Гендиректор Google Сандар Пичаи (Sundar Pichai) рассказал, что частота неверных слов технологии узнавания речи компании уменьшилась до 4,9 %. Иначе говоря, Google расшифровывает ошибочно любое 20 слово. В 2013 году уровень составлял 23 %, 2 месяца назад в процессе пресс-конференции I/O 2015 — 8 %.
Пичаи рассказал о достижении в масштабах I/O 2017, на которой организация выкроила большое внимание синтетическому уму. Для достижения повышенной правильности узнавания речи Google применяет технологии бездонного изучения.
«Мы применяем голос как средство ввода во всех наших продуктах, — заявил Пичаи. — Всё потому, что ПК стали намного лучше осознавать речь. У нас было несколько существенных достижений, однако с минувшего года ритм повышения был поразительным. Наша частота неверных слов продолжает совершенствоваться даже в весьма гулких местах. Потому у нас есть возможность в точности держать ваш голос, когда вы говорите с Google через ваш телефонный аппарат либо Google Хоум».
В начале октября 2016 года Майкрософт рассказала, что добилась паритета с человеком в плане механического узнавания речи. Тогда её уровень погрешностей в распознавании слов составил 5,9 %. Непонятно, создают ли обе компании оценку по одним и аналогичным стереотипам.
В феврале Google сообщила, что её частота погрешностей в распознавании речи с 2012 года снизилась не менее чем на 30 %. Со слов компании, этому подсобило серьезное применение нейронных сетей.
Пичаи поделился любопытной деталью подготовки «интеллектуальной» колонки компании. «Когда мы готовились к поставкам Google Хоум, то вначале рассчитывали добавить 8 микрофонов, — сообщил гендиректор. — Однако благодаря нейронным сетям и применению технологии под наименованием “нейронное развитие луча” мы сумели выпустить её всего с 2-мя микрофонами и добиться такого же качества».