Исследователи Microsoft сообщают, что создали новую технологию распознавания речи, которая расшифровывает разговорную речьточно так же, как это делает человек. Сообщается, что коэффициент ошибок системы на слово составляет 5,9 процента.По словам Microsoft, это примерно то же самое, что и профессиональные транскрипционисты, которых попросили поработать над теми же записями.
«Мы достигли паритета с человеком», - сказал ученый Сюэдун Хуанг, который дал основную информацию в своем заявлении. назвав эту веху «историческим достижением».
Чтобы достичь вехи, команда использовала компьютерную сеть и инструментарий Microsoft, а также самодельная система глубокого обучения, которую исследовательская группа сделала доступной на GitHub по лицензии с открытым исходным кодом. Система использует технологию нейронной сети на группах похожих слов., позволяя моделям работать эффективно слово в слово.
Нейронные сети основаны на больших объемах данных, называемых «обучающими данными». и они созданы, чтобы научить записывающие компьютеры распознавать синтаксические образцы в звуках. Microsoft планирует использовать технологию в Cortana, ваш личный голосовой помощник в Windows и Xbox One, а также программное обеспечение для преобразования речи в текст.
Перо технологии еще предстоит пройти долгий путь Прежде чем он сможет обработать основное значение (семантику) и контекстные знания, ключевые характеристики повседневного использования языка, которые должны быть уловлены личными помощниками, такими как Siri, чтобы обрабатывать запросы и действовать в соответствии с ними полезным образом.
«Мы уходим от мира, в котором люди должны понимать мир компьютеров, в то время как компьютеры все еще не понимают нас», - сказал Гарри Шам, возглавляющий исследовательскую группу Microsoft по ИИ. Однако он предупредил, что пройдет много времени, прежде чем компьютеры смогут понять истинный смысл сказанного. «Истинный искусственный интеллект еще не за горами».
Я думаю, что это огромный шаг, тот день, когда мы сможем взаимодействовать с устройствами без использования периферийных устройств, полностью изменит способ понимания взаимоотношений человека с машинами.