Искусственный интеллект Google DeepMind, который был разработан учеными Оксфордского университета, научился читать по губам и понимать речь, наблюдая за артикуляцией говорящего. При этом ученые отмечают, что искусственный интеллект допускает гораздо меньше ошибок, чем профессиональный сурдопереводчик.
Google DeepMind обучали при помощи 6 популярных телешоу (BBC Breakfast, Newsnight, Question Time), которые выходили в эфир с 2010 по 2015 год. За все время алгоритм изучил более 5 тыс. часов видео и около 118 тыс. предложений.
Эффективность алгоритма составила 46,8% слов, тогда как профессиональный переводчик, считывающий речь по губам, не ошибся лишь в 12,4%.
Команда DeepMind сообщает, что данная разработка может иметь множество вариантов применения, начиная от помощи людям с нарушениями слуха, заканчивая управлением голосовыми помощниками Siri и Alexa.