Яндекс добавит в Переводчик более 20 языков народов России, ранее не представленных в сервисе. Проект рассчитан на три года, а первый из новых языков – осетинский – уже появился в Переводчике.
Для части языков будет также встроена нейросетевая технология распознавания и синтеза речи. Это позволит узнать, как звучат слова на разных языках, и вскоре даст возможность вести диалог с носителями. Мобильная версия сервиса мгновенно переведет реплики, отобразит их на экране и озвучит на выбранном языке.
Первым языком народов России, для которого будет реализована такая возможность, станет татарский.
Распознавание и синтез речи в дальнейшем будут доступны для более чем десяти популярных языков, на каждом из которых в стране говорят более 300 тысяч человек. Технологии Яндекса позволят переводить сайты в Браузере, а также использовать голосовой ввод в Поиске, Картах и мессенджерах с помощью Яндекс Клавиатуры. Для всех пользователей это возможность лучше познакомиться с культурными особенностями народов страны через перевод их преданий, легенд, краеведческих статей и других материалов.
Виртуальный ассистент Алиса научится читать на этих языках народные сказки.
По данным Яндекс Поиска, россияне ищут в интернете перевод фраз на татарском чаще, чем на других языках народов России. На втором месте – башкирский, третьим по популярности среди пользователей рунета является чувашский.
Эти и другие языки, такие как удмуртский, якутский, горномарийский и марийский, уже доступны в Переводчике, часть из них – в бета-версии. Яндекс планирует улучшить качество перевода доступных языков, а также увеличить их количество. Так, к примеру, в Переводчик будут добавлены языки Северного Кавказа: чеченский, ингушский и другие, а позже и языки народов Сибири, например: бурятский и тувинский.
Яндекс реализует проект совместно с Федеральным агентством по делам национальностей и региональными языковыми институтами. Они помогают компании со сбором корпусов языков народов России – параллельных текстов на разных языках.
Источник: пресс-релиз Яндекса