Войти как пользователь
Вы можете войти на сайт, если вы зарегистрированы на одном из этих сервисов:
Россия +7 (495) 139-20-33
9 Апреля 2024 в 09:55

SberDevices представила семейство ИИ-моделей для распознавания речи и эмоций

Россия +7 (495) 139-20-33
0 7005
Подпишитесь на нас в Telegram

Команды разработки сервисов GigaChat и SaluteSpeech в SberDevices анонсировали семейство акустических ИИ-моделей для русского языка, которые умеют распознавать речь и эмоции.

В семейство вошли три модели: GigaAM, GigaAM-CTC и GigaAM-Emo.

  • Технология GigaAM предобучена на разнообразной русской речи (набор данных из 50 тысяч часов речи). Ее можно использовать для адаптации под различные задачи работы со звуком, включая распознавание речи и эмоций, определение диктора.
  • GigaAM-CTC – модель для распознавания русскоязычных запросов.
  • А GigaAM-Emo – акустическая модель для определения эмоций.

Модели размещены в открытом доступе. Их можно использовать для подготовки дипломных работ и научных статей по некоммерческой лицензии.

Улучшенные версии моделей доступны на платформе SaluteSpeech API, чтобы бизнес мог, например, автоматизировать колл-центры, и в приложении SaluteSpeech App. Модели можно также использовать в повседневной жизни: например, распознать запись совещания или лекции в вузе.

Напомним, OpenAI открыла доступ к ChatGPT без регистрации.

Источник: VC.RU

0 комментариев
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.

Отправьте отзыв!
X | Закрыть