Команды разработки сервисов GigaChat и SaluteSpeech в SberDevices анонсировали семейство акустических ИИ-моделей для русского языка, которые умеют распознавать речь и эмоции.
В семейство вошли три модели: GigaAM, GigaAM-CTC и GigaAM-Emo.
Модели размещены в открытом доступе. Их можно использовать для подготовки дипломных работ и научных статей по некоммерческой лицензии.
Улучшенные версии моделей доступны на платформе SaluteSpeech API, чтобы бизнес мог, например, автоматизировать колл-центры, и в приложении SaluteSpeech App. Модели можно также использовать в повседневной жизни: например, распознать запись совещания или лекции в вузе.
Напомним, OpenAI открыла доступ к ChatGPT без регистрации.
Источник: VC.RU