Войти как пользователь
Вы можете войти на сайт, если вы зарегистрированы на одном из этих сервисов:
Россия +7 (495) 139-20-33
31 Мая 2023 в 10:47

Google представил AI-технологию для генерации диалогов

Россия +7 (495) 139-20-33
0 3392
Подпишитесь на нас в Telegram

Google представил Soundstorm, AI-модель для эффективной и неавторегрессивной генерации звука. По сравнению с авторегрессивной генерацией, которая лежит в основе модели AudioLM, SoundStorm может воспроизводить аудио такого же качества, но с улучшенными показателями голоса и звука. И при этом в два раза быстрее – SoundStorm генерирует 30 секунд звука за 0,5 секунды на оборудовании Google TPU-v4.

SoundStorm в паре с системой SPEAR-TTS (берется этап преобразования текста в семантику) может синтезировать высококачественные и естественные диалоги, позволяя контролировать озвучиваемый контент (через транскрипции), голос спикера (через короткие голосовые подсказки) и очередность спикеров (через аннотации в транскрипции ).

Диалог, созданный SoundStorm: 


Напомним, работодатели стали указывать в IT-вакансиях навыки владения нейросетями. Эксперты отмечают, что для многих профессий нейросети становятся помощниками, благодаря которым можно снять с себя часть рутинных задач и повысить производительность труда.

Источник: Google

0 комментариев
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.

Отправьте отзыв!
X | Закрыть