
В чате с Алисой AI теперь можно создавать изображения с верными и более длинными надписями на русском языке. При генерации таких картинок разные нейросети зачастую допускают ошибки, потому что их обучают на открытых датасетах, в которых слабо представлен русский язык.
Алиса AI научилась решать эту проблему: для создания изображений она стала использовать обновленную модель Alice AI ART, которую Яндекс обучил на собственном масштабном датасете. Благодаря этому пользователи нейросети теперь могут создавать постеры, афиши и открытки с надписями на русском языке, а бизнес – рекламные материалы, лендинги, брошюры или презентации в Yandex AI Studio.

Для обучения модели команда Яндекса собрала датасет изображений с русскоязычными надписями и детальной разметкой текста, а также изменила архитектуру модели.
После обновления нейросеть стала в 3 раза чаще генерировать картинки с корректным русскоязычным текстом: без ошибок или нечитаемых букв.
Для этого достаточно использовать простые приёмы: заключать текст в кавычки, писать сложные слова заглавными буквами, разбивать длинные надписи на более короткие фразы.
Кроме того, на треть выросло общее качество генерации изображений – доля картинок без визуальных искажений, а также модель стала лучше понимать русский культурный код. Для этого ее обучили на русскоязычных промптах и дополнили системой, которая преобразует общие запросы в более конкретные визуальные образы. Например, если написать в чате с Алисой AI «Изобрази русский народный ансамбль», нейросеть создаст изображение с гармонистами и балалаечниками, а по запросу «Традиционный русский праздничный стол» – картинку с икрой, соленьями и самоваром. Если попросить Алису AI создать иллюстрацию на космическую тему, модель добавит на картинку российских космонавтов.
Новая модель также стала доступна для бизнеса на платформе Yandex AI Studio. С помощью нового инструмента Image Generation Tool бизнес может использовать модель в сложных агентских сценариях, где генерация изображений – лишь один из шагов решения задачи. Например, ИИ-агент сможет автоматически создать изображения для карточек товаров на маркетплейсах, как только информация о них появится в корпоративной базе данных.
Напомним, ранее Яндекс выяснил, какие рабочие задачи россияне решают с помощью нейросетей.
Источник: пресс-релиз Яндекса