Сбер представил обновление для своей модели генерации изображений Kandinsky. Нейросеть научилась создавать картинки с органично вписанным текстом на русском языке.
Для реализации этой функции модель дообучили на атасете из 10 миллионов изображений с русским текстом в разных форматах: печатном, прописном и других. Это позволяет нейросети не просто накладывать шрифт, а реалистично изображать надписи, как если бы они были вырезаны из дерева, отлиты из металла или нарисованы на стене.
Обновленная модель уже доступна в Telegram-боте Kandinsky и во всех ботах GigaChat (Telegram, ВКонтакте, Одноклассники, Max), а также в web-версии.
Напомним, ранее нейросеть Алиса научилась перерисовывать фото в разных стилях.
Источник: Habr