Сбер представил новую версию своей нейросети – Kandinsky 2.2. В бесплатной генеративной модели появилось сразу несколько новых возможностей.
В Kandinsky 2.2 можно создавать фотореалистичные изображения с более высоким разрешением и изменять соотношение сторон при генерации. Также значительного прироста качества удалось достигнуть при создании портретов.
Для обучения нейросети использовалось 1,5 млрд пар «текст – изображение». Это на 300 млн больше, чем в предыдущей версии.
Kandinsky 2.2 научилась генерировать стикеры, из них можно собирать полноценные стикерпаки в Telegram.
Также нейросеть может изменять отдельные элементы изображения по текстовому описанию, сохраняя композицию исходной иллюстрации. Это стало возможным благодаря внедрению в модель специального структурного блока управляемых изменений – ControlNet.
Kandinsky 2.2 понимает запросы на русском и английском языках, умеет рисовать более чем в 20 стилях, смешивать несколько рисунков, стилизовать изображение по текстовому описанию, генерировать изображения, похожие на заданные, дорисовывать недостающие части картинки (inpainting), создавать картины в режиме бесконечного полотна (outpainting).
Оценить возможности нейросети можно на странице Kandinsky 2.2, на платформе FusionBrain.AI, в Telegram-боте и боте соцсети «ВКонтакте», а также при помощи команды «Запусти художника» на умных устройствах Sber, в мобильном приложении «Салют».
Напомним, неделю назад Сбера обещал в самое ближайшее время выпустить новую версию своей нейросети Kandinsky. Об этом заявил первый заместитель председателя правления банка Александр Ведяхин в рамках Финансового конгресса Банка России.
Источник: ixbt.com