
Теперь компании смогут самостоятельно дообучать нейросети YandexGPT Lite в сервисе Foundation Models. Вскоре эта возможность появится и для опенсорсных моделей, которые можно запустить на выделенных мощностях, например, DeepSeek или Qwen.
Инструмент позволяет:
Использование дообученной модели будет не дороже базовых версий нейросетей. Новый метод уже доступен всем клиентам на платформе для разработки ИИ-решений Yandex Cloud AI Studio.
LoRА (Low-Rank Adaptation) работает быстро за счет того, что изменяет небольшое количество параметров при дообучении модели. Алгоритм ориентируется на эталонные запросы и ответы, заранее заданные пользователем, и приближает результаты работы модели к образцам из датасета. При обработке небольших датасетов весь процесс дообучения с помощью LoRA может занять всего 10 минут.
В рамках технического тестирования LoRA уже попробовали более 100 клиентов: они использовали ее для разработки Telegram-ботов для ретейла, классификации запросов в поддержку, генерации рекламного контента и других задач.
Напомним, накануне Яндекс выложил в открытый доступ большую языковую модель YandexGPT 5 Lite Pretrain и внедрил новую мощную модель YandexGPT 5 Pro в чат с Алисой и в Yandex Cloud.
Предыдущая версия – языковая модель YandexGPT 4 – была представлена в начале декабря 2024 года. Яндекс встроил ее в Алису, а позже добавил в сервис «Документы».
Источник: Телеграм-канал Yandex Cloud