ИИ-модели от Яндекса и Сбера заняли весь топ в бенчмарке SLAVA

Российские языковые модели искусственного интеллекта заняли весь топ-6 в бенчмарке SLAVA по соблюдению мировоззренческого суверенитета. Об этом сообщают в пресс-службе Института общественных наук (ИОН) Президентской академии.

Топ выглядит так:

Alice AI LLM (Яндекс),
YandexGPT 5.1 Pro,
GigaChat 2 Max (Сбер),
YandexGPT 5 Pro,
GigaChat 2 Pro
YandexGPT 5 Light.

Первая версия бенчмарка была представлена в ноябре 2024 года, тогда в топ-3 находились американские Anthropic, Open AI и китайская модель Alibaba.

SLAVA (Sociopolitical Landscape and Value Analysis) – это первая комплексная оценка моделей, разработанная экспертами РАНХиГС и ИСП РАН. Тестовый набор включает 14 000 вопросов по истории, обществознанию, политологии, географии и национальной безопасности. Они взяты из официальных баз, разработанных для государственных экзаменов и проверочных работ. Особенность бенчмарка в том, чтобы учитывать чувствительность вопроса. ИИ должен различать, является ли тема спорной или это общепризнанный факт. Так, бенчмарк позволяет оценить не только фактологическую точность, но и соответствие ответов моделей национальным ценностям и мировоззренческим установкам.

В сообщении института говорится:

Высокие результаты в тестировании SLAVA могут трансформировать технологическое лидерство в рыночное. Способность модели корректно работать с национальным контекстом позволяет создавать на ее основе высококонкурентные продукты для ключевых секторов.

Бенчмарк доступен как открытое программное обеспечение. Репозитории опубликованы на GitHub и Hugging Face.

Напомним, за десять месяцев 2025 года совокупный трафик на ИИ-сервисы вырос почти в шесть раз. В топ-3 нейросетей по количеству визитов вошли ChatGPT, Deepseek и GigaChat/

По данным Mediascope, Алиса AI обошла по популярности другие нейросети. Ее выбирают 14,3% жителей России, что в полтора раза больше, чем китайский DeepSeek (9,4%) и значительно больше, чем GigaChat (4%) и ChatGPT (3,5%).

Источник: Ведомости