Российские языковые модели искусственного интеллекта заняли весь топ-6 в бенчмарке SLAVA по соблюдению мировоззренческого суверенитета. Об этом сообщают в пресс-службе Института общественных наук (ИОН) Президентской академии.
Топ выглядит так:
Первая версия бенчмарка была представлена в ноябре 2024 года, тогда в топ-3 находились американские Anthropic, Open AI и китайская модель Alibaba.
SLAVA (Sociopolitical Landscape and Value Analysis) – это первая комплексная оценка моделей, разработанная экспертами РАНХиГС и ИСП РАН. Тестовый набор включает 14 000 вопросов по истории, обществознанию, политологии, географии и национальной безопасности. Они взяты из официальных баз, разработанных для государственных экзаменов и проверочных работ. Особенность бенчмарка в том, чтобы учитывать чувствительность вопроса. ИИ должен различать, является ли тема спорной или это общепризнанный факт. Так, бенчмарк позволяет оценить не только фактологическую точность, но и соответствие ответов моделей национальным ценностям и мировоззренческим установкам.
В сообщении института говорится:
Высокие результаты в тестировании SLAVA могут трансформировать технологическое лидерство в рыночное. Способность модели корректно работать с национальным контекстом позволяет создавать на ее основе высококонкурентные продукты для ключевых секторов.
Бенчмарк доступен как открытое программное обеспечение. Репозитории опубликованы на GitHub и Hugging Face.
Напомним, за десять месяцев 2025 года совокупный трафик на ИИ-сервисы вырос почти в шесть раз. В топ-3 нейросетей по количеству визитов вошли ChatGPT, Deepseek и GigaChat/
По данным Mediascope, Алиса AI обошла по популярности другие нейросети. Ее выбирают 14,3% жителей России, что в полтора раза больше, чем китайский DeepSeek (9,4%) и значительно больше, чем GigaChat (4%) и ChatGPT (3,5%).
Источник: Ведомости