Факторы ранжирования в ИИ-ответах: перевод исследования

Реклама. ООО «Клик.ру», ИНН:7743771327, ERID: 2VtzqviDgg1

В 2026 году сайту важно попасть на только в топ выдачи поисковых систем, но и в ответы нейросетей – Алисы Яндекса и AI Overview в Google. Мы перевели исследование Сайруса Шепарда, где он разбирает 23 фактора, которые влияют на цитирование контента в ИИ ответах Google.

Методология – как я оценивал эти факторы

Все говорят о цитировании контента искусственным интеллектом. Чтобы убедиться, что мы понимаем друг друга, что мы подразумеваем под цитатами ИИ? Хотя они различаются в зависимости от платформы, ИИ цитаты – это кликабельные ссылки на источники, которые системы искусственного интеллекта используют для подтверждения своих ответов. Например, такие, как показаны ниже.

Хотя никто не оспаривает тот факт, что ответы ИИ сокращают количество переходов в открытый интернет, упоминания могут служить предохранительным клапаном для издателей. Недавнее исследование Seer Interactive показывает, что упоминание в ИИ обзорах Google приводит к увеличению органических кликов на показ на 120% и росту платных кликов на 41% по сравнению с ситуацией, когда ваш бренд не упоминается.

Кажется, каждую неделю мы видим новое убедительное исследование ИИ цитат, новую концепцию или даже дискуссию о том, что действительно работает.

Однако мы отмечаем, что большинство маркетологов не внедряют эти тактики в свою работу либо потому, что не уверены в их важности, либо из-за информационной перегрузки.

Для решения этой задачи я скачал почти все опубликованные исследования, статьи и патенты по теме ИИ за последние пару лет. Они охватывали различные системы искусственного интеллекта, включая ChatGPT, Gemini и Perplexity. Затем я отобрал 54 наиболее важных и полезных примера. Я классифицировал результаты каждого из них и сопоставил их, чтобы выявить наиболее похожие и часто цитируемые наблюдения.

Представленные ниже факторы ранжирования в ИИ ответах основаны на реальных данных из опубликованных экспериментов и исследований. Сила каждого «фактора» определяется следующими критериями:

  1. Воспроизводимость. Сколько раз один и тот же результат наблюдался в разных исследованиях? А также, насколько стабильны результаты – положительные или отрицательные – в разных исследованиях.

  2. Сила доказательств. Например, исследование, охватившее 50 миллионов запросов, имеет больший вес, чем исследование, охватывающее 10 запросов.

  3. Официальная поддержка. Наличие или отсутствие официальной документации, технических характеристик или патентов, подтверждающих соответствие данного фактора заявленным параметрам.

Факторы ранжирования цитирований в ИИ – тепловая карта доказательств

После обработки всех этих данных я вручную присвоил баллы на основе указанных критериев, используя искусственный интеллект для уточнения цифр. Баллы варьируются от 9,5 до 2.

Ниже представлены наиболее обоснованные характеристики контента, которые обеспечивают цитирование в ИИ.

Примечание: это не «факторы ранжирования» в традиционном смысле. Это характеристики, коррелирующие с цитированием ИИ в нескольких исследованиях. Корреляция не означает причинно-следственную связь. Все ошибки в данных или объяснениях являются исключительно моей ответственностью. Для более глубокого понимания этих факторов я рекомендую вам ознакомиться с исходными статьями.

Краткое резюме

Хотя данные свидетельствуют о том, что определенные методы могут повысить количество упоминаний в ИИ-ответах, большинство критически важных факторов соответствуют традиционным методам SEO. Это важно, поскольку ведутся многочисленные дебаты о том, требуется ли для оптимизации видимости в ИИ другой набор инструментов.

Мои данные позволяют сделать такой вывод: выигрываем в SEO – выигрываем в цитировании ИИ (в большинстве случаев, с дополнительными шагами).

Описание факторов ранжирования в ИИ-ответах

1. Доступность URL-адресов

Оценка: 9,5.

Определение: страница доступна и индексируется во время обучения нейросети или подготовки ответа.

Это базовые принципы SEO, применяемые к системам искусственного интеллекта. Как правило, для того чтобы ИИ мог на него ссылаться, URL-адрес должен быть доступен и индексироваться либо во время обучения, либо на этапе подготовки ответа.

Тем не менее, ситуация значительно усложнилась, поскольку компании, занимающиеся искусственным интеллектом, добавляют все больше пользовательских агентов для сканирования веб-сайтов (OAI-SearchBot, GPTBot, Google-Extended и т. д.), а такие компании, как Cloudflare, предлагают средства защиты от парсинга веб-сайтов с помощью ИИ. В результате стало проще, чем когда-либо, исключать страницы из систем ИИ и снижать вероятность их упоминания в поисковых системах.

2. Рейтинг в поисковой выдаче

Оценка: 9,4.

Определение: как URL-адрес ранжируется по точному запросу.

Многочисленные исследования выявили четкую взаимосвязь между высокими позициями в «традиционном» поиске и упоминаниями в AI Overviews. Компания Ahrefs обнаружила, что 38% упоминаний AI Overviews приходится на первые 10 результатов поиска Google. Если же результаты выходят за пределы первой десятки, то пересечение увеличивается.

Ситуация с ChatGPT сложнее, поскольку он не полностью раскрывает источники поиска, но AirOps обнаружил сильную взаимосвязь между «рейтингом поиска» и цитированиями из ChatGPT.

3. Рейтинг по связанным запросам в выдаче

Оценка: 9,3.

Определение: как URL-адрес ранжируется для связанных запросов с расширением поисковой выдачи.

Помимо ранжирования по основному запросу, поисковые системы на основе ИИ выполняют множество дополнительных запросов, чтобы дополнить и обосновать свои ответы. Многочисленные данные свидетельствуют о четкой взаимосвязи между высоким рейтингом по дополнительным запросам и получением упоминаний в поисковых системах на основе ИИ.

Проработать все SEO-факторы, которые влияют на цитирование ИИ, поможет PromoPult. В модуле «Поисковое продвижение» есть тип проектов «Динамическое SEO». Его преимущество в том, что умный алгоритм не только автоматически подбирает слова для продвижения, но и постоянно анализирует семантику: выявляет, какие ключи приносят трафик и конверсии, неэффективные фразы заменяет на новые. Вам не нужно самостоятельно заниматься подбором и актуализацией семантического ядра. За вас это сделает PromoPult. Дополнительная опция – можно настроить собственные правила ротации ключевых слов.

Протестировать эффективность технологии можно бесплатно за 2 недели.

4. Управление предварительным просмотром

Оценка: 9,2.

Определение: элементы управления предварительным просмотром, такие как директива «nosnippet», могут влиять на видимость.

В частности, для Google и Bing элементы управления предварительным просмотром – это директивы, позволяющие владельцам сайтов и вебмастерам контролировать, какую часть страницы поисковые системы могут отображать в сниппетах и ​​на некоторых площадках ИИ. Примерами являются «nosnippet» и «data-nosnippet». Ограничение видимости определенного текста может снизить видимость в ИИ.

5. Релевантность запросу

Оценка: 9,2.

Определение: содержимое страницы точно соответствует запросу – как основному, так и расширенному.

Многочисленные исследования задокументировали «семантическую близость» между ответом ИИ и цитируемым контентом. Это часто означает, что заголовки страниц, подзаголовки и содержание точно соответствуют как поисковому запросу, так и ответу ИИ.

6. Соответствие интенту

Оценка: 9.

Определение: тип страницы соответствует цели запроса, например, использован список для запросов вида «топ-n сущностей».

Поисковые системы на основе искусственного интеллекта, как правило, отдают предпочтение статьям, формат контента которых лучше всего подходит для поискового запроса. Например, для запросов типа «лучшие» («лучшие пробиотики для мужчин») может быть предпочтительнее список или сравнительная таблица, тогда как для запросов типа «как сделать» («как построить скворечник») чаще будет предложено пошаговое руководство.

Возможно, это просто артефакт поискового рейтинга или рейтинга распространения.

7. Ранжирование тематических кластеров

Оценка: 8,9.

Определение: степень ранжирования сайта по нескольким запросам (основной + дополнительные).

Это интересная, но простая для понимания концепция. Суть в том, что ранжирование по нескольким связанным запросам увеличивает ваши шансы быть процитированным хотя бы один раз. Методика RRF Top-n Playbook, хотя и сложная с технической точки зрения, была одним из моих любимых экспериментальных способов объяснения этого явления.

8. Ответ в верхней части страницы.

Оценка: 8,8.

Определение: важный контент, размещенный в верхней части страницы, с большей вероятностью будет цитироваться.

Системы искусственного интеллекта не обрабатывают весь текст на странице одинаково. Дэн Петрович показал, как Google Gemini использует строгое ограничение на количество запросов к URL-адресу, и контент в верхней части страницы с большей вероятностью будет обработан. Это подтверждают и несколько других исследований.

9. Структура, готовая к использованию ИИ

Оценка: 8,6.

Определение: контент отформатирован таким образом, чтобы ИИ мог легко извлекать и понимать информацию.

Исходя из того, что поисковые системы на основе искусственного интеллекта обычно не загружают всю страницу целиком, учтите, что они разбивают страницы на разделы перед загрузкой. Если ваш контент не имеет четкой структуры, это может усложнить задачу.

Это не значит, что вам нужно «разбивать» свой контент на небольшие фрагменты; просто обеспечьте четкую структуру с заголовками, разделами, таблицами и т. д. Многие исследования выявили четкую взаимосвязь между такими функциями и цитированием в ответах ИИ.

10. Конкретика и факты

Оценка: 8,3.

Определение: страницы и фрагменты, содержащие конкретные, поддающиеся проверке факты.

Поскольку ссылки на источники вводятся для подтверждения конкретных утверждений в самом ответе ИИ, целесообразно подкрепить это конкретными фактами, на которые ИИ может ссылаться. Утверждения типа «Взрослым нужно много белка» не так часто цитируются, как «Эксперты рекомендуют 0,8 грамма белка на килограмм массы тела».

11. Четкая формулировка

Оценка: 8,1.

Определение: конкретные утверждения важнее расплывчатых заявлений.

Подобно принципу «фактической конкретности», системы искусственного интеллекта, похоже, предпочитают более определенные фразы без уклончивых формулировок. Например, фраза «Некоторые люди предпочитают глицинат магния, а другие используют цитрат или треонат...» гораздо слабее, чем «Глицинат магния – лучший выбор для сна».

12. Ссылки на источники

Оценка: 8.

Определение: факты подкреплены ссылками на источники.

Несколько исследований показали, что факты, для которых четко указаны источники, чаще цитируются ИИ. Это логично, поскольку системы искусственного интеллекта стремятся генерировать ответы и ссылки, которые они могут обосновать.

На практике это не означает, что вам нужно добавлять ссылки на источники ко всему вашему контенту, но было бы разумно продемонстрировать, как вы пришли к важным выводам.

13. Самодостаточные фрагменты текста

Оценка: 8.

Определение: важные утверждения могут существовать сами по себе, без дополнительного контекста.

Понятие «самодостаточные фрагменты текста» означает, что ключевые факты или моменты полностью излагаются в предложениях или блоках текста.

Например, если вы скажете: «Этот ингредиент имеет более веские доказательства», система искусственного интеллекта будет вынуждена анализировать смысл, исходя из других фрагментов текста. Какой ингредиент? Какие доказательства? Но если вы скажете: «Влияние глицината магния на здоровье сердца подтверждено 137 научными исследованиями», информация будет однозначной и самодостаточной.

14. Видимость контента

Оценка: 7,6.

Определение: важная информация находится в видимом HTML-тексте, а не скрыта.

Современные веб-страницы могут содержать много текста, который не сразу виден, по крайней мере, без большого количества JavaScript или с требованием к пользователям кликать по элементам div и tabs. Давно известно, что даже Google, похоже, не так хорошо ранжирует контент, если он нечетко виден на странице, и, судя по всему, системы искусственного интеллекта разделяют это предубеждение.

15. Свежесть

Оценка: 7.

Определение: насколько актуальна информация.

Актуальность – известный фактор ранжирования в SEO, и несколько исследований выявили корреляцию между актуальностью документа и цитированием в результатах ИИ. Как и в традиционном поиске, актуальность, по-видимому, варьируется в зависимости от запроса. Вопрос о недавнем спортивном матче потребует более актуальной информации, чем вопрос о британской истории.

16. Доверие к бренду/организации

Оценка: 6,8.

Определение: насколько хорошо система искусственного интеллекта знает бренд или веб-сайт и насколько ей доверяет.

Всё чаще системы искусственного интеллекта, похоже, стремятся использовать более достоверные источники информации. Это означает, что то, что они уже знают о вас, может влиять на уровень их доверия или на то, будут ли они искать у вас информацию. В случае запроса, связанного со здоровьем, система ИИ с большей вероятностью доверится известной клинике, чем анонимному медицинскому блогу. Google работает аналогичным образом, поэтому, вероятно, есть некоторое совпадение.

17. Длина контента

Оценка: 6,7.

Определение: длина текста в словах.

Многочисленные исследования изучали корреляцию между длиной контента и количеством цитирований ИИ. Хотя большинство из них показали, что более длинный контент, как правило, демонстрирует лучшие результаты, данные были противоречивыми. Несколько исследователей отметили, что более длинный контент также снижает вероятность того, что поисковые системы ИИ смогут получить доступ ко всему вашему контенту.

18. Язык

Оценка: 6,3.

Определение: язык контента.

Исследования выявили явную предвзятость в отношении языка – а иногда и места – задаваемого вопроса. Вопрос, заданный на французском языке человеком из Франции, с большей вероятностью будет содержать французские цитаты.

19. Согласованность сущностей

Оценка: 5,8.

Определение: использование единообразных названий для товаров, брендов, людей и т. д.

Согласованность сущностей означает использование единых правил именования для брендов, людей, продуктов и т. д.

Например, я мог бы написать: «Zyppy производит программное обеспечение для SEO, которое помогает маркетологам занимать высокие позиции в поисковой выдаче». Это гораздо понятнее, чем «Zyppy производит SEO-программное обеспечение. Мое программное обеспечение помогает маркетологам занимать высокие позиции в поисковой выдаче». Первый вариант понятнее как для поисковых систем, так и для пользователей.

20. Структурированные данные

Оценка: 5,6.

Определение: страница содержит разметку для идентификации сущностей и извлечения контента.

Среди SEO-специалистов ведутся жаркие споры об использовании структурированных данных для оптимизации контента под ИИ. Хотя это правда, что LLM (большие языковые модели) обычно не используют микроразметку в процессе обучения, есть ограниченные доказательства того, что они, по крайней мере, могут видеть ее при поиске.

Практически каждое исследование, изучающее микроразметку и цитирование в ИИ, выявляет положительную взаимосвязь. Эффект обычно невелик, но он удивительно устойчив во всех исследованиях.

21. Известный источник

Оценка: 5,4.

Определение: URL-адрес уже известен движку ИИ благодаря обучающим данным.

Иногда (довольно часто, на самом деле) ИИ цитирует URL-адрес просто потому, что знает о нем из имеющихся обучающих данных. Для ChatGPT и Perplexity это более типично, поскольку позволяет обойти обычную фазу сопоставления/поиска, что приводит к появлению ссылок, которые больше не существуют.

22. Авторитет домена

Оценка: 5.

Определение: показатель популярности веб-сайта, основанный на количестве ссылок.

В нескольких исследованиях изучалась взаимосвязь между авторитетом домена и цитированием, полученным с помощью ИИ. Хотя во многих из них была обнаружена взаимосвязь, она часто оказывалась слабой.

23. LLMs.txt

Оценка: 2.

Определение: на сайте размещен файл LLMs.txt для движков искусственного интеллекта.

Честно говоря, я не уверен, что во многих из этих исследований вообще рассматривалось влияние файлов LLMs.txt. Тем не менее, нам не удалось найти никаких достоверных доказательств или экспериментов, демонстрирующих какое-либо влияние файлов LLMs.txt на цитирование в контексте искусственного интеллекта.

Шаги для увеличения количества цитирований в ИИ

В конечном итоге, вам не нужна совершенно новая стратегия SEO, чтобы получить упоминания в результатах поиска, но вы можете скорректировать некоторые методы и более эффективно внедрить ряд других SEO-стратегий.

Между традиционными SEO-сигналами и сигналами цитирования, полученными с помощью ИИ, существует значительное совпадение.

Кроме того, многие из этих факторов при правильном внедрении могут улучшить пользовательский опыт на вашей странице, что должно быть приоритетом номер один.

Если бы нам пришлось их суммировать, они могли бы звучать так: релевантность, доверие, авторитетность по теме и извлекаемость – все эти сигналы должны соответствовать современным представлениям о SEO. Некоторые технические детали меняются, но мы по-прежнему можем сосредоточиться на создании превосходного пользовательского опыта.

(Нет голосов)

X | Закрыть