В конце января — начале февраля Яндекс сделал несколько апдейтов выдачи. Многие вебмастера заметили проседание трафика и позиций.
Уже 4 февраля я начал получать вопросы от владельцев информационных сайтов (см. комментарии к статье о порогах срабатывания «Баден-Бадена»). Легко видеть, что проблема очень серьезна. Будем разбираться.
Основные наблюдения, гипотезы и предположения
Прежде чем изучать новое явление в поиске, я всегда стараюсь понять, что о нем уже известно. Вот главные тезисы из обсуждений на форумах и в сообществах SEO-специалистов:
- Симптомы похожи на «Баден-Баден»: срезает часть трафика на посадочной странице, часть остается.
- Падает посещаемость с выдачи на настольных компьютерах; трафик с мобильных стабилен.
- Алгоритм затронул в основном контентные проекты. С другой стороны, есть ряд сообщений и о просадке на коммерческих сайтах.
- Очень часто среди пострадавших упоминаются медицинские статейники, а также информационные сайты в смежных нишах (ЗОЖ, похудение).
- Просевшие сайты злоупотребляли тизерной или контекстной рекламой. На подозрения наводит близость по дате к блокировке агрессивной рекламы Яндекс.Браузером.
- Проблемы наблюдаются в первую очередь на старых сайтах; некоторые давние лидеры ниш потеряли значимую часть видимости.
- Техподдержка Яндекса не комментирует изменения, называя их частью обычного процесса совершенствования алгоритма.
- Дополнительные предположения: появился новый алгоритм ранжирования по текстовым факторам (на мобильные пока могли просто не выкатить); просто тест выдачи, аналогично Бандиту; наказание за длинные тексты; наказание за тизеры.
Напоминаю, что это еще не мои выводы, а конспект 30 страниц обсуждений на Серче, постов в соцесетях и приватного общения с владельцами пострадавших сайтов. Мы будем их проверять и уточнять.
Выборка для изучения
В этот раз собрать пул пострадавших оказалось очень легко. Очевидно, проблема действительно масштабная. Выделить проекты, выигравшие от нововведений, было чуть сложнее — на них эффект более «смазанный».
Всего к настоящему моменту я вручную изучил 43 пострадавших и 22 выигравших сайта. Более чем достаточно для первого этапа исследования, так как выборка достаточно чистая. Как всегда, я жестко фильтрую сайты, где нельзя с высокой степенью уверенности исключить влияние других факторов. Смотрите далее примеры не вошедших в выборку (в блоке про коммерческие сайты).
Пока не будем выдвигать никакой гипотезы, чтобы не впадать в ловушку подтверждения предвзятости. Давайте просто знакомиться с ситуацией и собирать факты. Поехали.
Трафик действительно снижается именно из десктопной версии поиска
Основной симптом: трафик с настольных ПК упал на 40% и более, а с мобильных остался на том же уровне или подрос.
Типичная картина:
Трафик с планшетов падает вместе с десктопным
Еще один типичный пример:
Таких случаев в выборке подавляющее большинство, хотя не всегда можно наблюдать четкую закономерность, так как объем посещаемости с планшетов в целом невелик для достоверных выводов (если было в день 50 заходов, а стало 35 — не факт, что имеем дело с проблемами).
Текстовые факторы ни при чем
Этому есть несколько свидетельств.
Во-первых, текстовые характеристики у ряда выпавших и у тех, кто занял их место в ТОП, очень близки. Есть примеры, когда статьи, зашедшие в ТОП и выпавшие из него, сильно схожи:
- и по классическим факторам текстовой релевантности;
- и по показателям спама, которые я выявил в исследовании «Баден-Бадена»;
- и по новым характеристикам, которые я тестирую (все, кто показывал проблемные сайты еще в прошлом году — я о вас помню, и дело потихоньку двигается).
Разумеется, в своем анализе я могу упускать метрики, которые использует Яндекс (и даже, скорее всего, это так). Но значимые различия, за которые стоит наказывать — скорее всего, как-то отразились бы на результате.
Во-вторых, и это гораздо важнее, есть ряд примеров, когда падают позиции у сайтов, которые содержат только копипаст, растиражированный по сотням сайтов. В выдаче всплывает точно такой же копипаст с аналогичных проектов.
Под раздачу попали сайты разного возраста и разных тематик
Нельзя говорить, что проблемы только у старых. Часть таблички с проверкой возраста домена (проблемные):
А вот результаты для группы сайтов, где прирост наиболее заметен (более 40% прибавки):
Другие косвенные свидетельства о возрасте сайта (даты публикации статей, первые заходы в статистике, поиск с ограничением по дате) также подтверждают высокое разнообразие возрастов.
В выборки не попали совсем молодые сайты, однако это объяснимо. Я брал для изучения только сайты с достаточно большим объемом трафика, чтобы делать достоверные выводы. Возраст, точнее, время нахождения в индексе — важный фактор ранжирования (см. мой доклад на BDD). Недавно созданному проекту сложно набрать начальный уровень трафика, достаточный для попадания в выборку.
По поводу тематики — в выборках действительно много «женских» и медицинских сайтов. Однако хватает и других. Примеры тематик: литература, гаджеты, ремонт. Да и контент сайтов, ориентированных на прекрасный пол, весьма разнообразен: от садоводства до психологии.
Коммерческие сайты в массе своей не задеты
Мне попалось несколько сообщений о том, что коммерческие сайты тоже пострадали от апдейта. Однако нет оснований считать, что здесь поработал тот же самый алгоритм. Приведу пару примеров — и станет понятно, почему.
Кейс №1. Позиции на смартфоне лучше, чем на десктопе. Однако динамика трафика не меняется. А среди конкурентов есть сайты, не адаптированные под мобильные.
Кейс №2. То же самое, только есть еще есть слабая недостоверная просадка трафика (посещаемость в целом небольшая). Но на сайте месяц назад проводились работы со структурой.
Кейс №3. А тут падает и мобайл, и смартфоны. Динамика посещаемости немного различается, что и сбило оптимизатора, однако укладывается в недельный цикл (в выходные со смартфонов сидят больше).
То есть симптомы иногда бывают похожими, но копнешь чуть глубже — и понимаешь, что дело совсем в другом.
Корень проблем — поведенческие факторы
Я уверен в этом на 90%. Не на сто, потому что еще не завершил исследование (впереди главный этап — обработка всего массива данных, анализ количественных показателей). Но доводов очень много:
Во-первых, информации о поведенческих у оптимизатора меньше всего, это подводная часть айсберга ранжирования. Полные по кликам на выдаче в конкретную сессию пользователя есть только у поисковой системы. Неудивительно, что общие тенденции выделить сложно. Пострадавшие сайты наверняка похожи — но в скрытом от нас пласте факторов.
Во-вторых, в выборке выросших проектов есть сайты с обилием рекламы и в целом не слишком качественной структурой (ничуть не лучше тех, что просели). Однако у них весьма незначительный объем поискового трафика до апдейта. Вполне логично выглядит гипотеза, что это тоже кандидаты на пессимизацию, но по ним пока не набралось достаточно статистики по ПФ.
В-третьих, сам факт разного ранжирования на разных устройствах намекает, что причина — разный пользовательский опыт. Показательно, что планшеты приписали к настольным компьютерам. Вероятно, дело не в каких-то глубоких принципах (вроде «пользователи переносных устройств обычно в дороге, а не в офисе — им нужен другой контент»), а именно в статистике взаимодействия с контентом на экранах разного размера.
В-четвертых, есть первые результаты по анализу именно поведенческих метрик; отличия по ним в выборках присутствуют. Подробнее напишу в следующей статье. Пока могу сказать только, что модель вырисовывается довольно сложная. Никаких примитивных правил, вроде «банят за 20% отказов и выше» или «время на сайте у десктопных посетителей меньше» тут не будет.
Проседает сайт целиком, а не отдельные страницы
Ремарка: почему важно знать, на каком уровне работает алгоритм
Разбираться в том, факторы какого уровня (хост? страница? страница-запрос?) повлияли на ухудшение позиций — полезно для практики. Понимание позволяет нащупать стратегию борьбы и дальнейших инвестиций в проект:
- уровень запроса — анализируем конкурентов;
- уровень страницы — анализируем конкурентов по широкому ядру, решаем технические проблемы и повышаем общее качество документа;
- уровень хоста — оцениваем рентабельность реанимации по сравнению с созданием нового проекта, выполняем в первую очередь массовые доработки и т.д.
Откуда вывод о влиянии на уровне сайта?
Прежде всего, пострадавшие проекты показывают изменение трафика, сходное с динамикой сайтов под хостовым фильтром. Типичный пример:
(Скриншот обновленного инструмента для анализа изменения трафика в bez-bubna.com, см. анонс).
Легко видеть, что:
- максимальные потери из-за снижения трафика на ряде страниц;
- при этом страниц, где трафик исчез, в 3 раза больше, чем тех, где он появился.
Картина хорошо согласуется с гипотезой, что изменения затронули все подряд — и частотные, и «случайные» запросы. (Если вам непонятна логика в этом моменте — смотрите подробнее о диагностике по соотношению страниц с разной динамикой).
Однако не исключены и альтернативные объяснения. Например, алгоритм работает на уровне страниц, а пострадали шаблонные сайты, где у всех статей похожие поведенческие факторы.
Как отличить одно от другого, если от нас скрыта большая часть данных по поведенческим? Не так уж и сложно:
- Если в февральском шторме виноват фактор уровня страницы, то молодые документы, где мало статистики по ПФ, не будут задеты.
- Если же мы имеем дело с хостовыми проблемами, то недавно добавленные страницы тоже потеряют трафик. А опубликованные после апдейта будут с трудом его набирать.
Что мы видим в реальности? К счастью, на 4 сайтах обнаружилось достаточно много молодых страниц со слабой сезонностью спроса. Вот как на них меняется объем визитов с десктопа:
А вот так — с мобильных:
Трафик с настольных компьютеров падает, с мобильных растет или стабилен. Все как и в целом по сайту. Таким образом, винить в проблемах нужно факторы на уровне всего сайта.
Теоретически возможны и другие объяснения, но они мало что меняют для практики. Конечно, 4 сайта — еще недостаточно для полной уверенности, хотя полное сходство динамики на них оставляет не так много сомнений. В любом случае на следующем этапе исследования будет больше данных и больше ясности.
Если у вас есть еще примеры проблемных сайтов с 20 или более страницами в возрасте до 3 месяцев — пожалуйста, пришлите мне пример для изучения.
Резюме
- Изменения коснулись довольно большого числа информационных сайтов; коммерческие не затронуты. Отката за полторы недели не произошло. Похоже, это не временный «глюк», а новая реальность, к которой владельцам информационных сайтов нужно приспосабливаться.
- Обновление повлияло на проекты разных тематик, возраста и структуры.
- Текстовые факторы в данном случае не оказывают на просадку или прирост прямого влияния.
- Причина понижения — слабые поведенческие факторы на уровне сайта; они ухудшают позиции в том числе новых страниц. Добавлять статьи на пострадавшие сайты стало менее выгодно.
Ну что же. Некоторая ясность появилась, теперь остается самое интересное: на какие именно факторы обращать внимание и что делать для их улучшения. Об этом я напишу в следующий раз, когда завершу изучение собранных данных. Продолжение следует!
Источник: Блог Алексея Трудова о SEO, веб-аналитике и продажах