Как известно, Панда – поисковый алгоритм Google, направленный на борьбу с низкокачественным контентом. Алгоритм живет уже 4 года и потерпел множество обновлений. Логично было предположить, что в случае с идентифицированием сайтов на автоперевод Панда использует базу переводчика translate.google.com. Я решил выяснить, как Панда справится с автопереводом сайта на 37 языков через API translate.yandex.ru. За базу взят портал в тематике компьютерных игр и объемом контента на 20 миллионов знаков.
Цели эксперимента
- Узнать, сможет ли панда идентифицировать автоперевод по чужим базам переводчиков,
- Определить регионы, наиболее «податливые» на хорошее ранжирование плохого контента
- Оценить качество межрегионального ссылочного
- Выделить регионы, наиболее привлекательные для МFA сайтов (Made For AdSense)
Условия
- 37 поддоменов xx.name.info, по одному на каждый целевой регион,
- Сайты полностью переведены: навигация, мета данные, тексты,
- Произведена перегенерация ЧПУ, sitemap.xml,
- Одновременный запуск в индекс Google в феврале 2015,
- Полная синхронизация с русскоязычной версией. Как только мы публиковали новость на русском языке, она автоматически переводилась на 37 языков и публиковалась на всех региональных сайтах
- Региональные сайты залинкованы на русскоязычную версию следующим образом: каждая страница ссылается свою русскоязычную версию в доменной зоне .ru с русским анкором = «Название страницы»
- У сайтов одинаковые: IP, дизайн, контактные данные
Данные собирались 12 месяцев, за этот период поддерживалась хорошая активность публикаций уникального контента.
Результаты
Для начала посмотрим в процентах, сколько страниц по региональным доменам вошло в индекс.
Выделим 3 группы:
- Плохо проиндексированы, до 40%. Вероятно, панда зафиксировала неладное.
- Нормально, от 40% до 70%. Панда нашла ряд страниц сомнительного качества, но, в целом, сайт неплохо ранжируется.
- Хорошо, свыше 70% в индексе. Автоперевод принят весьма дружелюбно.
Важный момент, значение «Всего проиндексированных страниц» = «Общему индексу для всех доменов», то есть Google не выделял для автоперевода Дополнительный индекс, а просто удалял/не включал в индекс то, что идентифицировал, как негодный контент. Но есть исключение, Финскую языковую версию Google проиндексировал на 76% - 39100 страниц, из них 32090 определил в дополнительный индекс.
Посмотрим, сколько поискового трафика из Google мы получили с 1 марта 2015 по 29 февраля 2016.
Некорректно будет сравнивать объем регионального трафика с Россией т.к. нет выравнивающего коэффициента, учитывающего популярность всей группы запросов в каждом регионе. Чтобы его высчитать, нужны толковые переводчики и сбор данных по каждой стране, на это пока ресурсов не нашлось. Поэтому принимайте информацию, для общего ознакомления или самостоятельного анализа.
Отдельно выделю 5 стран, где Google не являлся трафикообразующей поисковой системой:
- Чехия, 50% из Seznam, относительно общего поискового трафика
- Турция, 30% из Яндекс
- Китай, 75% из Baidu
- Малайзия, 50% из местных поисков
- Сербия, 70% из Яндекса
В панели вебмастера Google отображается информация, что на русский домен учитывается всего 222700 ссылок из региональных сайтов, которые ссылаются на 3821 страницу. Отмечу, что все ссылки были с разными анкорами и распределялись на свои русскоязычные аналоги. Довольно внушительные цифры, которые никак не повлияли на трафик и позиции RU сайта. Из этого следует, что засчитался вес только с одной ссылки каждого домена, либо ссылки со сайтов на других языках учитываются весьма незначительно. RU домен не был подвержен санкциям пингвина за резкий прирост внешних ссылок.
Области вывода и размеры AdSense блоков одинаковы для всех сайтов, из чего следует, что ставки за клик формировались в равных условиях.
Общий итог
- Панда кушает не только вкусный и питательный бамбук, ее аппетит и избирательность очень зависит от региона
- Внешние ссылки из автогена работают сомнительно, не питайте надежды на сателлитную структуру
- Не тяните с открытием регионального сайта, даже если это будет автоперевод
Теперь я планирую испытать Пингвина, расширяя условия эксперимента, в рамках которого сеть языковых версий будет подвержена агрессивному посеву внешних ссылок.
Задавайте ваши вопросы и пишите пожелания к последующим форматам экспериментов на ящик info@zhaf.ru или в комментарии.