Специалист отдела качества поиска Google Джон Мюллер рассказал о различиях между сигналами noindex и rel=canonical и объяснил, почему они не должны смешиваться.
По словам Мюллера, Google нужны четкие и понятные сигналы. Если на сайте сообщается, что один URL важнее другого, но при этом другой сигнал утверждает противоположное, или используется noindex (чтобы скрыть менее важные страницы, при этом передавая ссылочный вес другим страницам), то в конечном итоге Google может сделать совсем не то, что нужно владельцу ресурса.
Также Мюллер сообщил следующее:
Когда Google видит два URL с одного сайта, которые выглядят одинаково, а вы четко сообщаете о своих предпочтениях, то мы стараемся объединить их и обрабатывать как один (более сильный) URL вместо двух. Редиректы, rel=canonical, внутренние и внешние ссылки, файлы Sitemap, heflang и т.д. демонстрируют нам ваши предпочтения, поэтому чем более согласованно они применяются, тем скорее мы им последуем и используем их для канонической версии страницы.
С другой стороны, noindex (один) и директива disallow в файле robots.txt не являются четкими сигналами для каноникализации. Наличие на странице лишь тега noindex не говорит нам, что вы хотите объединить его с чем-то еще и что сигналы необходимо перенаправить. А директива disallow в файле robots.txt еще сложнее для понимания, так как мы не знаем, есть ли на сайте похожие страницы, поэтому не можем использовать данный сигнал для каноникализации.
Отсюда вытекает правило: нельзя смешивать noindex и rel=canonical: для нас это очень противоречивые сигналы. Обычно мы учитываем rel=canonical как более важный сигнал. Однако всякий раз, когда вы полагаетесь на интерпретацию со стороны компьютерного скрипта, вы уменьшаете вес вашего входа. А SEO сводится к передаче компьютерным скриптам информации о ваших предпочтениях.
Напомним, на днях Google также поделился свежими фактами о работе поисковой системы.
Источник: Search Engine Roundtable