Google не рекомендует использовать код статуса 404 и другие 4хх для уменьшения частоты сканирования сайта роботом Google.
В последние несколько месяцев мы наблюдаем всплеск среди владельцев сайтов, которые пытаются использовать код 404 и другие 4xx для снижения частоты сканирования сайта роботом Google. Пожалуйста, не делайте так. Лучше прочтите нашу документацию по этому вопросу и следуйте рекомендациям.
Роботы Googlebot игнорируют любой контент, получаемый с URL, которые возвращают код статуса 4xx, и не индексируют такие URL. В итоге страницы с таким статус-кодом могут быть исключены из поиска Google. А если еще и файл robots.txt отдается с такой ошибкой, для Google он вообще будто не существует, и робот проиндексирует все подряд. Единственное исключение – 429 статус-код, который означает «слишком много запросов». Именно он покажет роботу, что сервер перегружен, и надо замедлиться.
Чтобы ограничить частоту сканирования сайта роботом Google, рекомендуется:
Напомним, Google обновил документацию для вебмастеров по ссылкам: в раздел добавилась информация о правильном использовании анкорного текста, а также о внутренних и внешних ссылках.
Источник: Google Search Central