Статья будет полезна посетителям и владельцам сайтов, которые заботятся о том, чтобы информация, получаемая с их ресурсов, была своевременной и достоверной. Прочитав этот материал, вы поймете, из-за чего посетители могут видеть устаревшую информацию на сайте, а также узнаете способы решения этой проблемы.
В настоящее время скорость передачи данных в сети интернет позволяет с легкостью просматривать видео в хорошем качестве, играть в online-игры, устраивать конференции, быстро скачивать и передавать информацию и т.д. Но так было не всегда! Десять лет назад, чтобы передать 1 Мб информации, приходилось тратить достаточно много времени. Для повышения скорости загрузки страниц сайта было решено сохранять часть данных в кэш браузера (памяти) на локальном компьютере пользователя. Во время последующего обращения к сайту браузер загружал их оттуда при условии, что загружаемые данные не менялись.
Сейчас содержание данных в кэше браузера не является столь востребованным в целях увеличения скорости загрузки. В большинстве случаев данные с сервера запрашиваются методами GET или HEAD. Запросы методами GET и HEAD по умолчанию кэшируются (сохраняются) в логах сервера и прокси-сервера, а также в истории браузера. Из-за того, что информация кэшируется, многие посетители сайта увидят устаревшие данные, а новая станет им доступна только после удаления из кэша. Это может доставить проблемы не только посетителям сайта, но и повлиять на прибыль компании, если сайт коммерческий.
Для решения данной проблемы нужно запретить кэшировать данные, передающиеся с сервера. В интернете описано множество способов запрета кэширования: все они отличаются друг от друга, а некоторые сейчас уже не работают.
Самые распространенные правила опубликованы на авторитетных ресурсах
Рис.1. Запрет кэширования —
По утверждению Википедии, если в заголовке документа
написатьРис.2. Запрет кэширования —
Другой авторитетный ресурс
При данных настройках сервер отдает заголовки, представленные на рис.3.
Рис.3 Заголовки ответа сервера
Разберем каждую строчку, чтобы понять, как это должно работать.
Заголовок актуальности документа предлагается передать прошедшей датой. Например, «Expires: Mon, 26 Jul 1997 05:00:00 GMT», определив, тем самым, что данные уже не нужны, и кэшировать их не за чем. Это, должно вызывать подозрение не только у людей, но и у поисковых роботов при индексации таких документом. Зачем роботу держать в индексе неактуальную информацию, мало кто задумывается. Поисковые системы не любят, когда им пытаются передать недостоверные данные.
Заголовок «Last-Modified» передает браузеру дату и время изменения документа (в данном примере дата и время будут текущие). Если при каждом заходе на страницу поисковому роботу сообщается, что документ только что изменился (хотя в своем поисковом индексе робот различий не замечает), то, возможно, система будет воспринимать это как воздействие на релевантность поисковой выдачи с целью улучшения позиций сайта. Это может послужить причиной наложения санкций со стороны поисковых систем.
Передача заголовка «Pragma: no-cache» для запрета кэширования данных была одним из первых методов, но на данный момент уже не работает.
Эксперимент
Пример 1.
Проведем эксперимент. Создадим документ cache.php, в котором будем отдавать заголовки из примера, чтобы проверить работает ли данный метод запрета кэширования данных. С сервера будем запрашивать актуальное время, и смотреть, откуда берется информация — из кэша браузера или загружается с сервера.
Во время эксперимента будем делать переходы по ссылке на файл cache.php, расположенный на реальном сервере, и наблюдать, обновляется время или нет. Если время не обновляется, значит, данные берутся из кэша браузера и запрет не работает.
Рис.4 Запрет кэширования не работает
Показатель времени не обновляется, и это еще раз доказывает, что на большинстве ресурсов содержится недостоверная информация по запрету кэширования. Большой интерес вызывает такое массовое копирование чужих ошибок не только в конкретном случае, но и в целом во всем интернете.
Для того, чтобы показать работающий способ запрета кэширования, приведу второй пример, в котором также посредством эксперимента будет проверена его работоспособность.
Пример 2.
В первом примере предлагалась передача заголовка «Cache-Control: no-cache, must-revalidate», вот только настроен он был неправильно. Дополним заголовок новыми параметрами «Cache-Control: no-cache, no-store, must-revalidate, max-age=0», где
no-store — приватные данные нельзя сохранять на локальном диске (запрещает кэширование в браузерах);
no-cache — директива, использующаяся для запрета кэширования информации прокси-серверами;
max-age=0 — директива, указывающая время, в течение которого хранится информация в кэше браузера;
must-revalidate — директива, сообщающая браузеру о требовании дополнительной проверки актуальности документа, в случае возникновения сомнений.
Создадим документ cache2.php, в котором будем отдавать новые заголовки, чтобы проверить работает ли этот метод запрета кэширования данных.
Порядок и условия эксперимента остаются прежними. Если время меняется, значит, оно запрашивается с сервера, а не из кэша браузера.
Рис.5 Запрет кэширования работает
Так как при каждом обращении к странице время обновляется, метод запрета кэширования действительно работает. В данном примере параметры передаются из самой страницы, но возможен более универсальный вариант, который настраивается на сервере. На сервере Apache настройки производятся через служебный файл .htaccess, это дает более функциональный механизм запрета кэширования сразу для всех страниц сайта. В файле конфигурации необходимо включить модули mod_headers.c и mod_expires.c, убрав комментарии с фрагмента кода
и добавить в файл .htaccess фрагмент кода
Если сервером является Internet Information Services (IIS) 6.0, то кэширование можно запретить только имея доступ непосредственно к интерфейсу сервера. Сделать это возможно во вкладке «Заголовки HTTP» (HTTP Headers) в настройках сервера.
Рис.6 Запрет кэширования на сервере IIS 6.0
На рис. 6 приведен пример запрета кэширования посредством передачи заголовков «Cache-Control: no-cache, no-store, must-revalidate, max-age=0» для страниц сайта. Для настройки заголовка «Expires» нужно включить «Установить срок действия содержимого» (Enable content expiration) и «истекает немедленно» (Expires immediate).
Минусы запрета кэширования
Запрет кэширования повышает нагрузку на сервер, на котором находится сайт, потому что приходится отвечать на большее количество запросов. Для посетителей сайта запрет кэширования снижает скорость загрузки страниц, но это заметно лишь при медленной скорости интернета.
Заключение
Своевременное получение информации играет значимую роль как для посетителей сайта, так и для их владельцев. Поэтому владельцам веб-ресурсов нужно тщательно анализировать заголовки, которые отдаются их серверами. Запрет кэширования является важной настройкой, которая позволяет посетителям всегда получать только реальную информацию с вашего сайта. Сейчас на большинстве интернет-ресурсов отдаются заголовки «Expires» и «Last-Modified», которые не только не запрещают кэширование, но и возможно способны препятствовать нормальной индексации сайта поисковыми роботами.