SEOnews запустил проект для специалистов и клиентов «Энциклопедия интернет-маркетинга», в рамках которого редакция публикует обучающие материалы от ведущих агентств на рынке. В итоге мы планируем выпустить полное, практически полезное и актуальное электронное руководство.
***
Энциклопедия интернет-маркетинга. Поисковая система: предназначение, поведение, состав
Поисковая система (search engine) помогает найти нужную информацию. Алгоритм такой: пользователь вбивает в нужной строке интересующий запрос, система выдает ссылки на ресурсы, где он может получить ответ.
Поисковиков немало, между ними — жесткая конкуренция. В Рунете лидируют Яндекс и Google, сильно отстает, но все же используется поисковый сервис Mail.ru, незначительная доля пользователей приходится на Bing и Rambler.
Данные LiveInternet.ru за последние 3 месяца (октябрь, ноябрь и декабрь 2015)
Чем выше качество поиска, тем большую популярность имеет поисковик.
Как работает поисковая система?
Поисковая система — сложный комплекс. Основные ее составляющие — оболочка (сайт) и программно-аппаратный набор. Каждый поисковик имеют свою уникальную структуру, однако принцип работы схожий.
● Поисковые роботы занимаются поиском и сохранением новых документов.
● Индексаторы анализируют и обрабатывают загруженные документы.
● Обработанная информация хранится в базе данных.
● Система запросов и выдачи принимает фразу, заданную пользователем, и выводит релевантные ей сайты.
Этапы поиска
1. Поисковый робот («паук», краулер) анализирует содержимое страницы сайта и сохраняет его на сервере. Затем переходит по найденным ссылкам для поиска новой информации. На этом этапе образуется большое количество необработанных и непригодных для выдачи данных. Их предстоит проиндексировать.
2. Индексатор разбивает скачанные страницы на составные части, затем анализирует их, применяя собственные морфологические и лексические алгоритмы. Сортировка позволяет систематизировать информацию, собранную роботами. Проанализированные элементы страницы записываются в индексную базу данных.
3. База данных хранит в себе преобразованные специальным образом параметры всех скачанных и проиндексированных страниц. Актуальная база называется индексом. В ней хранятся страницы, подготовленные к выдаче.
4. Система обработки запросов и выдачи результатов — важнейший элемент поисковой системы. Именно от алгоритмов, которые в ней заложены, зависит качество выдачи и скорость поиска.
5. Запрос, который получила от пользователя система, в обязательном порядке анализируется. Результат передается модулю ранжирования, после чего все документы обрабатываются с целью выявления страниц, наиболее релевантных запросу. Далее для каждого найденного документа генерируются сниппеты и перед пользователем предстают страницы выдачи (SERP).
Что такое сниппет?
Сниппет состоит из заголовка, краткой аннотации и ссылки на документ. Ключевые слова выделяются жирным шрифтом. Например, Google обычно формирует аннотацию из описания страницы (description). Если описания нет или оно содержит нерелевантую информацию, в качестве аннотации используется более подходящий фрагмент текста.
Яндекс формирует аннотацию из фрагментов документа, содержащих слова из запроса пользователя.
Чтобы удержать пользователя, система должна предоставлять максимально релевантные документы. Поэтому поисковики постоянно развиваются и улучшают свои алгоритмы.