Энциклопедия интернет-маркетинга. Поисковая система: предназначение, поведение, состав

12 Января 2016
в 10:00
0 5456
Анна Петрова
Специалист по рекламе,
digital-агентство Uplab

Лого.jpg

SEOnews запустил проект для специалистов и клиентов «Энциклопедия интернет-маркетинга», в рамках которого редакция публикует обучающие материалы от ведущих агентств на рынке. В итоге мы планируем выпустить полное, практически полезное и актуальное электронное руководство. 

***

Энциклопедия интернет-маркетинга. Поисковая система: предназначение, поведение, состав 

Поисковая система (search engine) помогает найти нужную информацию. Алгоритм такой: пользователь вбивает в нужной строке интересующий запрос, система выдает ссылки на ресурсы, где он может получить ответ.

Поисковиков немало, между ними — жесткая конкуренция. В Рунете лидируют Яндекс и Google, сильно отстает, но все же используется поисковый сервис Mail.ru, незначительная доля пользователей приходится на Bing и Rambler.

image02.jpg

Данные LiveInternet.ru за последние 3 месяца (октябрь, ноябрь и декабрь 2015)

Чем выше качество поиска, тем большую популярность имеет поисковик.

Как работает поисковая система?

Поисковая система — сложный комплекс. Основные ее составляющие — оболочка (сайт) и программно-аппаратный набор. Каждый поисковик имеют свою уникальную структуру, однако принцип работы схожий.

● Поисковые роботы занимаются поиском и сохранением новых документов.

● Индексаторы анализируют и обрабатывают загруженные документы.

● Обработанная информация хранится в базе данных.

● Система запросов и выдачи принимает фразу, заданную пользователем, и выводит релевантные ей сайты.

image03.jpg

Этапы поиска

1. Поисковый робот («паук», краулер) анализирует содержимое страницы сайта и сохраняет его на сервере. Затем переходит по найденным ссылкам для поиска новой информации. На этом этапе образуется большое количество необработанных и непригодных для выдачи данных. Их предстоит проиндексировать.

2. Индексатор разбивает скачанные страницы на составные части, затем анализирует их, применяя собственные морфологические и лексические алгоритмы. Сортировка позволяет систематизировать информацию, собранную роботами. Проанализированные элементы страницы записываются в индексную базу данных.

3. База данных хранит в себе преобразованные специальным образом параметры всех скачанных и проиндексированных страниц. Актуальная база называется индексом. В ней хранятся страницы, подготовленные к выдаче.

4. Система обработки запросов и выдачи результатов — важнейший элемент поисковой системы. Именно от алгоритмов, которые в ней заложены, зависит качество выдачи и скорость поиска.

5. Запрос, который получила от пользователя система, в обязательном порядке анализируется. Результат передается модулю ранжирования, после чего все документы обрабатываются с целью выявления страниц, наиболее релевантных запросу. Далее для каждого найденного документа генерируются сниппеты и перед пользователем предстают страницы выдачи (SERP).

image04.png

Что такое сниппет?

Сниппет состоит из заголовка, краткой аннотации и ссылки на документ. Ключевые слова выделяются жирным шрифтом. Например, Google обычно формирует аннотацию из описания страницы (description). Если описания нет или оно содержит нерелевантую информацию, в качестве аннотации используется более подходящий фрагмент текста.

image05.jpg

Яндекс формирует аннотацию из фрагментов документа, содержащих слова из запроса пользователя.

image06.jpg

Чтобы удержать пользователя, система должна предоставлять максимально релевантные документы. Поэтому поисковики постоянно развиваются и улучшают свои алгоритмы.

0 комментариев
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Поделиться 
Поделиться дискуссией:

Отправьте отзыв!
X | Закрыть