Войти как пользователь
Вы можете войти на сайт, если вы зарегистрированы на одном из этих сервисов:
Россия +7 (495) 139-20-33
21 Августа 2007 в 05:19

Обзор поиска по блогам

Россия +7 (495) 139-20-33
2 11291
Подпишитесь на нас в Telegram

В России блоги известны уже несколько лет, однако лишь в последнее время они стали по-настоящему массовым явлением: сегодня русскоязычные блоги исчисляются сотнями тысяч.

Сейчас среди «звезд» модно блогерстововать. Свой онлайн-дневник имеют участник шоу «Дом 2» Александр Нелидов и фигуристка Анастасия Гребенкина, даже необщительные в обычной жизни DJ Грув и Илья Лагутенко обзавелись блогами, есть интернет-дневник у Владимира Вольфовича Жириновского. О создании собственных, корпоративных блогов заговорили такие компании как Газпром и Норильский Никель.

Согласно опубликованному Яндексом в апреле исследованию российской блогосферы, в рунете около двух миллионов блогов. Чуть меньше половины из них обновляется хотя бы раз в три месяца. Но динамика роста числа интернет-журналов рунет опережает буржунет почти в два раза ( наши 74% против их 41%).

Причем одновременно с количеством блогов растет и их толщина. В рекомендациях типа «как стать успешным блогером» рефреном повторяется “чтобы привлечь пользователей, надо писать не менее 3 постов в день”. Всё вместе это оборачивается сногсшибательным ростом количества информации, а значит, растет и необходимость ее быстрого и удобного поиска.

Искать по блогам в рунете можно с помощью поисковых систем Яндекс и Google. Или воспользоваться поиском, который предлагают блогхостинги – популярные сегодня западный “Живой Журнал” (LiveJournal) и российский LiveInternet, Блоги.Mail, Планета Рамблер.

Кто и где ищет?


В России популярностью пользуются два блогхостинга: LiveInternet и Живой Журнал. Если по количеству рунетовских пользователей LiveJournal еще опережает отечественный Ливинтернет, то по массе сообщений разрыв гораздо меньше.

- LiveJournal LiveInternet
Количество пользователей 1 060 598 781 552
Количество сообществ 65 269 45 337
Количество сообщений в день Около 60 тысяч Около 50 тысяч

Поиск по ЖЖ осуществляется на основе Яндекс XML . В отличие от него, LiveInternet производит не поиск, а скорее фильтрацию запросов на основе географии, интересов и имен (ников). По словам медиа-директора LiveInternet Чачанова Руслана, хостинг планирует в ближайшее время ввести поиск по тексту. “Вероятнее всего, мы будем делать поиск по блогам самостоятельно”, - ответил Руслан на мой вопрос о возможности сотрудничества компании с каким-либо поисковиком.

Поиск по блогам – выдача по форумам


Данные, по которым ищет и которые индексирует поиск по блогам в поисковых системах, имеют совершенно иную специфику и формат по сравнению с тем, чем занимается основной поиск. В поиске по блогам сообщения хорошо структурированы и невелики по объему, в то время как в основном поиске находится большое количество слабоструктурированной информации.

Так же сильно, как разнится выдача Google и Яндекса, поиск по блогам одного поисковика (Яндекс Поиск по блогам) отличается от другого (Google Blogsearch) . В первую очередь, различие заключается в учете параметров при формировании выдачи.

Время создания записи - тот параметр, по которому упорядочены записи Поиска по блогам Яндекса по умолчанию. Поиск по блогам Яндекса имеет собственный, отдельный от основного, индекс (при этом ссылки на блоги можно встретить и в основной выдаче Яндекса). В этом индексе сейчас более 200 млн. сообщений из 2 млн. источников - это около 8% от основного поиска Яндекса.

У Google – PageRank. В результаты поиска Google включены все блоги, а не только опубликованные с помощью программы Blogger, являющейся собственностью поисковика. Как сказал инженер компании Google Ринат Сафин,"поиск по Блогам Google – это самостоятельный вид поиска, использующий индексатор и алгоритмы, разработанные специально для сервиса и с учетом его особенностей. Блоги включаются в выдачу основного поиска Google и, как и все остальные сайты глобальной паутины, ранжируются с учетом сотен факторов, учитывающихся системой Google PageRank . Если вы будете совершать поиск на интересующую вас тематику на Google.ru или Google.com, то в результатах поиска тоже сможете увидеть ссылки на блоги, если они там будут уместны. Просто бывают случаи, когда пользователям необходимо найти информацию, которая может быть только в блогах, например, определенный политический комментарий на недавнее событие. В таких случаях поиск по блогам - это просто незаменимый инструмент, и именно для таких случаев мы его и создавали."

Из-за разных факторов ранжирования, выдача у поисковиков сильно отличается. По одному и тому же запросу обоих поисковиков на первой странице выдачи нельзя найти два одинаковых сайта. SEONEWS проверил работу поиска по блогам Яндекса и Google.

Яндекс.Поиск по блогам ищет не только по блогам, но и по форумам и RSS-лентам. По умолчанию записи выводятся по свежести. Поэтому по такому абстрактному запросу как “информация”, в топ-10 попали в основном форумы и новостные сайты (добавленные через RSS).Обычно новая информация на форумах появляется быстрее и чаще, чем в блогах. На первой странице выдачи ссылка на блог была только на третьей позиции. В топ-10 попало только 3 ссылки на блоги. Остальные – на форумы.

http://blogs.yandex.ru/search.xml?how=tm&rd=2&text=%D0%B8%D0%BD%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%86%D0%B8%D1%8F


Google поиск по блогам. По тому же запросу “информация” предложил в топ-10 в основном новостные сайты. На первой позиции был сайт новостного издания для интересующихся йогой “Дыхание Жизни”. Газета “Коммерсант” оказалась в выдаче четвертой. Однако, на всех этих сайтах слово “информация” последний раз упоминалось за несколько часов до запроса. На третьей позиции выдачи оказался сайт, на страницах которого слово “информация” упоминалось за 21 час до запроса. На первой странице выдачи не было ссылки ни на один блог. Только на четвертой позиции – ссылка на форум “Конференция”.

http://www.google.ru/blogsearch?hl=ru&ie=UTF-8&q=%D0%B8%D0%BD%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%86%D0%B8%D1%8F&lr


Однако, и Google, и Яндекс предлагают пользователю выбрать, из какого источника он хочет получить нужную информацию.

В Яндексе справа расположена панель задач, где пользователь может выбрать, откуда должна формироваться выдача из
- популярных блогов,
- блогов (то есть всех блогов),
- форумов или
всего вышеперечисленного.

Блоговая выдача формируется на симбиозе релевантности и свежести. Но у Google, как всегда, свобода выбора: на экране слева в специальной панели можно задать временной промежуток поиска информации: 1 час, полдня, день неделя, и т.д.

Если ввести более конкретный запрос, например “Хиросима”, то Яндекс, в первую очередь, выдает ссылки на источники, где в последний раз упоминался этот город. Что вполне логично, ведь по умолчанию учитывается временной фактор. А вот найти что-либо о самой бомбардировке в предложенных поисковиком источниках сложно.

Google же, напротив, предоставляет ссылки на источники, из которых можно почерпнуть информацию о самом городе, дате бомбардировке и все, что последовало за этим.

Цена популярности


Одна из самых интересных «фишек» поиска по социальной среде от Яндекса – это фильтрация по популярным блогам. Описания того, какие блоги Яндекс из своего Яндекс\.Поиск по блогам считает популярными, мы не нашли. Поэтому я попробовала опытным путем нащупать границу популярности дневника в Я.Поиск по блогам. На сегодняшний день, самый популярный блогер - Александр Жданов aka Alexjdanov, чья авторитетность 191 766.

Чтобы оценить, с какой авторитетностью дневники попадают в выдачу по популярным блогам, SEONEWS провел небольшой эксперимент. В поиск по блогам вводился запрос, вероятность упоминания которого за последнее время была наименее вероятна. Затем оценивалась авторитетность последнего блога в выдаче.

Результаты:

Запрос Количество предложенных страниц в обычном поиске по блогам Количество страниц в выдаче по популярным блогам Авторитетность последнего блога
гиппопотам 3542 361 11168
голограмма 8736 455 4207
кукрыниксы 15064 390 2978
кашалот 3920 299 1026
киднеппинг 588 46 1608
макраме 3542 246 3536
примитив 3458 542 3444
бормотуха 3612 28 1490
морошка 4984 277 5327
оруженосец 6622 482 4146

Результаты эксперимента позволяют сделать вывод, что Яндекс отфильтровывает в поиске по популярным блогам дневники с авторитетностью не меньше 1000.

О главном


Ведение собственного блога – это не только самовыражение. Может быть, пятнадцать лет назад, когда только начали появляться первые блоги, это и было так. Теперь блог – это рекламная площадка для рекламодателей и для самого блогера. С помощью блога пользователь рассказывает о себе, пытается привлечь к себе внимание. Чем интереснее записи в блоге, тем больше посетителей. Как сказал Антон Носик, “способом продвижения моего блога является занятие мною разных заметных публике должностей. Если меня назначат премьер-министром РФ, то добавится человек 500 новых френдов. если приговорят к пожизненной каторге - тысяча”.

Больше посетителей – больше дохода для блогера от контекстной и баннерной рекламы. Однако, одними интересными постами пользователей не привлечь. На Западе уже давно известно, а в рунете только начинает свое развитие такое понятие как SMO – оптимизация под социальные медиа. Существует множество способов продвинуть свой блог, о многих из них SEONEWS не так давно уже писал. Но нельзя продвинуть свой блог под оба поиска по блогам Яндекса и Google.

Под какой же поисковик стоит продвигать свой блог? Я пришла к выводу, что под Яндекс. Несмотря на то, что основная выдача формируется по форумам, в российском поисковике существует фильтр поиска по блогам. Если пользователь хочет найти не просто свежую информацию, а именно то, каким образом те или иные блогеры отметили определенное событие, то логичнее будет воспользоваться Яндексом.

Выдачу Google пользователь сможет отфильтровать только по времени. А выбирать из того количества новостных сайтов, которое предоставляет поисковик, придется вручную.

Яндекс при использовании фильтра не только может сформировать выдачу по блогам, но и выдачу по популярным блогам. При этом ссылки на более популярные онлайн-дневники будут в выдаче выше стоять, чем на менее популярные. Однако наличие рейтинга приводит к тому, что пользователи сознательно начинают накручивать популярность блогов. Но это уже другая проблема.
2 комментария
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
  • Демфира Шакурова
    97
    комментариев
    0
    читателей
    Демфира Шакурова
    больше года назад
    Из чего состоит ППБ Яндекса.
    Роман Иванов ака kukutz
    Cтарье  (лето 2006 года), но больше я этого ни где не находила.

    1. Робот, который называется blogindexd. Робот скачивает RSS-потоки (его user-agent — YandexBlog/0.99.101 (compatible; DOS3.30; Mozilla/5.0; B; robot;) NN readers, где NN readers — количество подписчиков на этот поток в «Яндекс.Ленте» — эта информация может оказаться интересной для автора потока) и складывает их в хран...
    Из чего состоит ППБ Яндекса.
    Роман Иванов ака kukutz
    Cтарье  (лето 2006 года), но больше я этого ни где не находила.

    1. Робот, который называется blogindexd. Робот скачивает RSS-потоки (его user-agent — YandexBlog/0.99.101 (compatible; DOS3.30; Mozilla/5.0; B; robot;) NN readers, где NN readers — количество подписчиков на этот поток в «Яндекс.Ленте» — эта информация может оказаться интересной для автора потока) и складывает их в хранилище.
    2. Хранилище для текста записей, называется bulca. Это основанное на файловой системе хранилище, разработка «Яндекса».
    3. Хранилище для метаинформации (дата записи, id потока записи и т.п.). Для него используется mysql.
    4. Полнотекстовый индекс и поисковая программа над этим индексом. Это, фактически, обычный «Яндекс.Сервер». Вообще говоря, индекс не один, он разбит на несколько — постоянные индексы, которые содержат архивы; статичные индексы, которые содержат записи последних недель и обновляются довольно редко, примерно раз в сутки, и динамические индексы, которые обновляются гораздо чаще, вплоть до раза в пять минут.
    5. Планировщик, который, на основании истории потока, определяет, когда его нужно скачать в очередной раз. Это довольно интеллектуальная программа, цель которой состоит в том, чтобы качать потоки как можно чаще, но при этом не перегрузить сервера, с которых мы скачиваем потоки. В первые месяцы работы поиска по блогам бывало, что слишком активно качая RSS с Livejournal.com, мы «роняли» им сервера.
    6. Большое количество дополнительных скриптов, которые отвечают за борьбу со спамом (а спам в блогах есть), отключение новостных потоков (в поиске по блогам мы стараемся оставлять только потоки, содержащие мнения — блоги, форумы, группы и т.п.) и многое другое.

    Источник ( http://webeconomist.ru/2006/07/31/print:page,1,roman_ivanov_cilu_blogov_v_jandekse_priznali.html )
    -
    0
    +
    Ответить
  • Гость
    больше года назад
    Балагодаря тому что этот сайт romankalugin.com пописан в рсс Гугла, главная страница индексируется ежечасно:)
    -
    0
    +
    Ответить

Отправьте отзыв!
X | Закрыть