9 Июля 2010 в 12:39

Яндекс ищет в реальном времени

4 4450

Яндекс разработал и внедрил новую поисковую технологию, которая позволяет находить совсем свежие документы — через минуты после их появления в интернете.

Достаточно много поисковых запросов (от 2% в спокойные дни до 8% в дни важных событий) посвящено событиям, которые случились совсем недавно. Задавая эти запросы, пользователи ожидают найти, в том числе и документы, которые были созданы только что. Чтобы хорошо отвечать на такие запросы, Яндекс, во-первых, научился выявлять их среди общего потока, и во-вторых, внедрил нового поискового робота — Orange. Orange работает в режиме реального времени. Он умеет находить свежие документы, как только они появились в интернете, индексировать их и выкладывать на поисковые сервера буквально за несколько секунд.

Некоторые сайты интернета обновляются не очень часто, а на других — например, на новостных ресурсах — новые документы создаются постоянно. Orange обходит такие сайты и добавляет новые документы в поиск по мере их появления, без задержек.

Чтобы определять, нужна ли свежая информация в ответ на те или иные запросы, Яндекс разработал несколько детекторов. Они анализируют самую разную информацию — например, тематику сообщений в СМИ или рост количества поисковых запросов по той или иной теме.

«В интернете сейчас все больше real-time информации, которая нужна людям прямо сейчас. И мы хотим дать им возможность находить её прямо сейчас, — говорит Федор Романенко, менеджер качества поиска. — Это только первый шаг, конечно, мы будем улучшать качество поиска по новостным запросам и дальше. Новая технология дает возможность делать это сравнительно легко».

Робот Orange и технология поиска в реальном времени были разработаны специалистами из Yandex.Labs — калифорнийского офиса компании — в сотрудничестве с разработчиками из московского офиса. Подробнее о новых технологиях можно почитать в блоге Яндекса.

4 комментария
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Поделиться 
Поделиться дискуссией:
  • Анна Макарова
    285
    комментариев
    0
    читателей
    Анна Макарова
    больше года назад
    А вот Mail.Ru  новая поисковая технология Яндекса не впечатлила.  «Сама технология – это не полет на Марс», -  говорит Владислав Шабанов, руководитель поисковых проектов Mail.Ru в интервью газете ВЗГЛЯД (http://www.vz.ru/economy/2010/7/9/417239.html).
    -
    0
    +
    Ответить
    Поделиться
  • prohoruch
    3
    комментария
    0
    читателей
    prohoruch
    больше года назад
    Это новостной сайт или копипаст какой-то? http://company.yandex.ru/news/press_releases/2010/0709/index.xml
    -
    0
    +
    Ответить
    Поделиться
  • prohoruch
    3
    комментария
    0
    читателей
    prohoruch
    больше года назад
    Даже отрерайтить источник уже ленятся. Куда Димок смотрит
    -
    0
    +
    Ответить
    Поделиться
  • Анна Лебедева
    0
    комментариев
    0
    читателей
    Анна Лебедева
    больше года назад
    Это публикация пресс-релиза. О чем говорит тег - "пресс-релизы". Мы как бы и не претендуем в этом случае на уникальность. Кстати, это практикуется уже два года. Новости, написанные сотрудниками издания имеют указание авторства. И причем тут Димок? Дима - директор по развитию. Не стоит путать с главным редактором. Ссылка в первом же абзаце не на оригинал? или в пылу злопыхания не заметили?
    -
    0
    +
    Ответить
    Поделиться

Отправьте отзыв!
X | Закрыть