5 Декабря 2007 в 03:07

Колдунщик умер, да здравствует колдун!

25 1768

Колдунщик умер, да здравствует колдун! новый анализатор весов слов готов стать достойной заменой колдунщику яндекса. Новый «персонаж» вывел в свет руководитель отдела продвижения РА MIRALAB Михаил Райцин. Знакомство состоялось накануне на SE-форуме, где новичку был оказан весьма теплый прием.

Сервис Miratools.ru, первой ласточкой которого стал инструмент для проверки весов слов, с таким близким сердцу названием – koldun, задумывался как собрание уникальных сервисов для SEO-специалистов. «В основу легли алгоритмы, разработанные нами для внедрения во внутренние системы поисковой аналитики», - говорит Михаил. Проверку бэклинков планируется запустить к концу декабря.

Всех тонкостей работы koldun создатели не раскрывают, но отмечают, что веса слов берутся из собственной базы, объем которой порядка 210 000 слов, а при проверке весов используется расчет по кворуму. Слова, которых нет в базе, ставятся в очередь - раз в сутки обрабатывается 1 000 новых слов. Но произошло форс-мажорное обстоятельство, по словам Михаила, «кто-то "скормил" сервису базу на 90 000 слов, из-за чего проверка затянулась. Мы не предусмотрели, что кто-то захочет прогнать собственные базы, используя наш сервис. Меры уже приняли, такого больше не повторится! Базу обновим к концу недели».

Колдунщик умер, да здравствует колдун!

Точность и полноту алгоритма расчета весов разработчики Miratools.ru оценивают на 100%. Некоторая погрешность в расчете базы может появиться только в результате сбоя программного обеспечения или сбоев в выдаче Яндекса. База будет периодически обновляться и проверяться на соответствие реальным весам.

Дмитрий Рузанов, аналитик-проектировщик компании Ингейт, не только подтверждает, что сервис в точности определяет веса слов, но и пытается проанализировать сам процесс:

«Скорее всего, такая точность достигается путем вычисления весов через формулу кворума. Т.е. решается обратная задача: задают Яндексу запрос из нескольких слов, где для всех слов, кроме искомого, заданы в явном виде веса (например, хочу::1000 & посчитать::10000 & вес). Далее, манипулируя весами других слов, ищут пороговую величину кворума, т.е. когда выдача по запросу присутствует, и когда в выдаче нет ни одного сайта.

Может быть, задача решается несколько иначе. Например, есть много-много текстов. По ним составляется обратный индекс. Для ряда слов уже известны веса. Тогда по обратному индексу определяется отношение частоты искомого слова и уже известного слова. Через пропорцию вычисляют вес искомого слова во всей коллекции документов. Потом уже более точно подбирают через формулу кворума.

Может, также используют значение количества сайтов в выдаче по запросу. Но все равно, как мне кажется, последняя стадия - это проверка непосредственно через сам кворум и выдачу Яндекса
».

Однако у Дмитрия есть опасения, если Яндекс прикроет возможность задавать веса слов непосредственно в запросе, то данный сервис потеряет значительно в точности. «Хотя создатели сервиса набрали достаточную базу по весам слов. В общем, в любом случае они молодцы!».

25 комментариев
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
Поделиться 
Поделиться дискуссией:
  • Novichek
    3
    комментария
    0
    читателей
    Novichek
    больше года назад
    по формуле получается, что
    seo^0,3798=(1-0,06^(1/sqrt(2)))*(seo^0,3798+795^0,3798+411^0,3798).
    Решая уравнение, относительно seo, получаем вес seo=462689.
    Откуда ~120000 ??
    -
    0
    +
    Ответить
    Поделиться
  • ООО "Ай-ВИ"
    44
    комментария
    0
    читателей
    ООО "Ай-ВИ"
    больше года назад

    Да, по формуле действительно так. Поспешил )
    Проверил на реальной выдаче - получается вообще другое - порог вот такой (hfghfewhf::795 & ertert::411 seo::83725)//6
    т.е. вес слова seo - 83725
    Подставив в формулу кворума получаем, что значение степени должно измениться с 0,3798 до 0.5113
    Если манипулировать мягкостью и весами других слов, то вроде бы выдача меняется, т.е. эти операторы - рабочие. Соответственно, скорее всего изменился вид формулы.

    Да, по формуле действительно так. Поспешил )
    Проверил на реальной выдаче - получается вообще другое - порог вот такой (hfghfewhf::795 & ertert::411 seo::83725)//6
    т.е. вес слова seo - 83725
    Подставив в формулу кворума получаем, что значение степени должно измениться с 0,3798 до 0.5113
    Если манипулировать мягкостью и весами других слов, то вроде бы выдача меняется, т.е. эти операторы - рабочие. Соответственно, скорее всего изменился вид формулы.

    -------------------------
    А вообще интересно, надо будет на досуге заняться
    -
    0
    +
    Ответить
    Поделиться
  • Novichek
    3
    комментария
    0
    читателей
    Novichek
    больше года назад
    Вот-вот. с магадном с кворумом что-то нахимичили.
    -
    0
    +
    Ответить
    Поделиться
  • ООО "Ай-ВИ"
    44
    комментария
    0
    читателей
    ООО "Ай-ВИ"
    больше года назад
    Так, небольшая ошибка - запрос я задавал без второго &
    Со вторым амперсантом вроде все ок, если не считать того, что вылазят только записи с блогов
    -
    0
    +
    Ответить
    Поделиться
  • Novichek
    3
    комментария
    0
    читателей
    Novichek
    больше года назад
    вероятно формула верна только для блогов и не факт, что там присутствуют только статические параметры..
    (hfghfewhf::101 & ertert::92 & seo::77001)//6 - граничные значения.
    (hfghfewhf::795 & ertert::411 & seo::461071)//6 - граничные значения.
    -
    0
    +
    Ответить
    Поделиться
  • ООО "Ай-ВИ"
    44
    комментария
    0
    читателей
    ООО "Ай-ВИ"
    больше года назад
    Ну в общем вывод - точно есть изменения, а какие - это надо искать
    -
    0
    +
    Ответить
    Поделиться
  • Гость
    больше года назад
    как выбирать другие слова при манипулировании их весами в запросе (хочу::10 & посчитать::10 & вес)//6
    ?
    -
    0
    +
    Ответить
    Поделиться
  • ООО "Ай-ВИ"
    44
    комментария
    0
    читателей
    ООО "Ай-ВИ"
    больше года назад
    Блин, давно это было...
    Но стратегия вроде бы следующая
    Хотим проверить вес слова "seo"
    Берем фразу (hfghfewhf::1 & ertert::1 seo)//6 - по этому запросу в выдаче есть сайты, т.к. при малых значениях весов первых двух слов одного слова seo достаточно для прохождения кворума. Увеличиваем веса первых двух слов... ну и т.д.
    Пришли в следующему:
    (hfghfewhf::795 & ertert::410 seo)//6 - в выдаче есть сайты
    (hfghfewhf::795 & ertert::...
    Блин, давно это было...
    Но стратегия вроде бы следующая
    Хотим проверить вес слова "seo"
    Берем фразу (hfghfewhf::1 & ertert::1 seo)//6 - по этому запросу в выдаче есть сайты, т.к. при малых значениях весов первых двух слов одного слова seo достаточно для прохождения кворума. Увеличиваем веса первых двух слов... ну и т.д.
    Пришли в следующему:
    (hfghfewhf::795 & ertert::410 seo)//6 - в выдаче есть сайты
    (hfghfewhf::795 & ertert::411 seo)//6 - в выдаче нет сайтов

    Через формулу кворума пересчитываем, что вес слов seo около 120000
    Для повышения точности надо брать больше двух слов
    ------------------------
    Это первая стратегия, которая приходит на ум.
    Не знаю, может Михаил Райцин использует корпус документов, по которым считает IDF.
    -
    0
    +
    Ответить
    Поделиться
  • Miha Kuzmin
    262
    комментария
    0
    читателей
    Miha Kuzmin
    больше года назад
    Давай мне обьяснишь :) Что мне обьяснишь?
    -
    0
    +
    Ответить
    Поделиться
  • Светлана Чернева
    0
    комментариев
    0
    читателей
    Светлана Чернева
    больше года назад

    Про колдунщика ты и без моих объяснений знаешь всё :)
    -
    0
    +
    Ответить
    Поделиться
  • Гость
    больше года назад
    Кто-то удивиться, но знал и раньше, но не пользовал. Смысла большого мне так никто и не смог объяснить в этом.
    -
    0
    +
    Ответить
    Поделиться
  • Олег Сахно
    483
    комментария
    0
    читателей
    Олег Сахно
    больше года назад
    А смысл был :)
    -
    0
    +
    Ответить
    Поделиться
  • ООО "Ай-ВИ"
    44
    комментария
    0
    читателей
    ООО "Ай-ВИ"
    больше года назад

    Лекарство есть, великий критик из bdbd?
    Вы как всегда - посрались и ушли...
    -
    0
    +
    Ответить
    Поделиться
  • Miha Kuzmin
    262
    комментария
    0
    читателей
    Miha Kuzmin
    больше года назад
    Есть. Начать с учебника русского языка.

    p.s. раз уж великий, исполни 10 раз ку :)
    -
    0
    +
    Ответить
    Поделиться
  • Светлана Чернева
    0
    комментариев
    0
    читателей
    Светлана Чернева
    больше года назад

    Давай я объясню :) что тебе объяснить?
    -
    0
    +
    Ответить
    Поделиться
  • Miha Kuzmin
    262
    комментария
    0
    читателей
    Miha Kuzmin
    больше года назад
    Аналитик ингейта похоже бредит. Лечить надо. Это раз. Второе - веса слов - это далеко не замена выводимого запроса колдунщика. Самое интересное в контекстных ограничениях.
    -
    0
    +
    Ответить
    Поделиться
  • Гость
    больше года назад
    Миша, а когда ты хоть что-то внятно прокомментируешь, без "лечить надо" и мата? Может тебе всё-таки стоило получить высшее образование хотя бы для того, чтобы научиться нормально изъясняться в приличном обществе?
    -
    0
    +
    Ответить
    Поделиться
  • Miha Kuzmin
    262
    комментария
    0
    читателей
    Miha Kuzmin
    больше года назад
    Господин онаним, разрешите вас культурно и со всем уважением послать [цензура] :)
    -
    0
    +
    Ответить
    Поделиться
  • Гость
    больше года назад
    "[цензура]" пишется раздельно. "на" - это предлог. школу тоже не посещали... :)
    -
    0
    +
    Ответить
    Поделиться
  • Гость
    больше года назад
    Кузьмин совершенно прав - самое вкусное - это как раз ограничения. А вот сервис по их определению мы выкладывать в паблик не будем.
    -
    0
    +
    Ответить
    Поделиться
  • Miha Kuzmin
    262
    комментария
    0
    читателей
    Miha Kuzmin
    больше года назад

    Ты и этот зря выложил, к слову :)

    Онаним, продолжай онани... Жечь, в плане! :)))
    -
    0
    +
    Ответить
    Поделиться
  • Гость
    больше года назад
    Миш, возможно.
    Но там есть мой интерес, поэтому выложили.
    -
    0
    +
    Ответить
    Поделиться
  • Гость
    больше года назад
    Неясно только, кто же новичок, Михаил или Колдун? =)
    -
    0
    +
    Ответить
    Поделиться
  • Miha Kuzmin
    262
    комментария
    0
    читателей
    Miha Kuzmin
    больше года назад
    Яндекс :)
    -
    0
    +
    Ответить
    Поделиться
  • Светлана Чернева
    0
    комментариев
    0
    читателей
    Светлана Чернева
    больше года назад
    Колдунщик, колдун... оказывается о нём (колдунщике) в пору его существования никто и не знал, причём не знали люди, продвигающие сайты, да и сейчас спрашивают "что это такое".

    >>Неясно только, кто же новичок, Михаил или Колдун?
    >>Яндекс
    Бедный Яндекс - везде ему достаётся :)
    -
    0
    +
    Ответить
    Поделиться

Отправьте отзыв!
X | Закрыть