Войти как пользователь
Вы можете войти на сайт, если вы зарегистрированы на одном из этих сервисов:
Россия +7 (495) 139-20-33
22 Ноября 2006 в 12:00

Будущее за семантическим интернетом

Россия +7 (495) 139-20-33
1 5267
Подпишитесь на нас в Telegram

На последней конференции, проводимой Американской Ассоциацией Искусственного Интеллекта (American Association for Artificial Intelligence - AAAI), изобретатель Всемирной паутины, профессор сэр Тим Бернерс-Ли (Tim Berners-Lee) выступил с докладом о необходимости целенаправленного перехода к так называемому "семантическому интернету" - Semantic Web. Идея семантического поиска и методика LSI (Latent Semantic Indexing) появились около 10 лет назад. В теории семантический поиск базируется на определении смысловых связей между словами запроса и документа. Этого алгоритмы современных поисковых систем интернета (ни Google, ни Yahoo, ни Яндекс) делать не могут. Причина -технические сложности.

По мнению профессора Бернерс-Ли, причина жесткой необходимости перехода к семантическому поиску в увеличивающивающихся объемах информации, с поиском и обработкой которых человек не справляется даже с помощью поисоквых систем. Роль "миссии" семантического поиска профессор предложил взять на себя крупнейшей в мире поисковой системе , то есть Google. Директор по поиску компании Google, Питер Норвиг (Peter Norvig), также являющийся активным членом AAAI, разделяет мнение г-на Бернерс-Ли, однако считает, что воплотить это будет не легко:
"Я не против Semantic Web. Но с точки зрения Google к этому есть ряд препятствий, и главное из них - некомпетентность пользователей. Вторая проблема – счетчики статистики. И третье - жульничество. И если у нас будет семантический интернет без человеческого контроля, то мы будем гораздо более уязвимы для мошенников."

Бернерс-Ли согласился, что препятствия есть, и предложил Google заняться их устранением, отметив, что эта компания сейчас в силе значительно улучшить Сеть. Сейчас наиболее удачной попыткой реализации идеи Semantic Web в Рунете считается поисковая система Quintura .

1 комментарий
Подписаться 
Подписаться на дискуссию:
E-mail:
ОК
Вы подписаны на комментарии
Ошибка. Пожалуйста, попробуйте ещё раз.
  • Гость
    больше года назад
    Доброе вреся суток.
    Ниже размещаю часть своей статьи от 2003 года. А к настоящему времени разработал алгоритм поисковой системы и готов к диалогу с теми, кто готов его реализовать:
    Поисковая система «Тарзан» и организация баз данных.
    Искусственный интеллект «SNI».
    Автор: Кабжанов Рашид Шахмуратович
    15 октября 2003 г.
    Интернет и будущее человека.

        Единственная сфера, где произошла реализация нейронных связей  – э...
    Доброе вреся суток.
    Ниже размещаю часть своей статьи от 2003 года. А к настоящему времени разработал алгоритм поисковой системы и готов к диалогу с теми, кто готов его реализовать:
    Поисковая система «Тарзан» и организация баз данных.
    Искусственный интеллект «SNI».
    Автор: Кабжанов Рашид Шахмуратович
    15 октября 2003 г.
    Интернет и будущее человека.

        Единственная сфера, где произошла реализация нейронных связей  – это Интернет. Его развитие и проникновение во все страны является верным путем к изменению уровня развития человечества и обмена информацией.
        Но Интернет создан как система максимально работоспособная в экстремальных условиях (выход из строя одного или нескольких узлов связи не ведет к разрушению структуры и значительному ухудшению обмена данных). Этот принцип схож с био структурой нейронных отношений.
        Создание общей работающей системы пока не привело к массовому появлению таких же интересных идей, которые полностью используют возможности Интернета. Уровень софта и сервиса основанного на Интернете продолжает использовать линейный и редко плоскостной типы обменов и связей. Эти принципы описаны ниже.
        Создателям информационных баз данных и других информационных систем не хватило идеи и осознания необходимости в не традиционных решениях. Например: человек может воспроизвести у себя в памяти любое ощущение, полученное им ранее через один из органов чувств. Человек делает запрос и получает это воспоминание: запах цветов, вид солнца, пенье птиц, а также решение или осознание какого-то факта в этот момент. Запах цветов и солнце не имеют прямой связи, но у этого человека это связанные факты. Когда он ночью почувствует запах цветов, принесенных ветром, он вспомнит солнце. Попробуйте вспомнить, когда вы были счастливы и у вас возникнет масса воспоминаний, где есть все ваши восприятия. Это и погода, и ваше настроение, и звуки и прочее, всего 52 вида восприятия.
        Проводя аналогию, в идеале, человек делает запрос в Интернете и получает ответ. Ответ должен быть в 1-2-3 вариантах, в крайнем случае не более 10 вариантов. На деле он получает тысячи или десятки тысяч ссылок.
        Другое несоответствие норме – это просто отсутствие ссылки на нужный вам сайт или товар в поисковой системе. Это пробел в области Интернет стандартов.
        Традиционно применяется точечный способ поиска информации… Делается запрос, получаются ссылки, потом поиск по одному из вариантов найденного и так далее последовательная цепь от А к В, от В к С, от С к D… Чаше всего эти переходы не связаны между собой.
        Поиск был бы более точен, быстр и удобен при поиске параллельно по нескольким признакам. Например, у информации Х есть основные признаки А, В и С. Но для такого рода поисковой системы нужна совершенно другая система хранения и классификации информации, нежели существующая. Самым оптимальным решением было бы наличие трех или четырех признаков. Наличие 3 или 4 связей наиболее оптимально для создания плоскостной или пространственной структуры представления информации. Это решение может быть решено на обычных РС (нет необходимости в создании новых РС), которые работают только в точечном методе. Пример алгоритма решения задачи на компьютере: если А > В, то решение С, иначе решение D. То есть движение от одной точки к другой последовательный. Из одной точки не может быть движения в два или несколько вариантов решения. Эта проблема заложена в электрической природе триггеров, которые составляют «логику» компьютеров.

        Помогает получить решение многомерных задач через компьютер разветвленность связи между компьютерами в сети. Это означает, что запрос с одного компьютера может поступить на ряд других и вернуть свой вариант ответа. Этим достигается ответ на один и тот же вопрос: «да» и «нет» и другие ответы, которые лежат между ними. Такое решение полностью может быть похожим на решение человека, которое может изменяться в разных жизненных ситуациях. Такой же набор ответов может дать наш мозг на наш запрос. И наша задача сделать выбор из всех этих вариантов. Таким образом, через «сетевые решения» можно создавать самый приближенный к натуральному искусственный интеллект, именуемый «SNI» как аббревиатура Simulated Network Intelligence (искусственный сетевой интеллект).
        Еще одним отличительным уровнем SNI – является поиск решения по обширной базе данных (весь Интернет). А также решения, построенные на ряде промежуточных решений ряда компьютеров (сайтов), которые в свою очередь опираются на интегрированную информацию со всей сети.
        Первым шагом создания SNI является введение регламентов на размещение и представление (систематизация) данных в сети и организация информационных служб. Эти службы должны решать задачу легкого и точного доступа к нужным данным в SNI, а также ее представление в «чистом» виде для пользователей - Тарзана.
        Вторым шагом в создании SNI является разработка программ и приложений, организующих процессы постановки и поиска решения задач в сети на ряде сайтов. Так, что будет полностью реализован смысл слова сайт – как узел. Для этого должен быть введен регламент для соответствующих приложений*, а также необходимо достичь коллективного соглашения об использовании ресурсов для интеллектуальных сетевых программ (SNI Soft*).
        Второй и третий шаги подразумевают полную интегрируемость баз данных и возможность работы и обмена данными с разными сайтами и под различные операционные среды*. К этому можно добавить необходимость жесткого применения и использования существующих международных стандартов в области Интернета и программного обеспечения.

        Для Тарзана наличие 4 признаков дает полное представление об окружающем мире (необходимое количество связей с окружением) как это, возможно, происходит в нейронах мозга. У человека, который вспомнил запах цветов, одновременно есть другие ощущения, которые он получил в этот момент (в том числе сам момент этого события).

        В итоге для точного и однозначного поиска любой информации необходимо ввести следующий регламент:

    -
    0
    +
    Ответить

Отправьте отзыв!
X | Закрыть