26 нояб. 2011 г.

Несколько инструментов semantic web

Взято с сайта Лаборатория интеллектуальных систем ИТМО
Советую заглянуть в первоисточник - там есть много интересностей...

Marbles

Данное приложение является браузером семантического наполнения Интернет. Надо признать, что он является скорее инструментом специалиста а не простого пользователя. Для своей работы он требует указания ручного ввода идентификатора исследуемого ресурса и выбора способа представления.
Для результата Marbles предлагает три варианта отображения:

Подробное. Полный список отношений в которых участвует данный ресурс. Приводятся ссылки для просмотра в Marbles типа отношения и связанного объекта.
Сводка. Несколько наиболее важных характеристик, например имя, текстовое описание, домашняя страница.
Фотографии. Автоматически найденные изображения предмета.

Интересной особенностью является то, что после результатов приводится список источников с их значками-метками. Этими значками помечаются результаты, полученные из данного источника.
Особенно важен в этом проекте подход к способу представления результатов. В нём используется так называемый словарь представления RDF-документов Fresnel. Этот словарь образует язык, позволяющий описать способ отображения пользователю данных, распределённых в Сети. Он создан рабочей группой консорциума W3C для унификации способов представления метаданных и возможности отделения описания этого представления от сервиса, выполняющего сбор и, возможно, обработку данных.
В целом подводя итог обзору этого приложения можно отметить, что несмотря на общую недружественность пользователю, он несёт в себе следующие практически интересные идеи:
Использование переносимого формата описания представления ресурсов.
Дифференциация способа представления данных, предоставление пользователю выбора.
Визуальная ассоциация результатов запроса с источником из которого они получены.


Operator

Operator – плагин для браузера Firefox, предназначенный для обработки различных микроформатов. Функции предельно просты: обнаружение микроформатов на странице, просматриваемой пользователем, и возможность перенаправить данные из них в один из популярных сервисов.
Сценарий работы прост: если плагину удаётся обнаружить на странице данные в знакомом микроформате, он информирует об этом пользователя(предусмотренно несколько путей для этого) и тот может выбрать куда извлечённую информацию перенаправить.


Rich snippets

Rich snippets – способ дополнения результатов поиска, используемый Google. Это небольшая вставка рядом с результатом, содержащая некоторую дополнительную информацию о найденном ресурсе. Например отзывы о статье или персональную информацию человека.
Однако основной интерес представляет на snippet сам по себе, а способ его формирования. Дело в том, что данные для него могут браться непосредственно с самого ресурса. Для этого веб-мастеру достаточно внедрить в тело ресурса дополнительную разметку, содержащую необходимую информацию. Поддерживается два варианта разметки: на основе распространённых микроформатов и на основе открытого RDF-словаря, также разработанного Google. Таким образом устанавливается семантическая связь между ресурсом и его внешним представлением (результатом поиска).


True Knowledge

True Knowledge – являет системой поиска ответов на конкретные вопросы. Сервис основывается на решении двух вопросов: получение наборов формальных фактов из Интернет и преобразование запросов на естественном языке в запросы к имеющемуся набору фактов.
В качестве источников фактов выступают различные семантически аннотированные ресурсы (например Википедия или Freebase). Факты из них регулярно переносятся во внутреннее хранилище и становятся доступны для поиска. Для каждого ответа приводится факт на основании которого он был выведен и способ которым он был выведен. О факте также можно получить подробную информацию, например откуда он был получен.
Важной частью концепции этого ресурса является привлечение пользователей к наполнению базы знаний. Это достигается несколькими путями. Во-первых на главной странице портала есть несколько ссылок, позволяющих пользователям добавлять факты о некоторых объектах(людях, компаниях и т.д.). Во-вторых вместе с каждым ответом выдаётся вопрос согласен-ли пользователь с ним. Если пользователь не согласен, то ему предлагается указать с чем именно он не согласен и привести ссылку на подтверждающий документ. Также есть возможность вручную отредактировать ошибочный факт, введённый другим пользователем. Третьим способом является ввод правильного ответа на естественном языке.
Надо отметить, что данный сервис является одним из наиболее актуальных и полезных в данном обзоре. В нём прослеживается не академическая разработка, а близкий к коммерческому использованию проект. На его примере мы видим как масса распределённой в Сети информации может быть преобразована, интерпретирована и эффективно использована. Данный ресурс также отличается тем, что он не просто берёт информацию из Интернет, но и всячески привлекает своих пользователей к её оценке и, при необходимости, корректировки.

Комментариев нет: