Лекция 12. Семантическая паутина.ppt
- Количество слайдов: 40
http: //shcherbak. net/semantic-web-kak-novaya-model-informacionnogo-prostranstva-internet/ Семантическая паутина Лекция 12
World Wide Web набор широко распространенных стандартов Современная тенденция развития Интернета: читаемые компьютером (machine readable) понимаемые компьютером (machine understandable)
Web информационное пространство для коммуникации людей для понимания человеком компьютеров информация просматривающий веб-робот
2001 г. Тим Бернерс-Ли Semantic Web Подход к разработке языков для выражения информации в форме, пригодной для машинной обработки сеть информационных узлов глобально связанная база данных информация может легко обрабатываться компьютером
2001 г. Проект Semantic Web попытка собрать все устоявшиеся идеи и сделать так, чтобы они смогли работать вместе внутри сети Интернет консорциума W 3 C др. организаций разрешить взаимодействовать стандартам между собой внутри децентрализованной системы без вмешательства человека
Стадия активной разработки Большое внимание: - архитектура и модель распределенной среды, - архитектура метаданных «Semantic Web является абстрактным представлением данных во Всемирной паутине, которое базируется на стандартах RDF и других стандартах, имеющих распространение. Проект разрабатывается Консорциумом W 3 C в содружестве с большим количеством исследователей, ученых и промышленных партнеров» Home. Page
Home. Page Semantic Web - расширения текущего Web общедоступные, обрабатываемые автоматическими средствами • • более эффективное исследование, автоматизация, интеграция, повторное использование в разных приложениях
Фундаментальные основы Semantic Web • графовая модель представления полуструктурированных данных (OEM, Lore); • формальная логика (логика первого порядка, базы знаний, фреймы); • архитектура WWW (URI/IRI, Unicode, XML, HTTP); • криптография с открытым ключом.
Передовые технологии агентно-ориентированный подход в программировании проект DAML+OIL (DARPA Agent Markup Language + The Ontology Inference Layer) синтаксис, основанный на RDF и XML , которые могут быть использованы для описания набора фактов, составляющих онтологии XML
Стек понятий семантической паутины
URI универсальный идентификатор ресурсов Всему, что находится "в Web": • человек, • книга, • абстрактная концепция Если двигается с веб-сайта на веб-сайт
Расширяемый язык разметки (XML) e. Xtensible Markup Language гибкий текстовый формат для описания документов произвольной структуры + таблица стилей XSL
Онтологии (в информатике) попытка всеобъемлющей и детальной формализации некоторой области знаний с помощью концептуальной схемы Сферы применения: • моделирование бизнес-процессов, • семантическая паутина, • искусственный интеллект. редактор онтологий Protege
Элементы онтологий основные, нижнеуровневые компоненты онтологии § физические объекты (люди, дома, планеты), § абстрактные объекты (числа, слова) абстрактные группы, коллекции или наборы объектов Понятие «люди» , вложенное понятие «человек» Понятие «индивиды» , экземпляр «индивид»
Элементы онтологий используется для хранения информации, которая специфична для объекта и привязана к нему объект: атрибуты: - имя, Ford Explorer Название: Ford Explorer - значение Число-дверей: 4 Двигатель: {4. 0 Л, 4. 6 Л} Коробка-передач: 6 -ступенчатая зависимости между объектами онтологии Обычно: атрибут, значением которого является другой объект Ford Explorer модель-наследник is. Successor. Of Ford Bronco
Специализированные и общие онтологии Специализированные (предметно-ориентированные) онтологии представление какой-либо области знаний или части реального мира в сельском хозяйстве - участок земли, в физике — один из видов материи, в математике — класс алгебраических систем. Общие онтологии для представления понятий, общих для большого числа областей
Языки описания онтологий OWL (Web Ontology Language) язык описания онтологий для семантической паутины модель данных «объект — свойство» каждому элементу описания (в том числе атрибутам) ставится в соответствие URI
Характеристики языка веб-онтологий OWL использует синтаксис XML OWL имеет инструкции для представления дерева классов OWL имеет инструкции для указания принадлежности индивидов классам OWL имеет систему описания свойств: область определения, область значений OWL может задавать характеристики свойств: симметричность, транзитивность, функциональность OWL имеет инструкции для указания эквивалентности (склеивание) классов
1999 г. RDF (Resource Description Framework) для описания предметной области ресурсов (использует XML-синтаксис) не формат файла, а только абстрактная модель граф с обозначенными как вершинами, так и дугами - способ описания ресурсов - способ задачи схем, по которым ресурс описывается
Базовый строительный блок в RDF тройка «объект – атрибут – значение» A(O, V) - «объект O имеет атрибут A со значением V» [O] – A –> [V] объекты ребро с меткой A, которое объединяет два узла значения RDF не содержит каких-либо четких правил, ориентированных на моделирование данных
Форматы RDF/XML — запись в виде XML-документа; RDF/JSON — запись в виде JSON-данных; RDFa (англ. RDF in attributes) — запись внутри атрибутов произвольного HTML - или XHTML-документа; N-Triples, Turtle, N 3 — компактные формы записи утверждений.
Языки запросов к RDF хранилищам интеграция разных языков (информационно-поисковых, баз данных, манипулирования данными, обмена данными и т. п. ) в единый язык запросов Web Все специалисты: • декларативный язык, • построенный на модели неполноструктурированных данных (semistructured) XQL (1998) XML QL (1998) RDF Query (1998) -> в проекте Sesame
Микроданные (HTML microdata) международный стандарт семантической разметки HTML-страниц, с помощью атрибутов, описывающих смысл информации, содержащейся в тех или иных HTML-элементах браузер структурированная информация программы-обработчики более простой способ аннотирования HTML машиночитаемые теги
Метаданные, предназначенные для идентификации, описания или локализации (местоположения) информационных ресурсов, независимо от физической природы ресурса множество схем описания метаданных (стандарт ISO (ISO/IEC 13250: 2003)) для представления и обмена знаниями с точки зрения поиска информации
Еще схемы описания метаданных международный проект по разработке нормативов для разметки электронных текстов, таких как романы, пьесы, стихи; главным образом для поддержки исследований в гуманитарной сфере международный стандарт схемы метаданных, который разработан издателями книжной промышленности Соединенных Штатов и Европы
разработан в марте 1995 года Базовые схемы Semantic Web обеспечение минимального набора элементов описания, которые оказывают содействие внедрению описания и автоматической индексации документоподобных сетевых объектов Принцип: карточки библиотечного каталога предназначался для использования средствами исследования ресурсов Интернета
Базовые схемы Semantic Web (Friend-Of-A-Friend) формат машинно-обрабатываемых страниц, описывающих персональную информацию о людях и их деятельности (фотографии, календари, блоги и прочее) в формате XML
Базовые схемы Semantic Web (Semantically-Interlinked Online Communities) документы, описывающие онлайн-сообщества взаимосвязь средств обсуждения информации: как блоги, форумы и почтовые рассылки
Базовые схемы Semantic Web Description of a Project документы, описывающие в сети проекты с открытым исходным кодом В RTF:
Метаданные Встроенные (embedded) в сам ресурс в HTML страницы или документы, например, Ms. Word Могут сохраняться и обновляться независимо от ресурсов XML репозиторий RDF-описаний ресурсов Интернет на базе Open Directory (Google)
Архитектура Semantic Web сервисы приложений (н-р, сервис агентства путешествий) - логический вывод и запросы к метаданным и онтологиям - разъяснение выводов (управление доверием (trust)) - агенты, поисковые системы, серверы онтологий - уникальная глобальная идентификация ресурса - метаданные для декларирования фактов о ресурсах - общий язык для выражения метаданных и знаний онтологии, общий словарь, правила для добавления новых метаданных и знаний
Web-агенты (в упрощенном виде веб-сервисы) агенты, обладающие интеллектуальными способностями, смогут выполнять поставленные им пользователями цели и задачи самостоятельно персональный интеллектуальный агент
Агенты Задачи: поиск необходимой информации подбор и выбор оптимальных вариантов и т. п. знание о себе взаимодействие с другими агентами Внешний мир знание внешнем мире мобильный интеллектуальный пользуется веб-сервисы
агент Веб-сервис обычная программа программная система, предоставляющая некоторую услугу и обеспечивающая взаимодействие по сети - идентифицируема строкой URI - общедоступные интерфейсы определены на языке XML SOAP - XML-протокол для удаленного вызова методов веб-сервисов UDDI - описывает модель данных, предназначенную для каталогизации и обнаружения услуг, предоставляемых вебсервисами WSDL язык описания интерфейсов веб-сервисов
Веб-сервисы Компонентный подход • автономный • может состоять из нескольких сервисов • сервисы подбираемые динамически для выполнения конкретной задачи Доступность
Практическая реализация Semantic Web успешно решает следующие задачи: • независимость данных от приложений; • семантическая интеграция данных; • создание основы для повсеместного использование компьютерных агентов (сервисов) - предоставил свои ресурсы для запросов агентам - RDF-описания на базе Open Directory проблема связи хранилищ семантических данных с используемыми реляционными системами баз данных
Популярность сентябрь 2006 г пространства имен OWL –> в 113 000 документах Semantic Web (8%) Рядовые пользователи: 2 120 000 запросов к типу „RDF filetype: rdf 13 600 “ontology filetype: owl” Jena Framework (Java); Drive RDF Parser (C#).
Уже существуют библиотеки для интерпретации стека языков RDF для всех популярных языков программирования (Jena, Redland, RDFLib) редакторы онтологий (Protege) системы рассуждений над онтологиями (Racer, KAON, FACT) семантические хранилища (Sesame, Kowari, YARS) семантические браузеры (Simile, Piggy Bank, Gnowsis, Haystack) поисковики семантических данных (Swoogle)
HTML 5 семантические теги header, nav, aside, section, article, figure, figcaption, mark, hgroup, footer, address, time, video, audio, datalist, контактная форма в стиле HTML 5
Идея Semantic Web освобождение человека от обременительных рутинных задач по добыче, поиску, учету и индексированию информации, содержащейся в Web
Лекция 12. Семантическая паутина.ppt