_archive_2009_Rubashkin-Ontologii.ppt
- Количество слайдов: 28
Онтологическая инженерия в системах, основанных на знаниях Рубашкин В. Ш. кафедра информационных систем в искусстве и гуманитарных науках Факультет филологии и искусств СПб. ГУ
Онтология Модный научный термин?
Онтология ru. wikipedia. org: Онтоло гия (в информатике) — это попытка всеобъемлющей и детальной формализации некоторой области знаний с помощью концептуальной схемы. Обычно такая схема состоит из иерархической структуры данных, содержащей все релевантные классы объектов, их связи и правила (теоремы, ограничения), принятые в этой области. en. wikipedia. org: An ontology in computer science and information science is a formal representation of a set of concepts within a domain and the relationships between those concepts. It is used to reason about the properties of that domain, and may be used to define the domain.
Онтология Система, состоящая из набора понятий (концептов) и набора утверждений об этих понятиях (категоризация понятий, отношения между понятиями; в частности (но не только) иерархии понятий по отношениям общее – частное и часть целое). C точки зрения информационных технологий Онтология – это концептуальный словарь, обладающий вычислительной функциональностью.
Онтология Существенны четыре пункта: a) единицы – понятия (концепты), а не слова (ср. Word. Net) b) формализованное описание концептуальной системы, использующее язык представления знаний и обеспечивающее алгоритмизацию правил установления осмысленности языковых выражений и процедур логического вывода. c) способ формализации понятий есть предмет соглашения (ontological commitments [онтологические обязательства]) использующего их профессионального сообщества (или группы специалистов); d) информационно-вычислительный ресурс, стандартным образом подключаемый к любым информационным технологиям, - а не просто словарь.
Онтология Информационно-вычислительный ресурс – онтология предоставляет внешним приложениям программный интерфейс, реализующий набор функций, которые определяют семантические характеристики заданного понятия или отношения между заданной парой понятий. Функции вида F(1)( D ) , F(1) ( D 1 , D 2 ) , аргументами которых являются понятия (концепты). Программный интерфейс обычно реализуется специальным модулем, представляющим собой машину ограниченного логического вывода (Inference Engine, Reasoner). Иногда реализуется как часть функциональности онторедактора.
Далее • Востребованная функциональность • Общее положение дел • Инженерия • Проблемы и перспективы .
Целевые технологии • Первоначальная целевая технология – документальные ИПС. Ближайший прототип онтологий – информационно-поисковые тезаурусы.
Целевые технологии Два направления использования: • Разработка новых информационных технологий • Совершенствование традиционных информационных технологий
Целевые технологии Новые: • Системы концептуального доступа к информационным ресурсам. - семантический поиск (Semantic Web); - Концептуальный уровень доступа к данным (концептуальные схемы данных - организация прозрачного для смысла доступа к разнородным информационным ресурсам). • Вопросно-ответные системы • Автоматический анализ текста (извлечение знаний) (включая Information Extraction ).
Целевые технологии Новые: Семантический поиск (Semantic Web) – унификация и формализация описаний ресурсов: – Лексическая унификация (RDFS / OWL) – Синтаксическая унификация (RDF) – Логическая формализация (SPARQL) – Содержательная унификация (ср. Wiki)
Целевые технологии Традиционные: Автоматический перевод: 1. Выбор правильного переводного эквивалента 2. Поддержка синтаксического анализа. 3. Поддержка перевода "по прецедентам" (генерализация образцов). OCR и Speech Recognition: 1. Семантические фильтры (на лексическом и грамматическом уровнях) 2. Поиск подходящего прецедента (генерализация образцов). Грамматический корректор: 1. Проверка семантических согласований в синтаксических связях. 2. Проверка наличия семантически обязательных элементов в предложении. 3. Поиск подходящего прецедента (генерализация образцов).
Содержательная функциональность • Смысловое расширение запроса – функция НИЖЕ (К): хищник лев, тигр, волк, шакал, …), функция АССОЦИИРОВАНЫ_С (К): (автомобиль колесо, кузов, мотор, пассажир, груз, шофер, дорога, …). • Установление соответствий признак – значение признака; признак – применимость к классу объектов; признак – единица измерения; пересчет значений к стандартной единице. Установление отношения объемной совместимости между концептами: для пары концептов ( D 1 , D 2 ) вычислить объемное отношение между ними (совместимость, несовместимость, включение). Функциональность двух последних типов в большинстве онтологий отсутствует вообще или реализована не полностью.
Содержательная функциональность (Gomez-Perez et al. ): • • Controlled vocabularies Glossaries, that is, a list of terms with their meanings specified as natural language statements. Thesauri, which provide some additional semantics between terms. (Information such as synonym relationships) Formal is-a hierarchies (is-a taxonomy). Formal is-a hierarchies that include instances of the domain. Frames. The ontology includes classes and their attributes. Ontologies that express value restriction. These are ontologies that may place restrictions on the values that can fill a property. Ontologies that express general logical constraints. (It is not possible to travel from the USA to Europe by train).
Содержательная функциональность • Унификация терминологии. • Представление и логическая обработка таксономических отношений. • Представление и логическая обработка отношений объемной совместимости/несовместимости (!) • Представление и логическая обработка предметно-ассоциативных отношений. • Поддержка представления и логической обработки количественных данных. • Регламентация процедур описания объектов. • Аксиоматизация описаний процессов, причинных связей, процедур (It is not possible to travel from the USA to Europe by train).
Общее положение дел Между "вполне удовлетворительно" и "совершенно неудовлетворительно" Руководства: Staab Steffen, Studer Rudi (eds). Handbook on Ontologies. – Berlin— Heidelberg: Springer—Verlag, 2004 Gomez-Perez A. , Fernando-Lopez M. , Corcho O. Ontology Engineering. – Springer – Ferlag, 2004.
Общее положение дел Важнейшие исследовательские центры – – – Стэнфорд Карлсруэ Мадрид Шеффилд Осака Италия (Тренто и др. )
Общее положение дел Онтологические проекты SUMO CYC Web. ODE DOLCE Hozo AKT Omega KAON 2 Web. ONTO DIP
Общее положение дел Применения онтологий (Karlsrue Handbook on Ontologies) • • • Ontologies for Knowledge Management Ontology-based Content Management in a Virtual Organization Ontology-based Recommender Systems The Knowledge Portal “Onto. Web” Ontologies and Hypertext Semantic Layering with Magpie Ontologies and Metadata for e. Learning Ontology of the Process Specification Language The Role of Ontologies in e. Commerce An Ontology-based Platform for Semantic Interoperability Ontologies in Bioinformatics
Общее положение дел Применения онтологий (Gomez-Perez et al. ) • • • E-commerce Medical ontologies Engineering ontologies Enterprise ontologies Chemistry ontologies Knowledge management ontologies
Задачи онтологической инженерии • Создание и пополнение онтологий (Ontology Building - Онторедакторы) • Объединение и повторное использование онтологий (Ontology Merging / Alignment / Mapping) • Автоматизация пополнения (Ontology Learning) • Создание машины вывода для онтологии (Inference Engine / Reasoner) • Разработка средств экспорта - импорта
Проблемы онтологической инженерии Нет единой точки зрения: 1) Функциональность и границы онтологии (и функциональность инструментальной среды) 2) Методология формализации знаний 3) Унификация онтологий 4) Пополнение онтологий 5) Поддержка достоверности и целостности
Проблемы онтологической инженерии Унификация онтологий Рассматриваются два, вообще говоря, не исключающих друга пути: • Снизу вверх – объединение и постепенное сближение частных онтологий разной структуры (mapping & merging) • Сверху вниз – построение общепризнанной онтологии верхнего уровня (Top-Level Ontology) и ее конкретизация доменными онтологиями Реально оба направления развиваются параллельно, НО…
Проблемы онтологической инженерии Дальнейшее продолжение практики построения автономных специализированных онтологий превращается в неоправданное расточительство ресурсов. Следующий этап - глобализация и методологическая универсализация онтологического конструирования. Построения не "онтологий", а "Онтологии", - универсальной, с точки зрения возможностей использования в разных информационных технологиях, и всеобъемлющей, как с точки зрения возможностей охвата профессиональных концептуальных систем, так и с точки зрения возможностей концептуальной интерпретации лексики естественного языка (ЕЯ) и профессиональных подъязыков. Единая концептуальная модель и единая технологическая среда - ср. SUMO и CYC
Проблемы онтологической инженерии Основные требования: 1) Открытость – для добавления как отдельных концептов любого содержания, так и любых концептуальных подсистем; открытость для лексики ЕЯ и дополнительных вариантов концептуальной интерпретации уже содержащихся в Лексиконе онтологии слов. 2) Гибкость – возможность быстрого и простого обновления любого из фрагментов онтологии; возможность организации децентрализованного создания и редактирования онтологий.
Проблемы онтологической инженерии 3) Содержательная масштабируемость – возможность оперативно выбирать (подключать / отключать) те или иные фрагменты в соответствии с задачей, сферой интересов и точкой зрения отдельных профессиональных групп. (Доменное администрирование !) 4) Модельная масштабируемость – возможность представления концептуальных систем на разных уровнях детальности описания и формализации соответствующих фрагментов действительности (например, в такой последовательности: простая семантическая категоризация лексики – таксономия – полная терминологическая модель - продукционная система – логическая теория). 5) Пользовательская универсальность – пригодность для использования в разнотипных приложениях.
Проблемы онтологической инженерии Ключевая роль Top-Level онтологии. NB: нигде с достаточной определенностью не формулируется, что такое Top-Level онтология. Возможное операциональное определение: Концептуальная подсистема, достаточная для последующего построения и присоединения любых доменных онтологий и для представления логических связей между концептами, значимых во всех или хотя бы нескольких частных онтологиях. Три возможных составляющих: • «Категориальная» онтология • «Энциклопедическая» онтология (включая терминологию повседневной жизни) • Онтологии внутридоменных примитивов (должны добавляться по мере присоединения доменных концептуальных моделей).
Благодарю за внимание!
_archive_2009_Rubashkin-Ontologii.ppt