ИТЛ2_04_Онтологии.ppt
- Количество слайдов: 31
Информационные технологии в лингвистике Семантическое описание - ОНТОЛОГИИ
Инженерия знаний Направление искусственного интеллекта, в задачу которого входят разработка, исследование и использование экспертных систем. Экспертные системы - это системы поддержки деятельности специалистов, цель которых - помочь принять оптимальное решение конкретной задачи. Примеры: диагностика технических неисправностей, медицинская диагностика, финансовое, юридическое консультирование и т. д. Основа система – БАЗА ЗНАНИЙ, описывающая основные объекты деятельности, а также взаимосвязи между ними.
Организация знаний: семантическая сеть Вершины соответствуют понятиям предметной области, а дуги - отношениям между парами понятий.
Онтология Слово "онтология" имеет два значения: · Онтология 1 — философская дисциплина, которая изучает наиболее общие характеристики бытия и сущностей; · Онтология 2 — это структура формального описания понятий. Неформально онтология представляет собой некоторое описание взгляда на мир применительно к конкретной области интересов. Это описание состоит из терминов и правил использования этих терминов, ограничивающих их значения в рамках конкретной области. На формальном уровне онтология — это система, состоящая из набора понятий и набора утверждений об этих понятиях, на основе которых можно описывать классы, отношения, функции и индивиды. Онтологии — строительный материал для базы знаний.
Онтология
Онтология (греч. ontos — сущее и logos — мысль, слово, учение) — это учение о видах бытия, составляющих условие возможности мышления о мире и описания его в языке. В логической онтологии имеются две категории существующего: • предметы; • свойства и отношения.
Онтология: предмет Предмет — это то, что может иметь свойства и вступать в отношения, но само не является свойством или отношением. Предметы выражаются в языке при помощи существительных, субстантированных прилагательных, на них указывают местоимения. Множество — это мыслимые вместе объекты. Объект — это предмет, свойство, отношение или множество.
Онтология: отношения Свойство — это то, что каким-то образом характеризует предмет и не требует для своего описания более одного предмета. Отношение — это связь между двумя и более предметами. Отношение, в отличие от свойства, требует более одного предмета. Отношение превращается в свойство, если на всех его местах, кроме одного, вместо переменных стоят конкретные предметы. Типы отношений • таксономическое отношение; • отношение IS-A; • класс – подкласс; • лингвистика: гипоним – гипероним; • родовидовое отношение; • отношение a-kind-of
Отношения: тип?
Отношения
Формальное описание: предикаты 1 -го порядка
Онтология Обычно онтологии имеют две части: • Названия важных понятий (тэги) – Слон – Травоядное – Взрослый_Слон • Информацию/знание о домене – Взрослый_Слон весит по крайней мере 2 тонны – Слон бывает либо Африканский_Слон либо Индийский_Слон
Онтология как понятие Понятие — это мысль, которая обобщает объекты некоторого множества и выделяет это множество по отличительному для него признаку. Этапы образования понятия: 1. Анализ — мысленное разложение образца на отдельные признаки; 2. Абстрагирование (абстракция) — это отвлечение признаков от предмета и превращение их в объект самостоятельного рассмотрения. Швейцарский психолог Жан Пиаже доказал, что дети до 10 -11 лет в норме не способны рассматривать признаки сами по себе, но только вместе с предметами, которым эти признаки присущи. 3. Сравнение — рассмотрение различных видов предмета для выделения общих признаков и отбрасывания частных (т. е. присущих только отдельным видам) признаков. 4. Синтез — операция соединения признаков всех предметов данного множества в единый сложный признак, выделяющий рассматриваемое множество объектов из всех остальных. 5. Познавательное обобщение — объединение разных объектов в одно множество по общим для них признакам. Для того, чтобы отчетливо мыслить и уметь передавать наше понятие другим, мы должны его как-то обозначить, т. е. выразить в языке.
Структура онтологии Основными компонентами онтологии могут являться: · классы (или понятия), · отношения (или свойства, атрибуты), · * функции, · аксиомы, · экземпляры (или индивиды).
Онтология как артефакт Понятием может быть любая сущность, о которой может быть дана какая-либо информация. Классы — это абстрактные группы, коллекции или наборы объектов (могут включать экземпляры, другие классы, либо и то, и другое). Обычно организованы в таксономию — иерархическую классификацию понятий по отношению включения. Отношения представляют тип взаимодействия между понятиями предметной области. Формально n-арные отношения определяются как подмножество произведения n множеств: R: C 1 × C 2 × … × Cn. Функции — это специальный случай отношений, в которых n-й элемент отношения однозначно определяется n-1 предшествующими элементами. Формально функции определяются: F: C 1 × C 2 × … × Cn-1 —> Cn. Пример: цена_подержанного_автомобиля, которая вычисляется в зависимости от модели автомобиля, даты изготовления и пробега.
Онтология как артефакт Аксиомы используются для записи высказывания, которые всегда истинны. (для определения комплексных ограничений на значения атрибутов, аргументы отношений, для проверки корректности информации, описанной в онтологии, или для вывода новой информации). Пример: Работник, являющийся руководителем проекта, работает в проекте. Вводятся переменные Е (работник) и P (руководитель проекта). Аксиома записывается следующим образом: Forall (E, P) Employee(E) and Head-Of-Project(E, P) => Works-At-Project(E, P)
Создание онтологии Существует два альтернативных подхода к созданию и исследованию онтологий. 1. Формальный - основан на логике (предикатов первого порядка, дескриптивной, модальной и т. п. ). 2. Лингвистический - основан на изучении естественного языка (в частности, семантики) и построении онтологий на больших текстовых массивах, так называемых корпусах.
1. Формальный подход Классификация онтологий по степени формальности 1. Каталог на основе уникального номера (контролируемый словарь) - конечный список терминов. Каталоги представляют точную (не многозначную) интерпретацию терминов. 2. Глоссарий (словарь терминов) - список терминов с их значениями. 3. Тезаурусы - несут дополнительную семантику, определяя связи между терминами. Отношения, свойственные для тезаурусов: синонимия, иерархическое отношение и ассоциация. Не выполняется транзитивность отношения ПОДКЛАСС-КЛАСС.
Классификация по степени формальности 4. Формальные таксономии - включает точное определение отношения ПОДКЛАСС-КЛАСС (обозначаемого как is. A). Строго соблюдается транзитивность отношения is. A: если A является подклассом класса B, то каждый подкласса A также является подклассом класса B. 5. Формальные экземпляры — онтологии на базе формального отношения ЭКЗЕМПЛЯР-КЛАСС (обозначаемого как is. Instance. Of). 6. Фреймы — онтологии могут иметь информацию о свойствах (слотах). Пример: класс "продукт" может иметь свойство "цена", которое получат все его подклассы. 7. Фреймы с ограничениями на значения - значения свойств берутся из некоторого предопределенного множества (целые числа, символьные константы) или из подмножества концептов онтологии (множество экземпляров данного класса, множество классов). 8. Произвольные логические ограничения - утверждения на языке логики предикатов первого порядка.
Классификация по содержимому 1. Общие онтологии описывают наиболее общие концепты (пространство, время, материя, объект, событие, действие и т. д. ), которые независимы от конкретной проблемы или области. В эту категорию попадают и онтологии представления, и онтологии верхнего уровня. 2. Онтологии задач — это онтологии, используемые конкретной прикладной программой и содержащие термины, которые используются при разработке ПО, выполняющего конкретную задачу. При этом онтология задачи использует специализацию терминов, представленных в общих онтологиях. Пример: графический редактор — палитра, тип заливки, наложение слоев. 3. Предметная онтология - описывает реальные предметы, участвующие в какой-либо деятельности (производстве). Пример: онтология всех частей и компонентов самолетов определененной марки (Boeing) и сведения об их поставщиках, характеристиках, способе соединения друг с другом и т. п.
Классификация по цели создания Примеры: OWL Cyc, DOLCE, SUMO Unified Medical Language System Plinus - о механических свойствах керамических материалов
Пример предметной онтологии Система, которая помогает управлять стоимостью и организацией печатного издания (для простоты можно взять некую газету). Система должна отвечать на следующие вопросы: • Кто ответственный за каждый раздел в газете? • Каково содержимое каждой статьи в разделе и кто автор? • Перед кем отчитывается каждый автор? • Каково расположение и расходы на каждую статью?
Пример формального подхода В газете есть разделы. Каждый раздел имеет содержимое, например, статьи, реклама и т. д. и ответственного редактора. У каждой статьи есть автор, который может быть как работником газеты, так и быть приглашенным со стороны. Для каждого автора, работающего в газете, мы хотим знать его имя и зарплату, а также перед кем он отчитывается.
Пример лингвистического подхода Построение онтологии образовательного процесса Основа: официальные документы (Устав Тюм. ГУ) Этап 1. Выбор в тексте ключевых понятий (пример: ВУЗ) Этап 2. Контекстный анализ ключевого понятия
Пример лингвистического подхода
Пример лингвистического подхода Этап 3. Выявление отношений
Пример лингвистического подхода Этап 4. Построение онтологии при помощи инструмента (программы) Пример: Protege
Инструмент построения онтологии
Лексические онтологии - онтологии для автоматической обработки текстов, в частности, для решения задач информационного поиска. - охватывают большинство слов языка и одновременно имеют онтологическую структуру, проявляющуюся в отношениях между понятиями. - отличаются от формальных онтологий по степени формализации. Необходимо понятиям онтологии сопоставить набор языковых выражений (слов и словосочетаний), которыми понятия могут выражаться в тексте. Пример: Wordnet Word. Net — это электронный тезаурус/семантическая сеть для английского языка, разработанный в Принстонском университете и выпущенный вместе с сопутствующим программным обеспечением под некопилефтной свободной лицензией.


