Скачать презентацию Информационные технологии в лингвистике Семантическое описание — ОНТОЛОГИИ Скачать презентацию Информационные технологии в лингвистике Семантическое описание — ОНТОЛОГИИ

ИТЛ2_04_Онтологии.ppt

  • Количество слайдов: 31

Информационные технологии в лингвистике Семантическое описание - ОНТОЛОГИИ Информационные технологии в лингвистике Семантическое описание - ОНТОЛОГИИ

Инженерия знаний Направление искусственного интеллекта, в задачу которого входят разработка, исследование и использование экспертных Инженерия знаний Направление искусственного интеллекта, в задачу которого входят разработка, исследование и использование экспертных систем. Экспертные системы - это системы поддержки деятельности специалистов, цель которых - помочь принять оптимальное решение конкретной задачи. Примеры: диагностика технических неисправностей, медицинская диагностика, финансовое, юридическое консультирование и т. д. Основа система – БАЗА ЗНАНИЙ, описывающая основные объекты деятельности, а также взаимосвязи между ними.

Организация знаний: семантическая сеть Вершины соответствуют понятиям предметной области, а дуги - отношениям между Организация знаний: семантическая сеть Вершины соответствуют понятиям предметной области, а дуги - отношениям между парами понятий.

Онтология Слово Онтология Слово "онтология" имеет два значения: · Онтология 1 — философская дисциплина, которая изучает наиболее общие характеристики бытия и сущностей; · Онтология 2 — это структура формального описания понятий. Неформально онтология представляет собой некоторое описание взгляда на мир применительно к конкретной области интересов. Это описание состоит из терминов и правил использования этих терминов, ограничивающих их значения в рамках конкретной области. На формальном уровне онтология — это система, состоящая из набора понятий и набора утверждений об этих понятиях, на основе которых можно описывать классы, отношения, функции и индивиды. Онтологии — строительный материал для базы знаний.

Онтология Онтология

Онтология (греч. ontos — сущее и logos — мысль, слово, учение) — это учение Онтология (греч. ontos — сущее и logos — мысль, слово, учение) — это учение о видах бытия, составляющих условие возможности мышления о мире и описания его в языке. В логической онтологии имеются две категории существующего: • предметы; • свойства и отношения.

Онтология: предмет Предмет — это то, что может иметь свойства и вступать в отношения, Онтология: предмет Предмет — это то, что может иметь свойства и вступать в отношения, но само не является свойством или отношением. Предметы выражаются в языке при помощи существительных, субстантированных прилагательных, на них указывают местоимения. Множество — это мыслимые вместе объекты. Объект — это предмет, свойство, отношение или множество.

Онтология: отношения Свойство — это то, что каким-то образом характеризует предмет и не требует Онтология: отношения Свойство — это то, что каким-то образом характеризует предмет и не требует для своего описания более одного предмета. Отношение — это связь между двумя и более предметами. Отношение, в отличие от свойства, требует более одного предмета. Отношение превращается в свойство, если на всех его местах, кроме одного, вместо переменных стоят конкретные предметы. Типы отношений • таксономическое отношение; • отношение IS-A; • класс – подкласс; • лингвистика: гипоним – гипероним; • родовидовое отношение; • отношение a-kind-of

Отношения: тип? Отношения: тип?

Отношения Отношения

Формальное описание: предикаты 1 -го порядка Формальное описание: предикаты 1 -го порядка

Онтология Обычно онтологии имеют две части: • Названия важных понятий (тэги) – Слон – Онтология Обычно онтологии имеют две части: • Названия важных понятий (тэги) – Слон – Травоядное – Взрослый_Слон • Информацию/знание о домене – Взрослый_Слон весит по крайней мере 2 тонны – Слон бывает либо Африканский_Слон либо Индийский_Слон

Онтология как понятие Понятие — это мысль, которая обобщает объекты некоторого множества и выделяет Онтология как понятие Понятие — это мысль, которая обобщает объекты некоторого множества и выделяет это множество по отличительному для него признаку. Этапы образования понятия: 1. Анализ — мысленное разложение образца на отдельные признаки; 2. Абстрагирование (абстракция) — это отвлечение признаков от предмета и превращение их в объект самостоятельного рассмотрения. Швейцарский психолог Жан Пиаже доказал, что дети до 10 -11 лет в норме не способны рассматривать признаки сами по себе, но только вместе с предметами, которым эти признаки присущи. 3. Сравнение — рассмотрение различных видов предмета для выделения общих признаков и отбрасывания частных (т. е. присущих только отдельным видам) признаков. 4. Синтез — операция соединения признаков всех предметов данного множества в единый сложный признак, выделяющий рассматриваемое множество объектов из всех остальных. 5. Познавательное обобщение — объединение разных объектов в одно множество по общим для них признакам. Для того, чтобы отчетливо мыслить и уметь передавать наше понятие другим, мы должны его как-то обозначить, т. е. выразить в языке.

Структура онтологии Основными компонентами онтологии могут являться: · классы (или понятия), · отношения (или Структура онтологии Основными компонентами онтологии могут являться: · классы (или понятия), · отношения (или свойства, атрибуты), · * функции, · аксиомы, · экземпляры (или индивиды).

Онтология как артефакт Понятием может быть любая сущность, о которой может быть дана какая-либо Онтология как артефакт Понятием может быть любая сущность, о которой может быть дана какая-либо информация. Классы — это абстрактные группы, коллекции или наборы объектов (могут включать экземпляры, другие классы, либо и то, и другое). Обычно организованы в таксономию — иерархическую классификацию понятий по отношению включения. Отношения представляют тип взаимодействия между понятиями предметной области. Формально n-арные отношения определяются как подмножество произведения n множеств: R: C 1 × C 2 × … × Cn. Функции — это специальный случай отношений, в которых n-й элемент отношения однозначно определяется n-1 предшествующими элементами. Формально функции определяются: F: C 1 × C 2 × … × Cn-1 —> Cn. Пример: цена_подержанного_автомобиля, которая вычисляется в зависимости от модели автомобиля, даты изготовления и пробега.

Онтология как артефакт Аксиомы используются для записи высказывания, которые всегда истинны. (для определения комплексных Онтология как артефакт Аксиомы используются для записи высказывания, которые всегда истинны. (для определения комплексных ограничений на значения атрибутов, аргументы отношений, для проверки корректности информации, описанной в онтологии, или для вывода новой информации). Пример: Работник, являющийся руководителем проекта, работает в проекте. Вводятся переменные Е (работник) и P (руководитель проекта). Аксиома записывается следующим образом: Forall (E, P) Employee(E) and Head-Of-Project(E, P) => Works-At-Project(E, P)

Создание онтологии Существует два альтернативных подхода к созданию и исследованию онтологий. 1. Формальный - Создание онтологии Существует два альтернативных подхода к созданию и исследованию онтологий. 1. Формальный - основан на логике (предикатов первого порядка, дескриптивной, модальной и т. п. ). 2. Лингвистический - основан на изучении естественного языка (в частности, семантики) и построении онтологий на больших текстовых массивах, так называемых корпусах.

1. Формальный подход Классификация онтологий по степени формальности 1. Каталог на основе уникального номера 1. Формальный подход Классификация онтологий по степени формальности 1. Каталог на основе уникального номера (контролируемый словарь) - конечный список терминов. Каталоги представляют точную (не многозначную) интерпретацию терминов. 2. Глоссарий (словарь терминов) - список терминов с их значениями. 3. Тезаурусы - несут дополнительную семантику, определяя связи между терминами. Отношения, свойственные для тезаурусов: синонимия, иерархическое отношение и ассоциация. Не выполняется транзитивность отношения ПОДКЛАСС-КЛАСС.

Классификация по степени формальности 4. Формальные таксономии - включает точное определение отношения ПОДКЛАСС-КЛАСС (обозначаемого Классификация по степени формальности 4. Формальные таксономии - включает точное определение отношения ПОДКЛАСС-КЛАСС (обозначаемого как is. A). Строго соблюдается транзитивность отношения is. A: если A является подклассом класса B, то каждый подкласса A также является подклассом класса B. 5. Формальные экземпляры — онтологии на базе формального отношения ЭКЗЕМПЛЯР-КЛАСС (обозначаемого как is. Instance. Of). 6. Фреймы — онтологии могут иметь информацию о свойствах (слотах). Пример: класс "продукт" может иметь свойство "цена", которое получат все его подклассы. 7. Фреймы с ограничениями на значения - значения свойств берутся из некоторого предопределенного множества (целые числа, символьные константы) или из подмножества концептов онтологии (множество экземпляров данного класса, множество классов). 8. Произвольные логические ограничения - утверждения на языке логики предикатов первого порядка.

Классификация по содержимому 1. Общие онтологии описывают наиболее общие концепты (пространство, время, материя, объект, Классификация по содержимому 1. Общие онтологии описывают наиболее общие концепты (пространство, время, материя, объект, событие, действие и т. д. ), которые независимы от конкретной проблемы или области. В эту категорию попадают и онтологии представления, и онтологии верхнего уровня. 2. Онтологии задач — это онтологии, используемые конкретной прикладной программой и содержащие термины, которые используются при разработке ПО, выполняющего конкретную задачу. При этом онтология задачи использует специализацию терминов, представленных в общих онтологиях. Пример: графический редактор — палитра, тип заливки, наложение слоев. 3. Предметная онтология - описывает реальные предметы, участвующие в какой-либо деятельности (производстве). Пример: онтология всех частей и компонентов самолетов определененной марки (Boeing) и сведения об их поставщиках, характеристиках, способе соединения друг с другом и т. п.

Классификация по цели создания Примеры: OWL Cyc, DOLCE, SUMO Unified Medical Language System Plinus Классификация по цели создания Примеры: OWL Cyc, DOLCE, SUMO Unified Medical Language System Plinus - о механических свойствах керамических материалов

Пример предметной онтологии Система, которая помогает управлять стоимостью и организацией печатного издания (для простоты Пример предметной онтологии Система, которая помогает управлять стоимостью и организацией печатного издания (для простоты можно взять некую газету). Система должна отвечать на следующие вопросы: • Кто ответственный за каждый раздел в газете? • Каково содержимое каждой статьи в разделе и кто автор? • Перед кем отчитывается каждый автор? • Каково расположение и расходы на каждую статью?

Пример формального подхода В газете есть разделы. Каждый раздел имеет содержимое, например, статьи, реклама Пример формального подхода В газете есть разделы. Каждый раздел имеет содержимое, например, статьи, реклама и т. д. и ответственного редактора. У каждой статьи есть автор, который может быть как работником газеты, так и быть приглашенным со стороны. Для каждого автора, работающего в газете, мы хотим знать его имя и зарплату, а также перед кем он отчитывается.

Пример лингвистического подхода Построение онтологии образовательного процесса Основа: официальные документы (Устав Тюм. ГУ) Этап Пример лингвистического подхода Построение онтологии образовательного процесса Основа: официальные документы (Устав Тюм. ГУ) Этап 1. Выбор в тексте ключевых понятий (пример: ВУЗ) Этап 2. Контекстный анализ ключевого понятия

Пример лингвистического подхода Пример лингвистического подхода

Пример лингвистического подхода Этап 3. Выявление отношений Пример лингвистического подхода Этап 3. Выявление отношений

Пример лингвистического подхода Этап 4. Построение онтологии при помощи инструмента (программы) Пример: Protege Пример лингвистического подхода Этап 4. Построение онтологии при помощи инструмента (программы) Пример: Protege

Инструмент построения онтологии Инструмент построения онтологии

" src="https://present5.com/presentation/3/11097804_181643554.pdf-img/11097804_181643554.pdf-29.jpg" alt="Пример онтологии (на языке OWL) " /> Пример онтологии (на языке OWL)

" src="https://present5.com/presentation/3/11097804_181643554.pdf-img/11097804_181643554.pdf-30.jpg" alt="Пример онтологии (на языке OWL) " /> Пример онтологии (на языке OWL) IRI="#Корректировать"/>

Лексические онтологии - онтологии для автоматической обработки текстов, в частности, для решения задач информационного Лексические онтологии - онтологии для автоматической обработки текстов, в частности, для решения задач информационного поиска. - охватывают большинство слов языка и одновременно имеют онтологическую структуру, проявляющуюся в отношениях между понятиями. - отличаются от формальных онтологий по степени формализации. Необходимо понятиям онтологии сопоставить набор языковых выражений (слов и словосочетаний), которыми понятия могут выражаться в тексте. Пример: Wordnet Word. Net — это электронный тезаурус/семантическая сеть для английского языка, разработанный в Принстонском университете и выпущенный вместе с сопутствующим программным обеспечением под некопилефтной свободной лицензией.