Скачать презентацию Лингвистические основы информатики Часть 2 Семантические модели текста Скачать презентацию Лингвистические основы информатики Часть 2 Семантические модели текста

ЛОИ_2_2012.ppt

  • Количество слайдов: 170

Лингвистические основы информатики Часть 2 Семантические модели текста Рубашкин Валерий Шлемович д. т. н. Лингвистические основы информатики Часть 2 Семантические модели текста Рубашкин Валерий Шлемович д. т. н. , профессор кафедры информационных систем факультета филологии и искусств CПб. ГУ

Литература 1. Palmer F. R. Semantics. A new outline. – М. : Высшая школа, Литература 1. Palmer F. R. Semantics. A new outline. – М. : Высшая школа, 1982 2. Лайонз Дж. Лингвистическая семантика: Введение. – М. , 2003 3. Кронгауз М. А. Семантика. – М. , 2001. 4. Кобозева И. М. Лингвистическая семантика. – М. , 2000

5. Рубашкин В. Ш. Представление и анализ смысла в интеллектуальных информационных системах. - М. 5. Рубашкин В. Ш. Представление и анализ смысла в интеллектуальных информационных системах. - М. : Наука, 1989 6. Тузов В. А. Компьютерная семантика русского языка. - СПб. : Изд-во СПб. ГУ, 2003. 7. Арутюнова Н. Д. Предложение и его смысл (логикосемантические проблемы). – М. : УРСС, 2003 8. Рахилина Е. В. Когнитивный анализ предметных имен: семантика и сочетаемость. – М. : Русские словари, 2000.

Введение. Семантика как научное направление 1. О термине Введение. Семантика как научное направление 1. О термине "семантика" 2. Семантические проблемы в традиционной лингвистике 3. Семантика в терминоведении и философии – проблема определения терминов. 4. Компьютерная семантика

# 1. О термине # 1. О термине "семантика" греч. semantikos = обозначающий [Бреаль, 1897] Breal M. Essai de semantique. Paris, 1897. (а) смысловая сторона языковых выражений: семантика слова, семантика предложения, … (б) научная дисциплина, ее изучающая. Britannica: the philosophical and scientific study of meaning. Один из источников – этимология (наука о происхождении слов) Пример. пространство время дальше – дольше; длинный – долго; короткий – краткий; … Далеко ли до метро? – 10 минут ходьбы.

Другие употребления термина Другие употребления термина "семантика" 1) Семантика языков программирования. Семантика оператора ЯВУ – способ его выполнения (операционная семантика ): If <условие> Then <операторы-ДА> Else < операторы-НЕТ> 2) В математике - семантика формальных систем. Пример: семантика связки & в символической логике: (Что означает формула X & Y ? ) Ответ: функция &(X, Y), определяемая таблицей :

# 2. Семантические проблемы в традиционной лингвистике 1) Единственный хорошо разработанный # 2. Семантические проблемы в традиционной лингвистике 1) Единственный хорошо разработанный "семантический" раздел в традиционной лингвистике – лексикология и лексикография. . Лексикология – "раздел языкознания, изучающий словарный состав языка" Лексикография – "раздел языкознания, занимающийся практикой и теорией составления словарей". [Лингвистический энциклопедический словарь]

Проблемы в лексикографии: : a) установление межъязыковых соответствий (переводные словари), а также практика составления Проблемы в лексикографии: : a) установление межъязыковых соответствий (переводные словари), а также практика составления толковых словарей сделали актуальной задачу систематизации и описания значений слова. b) Дискретизация значений слова c) Разграничение омонимии и полисемии. NB: Используемая в переводных словарях нотация: Вал I 1) (насыпь) bank; 2) (волна) roller Вал II (тех. ) shaft Вал III (эк. ) gross

"Полисемия способность слова обозначать разные предметы и явления" "Лексические омонимы одинаково звучащие слова, не имеюшие общих элементов смысла" (Часто подразумевается этимологический анализ: возможность доказать случайное совпадение слов, имеющих разное происхождение – напр. , заимствованных из разных языков. ) Примеры "настоящих" омонимов: брак I = изъян (нем. , польск. ); … = defect (англ. ) ср. браконьер (фр. braconnier) брак II = женитьба (рус. брать); … = marriage (англ. ) рейд I (гол. reed) = водное пространство у входа в порт, удобное для якорной стоянки судов рейд II (англ. raid) = проникновение подвижных войсковых групп в глубь неприятельской территории [Словарь иностранных слов]

2) Другие семантические связи в лексике, рассматриваемые традиционной лингвистикой: • синонимия; • антонимия; ( 2) Другие семантические связи в лексике, рассматриваемые традиционной лингвистикой: • синонимия; • антонимия; ("антонимы – слова, имеющие противоположные значения". Но: ср. большой – маленький, черный – белый, синий красный, шар –куб и т. п. ) • гипонимия (общее - частное) • "семантические поля" – группы терминов, объединяемых по наличию общих компонентов значения и общей сферы употребления (названия цветов; термины родства и т. п. ). Их систематическое изучение и инвентаризация - особенно в профессиональной лексике мотивировано: a) работами по унификации и стандартизации профессиональной терминологии; b) разработкой автоматизированных документальных ИПС.

3) Явление анафоры – от местоимения к полнозначному слову. Невы державное теченье, береговой ее 3) Явление анафоры – от местоимения к полнозначному слову. Невы державное теченье, береговой ее гранит. Джон купил банку колы, сел на скамью и выпил ее. Возьми какую-нибудь из этих книг. *Я проглотил ее за одну ночь. Дальнейшее развитие: связь слов при лексическом повторе. (Каковы критерии предметного тождества одинаковых именований? ): Поэт издалека заводит речь, поэта далеко заводит речь. [Цветаева] Рыбак рыбака видит издалека. [*Рыбак себя видит издалека] Ворон ворону глаз не выклюет. Рука руку моет. Степь да степь кругом.

Дальнейшее обобщение – понятие кореференции предметных имен в тексте. Wiki: Coreference: identification chains of Дальнейшее обобщение – понятие кореференции предметных имен в тексте. Wiki: Coreference: identification chains of noun phrases that refer to the same object Вот бегает дворовый мальчик, В салазки жучку посадив, Себя в коня преобразив. Шалун уж заморозил пальчик… (the) Богумил Палек (1968): Наши взгляды на анафору резко отличаются от общераспространенных концепций. По существу, мы считаем кросс-референцию самостоятельным языковым явлением и предметом исследования. До сих пор в лингвистических работах она обычно рассматривалась как проблема местоимений и артиклей… Отсюда возникает неоднозначность и расплывчатость в употреблении термина "анафора".

4) Определение границ языковой правильности: *Бесцветные зеленые идеи яростно спят. [Н. Хомский] 4) Определение границ языковой правильности: *Бесцветные зеленые идеи яростно спят. [Н. Хомский]

# 3. Семантика в терминоведении и философии – проблема определения терминов. Представление любой области # 3. Семантика в терминоведении и философии – проблема определения терминов. Представление любой области профессиональных знаний начинается с раздела "Основные термины и понятия". Важность точного определения терминов: Юриспруденция: кража – грабеж; умышленное убийство – неумышленное убийство; состояние аффекта; … Проект закона: Запрещается продажа спирных напитков поблизости от образовательных учреждений. NB: Все слова требуют уточнений! Военное дело: применить оружие; огонь на поражение; … Медицина, математика, физика, этика, … Что такое 'частица' ? Что такое ‘болезнь' ? Что такое ‘число' ? …

Систематизация профессиональной терминологии начинается с выяснения того, что же именно обозначают употребляемые в данной Систематизация профессиональной терминологии начинается с выяснения того, что же именно обозначают употребляемые в данной профессиональной сфере обычные слова. Совсем простой пример: Автомобиль с большой скоростью промчался мимо нас. Большой автомобиль промчался мимо нас. Ожегов: 1. Значительный по размерам, по величине, силе (большой дом). 2. Значительный, выдающийся; обладающий в высокой степени качеством, которое заключено в значении определяемого существительного (большой поэт, большой плут, большая победа / беда). 3. Взрослый, подросший - о ребенке (сын уже большой). 4. Многочисленный (большая толпа) 5. Представленный в большом количестве (большая нефть).

Еще один пример: a) Джентльмену нельзя есть руками. b) Мужу изменять нельзя. (не рекомендуется Еще один пример: a) Джентльмену нельзя есть руками. b) Мужу изменять нельзя. (не рекомендуется правилами этикета) (не соответствует нормам морали) c) Улицу нельзя переходить на красный свет (запрещено законом – последует наказание) d) Пешеходу нельзя перелететь через улицу, махая руками. (противоречит законам природы)

Проблема смысла в философии: Что есть 'истина' ? Что есть 'красота' ? Что есть Проблема смысла в философии: Что есть 'истина' ? Что есть 'красота' ? Что есть 'жизнь' ? Что есть 'взаимодействие' ? Софисты: Перестал ли ты бить своего отца? (пресуппозиция) Схоласты: Может ли Господь создать такой тяжелый камень, который он сам не сможет поднять? (как понимать определение "всемогущий"? ) Диалоги Платона - проблема соотношения единичного и общего: Как человек может решить, что нечто прекрасно? - идея прекрасного и прекрасная вещь.

# 4. Компьютерная семантика Общая направленность традиционной лингвистики – на обучение языку человека (уже # 4. Компьютерная семантика Общая направленность традиционной лингвистики – на обучение языку человека (уже владеющего родным языком) Общая направленность компьютерной (точнее, инженерной!) лингвистики – воспроизведение на компьютере тех или иных аспектов языковой (и профессиональной) компетенции человека Общая направленность компьютерной (инженерной) семантики – воспроизведение на компьютере способности человека понимать и осмысленно употреблять языковые выражения.

Основные проблемы: 1) Разработка и стандартизация «хорошо определенных» языков представления знаний (ЯПЗ = KRL) Основные проблемы: 1) Разработка и стандартизация «хорошо определенных» языков представления знаний (ЯПЗ = KRL) и построение систем ограниченного вывода для них. Логические языки. 2) Перенос внимания от семантики слова к семантике словосочетания и предложения. Семантика синтаксиса. 3) Алгоритмы разрешения лексических и синтаксических неоднозначностей (ambiguity resolution, disambiguation)

4) Кореференция (как определить, что два разных слова в связном тексте указывают на один 4) Кореференция (как определить, что два разных слова в связном тексте указывают на один и тот же предмет, явление? ) Примеры: Так думал молодой повеса… Наследник всех своих родных. . . С героем моего романа. . . Онегин, добрый мой приятель. . . Судьба Евгения хранила. . . Ребенок был резов, но мил. Вот бегает дворовый мальчик, / В салазки жучку посадив, Себя в коня преобразив. Шалун уж заморозил пальчик…* Кампоманес не склонен терять время на попытки вернуть Фишера на шахматную арену… Прошло уже двенадцать лет, как победитель матча в Рейкъявике оставил шахматы. *

4) Недавнее землетрясение самым пагубным образом отразилось на Венеции. . . Уникальный исторический центр 4) Недавнее землетрясение самым пагубным образом отразилось на Венеции. . . Уникальный исторический центр может выжить лишь при условии, что итальянское правительство примет самые срочные меры по устранению угрозы затопления города водами Адриатики. 5) Эффективность красной люминесценции фосфида галлия. Проведены исследования оптических свойств кристаллов. 6) Итальянское правительство заключило с правительством России соглашение о сотрудничестве в области энергетики. 7) Слава богу! Грозненский «Терек» наконец-то проиграл и выбыл из кубка УЕФА. Впервые за сорок лет болельщицкого стажа я радуюсь проигрышу отечественного клуба иностранной команде. Надоело наблюдать, как наши телеканалы делают из совершенно рядового события – участия заштатного футбольного клуба в первой стадии международного турнира – политическое событие едва ли не всероссийского масштаба.

Кореференция в плане синтеза текста: (1 -1) Авианосец Кореференция в плане синтеза текста: (1 -1) Авианосец "Йорктаун" получил большие повреждения и был затоплен. (1 -2 а) … Крейсера повреждений не получили. (1 -2 б) ? …Корабли повреждений не получили. / + другие, остальные, …/ (2 -1) Завод "Электросила" производит мощные электрические машины. (2 -2) [Аналогичное] предприятие находится в Харькове.

5) Теория определений и семантические примитивы (атомы смысла) в языке. (Ср. лексические функции Мельчука 5) Теория определений и семантические примитивы (атомы смысла) в языке. (Ср. лексические функции Мельчука – Жолковского. )

5) Методы обнаружения смысловой неполноты текста и заполнения смысловых лакун. NB: “Внешняя” (энциклопедическая) неполнота 5) Методы обнаружения смысловой неполноты текста и заполнения смысловых лакун. NB: “Внешняя” (энциклопедическая) неполнота – присутствует всегда; формальных показателей обычно не имеет. “Внутренняя” (грамматическая) неполнота – присутствует иногда; формальные показатели обычно имеются. С. Михалков: Трусы и рубашка лежат на песке, Никто не плывет по опасной реке.

Посетитель в мастерской художника: - Не можете ли Вы предложить мне что-нибудь недорогое и Посетитель в мастерской художника: - Не можете ли Вы предложить мне что-нибудь недорогое и в масле? - Банку сардин. - Говорят поверхностное дыхание по Бутейко убивает вирусы гриппа. - Может быть. Но я не представляю, как Бутейко умудряется научить эти вирусы дышать поверхностно! Опрос таможенников бывших республик СССР – сколько времени вам нужно для покупки БМВ? Украинский таможенник – ну, 3 месяца, не меньше. Белорусский –месяцев 5 Российский – не менее 5 -ти лет ? ? ? Да уж больно фирма крупная!

6) Методы формализации понятийных систем. Разработка концептуальных словарей (онтологий), необходимых для поддержки алгоритмов семантического 6) Методы формализации понятийных систем. Разработка концептуальных словарей (онтологий), необходимых для поддержки алгоритмов семантического анализа. 6) Прецедентный анализ в семантике.

Тема 1. Понятие – основная единица семантического уровня языка 1. Что такое Тема 1. Понятие – основная единица семантического уровня языка 1. Что такое "понятие" ? 2. Классификация понятий Слайд 25 3. Понятие и слово 4. Синтагматические отношения между понятиями Слайд 37 5. Парадигматические отношения между понятиями Слайд 49

# 1. Что такое # 1. Что такое "понятие" ? Отделение понятия от слова – в значительной мере результат развития науки и лексикографической работы лингвистов. Объекты семантического уровня: • понятие • суждение (= высказывание), вопрос • умозаключение • база знаний

1. 1. Номинальные определения: Понятие – 1. 1. Номинальные определения: Понятие – "форма мышления, отражающая существенные свойства, связи и отношения предметов и явлений". Понятие – "мысль, отражающая в обобщенной форме предметы и явления действительности посредством фиксации их свойств и отношений". Неконструктивность подобных определений. Что такое понятие с точки зрения языка? Понятие – имя какого-либо класса предметов, явлений, (а) достаточно четко различаемых в системе знаний vs летающая тарелка, торсионные поля ("имовин"), медитация и др. (б) рассматриваемое независимо от способов его языкового выражения. Что требуется: • уметь проверить, владеет ли человек (или компьютер) данным понятием, системой понятий; • уметь выделять (простые) понятия в тексте.

1. 2. Что значит 1. 2. Что значит "владеть понятием"? a) Способность референции (проверочная процедура): Запрещается продажа спиртных напитков вблизи образовательных учреждений. спиртные напитки = ? (пиво? ) вблизи = ? (напротив? ) образовательное учреждение = ? (ясли? ) ? Мы оказались в эпицентре событий; апробация; дискредитация, дискретизация, диверсификация… Также способность правильно оценивать истинность высказываний, содержащих данное понятие. Ср. : Диверсификация производства увеличит доходы. (ДА? ) Дискретизация производства увеличит доходы. (? ) Дискредитация производства увеличит доходы. (НЕТ)

b) Способность строить правильные (осмысленные) выражения, используя данное понятие: b) Способность строить правильные (осмысленные) выражения, используя данное понятие: "Воробей просил ворону вызвать волка к телефону" [Маршак] ? Воробей посмотрел на часы, запер ящики своего письменного стола, взял портфель и отправился домой.

c) Способность правильно устанавливать смысловые отношения с другими понятиями (делать выводы, используя это понятие; c) Способность правильно устанавливать смысловые отношения с другими понятиями (делать выводы, используя это понятие; отвечать на вопросы, обнаруживать противоречия и смысловую избыточность в тексте). Прежде всего - правильно устанавливать объемные отношения между понятиями: На углу Большой Морской и Тучкова моста Шел высокий гражданин низенького роста. Весь курчавый без волос, Как картошка, длинный нос, Тоненький, как бочка. высокий неверно что низенький; дрозофила муха насекомое; X знает, что Y Y истинно; вошел в … находится в …

1. 3 Откуда взялись понятия ? (о природе 1. 3 Откуда взялись понятия ? (о природе "значения") "Функция понятия – выделение общего, которое достигается посредством отвлечения от всех особенностей отдельных предметов. " – вульгарный взгляд на происхождение понятий! Предполагаемая при этом схема познавательной деятельности: 1) Различение и восприятие отдельных предметов 2) Объединение их по какому-то признаку 3) Именование этого признака Но: Физиологически способность различать предметы не является первичной: напр. , животные, которые не видят неподвижных предметов (лягушки). Кант: "Мы видим только то, что мы уже знаем" (первоначально - руками!)

Ogden & Richards. The meanings of meaning. 1923. (17 значений) Семантический треугольник – только Ogden & Richards. The meanings of meaning. 1923. (17 значений) Семантический треугольник – только констатирует проблему: значение (мысль, понятие) знак (материал) предмет Откуда берется значение знака ? … (Возможности определений) Что возникло раньше –знак или значение?

задачи полезные функции предметов: предметный мир: q съедобное q горючее q может лечить раны задачи полезные функции предметов: предметный мир: q съедобное q горючее q может лечить раны q рубит дерево предмет

О возникновении языка: Празначения – практически значимые функции вещей. (число: остров Пасхи; ребенок: О возникновении языка: Празначения – практически значимые функции вещей. (число: остров Пасхи; ребенок: "мама", "дай", "не хочу", "пить") Символизация звуками (молчащий до 3 -х лет ребенок). Косвенные свидетельства тезиса: • иноязычные заимствования (при Петре I и сейчас) • множественность синонимов: – у эскимосов 'снег' – в русском языке: выпить, поддать, принять, наклюкаться, дербануть, сообразить, закладывать, квасить, …(>50)

Решающий шаг в становлении языка – формирование грамматики. Основная предпосылка формирования грамматической системы: структура Решающий шаг в становлении языка – формирование грамматики. Основная предпосылка формирования грамматической системы: структура деятельности приобретает разнообразие; становятся значимы связи между вычлененными ранее фрагментами. Одни и те же свойства могут соотноситься разными способами. a) Один и тот же предмет может соответствовать разным значимым функциям (обладать разными свойствами): съедобное & лечит раны; (красный шар; фарфоровая чашка). b) Одни и те же практически различаемые фрагменты действительности могут участвовать в разных видах связей: стол из дерева VS стол у дерева; ударить по камню VS ударить камнем прибыть в Москву VS прибыть из Москвы

Следующий шаг – конструирование новых смыслов (используя уже имеющиеся и грамматику как инструмент). Ср. Следующий шаг – конструирование новых смыслов (используя уже имеющиеся и грамматику как инструмент). Ср. кентавр, люди с собачьими головами, … четвертое измерение Далее мифология, религия и философия.

Общий вывод: Познание движется НЕ от единичного к общему ( Общий вывод: Познание движется НЕ от единичного к общему ("обобщение отдельных наблюдений"), а от общего к единичному (конкретизация и индивидуализация различаемых в мире реалий)! (Объективный смысл философии Платона) С точки зрения теории познания и самого языка уникальность именования есть не исходный пункт, а результат соединения в одном описании нескольких или даже многих общих имен. Уникальное имя отнюдь не Сократ, а Сократ Иванович Иванов, 19. . года рождения, проживающий по адресу…, паспорт N….

# 5. Понятие и слово Слово: Ø как правило, многозначно; Ø может включать эмоциональный # 5. Понятие и слово Слово: Ø как правило, многозначно; Ø может включать эмоциональный и оценочный компоненты

Понятие: Ø однозначно по определению; Ø стилистически и оценочно нейтрально (в профессиональных подъязыках); Ø Понятие: Ø однозначно по определению; Ø стилистически и оценочно нейтрально (в профессиональных подъязыках); Ø может быть выражено словосочетанием (обычно – именным словосочетанием) Ø профессиональные понятия формируются в сфере профессиональной деятельности – где и сама деятельность, и связанные с ней реалии достаточно хорошо структурированы; соответственно, языковая форма представления понятия и ее различия в разных языках мало существенны. Пример 1 – названия способов видоизменения шрифтов: английский: engrave русский: утопленный (ср. вдавленный) Пример 2 – зависимость от "местных условий": глава правительства – премьер-министр, председатель Совета министров, канцлер, …

Существенные противопоставления: : 1) Специальный термин vs общеязыковое выражение 2) Слово vs коллокация (2 Существенные противопоставления: : 1) Специальный термин vs общеязыковое выражение 2) Слово vs коллокация (2 -х и более словный термин / устойчивое словосочетание, фразеологизм)

В языке существует значительное число устойчивых оборотов , функционирующих как эквивалент слов (в том В языке существует значительное число устойчивых оборотов , функционирующих как эквивалент слов (в том числе служебных). Сложные предлоги: при помощи; в связи с; во избежание; в ответ на; в качестве; несмотря на; в интересах; с точки зрения; . . . Подчинительные союзы: ввиду того, что; в то время как; несмотря на то, что; . . . Наречия: на славу; на совесть; между делом; как попало; … Вводные обороты: к сожалению; так сказать; в конце концов; … Идиомы и устойчивые обороты речи: стреляный воробей; сидеть на мели; подложить свинью. Жесткие. Сочетания. doc

Двухсловные словосочетания, выделенные в тексте по частотному критерию: А) Терминологические: естественный семантический информационные единица Двухсловные словосочетания, выделенные в тексте по частотному критерию: А) Терминологические: естественный семантический информационные единица семантическое семантические базы логический понятийный указательные энциклопедические семантический классификация язык словарь технологии измерения представление категории данных язык словарь местоимения словари словарь лексики 15 12 10 8 6 5 5 5 4 4 4

Двухсловные словосочетания, выделенные в тексте по частотному критерию: Б) Общеязыковые: может могут должен и Двухсловные словосочетания, выделенные в тексте по частотному критерию: Б) Общеязыковые: может могут должен и т точка отношений и быть т п зрения между другие 11 5 9 8 6 4

Инвентаризация понятий: ( Инвентаризация понятий: ("делить или не делить") А. Не делить: А 1. Хотя бы одно из словосочетания имеет весьма общее значение. Взрывчатое вещество Трансурановые элементы Транспортное средство Измерительный прибор Турбозубчатый агрегат Ядерная установка Кровеносная система Элементарная частица Единица измерения

А 2. Хотя бы одно из словосочетания имеет несколько значений или употреблено в переносном А 2. Хотя бы одно из словосочетания имеет несколько значений или употреблено в переносном (метафорическом) значении, получая однозначное толкование только в контексте данного словосочетания. Железная дорога – ср. железная труба Бархатный путь - ср. бархатный кафтан Рублевое покрытие – ср. покрытие лаком Шахтный ствол – ср. ствол орудия Дорожное полотно – ср. льняное полотно Транспортная развязка – ср. развязка еще не наступила Цепная реакция – ср. цепная передача Момент инерции - ср. неподходящий момент Рабочий проект – ср. рабочий класс Гаечный ключ – ср. телеграфный ключ, скрипичный ключ

А 3. Термины, в состав которых входит имя собственное. Эффект Холла Постоянная Планка Теорема А 3. Термины, в состав которых входит имя собственное. Эффект Холла Постоянная Планка Теорема Ферма Море Лаптевых Градусов Цельсия Декартовы координаты А 4. Термины, для которых затруднительно однозначно определить семантику связи между компонентами. Нервная система - ср. нервная женщина Трансформатор тока (<> прибор, трансформирующий ток) А 5. Один из терминов употреблен в более узком , чем буквальный смысл, значении. Защитные материалы (= «материалы, применяемые для защиты от ионизирующих излучений» - ПС)

А 6. Наименования признаков, имеющих специфический способ измерения или специфическую единицу измерения. Срок службы А 6. Наименования признаков, имеющих специфический способ измерения или специфическую единицу измерения. Срок службы Срок годности Срок гарантии Продолжительность жизни Угловая скорость Абонентская плата А 7. Наименование класса объектов, процессов со специфическим набором характеристик (в этом случае рекомендуется оставлять термин неделимым, даже если его смысл полностью определяется смыслом составляющих его слов). Пассажирский транспорт Радиоактивные отходы Жилой дом Резиновая обувь Женская одежда

Б. Делить: Следует безусловно делить словосочетания, если смысл составляющих его слов (в контексте данной Б. Делить: Следует безусловно делить словосочетания, если смысл составляющих его слов (в контексте данной предметной области однозначен, а синтаксическая связь между ними может быть интерпретирована одним из следующих способов. Б 1. Ролевые отношения. Главное слово обозначает процесс, действие состояние, либо статическое отношение, а подчиненное слово обозначает объект, явление, специфицирующие одну из стандартных ролей относительно главного слова. • Объект процесса / действия: Сварка металлов, Выращивание овощей, хлопковая сеялка, измерение температуры, получили сообщение; • Активный субъект действия: Прибытие делегации, Решение судьи, Жалоба адвоката, Зрительские симпатии; • Пассивный субъект действия: Назначение послом, Сообщил в газеты; • Инструмент, средство, способ действия: Аргонная сварка, Рисование углем, Прибыл на поезде.

Б 2. Наименование признака – характеризуемый признаком объект. Водоизмещение судна, Скорость охлаждения, Прозрачность материала, Б 2. Наименование признака – характеризуемый признаком объект. Водоизмещение судна, Скорость охлаждения, Прозрачность материала, Толщина пленки. Б 3. Объект/процесс - его характеристика (по другому основанию). Глубинное бурение, Земляная плотина, Бериллиевые сплавы. Б 4. Предметно-ассоциативные отношения. Компоненты термина называют реалии, связываемые одним из следующих отношений. • Часть целое: Крыша дома, Колесо автомобиля, Глава диссертации; • Объект – функция: Защитная оболочка, Вязальная машина, Кукурузоуборочный комбайн; • Объект / процесс – локализация: Подводная съемка, Уличные беспорядки, Корабельный колокол. Во всех сомнительных случаях последнее слово за экспертом – составителем энциклопедического словаря!

Задание № 1 Определить, подлежат ли делению указанные словосочетания (указать правило, используемое для принятия Задание № 1 Определить, подлежат ли делению указанные словосочетания (указать правило, используемое для принятия решения): автомобильный аккумулятор логический элемент палубная авиация сила Лоренца коэффициент полезного действия лопасти винта синхронный электродвигатель синхронные и асинхронные электромашины печь для обжига …

# 2. Классификация понятий Слайд 16 2. 1. Собственно понятия и функциональные термы. 2. # 2. Классификация понятий Слайд 16 2. 1. Собственно понятия и функциональные термы. 2. 2. Основные семантические категории. 2. 3. Диагностика понятий

Семантическая классификация в Национальном корпусе русского языка: Семантика. Рус. Корпора. doc http: //www. ruscorpora. Семантическая классификация в Национальном корпусе русского языка: Семантика. Рус. Корпора. doc http: //www. ruscorpora. ru/

2. 1. Собственно понятия и функциональные термы. Обычно говорят о предметах, свойствах, отношениях, процессах. 2. 1. Собственно понятия и функциональные термы. Обычно говорят о предметах, свойствах, отношениях, процессах. Общее название, которое для них подходит – имена. (Не смешивать с собственными именами!) Помимо того в языке используются служебные и специальные элементы, не являющиеся именами – функциональные термы. Деление на имена и функциональные термы аналогично делению на знаменательную и служебную лексику в лингвистике

Виды функциональных термов 1) Логические операторы: И, ИЛИ, ЕСЛИ…ТО …; ВСЕ, НЕКОТОРЫЕ; ВСЕГДА, ИНОГДА; Виды функциональных термов 1) Логические операторы: И, ИЛИ, ЕСЛИ…ТО …; ВСЕ, НЕКОТОРЫЕ; ВСЕГДА, ИНОГДА; 2) Количественные термы и термы количественных отношений: один, два, три, …, тридцать, … ; больше, меньше 3) Термы нормативно-количественной оценки и их модификаторы: много, мало; большой малый; весьма, сверх-, ультра-, … 4) Вопросительные элементы: кто, когда, где, почему, … 5) Слова типа этот, другие (индикаторы референции) 6) анафорические элементы: я, они, который, … 7) Фазовые определители процессов: начинать(ся), заканчивать(ся), продолжать(ся) 8) Модальные операторы: возможно, необходимо.

2. 2. Основные семантические категории. В грамматике языка части речи отражают 2. 2. Основные семантические категории. В грамматике языка части речи отражают "наивную понятийную классификацию": • существительные – "предметы"; • (качественные) прилагательные – "свойства"; • глаголы – "процессы и действия"; • наречия – "характеристики действия". Ее неудовлетворительность: • непоследовательность – ср. падение, в ноябре, шар, белеет, корабельный, … • неполнота – ср. температура, расстояние, находится …

Более того: во многих случаях границы между частями речи следует считать несущественными с точки Более того: во многих случаях границы между частями речи следует считать несущественными с точки зрения семантики и, соответственно, слова, относимые к разным частям речи считать равнозначными. Ср. роторный двигатель = двигатель с ротором; корабельная турбина = турбина на корабле; металлические листы = листовой металл; падение метеорита = упал метеорит; февральские морозы = морозы в феврале; белеет парус = белый парус; и т. д. , и т. п.

Смысловые основания классификации понятий: 1) Тест – результат (основание классификации – имена классов, выделенных Смысловые основания классификации понятий: 1) Тест – результат (основание классификации – имена классов, выделенных по этому основанию) – в грамматике нет: цвет – красный синий желтый …; вес - тяжелый, легкий, весом 5 кг …; расстояние – далеко, близко; настроение – грустный, бодрый, …; профессия – слесарь, врач, … скорость – быстро, медленно, … 2) Статика – динамика (состояния - процессы): 1. парус, белеет, находится … vs нагрев, плавление, прибытие … 3) Число характеризуемых предметов (свойства - отношения): синий, медный, съедобный; шар, собака, планета vs раньше (что? чего? ); сообщать (кто? что? кому? ); наказывать (кто? кого? за что? чем? ) - 2 -х, 3 -х, 4 -х, … -местные отношения (арность, arity)

4) Элементарность – производность (выявление семантических примитивов): температура горячий, холодный; нагрев, охлаждение; нагреватель, термометр; 4) Элементарность – производность (выявление семантических примитивов): температура горячий, холодный; нагрев, охлаждение; нагреватель, термометр; вес легкий, тяжелый; облегчить; весы, взвешивать; стоимость, цена дешевый, дорогой; вздорожание, уценка; оценивать, прицениваться, торговаться (= договариваться о цене), оценщик; ценник. расстояние далекий, близкий; приближение, удаление; дальномер; имущественные отношения (владение) купить, продать, подарить; владелец, продавец, покупатель; Семантические примитивы: горячий ТЕМПЕРАТУРА + БОЛЬШАЯ_ВЕЛИЧИНА нагрев ТЕМПЕРАТУРА + УВЕЛИЧЕНИЕ Слайд 113 термометр ТЕМПЕРАТУРА + ИЗМЕРЕНИЕ Слайд 147

Семантические категории: 1. Наименования признаков: цвет, вес, агрегатное состояние, цена, возраст, социальное положение, фамилия, Семантические категории: 1. Наименования признаков: цвет, вес, агрегатное состояние, цена, возраст, социальное положение, фамилия, профессия ученое звание, марка, … 2. Имена объектов (значения признаков и их логические комбинации): вода, человек, корабль, тяжелый, медный, белый, … 3. Процессы, события, действия: таяние, падение, горение (длительность); взрыв, авария, рождение (отсутствие длительности, завершенность ); 4. Статические (непроцессные) отношения находиться в, владеть, руководить, иметь частью, причина … VS расстояние, отношение родства, … Слайд 101

Части речи и семантические категории: 1. Существительные - любая категория; обычно выделяют имена с Части речи и семантические категории: 1. Существительные - любая категория; обычно выделяют имена с предметным значением 1. Прилагательные - Качественные обычно значения объектных или процессных признаков 2. Глаголы – процессы, действия 3. Наречия – характеристики процессов, действий

Дальнейшая детализация – в соответствии с особенностями употребления и / или определения 1. Наименования Дальнейшая детализация – в соответствии с особенностями употребления и / или определения 1. Наименования признаков: 1. 1. Качественный (классификационный) (цвет, агрегатное состояние) 1. 2. Бинарный (истинность, исправность) 1. 3. Количественный (вес, цена, скорость; число полюсов; количество сотрудников) o измеримый числом o оцениваемый 1. 4. Строковый (марка, фамилия) 1. 5. Наименование группы признаков (величина; параметр) Слайд 123

2. 3. Контекстная диагностика понятий. Интуитивная оценка экспертом (информантом) может быть субъективной: «циклон» – 2. 3. Контекстная диагностика понятий. Интуитивная оценка экспертом (информантом) может быть субъективной: «циклон» – это процесс ? ? объект? ? Следует исходить из того, что семантические категории характеризуют сочетаемость (понятий!). Объективный метод – использование диагностических контекстов: a) диагностический контекст предлагается для оценивания эксперту; b) статистический анализ контекстов употребления термина Схема диагностического контекста: I --- T (синтаксическая связь, выражающая определенное смысловое отношение) T – диагностируемый термин; I – диагностирующий элемент (индикатор).

Пример: диагностика наименований признака. Изменение цвет вес агрегатное состояние Зависимость (чего? ) цена Влияние Пример: диагностика наименований признака. Изменение цвет вес агрегатное состояние Зависимость (чего? ) цена Влияние на (на что? ) возраст Исследование/Изучение социальное положение фамилия … профессия ученое звание марка …

Только для наименований признака, допускающих количественную оценку: Большой цвет Малый вес Низкий агрегатное состояние Только для наименований признака, допускающих количественную оценку: Большой цвет Малый вес Низкий агрегатное состояние Высокий цена Огромный возраст Минимальный социальное положение Максимальный фамилия Измерение профессия Увеличение ученое звание Уменьшение марка …

# 3. Синтагматические отношения между понятиями Слайд 16 Определяют семантическую интерпретацию синтаксических связей между # 3. Синтагматические отношения между понятиями Слайд 16 Определяют семантическую интерпретацию синтаксических связей между словами (терминами), но могут и не иметь грамматического выражения в тексте. 3. 1. Ролевые 3. 2. Кореференция 3. 3. Предметно-ассоциативные 3. 4. Смысловой повтор 3. 5. Функциональные 3. 6. Проблема интерпретации синтаксических связей в системах автоматического анализа текста.

3. 1. Ролевые отношения между понятиями Некоторые классы понятий (процессы, действия и отношения) предъявляют 3. 1. Ролевые отношения между понятиями Некоторые классы понятий (процессы, действия и отношения) предъявляют определенные требования к контексту (как правило, требования к непосредственному синтаксическому окружению). Такие понятия принято называть предикатами. При анализе текста можно говорить о предсказаниях относительно контекстного окружения, которые можно делать, отправляясь от термина-предиката. NB: анализ предсказания; синтез требования Каждое из предсказаний может быть охарактеризовано в терминах фиксированного набора смысловых ролей или, что то же самое, смысловых валентностей, имеющихся у термина-предиката. Пример: Иван купил у Петра дом. КУПИЛ (кто? , у кого? , что? [за сколько? ]) или: КУПИЛ ( SUB 1: x, SUB 2: y, OB: z )

Единицы, заполняющие в тексте валентности предикатного термина, называют актантами. Список возможных ролей должен устанавливаться Единицы, заполняющие в тексте валентности предикатного термина, называют актантами. Список возможных ролей должен устанавливаться исходя из принципа минимальной достаточности выразительных возможностей языка: большое количество ролей скорее вредит алгоритмизации, чем улучшает ее качество. Практический опыт работы с языковым материалом позволяет утверждать, что для описания актантной структуры основной части предикатной лексики достаточно использовать всего 6 ролевых указателей.

Минимально необходимый набор ролей: 1) Физический процесс всегда предполагает наличие материального носителя; физическое действие Минимально необходимый набор ролей: 1) Физический процесс всегда предполагает наличие материального носителя; физическое действие предполагает предмет, на который направлено действие (например, обработка предполагает обрабатываемый материал). Точно так же психические процессы восприятия, оценки, отображения, генерации сообщений и т. п. всегда предполагают, с одной стороны, воспринимающего субъекта, с другой стороны - воспринимаемый, отображаемый объект: видеть(что), читать(что), рассказывать(о чем), рисовать(что), запоминать(что), восхищаться(чем). Соответствующему указателю роли естественно присвоить обобщенное имя ОБЪЕКТ, приняв для него сокращение OB.

2) Процессы, характеризующиеся направленностью, предполагают наличие двух объектов, соответствующих ролям исходный пункт и конечный 2) Процессы, характеризующиеся направленностью, предполагают наличие двух объектов, соответствующих ролям исходный пункт и конечный пункт движения, изменения. (Ехать, лететь, идти, наливать подразумевают откуда и куда; превращаться подразумевает из чего и во что и т. д. ) Статические бинарные отношения, как характеризующиеся (зависеть, быть причиной, предшествовать), так и не характеризующиеся явно выраженной направленностью, - такие как ‘иметь частью’, ‘находиться над’ также предполагают пару объектов. И в том и в другом случае можно использовать одну и ту же пару обобщенных указателей роли - ПЕРВЫЙ ОБЪЕКТ и ВТОРОЙ ОБЪЕКТ, приняв для них сокращение OB 1 и OB 2. (В грамматических терминах – прямое дополнение при переходном глаголе. )

3) Действие предполагает наличие АКТИВНОГО СУБЪЕКТА (SUB 1). (Некто идет, читает, рисует, сверлит, ремонтирует, 3) Действие предполагает наличие АКТИВНОГО СУБЪЕКТА (SUB 1). (Некто идет, читает, рисует, сверлит, ремонтирует, изобретает, . . . ). То же для психических процессов и состояний. Для действий и отношений, предполагающих взаимодействие между субъектами, (один из которых чаще всего - но не обязательно - активный, действующий, а другой пассивный, воспринимающий) нужны, соответственно, указатели роли ПЕРВЫЙ/АКТИВНЫЙ СУБЪЕКТ (SUB 1) и ВТОРОЙ/ПАССИВНЫЙ СУБЪЕКТ (SUB 2): сообщил (кто, кому); начальник ( кто, для кого); купил (кто, у кого); знаком (кто, с кем); и т. д. Можно использовать эту пару ролей как в случае направленных, так и в случае симметричных отношений.

 4. Действие, осуществляемое субъектом, часто (но не обязательно) предполагает указание средств и методов 4. Действие, осуществляемое субъектом, часто (но не обязательно) предполагает указание средств и методов исполнения: рисовал кистью; сверлил на станке алмазным сверлом; прибыл на поезде; сообщил по телефону; сварное соединение (=соединение посредством сварки); и т. п. Здесь достаточен один обобщенный указатель роли ИНСТРУМЕНТАЛЬНЫЙ ОБЪЕКТ (INS). Нет необходимости детализировать этот указатель различением собственно инструментов, вспомогательных средств и агентов, способов, условий действия и т. п. Можно также допустить множественность, повторяемость объектов в этой смысловой позиции: забил гвоздь (OB) молотком (INS) несколькими сильными ударами (INS).

 Что не следует представлять как актанты предикатов? – то, что не является специфичным Что не следует представлять как актанты предикатов? – то, что не является специфичным для конкретного термина или группы предикатных терминов, а характеризует их все или, по крайней мере, подавляющее большинство. Все предикатные термины принадлежат категории процесс/действие, либо отношение. Любой процесс/действие разворачивается во времени и пространстве, обусловлен другими процессами / действиями и, следовательно, всегда может быть охарактеризован с точки зрения места (локализация), времени, и причинности (каузация). Это категориально предопределенные связи. Статическое отношение не всегда требует подобной характеризации,

В итоге получаем список из шести необходимых и достаточных ролевых указателей: SUB 1 (Agent) В итоге получаем список из шести необходимых и достаточных ролевых указателей: SUB 1 (Agent) – первый (активный) субъект действия; SUB 2 (Experiencer) – второй (пассивный) субъект действия; OB 1 (Source) – первый объект, исходный пункт; OB 2 (Goal) – второй объект , конечный пункт; OB (Theme) – объект, на который направлено действие; INS (Instrument) – инструмент, средство или способ действия. Слайд 119

Используемый в англоязычной литературе типовой набор можно представить, например, следующим списком: Agent Experiencer Source Используемый в англоязычной литературе типовой набор можно представить, например, следующим списком: Agent Experiencer Source Goal Theme Instrument

In the book Knowledge Representation by John F. Sowa: After analyzing and summarizing various In the book Knowledge Representation by John F. Sowa: After analyzing and summarizing various systems of case relations or thematic roles, Harold Somers (1987) organized them in a matrix with four types of participants at the top and six categories of verbs along the side. In the 24 boxes of the matrix, Somers had some boxes with duplicate role names and some boxes with two roles that were distinguished by other properties: ±animate, ±physical, ±dynamic, or ±volitional.

Thematic roles as subtypes the four types of participants Thematic roles as subtypes the four types of participants

John F. Sowa: John F. Sowa:

3. 2. Кореференция : Отношение кореференции устанавливается между терминами, относящимися к семантической категории Объект, 3. 2. Кореференция : Отношение кореференции устанавливается между терминами, относящимися к семантической категории Объект, либо между таким термином и объектным признаком с определенным значением. Указывает на предметное тождество двух терминов. синий шар; кристаллический кремний (= кристалл И кремний); парус одинокий; адвокат Иванова (2 смысла!) vs гусеничный трактор ( гусеница И трактор); офисная мебель ( офис И мебель).

Различительный тест - возможность синонимических трансформаций словосочетания – в том числе с изменением направления Различительный тест - возможность синонимических трансформаций словосочетания – в том числе с изменением направления синтаксической связи: синий шар = шаровая молния = *молниевый шар / молния в форме шара = диэлектрическая жидкость жидкий диэлектрик (-) магниевый порошок / порошок магния = порошковый магний аморфный кремний = кристаллический кремний = кремниевый кристалл / кристалл кремния = листовая медь = ? кубический металл / металл в форме куба медные листы металлический куб (-)

3. 3. Предметно-ассоциативные Связь между синтаксическим хозяином и слугой допускает конкретную содержательную интерпретацию; словосочетание 3. 3. Предметно-ассоциативные Связь между синтаксическим хозяином и слугой допускает конкретную содержательную интерпретацию; словосочетание может быть трансформировано в синонимичную трехчленную конструкцию, в которой связь получает явное лексическое выражение термином, представляющим некоторое отношение предметной области: дизельный автомобиль имеет частью дизель; учебный автомобиль используется для обучения; радиационная проводимость имеет причиной радиацию; продуктовый магазин, торгующий продуктами; цистерна с нефтью цистерна, содержащая нефть. В некоторых случаях отношение между терминами неоднозначно

3. 4. Смысловой повтор Отношения смыслового повтора обнаруживаются в словосочетаниях, обладающих смысловой избыточностью: произвел 3. 4. Смысловой повтор Отношения смыслового повтора обнаруживаются в словосочетаниях, обладающих смысловой избыточностью: произвел выстрел ~ выстрелил; осуществил расчет ~ рассчитал; процесс охлаждения ~ охлаждение; отношение предшествования ~ предшествование; величина мощности ~ мощность; красного цвета ~ красный

Семантически корректный и семантически некорректный смысловой повтор – границы = ? огромный мегаполис; очень Семантически корректный и семантически некорректный смысловой повтор – границы = ? огромный мегаполис; очень выдающийся; быстро мчавшийся; планета Земля масло масляное; металлическая медь; отвратительное безобразие; и т. п.

3. 5. Функциональные отношения между понятиями • признак – значение признака: высокое – напряжение; 3. 5. Функциональные отношения между понятиями • признак – значение признака: высокое – напряжение; весом - 2 [т] • число – единица измерения; число – имя объекта: 200 – мм; 200 - человек • число – модификатор значения: более - 100 - мм • терм - отрицание не сообщил • логический оператор – соединяемые термины: синий И красный шары

3. 6. Проблема интерпретации синтаксических связей в системах автоматического анализа текста. Неоднозначность интерпретации синтаксической 3. 6. Проблема интерпретации синтаксических связей в системах автоматического анализа текста. Неоднозначность интерпретации синтаксической связи: Книга [R 1] издательства R 1 = выпущенная Книга [R 2] сестры R 2 = принадлежит / написана Книга [R 3] анекдотов R 3 = содержит Улица жертв революции; памятник жертвам революции: (1) те, кто совершал революцию (2) те, против кого совершалась революция Для русского языка конструкция N + Ngen обычно десемантизирована (Ср. английские конструкции с предлогом of и N + N) Необходимость мощной словарной (тезаурусной) поддержки.

# 4. Парадигматические отношения между понятиями Слайд 16 3. 1. Объемные 3. 2. Предметно-ассоциативные # 4. Парадигматические отношения между понятиями Слайд 16 3. 1. Объемные 3. 2. Предметно-ассоциативные 3. 3. Функциональные

3. 1. Объемные отношения между понятиями. Каждое понятие может служить именем для некоторой совокупности 3. 1. Объемные отношения между понятиями. Каждое понятие может служить именем для некоторой совокупности предметов, явлений. Эту совокупность (множество) называют объем понятия. Объем некоторых понятий конечен и точно определен. Это: a) собственные имена (Николай Васильевич Гоголь; Чебоксары; Чернобыльская авария; Вторая мировая война; Солнце) b) совокупности, связанные с индивидуальным объектом: (планеты Солнечной системы; студенты 422 группы 2003 г. ; мосты С. -Петербурга; президенты России)

Объем большинства понятий неопределенный (именуемые реалии невозможно перечислить): стол, собака, сосна, книга, война, … Объем большинства понятий неопределенный (именуемые реалии невозможно перечислить): стол, собака, сосна, книга, война, … Даже для, казалось бы, собственных имен – ср. : Наполеон, Москва, Курск, Иван, Буш. Важно не знание точного количества предметов, а владение референцией, умение определять, входит предмет, явление в объем данного имени или нет! (Тест) Еще более важно знание соотношения объемов любых двух понятий, относящихся к одной категории. Соотношение объемов наглядно представляется кругами Эйлера.

Возможны 4 типа объемных отношений. 1. Пересечение: космонавт – инженер студент – депутат женщина Возможны 4 типа объемных отношений. 1. Пересечение: космонавт – инженер студент – депутат женщина - губернатор профессор - врач растение - лекарство 2. Несовместимость: школьник - инженер шахта - автомобиль собака – змея кит - кот вода - камень война – стихийное бедствие

Разве актер не может быть бунтовщиком? Разве актер не может быть бунтовщиком? "О бедном гусаре замолвите слово" (Е. Леонов) Химия и контрреволюция не исключают друга. В. И. Ленин – ходатаям

Возможны 4 типа объемных отношений. 3. Включение: специалист (A) – инженер (B) чиновник (A) Возможны 4 типа объемных отношений. 3. Включение: специалист (A) – инженер (B) чиновник (A) – губернатор (B) растение (A) - пальма (B) A B поэт (A) - Пушкин (B) И судно (A) – танкер (B) 4. Тождество: A B судно – корабль победитель при Аустерлице – побежденный при Ватерлоо утренняя звезда – вечерняя звезда

Сравнение с терминологией лингвистики: • • тождество ~ синонимия включение ~ гипонимия несовместимость ~ Сравнение с терминологией лингвистики: • • тождество ~ синонимия включение ~ гипонимия несовместимость ~ антонимия (? ? ) Ø антонимия – частное отношение: для большинства понятий оно не определено; несовместимость – общее отношение, для каждого общего предметного понятия можно перечислять множество с ним несовместимых: кот – дом, книга, планета, … Ø антонимия – парное отношение: для данного слова, как правило, в языке можно найти 1 антоним; несовместимость – множественное отношение (1 : N) совместимость ~ ? ? - в традиционной лингвистике аналог отсутствует; не различаются отношения в парах студент – депутат и студент – школьник.

Задание № 2 Представить круговыми диаграммами отношения следующих понятий: 1. учитель – рабочий – Задание № 2 Представить круговыми диаграммами отношения следующих понятий: 1. учитель – рабочий – студент; 2. пожар – стихийное бедствие – явление природы; 3. планета – комета – небесное тело – Земля; 4. Европа – Англия – Франция; 5. сутки – часть суток – день – час; 6. отец – сын – брат; 7. дядя – брат – племянник.

Задание № 3 Подобрать недостающие понятия, соответствующие данным круговым диаграммам: Задание № 3 Подобрать недостающие понятия, соответствующие данным круговым диаграммам:

3. 2. Предметно-ассоциативные отношения между понятиями Понятия A и B именуют разные предметы / 3. 2. Предметно-ассоциативные отношения между понятиями Понятия A и B именуют разные предметы / явления, но можно указать отношение, которое всегда (как правило? ) имеет место между предметами / явлениями A и B. Содержательно наличие предметно-ассоциативного отношения (ПАО) между A и B соответствует утверждению Для всякого A найдется B, такое, что между A и B имеет место отношение R (У человека есть голова) В некоторых случаях может выполняться и более сильное утверждение: Для любых A и B имеет место отношение R.

Примеры: автомобиль, колесо иметь частью Петербург, Нева иметь местом (локализация) стул, сидеть быть предназначенным Примеры: автомобиль, колесо иметь частью Петербург, Нева иметь местом (локализация) стул, сидеть быть предназначенным для рядовой, офицер подчиняться президент, организация руководить отвертка, винт вращать, завинчивать, отвинчивать, …

3. 3. Функциональные отношения между понятиями • единица измерения – наименование признака: ампер [ 3. 3. Функциональные отношения между понятиями • единица измерения – наименование признака: ампер [ измеряет ] сила тока • единица измерения нестандартная – стандартная: мм [ заменить на ] м; • свойство - наименование признака синий [ значение признака ] цвет • наименование признака – условие применимости упругость [ характеризует только ] твердое тело

Тема 2. Языки представления знаний (ЯПЗ) 1. Что такое ЯПЗ? 2. Логические языки 3. Тема 2. Языки представления знаний (ЯПЗ) 1. Что такое ЯПЗ? 2. Логические языки 3. Специализированные языки представления знаний в информационных технологиях Слайд 143 Языки представления знаний – основной инструмент инженерии знаний (knowledge engineering). Knowledge engineering is the application of logic and ontology to the task of building computable models of some domain for some purpose. John F. Sowa

# 1. Что такое ЯПЗ ? 1. 1. Основные требования к ЯПЗ. 1. 2. # 1. Что такое ЯПЗ ? 1. 1. Основные требования к ЯПЗ. 1. 2. Типы знаний. 1. 3. Виды ЯПЗ. 1. 4. Простой пример: язык реляционных СУБД.

1. 1. Основные требования к ЯПЗ. 1) Почему ЕЯ не может использоваться в качестве 1. 1. Основные требования к ЯПЗ. 1) Почему ЕЯ не может использоваться в качестве ЯПЗ? В информационных технологиях нужны точные правила сравнения и преобразования смысла языковых выражений. В ЕЯ (даже в профессиональных подъязыках) имеют место: Ø неоднозначность: лексическая и синтаксическая омонимия и синонимия; Ø неполнота выражения смысла; Ø отсутствие правил построения осмысленных языковых выражений. Ø отсутствие правил установления смысловых соответствий между языковыми выражениями. В естественном языке не всегда легко решить (и доказать), является текст осмысленным или представляет собой бессмысленный набор слов – даже если этот текст порожден в сфере науки.

Реальный пример (из заявки на грант): «Селекция когнитивных структур, принципов символического описания и представления Реальный пример (из заявки на грант): «Селекция когнитивных структур, принципов символического описания и представления ментальных процедур характеризуется тенденцией описания в агглютинативном ключе, которое, во-первых, фиксирует универсальные словопроизводственные и деривационные тенденции, отличающие современное состояние языков коммуникации; во-вторых, обнаруживает изменения в принципах фрагментации впечатлений, получаемых носителем языка извне, обусловленных не только состоянием мира, но и необходимостью создания модальной интерпретации энтропийных процессов, свидетельствующих о неупорядоченности систем, а также оппозиционным им антиэнтропийных процессов, обусловленных негэнтропией;

в третьих, свидетельствует об изменениях ментального ландшафта евразийского континента, онтологического пространства «Старый Свет» , в третьих, свидетельствует об изменениях ментального ландшафта евразийского континента, онтологического пространства «Старый Свет» , детерминированных влиянием нигероконголезской языковой культуры, предпосылками к чему следует признать музыкальную экспансию, подготовившую почву для нового сегментирования информационного потока, и как следствие, принятие нового типа нелинейных динамик » . Поэтому строятся искусственные языки, лишенные указанных недостатков естественного языка.

2) Что включает описание ЯПЗ? 1) точно определенный словарь; 2) точно определенные правила построения 2) Что включает описание ЯПЗ? 1) точно определенный словарь; 2) точно определенные правила построения языковых выражений; 3) точно определенные правила смысловых преобразований языковых выражений (правила логического вывода); 4) правила референции – «что обозначено» (через ЕЯ - ? !) P * V = R * T, где P – давление, V - объем, T - температура В отличие от естественного языка здесь описание системы языка первично, а тексты вторичны. ) Поэтому становится актуальной еще одна составляющая: 4) умение устанавливать соответствие между выражениями ЕЯ и ЯПЗ: a) умение "видеть" и представлять на ЯПЗ формальную структуру ЕЯ-выражений.

1. 2. Типы знаний 1) Естественнонаучные и гуманитарные знания. 2) Дескриптивные и нормативно-методические знания. 1. 2. Типы знаний 1) Естественнонаучные и гуманитарные знания. 2) Дескриптивные и нормативно-методические знания. 3) Факты и законы.

1) Естественнонаучные и гуманитарные знания (Мир природы VS мир человека) Мир природы Ø воспроизводимость 1) Естественнонаучные и гуманитарные знания (Мир природы VS мир человека) Мир природы Ø воспроизводимость явлений и познавательных процедур: медь электропроводна; Ø независимость объекта от знания о нем. Мир человека Ø индивидуализированность объектов и явлений; их невоспроизводимость или неполная воспроизводимость: история, археология, политология, экономика, филология, … Ø возможна зависимость объекта от знания о нем: социологические опросы перед выборами; сообщения об экономической конъюнктуре и курсах валют; Ø феномен рефлексии: Я оглянулся, посмотреть, не оглянулась ли она, чтоб посмотреть, не оглянулся ли я … Ø большая субъективность: литературоведение Физика как образец "настоящей" науки.

2) Дескриптивные и нормативно-методические знания (Естественно-научные vs 2) Дескриптивные и нормативно-методические знания (Естественно-научные vs "технические" знания; описание VS предписание; "что? " vs "как? " ): Солнце вращается вокруг Земли vs Чтобы сварить борщ, возьмите одну свеклу. . . Физика – Механика - Биология, Физиология - Социология Культурология ? ? Электротехника Теория машин и механизмов Медицина, Агрономия Социальная инженерия Библиотечное дело Информатика (Computer science) Кулинария

3) Факт и закон Медь добывают в Джезказгане VS Медь электропроводна Факт – знание 3) Факт и закон Медь добывают в Джезказгане VS Медь электропроводна Факт – знание об индивидуальных объектах и явлениях: (Здесь и сейчас; там и тогда; где-то когда-то) География Демография Медицина ("Нужно лечить не болезнь, а человека") Наблюдательная астрономия История Закон – знание универсальных связей между явлениями (Все и всегда; если … то …) Но: Все люди, побывавшие на Луне – американцы. Все президенты России – мужчины. Физика, химия, биология, ботаника, зоология, теоретическая астрономия, психология.

1. 3. Виды ЯПЗ. Ø Логические языки Ø Специализированные языки информационных технологий § Языки 1. 3. Виды ЯПЗ. Ø Логические языки Ø Специализированные языки информационных технологий § Языки табличного типа § Семантические сети § Фреймовые языки § Продукционные языки ØЯПЗ сетевых технологий

1. 4. Простой пример: язык реляционных СУБД. Общая предпосылка применения: проблемная область представляет собой 1. 4. Простой пример: язык реляционных СУБД. Общая предпосылка применения: проблемная область представляет собой одну или несколько совокупностей однотипных объектов, характеризуемых одним и тем же набором свойств. Простейший вариант – одна совокупность (= одна таблица). Пример – кадровая система. NB: подстановочные таблицы!

Элементы языка Термин: имя поля + значение поля Дата рождения = 29. 02. 1981 Элементы языка Термин: имя поля + значение поля Дата рождения = 29. 02. 1981 Должность = бухгалтер (Хранится и обрабатывается только значение!) Высказывание: запись (строка таблицы + имена полей) Содержание высказывания: Существует объект x, характеризуемый указанным набором свойств. Правила построения: заполнить все обязательные поля записи с использованием только допустимых значений и с учетом заданных ограничений. Соединение полей в записи подразумевает логическую связку &. Соединение записей в таблице - то же. Правила вывода: тривиальные.

Выразительные возможности табличных языков. Возможности представления отношений между объектами. a) Связывание записей по совпадению Выразительные возможности табличных языков. Возможности представления отношений между объектами. a) Связывание записей по совпадению значения поля - семантика отношения явно не выражена b) Связывание через вспомогательную таблицу связей.

Принципиальные ограничения (Можно выразить многое, но не все!). a) Представление динамики изменения объектов (только Принципиальные ограничения (Можно выразить многое, но не все!). a) Представление динамики изменения объектов (только через поле Дата-Время) a) Невозможно отражать содержание нарративных текстов: Жил-был поп, толоконный лоб. Пошел поп по базару Купить кой-какого товару. Навстречу ему Балда Идет, сам не зная куда… Другие виды "нетабличной" информации: §медицинская карта; §законодательство; §протокол обследования места преступления; §реклама.

# 2. Логические языки 2. 1. Логика высказываний 2. 2. Логика предикатов [Уайтхед А. # 2. Логические языки 2. 1. Логика высказываний 2. 2. Логика предикатов [Уайтхед А. Н. , Рассел Б. 1910 -13] Whitehead A. N. , Russel B. Principia Mathematica. – Cambridge. "Логика не изучает мышление, она упорядочивает и нормализует его. Она имеет дело не с процессом открытия, а с формой изложения полученного результата с тем, чтобы убедить других в его правильности, а себя в отсутствии самообмана (заметьте аналогию с отладкой программы!). Кант сказал ещё точнее и жестче: «Логика является цензурой мысли» . " (Н. Н. Непейвода)

"Для достижения большей выразительности поэт накладывает на себя самоограничение, переходя от прозы к стихам. Настоящие стихи проверяются прежде всего по формальному признаку: наличию чёткого ритма, а затем по создаваемому ими впечатлению и заложенному в них смыслу. Доказательное логическое рассуждение относится к обычному в некотором отношении так же, как стихи относятся к прозе. Но стихи часто ценятся за неоднозначность, а доказательство — лишь за однозначность. "

"Чтобы конструкция была доказательством, нужно, чтобы её синтаксическая правильность гарантировала семантическую. Чтобы конструкция была доказательством в конкретной системе (в этом случае её чаще всего называют выводом), нужно, чтобы она удовлетворяла однозначным, четким и алгоритмически разрешимым условиям, наложенным данной системой. Если система, в которой задано понятие вывода, работает с формулами математического формального языка, причём достаточно общепризнанным способом, её называют теорией, а в общем случае просто исчислением. "

2. 1. Логика высказываний - Язык для формального описания логических связок. Как из простых 2. 1. Логика высказываний - Язык для формального описания логических связок. Как из простых высказываний можно построить сложное высказывание; какие логические выводы это позволяет делать? Словарь: Логические связки: & - логическое И (конъюнкция); - логическое ИЛИ (дизъюнкция); - логическое отрицание (НЕ); - импликация (Если … то …) ; - эквивалентность (тогда и только тогда …). Переменные для обозначения любых высказываний: A, B, C, …, X, Y, Z; A 1, A 2 , … , A 3 , …,

Правила построения: Если X и Y – (любые) высказывания, то (а) X & Y Правила построения: Если X и Y – (любые) высказывания, то (а) X & Y (б) X Y (в) X (г) X Y (д) X Y - высказывания. Ничто другое, построенное из высказываний и логических связок, не является высказыванием.

Ср. ЕЯ: В огороде бузина, а в Киеве дядька. (X & Y) Если дважды Ср. ЕЯ: В огороде бузина, а в Киеве дядька. (X & Y) Если дважды два четыре, то Луна сделана из зеленого сыра ( X Y) Ср. : Если в Москве невысокое ограждение, отделяющее тротуар от проезжей части, называется бордюр, то в Петербурге – поребрик. NB: Нет в толковом словаре Ожегова (1991 ) и грамматическом словаре Зализняка (1977), но есть в орфографическом словаре! Примеры применения правил построения: 1) A 2) A & ( B C ) 3) ( A ) ( ? Неверно, что или если 12 делится на 2, то)

Правила логического следования: |— (1 б) X Y |— (1 а) X & Y Правила логического следования: |— (1 б) X Y |— (1 а) X & Y Y & X (*) Y X - симметричность связок & и (ср. с союзом «и» в ЕЯ). (2 а) X & Y |— X В огороде бузина, а в Киеве дядька, следовательно, огороде растет бузина. (2 б) X |— X Y (*) Правила (2) – из частного следует общее. Это основные правила вывода, используемые в ИПС (поиск по ключевым словам) (3) (X Y) & X |— Y Убийца либо Дживс, либо Вустер; но у Дживса алиби, следовательно, убийца Вустер.

(4 а) (X Y) & X |— Y (modus ponens) Если дважды два четыре (4 а) (X Y) & X |— Y (modus ponens) Если дважды два четыре (X ), то Луна сделана из зеленого сыра (Y ) Но дважды два действительно четыре. Следовательно, Луна действительно сделана из зеленого сыра. (4 б) (X Y) & Y |— X (modus tollens) Если дважды два четыре (X ), то Луна сделана из зеленого сыра (Y ) Но Луна НЕ сделана из зеленого сыра ( Y ). Следовательно, дважды два НЕ четыре ( X ). (5 а) X |— X (5 б) X (известный и небезызвестный)

"Женский вариант" modus ponens (А. Н. Колмогоров ? ): Если X, то Y Y приятно --------Следовательно, X истинно

Правила референции: если известна истинность высказываний X и Y, то истинность высказываний X, X Правила референции: если известна истинность высказываний X и Y, то истинность высказываний X, X & Y, X Y определяется таблицами истинности для логических связок.

1) 2) 3) 4) 5) 6) 7) Задание № 5. Определить (представить формулой) логическую 1) 2) 3) 4) 5) 6) 7) Задание № 5. Определить (представить формулой) логическую структуру данных сложных высказываний. Ель растет перед дворцом, а под ней хрустальный дом. В озеро Байкал впадает множество рек и речек, а вытекает из него только одна Ангара. Для организации повторяющихся действий в программах нужно использовать операторы FOR и WHILE. Предисловие предшествует основному тексту, содержит общую характеристику произведения, его оценку и пишется автором произведения или другим лицом. Гравюра изготавливается на камне, доске, линолеуме или металле, ручным или химическим способом. Студент допускается к экзамену только в том случае, если он прошел аттестацию и сдал зачеты. Если однородные члены стоят между подлежащим и сказуемым, причем этим однородным членам предшествует обобщающее слово, то перед однородными членами ставится двоеточие, а после них – тире.

8) Всякое тело продолжает удерживаться в состоянии покоя или равномерного прямолинейного движения, пока и 8) Всякое тело продолжает удерживаться в состоянии покоя или равномерного прямолинейного движения, пока и поскольку оно не понуждается приложенными силами изменить это состояние. 9) Беда, коль пироги начнет печи сапожник, а сапоги тачать пирожник. 10) Кто знатен и силен, да не умен, так худо, ежели и с добрым сердцем он. 11) Не для житейского волненья, не для корысти, не для битв, мы рождены для вдохновенья, для звуков сладких и молитв. 12) В красавиц он уж не влюблялся, а волочился как-нибудь, откажут – мигом утешался, изменят – рад был отдохнуть. 13) Русская аннотация (не более 300 знаков) предшествует основному тексту, не содержит заголовка, набирается по всей ширине страницы, шрифт Times New Roman (Cyr), размер (кегль) - 10 пунктов, отступы слева и справа по 1, 5 см, абзацный отступ - 8 мм, межстрочный интервал одинарный, выравнивание по ширине.

Пример: Ель растет перед дворцом, а под ней хрустальный дом. A & B A Пример: Ель растет перед дворцом, а под ней хрустальный дом. A & B A – Ель растет перед дворцом. B – Под елью находится хрустальный дом. NB: Раскрываются все смысловые пропуски и неопределенности; в частности, местоимения заменяются полнозначными словами.

Задание № 6 Привести пример высказывания, соответствующего каждой из данных логических формул. 1) X Задание № 6 Привести пример высказывания, соответствующего каждой из данных логических формул. 1) X ( Y & Z ) 2) X ( Y Z ) 3) X & ( Y Z ) 4) ù X ù Z Пример: (X & Y) Z Если число делится на 2 и на 3, то оно делится на 6. X - Число делится на 2. Y - Число делится на 3. Z - Число делится на 6.

2. 2. Логика предикатов - Является расширением языка логики высказываний. Что такое с логической 2. 2. Логика предикатов - Является расширением языка логики высказываний. Что такое с логической точки зрения свойство и отношение? Как из терминов можно строить высказывания; какие логические выводы это позволяет делать? Словарь: Предикатные термы : P(n), P 1(n 1) , P 2(n 2) , P 3(n 3) , …; ( R ) Целое число (n) определяет число характеризуемых объектов; его называют местностью (числом мест, арностью) предиката. Индивидные (объектные) переменные: x, y, z ; x 1 , x 2 , x 3 , … Индивидные константы (имена объектов): a, b, c ; a 1 , a 2 , a 3 , … Кванторы: - квантор общности (все, всякий, каждый, любой) ; - квантор существования (существует, некоторые). (возможно также количественные : ! 2 и т. д. ) (+ все элементы словаря логики высказываний!)

Правила построения. Правила А) – подстановка индивидных констант: Если P(1) – одноместный предикат, x, Правила построения. Правила А) – подстановка индивидных констант: Если P(1) – одноместный предикат, x, a -индивидная переменная и индивидная константа, то: P(1) ( x ) – высказывательная форма с одной свободной переменной, P(1) ( a ) – простое высказывание. (Для одноместных предикатов указание местности опускают как правило; для двух и более местных – если число мест ясно из контекста употребления. ) Примеры: Сократ – человек; Пушкин – поэт. x – человек. (высказывательная форма) Аналогия с грамматическим уровнем: a – подлежащее, P – сказуемое

В общем виде: Если то: P(n) – n-местный предикат, a 1 , a 2 В общем виде: Если то: P(n) – n-местный предикат, a 1 , a 2 , … , an -индивидные константы, x 1 , x 2 , … , xn -индивидные переменные, P(n) ( a 1 , a 2 , … , an ) – простое высказывание, P(n) (x 1 , x 2 , … , xn ) – высказывательная форма с n свободных переменных. Примеры: Петербург севернее Москвы. P(2) ( a 1 , a 2 ); R ( a 1 , a 2 ) Бологое находится между Петербургом и Москвой. 7 > 5; 7 = 5; 7 < 5 P(3) ( a 1 , a 2 , a 3 )

Б) В дополнение к правилам логики высказываний: Если A(x 1 , x 2 , Б) В дополнение к правилам логики высказываний: Если A(x 1 , x 2 , … , xn ), B(y 1 , y 2 , … , ym ) – высказывательные формы, то A(x 1 , x 2 , … , xn ) – высказывательная форма с n свободных переменных; A(…) & B(…), A(…) B(…), A(…) B(…) – высказывательные формы c q свободными переменными, где q <= n + m есть число различных свободных переменных в наборе x 1 , x 2 , … , xn ; y 1 , y 2 , … , ym. Например, A ( x, y ) & B ( y, z ) - высказывательная форма c тремя свободными переменными

Правила В): Если P ( x ) – высказывательная форма с одной свободной переменной, Правила В): Если P ( x ) – высказывательная форма с одной свободной переменной, то: x P ( x ), x P ( x ) – простые высказывания. Переменная x здесь называется связанной переменной. В общем виде: Если A(x 1 , x 2 , … , xn ) – высказывательная форма с n свободных переменных то K 1 x 1 K 2 x 2 …Knxn A( x 1 , x 2 , … , xn ), где каждый Ki – любой из кванторов , , - простое высказывание.

Язык ЛП без индивидных констант В этом случае словарь содержит только предикатные константы, индивидные Язык ЛП без индивидных констант В этом случае словарь содержит только предикатные константы, индивидные переменные и кванторы. Пушкин – поэт a) P( a ) b) x ( A( x ) & B( x ) )

Правила логического следования: (1) x P ( …x… ) |— P ( …a… ) Правила логического следования: (1) x P ( …x… ) |— P ( …a… ) (2) P ( …a… ) |— x P ( …x… ) (1 а) x P ( …x… ) |— x P ( …x… ) (3 а) x P ( …x… ) |— |— x P ( …x… ) x P ( …x… ) |— x P ( …x… ) – если для всех, то и для каждого… следовательно: (3 б) x P ( …x… ) следовательно: (3 в) x P ( …x… )

(4) x y R ( x, y ) |— y x R ( x, (4) x y R ( x, y ) |— y x R ( x, y ) - правило перестановки кванторов Сравним: x y ( x > y ) и y x ( x > y ) Сравним также: a) Всякий кот [когда-нибудь] охотился за какой-нибудь мышью. b) Какая-нибудь мышь [когда-нибудь] преследуется всяким котом

Установление соответствия с выражениями ЕЯ. Примеры: Кентавры существуют. x P ( x ) Встречаются Установление соответствия с выражениями ЕЯ. Примеры: Кентавры существуют. x P ( x ) Встречаются белые слоны. x ( P 1 ( x ) & P 2( x ) ) Все металлы электропроводны. x ( P 1 ( x ) P 2( x ) ) - формальная импликация Все [числа] делятся друг на друга. x y D ( x, y ) Существует, по крайней мере, одна пара [чисел], таких, что первое делится на второе. x y D ( x, y ) Каждый автомобиль (P 1 ) имеет [частью] (R ) двигатель (P 2 ). x ( P 1 ( x ) y ( P 2( y ) & R ( x, y ) ) )

Главные проблемы перевода: 1) Как отличить собственные имена от предикатов? (Иваны, не помнящие родства. Главные проблемы перевода: 1) Как отличить собственные имена от предикатов? (Иваны, не помнящие родства. Какая Марья без Ивана? ) "Настоящие имена", используемые в учебниках логики: • числа (2<5); • собственные имена хорошо известных объектов ( [Всякий? ] Пушкин - поэт) 2) Все vs Существуют? (В особенности – при отсутствии явного выражения кванторной информации в ЕЯ-тексте. Сравни: Собаки лают. Медь электропроводна) 3) Границы терминов. (Сравни: делится на; жесткий диск; электролитическая медь; президент США, водитель трамвая)

Задание № 7 Перевести на русский язык и оценить истинность данных высказываний. 1) x Задание № 7 Перевести на русский язык и оценить истинность данных высказываний. 1) x y ( ù P ( x ) ( B ( y, 1 ) & D ( x, y ) ) 2) x y ( ( P ( x ) & P ( y ) ) D ( x, y ) ) 3) x ( ( P ( x ) V y ( y < > x & D ( x, y ) ) ) 4) x ( P ( x ) y ( P ( y ) & B ( y, x ) ) ) Интерпретация предикатных символов: P ( x ) D ( x, y ) B ( x, y ) – x - простое число – x делится на y – x больше y

Задание № 8 Представить формулой логики предикатов структуру данных сложных высказываний (границы терминов указаны Задание № 8 Представить формулой логики предикатов структуру данных сложных высказываний (границы терминов указаны скобками). Пример: (Предисловие) (предшествует) (основному тексту), (содержит) (общую характеристику произведения), его (оценку) и (пишется) (автором произведения) или (другим лицом). " x ( ПРЕДИСЛОВИЕ ( x ) $ y $ z $ u $ v $ w( ОСНОВНОЙ_ТЕКСТ ( y ) & ПРЕДШЕСТВУЕТ ( x, y ) & ОБЩАЯ_ХАРАКТЕРИСТИКА_ПРОИЗВЕДЕНИЯ ( z ) & СОДЕРЖИТ ( x, z ) & ОЦЕНКА ( u ) & СОДЕРЖИТ ( x, u ) & ( (АВТОР_ПРОИЗВЕДЕНИЯ ( v ) & ПИШЕТ ( v, x )) ( АВТОР_ПРОИЗВЕДЕНИЯ ( w ) & ПИШЕТ ( w, x )) ) )

1) Если (число) (делится на) 2 и на 3, то оно делится на 6. 1) Если (число) (делится на) 2 и на 3, то оно делится на 6. 2) (Ель) (растет перед) (дворцом), а (под) ней (хрустальный) (дом). 3) В (красавиц) (он) уж не (влюблялся), а (волочился как-нибудь), (откажут) – (мигом утешался), (изменят) – (рад был отдохнуть). 4) Если (однородные члены) (стоят между) (подлежащим) и (сказуемым), причем этим однородным членам (предшествует) (обобщающее слово), то (перед [однородными членами] ставится) (двоеточие), а (после) них – (тире).

3. Специализированные языки представления знаний в информационных технологиях 4. 1. Семантические сети. 4. 2. 3. Специализированные языки представления знаний в информационных технологиях 4. 1. Семантические сети. 4. 2. Фреймовые и продукционные языки 4. 3. ЯПЗ в сетевых технологиях

4. 1. Семантические сети. Семантическая сеть с формальной точки зрения есть ориентированный граф с 4. 1. Семантические сети. Семантическая сеть с формальной точки зрения есть ориентированный граф с именованными дугами. Используются словарные и фактографические семантические сети. Словарная сеть есть графическое представление концептуального словаря. Представляет парадигматические отношения между понятиями. Последние годы формализованные понятийные словари чаще называются онтологиями. Фактографическая сеть отображает ситуацию, описывающую совокупность индивидуальных объектов.

Фактографическая сеть – удобный способ представления т. наз. нарративных текстов. Ср. Мюллер: narrative – Фактографическая сеть – удобный способ представления т. наз. нарративных текстов. Ср. Мюллер: narrative – 1) рассказ, повествование; 2) изложение фактов. На берегу пустынных волн Стоял он, дум великих полн, И вдаль глядел. Пред ним широко Река неслася; бедный челн По ней стремился одиноко. По мшистым, топким берегам Чернели избы здесь и там, Приют убого чухонца; И лес, неведомый лучам В тумане спрятанного солнца, Кругом шумел. И думал он: …

Узлы фактографической сети могут представлять: • объекты предметной области; • процессы, действия, события, относящиеся Узлы фактографической сети могут представлять: • объекты предметной области; • процессы, действия, события, относящиеся к объектам предметной области; • статические отношения. • в некоторых нотациях - значения числовых, строковых и нормативно-оценочных признаков, характеризующих объекты. Узел определяется семантической категорией и множеством приписанных ему термов.

Дуги сети могут представлять: • ролевые отношения при узле–предикате, представляющем процесс, действие, событие, отношение; Дуги сети могут представлять: • ролевые отношения при узле–предикате, представляющем процесс, действие, событие, отношение; • некоторые предметные отношения между объектами, которые, как правило, систематически выражаются в русских текстах (и текстах на других европейских языках) грамматическими средствами: часть-целое (HAP), локализация (LOC), внутри (IN), … • иногда - связи типа признак – значение и др. "функциональные" связи.

Пример. Жил старик со своею старухой у самого синего моря. Они жили в ветхой Пример. Жил старик со своею старухой у самого синего моря. Они жили в ветхой землянке ровно тридцать лет и три года. Старик ловил неводом рыбу, старуха пряла свою пряжу.

Семантическую сеть такого типа можно интерпретировать как ограниченный логический язык. Для фразы Старик ловил Семантическую сеть такого типа можно интерпретировать как ограниченный логический язык. Для фразы Старик ловил неводом рыбу, старуха пряла свою пряжу: $ x$ y$ z$ u$ w ( СТАРИК ( x ) & ( РЫБА ( y ) & НЕВОД ( z ) & ЛОВИЛ ( SUB 1: x, OB: y, INS: z ) & СТАРУХА ( u ) & ПРЯЖА (w ) & ПРЯЛА ( SUB 1: u, OB: w ) ) Основные ограничения: • используются только кванторы существования; • используются только связки И, ИЛИ;

 Техника кодирования: табличное представление семантической сети. a) Узлы: Техника кодирования: табличное представление семантической сети. a) Узлы:

б) Кодирование дуг: б) Кодирование дуг:

Задание № 11 Представить в виде семантической сети (граф и таблицы) указанный фрагмент текста Задание № 11 Представить в виде семантической сети (граф и таблицы) указанный фрагмент текста (только выделенные курсивом фрагменты). Милиционеры расстреляли трактор. Это произошло в городе Щигры Курской области. Водитель трактора марки Т-150 К, сворачивая на главную улицу города, не удержался на сидении и рухнул под колеса. Трактор переехал своего хозяина и понесся по улице – у него заклинило коробку передач. По пути он повалил несколько деревьев и был готов сравнять с землей все деревянные дома. Усмирять железного коня пришлось милиционерам из местного РОВД. Сначала сотрудник милиции стрелял из табельного пистолета по шинам, но не попал. Затем выпустил очередь из автомата в топливопроводы двигателя, и тогда машина, наконец, остановилась. Водитель, по которому проехали колеса трактора, жив-здоров и отделался легкими царапинами. Кстати, в базах данных экстрасенсов город Щигры значится "аномальной зоной".

4. 2. Фреймовые и продукционные языки 4. 2. 1. Продукционные языки. Используются для представления 4. 2. Фреймовые и продукционные языки 4. 2. 1. Продукционные языки. Используются для представления законов (зависимостей между свойствами, событиями, процессами). Основной единицей продукционного языка является утверждение вида A B ( Если A, то B ), которое и называется продукцией или правилом. Факты для такого набора правил используются как исходный материал, перерабатываемый в какие то полезные – с точки зрения поставленной задачи – выводы.

Продукционные языки используются при решении таких задач, которые не могут быть решены известными в Продукционные языки используются при решении таких задач, которые не могут быть решены известными в математике вычислительными методами, требуют учета неколичественных зависимостей. Продукционные языки используются в экспертных системах, ориентированных на получение выводов в условиях неполноты или неточности имеющихся знаний. Для экспертных систем характерны следующие типы задач: • выбор наиболее целесообразного плана действий; • объяснение наблюдаемых фактов в условиях отсутствия полных математических моделей для рассматриваемого класса явлений (например, в общественно-экономической сфере); • предсказание наиболее вероятного развития событий (результата); • диагностика технических неисправностей и заболеваний.

Типы решаемых задач (Ф. Хейес-Рот и др. , 1983). 1. Интерпретация: Анализ наблюдаемых данных Типы решаемых задач (Ф. Хейес-Рот и др. , 1983). 1. Интерпретация: Анализ наблюдаемых данных с целью определения их смысла. (Данные могут быть зашумленными и содержать ошибки). Пример: обнаружение месторождений полезных ископаемых по данным геологических и геофизических наблюдений. Пример: система PROSPECTOR помогла обнаружить месторождение молибдена стоимостью $100 млн. 2. Диагностика: Процесс поиска неисправности в технической системе или определение стадии заболевания в живой системе, основанный на интерпретации данных наблюдения 3. Проектирование: Построение конфигурации объекта при ограничениях. Пример: проектирование микропроцессоров. 4. Мониторинг: Сравнение наблюдений с критическими точками плана.

5. Отладка и ремонт: Выработка рекомендаций по устранению неисправностей; построение плана реализации рекомендаций 6. 5. Отладка и ремонт: Выработка рекомендаций по устранению неисправностей; построение плана реализации рекомендаций 6. Обучение: Диагностика, отладка и исправление поведения ученика 7. Управление: Интерпретация, прогноз, ремонт и мониторинг поведения сложной системы. Продукционные языки используются в так наз. непроцедурных языках программирования. Самый известный и самый популярный из них – язык –ПРОЛОГ. В таких языках программа содержит только набор исходных данных и описание требуемого результата (как в школьной математической задаче). Алгоритм решения задачи определяет сама программа.

4. 2. 2. Фреймовые языки. Frame – рамка, схема. В инженерии знаний фрейм - 4. 2. 2. Фреймовые языки. Frame – рамка, схема. В инженерии знаний фрейм - это схема описания типовой ситуации (или класса объектов), содержащая ряд переменных. Схема состоит из имени фрейма и набора признаков (слотов) значения, которых оставлены пустыми. (Для значений могут быть задан допустимый тип, априорные ограничения, зависимости и т. п. ) Значениями некоторых слотов могут быть другие фреймы – т. е. , фреймы могут вкладываться друг в друга. Заполненный фрейм называют экземпляром фрейма. Фреймовые языки используются для представления фактов в хорошо структурированных областях. Один из самых популярных языков такого типа – FRL.

Пример. Ф 1: Юридический договор: – агент1: <юридическое лицо> – агент2: <юридическое лицо> – Пример. Ф 1: Юридический договор: – агент1: <юридическое лицо> – агент2: <юридическое лицо> – предмет договора: <экономическое действие> – дата заключения: <дата> – кто засвидетельствовал: <юридическое лицо - нотариус> – … Ф 2: Юридическое лицо: – – наименование: <строка> юридический адрес: <адрес> телефон: <номер телефона> тип: <список: АО, ЗАО, ООО, индивидуальный предприниматель, ГУП, фонд, орган власти, …> – …

Пример. Ф 3: Экономическое действие: – вид действия: <список: поставка, строительство, аренда, лизинг, безвозмездная Пример. Ф 3: Экономическое действие: – вид действия: <список: поставка, строительство, аренда, лизинг, безвозмездная передача, наем на работу, …> – …

4. 3. ЯПЗ в сетевых технологиях • KIF: Knowledge Interchange Format. KIF is a 4. 3. ЯПЗ в сетевых технологиях • KIF: Knowledge Interchange Format. KIF is a language designed for use in the interchange of knowledge among disparate (несопоставимый) computer systems • Cyc. L: The Cyc Representation Language • UNL: The Universal Networking Language • RDF: Resource Description Framework. • OWL – Web Ontology Language

The Cyc. L Representation Language CYC® is a very large, multi-contextual knowledge base and The Cyc. L Representation Language CYC® is a very large, multi-contextual knowledge base and inference engine developed by Cycorp. The goal of the CYC® project is to break (преодолеть) the "software brittleness bottleneck (узкие места)" once and for all by constructing a foundation of basic "common sense" knowledge - a semantic substratum of terms, rules, and relations--that will enable a variety of knowledge-intensive products and services. CYC® is intended to provide (обеспечить) a "deep" layer (уровень) of understanding that can be used by other programs to make them more flexible.

RDF: Resource Description Framework. Текущее состояние Web характеризуется слабой структурой данных, низким уровнем их RDF: Resource Description Framework. Текущее состояние Web характеризуется слабой структурой данных, низким уровнем их взаимосвязи. Он развивается очень быстрыми темпами, но с его развитием возникает ряд проблем: 1. Проблема интеллектуализации Интернета (качественный поиск информации) 2. Проблема семантического преобразования данных и взаимодействия с документами на семантическом уровне. 3. Проблема интеграции и сравнения информации.

Ответом на эти проблемы считают проект «Семантический Веб» ( «Semantic Web» ) «Semantic Web Ответом на эти проблемы считают проект «Семантический Веб» ( «Semantic Web» ) «Semantic Web - это расширение Web, в котором информации придается определенная семантика, что позволит людям и машинам работать вместе» [Tim Berners-Lee]. Целью этого проекта является внедрение в Web таких технологий, которые позволят существенно повысить уровень интеграции информации, обеспечить развитую машинную обработку данных, дадут возможность выдавать более адекватные ответы на поисковые запросы и т. д. Языком описания документов и данных в проекте Semantic Web является RDF должен объединить информацию из различных источников, включая базы данных и системы инженерии знаний. Он обеспечивает совместное использование информации, смысл которой может одинаково интерпретироваться различными программами.

The Resource Description Framework (RDF) is a language for representing information about resources in The Resource Description Framework (RDF) is a language for representing information about resources in the World Wide Web. RDF can also be used to represent information about things that can be identified on the Web, even when they cannot be directly retrieved on the Web. Examples include information about items available from on -line shopping facilities (e. g. , information about specifications, prices, and availability), or the description of a Web user's preferences for information delivery. RDF is based on the idea of identifying things using Web identifiers (called Uniform Resource Identifiers, or URIs / URIref ). RDF основан на языке разметки XML (RDF есть XML-приложение)

 Язык RDF Основная концепция в RDF – описание ресурса через совокупность свойств, называемых Язык RDF Основная концепция в RDF – описание ресурса через совокупность свойств, называемых RDF-описанием. Каждое из этих свойств имеет тип и значение. Любой ресурс может быть описан с помощью RDF, пока ресурс опознается в сети с помощью URI как показано на рисунке.

Основа RDF-выражения – тройка вида <S, P, O>: • S - объект описания (subject). Основа RDF-выражения – тройка вида : • S - объект описания (subject). • P – имя свойства, описывающего объект (predicate). • O - значение этого свойства (object). An RDF triple contains three components: the subject, which is an RDF URI reference or a blank node the predicate, which is an RDF URI reference the object, which is an RDF URI reference, a literal or a blank node An RDF triple is conventionally written in the order subject, predicate, object. The predicate is also known as the property of the triple.

Пример: Документ RDF Primer имеет дату создания, значение которой - 10 февраля 2004 Это Пример: Документ RDF Primer имеет дату создания, значение которой - 10 февраля 2004 Это утверждение структурируется следующим образом: • Субъект документ, который зарегистрирован в сети по адресу http: //www. w 3. org/TR/2004/REC-rdf-primer-20040210 • Свойство • (свойство дата создания); берется из словаря свойств, хранящегося по адресу http: //www. example. org/terms/creation-date • Объект (Значение) - 10 февраля 2004

Эту тройку можно представить в виде RDF-описания: <http: //www. w 3. org/TR/2004/REC-rdf-primer-20040210> <http: //www. Эту тройку можно представить в виде RDF-описания: "10 февраля 2004" Существует развернутый и сокращенный RDF-синтаксис. Сокращенный синтаксис использует короткие префиксы вместо постоянно используемых сетевых адресов: xmlns: rdf-primer = "http: //www. w 3. org/TR/2004/REC-rdf-primer 20040210" xmlns: exterms = "http: //www. example. org/terms/" rdf-primer exterms: creation-date "10 февраля 2004" rdf-primer exterms: creator "John Smith " rdf-primer exterms: language "en"

"there is a Person identified by http: //www. w 3. org/People/EM/contact#me, whose name is Eric Miller, whose email address is em@w 3. org, and whose title is Dr. "