
KL-Lec17.ppt
- Количество слайдов: 44
АВТОМАТИЧНИЙ СЕМАНТИЧНИЙ АНАЛІЗ ОБЧИСЛЮВАЛЬНА СЕМАНТИКА ЛЕКЦІЯ № 17
СЕМАНТИЧНИЙ АНАЛІЗ ЦЕ ПРОЦЕС ОБРОБКИ ВХІДНИХ ЛІНГВІСТИЧНИХ ДАНИХ ШЛЯХОМ ВСТАНОВЛЕННЯ ДЛЯ ЦИХ ДАНИХ ПРЕДСТАВЛЕННЯ ЗНАЧЕННЯ (СМИСЛУ). ◦ РІЗНІ СПОСОБИ СЕМАНТИЧНОГО АНАЛІЗУ МОЖУТЬ ВИКОРИСТОВУВАТИ АБО І НЕ ВИКОРИСТОВУВАТИ РЕЗУЛЬТАТИ СИНТАКСИЧНОГО АНАЛІЗУ ◦ РОЗГЛЯДАЄМО ПІДХІД НА ОСНОВІ ВИКОРИСТАННЯ СИНТАКСИЧНОГО АНАЛІЗУ ПІДХІД НА ОСНОВІ ПРИНЦИПУ КОМПОЗИЦІЙНОСТІ Speech and Language Processing Jurafsky and Martin 2/12/2018 2
ПРИНЦИП КОМПОЗИЦІЙНОСТІ ◦ ЗНАЧЕННЯ ВИРАЗУ ЦЕ ФУНКЦІЯ ЗНАЧЕНЬ ЙОГО ЧАСТИН І СПОСОБУ ЇХ СИНТАКСИЧНОЇ КОМБІНАЦІЇ ЩО РОЗУМІЄМО ПІД ЧАСТИНАМИ ВИРАЗУ? ◦ СКЛАДНИКИ (БЕЗПОСЕРЕДНІ СКЛАДОВІ) СИНТАКСИЧНОЇ СТРУКТУРИ, ЯКА Є ВХІДНИМИ ДАНИМИ ЩО ОЗНАЧАЄ - СКЛАДНИК МАЄ ЗНАЧЕННЯ? ЯКІ ЗНАЧЕННЯ МОЖУТЬ МАТИ ЦІ ЧАСТИНИ І ЗВІДКИ ЇХ МОЖНА ОТРИМАТИ? ЯКІ ВЛАСТИВОСТІ ПОВИННІ МАТИ ЦІ ЗНАЧЕННЯ ДЛЯ ОБ’ЄДНАННЯ У БІЛЬШІ ЗНАЧЕННЯ Speech and Language Processing Jurafsky and Martin 2/12/2018 3
ПРИКЛАД 2/12/2018 Franco likes Frasca. Speech and Language Processing - Jurafsky and Martin 4
АНАЛІЗ НА ОСНОВІ КОМПОЗИЦІЙНОСТІ Speech and Language Processing Jurafsky and Martin 2/12/2018 5
ЗБАГАЧЕННЯ (аугмент) ПРАВИЛ 2/12/2018 ЗАБЕЗПЕЧИТИ ЗДІЙСНЕННЯ АНАЛІЗУ МОЖНА ДОДАВШИ ДО ПРАВИЛ КОНТЕКСТНО-ВІЛЬНОЇ ГРАМАТИКИ ПРАВИЛА ФОРМУВАННЯ СЕМАНТИКИ ФОРМАЛЬНО РОЗУМІЄМО - СЕМАНТИКА ДОДАНА ДО А ВИЗНАЧАЄТЬСЯ НА ОСНОВІ ФУНКЦІЇ ВІД СЕМАНТИКИ СКЛАДОВИХ ЧАСТИН A. Speech and Language Processing - Jurafsky and Martin 6
ПРИКЛАД ПРОСТІ СКЛАДНИКИ ◦ NP -> Prop. Noun ◦ Prop. Noun -> Frasca ◦ Prop. Noun -> Franco ДОДАТКИ {Prop. Noun. sem} {Frasca} {Franco} Speech and Language Processing Jurafsky and Martin 2/12/2018 7
ПРИКЛАД S -> NP VP VP -> Verb NP Verb -> like {VP. sem(NP. sem)} {Verb. sem(NP. sem) ? ? ? Speech and Language Processing Jurafsky and Martin 2/12/2018 8
ВИКОРИСТОВУЮЧИ ЛЯМБДАНОТАЦІЮ Speech and Language Processing Jurafsky and Martin 2/12/2018 9
ЛЯМБДА-НОТАЦІЯ ТА РЕДУКЦІЯ Speech and Language Processing Jurafsky and Martin 2/12/2018 10
ПРОБЛЕМИ ◦ НЕУЗГОДЖЕНІСТЬ (НЕВІДПОВІДНІСТЬ) СИНТАКСИСУ І СЕМАНТИКИ РОЗМІЩЕННЯ АРГУМЕНТІВ СКЛАДНІ NPs З КВАНТОРАМИ Speech and Language Processing Jurafsky and Martin 2/12/2018 11
ДОПОВНЕННЯ СИНТАКСИЧНИХ ПРАВИЛ (ПРИКЛАД 1) Maharani closed. Closed (Maharani) – ОЧІКУВАНЕ ПРЕДСТАВЛЕННЯ РУХАЄМОСЯ ЗНИЗУ-ВВЕРХ ПО ПРАВИЛАХ ЯКІ ФОРМУЮТЬ РЕЧЕННЯ (ПРЕДСТАВЛЕННЯ ЗНАЧЕННЯ РЕЧЕННЯ ) Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
ДОПОВНЕННЯ СИНТАКСИЧНИХ ПРАВИЛ (ПРИКЛАД 1) ПРАВИЛО ДЛЯ NP МІСТИТЬ ОДИН СКЛАДНИК І ПРИЙМАЄ (КОПІЮЄ) ЙОГО СЕМАНТИКУ Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
ДОПОВНЕННЯ СИНТАКСИЧНИХ ПРАВИЛ (ПРИКЛАД 1) ДОПОВНЕННЯ ПРАВИЛА ДЛЯ ДІЄСЛОВА ПОВИННО МІСТИТИ ІМ’Я ПРЕДИКАТУ , ЙОГО АРНІСТЬ ТА СПОСІБ ВКЛЮЧЕННЯ (ПРИЄДНАННЯ ) АРГУМЕНТА λ-НОТАЦІЯ ВИКОРИСТОВУЄТЬСЯ ДЛЯ ОПИСУ ЗА ДОПОМОГОЮ ЗМІННОЇ x НЕВИЗНАЧЕНОГО ПРЕДМЕТУ, ЩО ЗАКРИВАЄТЬСЯ Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
ДОПОВНЕННЯ СИНТАКСИЧНИХ ПРАВИЛ (ПРИКЛАД 1) ОСКІЛЬКИ VP. sem λ- ВИРАЗ ТО ЗДІЙСНИВШИ РЕДУКЦІЮ ОТРИМУЄМО Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
ДОПОВНЕННЯ СИНТАКСИЧНИХ ПРАВИЛ (СКЛАДНИЙ NP) Every restaurant closed. Вплив семантики іменникового виразу, який є підметом – значний порівняно з попереднім прикладом В представленні значення цього речення семантика, яку вносить NP вираз переплітається з семантикою VP виразу і для використання λредукції потрібно приготуватися Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
ДОПОВНЕННЯ СИНТАКСИЧНИХ ПРАВИЛ (СКЛАДНИЙ NP) Every restaurant ВСЕ Є РЕСТОРАНОМ, а потрібно виразите те, що говориться щось про всі ресторани, для чого і використовується таке словосполучення Вводимо фіктивний предикат, який буде використовуватися для представлення цього nuclear scope Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
ДОПОВНЕННЯ СИНТАКСИЧНИХ ПРАВИЛ (СКЛАДНИЙ NP) Для того щоб цей вираз передавав значення потрібно замінити Q на логічний вираз, який відповідає nuclear scope Використовуємо можливості λ- числення і отримуємо Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
ДОПОВНЕННЯ СИНТАКСИЧНИХ ПРАВИЛ (СКЛАДНИЙ NP) Правила граматики з семантичними доповненнями для формування представлення значення NP виразу Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
ДОПОВНЕННЯ СИНТАКСИЧНИХ ПРАВИЛ (СКЛАДНИЙ NP) • Критичний крок - проведення λ-редукції в правилі для NP. Згідно цього правила потрібно застосувати λ-вираз, який є доповненням до Det до семантичного розширення Nominal, який також є λ-виразом. • Послідовність кроків проведення редукції Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
ДОПОВНЕННЯ СИНТАКСИЧНИХ ПРАВИЛ (СКЛАДНИЙ NP) NP – λ-вираз і тому доцільно його розглядати як функтор зі значенням VP виразу, як його аргументом семантичне розширення дієслова яке перейде у семантичне значення VP виразу (неперехідне дієслово) Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
ДОПОВНЕННЯ СИНТАКСИЧНИХ ПРАВИЛ (СКЛАДНИЙ NP) Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
ДОПОВНЕННЯ СИНТАКСИЧНИХ ПРАВИЛ (МОДИФІКАЦІЇ В ПРИКЛАДІ1) Потрібно пересвідчитись чи працює перший приклад і врахувати зміни у правилі для S PROPER NOUN Перетворення простої константи у λ- вираз Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
ДОПОВНЕННЯ СИНТАКСИЧНИХ ПРАВИЛ (СКЛАДНИЙ NP) Чи буде працювати запропонований підхід у випадку з перехідним дієслівним виразом Matthew opened a restaurant. Потрібно розширити правила для a та open Аналогічно до every P та Q λ- змінні для врахування restriction і nuclear scopes, які будуть заповнені пізніше Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
ДОПОВНЕННЯ СИНТАКСИЧНИХ ПРАВИЛ (СКЛАДНИЙ NP) a restaurant Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
ДОПОВНЕННЯ СИНТАКСИЧНИХ ПРАВИЛ (СКЛАДНИЙ NP) Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
ФРАГМЕНТ ГРАМАТИКИ Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
ОБЛАСТЬ ДІЇ КВАНТОРА Чи буде працювати розроблена граматика у випадку прикладів подібних до Every restaurant has a menu. На основі правил граматики можна вивести Але можливе і таке представлення Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
ОБЛАСТЬ ДІЇ КВАНТОРА Неоднозначність зумовлює порядок редукції виразів, що визначені у правилах граматики Для уникнення таких явищ потрібно Мати можливість створювати представлення які будуть охоплювати всі можливі способи прочитання без їх явного перелічення Мати засоби генерувати або встановлювати всі можливі прочитання з таких представлень Мати можливість вибрати одне прочитання (потрібно використовувати контекст та знання про світ) Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
СКЛАДНИКИ ЩО ВПЛИВАЮТЬ НА ЗАГАЛЬНЕ ЗНАЧЕННЯ Якими мають бути (з чого мають складатися) семантичні вирази, які додаються до синтаксичних складників Розглянемо has, every restaurant, a menu Таке загальне представлення дає інформацію про те яким чином можуть комбінуватися представлення Cooper storage – спосіб збереження представлень, які відповідають вузлам дерева Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
ЗБЕРЕЖЕННЯ ПРЕДСТАВЛЕНЬ ОДИН ВУЗОЛ ДЕРЕВА – ОДНЕ ПРЕДСТАВЛЕННЯ ОДИН ВУЗОЛ ДЕРЕВА – ВСІ МОЖЛИВІ ПРЕДСТАВЛЕННЯ Вершині дерева буде відповідати λ ВИРАЗИ (NP ВИРАЗИ) КОМБІНУЮТЬСЯ З ОСНОВНИМ ПРЕДСТАВЛЕННЯМ В ДОВІЛЬНОМУ (індексованому) ПОРЯДКУ І ЦІ ВИРАЗИ БЕРУТЬСЯ З ВУЗЛІВ ДЕРЕВА (НИЖЧИХ) Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
ПОВНЕ ЗНАЧЕННЯ (ПРЕДСТАВЛЕННЯ) Індекси змінних s 1 та s 2 дозволяють правильно приєднати аргументи Для отримання повного представлення вибирається один з елементів і здійснюється редукція з основним представленням СПОЧАТКУ ОБРОБЛЯЄМО ДРУГИЙ ВИРАЗ Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
ПОВНЕ ЗНАЧЕННЯ (ПРЕДСТАВЛЕННЯ) ОБРОБЛЯЄМО ПЕРШИЙ ВИРАЗ ЗМІНА ПОРЯДКУ ОБРОБКИ ПРИВОДИТЬ ДО ІНШОГО ПРЕДСТАВЛЕННЯ Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
ПРОБЛЕМИ ЗМІНА ПОРЯДКУ ОБРОБКИ ПРИВОДИТЬ ДО РІЗНИХ ПРЕДСТАВЛЕНЬ РЕЧЕННЯ МОЖЕ МІСТИТИ НЕ ДВА СКЛАДНІ NP-ВИРАЗИ А БІЛЬШЕ ВРАХОВУЮТЬСЯ ТІЛЬКИ НЕОДНОЗНАЧНОСТІ, ЯКІ ВИНИКАЮТЬ НА ОСНОВІ ІМЕННИКОВИХ ВИРАЗІВ Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
http: //www. pravda. com. ua/columns/2 011/05/1/6155721/ Сьогодні їхня влада тримається тільки завдяки тому, що на руїнах загальнолюдських цінностей, як ви їх не формулюйте – чи "свобода, рівність, братерство" чи "свобода, справедливість, солідарність", чи ще як – вони утвердили свою тріаду – "прагматизм (насправді цинізм), комфорт, гламур". Не капіталісти, а саме вони, менеджери, "прагматики" встановили принцип: "якщо ти не маєш мільйона доларів – ти лайно". … щоб забезпечувати функціонування високотехнологічного виробництва, треба не тільки клепку мати, а і жити в режимі наднапруги. А навіщо? … Чим ламати собі голову, як налагодити отримання прибутку з верстата з числовим програмовим управлінням, простіше порізати його на металобрухт вкупі з усім іншим устаткуванням. А виробничі площі здавати в оренду і забезпечити собі окремо взятий комунізм… Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
ПІДХІД НА ОСНОВІ ОБМЕЖЕНЬ Every restaurant did not close. Підхід на основі збереження представлень не працює або потребує додаткових механізмів Інша проблема: неможливо накласти обмеження на можливі варіанти заповнення Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
HOLE SEMANTICS Замінити змінні на дірки (holes) Додати мітки(labels) до всіх кандидатів (FOL виразів) При побудові повного представлення всі дірки повинні бути заповнені промаркованими виразами Домінуючі обмеження дозволяють вказати яка мітка які дірки може заповнювати l≤h – вираз діркою домінує над виразом з міткою Вираз який містить h обов'язково повинен мати l, як свою частину Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
HOLE SEMANTICS Every restaurant has a menu Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
HOLE SEMANTICS Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
HOLE SEMANTICS Заповнюємо дірку h 0 Кандидати на заповнення l l Якщо довільно обрати l та позначити це P()= то згідно накладених обмежень Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
HOLE SEMANTICS Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
HOLE SEMANTICS Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
HOLE SEMANTICS ПЕРЕВАГИ Підхід не орієнтується на якісь визначені граматичні конструкції або джерела неоднозначностей Дірками і мітками можуть бути довільні частити виразу в термінах логіки першого порядку Домінуючі обмеження це потужний засіб накласти обмеження на небажані інтерпретації представлення значення Такі обмеження вказуються в доповненнях до лексичних одиниць чи до правил граматики Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
НЕОБХІДНО ПРОЧИТАТИ Daniel Jurafsky, James H. Martin Speech and Language Processing: an Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition - Second Edition Prentice Hall, 2008 -988. – Розділ, 18 ст. 583 - 610. Комп'ютерна лінгвістика (2010) Романюк А. Б. 2/12/2018
KL-Lec17.ppt