Скачать презентацию Ин яз им М Тореза Новые информационные технологии Скачать презентацию Ин яз им М Тореза Новые информационные технологии

Лекция 42.ppt

  • Количество слайдов: 43

Ин. яз. им. М. Тореза Новые информационные технологии Харламов Александрович © 2012 МГЛУ Ин. яз. им. М. Тореза Новые информационные технологии Харламов Александрович © 2012 МГЛУ

Лекция № 42. Лингвистика в новых информационных технологиях. Фонетический, морфологический Лекция № 42. Лингвистика в новых информационных технологиях. Фонетический, морфологический

Фонетический и фонологический анализ Цель фонетического анализа найти фонемное представление слова 11 Фонетический и фонологический анализ Цель фонетического анализа найти фонемное представление слова 11

Фонетический и фонологический анализ Сегментация и идентификация акустического сигнала в последовательности лингвистических единиц сложна, Фонетический и фонологический анализ Сегментация и идентификация акустического сигнала в последовательности лингвистических единиц сложна, поскольку акустические сигналы ассоциируются с сегментами, непосредственно с ними не связанными Кроме того, на эти сигналы сильно влияют соседние сегменты 11

Фонетический и фонологический анализ Акустико-фонетический компонент необходим в любой обрабатывающей речь системе, чтобы восстановить Фонетический и фонологический анализ Акустико-фонетический компонент необходим в любой обрабатывающей речь системе, чтобы восстановить канонические произношение слов, которые могут быть сопоставлены с соответствующими эталонами словаря, и далее реализовать синтаксическую, семантическую и/прагматическую интерпретацию речевого высказывания 11

Фонетический и фонологический анализ Фонема и звук - разные понятия, так как фонема - Фонетический и фонологический анализ Фонема и звук - разные понятия, так как фонема - психическое явление, а звук — акустикофизиологическое 11

Фонетический и фонологический анализ Отличие фонологии от фонетики состоит в том, что предмет фонетики Фонетический и фонологический анализ Отличие фонологии от фонетики состоит в том, что предмет фонетики не сводится к функциональному аспекту звуков речи, но охватывает наряду с этим также её субстанциальный аспект, а именно - физический и биологический (физиологический) аспекты – артикуляцию, акустические свойства звуков, их восприятие слушающим 11

Речевая волна во временной и частотной областях 20 Речевая волна во временной и частотной областях 20

Речевая волна во временной и частотной областях Широкополосная и узкополосная спектрограммы и речевая волна Речевая волна во временной и частотной областях Широкополосная и узкополосная спектрограммы и речевая волна для последовательности «Every salt breeze comes from the sea» 20

Представление речи в виде формантных траекторий Для последовательности «Why do I owe you a Представление речи в виде формантных траекторий Для последовательности «Why do I owe you a letter» 21

Речевая волна во временной области Речевая волна, соответствующая началу фразы «It’s time» . Каждый Речевая волна во временной области Речевая волна, соответствующая началу фразы «It’s time» . Каждый отрезок на графике соответствует временному отрезку в 100 мсек. S – пауза, U – невокализованный, и V – вокализованный звуки. 19

Акустико-фонетический подход Фонетические гипотезы, полученные при распознавании строки слов «all about» 41 Акустико-фонетический подход Фонетические гипотезы, полученные при распознавании строки слов «all about» 41

Фонетический и фонологический анализ В русском языке имеется два типа звуков: гласные и согласные Фонетический и фонологический анализ В русском языке имеется два типа звуков: гласные и согласные Гласные звуки характеризуются по ряду, длительности, лабиализации, напряженности Согласные характеризуются по месту образования, способу, твердости/мягкости, глухости/звонкости, придыхательности 11

Акустико-фонетический подход Бинарное дерево классификации речевых звуков 42 Акустико-фонетический подход Бинарное дерево классификации речевых звуков 42

Фонетический и фонологический анализ Не трудно учесть фонологические компоненты в рамках лексических процессов, которые Фонетический и фонологический анализ Не трудно учесть фонологические компоненты в рамках лексических процессов, которые обычно имеют дело с фонологически управляемыми изменениями, генерируя альтернативное произношение для индивидуальных лексических единиц и сохраняя их в дополнительном словаре Сложнее учесть фонологические процессы, которые соединяют границы слова 11

Фонетический и фонологический анализ Отличие фонологии от фонетики состоит в том, что предмет фонетики Фонетический и фонологический анализ Отличие фонологии от фонетики состоит в том, что предмет фонетики не сводится к функциональному аспекту звуков речи, но охватывает наряду с этим также её субстанциальный аспект, а именно - физический и биологический (физиологический) аспекты – артикуляцию, акустические свойства звуков, их восприятие слушающим 11

Фонетический и фонологический анализ Фонема и звук - разные понятия, так как фонема - Фонетический и фонологический анализ Фонема и звук - разные понятия, так как фонема - психическое явление, а звук — акустикофизиологическое 11

Фонетический и фонологический анализ Фонема – полифункциональная единица языка, которая: - различает звуковые оболочки Фонетический и фонологический анализ Фонема – полифункциональная единица языка, которая: - различает звуковые оболочки слов и морфем - доводит звуки речи до восприятия - является смыслоразличительной единицей 11

Фонетический и фонологический анализ Фонема - целиком психическое явление, равно как и аллофон, реализацией Фонетический и фонологический анализ Фонема - целиком психическое явление, равно как и аллофон, реализацией их в речи является звук Одной фонеме могут соответствовать несколько различных ее реализаций или аллофонов 11

Фонетический и фонологический анализ Аллофон - группа звуков, в которых реализуется данная фонема в Фонетический и фонологический анализ Аллофон - группа звуков, в которых реализуется данная фонема в зависимости от характера выполняемой ими функции, места в слове и соседства с другими звуками, а также ударности и безударности 11

Фонетический и фонологический анализ Согласно артикуляционной теории звук образуется в 3 стадии: 1) экскурсия Фонетический и фонологический анализ Согласно артикуляционной теории звук образуется в 3 стадии: 1) экскурсия (приготовление) 2) произнесение 3) рекурсия (расслабление) 11

Фонетический и фонологический анализ Так как звуки речи произносятся не изолированно, а в звуковой Фонетический и фонологический анализ Так как звуки речи произносятся не изолированно, а в звуковой цепи связной речи, то они могут, во-первых, влиять друг на друга, когда рекурсия предыдущего звука взаимодействует с экскурсией последующего, и, вовторых, испытывать влияние общих условий произношения 11

Фонетический и фонологический анализ В результате появляются следующие фонетические процессы: 1) редукция (изменение длительности Фонетический и фонологический анализ В результате появляются следующие фонетические процессы: 1) редукция (изменение длительности звуков в безударных словах: количественная/качественная). Она тесно связана с ударением: силовое – количественное (ударный звук произносится более долго) – тоновое (изменение высоты тона) 11

Фонетический и фонологический анализ В результате появляются следующие фонетические процессы: 2) аккомодация - взаимное Фонетический и фонологический анализ В результате появляются следующие фонетические процессы: 2) аккомодация - взаимное приспособление гласных и согласных, качество согласного влияет на качество гласного и наоборот 11

Фонетический и фонологический анализ В результате появляются следующие фонетические процессы: 3) ассимиляция - качественное Фонетический и фонологический анализ В результате появляются следующие фонетические процессы: 3) ассимиляция - качественное уподобление смежных по произношению звуков. Бывает прогрессивной (когда предыдущий звук влияет на последующий), - регрессивной (когда последующий звук влияет на предыдущий) 11

Фонетический и фонологический анализ В результате появляются следующие фонетические процессы: 4) диссимиляция - расподобление, Фонетический и фонологический анализ В результате появляются следующие фонетические процессы: 4) диссимиляция - расподобление, когда из двух одинаковых или подобных звуков получается два различных звука. Процесс, противоположный ассимиляции 11

Фонетический и фонологический анализ Для нахождения канонического фонемного представления слова русского языка в словаре Фонетический и фонологический анализ Для нахождения канонического фонемного представления слова русского языка в словаре по его фонетической форме произнесения необходимо учитывать что: - одна буква может обозначать несколько звуков - несколько букв могут обозначать один звук 11

Фонетический и фонологический анализ Основные прикладные аспекты фонетических исследований в речевых технологиях: - автоматическое Фонетический и фонологический анализ Основные прикладные аспекты фонетических исследований в речевых технологиях: - автоматическое распознавание речи - синтез речи - идентификация говорящего по характеристикам речевого сигнала 11

Морфологический анализ тесно связан с морфологическим уровнем языка, единицей которого является морфема Морфемы по Морфологический анализ тесно связан с морфологическим уровнем языка, единицей которого является морфема Морфемы по обязательности наличия в слове делятся на: - корневые (корни) – обязательные - аффиксальные (аффиксы) необязательные 11

Морфологический анализ Корень — основная значимая часть слова. Является обязательной частью любого слова — Морфологический анализ Корень — основная значимая часть слова. Является обязательной частью любого слова — не существует слов без корня (кроме редких вторичных образований с утраченным корнем типа русского вы-ну-ть (префикс-суффикс-окончание) 11

Морфологический анализ Аффикс — вспомогательная часть слова, присоединяемая к корню и служащая для словообразования Морфологический анализ Аффикс — вспомогательная часть слова, присоединяемая к корню и служащая для словообразования и выражения грамматических значений По положению относительно корня: - префиксы - перед корнем (традиционное название в русском языке - приставки) - постфиксы — после корня 11

Морфологический анализ По словоизменяющей функции : - словонеизменяющие аффиксы передают грамматическое и лексическое значение Морфологический анализ По словоизменяющей функции : - словонеизменяющие аффиксы передают грамматическое и лексическое значение - флексии — словоизменяющие аффиксы, которые передают реляционное, т. е. указывающее на связь с другими членами предложения, значение и являются показателем комплекса грамматических категорий, выражающихся в словоизменении 11

Морфологический анализ В отличие от флексии основа - это неизменяемая часть слова, которая выражает Морфологический анализ В отличие от флексии основа - это неизменяемая часть слова, которая выражает его лексическое значение, то есть соотнесённость звуковой оболочки слова с соответствующими предметами или явлениями объективной действительности Применительно к русскому языку основа – это часть слова без окончания 11

Морфологический анализ Парадигма - в лингвистике список словоформ, принадлежащих одной лексеме и имеющих разные Морфологический анализ Парадигма - в лингвистике список словоформ, принадлежащих одной лексеме и имеющих разные грамматические значения Обычно парадигмы упорядочены в некотором традиционном порядке граммем, например, парадигма русского склонения записывается в порядке падежей И—Р—Д—В—Т—П 11

Морфологический анализ Лемма — это начальная (словарная) форма лексемы Процесс привода словоформы к лемме Морфологический анализ Лемма — это начальная (словарная) форма лексемы Процесс привода словоформы к лемме — её словарной форме называется лемматизацией 11

Морфологический анализ В русском языке начальными формами (леммами) являются: - для существительных — именительный Морфологический анализ В русском языке начальными формами (леммами) являются: - для существительных — именительный падеж, единственное число - для прилагательных — именительный падеж, единственное число, мужской род - для глаголов, причастий, деепричастий — глагол в инфинитиве 11

Морфологический анализ Цель морфологического анализа: - определить принадлежность некоторой словоформы к парадигме определенной лексемы Морфологический анализ Цель морфологического анализа: - определить принадлежность некоторой словоформы к парадигме определенной лексемы - выявить грамматические признаки для этой словоформы морфологическую информацию для использования ее на последующих этапах обработки естественно-языкового текста 11

Морфологический анализ Морфологические признаки слов русского языка 11 Морфологический анализ Морфологические признаки слов русского языка 11

Морфологический анализ Для русского языка морфологический разбор текста включает: - выделение внутри предложений отдельных Морфологический анализ Для русского языка морфологический разбор текста включает: - выделение внутри предложений отдельных словоформ - определение всех вариантов комбинаций основ и аффиксов для каждой словоформы и, соответственно, вариантов грамматических форм 11

Морфологический анализ Для русского языка морфологический разбор текста включает: - устранение грамматической неоднозначности на Морфологический анализ Для русского языка морфологический разбор текста включает: - устранение грамматической неоднозначности на основе комбинаторного словаря, содержащего все контексты употребления слов 11

Морфологический анализ Существует несколько классификаций основных видов алгоритмов морфологического анализа: - по использованию словарей Морфологический анализ Существует несколько классификаций основных видов алгоритмов морфологического анализа: - по использованию словарей системы МА можно разделить на словарные (со словарем словоформ или со словарем основ) и бессловарные - по организации алгоритмов — на методы с декларативной, процедурной и комбинированной ориентацией 11

Морфологический анализ МА со словарем основ имеет словарь основ Безсловарный МА имеет таблицу аффиксов Морфологический анализ МА со словарем основ имеет словарь основ Безсловарный МА имеет таблицу аффиксов и список словисключений При декларативном методе в словаре хранятся все возможные словоформы каждого слова с приписанной им МИ Процедурный МА выделяет в текущей словоформе основу и приписывает данной словоформе соответствующий комплекс МИ 11

Морфологический анализ Часть речи w. Info & 0 x 3 F 0 x 01 Морфологический анализ Часть речи w. Info & 0 x 3 F 0 x 01 Глагол несовершенного вида 0 x 02 Непереходный глагол несовершенного вида 0 x 03 Глагол совершенного вида 0 x 04 Непереходный глагол совершенного вида 0 x 05 Двувидовой глагол 0 x 06 Непереходный двувидовой глагол 0 x 07 Неодушевленное существительное мужского рода 0 x 08 Одушевленное существительное мужского рода 0 x 09 Одушевленное - неодушевленное существительное мужского рода 0 x 0 A Неодушевленное существительное мужского рода 0 x 0 B. . 0 x 0 C Одушевленное существительное мужского рода 0 x 0 D Неодушевленное существительное женского рода 0 x 0 E Одушевленное существительное женского рода 0 x 0 F Одушевленное - неодушевленное существительное женского рода Описание постоянной МИ в модуле LINGUIST 11