5_Акустическая теория речи.ppt
- Количество слайдов: 55
Акустическая теория речеобразования План темы 1. Акустическая фаза речевого процесса 2. Основные положения акустической теории речеобразования (АТР) 3. Акустические характеристики звучащей речи: частота основного тона, амплитуда колебательного движения, форма звуковой волны. 4. Передаточная функция речевого тракта. 5. Функции акустических характеристик речи.
1. Акустическая фаза речевого процесса 1. Речевой сигнал Артикуляционная фаза производство речевого сообщения завершается созданием звуковых колебаний, которые в фонетике называют речевым сигналом, относящимся к акустической фазе речепроизводства. Физически речевой сигнал незначительные по величине колебания воздушного давления, распространяющиеся по воздушной среде в виде звуковой волны.
2. Предмет изучения акустической фонетики – • физические свойства звуковой волны, • их корреляция (связь) с артикуляционными процессами, которые определяют форму звуковой волны, • и их восприятием. В изучении звуковой коммуникации акустическая фонетика занимает промежуточное положение между артикуляционной и перцептивной фонетикой.
3. Задача акустической фонетики количественное описание аэродинамических и акустических процессов, которые происходят в речевом тракте при артикуляции.
4. Основы акустической теории речи были заложены в 19 -м веке выдающимся немецким физиком Германом Л. Гельмгольцем. В 20 -м веке наибольший вклад в акустику речи внесли Гуннар Фант «Акустическая теория речеобразования» и Дж. Фланаган.
5. Прикладной аспект Данные акустической фонетики находят практическое применени разработке технических средств анализа и синтеза речевого сигн
2. Основные положения АТР Движения речевых органов не создают речевого сигнала, они создают в речевом тракте аэродинамические условия, необходимые для образования звуковых колебаний. Инициатор звуковых колебаний – дыхательная система, создающая движущийся поток воздуха.
Чтобы поток воздуха превратить в колеблющуюся воздушную струю, на него должно быть наложено акустическое возмущение. Это осуществляется: а) голосовыми связками б) преградами в надгортанных полостях речевого тракта.
Схема речеобразующего аппарата. Анатомическое изображение 1 -грудная клетка; 2 -лёгкие; 3 -трахея; 4 голосовые связки; 5 -гортань; 6 -полость глотки; 7 -нёбная занавеска; 8 -полость рта; 9 -полость носа.
Схема речеобразующего аппарата. Функциональные элементы 1 -сила дыхательных мышц, 2 -объём лёгких, 3 -трахея, 4 голосовые связки, 5 -гортанная трубка, 6 -полость глотки, 7 нёбная занавеска, 8 -полость рта, 9 -полость носа, 10 излучение из ротового отверстия, 11 -излучение из носового отверстия
Схема речеобразующего аппарата. Блок-схема 2, 3 -ёмкость лёгких и трахеи, 4 -голосовой источник колебаний, 5, 6 -ёмкость гортани и глотки, 7 -механизм нёбноё занавески, 8 -ёмкость полости рта, 9 -ёмкость полостей носа, 10 -выходной сигнал ротового тракта, 11 -выходной сигнал носового тракта, 12 -шумовой источник.
3. Акустические характеристики звучащей речи Физические параметры звуковой волны определяются: а) характером источника звука и б) характеристиками передающего тракта.
Источник звука Речевой аппарат человека располагает двумя источниками звука: • голосовым и • шумовым. Голосовой источник звука – гортань. Источник шума – различные формы преград в речевом тракте.
Голосовой источник Функция голосового источника - создание глоттальной волны: последовательности воздушных толчков, регулярно повторяющихся во времени.
Глоттальная волна
Глоттальная волна может быть представлена графически как синусоида с двумя основными характеристиками: • длиной периода, равной продолжительности колебательного цикла голосовых связок, • амплитудой (размахом) колебания, пропорциональной степени голосового усилия,
Графическое представление глоттальной волны Длина периода и амплитуда синусоиды
Амплитуда и частота колебательного движения Синусоиды равной длины колебательного цикла и различной амплитуды
Амплитуда и частота колебательного движения Синусоиды равной амплитуды и различной длины колебательного цикла
Длина звуковой волны Длительность колебательного цикла зависит от массы и натяжения голосовых связок: чем толще и длиннее голосовые связки и чем меньше их натяжение, тем продолжительнее цикл колебательного движения.
Амплитуда звуковой волны На амплитуду голосового импульса влияет изменение голосового усилия. Голосовое усилие зависит от величины подсвязочного давления, создаваемого потоком выдыхаемого воздуха.
Форма звуковой волны Голос воспринимается как гудение или гул. Он является сложным периодическим звуком, который может быть представлен в виде суммы простых синусоидальных колебаний – гармоник. Набор гармоник составляет спектр голосового источника.
Первая гармоника голосового спектра называется основным тоном. Её частота обратна периоду глоттальной волны, Fо = 1/ Т, и равна частоте колебаний голосовых связок.
Частоты остальных гармоник, или обертонов, в целое число раз больше частоты основного тона. От частоты основного тона (ЧОТ) зависит плотность спектральных линий в спектре голоса: чем длиннее период голосовых колебаний, тем меньше основная частота и тем чаще расположены спектральные линии.
Спектр голосового источника Основная гармоника и парциальные тоны
Синусоида голосового источника Сложение гармоник
Сложение частот Спектр голосового источника в виде сложной синусоиды
Сложение частот Осциллограмма и спектрограмма
Шумовые источники. Источники шумов – различные преграды в надгортанных полостях речевого тракта. По характеру создаваемого шума различают два типа преград: • турбулентный и • импульсный.
Турбулентный шум возникает, когда сжатый воздух, проходя через сужение, приобретает большую скорость. На выходе из сужения высокоскоростная струя сталкивается с инертной воздушной массой и разбивается на фрагменты, содержащие вихри.
Когда вихри смешиваются с остальной массой воздуха, возникают быстрые и нерегулярные колебания давления, которые воспринимаются как шум. Спектр турбулентного шума сплошной: в нем невозможно выделить гармоники.
Импульсный шум Импульсный источник звука создает скачкообразное изменение давления воздуха. Для образования звукового импульса необходимо накопить в речевом тракте избыточное давление, для чего создается преграда, полностью перекрывающая выход воздуха на достаточно длительный промежуток времени. При быстром размыкании смычки воздушный поток на выходе резко возрастает, скачкообразно изменяя давление.
В акустической картине взрывных согласных отмечается: • фаза смычки (акустический ноль) продолжительностью не менее 30 мс, • скачкообразное увеличение амплитуды колебания, за которым может следовать • фаза турбулентного шума фрикативного или аспиративного характера. (Тётя, дядя)
4. Передаточная функция тракта Количество фонетических единиц, основывающихся только на различиях в свойствах источников звуков, ограниченно. Основой для огромного разнообразия звуков человеческой речи являются резонансные возможности речевого тракта.
Речевой тракт представляет собой полость, заполненную воздухом, с собственной частотой колебаний. Если поднести к ней источник звука той же частоты, амплитуда звука усиливается в силу явления резонанса.
Целевые артикуляции направлены на создание определенной конфигурации речевого тракта с разными частотноизбирательными свойствами: звуки одной частоты пропускаются и усиливаются, другой гасятся.
Воздушный столб речевого тракта – колебательная система с собственной частотой колебаний.
Когда колебания, созданные источником, проходят через речевой тракт, некоторые частоты спектра источника усиливаются, другие остаются без изменения либо подавляются.
Усиление получают те исходные составляющие, частоты которых близки к собственным частотам воздушного столба в тракте.
Артикуляционные движения изменяют конфигурацию речевого тракта и придают ему разные частотноизбирательные свойства. Поэтому звуки одной частоты пропускаются и усиливаются, а другой гасятся. Результат – звуковые колебания с особым тембром звучания.
Частота резонирующей полости
Спектр звука речи Спектры голосового источника, резонирующей полости, артикулируемого звука
Для характеристики фильтрующего действия тракта наиболее существенны три параметра: • место основного сужения, • площадь поперечного сужения в главном язычном сужении, • отношение площади ротового отверстия к его длине.
В традиционных фонетических терминах эти параметры приблизительно соответствуют: 1) место основного сужения: ряду гласных и месту образования согласных 2) площадь поперечного сужения: подъему гласных и способу образования согласных 3) отношение площади ротового отверстия к его длине: степени огубленности.
5. Функции акустических характеристик речи. При вербальном общении используются все акустические параметры речи: • частота тона, • интенсивность, • спектральные характеристики.
Частота основного тона (ЧОТ) Акустические параметры голоса существенны для восприятия: они участвуют в передаче важной для речевого общения информации. Изменение основной частоты, воспринимаемой как высота голоса (тон): 1. формирует интонацию речи, 2. выделяет ударный слог в слове 3. отмечает место логического ударения во фразе, 4. определяет состав слов в тональных языках.
Диапазон возможных изменений ЧОТ велик. Диапазон возможных Для взрослого человека он составляет около полутора-двух октав. изменений ЧОТ составляет Для каждого человека существует наиболее удобный и привычныйчеловека работы для взрослого режимчастота, голосовых связок. Основная соответствующая этому режиму, около полутора-двух октав. называется базовой или нейтральной. Она расположена в области, приблизительно соответствующей одной третьей или четвертой части человека Для каждого его голосового диапазона, считая от нижней границы. Несмотря на большую индивидуальную существует наиболее вариативность базовых частот можно удобный типовые значения для разных выделить их и привычный режим половых и возрастных групп говорящих. работы голосовых связок. Средняя базовая частота Для мужских голосов - приблизительно 130 Гц, для женских – 260 Гц. Такая основная частота Для диапазона мужского голоса типичен называется. Гц, интервал 80 -200 базовой или для женского – 150 -400 Гц, нейтральной. для детских голосов (в сильной зависимости от возраста) – 200 -500 Гц.
Диапазон возможных изменений ЧОТ велик. Нейтральный частотный Для взрослого человека он составляет около полутора-двух октав. уровень располагается в Для каждого человека существует третьей области около одной наиболее удобный и привычный режим работы или четвертой части его голосовых связок. Основная частота, соответствующаядиапазона, голосового этому режиму, называется базовой или нейтральной. считая от в области, приблизительно Она расположенанижней границы. соответствующейуровень: третьей или одной Неужели… Верхний тональный четвертой части его голосового диапазона, 500 гц считая от нижней границы. Т Несмотря на большую индивидуальную о вариативность базовых частот можно н а выделить их типовые значения для разных л половых и возрастных групп говорящих. ь н ы Для й Средняя базовая частота мужских голосов - приблизительно 130 Гц, Средний уровень д для 130 гц женских – 260 Гц. Для диапазона мужского голоса типичен иа интервал 80 -200 Гц, п для женского – 150 -400 Гц, а з для детских голосов (в сильной зависимости о н от возраста) – 200 -500 Гц. 80 гц Нижний тональный уровень: Ну что вы…
Диапазон возможных изменений ЧОТ велик. Для взрослого человека он составляет около полутора-двух октав. Для каждого человека существует наиболее удобный и привычный режим работы голосовых связок. Основная частота, соответствующая этому режиму, называется базовой или нейтральной. Она расположена в области, приблизительно соответствующей одной третьей или четвертой части его голосового диапазона, считая от нижней границы. Несмотря на большую индивидуальную вариативность базовых частот можно выделить их типовые значения для разных половых и возрастных групп говорящих. При большой индивидуальной вариативности базовых частот можно выделить их типовые значения для Средняя базовая частота разных половых и Для мужских голосов - приблизительно 130 Гц, возрастных групп для женских – 260 Гц. Для диапазона мужского голоса типичен говорящих. интервал 80 -200 Гц, для женского – 150 -400 Гц, для детских голосов (в сильной зависимости от возраста) – 200 -500 Гц.
Диапазон возможных изменений ЧОТ велик. Для взрослого человека он составляет Средняя базовая частота около полутора-двух октав. Для мужских существует Для каждого человека голосов наиболее удобный и привычный режим работы приблизительно 130 Гц, голосовых связок. Основная частота, соответствующая этому режиму, для женских –или нейтральной. 260 Гц. называется базовой Она расположена в области, приблизительно соответствующей одной третьей или Для диапазона мужского четвертой части его голосового диапазона, считая от нижней границы. голоса типичен интервал Несмотря на большую индивидуальную 80 -200 Гц, вариативность базовых частот можно выделить их типовые значения для разных половых и возрастных групп говорящих. для женского – частота Средняя базовая Для мужских голосов - приблизительно 130 150 -400 Гц, для женских – 260 Гц. Для диапазона мужского голоса типичен для детских голосов (в интервал 80 -200 Гц, зависимости от возраста) – для женского – 150 -400 Гц, для детских голосов (в сильной зависимости от возраста) 200 -500 Гц. – 200 -500 Гц.
Громкость звука Перцептивный коррелят амплитуды – интенсивность или громкость звука. Абсолютные значения интенсивности: • лингвистически нерелевантны; • несут информацию о личности говорящего, его физическом и эмоциональном состоянии. Относительная интенсивность: • лингвистически значима; • Участвует в выделении ударных слогов, важнейших элементов речи, интонационном оформлении высказывания.
Спектральные характеристики Спектр звука речи воспринимается как его тембр. Тембральные (качественные) характеристики несут как лингвистическую, так и экстралингвистическую информацию: • различают звуки речи; • передают информацию о физическом и эмоциональном состоянии говорящего, его отношении к предмету речи и собеседнику.
Контрольные вопросы 1 1. Что изучает акустическая фонетика? 2. Что представляют собой звуки речи с (. ) акустики? 3. Какие органы инициируют звуковые колебания? 4. Какую функцию выполняют артикуляционные органы в создании звуковой волны? 5. Какими источниками звука располагает речевой аппарат? 6. Что создаёт голосовой источник? 7. Что представляет собой глоттальная волна? 8. От чего зависит длина волны?
Контрольные вопросы 2 1. Что определяет величину её амплитуды? 2. Что представляет собой спектр голоса? 3. Чему равна частота первой гармоники? 4. От чего зависят частоты обертонов? 5. Почему синусоида голосового источника имеет на простой, а сложный вид? 6. Какие типы преград создают органы речи? 7. Когда возникает турбулентный шум? 8. Как изменяется давление воздуха при импульсном источнике? 9. Какие две фазы наблюдаются в спектре взрывного согласного?
Контрольные вопросы 3 1. Что представляет собой воздушный столб речевого тракта? 2. Какие частоты спектра источника усиливаются, проходя через речевой тракт? 3. Что определяет резонансные свойство речевого тракта? 4. Какие акустические параметры речи используются в речевом общении? 5. Как используется изменение основной частоты? 6. Что такое нейтральная основная частота? 7. Какова средняя базовая частота мужского, женского голосов? 8. Каков частотный диапазон мужского, женского и детского голоса? 9. Как используется в речи интенсивность? 10. Что образуют тембровые характеристики?
5_Акустическая теория речи.ppt