b50881478081717887bcea170748aa6b.ppt
- Количество слайдов: 22
To. BI (Tone and Break Indices) Тоны и показатели просодических швов (стыков, брейков)
To. BI (1992 -1996) Стандартная транскрипционная система для интонации американского варианта английского языка (AE), разработанная и протестированная международной группой исследователей (Silverman et al. 1992). Цели стандартизации 1. 2. Создание единой теоретической и практической парадигмы для дальнейших научных исследований и технологических разработок, которая позволила ли бы разным лабораториям и рабочим коллективам интерпретировать и использовать накопленные данные по интонации английского языка в его главных вариантах (АЕ, АА, АB ). Создание ресурсов для разработки и использования он-лайновых баз данных с просодически размеченной и затранскрибированной речью. 2
Вопросы для дальнейшего обсуждения ü Теоретическая база системы To. BI ü Иллюстративные примеры ü Соглашения и инструкция для разметчиков; ü Компьютерный инструментарий, примеры; ü Структура разметочных файлов, совместимость; ü Экспериментальная проверка работоспособности (валидности) системы; ü Расширения парадигмы To. BI на другие языки – To. GI, To. DI, GRTo. BI, To. RI, + итальянский, испанский, арабский (каирский вар. ). 3
Теоретическая база системы To. BI Общее направление – интонационная фонология, в ее рамках автосегментная тональная теория, метрическая теория. 1. J. Pierrehumbert, 1980 – модель английской интонации 1 ; 2. M. Beckman & J. Pierrehumbert, 1986 - модель английской интонации; 3. J. Pierrehumbert. Tonal elements and their alignment, 2000 - модель английской интонации; 4. Goldsmith J. , 1990 – общие вопросы автосегментной и метрической фонологии 2; 5. Ladd D. R. (1983, 1996) – интерпретация явления даунстепа и тональный диапазон; 6. Wightman C. et. al. – 1992 – интерпретация просодических стыков=швов; 7. Selkirk E. 1984, 1995 – метрическая теория и просодическое фразирование (формирование просодических составляющих). 1 См. учебник «Общая фонетика» К&К; 2 К&К. Современная американская фонология. 4
J. Pierrehumbert. Tonal elements and their alignment, 1980 - 2000 - модель английской интонации, АЕ Из истории : 50 -е годы ХХ в. – первые попытки фонологизации тональных явлений= интонации на материале АЕ. • Признание автономной, супрасегментной фонетической природы интонации и ее отдельных элементов; слог - основное поле реализации интонационных контрастов. Два подхода в в фонологической интерпретации интонации. 1. Trager. Smith, 1951, Pike, 1945 – декомпозиция тональных контуров в терминах 4 функционально значимых тональных уровней=уровневых тонов: L, LM, H. 2. Bolinger (1951, 1958), Британская фонет. школа + современные исследоваватели Liberman M. (1975), Ladd (1979). - декомпозиция контуров в терминах тональных движений- конфигураций. Каждый подход имеет свои преимущества и недостатки. 5
Современные модели J. Pierrehumbert и (1980 -2000) и другие в той же парадигме - попытка интегрировать прежние подходы с учетом их недостатков. Краткая характеристика модели • Базовый тональный контраст: H ~ L использование верхней и нижней части голосового диапазона в качестве основных целевых зон (мишеней= targets) во всех тональных элементах системы битональная модель интонации. Постулируется инвентарь из 6 фонологически разных L*, H*, L+H*, L*+H, H+L*, H*+L, тональных элементов: • Два простых L и H • Четыре сложных: L + H*, L* + H, H* + L, H+ L* Различаются по локализации во фразе и дискурсивной функции (см. слайд 7). 6
7
Грамматика возможных интонационных структур английского языка (ИГ) Интонационная структура (ИС) фразы = линейная последовательность фонологически значимых тональных элементов, ассоциированных с метрически сильными (акцентированными) слогами и границами просодических составляющих двух уровней иерархии (промежуточными и интонационными фразами) (сл. 10 ). Грамматика, исчисляющая возможные ИС, = сеть из 3 возможных тональных состояний; любой путь через сеть порождает некоторую ИС (сл. 9). Свойства порождаемых ИС: • Длина и сложность ИС. Фраза может иметь бесконечное к-во тональных акцентов, это идеализация. Обычно акцентов 1 - 3, очень редко 5. Но это ограничение не самой ИГ, а ритмометрики фразы: количество метрически сильных слогов в составляющей ограничивает кол-во тон. Акцентов в ней. • Комбинаторика тональных элементов. Тональные акценты и граничные тоны не имеют принципиальных ограничений на комбинаторику, порождая 36 сложных тон. конфигураций в завершении фразы (сл. 11). Но комбинаторика акцентов внутри одной и той же фразы имеет ограничения, как показывают исследования. • Инвентарь нуклеарных и ненуклеарных тональных акцентов один и тот же. • Иерархия в ИС - Линейная последовательность тональных элементов, организованных в иерархическую фразово-просодическую структуру. 8 (сл. 10)
Интонационная порождающая грамматика ‘X*’ ‘Х-’ ‘X%’ 9
Линейно-иерархическая природа интонационной структуры предложения Adelaide’s in South Australia and Sydney’s in New South Wales. 10
Тональные конфигурации в завершении фразы ТА Г Т ТА Тональные конфигурации в завершении фразы 11
Просодические тональные правила 1. 2. 3. Tone alignment rules = Постлексические правила выбора тональных элементов и их связывания с сегментным составом (слоговой последовательностью, представляющей высказывание). Связь ТА с акцентированными слогами мб объяснена общей организацией моторного контроля 1. Правила формирования ЧОТ-контура на основе данной ИС = реализационные правила тональной параметризации. Абстрактные тон. элементы ИС условно можно рассматривать как маршрут или схему движения в целевом ЧОТ-пространстве. Есть два типа реализационных правил – таймирование и частотное шкалирование акустических событий, соотносимых с абстрактными тон. элементами. Учитывается не только исходная ИС, но и ряд других факторов – тон. диапазон фразы, взаимодействие тональных элементов, деклинационные тенденции и пр. Очень важны для автом. синтеза речи. См. э-библиотеку речевой группы ОТ и ПЛ. Кривнова О. Ф. Генерация тонального контура фразы в системах автоматического синтеза речи // Диалог’ 2000. С. 211 -219. Кривнова. О. Ф. Моделирование и синтез фразовой интонации на основе особых точек тонального контура // Диалог'97. М. , 1997. C. 161 -164. 1 это процесс, в кот. две руки становятся синхронизированы, если хлопать себя по голове и гладить живот одновременно. 12
Иллюстративные примеры [[Adelaide] [is in South Australia] ] - вверху H* H- H* L- L% [[Adelaide] [is in South Australia? ] ] - внизу H* H- L* H- H% 13
[[Adelaide’s] [ in South Australia] ] - вверху H* H- H* L- H% [[Adelaide’s] [ in South Australia] ] H* H- H* H- L% 14
[[Sydney isn’t in South Australia!] ] - внизу L*+H* L- H% 15
To. BI Annotation Conventions (1992 ) M. Beckman and J. Hirshberg Соглашения и инструкция для разметчиков • • 1. 2. 3. 4. Разметочная система To. BI обеспечивает для каждого речевого высказывания следующую информацию: цифровую запись звучания, ассоциированный ЧОТ-контур, собственно транскрипцию – маркеры (labels) для различных речевых событий в следующих 4 слоях (каналах): Орфографический слой: w*ord Тональный слой: TA; Ph. T; BT; !H; Hi. F 0 Слой показателей просодических швов (стыков): 0, 1, 2, 3, 4 - числовой показатель фонетической выраженности словораздела; Слой дополнительных комментариев (прочие события разного рода): паузы, речевые сбои, хезитации и пр. Соглашения касаются как собственно транскрипционных файлов, так и компьютерного инструментария waves. TM , форматов речевых файлов и средств временной синхронизации разных информационных слоев. 16
Компьютерный инструментарий, примеры; • waves. TM - часть пакета ESPS (Entropic Speech Processing System, ОС Unix ) – Англия • EMU Labeller – Австралия • Pitchworks – Sci. Concord. com (сл. 18, 19 + Demo) • SA SIL ? 17
Рабочее окно разметчика Pitch. Works 18
19
Структура разметочных файлов, чекеры, совместимость waves. TM формат • Каждая строка в разметочном текстовом файле содержит несколько полей, разделенных маркерами: field_1; field_2; field_3; field_4; field_5. С учетом содержания полей типичная строка в абстрактном виде выглядит так: : w(*)ord–tonal_marker$break_index@(time_stamp); comment • В системе имеется чекер для проверки правильности состава и структуры разметочных протоколов. • Большинство работ с иcпользованием To. BI сделано с помощью инструментария waves. TM (ESPS) в среде Unix, в собственном формате. Для работы с ESPS-форматом, например, для изучения тренировочного материала по этой просодической разметке на сайте Ohio State Univ. , под Windows требуется конвертер. См. сайт EMU-Австралия. Кроме традиционной формы разметки, EMU строит иерархическую просодическую аннотацию. Мои данные об указанных сайтах на сегодняшний день устарели, поэтому здесь не приводятся. 20
Экспериментальная проверка работоспособности (валидности) системы To. BI • • • Эксперимент по оценке валидности системы проводился с участием 26 разметчиков, на материале из 34 высказываний. По оценкам экспертов (Pitrelli et al. 1994) протоколы продемонстрировали хорошую согласованность работы экспертов при попарном сравнении протоколов с учетом транскрипционных символов на каждом слове. 88% согласования по наличию-отсутствию тонального маркера; 81 % по выбору определенного тонального маркера; 92% согласования в пределах одного уровня фразирования (членения) = разметки просодических швов; Полученный уровень согласования значительно выше, чем показывали предыдущие транскрипционные системы интонации , обеспечивает дальнейшее развитие в области создания и использования интонационных корпусов. 21
Заключение Ограничения To. BI Разработчики To. BI не утверждают, что система покрывает всё содержание интонационного оформления речи. Имеющиеся слои относятся к наиболее значимым, по общему мнению, просодическим характеристикам речевых сообщений. Последний, 4 -ый канал может использоваться для любой дополнительной информации, например, для наблюдений об экспрессивном использовании фонации. § Стандарт-To. BI разрабатывался под влиянием теорий для конкретного языка, но в ряде важных теоретических отношений он нейтрален. § Однако, не следует ожидать сходства тональных инвентарей и физического тождества тональных элементов в разных языках. В то же время , можно ожидать, что широкие типы тональных контрастов и тональных реализаций могут воспроизводиться в разных интонационных системах (аналогично с ситуацией в сегментной фонетике). § Это подтверждают попытки расширения парадигмы To. BI на другие языки – To. GI, To. DI, GRTo. BI, To. Ri www. fon. hum. uva. nl/tori I, +шведский, итальянский, испанский, арабский (каирский вар. ), японский, китайский…. . 22
b50881478081717887bcea170748aa6b.ppt