Речевые технологии: вчера – сегодня – завтра Проф. Фолькер Дэлво Лаборатория фонетики Университет г. Цюрих Благодарности: Некоторые расчёты сделаны Дугласом Рейнолдсом
Речь несёт информацию двух типов сообщение (лингвистическая инф-я ) присущая голосу инф-я (индексная информация) МЕТОДИКА
Речь несёт информацию двух типов сообщение (лингвистическая инф-я ) присущая голосу инф-я (индексная информация ) МЕТОДИКА понимание сообщения à распознавание речи составление сообщения à синтез речи пол возраст настроение личность à распознавание голоса
Назначение речевых технологий Магазин в будущем Я бы хотел купить цветы. Вот что у нас есть. Согласен их купить. Можете использовать мою кредитную карту. Итак, Марк, мы опознали Вас по голосу. Вы заплатили за этот предмет.
Назначение речевых технологий Магазин в будущем Я бы хотел купить цветы. Вот что у нас есть. Согласен их купить. Можете использовать мою кредитную карту. Итак, Марк, мы опознали Вас по голосу. Вы заплатили за этот предмет. распознава ние речи синтез речи распознава ние говорящего
Синтез речи: не так просто, как можно подумать. • 1982 Dectalk von Fonix • 1996 Proser von Atip • 2002 Bright. Speech von Babeltech • 2009 HQ TTS von Acapela (siehe: http: //ttssamples. syntheticspeech. de/deutsch/#realspeak)
Распознавание голоса: Множество технических применений Системы контроля доступа Голосовая подпись Персонализация Одноразовый пароль Правоприменение для транзакции Идентификация судебного эксперта
Почему каждый говорящий уникален? Голос зависит от анатомического строения носовая полость Речевой тракт (фильтр) (Источник сигнала) глот Гортань ка ротовая полость --> Даже однократное ‘кхм’ может выдать говорящего
Почему каждый говорящий уникален? Голос зависит от артикуляции Уникальны и движения тела Речевая артикуляция зависит от телодвижений Вы оставляете следы в звуковом сигнале --> Поэтому характерный ритм речи может выдать говорящего
Уникален ли каждый говорящий? ДА!
Как выстроить технологию? Учимся у людей Ухудшение сигнала
Развитие технологий
Оценка и производительность Два типа ошибок:
Оценка и производительность Вероятность ошибочного ОТКАЗА Два типа ошибок: Наименее идеальная работа Идеальная работа Наименее идеальная работа Вероятность ошибочной ИДЕНТИФИКАЦИИ
Функционирование зависит от конкретных обстоятельств.
Зачем использовать распознавание по голосу? Существуют различные каналы/способы распознавания: Идеального метода нет. У всех методов есть достоинства и недостатки. Исключать нельзя ни одну возможность.
Перспективные исследования: Новые "речевые ключи" для идентификации
Выводы Ø Речевые технологии - активно развивающаяся и постоянно совершенстующаяся комплексная область исследований. Ø Направление деятельности в большой степени зависит от конкретной ситуации. Ø Ожидается, что приложения с речевыми технологиями окажут серьёзное влияние на общество в будушем. Ø Системы с речевыми технологиями - рынок настоящего и будущего.