Отчет по преддипломной практике Тема дипломного проекта: ИС голосового управления ПК Выполнил: студент гр. 08 И Насыров Ш. М.
Цель работы – разработка информационной системы, обеспечивающей сбор, обработку, анализ речевых команд, полученных от пользователя и управление персональным компьютером.
Основные задачи: • анализ современного состояния и тенденций развития систем распознавания речи; • обзор методов построения информационных систем распознавания речи; • обзор существующих решений в области голосового управления; • моделирование процесса распознавания голосовых команд; • моделирование информационной системы распознавания голосовых команд; • составление требований на разработку информационной системы голосового управления персональным компьютером.
Этапы развития исследований и разработок в области информационных систем распознавания речи • 1. 1950 -1965 гг. : Начало исследований • 2. 1970 -е: Системы постепенно приобретают популярность • 3. 1980 -е: Распознавание речи оправдывает прогнозы • 4. 1990 -е: Автоматическое распознавание речи получает широкое распространение • 5. 2000 -е: Застой в распознавании речи • 6. Будущее: Точная и повсеместная речь
Способы распознавания речи: • • Распознавание отдельных команд. Распознавание по грамматике. Поиск ключевых слов в потоке слитной речи. Распознавание слитной речи на большом словаре (LVCSR — large vocabulary continuous speech recognition).
Современные программные продукты для распознавания голосовых команд • Автоматизированная система поиска ключевых слов и выражений Voice. Digger (компания «Центр речевых технологий» (ЦРТ)) • Typle Premium 2. 0 • Google Voice Search (компания «Google» ) • Dragon Naturally. Speaking 11 (компания «Nuance» ) • Via. Voice (компания «IBM» )
Характеристики систем распознавания речи Название системы Назначение Voice Digger Поиск ключевых слов Typle Голосовое Premium 2. 0 управление ПК Google Голосовой Voice поиск Search Dragon Голосовое Naturally. Sp управление, eaking распознавани е речи Via. Voice Голосовое управление, распознавани е речи Структур. Обученая единица ние Поддержка русского языка Дикторонезависимость Коэфф. Стоим расп. , ость зависит от словаря Слово, фраза Да Да Да до 97% , – Слово, фраза Да Да Да до 95% 0$-13$ Слово, фраза Нет Да Да – Нет Нет до 98% 85100$ – Нет Да до 95% 100110$ – –
Основные проблемы существующих систем: • отличие длительности звуков речи • голосовые различия отдельных людей • сильное влияние эмоционального состояния говорящего на изменения в его речи • потери и искажение звука при распространении в пространстве • усложнение системы обработки в связи с почти бесконечным числом вариаций звуков речи
Алгоритм процесса распознавания голосовых команд
Бизнес-модель системы
Функциональная модель