Голосовой детектор эмоционального состояния человека (Пример инновационной идеи)
Актуальность идеи • • Изучение различных видов невербальной (несловесной) коммуникации имеет огромную научную ценность для целей автоматического распознавания речи. Невербальная информация, характеризующая внутреннее состояние человека в процессе общения (гнев, раздражение, счастье, печаль, страх, удивление, и мн. др. ), является одной из важнейших составляющих речи. Она не только помогает пониманию вербальной информации, но и дополняет смысл, который приобретает эта информация в изречениях конкретного индивида. Создание системы распознавания эмоций человека по речевому сигналу является актуальной проблемой в различных сферах деятельности, в частности, в психологии, криминалистике, звукорежиссуре, биомедицине, а также для предотвращения негативных последствий, которые могут наступить по причине неуравновешенного состояния оператора. Речевой сигнал может служить объективным показателем оценки эмоционального состояния человека (оператора, диспетчера, летчика и пр. ) наряду с невербальными проявлениями эмоциональности, что особенно важно при отсутствии визуального контакта с человеком.
Существующие методы Для обнаружения эмоциональной составляющей в речи человека используют различные методы анализа: • • • спектральный анализ, который позволяет разложить любой сложный акустический сигнал, создаваемый различными источниками звука, на более простые составляющие (оценка частоты основного тона, формантная структура); статистический анализ сигналов позволяет установить распределение мгновенных значений и их уровней во времени; распределение длительностей пауз [9]; распределение максимальных уровней сигнала и длительностей их непрерывного существования во времени; распределение текущей и средней мощности; динамический диапазон и др. ; применение методов нелинейной динамики с последующим вычислением фазового портрета или аттрактора (аттрактор - компактное подмножество фазового пространства динамической системы, все траектории из некоторой окрестности которого стремятся к нему при времени, стремящемся к бесконечности. ).
Существующие методы Долговременный статистический спектр для речи с разным эмоциональным содержанием
Существующие методы Примеры реконструкций аттракторов выборок ОВ 1 (слева) и ОВ 2 (справа): а, б – гнев; в, г – нейтральное состояние; д, е – счастье
Суть идеи Предлагается использовать метод корреляционного анализа акустических сигналов как нестационарного случайного процесса для выявления эмоциональной компоненты разговорной речи. Необходимые вычисления (могут лечь в основу модели детектора): 1. Тест нестационарности эталонного речевого сигнала (с вычислением основных статистических характеристик). 2. Вычисление автокорреляционной функции эталонного речевого сигнала как нестационарного случайного процесса с усреднением по ансамблю реализаций для различных видов эмоций. 3. Сопоставление реальных сигналов с эталонными и классификация по принадлежности к соответствующим эмоциям.
Реализация идеи На начальном этапе голосовой детектор эмоционального состояния человека предполагается реализовать в качестве виртуального прибора в графической среде программирования Lab. VIEW.
Перечень затрат на реализацию идеи Длительность этапов работ
Перечень затрат на реализацию идеи
Перечень затрат на реализацию идеи