Diplom_Starikov (1).pptx
- Количество слайдов: 18
Разработка программного средства идентификации личности по голосу ВЫПОЛНИЛ: СТАРИКОВ К. А. НАУЧНЫЙ РУКОВОДИТЕЛЬ: К. Т. Н. , ДОЦЕНТ ПАРСАЕВ Н. В.
Цели и задачи Изучение теоретических основ биометрической идентификации по голосу; Анализ существующих методов реализации программного средства идентификации личности по голосу; Разработка программного средства идентификации личности по голосу; Расчет экономической себестоимости программного средства; Расчет напряженности труда при разработке программного средства.
Биометрические методы идентификации Геометрия лица Отпечаток пальца Геометрия руки Радужная оболочка глаза Рисунок вен Почерк Голос
Система распознавания личности по голосу Работа систем распознавания состоит из двух этапов: регистрация нового пользователя; идентификация зарегистрированного пользователя (процесс распознавания). Основная программа База данных Регистрация пользователя Успешная/неуспешная регистрация Идентификация пользователя Успешная/неуспешная идентификация Обработка запроса и выполнение операции
Информационная схема Не Зарегистрирован зарегистрирован Пользователь База данных Пользователь Микрофон Обработка записанного голоса Преобразовани е записи Сравнение Вывод на экран результата
Извлечение признаков из речевого сигнала Признаки можно разбить на два вида: низкоуровневые (анатомическое строение речевого аппарата); высокоуровневые (манера произношения). Рассматриваемые методы извлечения признаков Мел-частотные кепстральные коэффициенты Кепстральные коэффициенты на основе линейного предсказания
Мел-частотные кепстральные коэффициенты АЛГОРИТМ МЕТОДА 1. Подача по частям входного сигнала (речи человека) Длительность одного сегмента (мс) вычислялась по формуле: 2. Применение весовой функции (окно Хэмминга) для уменьшения искажений 3. Дискретное преобразование Фурье
Мел-частотные кепстральные коэффициенты 4. Разбиение на диапазоны с помощью треугольных фильтров (границы фильтров рассчитываются в шкале мел) Треугольные фильтры на шкале мел 5. Треугольные фильтры на шкале частот Дискретное косинусное преобразование (вычисление мел-частотных кепстральных коэффициентов)
Алгоритмическая схема
Запись речевого сигнала Частота дискретизации 44100 Гц; Кодирование – 16 бит; Ключевая фраза – «звукозапись» .
Пример вычисление коэффициентов для сегмента произнесенной фразы 1. Сегмент сигнала длительностью 23 мс; 2. Отфильтрованный сегмент 3. Спектр сегмента
Таблица с мел-частотными кепстральными коэффициентами
Графики сравнения мел-частотны кепстральных коэффициентов Мел-частотные коэффициенты речевых сигналов двух разных пользователей (один сегмент) Мел-частотные коэффициенты речевых сигналов одного и того же пользователя (один сегмент) 100 80 80 60 60 40 40 20 20 0 0 -20 -40 Первый пользователь Второй пользоваттель Первый запись Второй запись
Выбор решающего правила Вычисление расстояний (евклидово) Метод опорных векторов Модель гауссовых смесей Метод ближайшего соседа Экспериментальным методом был найден порог евклидового расстояния, который равняется 0, 4. Расчет евклидового расстояния Да Нет > 0, 4 Не идентификация Идентификация
Вероятность ошибки первого рода Формула Вероятность ошибки второго рода N / N* , M/M* , где N* – общее количество злоумышленников (20 человек), N - количество злоумышленников, получивших несанкционированный доступ (1 человек) Расчет где M* – количество попыток идентификации одного и того же пользователя (20 попыток), M - количество неудачных попыток идентификации (0 попыток) 5% 0% Ошибки первого рода - злоумышленник получает доступ к системе; Ошибка второго рода – зарегистрированный пользователь не может получить доступ к системе.
Интерфейс программы 1 2 3 4 1 - панель инструментов (выход из программы, справка о программе); 2 - поле ввода логина; 3 - кнопка «идентификации» , после которой идет запись речи пользователя; 4 – регистрация нового пользователя, с вводом логина и записью речи.
Результат работы программы Результатом программы является вывод на экран двух спектрограмм (записанный голос из БД) и информация о совпадении или не совпадении речевых признаков, соответственно идентификация или не идентификация:
Выводы Изучены теоретические основы биометрической идентификации по голосу; Проанализированы существующие методы реализации программного средства идентификации личности по голосу; Разработано программное средство идентификации личности по голосу; Рассчитана себестоимость программного средства – 32639 рублей; Присвоен второй класс напряженности труда (допустимый) при разработке программного средства.
Diplom_Starikov (1).pptx