Презентация_МЛП++осн.ppt
- Количество слайдов: 107
Лекция Метод линейного предсказания и его приложения
Процесс авторегрессии – скользящего среднего • АРСС - процесс - стационарный в широком смысле случайный процесс y(n) с дискретным временем, значения которого удовлетворяют уравнению , где x(n) - процесс дискретного белого шума с нулевым средним и дисперсией σ2; а а 1, . . , а. N , b 1, . . . , b. M - постоянные коэффициенты.
Процесс авторегрессии АР-процесс является частным случаем процесса АРСС при условии bi=0, i=1, . . . , M. • Таким образом, АР-процесс - стационарный в широком смысле случайный процесс y(n) с дискретным временем, значения которого удовлетворяют уравнению , где x(n) - процесс дискретного белого шума с нулевым средним и дисперсией σ2; а а 1, . . , а. N - постоянные коэффициенты.
Дискретные системы Процесс АРСС может быть получен на выходе дискретной системы, работа которой описывается разностным уравнением
Авторегрессионные системы с подвижным средним (Auto. Regressive Systems with Moving Average - ARMA) • Системы, в которых входные и выходные сигналы связаны конечноразностными уравнениями, называются авторегрессионными системами с подвижным средним • Коэффициенты a 0. a 1, a 2, …, a. N, b 0, b 1, …, b. M называются коэффициентами соответствующей системы
Авторегрессионные системы (Auto. Regressive Systems – AR-Systems) • Это – частный случай ARMA-систем • Иначе этот тип систем называют моделями линейного предсказания • Коэффициенты a 0. a 1, a 2, …, a. N, (a 0 не равен нулю) называют коэффициентами AR-модели (или коэффициентами соответствующей модели линейного предсказания) • Число N называют порядком данной системы (или модели)
Передаточная функция ARMAсистем
Обозначения В дальнейшем воспользуемся обозначениями: С учетом этого следующие уравнения для АР процессов равноценны Обычно полагается, что
Линейное предсказание Сигнал возбуждения интерпретируется как ошибка предсказания где - предсказанный сигнал. - линейный предсказатель М-го порядка.
Передаточная характеристика обеляющего фильтра
Определение коэффициентов предсказания Полная квадратическая ошибка предсказания Таким образом, где
Определение коэффициентов предсказания Следовательно, имеем где Поскольку , то (1) (2)
Ковариационный метод • Таким образом, имеем ковариационный метод где В этом случае ошибка предсказания
Автокорреляционный метод (Ю-У) Система уравнений (Ю-У) известна под названием уравнейни Юла-Улкера
Уравнения Юла-Уокера , где
Параметрические методы спектрального оценивания Спектральная плотность мощности для АРСС-процесса
Параметрические методы спектрального оценивания Если все АР-параметры, кроме a(0)=1 равны нулю, то Будет строго процессом скользящего среднего (ССпроцесс) порядка q. Если все ССпараметры равны 0, то процесс станет АРпроцессом (авторегрессионным)
Параметрические методы спектрального оценивания Алгоритм оценки спектра 1. АРСС оценка: вычислить дисперсию белого шума , 2. Коэффициенты скользящего среднего b(k), авторегрессионные 3. Коэффициенты a(k) 2. АР оценка: вычислить дисперсию белого шума , авторегрессионные коэффициенты a(k) 3. СС оценка: вычислить дисперсию белого шума , Коэффициенты скользящего среднего b(k) Методы поиска коэффициентов: 1. Метод Бурга 2. Метод максимального правдоподобия 3. Ковариационный метод (модифицированный) 4. Метод Юла-Уолкера
Параметрические методы спектрального оценивания Авторегрессионный метод
Процесс речеобразования
Процесс речеобразования
Речевой сигнал
Речевой сигнал
Речевой сигнал
Речевой сигнал
ФОРМАНТА • ФОРМАНТА (от лат. formans — образующий) — группа усиленных обертонов, формирующих специфический тембр голоса или музыкального инструмента. Форманты возникают в основном под влиянием резонаторов, на их высотное положение мало влияет высота основного тона звука. В струнных инструментах образование формант связано с резонансом дек, в голосовом аппарате — с резонансом полостей. • Оберто ны (нем. Oberton — «верхний тон» ) в акустике — призвуки, входящие в спектр музыкального звука; высота обертонов выше основного тона (отсюда название). Наличие обертонов обусловлено сложной картиной колебаний звучащего тела (струны, столба воздуха, мембраны, голосовых связок и т. д. ): частоты обертонов соответствуют частотам колебания его частей.
История вокодеров
Лекция Принципы построения вокодеров
История вокодеров
Канальный вокодер
Канальный вокодер
Канальный вокодер Исходный спектр человеческого голоса здесь делится на ряд субдиапазонов (на рисунке их число равно 16) по 200 Гц каждый. Эти субдиапазоны выделяются узкополосными фильтрами, за которыми следуют выпрямители и фильтры низких частот (20 Гц). Выходные сигналы этих фильтров мультиплексируются и преобразуются в цифровую форму. Частота стробирования этих сигналов составляет примерно 50 Гц. Разрядность АЦП в этом случае может составлять 3 бита. На принимающей стороне осуществляется цифро-аналоговое преобразование (ЦАП) и мультиплексирование. Сбалансированные амплитудные модуляторы, управляемые ЦАП и переключателем, выдают сигналы на узкополосные фильтры. Все эти сигналы смешиваются в сумматоре, а результат воспроизводится.
Вокодер на 2400/600 бит/с
Вокодер на 2400/600 бит/с
Модель речеобразования
Модель речевого тракта в виде акустической трубы
Модель речевого тракта в виде акустической трубы x Аm , m=0, …, M - площади акустической трубы
Модель речевого тракта в виде акустической трубы Коэффициенты отражения
Формирование речевого сигнала в кодеке G. 711 (напоминание!)
Использование линейного предсказания в кодерах
ADPCM-кодер голоса в код 32 кбит/с
Архитектура кодека на основе линейного предсказания (G. 72*) X(n) Коэффициент усиления Выделитель основного тона Определитель Признака тон/шум КОДЕР Блок преобразования LSF A(z) анализатор Линия тон/шум Линия ДЕКОДЕР b 0, LSF Основной тон Тон/шум синтезатор Блок преобразования LSF Генератор сигнала возбуждения b 0 (1+A(z)) S(n) речевой сигнал
Типовая схема кодера
Residual and Excitation Synthesis filter sn = en + S am sn-m en all-pole filter excitation sn residual Analysis filter rn = sn - S am sn-m all-zero rn sn - filter Note: all-zero filter is the inverse of the all-pole filter
Принцип кодирования
Принцип кодирования
Разновидности метода линейного предсказания • Известно несколько разновидностей метода линейного предсказания, а именно: - с возбуждением от импульсов основного тона- LPC (Linear Predictive Coding); - многоимпульсным возбуждением MPELP (Multi Pulse Excidet Linear Predictive) или MPLPC (Multi Pulse Excited LPC); - возбуждением от остатка предвидения RELP (Residual Excited Linear Predictive); - возбуждением от кода СELP (Code Excited Linear Predictive).
Вокодер с возбуждением сигналом ОТ
Вокодер с возбуждением сигналом ОТ Кодируються коэффициенты отражения: или отношения площадей Вокодеры на основе ковариационного метода при частоте анализа 50 Гц имеют скорость передачи 3600 бит/с.
Кодирование параметров LPC 10
Encoding the Residual RELP (6 -9. 6 Kbps) Low-pass filter and downsample residual to 1 KHz Encode using ADPCM VQ-RELP (4. 8 Kbps) VQ coding of residual RELP (4. 8 Kbps) Perform FFT on residual Baseband coding RPE-LTP (GSM-FR at 13 Kbps) Residual Pulse Excitation - Long Term Predictor Perform Long Term Prediction (pitch recovery) Subtract to obtain new residual Decimate by 3, use phase with maximum energy Extract 6 -bit overall gain Encode remainder with 3 bits/sample
Кодируемые параметры
Кратковременное и долговременное предсказание
Кратковременное и долговременное предсказание
Общая схема системы передачи на основе кратковременного и долговременного предсказания
RPE-LTP вокодер стандарта GSM Кодер Оценка параметров фильтра кратковременного предсказания Sn Предварительная обработка Фильтр-анализатор кратковременного предсказания A(z) Оценка параметров сигнала возбуждения en Оценка параметров фильтра долговременного предсказания Оценка параметров сигнала возбуждения Декодер S’n Пост – фильтрация Фильтр-синтезатор кратковременного предсказания H(z) e’n Фильтр-синтезатор долговременного предсказания R(z) Оценка параметров сигнала возбуждения
Кодирование RPE-LTP
Декодирование RPE-LTP
Кодирование RPE-LTP
Декодирование RPE-LTP
Распределение бит по параметрам для вокодера RPE-LTP Скорость равна 260× 50=13000 бит/с
Вокодер MPLPC с многоимпульсным возбуждением
Векторное квантование
Векторное квантование
Вокодеры CELP
Analysis by Synthesis Finding the best codeword by exhaustive search sn CB. . . find minimum LPC Compute energy
Вокодеры CELP
Оценивание качества речи
Оценка качества речи
Оценка качества речи • Существуют два главных метода измерения качества речи. 1. Субъективное тестирование. Привлекаются слушатели, оценивающие способность разных кодирующих систем воспроизводить трудные фразы. В качестве примера можно привести методы ACR (Absolute Category Rating — показатель абсолютной категории) или MOS (Mean Opinion Score — средняя экспертная оценка). 2. Машинное тестирование. Электронная система пропускает цифровой речевой файл через устройство кодирования/сжатия, после чего проводится математическое сравнение выходного сигнала с входным. В качестве примеров можно привести рекомендуемые ITU методы P. 861: PSQM (Perceptual Speech Quality Measurement — измерение воспринимаемого качества передачи речи) и G. 107 E Model, или R Factor (коэффициент R, объективная мера качества передачи в телефонных сетях на основе электронной модели).
Оценка качества речи
Средняя экспертная оценка - MOS • Наиболее распространенным методом измерения качества речи является MOS — тест с привлечением слушателей для определения качества кодирования голоса различными системами и выставление оценок по пятибалльной шкале. Например, оценка « 5» является самой высокой, и ИКМ-модуляция со скоростью 64 Кбит/с получила 4, 4 балла. Рекомендуемая минимальная оценка для бизнес-телефонии — 4, 0 балла, причем 3, 5 балла — минимально допустимая величина. Типичное значение для алгоритма сжатия звука G. 729 A — 4, 0 балла, а минимально допустимая для него граница диапазона оценок достигается при потере 1% пакетов. Оценки рассчитываются в условиях прогнозирования качества только при слушании (listening quality, LQ) и при разговоре (conversational quality, CQ). При оценке качества LQ для 16 -ти или более слушателей воспроизводится набор фонетически сбалансированных фраз, например т. н. гарвардских предложений Для измерения качества разговора CQ пары пользователей выполняют определенное задание, общаясь по телефону. Процесс определения этой оценки сложнее, т. к. необходимо установить качество слушания, эхо и задержку. Влияние задержки изменяется в зависимости от характера задачи (сравните, например, бизнес-переговоры и неформальное общение).
Оценки качества услуг для трафика IP-телефонии • Субъективные методики оценки качества услуг: MOS - Mean Opinion Score – восприятие качества услуги пользователем по 5 -бальной шкале. Не учитывает ряд явлений, типичных для сетей передачи данных и влияющих на качество речи в системах Vo. IP. Отсутствует возможность количественно учесть влияющие на качество речи факторы, такие как: – сквозная задержка между говорящим по телефону и слушающим; – влияние вариации задержки (джиттера); – влияние потерь пакетов.
Оценки качества услуг для трафика IP-телефонии • Объективные методики оценки качества услуг: Е-модель – многокритериальная оценка качества (R-фактор) в диапазоне от 1 до 120 баллов: – однонаправленная задержка, – коэффициент потери пакетов, – потери данных из-за переполнения буфера джиттера, – искажения, вносимые при преобразовании аналогового сигнала в цифровой и последующем сжатии (обработка сигнала в кодеках), – влияние эхо и др. • R-фактор (называемый фактором достоверности (англ. reliability))
Модель Е • Модель Е была разработана институтом ETSI (European Telecommunications Standards Institute — Европейский институт стандартизации электросвязи) для измерения качества на основе эталонного образца. Эта оценка требует меньшей обработки, чем метод PESQ. Модель Е также учитывает параметры разговора. Поначалу она рассматривалась как перспективное средство для систем передачи данных, но в настоящее время широко используется для оценки качества сетей Vo. IP. Она была принята союзом ITU в 1998 г. под названием G. 107, и с тех пор ежегодно корректируется и дополняется. Модель Е определяет оценку качества передачи, или коэффициент R, в диапазоне значений 0. . . 120 (100). Этот показатель в случае ИКМ-модуляции равен 93, а значения выше 80 считаются приемлемыми для передачи речи в бизнеспереговорах. Использование модели Е основано на предположении, что искажения носят аддитивный характер.
Расчет R-фактора • Значение R-фактора определяется по следующей формуле: R = Rо — Is — Id — Ie + A, • где: Ro = 93, 2 — исходное значение R-фактора; • Is — искажения, вносимые кодеками и шумами в канале; • Id — искажения за счет суммарной сквозной задержки ("из конца в конец") в сети; • Iе — искажения, вносимые оборудованием, включая и потери пакетов; • А — так называемый фактор преимущества. • Например, мобильные пользователи могут соглашаться с низким уровнем качества, • получая дополнительные удобства. В большинстве случаев расчета R-фактора параметр А принимается равным нулю.
Расчет R-фактора R = Ro- ls - ld - le • Ro = 93, 2 – базовое значение R-фактора. Качество речевого сигнала на входе в систему равно 100 единицам. При его оцифровке и передаче по сети происходит некоторое искажение сигнала, снижающее значение Ro до теоретического максимума – 93, 2, которое обычно округляют до 94; • ls - искажения, вызванные местным эффектом и процедурой квантования; • ld - искажения за счет суммарных задержек в сети; • le- искажения, вносимые оборудованием.
Зависимость между оценками MOS и Rфактором
R-фактор для некоторых типов кодеков
Типичные значения уровней качества передачи сигнала
Связь показателей качества речи
Соотношение R-фактора и MOS Значение R-фактора Категория качества и оценка пользователя Значение оценки MOS 90
Характеристики кодеков
Показатели Qo. S для трафика IP-телефонии Требования к речевому трафику (TIPHON): • Потери пакетов – потери речевых пакетов в сквозном соединении не должны превышать 2% • < 0. 5% (класс 1 – gold) • 0. 5 - 1% (класс 2 – silver) • 1 - 2% (класс 3 – bronze) • Влияние потерь на качество речи Потери пакетов, % 0 1 2 3 4 5 6 7 8 9 Параметр G 711 le (*) G. 729 0 8 12 18 22 26 28 30 32 34 10 15 20 25 30 34 38 40 42 44
• Задержка – Задержка в сквозном соединении не должна превышать 250 мс для приемлемого качества – Цель: < 150 мс (человек замечает задержку более 200 мс) – 400 мс неприемлема • Вариация задержки (джиттер задержки) – Джиттер в сквозном соединении не должен превышать 40 мс – Джиттер задержки в зависимости от класса обслуживания: • <10 мс (класс 1 - gold) • 10 - 20 мс (класс 2 – silver) • 20 - 40 мс (класс 3 – bronze)
Механизмы, позволяющие снизить влияние кодека на качество речи • методы эффективного кодирования речи (рекомендации ITU-T серии G. 7 xx); • механизмы эхоподавления (G. 164) и эхокомпенсации (G. 165, G. 168); • механизмы нивелирования ошибок (packet loss concealment), обеспечивающие компенсацию пробелов в речевом потоке, вызванных потерей отдельных пакетов.
Методы нивелирования потерь (PLC - Packet Loss Concealment) в кодеках IP-телефонии Замена потерянного фрагмента: -предыдущим пакетом -комфортным шумом
Методы обеспечения качества обслуживания Vo. IP, используемые на сети • Методы предотвращения перегрузок: алгоритмы «дырявого ведра» , RED • Методы обслуживания очередей: алгоритм WFQ • Организация джиттер-буфера на приеме • Использование протоколов передачи и контроля передачи речи по IP-сетям RTP/RTCP • Использование резервирования ресурсов (приоритезация, RSVP, Diff. Serv, MPLS)
Дифференциальная ИКМ
Дифференциальная ИКМ
Дифференциальная ИКМ
Дифференциальная ИКМ
Схемы кодера и декодера ДИКМ
Дифференциальная ИКМ
Адаптивная ДИКМ
Адаптивная ДИКМ
Адаптивная ДИКМ
Адаптивная ДИКМ
Адаптивная ДИКМ
Адаптивная ДИКМ
Дельта-модуляция
Дельта-модуляция
Дельта-модуляция
Литература 1. Беллами Дж. Цифровая телефония – М. : Эко-Тренз, 2004. – 640 с. • • • 2. Рабинер Л. Р. , Шафер Р. В. Цифровая обработка речевых сигналов: Пер. с англ. /Под ред. М. В. Назарова и Ю. Н. Прохорова. – М. : Радио и связь, 1981. - 496 с. 3. Шелухин О. И. , Лукьянцев Н. Ф. Цифровая обработка и передача речи/ Под ред. О. И. Шелухина. – М. : Радио и связь, 2000 – 456 с. 4. Шульгин В. И. Основы теории связи. Часть 1. теория и практика кодирования. Харьков. ХАИ. 2005. -194 с 5. Скляр Б. Цифровая связь. Теоретические основы и практическое применение. Изд. 2 -е, испр. : Пер с англ. – М. Издательский дом «Вильямс» , 2003. – 1104 с. 6. Прокис Дж. Цифровая связь – М. : Радио и связь, 2000. – 800 с. 7. Оппенгейм А. В. , Шафер Р. В. Цифровая обработка сигналов – М. : Связь, 1979. – 416 с. 8. А. Б. Сергиенко. Цифровая обработка сигналов – СПб. : Питер, 2002. – 608 с.