Кодирование звука.ppt
- Количество слайдов: 18
Звук и звукозапись
Звук – волновые колебания давления в упругой среде (термин "звуковая волна") Основные параметры любых волн: • Частота колебаний – измеряется в Гц: человеческое ухо способно воспринимать звук в широком диапазоне – от 16 Гц до 20 к. Гц. – чем больше частота, тем выше тон. • Амплитуда колебаний – измеряется в Па – от 20 мк. Па до 200 Па (болевой порог) – чем больше амплитуда, тем больше громкость.
Измерение силы звука Силу звука (уровень звука) измеряют в децибелах – д. Б. Весь диапазон слышимых звуков составляет 0140 д. Б Человеческое ухо способно уловить различие в громкости, если звуки отличаются по силе не менее, чем на 10% - 1 д. Б Примеры уровней звука: Порог слышимости 0 д. Б Шорох листьев 10 -20 д. Б Разговор средней громкости 50 -60 д. Б Авиадвигатели 120 -130 д. Б Болевой порог 140 д. Б
Звукозапись процесс сохранения информации о параметрах звуковых волн Формы представления звуковой информации: l Аналоговая - грампластинка – дорожка, изгибы которой повторяют амплитуду и частоту звука, магнитная лента – параметры звука сохраняются в виде намагниченности поверхности, степень намагниченности непрерывно изменяется, повторяя параметры звука. l Дискретная - компакт-диск (звуковая дорожка содержит участки с различной отражающей способностью)
Основные форматы компьютерного звука l Цифровой (WAV) –цифровая копия речи, музыки или др. звука. l Синтезированный (MIDI) – «конструкция» , собираемая из стандартных блоков (звуков, сыгранных на определенном инструменте).
Оцифровка звука - процесс получения цифровой формы звука При цифровой записи звук необходимо подвергнуть временной дискретизации и квантованию: l Параметры звукового сигнала измеряются не непрерывно, а через определенные промежутки времени (временная дискретизация) l Результаты измерений записываются в цифровом виде с ограниченной точностью (квантование).
Искажения при цифровой записи Дискретизация теряет информацию об истинном изменении звука между измерениями l При квантовании сохраняются не точные параметры, а только близкие к ним дискретные значения. l Качество звукового сигнала зависит от: l Глубины кодирования звука l Частоты дискретизации
Параметры оцифровки Глубина кодирования звука (разрядность оцифровки) – количество бит, используемых для кодирования амплитуды звука: 16 бит – компакт-диски (65536 уровней громкости), 8 бит – автоответчик. l Частота дискретизации – количество измерений уровней сигнала в единицу времени (секунду): l компакт – диски – 44, 1 к. Гц автоответчик, радиотрансляция – 8 -11 к. Гц
Решение задач Найти объем звукового стереоаудиофайла с глубиной кодирования 16 бит и частотой дискретизации 44, 1 к Гц длительностью звучания 5 минут. l Длительность файла с одной звуковой дорожкой – 2 минуты. Свободный объем – 5 Мбайт. Какой может быть частота дискретизации, если разрядность – 8 бит? l
Решение задач Найти объем звукового стереоаудиофайла с глубиной кодирования 16 бит и частотой дискретизации 44, 1 к Гц длительностью звучания 5 минут. 16*44100*2*300=50, 5 Мбайт l Длительность файла с одной звуковой дорожкой – 2 минуты. Свободный объем – 5 Мбайт. Какой может быть частота дискретизации, если разрядность – 8 бит? 5*1024*8/(120*8)=43, 7 к. Гц l
Форматы аудиофайлов Расширение Полное название Описание WAV RIFF/WAVE Простой звуковой файл, в котором хранится описание звуковой волны. Может быть использован для хранения музыки, речи и звуковых эффектов, но файлы этого формата имеют слишком большой объём. MP 3 MPEG Layer-3 Самый популярный на сегодняшний день звуковой формат. Файлы этого формата имеют в 10 раз меньший объём, чем WAV-файлы, при минимальных потерях качества. MIDI Формат, который используется для записи музыки. Файлы этого формата хранят не звуковую волну, а описание музыкальных инструментов и последовательность нот. Этот формат очень удобен для редактирования музыки, но не предназначен для хранения звуковых эффектов и человеческого голоса. KAR Karaoke MIDI Файл для караоке. То же самое, что и формат MIDI, но кроме музыки содержит ещё текст песни. РСМ расшифровывается как pulse code modulation, что и является в переводе как импульсно -кодовая. Файлы именно с таким расширением встречаются довольно редко. Но РСМ является основополагающей для всех звуковых файлов.
Формат MP 3 l 1. 2. 3. 4. l Алгоритм МРЗ является частью стандарта MPEG и описывает сжатие аудиоинформации. Алгоритму передается звуковой фрагмент и желаемый битрейт (англ. bitrate) — количество бит, используемых для кодирования одной секунды звука. Этот параметр регулирует долю информации, которая будет удалена при сжатии. Звуковой фрагмент разбивается на небольшие участки — фреймы (англ. frames), а в каждом фрейме звук разлагается на составляющие звуковые колебания. Начинается психоакустическая обработка — удаление маловажной для человеческого восприятия звуковой информации, при этом учитываются различные особенности слуха. Желаемый битрейт определяет, какие эффекты будут учитываться при сжатии, а также количество удаляемой информации. Оставшиеся данные сжимаются. Алгоритм МРЗ позволяет сжимать звуковые файлы в несколько раз. При этом даже самый большой битрейт 320 Кбит/с стандарта МРЗ обеспечивает четырехкратное сжатие аудиоинформации по сравнению с форматом Audio CD, при таком же субъективном качестве звука. Формат МРЗ стал стандартом для распространения музыкальных файлов через Интернет.
Методы сжатия цифровой информации
Виды алгоритмов сжатия • Обратимые – изменяют способ представления входных данных, приводя их к форме, которая более компактно кодируется • С регулируемой потерей информации – во входных данных выделяется информация, которой можно пренебречь и удалить, после чего «существенные» данные подвергаются дальнейшему сжатию.
Алгоритмы обратимых методов Форматы файлов, хранящих сжатую без потерь информацию: - - GIF, TIF, PCX, PNG – для графических файлов AVI – для видеоданных ZIP, ARJ, RAR – для любых типов данных
Методы сжатия с регулируемой потерей информации Основаны на особенностях человеческого восприятия звуковой, графической и видеоинформации Например: Глаз наиболее чувствителен к зеленому цвету, к красному – чувствительность ниже в 4 раза, к синему – в 10 раз. 1980 -1990 гг. – созданы группы экспертов: по фотографическим изображениям (JPEG) по видеоизображениям (MPEG) Характерная черта разработанных алгоритмов – возможность регулируемого удаления маловажной (для человеческого восприятия) информации
Наиболее известные методы сжатия в регулируемой потерей информации JPEG – метод сжатия графических файлов (статических изображений). Задается коэффициент сжатия, регулирующий долю информации, удаляемой при сжатии. l MPEG – группа методов сжатия видеоданных l MP 3 – метод сжатия звуковых данных l
Алгоритмы MPEG Много приемов сжатия: l Основная идея – метод «опорного кадра» сохранять не целый кадр, а только изменения кадров l Быстро сменяемые участки изображения кодировать с более низким качеством, чем статичные (глаз не успевает рассмотреть детали) l Возможность сохранять в одном файле несколько потоков данных – фильм, логотип, субтитры и т. д. Потоки данных накладываются только при воспроизведении.
Кодирование звука.ppt