Кодирование звука Звук – это волновые колебания
Кодирование звука
Звук – это волновые колебания в упругой среде (в воздухе, воде, металле и т. п. ). Для обозначения звука часто используется термин звуковая волна. Основными параметрами любой волны и звуковой в частности, является частота и амплитуда колебаний. Частота звука измеряется в герцах (Гц, количество колебаний в секунду). Человеческое ухо способно воспринимать звук в достаточно широком диапазоне частот: от 16 Гц до 20 к. Гц. В нетехнических областях (например, в музыке) вместо термина частота используют термин тон. Человеческое ухо может воспринимать огромный разброс значений амплитуды звуковой волны. Порог слышимости – самые слабые различимые человеческим ухом звуки – имеют амплитуду колебаний около 20 мк. Па. Самые сильные звуки, которые еще не травмируют органы слуха, могут иметь амплитуду до 200 Па. Звуковая волна такой силы называется болевым порогом/Приведем некоторые значения уровней звука: Порог слышимости 0 д. Б Шорох листьев, шум слабого ветра 10– 20 д. Б Шепот (например, на задней парте)20– 30 д. Б Разговор средней громкости 50– 60 д. Б Автомагистраль с интенсивным движением 80– 90 д. Б Авиадвигатели 120– 130 д. Б Болевой порог 140 д. Б
Сам процесс сохранения информации о параметрах звуковых волн называется звукозаписью. Сначала люди освоили аналоговые способы записи и хранения звуковой информации. При аналоговой записи на носителе размещается непрерывный «слепок» звуковой волны. Например, на музыкальные пластинки наносится непрерывная канавка, изгибы которой повторяют амплитуду и частоту звука, на магнитофонной ленте параметры звука сохраняются в виде намагниченности рабочей поверхности, намагниченность поверхности непрерывно изменяется, повторяя параметры звука. Однако, в компьютере используется только цифровая форма записи звука. При цифровой записи звук необходимо подвергнуть подготовительным процедурам, а именно временной дискретизации и квантованию. Дискредитация выполняется для того, чтобы от бесконечного количества информации, которое содержит звук, перейти к конечному количеству информации.
При цифровой звукозаписи значения амплитуды звукового сигнала измеряются не непрерывно, а через равные небольшие промежутки времени (временная дискретизация) и записываются с некоторой точностью, то есть округляются до некоторого значения – уровня, на которые предварительно разбивается диапазон всех возможных значений (квантование). Из- за этих процедур цифровая запись, в отличие от аналоговой, несет двойное искажение. Во-первых, теряется информация о реальном значении амплитуд в моменты времени между замерами, а во-вторых, сами измеренные значения записываются с некоторой точностью.
p При цифровой звукозаписи значения амплитуды звукового сигнала измеряются не непрерывно, а через равные небольшие промежутки времени (временная дискретизация) и записываются с некоторой точностью, то есть округляются до некоторого значения – уровня, на которые предварительно разбивается диапазон всех возможных значений (квантование). Из- за этих процедур цифровая запись, в отличие от аналоговой, несет двойное искажение. Во-первых, теряется информация о реальном значении амплитуд в моменты времени между замерами, а во-вторых, сами измеренные значения записываются с некоторой точностью. В компьютер приходит не сам звук, а электрический сигнал, снимаемый с какого-либо устройства: микрофона, преобразующего звуковое давление в электрические колебания, магнитофона, радио, эхолота или любого другого устройства, вырабатывающего электрические сигналы. Электрические сигналы переводятся в цифровую запись способом импульсно-кодовой модуляции.
Процесс оцифровки
При обратном преобразовании, которое реализуется в цифроаналоговом преобразователе (ЦАП), сигнал «восстанавливается» по тем значениям, которые зафиксированы в памяти компьютера. Качество восстановленного сигнала во многом зависит от способа разбиения. Чем чаще расположены опорные точки, тем меньше будет искажен восстановленный сигнал, но при этом выше затраты ресурсов памяти. Количество интервалов разбиения, размещенных на промежутке длительностью в одну секунду, характеризуется частотой дискретизации. Второй причиной серьезного искажения сигнала может быть количество битов, отведенных для записи значения сигнала. Если для записи отведено только 4 бита, то можно записать только 16 уровней, для высококачественной записи необходимо использовать 1 байт (256 уровней) или 2 байта и выше. Этот параметр преобразования характеризуется разрядностью преобразования. Количество бит, которые используются для записи номеров подуровней, называется глубиной кодирования звука.
Импульсное кодирование по сути можно сравнить с растровым представлением изображения. При сохранении импульсного представления звука один раз сохраняются параметры оцифровки (глубина кодирования, частота дискретизации и длительность звукового фрагмента), а затем требуется сохранять только номера подуровней единым потоком. Если увеличивать частоту дискретизации и глубину кодирования, то впоследствии можно будет более точно восстановить форму звукового сигнала. Однако, при повышении таким образом качества записи ее объем будет увеличиваться. Поэтому возникает вопрос, какими должны быть частота дискретизации и глубина кодирования, чтобы получить оптимальное соотношение объема файла и качества воспроизводимого звука. В 1928 году американский инженер и ученый Гарри Найквист высказал утверждение, что частота дискретизации должна в два или более раз превышать максимальную частоту измеряемого сигнала. В 1933 году советский ученый В. А. Котельников и независимо от него Клод Шеннон сформулировали и доказали теорему о том, при каких условиях и как по дискретным значениям можно восстановить форму непрерывного сигнала - Теорему об отсчетах. Результат применения этой теоремы – частота дискретизации должна быть как минимум вдвое выше частоты сигнала.
Как определить объем памяти для хранения звука? V=b*d*t*s K=2 b V – объем памяти для хранения звука Ь –глубина кодирования звука K - количество уровней звука d – частота дискретизации звука t- длительность звучания s – количество каналов звучания
Задача. Определить объем памяти, необходимый для хранения записи стереозвука продолжительностью 10 сек, если использовалось 256 уровней и частота дискретизации – 11 к. Гц? Дано: Решение: t=10 ctr 1). Найдем глубину кодирования звука d=11 КГц V=b*d*t*s K=2 b 256=2 b К=256 b=8 S=2 2). d=11 к. Гц=11000 Гц V=8*11000*10*2=1760000 (бит)= 220 байт=215 Кбайт Найти: V
Задачи 1. Закодируйте звуковой фрагмент, длящийся 3 с, если частота дискретизации звука – 20 к. Гц, глубина кодирования – 3 бита (см. рис. ) 2. Определить объем памяти для хранения звукового фрагмента, длительностью 10 мин, глубина кодирования – 16 бит, частота дискретизации – 44, 1 к. Гц 3. На компакт-диске, объемом 650 Мб записана музыка с частотой дискретизации 44, 1 к. Гц и глубины кодирования 2 байта. Сколько часов она будет звучать? 4. Как измениться объем звукового файла, если при записи звука количество уровней звука уменьшить с 65536 до 256?
Кодирование звука.ppt
- Количество слайдов: 11

