Скачать презентацию 第五章 音频素材制作与处理 声音 声音是人类表达思想和情感的重要媒介 是用于 传送信息的媒体 不同类型的声音会给人带来不 同的感受 优美的乐音令人心情舒畅 繁杂的噪 音使人疲劳紧张 Скачать презентацию 第五章 音频素材制作与处理 声音 声音是人类表达思想和情感的重要媒介 是用于 传送信息的媒体 不同类型的声音会给人带来不 同的感受 优美的乐音令人心情舒畅 繁杂的噪 音使人疲劳紧张

c1bd2d109737ad186cc6116a09dcdcc3.ppt

  • Количество слайдов: 71

第五章 音频素材制作与处理 第五章 音频素材制作与处理

声音 ·声音是人类表达思想和情感的重要媒介,是用于 传送信息的媒体。不同类型的声音会给人带来不 同的感受,优美的乐音令人心情舒畅,繁杂的噪 音使人疲劳紧张。 ·在多媒体技术领域,声音主要表现为语音、自然 声和音乐。 ·本章介绍音频信号的特点、模拟音频与数字音频 的基本概念、语音合成技术与识别技术、音频处 理软件Adobe Audition基本功能介绍以及利用本 软件实现相应音频素材制作技术等理论知识与应 用方法。 声音 ·声音是人类表达思想和情感的重要媒介,是用于 传送信息的媒体。不同类型的声音会给人带来不 同的感受,优美的乐音令人心情舒畅,繁杂的噪 音使人疲劳紧张。 ·在多媒体技术领域,声音主要表现为语音、自然 声和音乐。 ·本章介绍音频信号的特点、模拟音频与数字音频 的基本概念、语音合成技术与识别技术、音频处 理软件Adobe Audition基本功能介绍以及利用本 软件实现相应音频素材制作技术等理论知识与应 用方法。

模拟音频 ·声音是由物体振动产生的。 ·正在发声的物体称为声源。 ·声音的产生: 声源振动,通过空气等介质,把这种振动以机械 波的形式传向远方,这就是声波。声波传入人的 耳朵,促使耳膜产生振动,这种耳膜的振动被传 导到人的听觉神经,就产生了对“声音”的感觉。 模拟音频 ·声音是由物体振动产生的。 ·正在发声的物体称为声源。 ·声音的产生: 声源振动,通过空气等介质,把这种振动以机械 波的形式传向远方,这就是声波。声波传入人的 耳朵,促使耳膜产生振动,这种耳膜的振动被传 导到人的听觉神经,就产生了对“声音”的感觉。

·声音是振动的波,是随时间连续变化的物理量, 是连续的模拟信号,即模拟音频信号。声波与普 通波形一样,可以用以下三个物理量来描述:振 幅、周期、频率。 (1)振幅是声音波形振动的幅度,表示声音的强 弱。 (2)周期是声音波形完成一次全振动经过的时间, 也是两个连续波峰之间的时间长度。 (3)频率是声音波形在一秒钟内完成全振动的次 数,表示声音的音调。 ·声音是振动的波,是随时间连续变化的物理量, 是连续的模拟信号,即模拟音频信号。声波与普 通波形一样,可以用以下三个物理量来描述:振 幅、周期、频率。 (1)振幅是声音波形振动的幅度,表示声音的强 弱。 (2)周期是声音波形完成一次全振动经过的时间, 也是两个连续波峰之间的时间长度。 (3)频率是声音波形在一秒钟内完成全振动的次 数,表示声音的音调。

·声音具有三个要素:音调、音色和音强。 (1) 音调代表声音的高低。频率越高,音调越高。 (2)音色是声音的特色。 声音分纯音和复音两种类型。纯音的振幅和周期均为常数; 复音是具有不同频率和不同振幅的混合声音,是影响声音特 色的主要因素。自然界的大部分声音是复音。 (3) 音强是声音的强度,常说的“音量”就是指音强。音强与 声波的振幅成正比,振幅越大,强度越大。声音录制完毕后 音强即随之确定,通过播放设备的音量控制,可改变聆听时 的强度。 ·声音具有三个要素:音调、音色和音强。 (1) 音调代表声音的高低。频率越高,音调越高。 (2)音色是声音的特色。 声音分纯音和复音两种类型。纯音的振幅和周期均为常数; 复音是具有不同频率和不同振幅的混合声音,是影响声音特 色的主要因素。自然界的大部分声音是复音。 (3) 音强是声音的强度,常说的“音量”就是指音强。音强与 声波的振幅成正比,振幅越大,强度越大。声音录制完毕后 音强即随之确定,通过播放设备的音量控制,可改变聆听时 的强度。

·声音频率是指声音信号每秒钟变化的次数。 ·频率小于20 Hz的信号称为亚音信号,或次音信 号; ·频率范围为 20 -20000 Hz的信号称为音频信号。 ·高于20000 Hz的信号称为超音频信号。 ·在多媒体技术中,处理的信号主要是音频信号, 它包括音乐、语音及自然界的各种声响。 ·声音频率是指声音信号每秒钟变化的次数。 ·频率小于20 Hz的信号称为亚音信号,或次音信 号; ·频率范围为 20 -20000 Hz的信号称为音频信号。 ·高于20000 Hz的信号称为超音频信号。 ·在多媒体技术中,处理的信号主要是音频信号, 它包括音乐、语音及自然界的各种声响。

·模拟音频信号通常是被转换为电信号来进行处理 的。大多数电信号的处理方法一直是采用模拟元 部件(如晶体管、变压器、电阻、电容等)对模 拟音频信号进行处理。 ·模拟音频信号通常是被转换为电信号来进行处理 的。大多数电信号的处理方法一直是采用模拟元 部件(如晶体管、变压器、电阻、电容等)对模 拟音频信号进行处理。

模拟音频的特点 · 1、模拟音频信号的频率范围 ·模拟音频信号由许多频率不同的信号组成,每个 信号都有各自的频率范围,这个组合信号被称为 复合信号。频率范围也叫“频域”或“频带”,不同种 类的声源频带是不同的。人耳听到的声音频带范 围是有限的,频率低于20 Hz和高于20000 Hz的声 音信号人类听不到,即表示人耳的可听域在 2020000 Hz之间。 模拟音频的特点 · 1、模拟音频信号的频率范围 ·模拟音频信号由许多频率不同的信号组成,每个 信号都有各自的频率范围,这个组合信号被称为 复合信号。频率范围也叫“频域”或“频带”,不同种 类的声源频带是不同的。人耳听到的声音频带范 围是有限的,频率低于20 Hz和高于20000 Hz的声 音信号人类听不到,即表示人耳的可听域在 2020000 Hz之间。

不同声源的频带宽度 声源类型 人类语音 电话声音 电台调幅广播 AM 电台调频广播 FM 高级音响设备 宽带音响设备 频带宽度(Hz) 100 -10000 200 不同声源的频带宽度 声源类型 人类语音 电话声音 电台调幅广播 AM 电台调频广播 FM 高级音响设备 宽带音响设备 频带宽度(Hz) 100 -10000 200 -3400 50 -7000 20 -15000 20 -20000 10 -40000

模拟音频的连续性 ·模拟音频是在时间上和幅值上都连续变化的信号, 构成声音数据前后之间具有强烈的相关性。连续 波形上的任何一点都代表了特定的声音信息。因 此,模拟录音过程需要将连续变化的声音波形转 换为连续变化的电信号,再作用于磁性存储设备 的磁头,产生连续的强度不同的磁场,磁化磁带 上的磁性材料。 模拟音频的连续性 ·模拟音频是在时间上和幅值上都连续变化的信号, 构成声音数据前后之间具有强烈的相关性。连续 波形上的任何一点都代表了特定的声音信息。因 此,模拟录音过程需要将连续变化的声音波形转 换为连续变化的电信号,再作用于磁性存储设备 的磁头,产生连续的强度不同的磁场,磁化磁带 上的磁性材料。

模拟音频的声音质量 ·模拟音频的声音质量简称“音质”,与音色和频率 范围有关。悦耳的音色、宽广的频率范围,能够 获得更好的音质。 ·影响音质的因素主要与声音还原设备有关。其次, 噪声也是影响音质的重要因素,在录制声音时, 音频信号幅度与噪声幅度的比值越大越好。 ·模拟信号的一个重要的缺点就是噪声容限较低, 抗干扰能力差,在录音过程中,噪声的影响是限 制模拟音频信号质量的重要原因。 模拟音频的声音质量 ·模拟音频的声音质量简称“音质”,与音色和频率 范围有关。悦耳的音色、宽广的频率范围,能够 获得更好的音质。 ·影响音质的因素主要与声音还原设备有关。其次, 噪声也是影响音质的重要因素,在录制声音时, 音频信号幅度与噪声幅度的比值越大越好。 ·模拟信号的一个重要的缺点就是噪声容限较低, 抗干扰能力差,在录音过程中,噪声的影响是限 制模拟音频信号质量的重要原因。

数字音频 ·数字音频是以二进制的方式记录的音频,是模拟 音频的数字化表达。相对于模拟音频,数字音频 可以表现出更好的音质效果。 ·数字音频技术是指利用数字技术处理声音的方法。 ·数字音频可以以声音文件WAV格式或者MIDI格 式在磁盘中保存。通常,通过计算机的声卡(也 称音频卡)将模拟音频进行模拟/数字转换,将模 拟信号进行采样和量化处理,就可以得到数字音 频信号了。 数字音频 ·数字音频是以二进制的方式记录的音频,是模拟 音频的数字化表达。相对于模拟音频,数字音频 可以表现出更好的音质效果。 ·数字音频技术是指利用数字技术处理声音的方法。 ·数字音频可以以声音文件WAV格式或者MIDI格 式在磁盘中保存。通常,通过计算机的声卡(也 称音频卡)将模拟音频进行模拟/数字转换,将模 拟信号进行采样和量化处理,就可以得到数字音 频信号了。

数字音频信号特点 ·数字音频信号可以通过计算机进行加 和处理, 如进行编辑、合成、静音、增加混响、调整频率 等,使得声音效果能更有力的烘托主题的气氛, 因此对于多媒体展示系统、多媒体广告、视频特 技等领域,数字音频信号显得更加重要。 数字音频信号特点 ·数字音频信号可以通过计算机进行加 和处理, 如进行编辑、合成、静音、增加混响、调整频率 等,使得声音效果能更有力的烘托主题的气氛, 因此对于多媒体展示系统、多媒体广告、视频特 技等领域,数字音频信号显得更加重要。

数字音频信号特点 ·在声音存储方面,传统的模拟音频信号记录在磁 带或者唱片等模拟介质中。模拟介质的缺点是难 以保存。并且存储效率很低,成本很高。数字音 频信号可以文件的形式存储在光存储介质或磁存 储介质中,实现永久保存。 ·在声音处理方面,模拟音频信号的修正 作非常 复杂。数字音频技术在后期的音频处理过程中, 可以非常容易的进行多种修正以及加 ,例如改 变音高、纠正语音错误、变换节奏,甚至可以增 加大量的声音效果。极大程度的简化了音频编辑 作的难度。 数字音频信号特点 ·在声音存储方面,传统的模拟音频信号记录在磁 带或者唱片等模拟介质中。模拟介质的缺点是难 以保存。并且存储效率很低,成本很高。数字音 频信号可以文件的形式存储在光存储介质或磁存 储介质中,实现永久保存。 ·在声音处理方面,模拟音频信号的修正 作非常 复杂。数字音频技术在后期的音频处理过程中, 可以非常容易的进行多种修正以及加 ,例如改 变音高、纠正语音错误、变换节奏,甚至可以增 加大量的声音效果。极大程度的简化了音频编辑 作的难度。

数字音频信号特点 ·在声音的压缩方面,模拟音频的压缩率很难提高。 而数字音频技术在数据的压缩方面具有绝对优势。 例如目前最流行的MP 3音频格式,压缩率达到了7 %左右,同时还能保持良好的音质。 数字音频信号特点 ·在声音的压缩方面,模拟音频的压缩率很难提高。 而数字音频技术在数据的压缩方面具有绝对优势。 例如目前最流行的MP 3音频格式,压缩率达到了7 %左右,同时还能保持良好的音质。

模拟音频信号转换为数字音频信号 ·将模拟音频信号转换为数字音频信号的过程就是 对于模拟音频信号的数字化过程。模拟音频信号 的数字化过程需要三个步骤:采样、量化和编码。 模拟音频信号转换为数字音频信号 ·将模拟音频信号转换为数字音频信号的过程就是 对于模拟音频信号的数字化过程。模拟音频信号 的数字化过程需要三个步骤:采样、量化和编码。

采样 ·采样就是每隔一定的时间间隔,抽取模拟音频信 号的一个瞬时幅度值也称作采样值,采样后所得 出的一系列在时间上离散的采样值称为样值序列。 采样后的样值序列在时间上是离散的。 采样 ·采样就是每隔一定的时间间隔,抽取模拟音频信 号的一个瞬时幅度值也称作采样值,采样后所得 出的一系列在时间上离散的采样值称为样值序列。 采样后的样值序列在时间上是离散的。

量化 ·采样只是在时间上实现了离散化。其音频脉冲信 号的幅度仍然是模拟的,因此,还必须对幅度进 行离散化处理,这个过程称为量化。 ·量化的过程如下:先将整个幅度划分成为有限个 小幅度(量化阶距)的集合,把落入同一阶距内的幅 度值归为一类,并赋予相同的量化值。 量化 ·采样只是在时间上实现了离散化。其音频脉冲信 号的幅度仍然是模拟的,因此,还必须对幅度进 行离散化处理,这个过程称为量化。 ·量化的过程如下:先将整个幅度划分成为有限个 小幅度(量化阶距)的集合,把落入同一阶距内的幅 度值归为一类,并赋予相同的量化值。

编码 ·采样和量化之后的音频信号还必需转换为数字编 码脉冲才是数字信号,这一转换过程称为编码。 最简单的编码方式是二进制编码。就是用n比特二 进制码来表示已经量化了的采样值,每个二进制 数对应一个量化值,然后把它们排列,得到由二 值脉冲组成的数字信息流。 编码 ·采样和量化之后的音频信号还必需转换为数字编 码脉冲才是数字信号,这一转换过程称为编码。 最简单的编码方式是二进制编码。就是用n比特二 进制码来表示已经量化了的采样值,每个二进制 数对应一个量化值,然后把它们排列,得到由二 值脉冲组成的数字信息流。

数字音频文件的类型 ·WAV格式:微软公司开发,用于windows平台,是最早的数字音频 格式。 ·MIDI格式:MIDI格式是Musical Instrument Digital Interface的缩写, 又称作乐器数字接口,是数字音乐/电子合成乐器的统一国际标准。在 MIDI文件中存储的是一些指令,把这些指令发送给声卡,由声卡按照 指令将声音合成出来。 ·CDA格式:CDA格式是CD音乐格式,取样频率为 44. 1 k. 数字音频文件的类型 ·WAV格式:微软公司开发,用于windows平台,是最早的数字音频 格式。 ·MIDI格式:MIDI格式是Musical Instrument Digital Interface的缩写, 又称作乐器数字接口,是数字音乐/电子合成乐器的统一国际标准。在 MIDI文件中存储的是一些指令,把这些指令发送给声卡,由声卡按照 指令将声音合成出来。 ·CDA格式:CDA格式是CD音乐格式,取样频率为 44. 1 k. Hz,16位量 化位数,CDA格式存储采用了音轨的形式,记录的是波形流,是一种 近似无损的格式。 ·MP 3格式:MP 3格式是MPEG-1 Audio Layer 3。MP 3能够以高音质、 低采样率对数字音频文件进行压缩。

数字音频文件的类型 ·MP 3 Pro格式:MP 3 Pro格式可以在基本不改变文件大小的情况下改 善MP 3的音质。 ·WMA格式:WMA格式是Windows Media Audio的缩写,是微软公司 开发的网络音频格式。其压缩率一般可以达到 1: 18。 数字音频文件的类型 ·MP 3 Pro格式:MP 3 Pro格式可以在基本不改变文件大小的情况下改 善MP 3的音质。 ·WMA格式:WMA格式是Windows Media Audio的缩写,是微软公司 开发的网络音频格式。其压缩率一般可以达到 1: 18。 ·MP 4格式:MP 4格式采用“知觉编码”为关键技术的压缩技术。只有特 定的用户才可以播放。MP 4的压缩比可达到 1: 15,体积较MP 3更小, 但音质却没有下降。 ·Quick. Time格式:Quick. Time格式是苹果公司推出的一种数字流媒体, 它面向视频编辑、Web网站创建和媒体技术平台,Quick. Time支持几 乎所有主流的个人计算平台。

数字音频文件的类型 ·DVD Audio格式:DVD Audio格式是新一代的数字音频格式,是音 乐格式的DVD光碟,可容纳 74分钟以上的录音。 ·MD格式:MD格式是Mini. Disc缩写,是Sony公司的一种音频文件格 式。采用了ATRAC算法,可以在一张尺寸较小的光盘中存储 60-80 分钟采用 44. 1 khz采样的立体声音乐。 数字音频文件的类型 ·DVD Audio格式:DVD Audio格式是新一代的数字音频格式,是音 乐格式的DVD光碟,可容纳 74分钟以上的录音。 ·MD格式:MD格式是Mini. Disc缩写,是Sony公司的一种音频文件格 式。采用了ATRAC算法,可以在一张尺寸较小的光盘中存储 60-80 分钟采用 44. 1 khz采样的立体声音乐。 ·Real. Audio格式:Real. Audio格式是由Real Networks公司推出的一 种文件格式,可以实时传输音频信息,尤其是在网速较慢的情况下, 仍然可以较为流畅地传送数据。现在的Real. Audio文件格式主要有 RA、RM、RMX三种,这些文件的共同性在于随着网络带宽的不同 而改变声音的质量,在保证大多数人听到流畅声音的前提下,令带 宽较宽的听众获得更好的音质。

数字音频文件的类型 ·VOC格式:VOC格式常用在DOS程序和游戏中,它是随声卡一起产 生的数字声音文件,与WAV文件的结构相似。 ·AU 格式:AU格式是应用于互联网上的多媒体声音。AU文件是UNIX 操作系统下的数字声音文件。 ·MAC格式:MAC格式是Apple公司开发的,被Macintosh平台和多种 Macintosh应用程序所支持。 ·AAC格式:AAC格式是高级音频编码的缩写。AAC是MPEG-2规范 的一部分。AAC的音频算法在压缩能力上远远超过了以前的一些压缩 算法(比如MP 3等)。AAC可以在比MP 3文件缩小 30%的前提下提供 数字音频文件的类型 ·VOC格式:VOC格式常用在DOS程序和游戏中,它是随声卡一起产 生的数字声音文件,与WAV文件的结构相似。 ·AU 格式:AU格式是应用于互联网上的多媒体声音。AU文件是UNIX 操作系统下的数字声音文件。 ·MAC格式:MAC格式是Apple公司开发的,被Macintosh平台和多种 Macintosh应用程序所支持。 ·AAC格式:AAC格式是高级音频编码的缩写。AAC是MPEG-2规范 的一部分。AAC的音频算法在压缩能力上远远超过了以前的一些压缩 算法(比如MP 3等)。AAC可以在比MP 3文件缩小 30%的前提下提供 更好的音质。

数字音频的质量与数据量 ·音频数字化就是将模拟声音波形数字化,以便利 用数字计算机进行处理。影响数字音频信号质量 的技术指标主要包括采样频率、采样精度、声道 数和编码算法。 数字音频的质量与数据量 ·音频数字化就是将模拟声音波形数字化,以便利 用数字计算机进行处理。影响数字音频信号质量 的技术指标主要包括采样频率、采样精度、声道 数和编码算法。

采样频率 ·采样频率是对声音波形每秒钟进采样的次数。奈 奎斯特理论指出:采样频率不应低于声音信号最 高频率的两倍,这样就能把以数字表达的声音还 原为原来的声音,这叫做无损数字化。如果一个 信号中的最高频率为f,采样频率最低要选择 2 f。 例如:电话话音的信号频率约为 3. 4 k. Hz,采样频 率就选为 采样频率 ·采样频率是对声音波形每秒钟进采样的次数。奈 奎斯特理论指出:采样频率不应低于声音信号最 高频率的两倍,这样就能把以数字表达的声音还 原为原来的声音,这叫做无损数字化。如果一个 信号中的最高频率为f,采样频率最低要选择 2 f。 例如:电话话音的信号频率约为 3. 4 k. Hz,采样频 率就选为 8 k. Hz。人的听觉的频率上限在 20 k. Hz左 右。为了使声音不发生失真,采样频率一般在 40 k. Hz左右。如44. lk. Hz。采样频率越高,声音失 真越小、音频数据量越大。

采样精度 ·采样精度是每次采样的数据位数。数位是每个采 样点的振幅动态响应数据范围,经常采用的有8位、 12位和16位。采样量化位数越高音质越好,数据 量也越大。 采样精度 ·采样精度是每次采样的数据位数。数位是每个采 样点的振幅动态响应数据范围,经常采用的有8位、 12位和16位。采样量化位数越高音质越好,数据 量也越大。

声道数 ·声道数表示一次采样的声音波形数。如果每次生 成一个声波数据,称为单声道;每次生成二个声 波数据,称为立体声(双声道) 。若每次生成多个 声道,则音频数据量会更大。 声道数 ·声道数表示一次采样的声音波形数。如果每次生 成一个声波数据,称为单声道;每次生成二个声 波数据,称为立体声(双声道) 。若每次生成多个 声道,则音频数据量会更大。

·声音数字化的采样频率和采样精度越高,结果越 接近原始声音,但记录数字声音所需存储空间也 随之增加。未经压缩的音频文件所需的存储空间 的计算公式如下: ·存储容量(字节)= (采样频率*采样精度)/8×声道数 ×时间 ·例如,数字激光唱盘CD-DA的标准采样频率为 44. lk. Hz,采样数位为 16位,立体声。则激光唱盘 一分钟音乐需要的存储量为: 44. ·声音数字化的采样频率和采样精度越高,结果越 接近原始声音,但记录数字声音所需存储空间也 随之增加。未经压缩的音频文件所需的存储空间 的计算公式如下: ·存储容量(字节)= (采样频率*采样精度)/8×声道数 ×时间 ·例如,数字激光唱盘CD-DA的标准采样频率为 44. lk. Hz,采样数位为 16位,立体声。则激光唱盘 一分钟音乐需要的存储量为: 44. 1*1000*l 6*2*60/8 = 10. 584 MB

编码算法 ·编码的作用体现在两个方面,一是采用一定的格 式来记录数字数据,二是采用一定的算法来压缩 数字数据以减少存贮空间和提高传输效率。 ·压缩比是压缩编码的基本指标,表示音频压缩的 程度,是压缩后的音频数据量与压缩前的音频数 据量的比值。压缩程度越大,信息丢失越多、信 号还原后失真越大。根据不同的应用,应该选用 不同的压缩编码算法。 编码算法 ·编码的作用体现在两个方面,一是采用一定的格 式来记录数字数据,二是采用一定的算法来压缩 数字数据以减少存贮空间和提高传输效率。 ·压缩比是压缩编码的基本指标,表示音频压缩的 程度,是压缩后的音频数据量与压缩前的音频数 据量的比值。压缩程度越大,信息丢失越多、信 号还原后失真越大。根据不同的应用,应该选用 不同的压缩编码算法。

语音合成技术 ·语音合成是指利用计算机合成语音的一种技术,使计算 机能够产生高清晰度、高自然度的连续语音,具有类似于 人一样的说话的能力。 ·语音合成技术可以通过将预先录制并存储的语音信号重 新播放来实现,或者采用数字信号处理的方法,生成各种 音调的语音。 ·语音合成可分为三个层次,分别是“文字到语音”的合成( Text-To-Speech);“概念到语音”的合成(Concept-To. Speech);“意向到语音”的合成(Intention-To-Speech)。 要合成出高质量的语言,不仅要对语言进行理解,还必须 遵循人类语言的一些表达规则,如语义学规则、词汇规则、 语音学规则。 语音合成技术 ·语音合成是指利用计算机合成语音的一种技术,使计算 机能够产生高清晰度、高自然度的连续语音,具有类似于 人一样的说话的能力。 ·语音合成技术可以通过将预先录制并存储的语音信号重 新播放来实现,或者采用数字信号处理的方法,生成各种 音调的语音。 ·语音合成可分为三个层次,分别是“文字到语音”的合成( Text-To-Speech);“概念到语音”的合成(Concept-To. Speech);“意向到语音”的合成(Intention-To-Speech)。 要合成出高质量的语言,不仅要对语言进行理解,还必须 遵循人类语言的一些表达规则,如语义学规则、词汇规则、 语音学规则。

常用的语音合成方法 ·参数合成法是通过调整合成器参数实现语音合成。 ·基音同步叠加法是对时域波形拼接实现语音合成, 在音色和自然度方面相比参数合成法有很大程度 提高。 ·基于数据库的语音合成方法是采用预先录制各种 可能语境下的语音单元并保存在数据库中,建立 一个庞大的语音数据库。再从数据库中选择并拼 接出各种语音内容。由于声音来源于自然音,因 此清晰度和自然度都非常高。 常用的语音合成方法 ·参数合成法是通过调整合成器参数实现语音合成。 ·基音同步叠加法是对时域波形拼接实现语音合成, 在音色和自然度方面相比参数合成法有很大程度 提高。 ·基于数据库的语音合成方法是采用预先录制各种 可能语境下的语音单元并保存在数据库中,建立 一个庞大的语音数据库。再从数据库中选择并拼 接出各种语音内容。由于声音来源于自然音,因 此清晰度和自然度都非常高。

语音合成的技术方式 ·波形编辑合成。以语句、短语、词或音节为合成 单元,经数据压缩,组成一个合成语音库。重放 时,根据待输出的信息,在语料库中取出相应单 元的波形数据,串接或编辑在一起,经解码还原 出语音。这种合成方式,也叫录音编辑合成,合 成单元越大,合成的自然度越好,系统结构简单, 价格低廉,但合成语音的数码率较大,存储量也 大,因而合成词汇量有限。 语音合成的技术方式 ·波形编辑合成。以语句、短语、词或音节为合成 单元,经数据压缩,组成一个合成语音库。重放 时,根据待输出的信息,在语料库中取出相应单 元的波形数据,串接或编辑在一起,经解码还原 出语音。这种合成方式,也叫录音编辑合成,合 成单元越大,合成的自然度越好,系统结构简单, 价格低廉,但合成语音的数码率较大,存储量也 大,因而合成词汇量有限。

语音合成的技术方式 ·参数分析合成。以音节、半音节或音素为合成单 元。首先对所有合成单元的语音进行分析,提取 语音参数,经编码后组成一个合成语音库;输出 时,根据待合成的语音的信息,从语音库中取出 相应的合成参数,经编辑和连接,顺序送入语音 合成器。在合成器中,通过合成参数的控制,将 语音波形重新还原出来。 语音合成的技术方式 ·参数分析合成。以音节、半音节或音素为合成单 元。首先对所有合成单元的语音进行分析,提取 语音参数,经编码后组成一个合成语音库;输出 时,根据待合成的语音的信息,从语音库中取出 相应的合成参数,经编辑和连接,顺序送入语音 合成器。在合成器中,通过合成参数的控制,将 语音波形重新还原出来。

语音合成的技术方式 ·规则合成。通过语音学规则来产生目标语音。规 则合成系统存储的是较小的语音单位。当输入字 母符号时,合成系统利用规则自动地将它们转换 成连续的语音波形。 语音合成的技术方式 ·规则合成。通过语音学规则来产生目标语音。规 则合成系统存储的是较小的语音单位。当输入字 母符号时,合成系统利用规则自动地将它们转换 成连续的语音波形。

文语转换系统 ·文语转换系统是将文字内容转换为语音输出的语 音合成系统。文本分析器根据发音字典,将输入 的文本字符串分解为带有属性标记的词和读音符 号,再根据语义规则和语音规则,为每一个词、 每一个音节确定重音等级和语句结构及语调,以 及各种停顿等。这样文字串就转变为符号代码串。 采用前面介绍的合成技术的一种或者是几种的结 合,合成出输出语音。 文语转换系统 ·文语转换系统是将文字内容转换为语音输出的语 音合成系统。文本分析器根据发音字典,将输入 的文本字符串分解为带有属性标记的词和读音符 号,再根据语义规则和语音规则,为每一个词、 每一个音节确定重音等级和语句结构及语调,以 及各种停顿等。这样文字串就转变为符号代码串。 采用前面介绍的合成技术的一种或者是几种的结 合,合成出输出语音。

语音合成技术特点 (1)自然度 (2)清晰度 (3)表现力 (4)复杂度 语音合成技术特点 (1)自然度 (2)清晰度 (3)表现力 (4)复杂度

语音合成系统应用 ·目前,语音合成技术开始广泛应用于金融、邮电、 商、政府机关、交通、教育、游戏等领域。此 外还有一些教育娱乐软件、普通话教学软件、游 戏软件中都使用了语音合成技术。 语音合成系统应用 ·目前,语音合成技术开始广泛应用于金融、邮电、 商、政府机关、交通、教育、游戏等领域。此 外还有一些教育娱乐软件、普通话教学软件、游 戏软件中都使用了语音合成技术。

语音识别技术 ·语音识别技术是让计算机通过识别和理解过程把 语音信号转变为相应的文本或命令的技术。即让 计算机能够听懂人类的语言。是目前信息技术领 域重要的科技发展技术之一。 ·例如:IBM的语音识别软件Via. Voice,可以帮助 人们通过话筒用语音向字处理软件输入文字,能 识别英语、意大利语、德语、法语、日语、汉语 等语种,已经得到了广泛的使用。 语音识别技术 ·语音识别技术是让计算机通过识别和理解过程把 语音信号转变为相应的文本或命令的技术。即让 计算机能够听懂人类的语言。是目前信息技术领 域重要的科技发展技术之一。 ·例如:IBM的语音识别软件Via. Voice,可以帮助 人们通过话筒用语音向字处理软件输入文字,能 识别英语、意大利语、德语、法语、日语、汉语 等语种,已经得到了广泛的使用。

语音识别的关键技术 ·语音识别技术主要包括特征提取技术、模式匹配 技术及模型训练技术三个方面。 ·语音识别所应用的模式匹配和模型训练技术主要 有动态时间归正技术、隐马尔可夫模型和人 神 经网络技术。 语音识别的关键技术 ·语音识别技术主要包括特征提取技术、模式匹配 技术及模型训练技术三个方面。 ·语音识别所应用的模式匹配和模型训练技术主要 有动态时间归正技术、隐马尔可夫模型和人 神 经网络技术。

音频处理软件Adobe Audition ·Adobe Audition软件是一款多轨音频制作软件。具有高 级混音、编辑、控制和特效处理能力。 2006年 1月,升级 至 2. 0版。 ·Adobe Audition拥有集成的多音轨和编辑视图、实时特 效、环绕支持、分析 具、恢复特性和视频支持等功能, 音频处理软件Adobe Audition ·Adobe Audition软件是一款多轨音频制作软件。具有高 级混音、编辑、控制和特效处理能力。 2006年 1月,升级 至 2. 0版。 ·Adobe Audition拥有集成的多音轨和编辑视图、实时特 效、环绕支持、分析 具、恢复特性和视频支持等功能, 为音乐、视频、音频和声音设计专业人员提供全面集成的 音频编辑和混音解决方案。 ·Adobe Audition广泛支持 业标准音频文件格式,包括 WAV、AIFF、MP 3 PRO和WMA,还能够利用达 32 位的位深度来处理文件,取样速度超过192 k. Hz,从而能 够以最高品质的声音输出磁带、CD、DVD或DVD音频。

Adobe Audition基本功能 (1)录音 Adobe Audition能够实现高精度声音的录制,可以导入 视频文件到Abobe Audition,实现对视频的同步配音。 (2)混音 通过混音功能可以将多个音轨声音混合在一起,输出 综合的声音效果。 (3)声音编辑 例如声音的淡入淡出,声音移动和剪辑,音调调整,播 放速度调整等。 Adobe Audition基本功能 (1)录音 Adobe Audition能够实现高精度声音的录制,可以导入 视频文件到Abobe Audition,实现对视频的同步配音。 (2)混音 通过混音功能可以将多个音轨声音混合在一起,输出 综合的声音效果。 (3)声音编辑 例如声音的淡入淡出,声音移动和剪辑,音调调整,播 放速度调整等。

Adobe Audition基本功能 (4)效果处理 软件本身自带了效果器,如压缩器、限制器、噪声门、 参量均衡器、合唱效果器、延迟效果器、回升效果器等。 (5)降噪 降噪功能可以实现在不影响音质的情况下,最大程度 地减少噪声。 (6)声音压缩 可以将音频文件压缩为容量较小的MP 3、MP 3 Pro等文 件格式,同时最大程度地保持声音的音质。 Adobe Audition基本功能 (4)效果处理 软件本身自带了效果器,如压缩器、限制器、噪声门、 参量均衡器、合唱效果器、延迟效果器、回升效果器等。 (5)降噪 降噪功能可以实现在不影响音质的情况下,最大程度 地减少噪声。 (6)声音压缩 可以将音频文件压缩为容量较小的MP 3、MP 3 Pro等文 件格式,同时最大程度地保持声音的音质。 (7)协同创作 能够与多种音乐软件协同运行,一起实现整个音乐创 作的过程。

Adobe Audition基本应用 ·Adobe Audition 2. 0 音频处理软件具有三种编辑模式界面,分别是多 轨编辑模式、单轨编辑模式以及CD模式。多轨编辑模式界面如下: 主要包括:菜单栏、 具 栏、文件/效果器列表栏、 音轨显示区、基本功能区 和电平显示区。 Adobe Audition基本应用 ·Adobe Audition 2. 0 音频处理软件具有三种编辑模式界面,分别是多 轨编辑模式、单轨编辑模式以及CD模式。多轨编辑模式界面如下: 主要包括:菜单栏、 具 栏、文件/效果器列表栏、 音轨显示区、基本功能区 和电平显示区。

菜单栏 ·File(文件) ·Edit(编辑) ·Clip(剪辑) ·View(查看) ·Insert(插入) ·Effects(效果) ·Options(选项) ·Windows(窗 口) ·Help(帮助) 菜单栏 ·File(文件) ·Edit(编辑) ·Clip(剪辑) ·View(查看) ·Insert(插入) ·Effects(效果) ·Options(选项) ·Windows(窗 口) ·Help(帮助)

文件/效果器列表栏 ·其中文件栏可以对音轨显示区打开的波 形文件以列表的方式显示出来,便于对 音频文件的管理和操作。 ·通过效果器栏中的效果可以直接对各个 音轨进行处理,制作各种音频效果。 文件/效果器列表栏 ·其中文件栏可以对音轨显示区打开的波 形文件以列表的方式显示出来,便于对 音频文件的管理和操作。 ·通过效果器栏中的效果可以直接对各个 音轨进行处理,制作各种音频效果。

音轨显示区 ·通过多个音轨的音频剪辑和处理,实现对整体音乐效果 的控制。音轨显示区包含音轨属性面板和音轨波形显示窗 两个部分。其中属性面板主要实现对当前音轨的音量调节、 相位调节、以及静音、独奏和录音等选项。而波形显示窗 则显示当前声音文件所包含的不同音轨的声音波形。 音轨显示区 ·通过多个音轨的音频剪辑和处理,实现对整体音乐效果 的控制。音轨显示区包含音轨属性面板和音轨波形显示窗 两个部分。其中属性面板主要实现对当前音轨的音量调节、 相位调节、以及静音、独奏和录音等选项。而波形显示窗 则显示当前声音文件所包含的不同音轨的声音波形。

基本功能区 ·控制以及观测音频文件的功能区域,包括走带控制器面板、时间面 板、缩放面板、选择/查看面板、 程属性面板。 走带控制器 时间面板 缩放面板 选择/查看面板 程属性面板 基本功能区 ·控制以及观测音频文件的功能区域,包括走带控制器面板、时间面 板、缩放面板、选择/查看面板、 程属性面板。 走带控制器 时间面板 缩放面板 选择/查看面板 程属性面板

电平显示区 ·显示音频电平的高低情况,即音频的音量大小。 电平显示区 ·显示音频电平的高低情况,即音频的音量大小。

Abobe Audition 2. 0 单轨操作界面只 有一个音轨,并且没 有针对这个音轨的属 性面板。在单轨模式 下,主要进行的操作 内容是针对此音轨波 形的效果处理、降噪 处理等等。 Abobe Audition 2. 0 单轨操作界面只 有一个音轨,并且没 有针对这个音轨的属 性面板。在单轨模式 下,主要进行的操作 内容是针对此音轨波 形的效果处理、降噪 处理等等。

音频素材制作-采集与录制 ·音频采集与录制是音频处理软件的最基本的功能。 在进行音频录制前,需要安装关于音频录制或者 采集的外围设备,例如麦克风或CD唱机等设备。 ·录音前的声卡设置,在音量控制窗口/选项/属性 音频素材制作-采集与录制 ·音频采集与录制是音频处理软件的最基本的功能。 在进行音频录制前,需要安装关于音频录制或者 采集的外围设备,例如麦克风或CD唱机等设备。 ·录音前的声卡设置,在音量控制窗口/选项/属性

录音属性设置 ·在面板中调整音量到 合适的位置,并在选项 菜单中选择“高级选项” 命令。 录音属性设置 ·在面板中调整音量到 合适的位置,并在选项 菜单中选择“高级选项” 命令。

·在麦克风的高级控制面板 中的其它控制栏中,选择麦 克风加强。 以上操作实现了对声卡的设置以及麦克风的设置。 ·在麦克风的高级控制面板 中的其它控制栏中,选择麦 克风加强。 以上操作实现了对声卡的设置以及麦克风的设置。

新建音频文件 ·在多轨编辑模式窗口中选 择“File”/“new Session”命令, 建立新的声音 程,打开 New Session 窗口。在窗口 中选择合适的采样频率,通 常使用 44. 1 k. 新建音频文件 ·在多轨编辑模式窗口中选 择“File”/“new Session”命令, 建立新的声音 程,打开 New Session 窗口。在窗口 中选择合适的采样频率,通 常使用 44. 1 k. Hz的采样频率。

导入声音波形 ·选择“file”/“imports”命令可以向当前的声音 程中导入音频文 件。导入后,在文件面板中就出现了音频文件的名称。编辑或 处理,只要将这个文件从文件面板中直接拖放到音轨中即可。 导入声音波形 ·选择“file”/“imports”命令可以向当前的声音 程中导入音频文 件。导入后,在文件面板中就出现了音频文件的名称。编辑或 处理,只要将这个文件从文件面板中直接拖放到音轨中即可。

录制声音文件 ·通过使用麦克风进行声 音录制之前,首先需要选 择将要录制声音的音轨, 若选择Track 2作为录音音 轨。按下Track 2属性面板 中的录音准备按钮,使之 变为红色,进入录音准备 状态。然后,选择音频播 放控制区的录音按钮开始 实际录音。 录制声音文件 ·通过使用麦克风进行声 音录制之前,首先需要选 择将要录制声音的音轨, 若选择Track 2作为录音音 轨。按下Track 2属性面板 中的录音准备按钮,使之 变为红色,进入录音准备 状态。然后,选择音频播 放控制区的录音按钮开始 实际录音。

音频编辑 ·常用的音频编辑方法主要是对音频波形进行裁剪、 切分、合并、锁定、编组、删除、复制以及对音 频进行包络编辑和时间伸缩编辑。 ·通常,音频编辑 作是在单轨编辑模式窗口中进 行的,可以在多轨模式中双击某个音轨的音频波 形,进入相应音频的单轨编辑界面。 音频编辑 ·常用的音频编辑方法主要是对音频波形进行裁剪、 切分、合并、锁定、编组、删除、复制以及对音 频进行包络编辑和时间伸缩编辑。 ·通常,音频编辑 作是在单轨编辑模式窗口中进 行的,可以在多轨模式中双击某个音轨的音频波 形,进入相应音频的单轨编辑界面。

裁剪音频 ·对音频波形进行裁剪首先 要选择被裁剪的音频段落。 在 具栏中按下Time Selection Tool 具按钮,如 图 5 -20所示,然后在波形显 示面板中拖动鼠标,选中需 要进行裁剪的音频区域,单 击鼠标右键,在快捷菜单中 裁剪音频 ·对音频波形进行裁剪首先 要选择被裁剪的音频段落。 在 具栏中按下Time Selection Tool 具按钮,如 图 5 -20所示,然后在波形显 示面板中拖动鼠标,选中需 要进行裁剪的音频区域,单 击鼠标右键,在快捷菜单中 选择“cut”命令。

切分音频 ·选择音频切片的区域范围,在所选音频上单击鼠标右 键,在快捷菜单中选择“Split”。 ·切分之后,可以通过选择 具栏中的移动 具,实现 将音频切片移动到当前音轨的其它位置或者移动到其它 的音轨。 切分音频 ·选择音频切片的区域范围,在所选音频上单击鼠标右 键,在快捷菜单中选择“Split”。 ·切分之后,可以通过选择 具栏中的移动 具,实现 将音频切片移动到当前音轨的其它位置或者移动到其它 的音轨。

合并音频波形 ·将单独的音频切片移动到一起,首尾连接。两个 音频切片会自动吸附在一起。实现无缝连接。同 理,可以实现多个独立音频切片的无缝连接,然 后使用Ctrl键将要合并的音频切片全部选中,执行 “Clip”/“Merge”/“Rejoin split”命令,实现合并音频。 合并音频波形 ·将单独的音频切片移动到一起,首尾连接。两个 音频切片会自动吸附在一起。实现无缝连接。同 理,可以实现多个独立音频切片的无缝连接,然 后使用Ctrl键将要合并的音频切片全部选中,执行 “Clip”/“Merge”/“Rejoin split”命令,实现合并音频。

锁定音频波形 ·选择需要进行时间锁定的一个或多个音频切片, 单击鼠标右键,选择快捷菜单中的Lock in Time 命令,被锁定的音频切片上会出现一个锁头的图 标,音频切片的位置被锁定。 锁定音频波形 ·选择需要进行时间锁定的一个或多个音频切片, 单击鼠标右键,选择快捷菜单中的Lock in Time 命令,被锁定的音频切片上会出现一个锁头的图 标,音频切片的位置被锁定。

编组音频波形 ·编组可以将多个音频切片组合成一个固定的音频 切片组,能够实现组内各个音频切片的相互位置 固定不变,这样可以对整个切片组进行整体移动。 实现方法是选取多个音频切片,单击鼠标右键, 在快捷菜单中选择“Group Clips”命令。 编组音频波形 ·编组可以将多个音频切片组合成一个固定的音频 切片组,能够实现组内各个音频切片的相互位置 固定不变,这样可以对整个切片组进行整体移动。 实现方法是选取多个音频切片,单击鼠标右键, 在快捷菜单中选择“Group Clips”命令。

删除和复制音频波形 ·删除:选中音频波形或者某个音频切片,单击鼠 标右键,在快捷菜单中选择“Delete”命令可以实现 删除。 ·复制:通过“Time selection Tool” 具选中需要 复制的区域范围,单击鼠标右键,在快捷菜单中 选择“Copy”进行复制,然后将位置指针移动到需 要粘贴的位置,单击鼠标右键,在快捷菜单中选 择“Paste”实现粘贴。 删除和复制音频波形 ·删除:选中音频波形或者某个音频切片,单击鼠 标右键,在快捷菜单中选择“Delete”命令可以实现 删除。 ·复制:通过“Time selection Tool” 具选中需要 复制的区域范围,单击鼠标右键,在快捷菜单中 选择“Copy”进行复制,然后将位置指针移动到需 要粘贴的位置,单击鼠标右键,在快捷菜单中选 择“Paste”实现粘贴。

包络编辑 • 包络编辑,可以实现特殊的音乐效果,例如淡 入淡出。每个音轨的上方都有一条绿色的包络 线,用鼠标单击包络线,会出现一个白色的控 制块,可以向下拖动控制块,实现对包络线的 绘制。 包络编辑 • 包络编辑,可以实现特殊的音乐效果,例如淡 入淡出。每个音轨的上方都有一条绿色的包络 线,用鼠标单击包络线,会出现一个白色的控 制块,可以向下拖动控制块,实现对包络线的 绘制。

时间伸缩编辑 Clip Time Stretching”, 然后将鼠标移动到音频切片的左下角或者右下 角有斜线的地方,当鼠标指针变成双向箭头时, 左右拖动鼠标,即可实现对音频的时间伸缩编 辑。 ·选择“View”/“Enable 时间伸缩编辑 Clip Time Stretching”, 然后将鼠标移动到音频切片的左下角或者右下 角有斜线的地方,当鼠标指针变成双向箭头时, 左右拖动鼠标,即可实现对音频的时间伸缩编 辑。 ·选择“View”/“Enable

噪声处理 ·噪声处理的目的是为了降低噪声对于声音的干扰, 使声音更加清晰,音质更加完美。常常也称降噪 处理。但是,降噪处理也会在一定程度上影响现 有音乐的品质,因此,降噪过程需要处理得当。 降噪处理有很多种方法,针对不同类型的噪音。 例如爆破音修复、嘶嘶声降低器和噪声降低器等。 在这里我们以噪声降低器为例,介绍降噪处理方法。 噪声处理 ·噪声处理的目的是为了降低噪声对于声音的干扰, 使声音更加清晰,音质更加完美。常常也称降噪 处理。但是,降噪处理也会在一定程度上影响现 有音乐的品质,因此,降噪过程需要处理得当。 降噪处理有很多种方法,针对不同类型的噪音。 例如爆破音修复、嘶嘶声降低器和噪声降低器等。 在这里我们以噪声降低器为例,介绍降噪处理方法。

噪声处理 ·降噪处理需要在单轨 编辑模式中进行。首 先选中一小段噪音, 然后在左侧的effect面 板中双击 “Restoration”/“Capure Noise Reduction Production”命令,进 行噪音捕获。 ·然后,选中整个需要 降噪的声音波形,双 击“Restoration”/“Noise 噪声处理 ·降噪处理需要在单轨 编辑模式中进行。首 先选中一小段噪音, 然后在左侧的effect面 板中双击 “Restoration”/“Capure Noise Reduction Production”命令,进 行噪音捕获。 ·然后,选中整个需要 降噪的声音波形,双 击“Restoration”/“Noise Reduction”命令,打开 降噪效果器。

音频特效处理 Audition 2. 0 软件 提供的多种效果器。主要包括均衡效果处理、混 响效果处理、压限效果处理、延迟效果处理等。 ·音频特效处理主要使用Adobe 音频特效处理 Audition 2. 0 软件 提供的多种效果器。主要包括均衡效果处理、混 响效果处理、压限效果处理、延迟效果处理等。 ·音频特效处理主要使用Adobe

均衡效果处理 ·均衡效果处理使用软件中的图形式均衡器来完成。进 入到单轨编辑模式,选择“Effect”/“Filter”/“Craphic Equalizer”命令,打开均衡器,通过调整不同频段上的推 子,改变增益或衰减,即可对音乐的效果进行初步处理。 均衡效果处理 ·均衡效果处理使用软件中的图形式均衡器来完成。进 入到单轨编辑模式,选择“Effect”/“Filter”/“Craphic Equalizer”命令,打开均衡器,通过调整不同频段上的推 子,改变增益或衰减,即可对音乐的效果进行初步处理。

混响效果处理 ·混响效果器可将干涩的声音处理为在空旷的房 间中具有多次反射回响的特殊效果。在单轨编 辑模式中,选择需要处理的声音波形,执行 “Effect”/“Delay Effect”/“Reverb”命令,打开混响 效果器。通过调整衰减时间、反射情况、干湿 音等实现对声音的混响效果处理。 混响效果处理 ·混响效果器可将干涩的声音处理为在空旷的房 间中具有多次反射回响的特殊效果。在单轨编 辑模式中,选择需要处理的声音波形,执行 “Effect”/“Delay Effect”/“Reverb”命令,打开混响 效果器。通过调整衰减时间、反射情况、干湿 音等实现对声音的混响效果处理。

压限效果处理 ·压限效果处理可以对声音的振幅进行控制,还可以改变输 入增益等,压限效果处理能对高音部分的声音效果进行限 制。其操作方法是在单轨编辑模式中,选择需要处理的音 频内容,选择“Effect”/“Amplitude”/“Hard Limiting”命令,打 开限制器窗口。 压限效果处理 ·压限效果处理可以对声音的振幅进行控制,还可以改变输 入增益等,压限效果处理能对高音部分的声音效果进行限 制。其操作方法是在单轨编辑模式中,选择需要处理的音 频内容,选择“Effect”/“Amplitude”/“Hard Limiting”命令,打 开限制器窗口。

延迟效果处理 ·延迟效果器可以 使单薄的声音变得 厚实丰满。 ·在单轨编辑模式 中,选择待处理波 形,选择 “Effect”/“Delay”命 令,打开延迟效果 器窗口。 延迟效果处理 ·延迟效果器可以 使单薄的声音变得 厚实丰满。 ·在单轨编辑模式 中,选择待处理波 形,选择 “Effect”/“Delay”命 令,打开延迟效果 器窗口。