计算机中的“音频格式”是什么?请举例说明。
采样速率:
数字音频系统通过将声波转换成一系列二进制数据来再现原始声音。实现这一步的设备是模数转换器(A/D),它以每秒上万次的速率对声波进行采样,每次采样记录下原始模拟声波在某一时刻的状态,称为样本。
一串样本可以连接起来描述一个声波,每秒的样本数称为采样频率或产量,单位为HZ(赫兹)。采样频率越高,可以描述的声频越高。对于每个采样系统,都会分配一定数量的存储比特来表示声波的振幅状态,称为采样分辨率或采样精度。每增加一位,表示声波振幅的状态数就会增加一倍,增加6db的动态范围状态,也就是6db的动态范围。一个2位的数字音频系统可以表示成千上万种状态,即12db的动态范围,以此类推。如果位数继续增加,采样精度会以非常快的速度提高。可以计算出16bit可以表示65536个状态,对应96db,而20bit可以表示1048576个状态,对应120db。24bit可以表示多达16777216个状态。对应144db的动态范围,采样精度越高,声波还原越精细。(注:动态范围是指声音从最弱到最强的范围)人耳的听觉范围通常是20HZ~20KHZ。
根据奈奎斯特采样定理,以正弦波的两倍频率采样,可以完全真实地还原波形,因此数字记录波的采样频率与其最高还原频率指数直接相关。比如以44.1KHZ的采样频率进行采样,可以还原最高频率22.05KHZ,略高于人耳的听觉极限。(注:可以录MD。比如R900的采样频率是44.1KHZ,有一个采样频率转换器,可以把输入的32KHz/44.1KHZ/48KHZ转换成本机的标准采样频率,足以记录和真实再现全世界所有人都能分辨的声音,所以CD音频的采样规格定义为6544。44KHZ,即使在现实生活中几乎不可能制造的高精度电子元件的最理想环境下实现16bit的录音,仍然会受到滤波和声音特定位等问题的困扰,人们仍然可以察觉到一些轻微的失真,所以很多专业的数字音频系统都使用了18bit甚至24bit进行录音和回放。
现有取样方法:
MP3:MP3的全称应该是MPEG1 Layer-3音频文件,MPEG(Moving Picture Experts Group)中文翻译为运动图像专家组,特指运动视频压缩标准。MPEG音频文件是MPEG 1标准的声音部分,也称为MPEG音频层。根据压缩质量和编码复杂度,分为三层,即Layer-1、Layer2和Layer3,分别对应三种声音文件,即MP1、MP2和MP3,根据不同用途采用不同级别的编码。MPEG音频编码级别越高,编码器越复杂,压缩比越高。MP1和MP2的压缩比分别为4: 1和6: 1-8: 1,而MP3的压缩比高达10: 1-12。但是,MP3对音频信号使用有损压缩。为了减少声音的失真,MP3采用了“感官编码技术”,即在编码时,对音频文件进行频谱分析,然后通过滤波器滤除噪声水平,再对剩余的比特进行量化分散排列,最终形成高压缩比的MP3文件,压缩后的文件在回放时可以达到更接近原始声源的声音效果。(另一个mp3 PRO:MP3 PRO编码器将录音分为两部分:MP3部分和PRO部分。mp3部分分析低频带的信息,并将其编码成正常的mp3文件数据流。这使得编码器能够集中精力对不太有用的信息进行编码,获得更好的质量编码效果。同时也保证了mp3PRO文件与老款mp3播放器的兼容性。PRO部分对高频带信息进行分析,将其编码为mp3数据流的一部分,这一点在老款mp3解码器中通常被忽略。新的mp3PRO解码器将有效地利用这部分数据流,将两段(高频带和低频带)组合起来,产生一个完整的音频带,从而增强音质。)
WMA:WMA是由微软开发的Windows Media Audio编码的文件格式。WMA针对的不是单机市场,而是网络!竞争对手是在线媒体市场上著名的Real Networks。微软声称,WMA可以在仅64kbps的比特率下实现接近CD的音质。与之前的编码不同,WMA支持防拷贝功能。它支持通过Windows Media Rights Manager添加保护,可以限制播放时间和次数,甚至是播放机器等等。WMA支持流媒体技术,即一边阅读一边播放,因此WMA可以轻松实现在线播放。因为它是微软的杰作,所以微软在Windows中增加了对WMA的支持。WMA具有优秀的技术特性,在微软的大力推动下,这种格式已经被越来越多的人所接受。
WAV:这是微软开发的一种古老的音频文件格式。WAV是一种文件格式,它符合piff资源交换文件格式规范。所有wav都有一个文件头,它是音频流的编码参数。WAV对音频流的编码没有硬性规定。除了PCM,几乎所有支持ACM规范的编码都可以对WAV的音频流进行编码。很多朋友没有这个概念。让我们以AVI为例,因为AVI和WAV在文件结构上非常相似,但AVI只有一个视频流。我们接触到的AVI有很多种,所以我们经常需要安装一些解码器来观看一些AVI。我们接触到的DivX,就是视频编码的一种。AVI可以使用DivX编码来压缩视频流,当然,它也可以使用其他编码压缩。同样,WAV也可以使用多种音频编码来压缩其音频流,但我们通常使用的是音频流经过脉码调制处理的WAV,但这并不意味着WAV只能使用脉码调制,MP3编码也可以在WAV中使用。就像AVI一样,只要你安装了相应的解码器,你就可以享受这些wav。在Windows平台下,基于脉码调制的WAV是支持最好的音频格式,所有音频软件都能完美支持。由于可以满足高音质的要求,WAV也是音乐编辑创作的首选格式,适合保存音乐素材。因此,基于脉冲编码调制的WAV被用作中间格式,其经常用于其他编码的相互转换,例如MP3到WMA。
Ogg Vorbis:号称MP3杀手!Ogg Vorbis从何而来?OGG是一个庞大的多媒体开发计划的项目名称,该计划将涉及视频和音频的编码开发。整个OGG项目计划的目的是为任何人提供一个完全免费的多媒体编码方案!OGG的信念是:开放!免费!沃比斯是特里·普拉特的奇幻小说《小神》中的花花公子。这个词成为OGG项目中音频编码的正式名称。目前Vorbis已经开发成功,并开发了编码器。Ogg Vorbis是一种高质量的音频编码方案。官方数据显示,Ogg Vorbis可以在相对较低的数据速率下实现比MP3更好的音质!Ogg Vorbis也远比90年代研发成功的MP3先进。它可以支持多个频道。这是什么意思?这意味着Ogg Vorbis可以在SACD、DTSCD和DVD音频(目前还没有)的支持下对所有声道进行编码,而不是MP3只对两个声道进行编码。多声道音乐的兴起给音乐欣赏带来了革命性的变化,尤其是欣赏交响乐时,会带来更多的临场感。这一革命性的变化超出了MP3的适应性。和MP3一样,Ogg Vorbis是一种灵活开放的音频编码,在编码方案已经固定的情况下,可以明显的调整音质,改进新的算法。所以它的音质会越来越好。与MP3类似,Ogg Vorbis更像是一个音频编码框架,可以通过引入新技术不断完善。像MP3一样,OGG支持VBR。
Ra: Ra是RealAudio格式,是互联网用户接触比较多的一种格式。音乐网站的在线试听大多采用RealAudio,完全是针对网络上的媒体市场,支持非常丰富的功能。最大的忽悠就是这种格式可以根据观众的带宽来控制自己的码率,在保证流畅度的前提下尽可能的提高音质。RA可以支持多种音频编码,包括ATRAC3。和WMA一样,RA不仅支持边玩边读,还支持使用特殊协议隐藏文件的真实网络地址,实现只在线玩不下载的欣赏模式。这对唱片公司和唱片销售公司来说非常重要。在各方的大力推动下,RA和WMA是互联网上在线试听使用最广泛的音频媒体格式。
APE:APE是猴子音频提供的无损压缩格式。Monkey的音频提供了Winamp插件支持,所以这意味着压缩后的文件不再是简单的压缩格式,而是可以像MP3一样播放的音频文件格式。这种格式的压缩比远低于其他格式,但却能做到真正的无损,因此赢得了很多热心用户的青睐。在众多无损压缩方案中,APE是一种性能出众、压缩比令人满意、压缩速度快的格式,成为很多朋友私下交流发烧音乐的不二选择。
ACC:AAC(高级音频编码)是杜比实验室为音乐社区提供的技术。AAC声称“它可以容纳多达48声道的音轨,采样率为96 KHz,可以提供5.1声道的音乐节目,质量相当于ITU-R广播,数据速率为320Kbps”。与MP3相比,音质更好,可以节省30%左右的存储空间和带宽。它是根据MPEG-2的规范开发的技术。
ATRAC 3/ATRAC 3 Plus:ATRAC 3(Adaptive Transform acoustic Coding 3)由日本索尼公司开发,是MD采用的ATRAC的升级版,其压缩比(约为ATRAC的两倍)和音质与MP3相当。压缩原理包括同时掩蔽、老化掩蔽和等响度曲线,和MP3差不多。ATRAC3的版权保护功能使用了OpenMG。目前对应ATRAC3的便携播放器主要是索尼自己的产品。然而,2000年2月,该公司与富士通、日立、NEC、罗门、三洋和TI等半导体制造商签署了专利许可协议,为ATRAC3制造和销售LSI。