请介绍并比较上的音频格式(专业)。
脉码调制(原始数字音频信号流)
类型:音频
由ITU-T制定。
所需带宽:1411.2kbps。
特点:音源信息完整,但冗余过大。
优点:音源信息保存完整,音质好。
缺点:信息量大,体积大,冗余过多。
应用领域:网络电话
版税方法:免费
备注:在计算机应用中,脉码调制可以达到最高的保真度,广泛用于素材保存和音乐欣赏,也用于CD、DVD和我们常见的WAV文件中。所以PCM惯例变成了无损编码,因为PCM代表了数字音频中最好的保真度水平,并不意味着PCM可以保证信号的绝对保真度,PCM只能最大程度的实现无限接近。计算一个PCM音频流的码率非常容易,采样率×采样大小×通道数bps。采样率为44.1KHz,采样大小为16bit的脉码调制WAV文件,数据速率为44.1k×16×2 = 141.2 kbps。我们常见的音频CD采用脉码调制,一张CD的容量只能容纳72分钟的音乐信息。
WMA(Windows Media音频)
类型:音频
制造商:微软公司
所需带宽:320 ~ 112 kbps(压缩10 ~ 12倍)
特点:在码率小于128K的情况下,WMA在几乎所有同级别的有损编码格式中表现最好,但似乎128k对WMA来说是个门槛。当比特率上升时,音质不会有太大变化。
优点:码率小于128K时,WMA效果最好,编码的音频文件非常小。
缺点:当比特率大于128K时,WMA失去了太多的音质。WMA标准不是开放的,它是由微软控制的。
应用领域:网络电话
提成方式:单独收取。
备注:WMA,全称Windows Media Audio,是微软推出的一种新的音频格式,与MP3格式齐名。由于WMA在压缩比和音质上超越MP3,远优于RA(Real Audio),所以即使在低采样频率下也能产生更好的音质。此外,WMA拥有微软Windows Media Player的强大后盾,因此它一推出就赢得了掌声。
自适应差分PCM
类型:音频
由ITU-T制定。
所需带宽:32Kbps
特点:ADPCM(自适应差分脉冲编码调制)结合了APCM的自适应特性和DPCM系统的差分特性,是一种性能良好的波形编码。
其核心思想是:
(1)通过使用自适应思想改变量化步长的步长,即使用小的量化步长来编码小的差异,使用大的量化步长来编码大的差异;
②利用过去的样本值来估计下一个输入样本的预测值,使实际样本值与预测值之差总是最小的。
优点:算法复杂度低,压缩比低(CD音质>;400kbps),编解码延时最短(与其他技术相比)。
缺点:音质一般。
应用领域:网络电话
版税方法:免费
备注:ADPCM (ADPCM自适应差分脉码调制)是一种用于16bit(或更高?)一种声音波形数据的有损压缩算法,将声音流中每次采样的164bit数据存储为4bit,因此压缩比为1:4,压缩/解压缩算法非常简单,是一种低空间消耗获得高质量声音的好方法。
线性预测编码
类型:音频
制造商:
所需带宽:2Kbps-4.8Kbps
特点:压缩比高,计算量大,音质低,价格低。
优点:压缩比高,成本低。
缺点:计算量大,语音质量差,自然度低。
应用领域:网络电话
版税方法:免费
备注:参数编码又称声源编码,是在频域或其他正交变换域从源信号中提取特征参数,转换成数字码进行传输。解码是逆过程,对接收到的数字序列进行变换,恢复特征参数,然后根据特征参数重构语音信号。具体地,参数编码试图通过提取和编码语音信号的特征参数来使重构的语音信号尽可能准确,但是重构的语音信号的波形可能与原始语音信号的波形有很大不同。例如,线性预测编码(LPC)和各种其他改进都属于参数编码。编码比特率可以压缩到2Kbit/s-4.8Kbit/s甚至更低,但语音质量只能达到中等,特别是自然度较低。
码激励线性预测
类型:音频
制造商:欧洲通信标准协会(ETSI)
所需带宽:4 ~ 16 kbps。
特点:提高语音质量;
①利用人类听觉的掩蔽特性,对误差信号进行感官加权,提高语音的主观质量;
(2)基音预测通过分数延迟进行改进,使得浊音语音更加准确,特别是提高了女声的质量;
③采用修正的MSPE准则寻找“最佳”延迟,使得基音周期延迟的出现更加平滑;
④根据长时预测的效率,调整随机激励向量的大小,提高语音的主观质量;
⑤使用基于信道误码率估计的自适应平滑器,可以在高信道误码率条件下合成高自然度的语音。
结论:
(1) CELP算法可以在低码率编码环境下达到满意的压缩效果;
②使用快速算法可以有效降低CELP算法的复杂度,使其完全实时化;
(3) ③CELP可以成功地对各种类型的语音信号进行编码,这种适应性对于真实环境更为重要,尤其是在背景噪声存在的情况下。
优点:它以非常低的带宽提供清晰的语音。
缺点:-
应用领域:网络电话
版税方法:免费
备注:1999年,欧洲通信标准协会(ETSI)推出了基于码激励线性预测(CELP)的自适应多速率语音编码器(AMR),其最低速率为4.75kb/s,达到通信质量。CELP码激励线性预测是码激励线性预测的缩写。CELP是近10年来最成功的语音编码算法。CELP语音编码算法利用线性预测提取声道参数,使用一个包含许多典型激励矢量的码本作为激励参数,每次编码时在这个码本中搜索一个最优激励矢量,这个激励矢量的编码值就是这个序列在码本中的序号。
CELP被许多语音编码标准采用,美国联邦标准FS1016是CELP的编码方法,主要用于高质量窄带语音保密通信。Celp(码激励线性预测)这是一种简化的LPC算法,以低比特率(4800-9600Kbps)、清晰的语音质量和对背景噪声的高抗扰度而闻名。CELP是中低比特率下广泛使用的语音压缩编码方案。
MPEG-1音频层1
类型:音频
制造商:MPEG
所需带宽:384kbps (4倍压缩)
特点:编码简单。数字盒式磁带、2声道和VCD中使用的音频压缩方案是MPEG-1第一层..
优点:与时域压缩技术相比,压缩方式要复杂得多,编码效率和音质也大大提高,编码延迟也相应增加。它可以实现“完全透明”的音质(EBU音质标准)
缺点:带宽要求高。
应用领域:网络电话
版税方法:免费
备注:MPEG-1音频压缩编码是第一个高保真音频数据压缩的国际标准,分为三个级别:
-Layer 1(Layer 1):简单编码,用于数字盒式录音磁带。
-第2层:该算法具有中等复杂度,用于数字音频广播(DAB)和VCD等。
-第三层:编码复杂,用于高质量声音在互联网上的传输,如10倍的MP3音乐压缩。
Musicam (MPEG-1音频层2,MP2)
类型:音频
制造商:MPEG
所需带宽:256 ~ 192 kbps(压缩6 ~ 8倍)
特点:算法复杂度适中,用于数字音频广播(DAB)和VCD,有两个通道。MUSICAM因其适当的复杂度和出色的音质,广泛应用于数字演播室、DAB和DVB等数字节目的制作、交换、存储和传输。
优点:与时域压缩技术相比,压缩方式要复杂得多,编码效率和音质也大大提高,编码延迟也相应增加。它可以实现“完全透明”的音质(EBU音质标准)
缺点:
应用领域:网络电话
版税方法:免费
备注:同MPEG-1音频层1。
MP3(MPEG-1音频层3)
类型:音频
制造商:MPEG
所需带宽:128 ~ 112kbps(压缩10 ~ 12倍)。
特点:复杂编码,用于互联网上的高质量声音传输,如MP3音乐压缩10倍,2声道。MP3是一种基于MUSICAM和ASPEC优点的混合压缩技术。当时MP3的复杂度比较高,不利于实时编码。但由于其低比特率下的高水准音质,MP3成为了软解压和网络播放的宠儿。
优点:压缩比高,适合互联网通信。
缺点:MP3在128KBitrate或以下时,会有明显的高频损耗。
应用领域:网络电话
版税方法:免费
备注:同MPEG-1音频层1。
MPEG-2音频层
类型:音频
制造商:MPEG
所需带宽:与MPEG-1层1、层2和层3相同。
特点:MPEG-2使用与MPEG-1相同的编解码器,层1、层2、层3的结构相同,但可以支持5.1和7.1声道的环绕声。
优点:支持5.1声道和7.1声道的环绕声。
缺点:-
应用领域:网络电话
提成方式:单独收取。
备注:MPEG-2使用与MPEG-1声音相同的编解码器,层1、层2、层3的结构相同,但可以支持5.1声道和7.1声道的环绕声。
高级音频编码
类型:音频
制造商:MPEG
所需带宽:96-128 kbps。
特点:AAC可以支持1到48的任意数量的音频通道组合,包括15低频效果通道、配音/多声部通道、15数据通道。可同时传输16个节目,每个节目的音频和数据结构可任意指定。
AAC的主要可能应用集中在互联网通信、数字音频广播,包括卫星直播和数字AM,以及数字电视和影院系统。AAC使用非常灵活的熵编码核心来传输编码频谱数据。拥有48个主音频通道,16个低频增强通道,16个集成数据流,16个配音,16个编曲。
优点:支持多个音频通道组合,提供高品质音质。
缺点:-
应用领域:网络电话
提成方式:一次性收取
备注:AAC于1997年形成了国际标准ISO 13818-7。高级音频编码——AAC已经开发成功,成为继MPEG-2音频标准(ISO/IEC13818-3)之后的新一代音频压缩标准。
在MPEG-2的早期,最初是为了保持其音频编码部分兼容MPEG-1。但后来为了满足广播电视的要求,定义为可以获得更高质量的多声道音频标准。这个标准自然和MPEG-1不兼容,所以叫MPEG-2AAC。换句话说,从表面上看,制作和播放AAC,需要使用与MP3完全不同的工具。
人力资源(部)
类型:音频
制造商:飞利浦
所需带宽:8Kbps
特点:目的是增加GSM网络的容量,但会损害语音质量;由于网络频率不足,一些大型运营商在大城市人口密集区开通了这种方式来增加容量。
优点:系统容量大。
缺点:音质差
应用领域:GSM
版税方法:根据具体情况收取
备注:HR半速率是一种GSM语音编码方法。
神父
类型:音频
制造商:飞利浦
所需带宽:13Kbps
特点:是GSM手机通用的通信编码方式,可以达到4.1左右的语音通信质量(ITU规定语音通信质量Qos满分为5)。
优点:语音质量有所提升。
缺点:系统容量降低。
应用领域:GSM
版税方法:根据具体情况收取
备注:FR全速率是一种GSM语音编码方法。
电子故障报告(electronic failure report)
类型:音频
制造商:飞利浦
所需带宽:13Kbps
特点:可用于基于13Kbps全速率的GSM手机语音编码和传输,可获得更好更清晰的语音质量(接近Qos4.7)。手机只能与网络服务提供商合作来启用此网络功能。
优点:音质好。
缺点:网络服务商需要开通此网络功能,系统容量降低。
应用领域:GSM
版税方法:根据具体情况收取
备注:EFR增强型全速率,一种GSM网络语音编码方法。
自适应多速率
类型:音频
制造商:飞利浦
所需带宽:8Kbps(4.75 Kbps~12.2 Kbps)
特点:语音可替换静音,平滑噪音,支持间歇传输,动态检测语音。它可以在各种网络条件下提供高质量的语音效果。
优点:音质优秀。
缺点:-
应用领域:GSM
版税方法:根据具体情况收取
备注:GSM-ASM是一种广泛应用于GPRS和W-CDMA网络的音频标准。GSM-AMR在ETSI GSM06.90规范中定义,AMR语音编码是GSM2+和WCDMA的默认编码标准,是第三代无线通信系统的语音编码标准。GSM-AMR标准基于ACELP(代数激励线性预测)编码。它可以在广泛的传输条件下提供高质量的语音效果。
EVRC(增强型可变速率编码器)
类型:音频
制造商:美国高通通信公司(高通)。
所需带宽:8Kbps或13Kbps。
特点:支持三种比特率(9.6 Kbps,4.8 Kbps和1.2 Kbps),噪音抑制和邮件过滤。它可以在各种网络条件下提供高质量的语音效果。
优点:音质优秀。
缺点:-
应用领域:CDMA
版税方法:根据具体情况收取
备注:EVRC编码广泛用于CDMA网络。EVRC标准遵循TIA IS-127的内容。EVRC编码基于RCELP(宽松码激励线性预测)标准。编码可以以速率1(171比特/分组)、速率1/2(80比特/分组)或速率1/8(16比特/分组)的容量操作。根据要求,它还可以产生0位/包。
高通码激励线性预测。
类型:音频
制造商:美国高通通信公司(高通)。
所需带宽:8k语音编码算法(可工作在4/4.8/8/9.6Kbps等固定速率,可工作在800Kbps~9600Kbps之间的可变速率)。
特征:使用适当的阈值来确定所需的速率。QCELP是一种8k的语音编码算法(在8k的速率下可以提供接近13k的语音压缩质量)。这是一种变速率语音编码,是一种基于人类语音特点的优化技术(我们应该可以理解,在日常的交流和交流中,我们并不总是以一种恒定的方式说话,断断续续的、不同的音频都是人类的自然表现)。
优点:语音清晰,背景噪音低,系统容量大。
缺点:不自由
应用领域:CDMA
特许权使用费法:为使用权支付年费。
备注:QCELP,即高通码激励线性预测(高通激励线性预测编码)。美国高通通信公司的专利语音编码算法是北美第二代数字移动电话(CDMA)的语音编码标准(IS95)。这种算法不仅可以工作在4/4.8/8/9.6 kbit/s的固定速率,还可以工作在800 bit/s到9600 bit/s之间的可变速率,QCELP算法被认为是迄今为止效率最高的算法,其主要特点之一是使用合适的阈值来确定所需的速率。阈值随着背景噪声水平而变化,使得背景噪声被抑制,并且即使在嘈杂的环境中也可以获得良好的语音质量。CDMA8Kbit/s的语音类似于GSM 13mbit/s的语音..CDMA采用QCELP编码等一系列技术,语音清晰,背景噪声低。其性能明显优于其他无线移动通信系统,语音质量可与有线电话媲美。无线辐射很低。
本文来自:我爱R&D网(52RD.com)-R & D大本营
详细来源:/blog/detail _ rd . blog _ zcy _ lhj _ 20876.html。