这些因素中哪一个与音频文件的音质关系最大?
龙天使]
说起mp3,恐怕没人会说没听过。即使你不是mp3用户,你也会对互联网上无处不在的广告、宣传活动、朋友间的讨论和丰富的资源印象深刻。对于时尚的年轻人,尤其是喜欢音乐和数码设备的朋友来说,mp3大概是每天都要背的一个词。但是什么是mp3呢?如何确定MP3的音质?如何听高质量的MP3?我觉得下面这篇文章可以帮你解决很多问题。
纵观现在的mp3用户,公认的通用制作标准是eac ripping +lame compression。我也用这个搭配。在这个制作过程中,有经验的朋友会摸索出一些窍门。不同的音乐使用不同的参数设置和压缩比,范围从标准的128kbps到最大的320kbps。但是这些比特率之间有什么区别和不同呢?是最合适的压缩比。cbr和vbr应该选择哪个更好,等等。这些问题都是大家经常讨论的。为了把这些细节说清楚,我特意做了一个有针对性的实验。我来和大家分享一些感受。
我很喜欢听古典音乐,所以巴赫的曲目1:慕尼黑巴赫乐团。轨迹抓取软件eac。压缩软件cd`ex。玩软件fooba2000 v0.8版本。视听耳机是舒尔的er6和E3。由于古典音乐中细节多,乐队大,各方面质量要求高,所以能很明显的体现出不同处理方式之间细节上的差异。
(后面会提供频谱对比图)
我先用rac抓取了曲目,然后在cd`ex软件中用lame MP3编码器(Vision 1.92 Engine 3.92)引擎处理了wav文件。我一个接一个地试验蹩脚的参数,以选择好的结果:
第一个参数,线程优先级,分别是最高和最低的。当其他参数相同时,比较被压缩。发现线程优先级对声音没有影响。生成的文件大小是相同的。比较起来声音一样,所以这个参数对音质没有影响。
第二个参数是版本。有mpegI.mpegII和mpegII。可以选择的v。其他参数相同。它们分别用这三个选项压缩了三次。通过对比,虽然三种方式的文件大小相同,但mpegI的实际听感更好。中低频压缩比略小,但高频失真略多。比较适合听人声和流行音乐。听着。古典的mpegI型也不错,音底更好。但如果是小提琴等高频率的独奏音乐,可以推荐使用mpegII.v型,效果会更好。
第三个参数是最重要的。这是码率。选择它将直接影响你的mp3文件的大小和听感。高压缩比会造成很大的失真,低压缩比会造成很小的失真。但是怎样才能找到一个双方都能接受的平衡点呢?这需要在实验中仔细探索。考虑到低比特率的文件音质不适合播放音乐,最低128kbps。四个固定比特率文件(128.192.256.320 * *)用于比较和测试。
128kbps的压缩比还是比较粗糙的。压缩后高频部分失真非常明显。听起来空洞、干瘪、刺耳。经常有闪烁的声音。这些乐器的质地很差。有些乐器已经变了味道。你甚至可能听错了。一段音乐在3: 39的压缩音量是3414kb。虽然音量不大,但是声音不尽如人意。有很大的缺陷。
相比192kbps,128的压缩效果要好很多。首先声音是立体的,至少没有空洞感,高频失真小很多。声音紧凑,噪音小而干净,达到了比较理想的听音效果。只是压缩还是比较厉害,细节表现还是不太好。乐器尤其是管乐器的质感还是很硬,不真实,缺少音乐感。5123kb。我觉得这个压缩比对于一个容量为128-256m的mp3播放器来说比较好。既能满足基本的听觉,又能大小合适。128m可以存储95分钟左右的音乐,256m可以翻倍到190分钟的音乐。
相比192,256kbps的压缩率在音质上自然更高。以曲目前10秒为例。大提琴部分的低频颗粒感要小很多。声音更加流畅自然。质感和质感更清晰。有很多细节。气氛的渲染更加突出。后面几首曲目中的声部旋转也表现得更加淋漓尽致。大信号和小信号的清晰度也有所提高。一些。声音更加细致,好听。但与此同时,文件大小突然增加到了68,365,438+0 KB,对于一个256m的mp3播放器来说还是可以承受的。通过计算不难知道,在码率为256的情况下,大约可以存储135分钟的音乐。总的来说,足够了。128m有点少。
320kbps是lame能提供的最大比特率。最终生成的文件为8592kb,比wav文件的37M大了8.4M左右,压缩比基本为4.5:1。但是,生成的mp3文件听起来非常失真。相比其他码率,320的天然优势显而易见。音色,细节等等都很精致。基本上已经做到了原样复制cd的音质。不要在带mp3播放器的cd播放器上听起来像。基本没有区别。不过我用的是高分辨率的高端耳塞。再加上我在音乐和设备方面的经验和能力,还是听出了很多和wav文件相比的不同。首先,压缩的mp3听起来有点干瘪。没有wav文件听起来也很活泼动感。结尾细节,泛音,空间感都没有wav文件高。不过音色上挺接近的,但是表现力差。数码味浓。所以如果你用的是ipod之类的微型硬盘播放器,我还是推荐你用320kb。ps的压缩比。这样可以获得最佳的听感。当然直接听wav最好——不压缩。不亏。可惜没有随身听支持ape无损压缩。不然选择多了。
我上面说的是固定比特率的压缩比。在lame中,这被称为CBR(即不变比特率)。其实lame最大的特点就是为用户提供了可变比特率VBR的压缩方式。这种方法会自动降低比特率,并在某些暂停时减小文件大小。这是一种非常好的编码方法。但是如何选择VBR的最低和最高比特率范围来获得最合适的文件和声音质量呢?这又是一个需要实验解决的问题。同样,考虑128kbps作为基本值,我们选择96kbps到160kbps进行压缩。压缩后的文件大小为3801kb,只比CBR的128kbps多了387kb。但是声音绝对提升了一个大的层次。至少小了一半。虽然细节上有很多噪点,但第一听觉还是比128kbps强很多。压缩后的平均码率为147kbps,也非常节省空间。后来又从96kbps到192kbps.96kbps到224kbps.96kbps到320kbps进行了实验。发现它们与最大cbr压缩音质相似,即vbr从96kbps到192kbps的声音与CBR相似,但前者为4481kb,后者为5123kb。所以vbr作为一种追求高音质和节省空间的折中方法,确实有用。当然,另一方面,
第四,模式参数是立体的。j立体声。强制立体声和单声道。对比测试表明,标准立体声效果最好。虽然压缩文件大小最大,但是考虑到文件大小差异小,音质差异和听感,立体声还是比较理想的。
第五,压缩法。软件里有vbr-old.vbr-new等两种,但是只有前两种好用。对比新旧vbr编码方式,发现旧的在音质上更细腻,但是旧的压缩速度很慢,几乎是新的5.6倍。做一首歌差不多要3.4分钟,非常难用,文件大小也是6540。
Mp3吧不是凭空造出来的词,而是一个技术术语的缩写,也就是MPEG-1 AudioLayer-3的缩写拼写。这是什么意思?我给你解释一下:MPEG-1 AudioLayer-3是MPEG-1国际标准技术协议中音频部分的第三层协议。它描述了一种音频格式。看起来复杂吗?一点一点的说也没关系。首先,mpeg -这个词是Moving Picture Exp-erts Group的缩写,意思是运动图像压缩处理组。这个团体相当强大。它专门开发动态静态视频(包括音频)。几乎所有的国际技术标准。我们用他们的研究成果从电视到电影,从vcd到dvd。mp3是他们的mpeg1协议的一部分。音频部分在三楼,所以叫mp3。据我所知,mp3的诞生是mpeg集团的工作人员在不知不觉中发现的。它是作为一种捕获cd音轨的方法而产生的。顶多是当时实验中的附属产品。我们一起去看看吧。
首先,大小小:根据不同的压缩比可以得到不同大小的文件大小。不过和原来的wav格式相比,尺寸要小很多。文件大小小,存储空间小,用于播放的硬件设备的尺寸和成本都会显著降低,所以有很好的市场。另外,mp3文件到处下载。相对于cd机用户要不停的买软件,自然是一种节约。再次:用。无论你想要什么。一个小球员可以很容易地随身携带。我可以随心所欲地使用它。而且由于播放器的电路部分功耗比较低,单块电池的工作时间也长,省去了很多更换电池的麻烦。此外,用户可以随意一起听自己喜欢的歌曲,而不必受制于音像发行商的成型软件。自由度很大。这让我想起了周杰伦为动感地带[我的地盘]打广告的一句广告语。我说了算!“真酷——!!
说了这么多相关的话,肯定让大家都等不及了。下面就深入主体,为大家透彻分析mp3的方方面面。
一、基础知识:
数字压缩音频和mp3技术;
要说mp3,我得先说数字压缩音频。嗯,数字压缩音频顾名思义就是压缩数字音频。但是什么是数字音频呢?什么是压缩?下面是一些专业的解释。感兴趣的朋友要仔细看!
在计算机的数字世界里,声音都是以数字编码的方式存储的,不同于传统生活中的模拟音频。因为计算机只能记录0和1的数字,所以模拟音频必须进行定量采样。根据奈奎斯特采样定理。以两倍于正弦波频率的频率进行采样可以完全真实地还原波形。因此,数字记录波的采样频率与其最高恢复频率指数直接相关。比如以44.1KHZ的采样频率进行采样,可以还原最高频率22.05KHZ,略高于人耳的听觉极限。所以a/ D转换通常使用44.1KHZ以上的采样频率。但是,由于采样频率(通常以Hz为单位)和采样比率(通常以比特为单位),声学数据的文件大小是不同的。采样频率越高,所需的存储空间就越大。采样率越高,所需的存储空间就越大。这给实际操作带来了困难。因此,压缩技术的出现成为必然。
数字压缩是指“瘦身”已采样的原始数字音频文件。利用一些有效的算法和方法,可以去掉文件中的冗余信息。这样可以减小体积,方便使用。具体操作太复杂太专业了(连我这个计算数学的学生都看硬)。所以就不一一给你解释了。这里只简单解释一下压缩中涉及的MP3压缩编码技术:MP3压缩编码使用了最小听觉阈值、掩蔽效应和比特存储槽五项重要技术。JointStereo和huffman编码相结合。通过这些技术计算机的计算,我们可以大大减少数字音频的文件大小。压缩后产生的新音频格式是我们熟悉的mp3。
2.压缩原理:
无论什么技术,都要有自己的道理。音频技术尤其如此,因为它直接关系到我们的听觉。为什么压缩后的mp3听起来很接近cd的声音?这和人的生理结构有很大的关系。实验表明,人类能够听到的声音的频率范围(音频)。是20Hz-20kHz。但人耳对整个音频频段内声音的反应并不直。2-5kHz是人耳最敏感的频段。根据其特点,将整个音频频带划分为若干个临界频带。因为人类的听觉系统是根据频率来区分声音能量的,任何频率的小声音都会因为掩蔽效应而被临界频带内音量较大的声音所覆盖。MP3并没有对其进行量化,从而去掉了人类听觉系统所没有的东西。可以看出,mp3是一种有损音频压缩编码。所以不管多高的码率,MP3都是有损压缩。音质比cd低,但多少可以接受。因人而异。
3.压缩后的音质:
这是大家最关心的话题。压缩后的声音能达到什么样的标准?先给你一张图表。让我们看看mpeg标准中的参考值。
可以看出,由于压缩比的不同,得到的声音文件的质量在逐渐提高。128kbps基本达到cd音质。是这样吗?我的回答是:当然不是。这只是一个官方参考数据表。在实际使用中,. 128的码率根本无法表现一张cd的音质。虽然mp3压缩过程中使用的软件算法会有所不同,但压缩比是限制其性能的最根本因素。
Lame不是市面上唯一的压缩软件,mp3也不是唯一的音频压缩格式。其他公司也开发了很多有用的压缩格式,但是由于各种原因没有像mp3一样普及。但是,作为压缩音频家族的一员,我想在这里把它们介绍给你,让你了解更多。
1.猿:
APE格式:猴子的音频(
www.monkeysaudio.com
).简单来说,ape是音频的无损压缩格式。它的大小只有wav文件的一半,但音质丝毫没有降低。可以最大程度的还原CD的音质。当然也要看抓轨质量。如果抓轨质量好,ape的音质会和CD差不多,这是mp3等有损压缩无法做到的。当然,无损的代价是体积的增加。1CD的范围从200mb到400mb。因此,如果有足够的带宽,ape为用户交换CD带来了更多的便利,满足了很多古典音乐爱好者传输高质量CD的需求。一张80分钟的音乐CD大约有700米。传输这么大的尺寸显然很不方便。此时使用Monkey " " audio-可以将WAV文件压缩成一半大小(甚至更小)的APE文件。在理想状态下,当你把它。
优点:压缩比高,音质好。加载插件后,可以直接用Winamp播放。音质比任何参数的Mp3或Mp3 Pro都要好。
缺点:压缩解压时间过长。
2.MP3专业版
为了降低失真度,出现了一种新的MP3格式,MP3 Pro。它将整个音频频带分成两个通道,中低频通道和高频通道。传统的MP3编码器负责中低频通道,另一种采用SBR技术(频段复制/)。解码器负责高频部分。最后两者同时在MP3 Pro播放软件中播放,使得相同码率的MP3音质明显优于MP3。不仅高频细节丰富,而且颤抖现象不易察觉,非常接近原始WAV文件。
MP3 Pro采用的SBR技术并不是直接对音乐中的高频进行分离编码那么简单,而是基于对原编码器传输的低频信号进行分析,从而重构出高频信号。
3.真实音频
真实音频。扩展RA:这种格式真的是网络的灵魂。其强大的压缩和最小的失真使它在众多格式中脱颖而出。和MP3一样,也是为了解决网络传输带宽资源。所以主要目标是压缩比和容错,其次是音质。因此,我们通常在网上用这种格式进行新音乐试听。
3.WMA
WMA是由Windows Media Audio编码的文件格式。它是由微软开发的。WMA的目标不是单机市场。是网络!竞争对手是在线媒体市场上著名的Real Networks。微软声称,WMA仅用64kbps的比特率就可以达到接近CD的音质。与以前的编码不同,WMA支持防复制功能。她支持通过Windows Media Rights Manager进行保护,可以限制播放时间和次数,甚至是播放机器等。WM。a支持流媒体技术,即边看边播放,因此WMA可以轻松实现在线播放。因为它是微软的杰作,所以微软在Windows中增加了对WMA的支持。WMA具有优秀的技术特征。随着微软的大力推广,这种格式被越来越多的人接受。相对于ra,版权大概是用户最讨厌的地方。
4.ACC:
AAC(高级音频编码)是杜比实验室为音乐社区提供的一项技术。AAC声称“它可以容纳多达48声道的音轨,采样率为96 KHz,可以提供5.1声道的音乐节目,质量相当于ITU-R广播,数据速率为320Kbps”。相比MP3,它的音质更好,还能节省30%左右的存储空间和带宽。它是根据MPEG-2的规范开发的技术。松下的mp3产品都采用这种编码方式,当然兼容mp3格式。我自己用的时候发现aac是一种非常好用的音频格式。128kbps的aac足以和224kbps的mp3抗衡,但空间几乎小了一半。但是aac和mp3编码的风格在空间和结构上是不一样的。我喜不喜欢是见仁见智的问题。
5.ATRAC 3/ATRAC 3 plus:
ATRAC 3(自适应变换声学编码3)是由日本索尼公司开发的。它是MD采用的ATRAC的升级版,压缩比是ATRAC的两倍左右。而压缩原理包括同时掩蔽、老化掩蔽和等响度曲线,类似于MP3。ATRAC3的版权保护功能是OpenMG。目前对应ATRAC3的便携播放器主要是索尼自己的产品。然而,该公司与富士通、日立、NEC等半导体制造商签订了合同。罗门、三洋和TI于2000年2月制造和销售A。TRAC3使用LSI的专利许可协议。与mp3相比,用mdlp压缩录制cd还是有一定的声音优势的。但是版权问题,使用起来很不方便。ATRAC3 Plus由于算法先进,音质得到了进一步的提升,但只在索尼产品中广泛使用。这是相当令人沮丧的。
6.VQF:
所谓VQF指的是Twinvq(变换域加权间接矢量量化),也就是日本的NTT(日本电报电话公司)。由NTT人机界面实验室开发的音频压缩技术。这项技术得到了著名的雅马哈公司的支持。VQF是其档案的延伸。在实现方法上类似于MP3。它通过使用失真算法来压缩声音。然而,与MP3压缩技术相比,它有着本质的不同:VQF的目的是压缩音乐而不。它是声音的压缩。所以vqf采用了一种叫做“矢量量化”的压缩技术。该技术首先对音频数据进行矢量化,然后对音频波形中相似的波形部分进行统一平滑,对人耳敏感的部分进行加强。最后,对处理后的矢量数据进行量化,然后进行压缩。我在自己的使用中感觉VQF比同音质的mp3要好很多。