abr算法

发布时间: 2023-06-17 00:12:38

⑴ AAC与MP3格式对比好在哪

AAC比MP3格式有以下的优势：

一、ACC比MP3音质更佳

AAC相较于mp3，AAC格式的音质更佳，文件更小。与MP3不同，它采用了全新的算法进行编码，更加高效，具有更高的“性价比”。使用AAC格式可以让人感觉音质更小，没有明显的降低。

Mp3以较低的比特率编码，所以编码器的错误更明显，听起来像回声。

二、ACC比MP3更算法更高级

AAC所采用的运算法则与MP3的运算法则有所不同，AAC通过结合其他的功能来提高编码效率。AAC的音频算法在压缩能力上远远超过了一些以前的压缩算法（如MP3等）。

它还支持多达48个磁道、15个低频磁道、更多采样率和比特率、多语言兼容性和更高的解码效率。它被称为48声道的音轨，采样率为96khz，数据速率为320kbps，为5．1声道的音乐节目提供相当于ITU－R广播的效果。

三、ACC比MP3更先进

AAC格式出现于1997年，基于MPEG－2的音频编码技术。弗劳恩霍夫二世，杜比实验室。

MP3在1991年由位于德国埃尔朗根的研究组织Fraunhofer－Gesellschaft的一组工程师发明和标准化的。

⑵ MP3 编码恒定码率(CBR) 跟平均码率(ABR) 是什么东西..还有32~320 kbps 这些代表什么.是不是越高音质越好

VBR是动态编码
最高应该是320Kbps
MP3的全称是MPEG(MPEG：Moving Picture Experts Group) Audio Layer-3，1993年由德国夫朗和费研究院和法国汤姆生公司合作发展成功。MP3是一种有损的压缩方式，早期的MP3编码采用的的是固定编码率的方式（CBR ），我们常看到的128KB/S，就代表每秒的数据流量有128KBIT，而且是固定的，这个称之为比特率，比特率本身是可以改变的，最高可以到320KBPS，当然比特率越高音质越好，但是文件的体积会相应增大。

因为MP3的编码方式是开放的，你可以在这个标准框架的基础上自己选择不同的声学原理进行压缩处理，所以，很快由Xing公司推出可变编码率的压缩方式（VBR）。它的原理就是利用将一首歌的复杂部分用高 bitrate 编码，简单部分用低 bitrate 编码，通过这种方式，进一步取得质量和体积的统一。当然，早期的Xing 编码器的 VBR 算法很差，音质与 CBR （固定码率）相去甚远。但是，这种算法指明了一种方向，其他开发者纷纷推出自己的VBR算法，使得效果一直在改进。目前公认比较好的首推 LAME，它完美地实现了 VBR 算法，而且它是是完全免费的软件，并且由爱好者组成的开发团队一直在不断的发展完善。

而在VBR的基础上，LAME更加发展出ABR算法。ABR（Average Bitrate）平均比特率，是VBR的一种插值参数。LAME针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR在指定的文件大小内，以每50帧（30帧约1秒）为一段，低频和不敏感频率使用相对低的流量，高频和大动态表现时使用高流量，可以做为VBR和CBR的一种折衷选择。

⑶ M4A格式和MP3格式有什么不同呢

1、M4A是MPEG-4音频标准的文件的扩展名。而MP3则是属于MPEG-3音频标准。

2、M4A属于苹果专用的音频格式，而MP3则是一种通用音频格式。

3、M4A属于高品质压缩类型的音乐文件，而MP3则是低品质有损压缩。

4、M4A音频文件的大小要远远大于MP3，对于磁盘空间的占用，M4A要远大于MP3。

5、MP3的诞生时间要早于M4A，但是M4A的流行度正在超过MP3。目前大多数主流音乐播放器都支持M4A格式。

6、根据MPEG规范的说法，MPEG-4中的AAC（Advanced audio coding）将是MP3格式的下一代。因此，M4A与MP3有代际继承的关系。

(3)abr算法扩展阅读：

关于MP3

MP3是利用人耳对高频声音信号不敏感的特性，将时域波形信号转换成频域信号，并划分成多个频段，对不同的频段使用不同的压缩率，对高频加大压缩比（甚至忽略信号）对低频信号使用小压缩比，保证信号不失真。

M4A是MPEG-4音频标准的文件的扩展名。在MPEG4标准中提到，普通的MPEG4文件扩展名是“.mp4”。自从Apple开始在它的iTunes以及iPod中使用“.m4a”以区别MPEG4的视频和音频文件以来，“.m4a”这个扩展名开始被大家认识。目前，主流的播放器支持播放m4a格式的文件。

⑷ 谈谈什么是 CBR、VBR、ABR

这个值越高，音质就越好。未压缩的 WAV 文件其 bitrate 为 1400kbps，1 个字节为 8 比特，将 1400/8 转换成字节就是 175kByte/s。所以，对一首 4 分钟的音乐，wav 格式的文件占用的空间为 4 分 * 60 秒 * 175=42000kByte，即 42000/1024=41MB；而 192kbps（每秒 24kByte）的 MP3 则占用了 4*60*24/1024=5.625MB。这种每秒固定比特率的算法是由 Xing 公司开发的，被称为 Constant BitRate，即 CBR（固定速率）；后来，Xing 又发展了一种新的算法，他们将一首歌的复杂部分用高 bitrate 编码，简单部分用低 bitrate 编码，这被称为 Variable BitRate，简称 VBR（可变速率）。主意虽然不错，可惜 Xing 编码器的 VBR 算法很差，音质与 CBR 相去甚远，而且不是所有的播放器都支持 VBR 编码的 MP3，包括微软的 media player，这也是为什么在 WMP 中 VBR 编码的 MP3 不能正确显示时间的原因。幸运的是，由 LAME 完美地实现了 VBR 算法（以 Xing 的算法为基础加以改进和扩充），非但如此，从 LAME 3.89 版本开始，LAME 又引入了一种新的算法：ABR（average bitrate，平均速率）。ABR 也被称为“safe VBR”，它可以将生成的 MP3 控制在给定的 bitrate 上。举例来说，当指定用 192kbps、ABR 对一段 wav 文件进行编码时，LAME 会将该文件的 90% 用 192kbps 编码，然后对剩余 10% 进行优化：复杂部分用高于 192kbps 来编码、简单部分用低于 192kbps 来编码。与 192kbps、CBR 相比，192kbps、ABR在文件大小上相差不多，音质却提高不少。据统计，ABR 编码在速度上是 VBR 编码的 2 到 3 倍，在 128-256kbps 范围内质量要好于 CBR 由此看来，仍然是320K的CBR编码音质最好！！！

⑸ 常见的音频文件格式

MP3格式诞生于八十年代的德国，所谓的MP3也就是指的是MPEG标准中的音频部分，也就是MPEG音频层。根据压缩质量和编码处理的不同分为3层，分别对应“*.mp1/“*.mp2”/“*.mp3”这3种声音文件。需要提醒大家注意的地方是：MPEG音频文件的压缩是一种有损压缩，MPEG3音频编码具有10：1~12：1的高压缩率，同时基本保持低音频部分不失真，但是牺牲了声音文件中12KHz到16KHz高音频这部分的质量来换取文件的尺寸，相同长度的音乐文件，用*.mp3格式来储存，一般只有*.wav文件的1/10，因而音质要次于CD格式或WAV格式的声音文件。由于其文件尺寸小，音质好；所以在它问世之初还没有什么别的音频格式可以与之匹敌，因而为*.mp3格式的发展提供了良好的条件。直到现在，这种格式还是很流行，作为主流音频格式的地位难以被撼动。但是树大招风，MP3音乐的版权问题也一直找不到办法解决，因为MP3没有版权保护技术，说白了也就是谁都可以用。
MP3格式压缩音乐的采样频率有很多种，可以用64Kbps或更低的采样频率节省空间，也可以用320Kbps的标准达到极高的音质。用装有Fraunhofer
IIS
Mpeg
Lyaer3的
MP3编码器（现在效果最好的编码器）MusicMatch
Jukebox
6.0在128Kbps的频率下编码一首3分钟的歌曲，得到2.82MB的MP3文件。采用缺省的CBR（固定采样频率）技术可以以固定的频率采样一首歌曲，而VBR（可变采样频率）则可以在音乐“忙”的时候加大采样的频率获取更高的音质，不过产生的MP3文件可能在某些播放器上无法播放。把VBR的级别设定成为与前面的CBR文件的音质基本一样，生成的VBR
MP3文件为2.9MB。
MP3是到2008年止使用用户最多的有损压缩数字音频格式了。它的全称是MPEG(MPEG：MovingPictureExpertsGroup)AudioLayer-3，刚出现时它的编码技术并不完善，它更像一个编码标准框架，留待人们去完善。早期的MP3编码采用的的是固定编码率的方式（CBR），看到的128Kbps，就是代表它是以128Kbps固定数据速率编码——你可以提高这个编码率，最高可以到320Kbps，音质会更好，自然，文件的体积会相应增大。
因为MP3的编码方式是开放的，可以在这个标准框架的基础上自己选择不同的声学原理进行压缩处理，所以，很快由Xing公司推出可变编码率的压缩方式（VBR）。它的原理就是利用将一首歌的复杂部分用高bitrate编码，简单部分用低bitrate编码，通过这种方式，进一步取得质量和体积的统一。当然，早期的Xing编码器的VBR算法很差，音质与CBR（固定码率）相去甚远。但是，这种算法指明了一种方向，其他开发者纷纷推出自己的VBR算法，使得效果一直在改进。目前公认比较好的首推LAME，它完美地实现了VBR算法，而且它是是完全免费的软件，并且由爱好者组成的开发团队一直在不断的发展完善。
而在VBR的基础上，LAME更加发展出ABR算法。ABR（AverageBitrate）平均比特率，是VBR的一种插值参数。LAME针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR在指定的文件大小内，以每50帧（30帧约1秒）为一段，低频和不敏感频率使用相对低的流量，高频和大动态表现时使用高流量，可以做为VBR和CBR的一种折衷选择。
MP3问世不久，就凭这较高的压缩比12:1和较好的音质创造了一个全新的音乐领域，然而MP3的开放性却最终不可避免的导致了版权之争，在这样的背景之下，文件更小，音质更佳，同时还能有效保护版权的MP4就应运而生了。MP3和MP4之间其实并没有必然的联系，首先MP3是一种音频压缩的国际技术标准，而MP4却是一个商标的名称。
WMA
(Windows
Media
Audio)
格式是来自于微软的重量级选手，后台强硬，音质要强于MP3格式，更远胜于RA格式，它和日本YAMAHA公司开发的VQF格式一样，是以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的，WMA的压缩率一般都可以达到1：18左右，WMA的另一个优点是内容提供商可以通过DRM（Digital
Rights
Management）方案如Windows
Media
Rights
Manager
7加入防拷贝保护。这种内置了版权保护技术可以限制播放时间和播放次数甚至于播放的机器等等，这对被盗版搅得焦头烂额的音乐公司来说可是一个福音，另外WMA还支持音频流(Stream)技术，适合在网络上在线播放，作为微软抢占网络音乐的开路先锋可以说是技术领先、风头强劲，更方便的是不用象MP3那样需要安装额外的播放器，而Windows操作系统和Windows
Media
Player的无缝捆绑让你只要安装了windows操作系统就可以直接播放WMA音乐，新版本的Windows
Media
Player7.0更是增加了直接把CD光盘转换为WMA声音格式的功能，在新出品的操作系统Windows
XP中，WMA是默认的编码格式，大家知道Netscape的遭遇，现在“狼”又来了。WMA这种格式在录制时可以对音质进行调节。同一格式，音质好的可与CD媲美，压缩率较高的可用于网络广播。虽然现在网络上还不是很流行，但是在微软的大规模推广下已经是得到了越来越多站点的承认和大力支持，在网络音乐领域中直逼*.mp3，在网络广播方面，也正在瓜分Real打下的天下。因此，几乎所有的音频格式都感受到了WMA格式的压力。微软官方宣布的资料中称WMA格式的可保护性极强，甚至可以限定播放机器、播放时间及播放次数，具有相当的版权保护能力。应该说，WMA的推出，就是针对MP3没有版权限制的缺点而来——普通用户可能很欢迎这种格式，但作为版权拥有者的唱片公司来说，它们更喜欢难以复制拷贝的音乐压缩技术，而微软的WMA则照顾到了这些唱片公司的需求。
除了版权保护外，WMA还在压缩比上进行了深化，它的目标是在相同音质条件下文件体积可以变的更小（当然，只在MP3低于192KBPS码率的情况下有效，实际上当采用LAME算法压缩MP3格式时，高于192KBPS时普遍的反映是MP3的音质要好于WMA）。
RealAudio主要适用于在网络上的在线音乐欣赏，现在大多数的用户仍然在使用56Kbps或更低速率的Modem，所以典型的回放并非最好的音质。有的下载站点会提示你根据你的Modem速率选择最佳的Real文件。real的的文件格式主要有这么几种：有RA（RealAudio）、RM（RealMedia，RealAudio
G2）、RMX（RealAudio
Secured），还有更多。这些格式的特点是可以随网络带宽的不同而改变声音的质量，在保证大多数人听到流畅声音的前提下，令带宽较富裕的听众获得较好的音质。
近来随着网络带宽的普遍改善，Real公司正推出用于网络广播、达到CD音质的格式。如果你的RealPlayer软件不能处理这种格式，它就会提醒你下载一个免费的升级包。许多音乐网站
提供了歌曲的Real格式的试听版本。现在最新的版本是RealPlayer
9.0，第39期《电脑报》也对RealPlayer
9.0作了详细的介绍，这里不再赘述。
雅马哈公司另一种格式是*.vqf，它的核心是减少数据流量但保持音质的方法来达到更高的压缩比，VQF的音频压缩率比标准的MPEG音频压缩率高出近一倍，可以达到18:1左右甚至更高。也就是说把一首4分钟的歌曲（WAV文件）压成MP3，大约需要4MB左右的硬盘空间，而同一首歌曲，如果使用VQF音频压缩技术的话，那只需要2MB左右的硬盘空间。因此，在音频压缩率方面，MP3和RA都不是VQF的对手。相同情况下压缩后VQF的文件体积比MP3小30%～50%，更便利于网上传播，同时音质极佳，接近CD音质(16位44.1kHz立体声)。可以说技术上也是很先进的，但是由于宣传不力，这种格式难有用武之地。*.vqf可以用雅马哈的播放器播放。同时雅马哈也提供从*.wav文件转换到*.vqf文件的软件。
此文件缺少特点外加缺乏宣传。
当VQF以44KHz、80kbit/s的音频采样率压缩音乐时，它的音质优于44KHz、128kbit/s的MP3，当VQF以44KHz、96kbit/s的频率压缩时，它的音质几乎等于44KHz、256kbit/s的MP3。经SoundVQ压缩后的音频文件在进行回放效果试听时，几乎没有人能听出它与原音频文件的差异。播放VQF对计算机的配置要求仅为奔腾75或更高，当然如果您用奔腾100或以上的机器，VQF能够运行得更加出色。实际上，播放VQF对CPU的要求仅比Mp3高5～10%左右。
VQF即TwinVQ技术虽然是由NTT和YAMAHA开发的，但它们的应用软件都是免费的。只是NTT和YAMAHA并没有公布VQF的源代码。
OggVorbis是一种新的音频压缩格式，类似于MP3等现有的音乐格式。但有一点不同的是，它是完全免费、开放和没有专利限制的。Vorbis是这种音频压缩机制的名字，而Ogg则是一个计划的名字，该计划意图设计一个完全开放性的多媒体系统。目前该计划只实现了OggVorbis这一部分。
OggVorbis文件的扩展名是*.OGG。这种文件的设计格式是非常先进的。这种文件格式可以不断地进行大小和音质的改良，而不影响旧有的编码器或播放器。
VORBIS采用有损压缩，但通过使用更加先进的声学模型去减少损失，因此，同样位速率(BitRate)编码的OGG与MP3相比听起来更好一些。另外，还有一个原因，MP3格式是受专利保护的。如果你想使用MP3格式发布自己的作品，则需要付给Fraunhofer（发明MP3的公司）专利使用费。而VORBIS就完全没有这个问题。
对于乐迷来说，使用OGG文件的显着好处是可以用更小的文件获得优越的声音质量。而且，由于OGG是完全开放和免费的，制作OGG文件将不受任何专利限制，可望可以获得大量的编码器和播放器。这也是为何现在MP3编码器如此少而且大多是商业软件的原因，因为Fraunhofer要收取专利使用费。Vorbis使用了与MP3相比完全不同的数学原理，因此在压缩音乐时受到的挑战也不同。同样位速率编码的Vorbis和MP3文件具有同等的声音质量。Vorbis具有一个设计良好、灵活的注释，避免了象MP3文件的ID3标记那样烦琐的操作；Vorbis还具有位速率缩放：可以不用重新编码便可调节文件的位速率。Vorbis文件可以被分成小块并以样本粒度进行编辑；Vorbis支持多通道；Vorbis文件可以以逻辑方式相连接等。
AMR全称Adaptive
Multi-Rate，自适应多速率编码，主要用于移动设备的音频，压缩比比较大，但相对其他的压缩格式质量比较差，由于多用于人声，通话，效果还是很不错的。
一、分类
1.
AMR:
又称为AMR-NB，相对于下面的WB而言，语音带宽范围：300－3400Hz，8KHz抽样
2.
AMR-WB:AMR
WideBand，
语音带宽范围：
50－7000Hz
16KHz抽样
“AMR-WB”全称为“Adaptive
Multi-rate
-
Wideband”，即“自适应多速率宽带编码”，采样频率为16kHz，是一种同时被国际标准化组织ITU-T和3GPP采用的宽带语音编码标准，也称为G722.2标准。AMR-WB提供语音带宽范围达到50～7000Hz，用户可主观感受到话音比以前更加自然、舒适和易于分辨。
与之作比较，现在GSM用的EFR(Enhenced
Full
Rate，增强型全速率编码)采样频率为8kHz，语音带宽为200～3400Hz。
AMR-WB应用于窄带GSM(全速信道16k，GMSK)的优势在于其可采用从6.6kb/s,
8.85kb/s和12.65kb/s三种编码，当网络繁忙时C/I恶化，编码器可以自动调整编码模式，从而增强QoS。在这种应用中，AMR-WB抗扰度优于AMR-NB。
AMR-WB应用于EDGE、3G可充分体现其优势。足够的传输带宽保证AMR-WB可采用从
6.6kb/s到23.85kb/s共九种编码，语音质量超越PSTN固定电话。

⑹ 有损压缩的常见格式

——MP3（MP3PROMP3SURROUND）、AAC（*.3gp/*.mp4/*.m4a）、ATRAC3/ATRAC3+（*.aa3）。
先来明白音频压缩的原理：利用人耳听觉的心理声学特性（频谱掩蔽特性和时间掩蔽特性等）以及人耳对信号幅度、频率、时间的有限分辨能力，编码时凡是人耳感觉不到的频率不编码、不传送，即凡是对人耳辨别声音信号的强度、声调、方位没有贡献的部分（称为不相关部分或无关部分）都不编码和传送。对感觉不到的部分进行编码时，允许有较大的量化失真、并使其处于听阈（即人耳所能听到的最低音量）以下，人耳仍然感觉不到。音频的压缩就是利用这些特点来工作的。 1、等响度曲线
人的听觉的灵敏度随着频率而改变。即通常两个功率一样但频率不同的音调听起来并不一样响。通过等响度曲线，我们可以看出，人耳对4KHz的频率最灵敏，即在4KHz下能被察觉出来的声音压力水平（响度），在其他频率下并不能被察觉。这就给在一些不太灵敏的频率下失真提供了条件。
2、屏蔽
我们上高中物理时学过屏蔽。就是强的声音信号把弱的声音信号覆盖，导致我们无法察觉。而且，当两个声音在时间和频率上很接近时，屏蔽效应就会很强。因此，我们可以在编码时对被屏蔽的部分不编码、不传送。这样，音质依然没有大的损失，人耳也不易察觉。
3、临界频带
对于人类的听觉来说，对声音的感知特性并不是以线形频率为尺度来变化的（人的听觉还没那么好），而是可以用被称为临界频带的一系列有限的频段来表达。简单的说，把整个频带划分成几段，在这每个频段里，人耳的听觉感知是相同的，即心理声学特性都是一样的。
言归正传，编码的精髓就是算法。 1、MP3(MP3PROMP3SURROUND)
MP3应该算目前应用最广泛的有损压缩数字音频格式了。它的全称是MPEG（MovingPictureExpertsGroup）AudioLayer-3。1987年德国Fraunhofer研究院研制成功的一种有损压缩数字音频格式，并于1989年取得专利。起初，它并不完善，它更像一个编码标准框架，留待人们去完善。1992年，这一技术并入了MPEG规范，并有了正式名号——MP3。
MP3文件是由帧(frame)构成的，帧是MP3文件最小的组成单位。什么是帧?还记得最初的动画是怎么做的吗?不同的连续画面切换以达到动态效果，每幅画面就是一个“帧”，不同的是MP3里面的帧记录的是音频数据而不是图形数据。MP3的帧速度大概是30帧/秒。
每个帧又由帧头和帧数据组成，帧头记录着该帧的基本信息，包括位率索引和采样率索引(这对理解ABR和VBR编码方式很重要)。帧数据，顾名思义就是记录着主体音频数据。
上面说的都是MP3编码的基础，但事实上，早期的编码器都非常不完善，压缩算法近于粗暴，音质很不理想。MP3的音质有两次飞跃:人体听觉心理学模型(PerceptualModel)的导入和VBR技术的应用。
PS：VBR是variablebitrate的缩写，意思是可变比率，就是MP3文件压制的时候声音元素较多，比率较高时，将自动减低压缩比特率，在比特率需求比较低时自动升高比特率，这样做的目的是在保证音质基本不被损害的情况下增加文件在线播放时的速度，和减少在本机播放时所占的系统资源……这是Xing发展的算法，他们将一首歌的复杂部分用高Bitrate编码，简单部分用低Bitrate编码。主意虽然不错，可惜Xing编码器的VBR算法很差，音质与CBR相去甚远。幸运的是，Lame完美地优化了VBR算法，使之成为MP3的最佳编码模式。这是以质量为前提兼顾文件大小的方式，推荐编码模式。
MP3能生存到今天，它的发展仍未止步。2001年6月14日，法国汤姆森与美国RCA两家公司联合推出了一种新的压缩格式：MP3PRO。MP3PRO是基于MP3技术改良而来，它利用了CodingTechnologies公司开发的编解码增强技术，该术称为SBR(SpectralBandReplication)。当制作MP3PRO文件时，编码器将音频分为两部分。一部分是将音频数据中的低频部分分离出来，通过传统的MP3技术编码得出正常的MP3音频流。此举使MP3编码器专注于低频段信号的压缩从而获得更好的质量，而且使原来的MP3播放器也能播放MP3PRO文件。另一部分则是将分离出来的高频信号进行编码并嵌入MP3流中。传统的MP3播放器会将其忽略掉，而新的MP3PRO播放器会将其还原出来并进行组合，得到高质量的全带宽的声音。通过这项技术，使得MP3PRO64Kbps的编码率便可提供128Kbps的MP3相同的质量，且具有相差无几的音质，而体积只有MP3的一半大小。
PSP就支持MP3PRO，而且支持MP3PRO的格式转换软件也很多，大家可以去网上找找。有兴趣的话可以试试，绝对比mp3强啊。
Thomson在2004年12月初正式宣布世界上最流行的音乐压缩格式MP3迈进多声道时代。MP3SURROUND是由FraunhoferIIS和Agere联合开发的，使用了binauralCueCoding（BCC）技术心理声学编码，可以在实现多声道环绕的同时保证文件的大小。同时加入的AgereSystems公司则主要负责将多声道MP3格式——MP3SURROUND进行推广。MP3SURROUND技术实现了5.1声道环绕的高品质音频，应用范围相当广泛，可以在网络音乐发布、广播系统、PC视听应用、游戏音效、消费电子产品和车载音响等方面发挥作用。尽管集成了多个声道，但是Thomson表示MP3SURROUND文件相对于普通MP3（采样率相当）并没有太大的增加，相对于其他环绕多声道音频格式就只有它们的一半了。更为重要的，MP3SURROUND提供了良好的兼容性，可以在现有的MP3软件、MP3播放器上正常使用。
2、AAC（*.3gp/*.mp4/*.m4a）
AAC是高级音频编码（AdvancedAudioCoding）的缩写，它是由Fraunhofer研究院、杜比和AT&T共同研发的。AAC是MPEG-2规范的一部分，它适用于从速率8Kbps的单声道电话音质到160Kbps多声道的超高质量音频范围内的编码。AAC与MP3相比，增加了诸如对立体声的完美再现、码流效果音扫描、多媒体控制、降噪优化等MP3音频格式所没有的特性，使得在音频压缩后仍能完美地再现CD音质。它还同时支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容性、更高的解码效率。总之，AAC可以在比MP3文件缩小30%的前提下提供更好的音质。
现将其中的几个模块作一些说明：
增益控制(Gaincontrol)
增益控制模块用在可变采样率配置中，它由多相正交滤波器PQF(polyphasequadraturefilter)、增益检测器(gaindetector)和增益修正器(gainmodifier)组成。这个模块把输入信号分离到4个相等带宽的频带中。在解码器中也有增益控制模块，通过忽略PQF的高子带信号获得低采样率输出信号。
滤波器组(FilterBank)
滤波器组是把输入信号从时域变换到频域的转换模块，它是MPEG-2AAC系统的基本模块。这个模块采用了改进离散余弦变换MDCT，它是一种线性正交交迭变换，使用了一种称为时域混迭取消TDAC()技术。MDCT使用KBD(Kaiser-Besselderived)窗口或者使用正弦(sine)窗口，正向MDCT变换可使用下式表示：
逆向MDCT变换可使用下式表示：
其中，
n=样本号，
N=变换块长度，
i=块号，
以上两个离散余弦变换公式在《离散函数》和《数理方程》中有详细介绍，只为帮助有兴趣的玩家了解，不必深究。
瞬时噪声定形TNS
在感知声音编码中，TNS模块是用来控制量化噪声的瞬时形状的一种方法，解决掩蔽阈值和量化噪声的错误匹配问题。这种技术的基本想法是，在时域中的音调声信号在频域中有一个瞬时尖峰，TNS使用这种双重性来扩展已知的预测编码技术，把量化噪声置于实际的信号之下以避免错误匹配。
联合立体声编码
联合立体声编码(jointstereocoding)是一种空间编码技术，其目的是为了去掉空间的冗余信息。MPEG-2AAC系统包含两种空间编码技术：M/S编码(Mid/Sideencoding)和声强/耦合(Intensity/Coupling)。M/S编码使用矩阵运算，因此把M/S编码称为矩阵立体声编码(matrixedstereocoding)。M/S编码不传送左右声道信号，而是使用标称化的“和”信号与“差”信号，前者用于中央M(middle)声道，后者用于边S(side)声道，因此M/S编码也叫做“和-差编码(sum-differencecoding)”。声强/耦合编码的名称也很多，有的叫做声强立体声编码(intensitystereocoding)，或者叫做声道耦合编码(channelcouplingcoding)，它们探索的基本问题是声道间的不相关性(irrelevance)。
预测(Prediction)
这是在话音编码系统中普遍使用的一种技术，它主要用来减少平稳(stationary)信号的冗余度。
量化器(Quantizer)
使用了非均匀量化器。
无噪声编码(Noiselesscoding)
无噪声编码实际上就是霍夫曼编码，它对被量化的谱系数、比例因子和方向信息进行编码。
PS:我个人比较喜欢AAC,所以写的较为详细，大家也不妨试试，绝对比MP3优秀。大家可以使用iTunes6来转换AAC(*.m4a)。iTunes6AAC的操作很简单，你可以直接把AAC（*.3gp*.mp4*.m4a）拷贝到[MUSIC]就能播。
可以说，aac是目前最好的有损压缩方式。
最高质量的普较无损看（肉眼）不出区别。
3、ATRAC3/ATRAC3+（*.aa3）
早年玩MD的朋友都知道SONY专为MD量身定做的ATRAC音频格式算法，后来又广泛应用于SONY的NetworkWalkman和其他便携音频设备。“ATRAC3plus”代表“自适应转换声音编码3+”,是一套基于心理声学原理的音频压缩技术，从ATRAC3格式发展而来，到2002年这项技术才日趋完美。这一技术是把MD随身听的体积缩小到很小的理论基础。
要分析ATRAC3/ATRAC3+，我们先要谈谈它的大哥——ATRAC算法。当数字音频数据被压缩时，通常都会把一定数量的量化噪音带入信号。为了不让这些信号被人耳感知，通常的做法是，音频编码把信号分解为一组单元，每组单元都对应着特定的时间频率范围。编码器会依据前文提到的心理声学原理来分析，对重要的单元进行高精度编码，对不敏感的单元可以保留一些量化的噪音但不影响人耳的感知质量。解码时，量化频谱会根据比特分配重新建立，然后合成音频信号。
ATRAC也不例外，但有一些改进。ATRAC还应用了子频带译码和转换译码技术，输入的信号被分配得到不均匀的强调重要低音区的频率分割。另外，ATRAC使用一个可变块长度改变输入的信号，这可以确保在稳定通过时高效的译码，不会在瞬间通过时影响时间的分辨率。具体说，输入的信号在5.5125KHz和11.025KHz被分为3个频带。子频带的分解使用QMF(QuadratureMirrorFilters积分映射过滤器)来完成；这3个频带被MDCT（变址离散余弦变换——类似于通常的快速傅里叶变换，《高等数学二》和《数理方程》中有相关介绍。）转换成频谱值，MDCT允许块之间有达50%的交迭，使得在维持临界采样时能提高频率分辨率。块的长度可以根据信号的种类改变，这就是ATRAC的自适应部分（这一做法主要是为了利用屏蔽掩盖初始量化噪音）。
当ATRAC算法发展了10年，已经满足不了市场的需求，SONY于2002年8月推出了新的算法——
ATRAC3/ATRAC3+。其核心算法较ATRAC没有本质的大改变，只是采用了改进的频带分离过滤和MDCT，并使用增益调节、音调成分分离、联合立体声（Joint-Stereo）等技术，使得音频压缩数据的体积进一步缩小。
4、AAL（ATRACAdvancedLossless）
AAL是ATRACAdvancedLossless（自适应声学转换高级无损编码）的缩写，是SONY新开发的一个音频压缩格式其特点是无损压缩，不损失一点音频信息，一张CD可以压缩到原来的30%--80%。
5、Ogg
Ogg全称应该是OGG Vobis(ogg Vorbis) 是一种新的音频压缩格式，类似于MP3等现有的音乐格式。但有一点不同的是，它是完全免费、开放和没有专利限制的。OGG Vobis有一个很出众的特点，就是支持多声道，随着它的流行，以后用随身听来听DTS编码的多声道作品将不会是梦想。
Vorbis 是这种音频压缩机制的名字，而Ogg则是一个计划的名字，该计划意图设计一个完全开放性的多媒体系统。
Ogg Vorbis文件的扩展名是.OGG。这种文件的设计格式是非常先进的。创建的OGG文件可以在任何播放器上播放，因此，这种文件格式可以不断地进行大小和音质的改良，而不影响旧有的编码器或播放器。
较aac而言，低频方面略有优势，高频方面比aac差。
最高质量的普较无损看（肉眼）不出区别。
最高质量，即Q10，体积比aac使用faac编码最高质量Q500体积大差不多一倍。
编码开源。

阅读全文

热点内容

java阿里发布：2025-03-23 05:52:52 浏览：108

惠普服务器如何删掉raid 发布：2025-03-23 05:51:32 浏览：555

如何自学linux 发布：2025-03-23 05:50:10 浏览：842

安卓系统怎么删除短信发布：2025-03-23 05:40:44 浏览：117

c语言编译错误与崩溃发布：2025-03-23 05:34:13 浏览：590

uc浏览器视频缓存在哪里发布：2025-03-23 05:30:40 浏览：357

添加到收藏夹的脚本代码发布：2025-03-23 05:22:42 浏览：646

原神什么配置顶配发布：2025-03-23 05:22:00 浏览：577

c程序总是编译不过发布：2025-03-23 05:19:08 浏览：683

刷机网站源码发布：2025-03-23 05:08:41 浏览：570

abr算法

与abr算法相关的资讯