當前位置:首頁 » 操作系統 » abr演算法

abr演算法

發布時間: 2023-06-17 00:12:38

⑴ AAC與MP3格式對比好在哪

AAC比MP3格式有以下的優勢:

一、ACC比MP3音質更佳

AAC相較於mp3,AAC格式的音質更佳,文件更小。與MP3不同,它採用了全新的演算法進行編碼,更加高效,具有更高的「性價比」。使用AAC格式可以讓人感覺音質更小,沒有明顯的降低。

Mp3以較低的比特率編碼,所以編碼器的錯誤更明顯,聽起來像回聲。

二、ACC比MP3更演算法更高級

AAC所採用的運演算法則與MP3的運演算法則有所不同,AAC通過結合其他的功能來提高編碼效率。AAC的音頻演算法在壓縮能力上遠遠超過了一些以前的壓縮演算法(如MP3等)。

它還支持多達48個磁軌、15個低頻磁軌、更多采樣率和比特率、多語言兼容性和更高的解碼效率。它被稱為48聲道的音軌,采樣率為96khz,數據速率為320kbps,為5.1聲道的音樂節目提供相當於ITU-R廣播的效果。

三、ACC比MP3更先進

AAC格式出現於1997年,基於MPEG-2的音頻編碼技術。弗勞恩霍夫二世,杜比實驗室。

MP3在1991年由位於德國埃爾朗根的研究組織Fraunhofer-Gesellschaft的一組工程師發明和標准化的。

⑵ MP3 編碼 恆定碼率(CBR) 跟平均碼率(ABR) 是什麼東西..還有32~320 kbps 這些代表什麼.是不是越高音質越好

VBR是動態編碼
最高應該是320Kbps
MP3的全稱是MPEG(MPEG:Moving Picture Experts Group) Audio Layer-3,1993年由德國夫朗和費研究院和法國湯姆生公司合作發展成功。MP3是一種有損的壓縮方式,早期的MP3編碼採用的的是固定編碼率的方式(CBR ),我們常看到的128KB/S,就代表每秒的數據流量有128KBIT,而且是固定的,這個稱之為比特率,比特率本身是可以改變的,最高可以到320KBPS,當然比特率越高音質越好,但是文件的體積會相應增大。

因為MP3的編碼方式是開放的,你可以在這個標准框架的基礎上自己選擇不同的聲學原理進行壓縮處理,所以,很快由Xing公司推出可變編碼率的壓縮方式(VBR)。它的原理就是利用將一首歌的復雜部分用高 bitrate 編碼,簡單部分用低 bitrate 編碼,通過這種方式,進一步取得質量和體積的統一。當然,早期的Xing 編碼器的 VBR 演算法很差,音質與 CBR (固定碼率)相去甚遠。但是,這種演算法指明了一種方向,其他開發者紛紛推出自己的VBR演算法,使得效果一直在改進。目前公認比較好的首推 LAME,它完美地實現了 VBR 演算法,而且它是是完全免費的軟體,並且由愛好者組成的開發團隊一直在不斷的發展完善。

而在VBR的基礎上,LAME更加發展出ABR演算法。ABR(Average Bitrate)平均比特率,是VBR的一種插值參數。LAME針對CBR不佳的文件體積比和VBR生成文件大小不定的特點獨創了這種編碼模式。ABR在指定的文件大小內,以每50幀(30幀約1秒)為一段,低頻和不敏感頻率使用相對低的流量,高頻和大動態表現時使用高流量,可以做為VBR和CBR的一種折衷選擇。

⑶ M4A格式和MP3格式有什麼不同呢

1、M4A是MPEG-4音頻標準的文件的擴展名。而MP3則是屬於MPEG-3音頻標准。

2、M4A屬於蘋果專用的音頻格式,而MP3則是一種通用音頻格式。

3、M4A屬於高品質壓縮類型的音樂文件,而MP3則是低品質有損壓縮。

4、M4A音頻文件的大小要遠遠大於MP3,對於磁碟空間的佔用,M4A要遠大於MP3。

5、MP3的誕生時間要早於M4A,但是M4A的流行度正在超過MP3。目前大多數主流音樂播放器都支持M4A格式。

6、根據MPEG規范的說法,MPEG-4中的AAC(Advanced audio coding)將是MP3格式的下一代。因此,M4A與MP3有代際繼承的關系。

(3)abr演算法擴展閱讀:

關於MP3

MP3是利用人耳對高頻聲音信號不敏感的特性,將時域波形信號轉換成頻域信號,並劃分成多個頻段,對不同的頻段使用不同的壓縮率,對高頻加大壓縮比(甚至忽略信號)對低頻信號使用小壓縮比,保證信號不失真。

M4A是MPEG-4音頻標準的文件的擴展名。在MPEG4標准中提到,普通的MPEG4文件擴展名是「.mp4」。自從Apple開始在它的iTunes以及iPod中使用「.m4a」以區別MPEG4的視頻和音頻文件以來,「.m4a」這個擴展名開始被大家認識。目前,主流的播放器支持播放m4a格式的文件。

⑷ 談談什麼是 CBR、VBR、ABR

這個值越高,音質就越好。未壓縮的 WAV 文件其 bitrate 為 1400kbps,1 個位元組為 8 比特,將 1400/8 轉換成位元組就是 175kByte/s。所以,對一首 4 分鍾的音樂,wav 格式的文件佔用的空間為 4 分 * 60 秒 * 175=42000kByte,即 42000/1024=41MB;而 192kbps(每秒 24kByte)的 MP3 則佔用了 4*60*24/1024=5.625MB。這種每秒固定比特率的演算法是由 Xing 公司開發的,被稱為 Constant BitRate,即 CBR(固定速率);後來,Xing 又發展了一種新的演算法,他們將一首歌的復雜部分用高 bitrate 編碼,簡單部分用低 bitrate 編碼,這被稱為 Variable BitRate,簡稱 VBR(可變速率)。主意雖然不錯,可惜 Xing 編碼器的 VBR 演算法很差,音質與 CBR 相去甚遠,而且不是所有的播放器都支持 VBR 編碼的 MP3,包括微軟的 media player,這也是為什麼在 WMP 中 VBR 編碼的 MP3 不能正確顯示時間的原因。幸運的是,由 LAME 完美地實現了 VBR 演算法(以 Xing 的演算法為基礎加以改進和擴充),非但如此,從 LAME 3.89 版本開始,LAME 又引入了一種新的演算法:ABR(average bitrate,平均速率)。ABR 也被稱為「safe VBR」,它可以將生成的 MP3 控制在給定的 bitrate 上。舉例來說,當指定用 192kbps、ABR 對一段 wav 文件進行編碼時,LAME 會將該文件的 90% 用 192kbps 編碼,然後對剩餘 10% 進行優化:復雜部分用高於 192kbps 來編碼、簡單部分用低於 192kbps 來編碼。與 192kbps、CBR 相比,192kbps、ABR在文件大小上相差不多,音質卻提高不少。據統計,ABR 編碼在速度上是 VBR 編碼的 2 到 3 倍,在 128-256kbps 范圍內質量要好於 CBR 由此看來,仍然是320K的CBR編碼音質最好!!!

⑸ 常見的音頻文件格式

MP3格式誕生於八十年代的德國,所謂的MP3也就是指的是MPEG標准中的音頻部分,也就是MPEG音頻層。根據壓縮質量和編碼處理的不同分為3層,分別對應「*.mp1/「*.mp2」/「*.mp3」這3種聲音文件。需要提醒大家注意的地方是:MPEG音頻文件的壓縮是一種有損壓縮,MPEG3音頻編碼具有10:1~12:1的高壓縮率,同時基本保持低音頻部分不失真,但是犧牲了聲音文件中12KHz到16KHz高音頻這部分的質量來換取文件的尺寸,相同長度的音樂文件,用*.mp3格式來儲存,一般只有*.wav文件的1/10,因而音質要次於CD格式或WAV格式的聲音文件。由於其文件尺寸小,音質好;所以在它問世之初還沒有什麼別的音頻格式可以與之匹敵,因而為*.mp3格式的發展提供了良好的條件。直到現在,這種格式還是很流行,作為主流音頻格式的地位難以被撼動。但是樹大招風,MP3音樂的版權問題也一直找不到辦法解決,因為MP3沒有版權保護技術,說白了也就是誰都可以用。
MP3格式壓縮音樂的采樣頻率有很多種,可以用64Kbps或更低的采樣頻率節省空間,也可以用320Kbps的標准達到極高的音質。用裝有Fraunhofer
IIS
Mpeg
Lyaer3的
MP3編碼器(現在效果最好的編碼器)MusicMatch
Jukebox
6.0在128Kbps的頻率下編碼一首3分鍾的歌曲,得到2.82MB的MP3文件。採用預設的CBR(固定采樣頻率)技術可以以固定的頻率采樣一首歌曲,而VBR(可變采樣頻率)則可以在音樂「忙」的時候加大采樣的頻率獲取更高的音質,不過產生的MP3文件可能在某些播放器上無法播放。把VBR的級別設定成為與前面的CBR文件的音質基本一樣,生成的VBR
MP3文件為2.9MB。
MP3是到2008年止使用用戶最多的有損壓縮數字音頻格式了。它的全稱是MPEG(MPEG:MovingPictureExpertsGroup)AudioLayer-3,剛出現時它的編碼技術並不完善,它更像一個編碼標准框架,留待人們去完善。早期的MP3編碼採用的的是固定編碼率的方式(CBR),看到的128Kbps,就是代表它是以128Kbps固定數據速率編碼——你可以提高這個編碼率,最高可以到320Kbps,音質會更好,自然,文件的體積會相應增大。
因為MP3的編碼方式是開放的,可以在這個標准框架的基礎上自己選擇不同的聲學原理進行壓縮處理,所以,很快由Xing公司推出可變編碼率的壓縮方式(VBR)。它的原理就是利用將一首歌的復雜部分用高bitrate編碼,簡單部分用低bitrate編碼,通過這種方式,進一步取得質量和體積的統一。當然,早期的Xing編碼器的VBR演算法很差,音質與CBR(固定碼率)相去甚遠。但是,這種演算法指明了一種方向,其他開發者紛紛推出自己的VBR演算法,使得效果一直在改進。目前公認比較好的首推LAME,它完美地實現了VBR演算法,而且它是是完全免費的軟體,並且由愛好者組成的開發團隊一直在不斷的發展完善。
而在VBR的基礎上,LAME更加發展出ABR演算法。ABR(AverageBitrate)平均比特率,是VBR的一種插值參數。LAME針對CBR不佳的文件體積比和VBR生成文件大小不定的特點獨創了這種編碼模式。ABR在指定的文件大小內,以每50幀(30幀約1秒)為一段,低頻和不敏感頻率使用相對低的流量,高頻和大動態表現時使用高流量,可以做為VBR和CBR的一種折衷選擇。
MP3問世不久,就憑這較高的壓縮比12:1和較好的音質創造了一個全新的音樂領域,然而MP3的開放性卻最終不可避免的導致了版權之爭,在這樣的背景之下,文件更小,音質更佳,同時還能有效保護版權的MP4就應運而生了。MP3和MP4之間其實並沒有必然的聯系,首先MP3是一種音頻壓縮的國際技術標准,而MP4卻是一個商標的名稱。
WMA
(Windows
Media
Audio)
格式是來自於微軟的重量級選手,後台強硬,音質要強於MP3格式,更遠勝於RA格式,它和日本YAMAHA公司開發的VQF格式一樣,是以減少數據流量但保持音質的方法來達到比MP3壓縮率更高的目的,WMA的壓縮率一般都可以達到1:18左右,WMA的另一個優點是內容提供商可以通過DRM(Digital
Rights
Management)方案如Windows
Media
Rights
Manager
7加入防拷貝保護。這種內置了版權保護技術可以限制播放時間和播放次數甚至於播放的機器等等,這對被盜版攪得焦頭爛額的音樂公司來說可是一個福音,另外WMA還支持音頻流(Stream)技術,適合在網路上在線播放,作為微軟搶占網路音樂的開路先鋒可以說是技術領先、風頭強勁,更方便的是不用象MP3那樣需要安裝額外的播放器,而Windows操作系統和Windows
Media
Player的無縫捆綁讓你只要安裝了windows操作系統就可以直接播放WMA音樂,新版本的Windows
Media
Player7.0更是增加了直接把CD光碟轉換為WMA聲音格式的功能,在新出品的操作系統Windows
XP中,WMA是默認的編碼格式,大家知道Netscape的遭遇,現在「狼」又來了。WMA這種格式在錄制時可以對音質進行調節。同一格式,音質好的可與CD媲美,壓縮率較高的可用於網路廣播。雖然現在網路上還不是很流行,但是在微軟的大規模推廣下已經是得到了越來越多站點的承認和大力支持,在網路音樂領域中直逼*.mp3,在網路廣播方面,也正在瓜分Real打下的天下。因此,幾乎所有的音頻格式都感受到了WMA格式的壓力。微軟官方宣布的資料中稱WMA格式的可保護性極強,甚至可以限定播放機器、播放時間及播放次數,具有相當的版權保護能力。應該說,WMA的推出,就是針對MP3沒有版許可權制的缺點而來——普通用戶可能很歡迎這種格式,但作為版權擁有者的唱片公司來說,它們更喜歡難以復制拷貝的音樂壓縮技術,而微軟的WMA則照顧到了這些唱片公司的需求。
除了版權保護外,WMA還在壓縮比上進行了深化,它的目標是在相同音質條件下文件體積可以變的更小(當然,只在MP3低於192KBPS碼率的情況下有效,實際上當採用LAME演算法壓縮MP3格式時,高於192KBPS時普遍的反映是MP3的音質要好於WMA)。
RealAudio主要適用於在網路上的在線音樂欣賞,現在大多數的用戶仍然在使用56Kbps或更低速率的Modem,所以典型的回放並非最好的音質。有的下載站點會提示你根據你的Modem速率選擇最佳的Real文件。real的的文件格式主要有這么幾種:有RA(RealAudio)、RM(RealMedia,RealAudio
G2)、RMX(RealAudio
Secured),還有更多。這些格式的特點是可以隨網路帶寬的不同而改變聲音的質量,在保證大多數人聽到流暢聲音的前提下,令帶寬較富裕的聽眾獲得較好的音質。
近來隨著網路帶寬的普遍改善,Real公司正推出用於網路廣播、達到CD音質的格式。如果你的RealPlayer軟體不能處理這種格式,它就會提醒你下載一個免費的升級包。許多音樂網站
提供了歌曲的Real格式的試聽版本。現在最新的版本是RealPlayer
9.0,第39期《電腦報》也對RealPlayer
9.0作了詳細的介紹,這里不再贅述。
雅馬哈公司另一種格式是*.vqf,它的核心是減少數據流量但保持音質的方法來達到更高的壓縮比,VQF的音頻壓縮率比標準的MPEG音頻壓縮率高出近一倍,可以達到18:1左右甚至更高。也就是說把一首4分鍾的歌曲(WAV文件)壓成MP3,大約需要4MB左右的硬碟空間,而同一首歌曲,如果使用VQF音頻壓縮技術的話,那隻需要2MB左右的硬碟空間。因此,在音頻壓縮率方面,MP3和RA都不是VQF的對手。相同情況下壓縮後VQF的文件體積比MP3小30%~50%,更便利於網上傳播,同時音質極佳,接近CD音質(16位44.1kHz立體聲)。可以說技術上也是很先進的,但是由於宣傳不力,這種格式難有用武之地。*.vqf可以用雅馬哈的播放器播放。同時雅馬哈也提供從*.wav文件轉換到*.vqf文件的軟體。
此文件缺少特點外加缺乏宣傳。
當VQF以44KHz、80kbit/s的音頻采樣率壓縮音樂時,它的音質優於44KHz、128kbit/s的MP3,當VQF以44KHz、96kbit/s的頻率壓縮時,它的音質幾乎等於44KHz、256kbit/s的MP3。經SoundVQ壓縮後的音頻文件在進行回放效果試聽時,幾乎沒有人能聽出它與原音頻文件的差異。播放VQF對計算機的配置要求僅為奔騰75或更高,當然如果您用奔騰100或以上的機器,VQF能夠運行得更加出色。實際上,播放VQF對CPU的要求僅比Mp3高5~10%左右。
VQF即TwinVQ技術雖然是由NTT和YAMAHA開發的,但它們的應用軟體都是免費的。只是NTT和YAMAHA並沒有公布VQF的源代碼。
OggVorbis是一種新的音頻壓縮格式,類似於MP3等現有的音樂格式。但有一點不同的是,它是完全免費、開放和沒有專利限制的。Vorbis是這種音頻壓縮機制的名字,而Ogg則是一個計劃的名字,該計劃意圖設計一個完全開放性的多媒體系統。目前該計劃只實現了OggVorbis這一部分。
OggVorbis文件的擴展名是*.OGG。這種文件的設計格式是非常先進的。這種文件格式可以不斷地進行大小和音質的改良,而不影響舊有的編碼器或播放器。
VORBIS採用有損壓縮,但通過使用更加先進的聲學模型去減少損失,因此,同樣位速率(BitRate)編碼的OGG與MP3相比聽起來更好一些。另外,還有一個原因,MP3格式是受專利保護的。如果你想使用MP3格式發布自己的作品,則需要付給Fraunhofer(發明MP3的公司)專利使用費。而VORBIS就完全沒有這個問題。
對於樂迷來說,使用OGG文件的顯著好處是可以用更小的文件獲得優越的聲音質量。而且,由於OGG是完全開放和免費的,製作OGG文件將不受任何專利限制,可望可以獲得大量的編碼器和播放器。這也是為何現在MP3編碼器如此少而且大多是商業軟體的原因,因為Fraunhofer要收取專利使用費。Vorbis使用了與MP3相比完全不同的數學原理,因此在壓縮音樂時受到的挑戰也不同。同樣位速率編碼的Vorbis和MP3文件具有同等的聲音質量。Vorbis具有一個設計良好、靈活的注釋,避免了象MP3文件的ID3標記那樣煩瑣的操作;Vorbis還具有位速率縮放:可以不用重新編碼便可調節文件的位速率。Vorbis文件可以被分成小塊並以樣本粒度進行編輯;Vorbis支持多通道;Vorbis文件可以以邏輯方式相連接等。
AMR全稱Adaptive
Multi-Rate,自適應多速率編碼,主要用於移動設備的音頻,壓縮比比較大,但相對其他的壓縮格式質量比較差,由於多用於人聲,通話,效果還是很不錯的。
一、分類
1.
AMR:
又稱為AMR-NB,相對於下面的WB而言,語音帶寬范圍:300-3400Hz,8KHz抽樣
2.
AMR-WB:AMR
WideBand,
語音帶寬范圍:
50-7000Hz
16KHz抽樣
「AMR-WB」全稱為「Adaptive
Multi-rate
-
Wideband」,即「自適應多速率寬頻編碼」,采樣頻率為16kHz,是一種同時被國際標准化組織ITU-T和3GPP採用的寬頻語音編碼標准,也稱為G722.2標准。AMR-WB提供語音帶寬范圍達到50~7000Hz,用戶可主觀感受到話音比以前更加自然、舒適和易於分辨。
與之作比較,現在GSM用的EFR(Enhenced
Full
Rate,增強型全速率編碼)采樣頻率為8kHz,語音帶寬為200~3400Hz。
AMR-WB應用於窄帶GSM(全速信道16k,GMSK)的優勢在於其可採用從6.6kb/s,
8.85kb/s和12.65kb/s三種編碼,當網路繁忙時C/I惡化,編碼器可以自動調整編碼模式,從而增強QoS。在這種應用中,AMR-WB抗擾度優於AMR-NB。
AMR-WB應用於EDGE、3G可充分體現其優勢。足夠的傳輸帶寬保證AMR-WB可採用從
6.6kb/s到23.85kb/s共九種編碼,語音質量超越PSTN固定電話。

⑹ 有損壓縮的常見格式

——MP3(MP3PROMP3SURROUND)、AAC(*.3gp/*.mp4/*.m4a)、ATRAC3/ATRAC3+(*.aa3)。
先來明白音頻壓縮的原理:利用人耳聽覺的心理聲學特性(頻譜掩蔽特性和時間掩蔽特性等)以及人耳對信號幅度、頻率、時間的有限分辨能力,編碼時凡是人耳感覺不到的頻率不編碼、不傳送,即凡是對人耳辨別聲音信號的強度、聲調、方位沒有貢獻的部分(稱為不相關部分或無關部分)都不編碼和傳送。對感覺不到的部分進行編碼時,允許有較大的量化失真、並使其處於聽閾(即人耳所能聽到的最低音量)以下,人耳仍然感覺不到。音頻的壓縮就是利用這些特點來工作的。 1、等響度曲線
人的聽覺的靈敏度隨著頻率而改變。即通常兩個功率一樣但頻率不同的音調聽起來並不一樣響。通過等響度曲線,我們可以看出,人耳對4KHz的頻率最靈敏,即在4KHz下能被察覺出來的聲音壓力水平(響度),在其他頻率下並不能被察覺。這就給在一些不太靈敏的頻率下失真提供了條件。
2、屏蔽
我們上高中物理時學過屏蔽。就是強的聲音信號把弱的聲音信號覆蓋,導致我們無法察覺。而且,當兩個聲音在時間和頻率上很接近時,屏蔽效應就會很強。因此,我們可以在編碼時對被屏蔽的部分不編碼、不傳送。這樣,音質依然沒有大的損失,人耳也不易察覺。
3、臨界頻帶
對於人類的聽覺來說,對聲音的感知特性並不是以線形頻率為尺度來變化的(人的聽覺還沒那麼好),而是可以用被稱為臨界頻帶的一系列有限的頻段來表達。簡單的說,把整個頻帶劃分成幾段,在這每個頻段里,人耳的聽覺感知是相同的,即心理聲學特性都是一樣的。
言歸正傳,編碼的精髓就是演算法。 1、MP3(MP3PROMP3SURROUND)
MP3應該算目前應用最廣泛的有損壓縮數字音頻格式了。它的全稱是MPEG(MovingPictureExpertsGroup)AudioLayer-3。1987年德國Fraunhofer研究院研製成功的一種有損壓縮數字音頻格式,並於1989年取得專利。起初,它並不完善,它更像一個編碼標准框架,留待人們去完善。1992年,這一技術並入了MPEG規范,並有了正式名號——MP3。
MP3文件是由幀(frame)構成的,幀是MP3文件最小的組成單位。什麼是幀?還記得最初的動畫是怎麼做的嗎?不同的連續畫面切換以達到動態效果,每幅畫面就是一個「幀」,不同的是MP3裡面的幀記錄的是音頻數據而不是圖形數據。MP3的幀速度大概是30幀/秒。
每個幀又由幀頭和幀數據組成,幀頭記錄著該幀的基本信息,包括位率索引和采樣率索引(這對理解ABR和VBR編碼方式很重要)。幀數據,顧名思義就是記錄著主體音頻數據。
上面說的都是MP3編碼的基礎,但事實上,早期的編碼器都非常不完善,壓縮演算法近於粗暴,音質很不理想。MP3的音質有兩次飛躍:人體聽覺心理學模型(PerceptualModel)的導入和VBR技術的應用。
PS:VBR是variablebitrate的縮寫,意思是可變比率,就是MP3文件壓制的時候聲音元素較多,比率較高時,將自動減低壓縮比特率,在比特率需求比較低時自動升高比特率,這樣做的目的是在保證音質基本不被損害的情況下增加文件在線播放時的速度,和減少在本機播放時所佔的系統資源……這是Xing發展的演算法,他們將一首歌的復雜部分用高Bitrate編碼,簡單部分用低Bitrate編碼。主意雖然不錯,可惜Xing編碼器的VBR演算法很差,音質與CBR相去甚遠。幸運的是,Lame完美地優化了VBR演算法,使之成為MP3的最佳編碼模式。這是以質量為前提兼顧文件大小的方式,推薦編碼模式。
MP3能生存到今天,它的發展仍未止步。2001年6月14日,法國湯姆森與美國RCA兩家公司聯合推出了一種新的壓縮格式:MP3PRO。MP3PRO是基於MP3技術改良而來,它利用了CodingTechnologies公司開發的編解碼增強技術,該術稱為SBR(SpectralBandReplication)。當製作MP3PRO文件時,編碼器將音頻分為兩部分。一部分是將音頻數據中的低頻部分分離出來,通過傳統的MP3技術編碼得出正常的MP3音頻流。此舉使MP3編碼器專注於低頻段信號的壓縮從而獲得更好的質量,而且使原來的MP3播放器也能播放MP3PRO文件。另一部分則是將分離出來的高頻信號進行編碼並嵌入MP3流中。傳統的MP3播放器會將其忽略掉,而新的MP3PRO播放器會將其還原出來並進行組合,得到高質量的全帶寬的聲音。通過這項技術,使得MP3PRO64Kbps的編碼率便可提供128Kbps的MP3相同的質量,且具有相差無幾的音質,而體積只有MP3的一半大小。
PSP就支持MP3PRO,而且支持MP3PRO的格式轉換軟體也很多,大家可以去網上找找。有興趣的話可以試試,絕對比mp3強啊。
Thomson在2004年12月初正式宣布世界上最流行的音樂壓縮格式MP3邁進多聲道時代。MP3SURROUND是由FraunhoferIIS和Agere聯合開發的,使用了binauralCueCoding(BCC)技術心理聲學編碼,可以在實現多聲道環繞的同時保證文件的大小。同時加入的AgereSystems公司則主要負責將多聲道MP3格式——MP3SURROUND進行推廣。MP3SURROUND技術實現了5.1聲道環繞的高品質音頻,應用范圍相當廣泛,可以在網路音樂發布、廣播系統、PC視聽應用、游戲音效、消費電子產品和車載音響等方面發揮作用。盡管集成了多個聲道,但是Thomson表示MP3SURROUND文件相對於普通MP3(采樣率相當)並沒有太大的增加,相對於其他環繞多聲道音頻格式就只有它們的一半了。更為重要的,MP3SURROUND提供了良好的兼容性,可以在現有的MP3軟體、MP3播放器上正常使用。
2、AAC(*.3gp/*.mp4/*.m4a)
AAC是高級音頻編碼(AdvancedAudioCoding)的縮寫,它是由Fraunhofer研究院、杜比和AT&T共同研發的。AAC是MPEG-2規范的一部分,它適用於從速率8Kbps的單聲道電話音質到160Kbps多聲道的超高質量音頻范圍內的編碼。AAC與MP3相比,增加了諸如對立體聲的完美再現、碼流效果音掃描、多媒體控制、降噪優化等MP3音頻格式所沒有的特性,使得在音頻壓縮後仍能完美地再現CD音質。它還同時支持多達48個音軌、15個低頻音軌、更多種采樣率和比特率、多種語言的兼容性、更高的解碼效率。總之,AAC可以在比MP3文件縮小30%的前提下提供更好的音質。
現將其中的幾個模塊作一些說明:
增益控制(Gaincontrol)
增益控制模塊用在可變采樣率配置中,它由多相正交濾波器PQF(polyphasequadraturefilter)、增益檢測器(gaindetector)和增益修正器(gainmodifier)組成。這個模塊把輸入信號分離到4個相等帶寬的頻帶中。在解碼器中也有增益控制模塊,通過忽略PQF的高子帶信號獲得低采樣率輸出信號。
濾波器組(FilterBank)
濾波器組是把輸入信號從時域變換到頻域的轉換模塊,它是MPEG-2AAC系統的基本模塊。這個模塊採用了改進離散餘弦變換MDCT,它是一種線性正交交迭變換,使用了一種稱為時域混迭取消TDAC()技術。MDCT使用KBD(Kaiser-Besselderived)窗口或者使用正弦(sine)窗口,正向MDCT變換可使用下式表示:
逆向MDCT變換可使用下式表示:
其中,
n=樣本號,
N=變換塊長度,
i=塊號,
以上兩個離散餘弦變換公式在《離散函數》和《數理方程》中有詳細介紹,只為幫助有興趣的玩家了解,不必深究。
瞬時雜訊定形TNS
在感知聲音編碼中,TNS模塊是用來控制量化雜訊的瞬時形狀的一種方法,解決掩蔽閾值和量化雜訊的錯誤匹配問題。這種技術的基本想法是,在時域中的音調聲信號在頻域中有一個瞬時尖峰,TNS使用這種雙重性來擴展已知的預測編碼技術,把量化雜訊置於實際的信號之下以避免錯誤匹配。
聯合立體聲編碼
聯合立體聲編碼(jointstereocoding)是一種空間編碼技術,其目的是為了去掉空間的冗餘信息。MPEG-2AAC系統包含兩種空間編碼技術:M/S編碼(Mid/Sideencoding)和聲強/耦合(Intensity/Coupling)。M/S編碼使用矩陣運算,因此把M/S編碼稱為矩陣立體聲編碼(matrixedstereocoding)。M/S編碼不傳送左右聲道信號,而是使用標稱化的「和」信號與「差」信號,前者用於中央M(middle)聲道,後者用於邊S(side)聲道,因此M/S編碼也叫做「和-差編碼(sum-differencecoding)」。聲強/耦合編碼的名稱也很多,有的叫做聲強立體聲編碼(intensitystereocoding),或者叫做聲道耦合編碼(channelcouplingcoding),它們探索的基本問題是聲道間的不相關性(irrelevance)。
預測(Prediction)
這是在話音編碼系統中普遍使用的一種技術,它主要用來減少平穩(stationary)信號的冗餘度。
量化器(Quantizer)
使用了非均勻量化器。
無雜訊編碼(Noiselesscoding)
無雜訊編碼實際上就是霍夫曼編碼,它對被量化的譜系數、比例因子和方向信息進行編碼。
PS:我個人比較喜歡AAC,所以寫的較為詳細,大家也不妨試試,絕對比MP3優秀。大家可以使用iTunes6來轉換AAC(*.m4a)。iTunes6AAC的操作很簡單,你可以直接把AAC(*.3gp*.mp4*.m4a)拷貝到[MUSIC]就能播。
可以說,aac是目前最好的有損壓縮方式。
最高質量的普較無損看(肉眼)不出區別。
3、ATRAC3/ATRAC3+(*.aa3)
早年玩MD的朋友都知道SONY專為MD量身定做的ATRAC音頻格式演算法,後來又廣泛應用於SONY的NetworkWalkman和其他便攜音頻設備。「ATRAC3plus」代表「自適應轉換聲音編碼3+」,是一套基於心理聲學原理的音頻壓縮技術,從ATRAC3格式發展而來,到2002年這項技術才日趨完美。這一技術是把MD隨身聽的體積縮小到很小的理論基礎。
要分析ATRAC3/ATRAC3+,我們先要談談它的大哥——ATRAC演算法。當數字音頻數據被壓縮時,通常都會把一定數量的量化噪音帶入信號。為了不讓這些信號被人耳感知,通常的做法是,音頻編碼把信號分解為一組單元,每組單元都對應著特定的時間頻率范圍。編碼器會依據前文提到的心理聲學原理來分析,對重要的單元進行高精度編碼,對不敏感的單元可以保留一些量化的噪音但不影響人耳的感知質量。解碼時,量化頻譜會根據比特分配重新建立,然後合成音頻信號。
ATRAC也不例外,但有一些改進。ATRAC還應用了子頻帶解碼和轉換解碼技術,輸入的信號被分配得到不均勻的強調重要低音區的頻率分割。另外,ATRAC使用一個可變塊長度改變輸入的信號,這可以確保在穩定通過時高效的解碼,不會在瞬間通過時影響時間的解析度。具體說,輸入的信號在5.5125KHz和11.025KHz被分為3個頻帶。子頻帶的分解使用QMF(QuadratureMirrorFilters積分映射過濾器)來完成;這3個頻帶被MDCT(變址離散餘弦變換——類似於通常的快速傅里葉變換,《高等數學二》和《數理方程》中有相關介紹。)轉換成頻譜值,MDCT允許塊之間有達50%的交迭,使得在維持臨界采樣時能提高頻率解析度。塊的長度可以根據信號的種類改變,這就是ATRAC的自適應部分(這一做法主要是為了利用屏蔽掩蓋初始量化噪音)。
當ATRAC演算法發展了10年,已經滿足不了市場的需求,SONY於2002年8月推出了新的演算法——
ATRAC3/ATRAC3+。其核心演算法較ATRAC沒有本質的大改變,只是採用了改進的頻帶分離過濾和MDCT,並使用增益調節、音調成分分離、聯合立體聲(Joint-Stereo)等技術,使得音頻壓縮數據的體積進一步縮小。
4、AAL(ATRACAdvancedLossless)
AAL是ATRACAdvancedLossless(自適應聲學轉換高級無損編碼)的縮寫,是SONY新開發的一個音頻壓縮格式其特點是無損壓縮,不損失一點音頻信息,一張CD可以壓縮到原來的30%--80%。
5、Ogg
Ogg全稱應該是OGG Vobis(ogg Vorbis) 是一種新的音頻壓縮格式,類似於MP3等現有的音樂格式。但有一點不同的是,它是完全免費、開放和沒有專利限制的。OGG Vobis有一個很出眾的特點,就是支持多聲道,隨著它的流行,以後用隨身聽來聽DTS編碼的多聲道作品將不會是夢想。
Vorbis 是這種音頻壓縮機制的名字,而Ogg則是一個計劃的名字,該計劃意圖設計一個完全開放性的多媒體系統。
Ogg Vorbis文件的擴展名是.OGG。這種文件的設計格式是非常先進的。創建的OGG文件可以在任何播放器上播放,因此,這種文件格式可以不斷地進行大小和音質的改良,而不影響舊有的編碼器或播放器。
較aac而言,低頻方面略有優勢,高頻方面比aac差。
最高質量的普較無損看(肉眼)不出區別。
最高質量,即Q10,體積比aac使用faac編碼最高質量Q500體積大差不多一倍。
編碼開源。

熱點內容
怎麼連台式電腦的wifi密碼 發布:2025-03-22 07:03:14 瀏覽:541
海豚模擬器怎麼配置不卡 發布:2025-03-22 06:57:31 瀏覽:772
名字學演算法 發布:2025-03-22 06:57:27 瀏覽:753
加密的話 發布:2025-03-22 06:55:54 瀏覽:989
最吃配置的手機游戲有哪些 發布:2025-03-22 06:42:35 瀏覽:225
新聞開發android 發布:2025-03-22 06:40:27 瀏覽:94
應用程序緩存在哪裡 發布:2025-03-22 06:31:10 瀏覽:232
電量演算法 發布:2025-03-22 06:27:08 瀏覽:364
ip地址選擇伺服器 發布:2025-03-22 06:25:46 瀏覽:229
本店的密碼是多少 發布:2025-03-22 06:20:07 瀏覽:733