當前位置:首頁 » 操作系統 » mp3編碼演算法

mp3編碼演算法

發布時間: 2022-05-20 20:45:50

⑴ mp3,rm,wma幾種格式的區別和聯系

一、WMA 由於是微軟的作品,絕對不能小看,WMA象一劑強心針一樣促進了流式媒體格式的大進步。WMA文件可以在僅僅20K Bitrate的流量下提供可聽的音質,因此WMA常常當作用於在線收聽和廣播的首選,微軟早就在Windows Media Player中提供了播放支持。當WMA的Bitrate上升到128k時,幾乎在同級別的所有有損編碼格式中笑傲江湖了,MP3在128KBitrate時,會出現明顯的高頻丟失,而WMA不會。但似乎128k是WMA一個檻,當Bitrate再往上提升時,不會有太多的音質改變。MP3卻不一樣,在192K時,音質可以比WMA好了。微軟推出WMA編碼時主要有2個針對目標,一個是瞄準了網路上的RM和RAM格式,另一個是用戶硬碟中的MP3。但在高音質要求下,WMA仍無法構成對MP3的威脅。如果你要獲得12:1左右或更高的壓縮比,就不妨選擇WMA格式,在這個流量下,WMA優秀太多了。WMA和MP3的優劣一直是大家爭論的焦點,其實這是一個無法回答的問題。這要看你的實際需要,是追求高音質(mp3)還是高壓縮率(wma)。二.MP3 MP3最受爭議的就是音質問題(尤其是隨著WMA的普及),其高頻損失很大,很多MP3編碼器粗糙的編碼演算法不但導致高頻丟失,還丟失了許多細節,類似吉他擦弦的感覺在MP3中是找不到的。在對MP3快要失望時,偶發現了Lame,它支持根據人耳遮蔽效應原理來分析波形,配合VBR技術,可以讓音質達到令人吃驚的地步;其獨創的心理音響模型技術保證了CD音頻還原的真實性,配合VBR(動態比特率)和ABR(平均比特率)參數,編碼出來的MP3音色純厚、空間寬廣、低音清晰、細節表現良好,音質幾乎可以媲美CD音頻,但文件體積卻非常小。很多網友在使用LAME後的反映就是:立刻刪除硬碟上所有的MP3和其他編碼器,全部用Lame重新來過。 Lame提供EXE和DLL,其中DLL是作為標準的動態運行庫供其他程序調用。EXE是Command Line程序,象DOS程序一樣工作,兩者彼此獨立,互不關聯。但大家很快能發現兩者編碼的質量是不一樣的,那是由於dll可控性差,與具備豐富調節參數的EXE版相比,其壓縮出來的MP3效果稍遜一籌。但EXE是一個命令行工具,操作很麻煩,幸虧有了WinLAMEr或lameGUIxp這些Shell。只要學會使用這些Shell(是傻瓜型的,一看即會),就可以用LAME壓縮出最最精彩的MP3了。 再說說APS,在LAME出現以前,APS就是最好的MP3編碼器,它使用的Fraunhofer IIS編碼演算法,這比LAME使用的編碼演算法要先進,在192k Bitrate(CBR)下,甚至比LAME編碼的曲子要優秀,細節明顯要豐富一些,但APS本身不支持VBR,當Bitrate往上提高時,音質就要比LAME編碼的要差了,大部分朋友的MP3的一般都是128-192K Bitrate的,因此APS仍舊有推薦的價值。特別是有很多MP3隨身聽不支持VBR和256K Bitrate以上的MP3,LAME就不一定合適這些朋友了,APS就成了不錯的選擇,由它編碼的曲子,絕對不會辱沒你昂貴的PLAYER。 三.RM RM已經是昨日黃花,沒有任何新意,低Bitrate比不過WMA,高Bitrate比不過MP3,雖然新的RM導入了ATRAC3演算法,但頹勢已定,很難東山再起了 總結: 區別在以下幾方面: 1.音質 2.文件大小(壓縮率) 3.內部演算法參考資料: http://iask.sina.com.cn/q/5/48/55/554805.shtml

滿意請採納

⑵ mp3採用的是什麼編碼

PME-MP3 Decoder系統是普銳移通科技面向嵌入式系統多媒體整體解決方案中,MP3解碼功能部分。本系統可以用於智能手機或者其他嵌入式設備中的MP3 軟體解碼器。

PME-MP3 Decoder系統是嚴格遵循MPEG-1 LayerIII及MPEG-2 LayerIII協議標准設計的。演算法本身支持所有協議規定的碼流率和采樣率,以便用戶根據不同的音質和存儲空間的要求,自由調節。最大限度提高了系統的普適性。例如在智能手機應用系統中,用戶欣賞音樂一般用128kbps或者更高碼流率的文件;而手機內置或者在線下載的鈴聲,用64kbps碼流率即可。

系統設計時在嚴格遵循有關協議規范的基礎上,同時在音頻演算法方面,提出了眾多高效快速的等效演算法,最大限度的降低CPU運算資源消耗。

在具體嵌入式處理器移植過程中,充分和EPSON、ARM、ADI公司進行合作,在指令級最大限度降低CPU資源消耗。EPSON 32-bit RISC處理器進行有關體系結構優化。在EPSON S1C33401等系列處理器都可以流暢運行。

在系統具體應用層面,針對於同一種碼流率,系統提供了多種解碼和輸出方式選擇,以便用戶根據當前CPU資源的佔用情況,提供靈活的MP3解碼解決方案。

2、PME-MP3基本技術指標

項目 具體描述 備注
遵循國際行業標准 8kbps ~ 320kbps
支持輸出采樣率 8K,11K,22K,32K,44K
支持輸出模式 單聲道、立體聲
其他協議支持 MPEG-1 Layer I, LayerII MPEG-2 LayerI, LayerII
支持文件格式 MP3 ID3支持

3、PME MP3 Decoder 存儲器資源消耗

項目 具體描述 備注
代碼空間 46KByte
RAM消耗 < 64K byte
棧消耗 < 8K byte
放音緩沖區 64kbyte
使用編譯器 GCC ID3支持
支持處理器 EPSON S1C33xx、S1C334xx、ARM7、ARM9、ADI BlackFin、TI 54xx、OMAP、Xscale

⑶ MP3音頻格式採用的編碼方式是

一、MP3播放機和MP3的區別

許多朋友可能都知道,MP3是一種可以通過電腦進行編碼和播放的音樂格式,這是一種文件的數據格式。這里所指的MP3播放機就是可以脫離電腦直接播放MP3音樂的一種設備,是一種客觀存在的機器,和常說的MP3格式不同,因此我們為了區分,往往在「MP3」後面加上個「機」或「播放器」來區分MP3的播放設備和MP3文件格式。

二、快閃記憶體式MP3

快閃記憶體MP3可以說是目前最常見的MP3產品,大約占據MP3銷量的95%甚至更高一些。電腦上存儲的文件和數據都必須有一個載體,在電腦中這個載體就是硬碟。而對於MP3播放器來說,歌曲存在哪裡呢?沒有保存的介質自然無法播放。目前,大多數MP3播放器都採用快閃記憶體的存儲方式,快閃記憶體FlashMemory是快速寫存儲器的簡稱,它是一種固態、不易揮發、可復寫的存儲載體,其運作方式就像隨機存取內存與硬碟的結合體。快閃記憶體FlashMemory工作穩定、能夠在低電壓狀態下運作、以及能夠在斷電狀態下保存其中的資料等特色。快閃記憶體式MP3發展的最初容量非常低,只有16MB或者32MB。不過,隨著快閃記憶體晶元的不斷發展,現在比較主流的快閃記憶體式MP3產品的容量已經達到了128MB至256MB,而512MB、1GB或者更大容量的MP3播放器也已經屢見不鮮。

近日,著名MP3廠商蘋果放棄了微硬碟MP3轉而推出的2GB和4GB大容量的快閃記憶體MP3播放器,這款採用真彩屏幕、超薄設計的時尚大容量快閃記憶體MP3一經推出就受到了許多朋友的喜愛。一般來說,我們常使用的128kbps壓縮率的MP3每首大約3-5M,所以現在主流的256M內存的MP3播放器,可以存放這樣的歌曲60首左右,如果是一台1GB容量的MP3播放器則可以存儲大約250首這樣的歌曲。快閃記憶體MP3的容量當然是內至快閃記憶體當然是越大越好,但是快閃記憶體容量越大價格也會幾何級別上升。雖然,MP3播放器還能當做閃盤等移動存儲來使用,但是容量大小還是根據您的需要來進行選擇,沒必要一味追求超大的存儲容量。如果還要考慮到今後對容量的升級,那可以考慮購買有擴展槽的MP3機,以滿足日後擴充的需要

三、硬碟式MP3

和快閃記憶體式MP3一樣,硬碟式MP3的含義是MP3文件的存儲載體由快閃記憶體變成了硬碟。硬碟式MP3播放器是近年來興起的一類MP3播放器,硬碟式MP3播放器也分為兩類,一類是採用1英寸微硬碟做為載體的MP3播放器,以蘋果ipodmini、創新Muvo、艾利和H10代表,存儲容量一般為2GB-6GB;另一類是採用1.8英寸硬碟做為載體的MP3播放器,以蘋果ipod系列、索尼HD5為代表,存儲容量達到20GB至60GB。
硬碟式MP3播放器和傳統的快閃記憶體式MP3播放器相比,在體積上都有先天的不足,因為體積較大的硬碟和微硬碟讓硬碟MP3播放器顯得有些臃腫,所以硬碟型的MP3與快閃記憶體型MP3相比普遍都是龐然大物,並且外形方面都比較中規中矩,除了蘋果的產品在外觀工藝和色彩上完全走的時尚路線,大多數硬碟式MP3播放器外觀都沒有什麼特別出彩的地方。但是,也真是因為體積比較大,硬碟式MP3可以設計更多的外觀功能,例如較大尺寸的彩色液晶顯示屏、支持外置存儲卡介面以及採用觸摸按鍵等等。一般來說,硬碟式MP3播放器可以存儲更多的音樂,做為移動硬碟存儲數據也非常方便。而且大多數硬碟MP3都內置了大容量的鋰電池,所以在播放時間上並不用擔心,索尼新推出的硬碟MP3HD5更是可以達到40小時的連續播放時間。

四、MP3音頻格式

MP3是目前使用用戶最多的有損壓縮數字音頻格式了,它的全稱是MPEG(MPEG:Moving PictureExpertsGroup)AudioLayer-3,MP3音頻格式最早在1993年由德國夫朗和費研究院和法國湯姆生公司合作發展成功。早期的MP3編碼採用的的是固定編碼率的方式(CBR),我們常看到的128kbps,就是代表它是以128kbps固定數據速率編碼(碼流),目前最高可以達到320kbps,當然,編碼率越高音質就更好,同時音樂文件的體積也就更大。目前大多數主流MP3播放器都可以支持到8kbps-320kbps,不過一些低端產品就支持不了寬廣的編碼率。

不過MP3編碼方式並不是十全十美,而且MP3是開放編碼,因此就有新的演算法推出了,VBR動態編碼就是其中的一種,它的原理就是利用將一首歌的復雜部分用高bitrate編碼,簡單部分用低bitrate編碼,通過這種方式,進一步取得質量和體積的統一。現在新推出的MP3播放器大部分都支持VBR編碼方式了,老款產品在VBR支持這方面較少,因為VBR編碼方式可以在同等音質下獲得更好的文件體積,因此越來越普及。

五、WMA音頻格式

WMA格式的全稱為WindowsMediaAudio,它是微軟公司推出的與MP3格式齊名的一種新的音頻格式。由於WMA在壓縮比和音質方面都超過了MP3,更是遠勝於RA(RealAudio),即使在較低的采樣頻率下也能產生較好的音質,再加上WMA有微軟的WindowsMediaPlayer做其強大的後盾,所以一經推出就贏得一片喝彩。微軟官方宣布的資料中稱WMA格式的可保護性極強,甚至可以限定播放機器、播放時間及播放次數,具有相當的版權保護能力。應該說,WMA的推出,就是針對MP3沒有版許可權制的缺點而來。除了版權保護外,WMA還在壓縮比上進行了深化,它的目標是在相同音質條件下文件體積可以變的更小。

由於WMA具有較高的壓縮比所以就意味著,它在相同音質下可以比MP3格式文件更小體積,所以有這個功能等於變相增大MP3機的容量。它的壓縮率一般在5-192kbos。不過,只在MP3低於192kbps碼率的情況下有效,實際上當採用LAME演算法壓縮MP3格式時,高於192kbps時普遍的反映是MP3的音質要好於WMA。不過,現在許多WMA格式的音樂文件都加入了版權保護,這也是微軟主推的一個功能。因此,雖然目前支持WMA格式播放的MP3還是很多的,只是找免費的WMA音樂似乎要碰碰運氣了。除了上面介紹的MP3音頻格式和WMA音頻格式之外,還有許多MP3播放機可能可以播放的格式,例如ASF、WAV、Vorbis、AIF/AIFF、MP3PRO、Ogg以及索尼自己開發的ATRAC等等,但是最長見的播放格式就是MP3音頻格式和WMA音頻格式,因此選購MP3播放器一定要能支持這兩種播放格式。

⑷ MP3 編碼 恆定碼率(CBR) 跟平均碼率(ABR) 是什麼東西..還有32~320 kbps 這些代表什麼.是不是越高音質越好

VBR是動態編碼
最高應該是320Kbps
MP3的全稱是MPEG(MPEG:Moving Picture Experts Group) Audio Layer-3,1993年由德國夫朗和費研究院和法國湯姆生公司合作發展成功。MP3是一種有損的壓縮方式,早期的MP3編碼採用的的是固定編碼率的方式(CBR ),我們常看到的128KB/S,就代表每秒的數據流量有128KBIT,而且是固定的,這個稱之為比特率,比特率本身是可以改變的,最高可以到320KBPS,當然比特率越高音質越好,但是文件的體積會相應增大。

因為MP3的編碼方式是開放的,你可以在這個標准框架的基礎上自己選擇不同的聲學原理進行壓縮處理,所以,很快由Xing公司推出可變編碼率的壓縮方式(VBR)。它的原理就是利用將一首歌的復雜部分用高 bitrate 編碼,簡單部分用低 bitrate 編碼,通過這種方式,進一步取得質量和體積的統一。當然,早期的Xing 編碼器的 VBR 演算法很差,音質與 CBR (固定碼率)相去甚遠。但是,這種演算法指明了一種方向,其他開發者紛紛推出自己的VBR演算法,使得效果一直在改進。目前公認比較好的首推 LAME,它完美地實現了 VBR 演算法,而且它是是完全免費的軟體,並且由愛好者組成的開發團隊一直在不斷的發展完善。

而在VBR的基礎上,LAME更加發展出ABR演算法。ABR(Average Bitrate)平均比特率,是VBR的一種插值參數。LAME針對CBR不佳的文件體積比和VBR生成文件大小不定的特點獨創了這種編碼模式。ABR在指定的文件大小內,以每50幀(30幀約1秒)為一段,低頻和不敏感頻率使用相對低的流量,高頻和大動態表現時使用高流量,可以做為VBR和CBR的一種折衷選擇。

⑸ mp3的音頻解碼

我ctrl+c ,然後ctrl+v的解碼在標准中進行了細致的定義。 多數解碼器是bitstream compliant,也就是說MP3文件解碼出來的非壓縮輸出信號將與標准文檔中數學定義的輸出信號一模一樣(在規定的近似誤差范圍內)。 MP3文件有一個標準的格式,這個格式就是包括384、576、或者1152個采樣點(隨MPEG的版本和層不同而不同)的幀,並且所有的幀都有關聯的頭信息(32位)和輔助信息(9、17或者32位元組,隨著MPEG版本和立體聲或者單通道的不同而不同)。頭和輔助信息能夠幫助解碼器正確地解碼相關的霍夫曼編碼數據。所以,大多數的解碼器比較幾乎都是完全基於它們的計算效率(例如,它們在解碼過程中所需要的內存或者CPU時間)。

⑹ 什麼是MP3

1.便攜MP3播放器的俗稱.
用來播放MP3格式音樂(現在可以兼容wma,wav等格式)的一種攜帶型的播放器.攜帶型MP3播放器最初由韓國人文光洙和黃鼎夏(Moon & Hwang)於1997年發明,並申請了相關專利.

最新MP3播放器大全: target=_blank>http://proct.pcpop.com/MP3/00000_1.html
2.MP3作為一種音樂格式
MPEG-1 Audio Layer 3,經常稱為MP3,是當今較流行的一種數字音頻編碼和有損壓縮格式,它設計用來大幅度地降低音頻數據量,而對於大多數用戶來說重放的音質與最初的不壓縮音頻相比沒有明顯的下降。它是在1991年由位於德國埃爾朗根的研究組織Fraunhofer-Gesellschaft的一組工程師發明和標准化的。

概觀

MP3是一個數據壓縮格式。它丟棄掉脈沖編碼調制(PCM)音頻數據中對人類聽覺不重要的數據(類似於JPEG是一個有損圖像壓縮),從而達到了小得多的文件大小。

在MP3中使用了許多技術其中包括心理聲學以確定音頻的哪一部分可以丟棄。MP3音頻可以按照不同的位速進行壓縮,提供了在數據大小和聲音質量之間進行權衡的一個范圍。

MP3格式使用了混合的轉換機制將時域信號轉換成頻域信號:

* 32波段多相積分濾波器(PQF)
* 36或者12 tap 改良離散餘弦濾波器(MDCT);每個子波段大小可以在0...1和2...31之間獨立選擇
* 混疊衰減後處理

根據MPEG規范的說法,MPEG-4中的AAC(Advanced audio coding)將是MP3格式的下一代,盡管有許多創造和推廣其他格式的重要努力。然而,由於MP3的空前的流行,任何其他格式的成功在目前來說都是不太可能的。MP3不僅有廣泛的用戶端軟體支持,也有很多的硬體支持比如攜帶型媒體播放器(指MP3播放器)DVD和CD播放器。

歷史

發展

MPEG-1 Audio Layer 2編碼開始時是德國Deutsche Forschungs- und Versuchsanstalt für Luft- und Raumfahrt(後來稱為Deutsches Zentrum für Luft- und Raumfahrt, 德國太空中心)Egon Meier-Engelen管理的數字音頻廣播(DAB)項目。這個項目是歐盟作為EUREKA研究項目資助的,它的名字通常稱為EU-147。EU-147 的研究期間是1987年到1994年。

到了1991年,就已經出現了兩個提案:Musicam(稱為Layer 2)和ASPEC(自適應頻譜感知熵編碼)。荷蘭飛利浦公司、法國CCETT和德國Institut für Rundfunktechnik提出的Musicam方法由於它的簡單、出錯時的健壯性以及在高質量壓縮時較少的計算量而被選中。基於子帶編碼的Musicam 格式是確定MPEG音頻壓縮格式(采樣率、幀結構、數據頭、每幀采樣點)的一個關鍵因素。這項技術和它的設計思路完全融合到了ISO MPEG Audio Layer I、II 以及後來的Layer III(MP3)格式的定義中。在Mussmann教授(University of Hannover)的主持下,標準的制定由Leon van de Kerkhof(Layer I)和Gerhard Stoll(Layer II)完成。

一個由荷蘭Leon Van de Kerkhof、德國Gerhard Stoll、法國Yves-François Dehery和德國Karlheinz Brandenburg 組成的工作小組吸收了Musicam和ASPEC的設計思想,並添加了他們自己的設計思想從而開發出了MP3,MP3能夠在128kbit/s達到MP2 192kbit/s 音質。

所有這些演算法最終都在1992年成為了MPEG的第一個標准組MPEG-1的一部分,並且生成了1993年公布的國際標准ISO/IEC 11172-3。MPEG音頻上的更進一步的工作最終成為了1994年制定的第二個MPEG標准組MPEG-2標準的一部分,這個標准正式的稱呼是1995年首次公布的ISO/IEC 13818-3。

編碼器的壓縮效率通常由位速定義,因為壓縮率依賴於位數(:en:bit depth)和輸入信號的采樣率。然而,經常有產品使用CD參數(44.1kHz、兩個通道、每通道16位或者稱為2x16位)作為壓縮率參考,使用這個參考的壓縮率通常較高,這也說明了壓縮率對於有損壓縮存在的問題。

Karlheinz Brandenburg使用CD介質的Suzanne Vega的歌曲Tom's Diner來評價MP3壓縮演算法。使用這首歌是因為這首歌的柔和、簡單旋律使得在回放時更容易聽到壓縮格式中的缺陷。一些人開玩笑地將Suzanne Vega稱為「MP3之母」。來自於EBU V3/SQAM參考CD的更多一些嚴肅和critical 音頻選段(glockenspiel, triangle, accordion, ...)被專業音頻工程師用來評價MPEG音頻格式的主觀感受質量。

MP3走向大眾

為了生成位兼容的MPEG Audio文件(Layer 1、Layer 2、Layer 3),ISO MPEG Audio委員會成員用C語言開發的一個稱為ISO 11172-5的參考模擬軟體。在一些非實時操作系統上它能夠演示第一款壓縮音頻基於DSP的實時硬體解碼。一些其它的MPEG Audio實時開發出來用於面向消費接收機和機頂盒的數字廣播(無線電DAB和電視DVB)。

後來,1994年7月7日Fraunhofer-Gesellschaft發布了第一個稱為l3enc的MP3編碼器。

Fraunhofer開發組在1995年7月14日選定擴展名.mp3(以前擴展名是.bit)。使用第一款實時軟體MP3播放器Winplay3(1995年9月9日發布)許多人能夠在自己的個人電腦上編碼和回放MP3文件。由於當時的硬碟相對較小(如500MB),這項技術對於在計算機上存儲娛樂音樂來說是至關重要的。

MP2、MP3與網際網路

1993年10月,MP2(MPEG-1 Audio Layer 2)文件在網際網路上出現,它們經常使用Xing MPEG Audio Player播放,後來又出現了Tobias Bading為Unix開發的MAPlay。MAPlay於199年2月22日首次發布,現在已經移植到微軟視窗平台上。

剛開始僅有的MP2編碼器產品是Xing Encoder和CDDA2WAV,CDDA2WAV是一個將CD音軌轉換成WAV格式的CD抓取器。

Internet Underground Music Archive(IUMA)通常被認為是在線音樂革命的鼻祖,IUMA是網際網路上第一個高保真音樂網站,在MP3和網路流行之前它有數千首授權的MP2錄音。

從1995年上半年開始直到整個九十年代後期,MP3開始在網際網路上蓬勃發展。MP3的流行主要得益於如Nullsoft於1997年發布的Winamp和Napster於1999年發布的Napster這樣的公司和軟體包的成功,並且它們相互促進發展。這些程序使得普通用戶很容易地播放、製作、共享和收集MP3文件。

關於MP3文件的點對點技術文件共享的爭論在最近幾年迅速蔓延—這主要是由於壓縮使得文件共享成為可能,未經壓縮的文件過於龐大難於共享。由於MP3文件通過網際網路大量傳播一些主要唱片廠商通過法律起訴Napster來保護它們的版權(參見知識產權)。

如iTunes Music Store這樣的商業在線音樂發行服務通常選擇其它或者專有的支持數字版權管理(DRM)的音樂文件格式以控制和限制數字音樂的使用。支持DRM的格式的使用是為了防止受版權保護的素材免被侵犯版權,但是大多數的保護機制都能被一些方法破解。這些方法能夠被計算機高手用來生成能夠自由復制的解鎖文件。一個顯著的例外是微軟公司的Windows Media Audio 10格式,目前它還沒有被破解。如果希望得到一個壓縮的音頻文件,這個錄制的音頻流必須進行壓縮並且帶來音質的降低。

MP3的音頻質量

因為MP3是一種有損格式,它提供了多種不同「位速」的選項—也就是用來表示每秒音頻所需的編碼數據位數。典型的速度介於每秒128和320kb之間。與此對照的是,CD上未經壓縮的音頻位速是1411.2 kbit/s(16 位/采樣點 × 44100 采樣點/秒 × 2 通道)。

使用較低位速編碼的MP3文件通常回放質量較低。使用過低的位速,「壓縮雜訊(:en:compression artifact)」(原始錄音中沒有的聲音)將會在回放時出現。說明壓縮雜訊的一個好例子是壓縮歡呼的聲音:由於它的隨機性和急劇變化,所以編碼器的錯誤就會更明顯,並且聽起來就象回聲。

除了編碼文件的位速之外,MP3文件的質量也與編碼器的質量以及編碼信號的難度有關。使用優質編碼器編碼的普通信號,一些人認為128kbit/s的MP3以及44.1kHz的CD采樣的音質近似於CD音質,同時得到了大約11:1的壓縮率。在這個比率下正確編碼的MP3能夠獲得比調頻廣播和卡式磁帶更好的音質,這主要是那些模擬介質的帶寬限制、信噪比和其它一些限制。然而,聽力測試顯示經過簡單的練習測試聽眾能夠可靠地區分出128kbit/s MP3與原始CD的區別。在許多情況下他們認為MP3音質太低是不可接受的,然而其他一些聽眾或者換個環境(如在嘈雜的車中或者聚會上)他們又認為音質是可接受的。很顯然,MP3 編碼的瑕疵在低端計算機的揚聲器上比較不明顯,而在連接到計算機的高質量立體聲系統,尤其是使用高質量的headphone時則比較明顯。

Fraunhofer Gesellschaft(FhG)在他們的官方網站上公布了下面的MPEG-1 Layer 1、2和3的壓縮率和數據速率用於比較:

* Layer 1: 384 kbit/s,壓縮率 4:1
* Layer 2: 192...256 kbit/s,壓縮率 8:1...6:1
* Layer 3: 112...128 kbit/s,壓縮率 12:1...10:1

不同層面之間的差別是因為它們使用了不同的心理聲學模型導致的;Layer 1的演算法相當簡單,所以透明編碼就需要更高的位速。然而,由於不同的編碼器使用不同的模型,很難進行這樣的完全比較。

許多人認為所引用的速率出於對Layer 2和Layer 3記錄的偏愛而出現了嚴重扭曲。他們爭辯說實際的速率如下所列:

* Layer 1: 384 kbit/s 優秀
* Layer 2: 256...384 kbit/s 優秀, 224...256 kbit/s 很好, 192...224 kbit/s 好
* Layer 3: 224...320 kbit/s 優秀, 192...224 kbit/s 很好, 128...192 kbit/s 好

當比較壓縮機制時,很重要的是要使用同等音質的編碼器。將新編碼器與基於過時技術甚至是帶有缺陷的舊編碼器比較可能會產生對於舊格式不利的結果。由於有損編碼會丟失信息這樣一個現實,MP3演算法通過建立人類聽覺總體特徵的模型盡量保證丟棄的部分不被人耳識別出來(例如,由於noise masking),不同的編碼器能夠在不同程度上實現這一點。

一些可能的編碼器:

* Mike Cheng在1998年早些時候首次開發的LAME。 與其它相比,它是一個完全遵循LGPL的MP3編碼器,它有良好的速度和音質,甚至對MP3技術的後繼版本形成了挑戰。
* Fraunhofer Gesellschaft:有些編碼器不錯,有些有缺陷。

有許多的早期編碼器現在已經不再廣泛使用:

* ISO dist10 參考代碼
* Xing
* BladeEnc
* ACM Procer Pro.

好的編碼器能夠在128到160kbit/s下達到可接受的音質,在160到192kbit/s下達到接近透明的音質。所以不在特定編碼器或者最好的編碼器話題內說128kbit/s或者192kbit/s下的音質是容易引起誤解的。一個好的編碼器在 128kbit/s下生成的MP3有可能比一個不好的編碼器在192kbit/s下生成的MP3音質更好。另外,即使是同樣的編碼器同樣的文件大小,一個不變位速的MP3可能比一個變位速的MP3音質要差很多。

需要注意的一個重要問題是音頻信號的質量是一個主觀判斷。Placebo effect is rampant, with many users claiming to require a certain quality level for transparency.許多用戶在A/B測試中都沒有通過,他們無法在更低的位速下區分文件。一個特定的位速對於有些用戶來說是足夠的,對於另外一些用戶來說是不夠的。每個人的聲音感知可能有所不同,所以一個能夠滿足所有人的特定心理聲學模型並不明顯存在。僅僅改變試聽環境,如音頻播放系統或者環境可能就會顯現出有損壓縮所產生的音質降低。上面給出的數字只是大多數人的一個大致有效參考,但是在有損壓縮領域真正有效的壓縮過程質量測試手段就是試聽音頻結果。

如果你的目標是實現沒有質量損失的音頻文件或者用在演播室中的音頻文件,就應該使用無損壓縮演算法,目前能夠將16位PCM音頻數據壓縮到38%並且聲音沒有任何損失,這樣的壓縮工具有Lossless Audio LA、Apple Lossless、TTA、FLAC、Windows Media Audio 9 Lossless (wma) 和Monkey's Audio 等等。對於需要進行編輯、混合處理的音頻文件要盡量使用無損格式,否則有損壓縮產生的誤差可能在處理後無法預測,多次編碼產生的損失將會混雜在一起,在處理之後進行編碼這些損失將會變得更加明顯。無損壓縮在降低壓縮率的代價下能夠達到最好的結果。

一些簡單的編輯操作,如切掉音頻的部分片段,可以直接在MP3數據上操作而不需要重新編碼。對於這些操作來說,只要使用合適的軟體(mp3DirectCut和MP3Gain),上面提到的所關心的問題可以不必考慮。

位速

位速對於MP3文件來說是可變的。總的原則是位速越高則聲音文件中包含的原始聲音信息越多,這樣回放時聲音質量也越高。在MP3編碼的早期,整個文件使用一個固定的位速。

MPEG-1 Layer 3允許使用的位速是32、40、48、56、64、80、96、112、128、160、192、224、256和320 kbit/s,允許的采樣頻率是32、44.1和48kHz。44.1kHz是最為經常使用的速度(與CD的采樣速率相同),128kbit/s是事實上「好品質」的標准,盡管192kbit/s在對等文件共享網路上越來越受到歡迎。MPEG-2和[非正式的]MPEG-2.5包括其它一些位速:6、12、24、32、40、48、56、64、80、96、112、128、144、160kbit/s。

可變位速(VBR)也是可能的。MP3文件的中的音頻切分成有自己不同位速的幀,這樣在文件編碼的時候就可以動態地改變位速。盡管在最初的實現中並沒有這項功能,VBR現在已經得到了廣泛的應用。這項技術使得在聲音變化大的部分使用較大的位速而在聲音變化小的部分使用較小的位速成為可能。這個方法類似於聲音控制的磁帶錄音機不記錄靜止部分節省磁帶消耗。一些編碼器在很大程度上依賴於這項技術。

高達640kbit/s的非標准位速可以使用LAME編碼器和自由格式來實現,但是幾乎沒有MP3播放器能夠播放這些文件。

MP3的設計局限

MP3格式有一些不能僅僅通過使用更好的編碼器繞過的內在限制。一些新的壓縮格式如Vorbis和AAC不再有這些限制。

按照技術術語,MP3有如下一些限制:

* 位速最大是320 kbit/s
* 時間解析度相對於變化迅速的信號來說太低
* 對於超過15.5/15.8 kHz的頻率沒有scale factor band
* Joint stereo 是基於幀與幀完成的
* 沒有定義編碼器/解碼器的整體時延,這就意味著gapless playback缺少一個正式的規定

然而,即使有這些限制,一個好好的調整MP3編碼器能夠非常有競爭力地完成編碼任務。

MP3音頻編碼

MPEG-1標准中沒有MP3編碼器的一個精確規范,然而與此相反,解碼演算法和文件格式卻進行了細致的定義。人們設想編碼的實現是設計自己的適合去除原始音頻中部分信息的演算法(或者是它在頻域中的修正離散餘弦(MDCT)表示)。在編碼過程中,576個時域樣本被轉換成576個頻域樣本,如果是瞬變信號就使用192而不是576個采樣點,這是限制量化雜訊隨著隨瞬變信號短暫擴散。

這是聽覺心理學的研究領域:人類主觀聲音感知。

這樣帶來的結果就是出現了許多不同的MP3編碼器,每種生成的聲音質量都不相同。有許多它們的比較結果,這樣一個潛在用戶很容易選擇合適的編碼器。需要記住的是高位速編碼表現優秀的編碼器(如LAME這個在高位速廣泛使用的編碼器)未必在低位速的表現也同樣好。

MP3音頻解碼
另一方面,解碼在標准中進行了細致的定義。

多數解碼器是bitstream compliant,也就是說MP3文件解碼出來的非壓縮輸出信號將與標准文檔中數學定義的輸出信號一模一樣(在規定的近似誤差范圍內)。

MP3文件有一個標準的格式,這個格式就是包括384、576、或者1152個采樣點(隨MPEG的版本和層不同而不同)的幀,並且所有的幀都有關聯的頭信息(32位)和輔助信息(9、17或者32位元組,隨著MPEG版本和立體聲或者單通道的不同而不同)。頭和輔助信息能夠幫助解碼器正確地解碼相關的霍夫曼編碼數據。

所以,大多數的解碼器比較幾乎都是完全基於它們的計算效率(例如,它們在解碼過程中所需要的內存或者CPU時間)。

ID3和其它標簽

Main articles: ID3 and APEv2 tag

「標簽」是MP3(或其它格式)中保存的包含如標題、藝術家、唱片、音軌號或者其它關於MP3文件信息等添加到文件的數據。最為流行的標准標簽格式目前是ID3 ID3v1和ID3v2標簽,最近的是APEv2標簽。

APEv2最初是為MPC 文件格式開發的(參見 APEv2規范)。APEv2可以與ID3標簽在同一個文件中共存,但是它也可以單獨使用。

音量歸一化(normalization)

由於CD和其它各種各樣的音源都是在不同的音量下錄制的,在標簽中保存文件的音量信息將是有用的,這樣的話回放時音量能夠進行動態調節。

人們已經提出了一些對MP3文件增益進行編碼的標准。它們的設計思想是對音頻文件的音量(不是「峰值」音量)進行歸一化,這樣以保證在不同的連續音軌切換時音量不會有變化。

最流行最常用的保存回放增益的解決方法是被簡單地稱作「Replay Gain」的方法。音軌的音量平均值和修剪信息都存在元數據標簽中。

可選技術

有許多其它的有損音頻編解碼存在,其中包括:

* MPEG-1/2 Audio Layer 2 (MP2),MP3的前輩;
* MPEG-4 AAC, MP3的繼承者,Apple的iTunes Music Store和iPod使用;
* Xiph.org Foundation的Ogg Vorbis,自由軟體和沒有專利的編解碼器;
* MPC,也稱作Musepack(以前叫MP+),由MP2派生出來;
* Thomson Multimedia的MP3和SBR的組合mp3PRO;
* AC-3,Dolby Digital和DVD中使用;
* ATRAC,Sony的Minidisc使用;
* Windows Media Audio(WMA)來自於微軟公司;
* QDesign, 用於低速QuickTime;
* AMR-WB+ 針對蜂窩電話和其它有限帶寬使用進行了優化的增強自適應多速寬頻編解碼器(Enhanced Adaptive Multi Rate WideBand codec);
* RealNetworks的RealAudio,經常用於網站的流媒體;
* Speex,基於CELP的專門為語音和VoIP設計的自由軟體和無專利編解碼器。

mp3PRO、MP3、AAC、和MP2都是同一個技術家族中的成員,並且都是基於大致類似的心裡聲學模型。Fraunhofer Gesellschaft擁有許多涵蓋這些編解碼器所用技術的基本專利,Dolby Labs、索尼公司、Thomson Consumer Electronics和AT&T擁有其它一些關鍵專利。

在網際網路上有一些其它無損音頻壓縮方法。盡管它們與MP3不同,它們是其它壓縮機制的優秀範例,它們包括:

* FLAC 表示'自由無損音頻編解碼(Free Lossless Audio Codec)'
* Monkey's Audio
* SHN,也稱為Shorten
* TTA
* Wavpack
* Apple Lossless

聽覺測試試圖找出特定位速下的最好質量的有損音頻編解碼。在128kbit/s下,Ogg Vorbis、AAC、MPC和WMA Pro性能持平處於領先位置,LAME MP3稍微落後。在64kbit/s下,AAC-HE和mp3pro少許領先於其它編解碼器。在超過128kbit/s下,多數聽眾聽不出它們之間有明顯差別。什麼是「CD音質」也是很主觀的:對於一些人來說128kbit/s的MP3就足夠了,而對於另外一些人來說必須是200kbit/s以上的位速。

盡管如WMA和RealAudio這些新的編解碼器的支持者宣稱它們各自的演算法能夠在64kbit/s達到CD音質,聽覺測試卻顯示了不同的結果;然而,這些編解碼器在64kbit/s的音質明顯超過同樣位速下MP3的音質。無專利的Ogg Vorbis編解碼器的開發者宣稱它們的演算法超過了MP3、RealAudio和WMA的音質,上面提到的聽覺測試證實了這種說法。Thomson宣稱它的mp3PRO 在64kbit/s達到了CD音質,但是測試者報告說64kbit/s的mp3Pro文件與112kbit/s的MP3文件音質類似,但是直到 80kbit/s時它才能接近CD音質。

專門為MPEG-1/2視頻設計的、優化的MP3總體上在低於48kbit/s的單聲道數據和低於80kbit/s的立體聲上表現不佳。

授權和專利問題

Thomson Consumer Electronics在認可軟體專利的國家控制著MPEG-1/2 Layer 3 專利的授權,這些國家包括美國和日本,歐盟國家不包括在內。Thomson積極地加強這些專利的保護。Thomson已經在歐盟國家被歐洲專利局(:en:European Patent Office授予軟體專利,但是還不清楚它們是否會被那裡的司法所加強。參見歐洲專利協定中的軟體專利(:en:Software patents under the European Patent Convention)。

關於Thomson專利文件、授權協議和費用的最新信息請參考它們的網站mp3licensing.com。

在1998年9月,Fraunhofer Institute向幾個MP3軟體開發者發去了一封信聲明「發布或者銷售編碼器或者解碼器」需要授權。這封信宣稱非經授權的產品「觸犯了 Fraunhofer和THOMSON的專利權。製造、銷售或者發布使用[MPEG Layer-3]標准或者我們專利的產品,你們需要從我們這里獲得這些專利的授權協議。」

這些專利問題極大地減慢了未經授權的MP3軟體開發並且導致人們的注意力轉向開發和歡迎其它如WMA和Ogg Vorbis這樣的替代品。Windows開發系統的製造商微軟公司從MP3專向它們自有的Windows Media格式以避免與專利相關的授權問題。直到那些關鍵的專利過期之前,未經授權的編碼器和播放器在認可軟體專利的國家看起來都是非法的。

盡管有這些專利限制,永恆的MP3格式繼續向前發展;這種現象的原因看起來是由如下因素帶來的網路效應:

* 熟悉這種格式,不知道有其它可選格式存在,
* 這些可選格式沒有普遍地明顯超過MP3的優勢這樣一個現實,
* 大量的MP3格式音樂,
* 大量的使用這種格式的不同軟體和硬體,
* 沒有DRM保護技術,這使得MP3文件可以很容易地修改、復制和通過網路重新發布,
* 大多數家庭用戶不知道或者不關心軟體專利爭端,通常這些爭端與他們個人用途而選用MP3格式無關。

另外,專利持有人不願對於開源解碼器加強授權費用的徵收,這也帶來了許多免費MP3解碼器的發展。另外,盡管他們試圖阻止發布編碼器的二進制代碼, Thomson已經宣布使用免費MP3編碼器的個人用戶將不需要支付費用。這樣,盡管專利費是許多公司打算使用MP3格式時需要考慮的問題,對於用戶來說並沒有什麼影響,這就帶來了這種格式的廣受歡迎。

Sisvel S.p.A. [1]和它的美國子公司Audio MPEG, Inc. [2]以前曾經以侵犯MP3技術專利為由起訴Thomson[3],但是那些爭端在2005年11月最終以Sisvel給Thomson MP3授權而結束。Motorola最近也與Audio MPEG簽署了MP3的授權協議。由於Thomson和Sisvel都擁有他們聲稱編解碼器必需的單獨的專利,MP3專利的法律狀態還不清晰。

Fraunhofer的專利將在2010年4月到期,到了那時MP3演算法將不再受專利保護。 ]
說到mp3,首先要提一下MPEG是動態圖象專家組的應為縮寫。這個專家組始建於1988年,專門負責為cd建立視頻和音頻壓縮標准。MPEG音頻文件指的是MPEG標准中的聲音部分,即MPEG音頻層。MPEG文件根據壓縮質量和編碼復雜程度的不同可分為三層(MPEG AUDIO LAYER 1/2/3分別於mp1、mp2、mp3這三種聲音文件相對應。 MPEG音頻編碼具有很高的壓縮率,mp1和mp2的壓縮率分別為4:1和6:1-8:1,而mp3的壓縮率則高達10:1-12:1,也就是說一分鍾cd音質的音樂未經壓縮需要10MB存儲空間,而經過mp3壓縮編碼後只有1MB左右,同時其音質基本保持不失真。 因此,目前互聯網上的音樂格式一mp3最為常見,mp3位降低聲音失真採取了名為「感官編碼技術」的編碼演算法:編碼時先對音頻文件進行頻譜分析,然後用過濾器濾掉噪音電平,接著通過量化的方式將剩下的每一位打散排列,最後形成具有較高壓縮比的mp3文件,並使壓縮後的文件在回放時能夠達到較接近原音源的聲音效果。雖然他是一種有損壓縮,但是它的最大優勢是一極小的聲音失真換來較高的壓縮比。 MP3是MPEG-1 Audio Layer 3的簡稱,通過特殊的數據壓縮演算法對原先的音頻信號進行處理,可使數碼音頻文件的大小僅為原來的十幾分之一。作為手機鈴聲,MP3的最大優勢在於能將語音文件壓縮到原來的十分之一甚至十二分之一。 支持機型:摩托羅拉E398、C650、V303、索尼愛立信K700C、K500C等

MP3英文:
英文簡稱:Music Player III
英文全稱:Moving Picture Experts Group Audio Layer III

⑺ mp3的音頻編碼

MP3音頻編碼
MPEG-1標准中沒有MP3編碼器的一個精確規范,然而與此相反,解碼演算法和文件格式卻進行了細致的定義。人們設想編碼的實現是設計自己的適合去除原始音頻中部分信息的演算法(或者是它在頻域中的修正離散餘弦(MDCT)表示)。在編碼過程中,576個時域樣本被轉換成576個頻域樣本,如果是瞬變信號就使用192而不是576個采樣點,這是限制量化雜訊隨著隨瞬變信號短暫擴散。
這是聽覺心理學的研究領域:人類主觀聲音感知。
這樣帶來的結果就是出現了許多不同的MP3編碼器,每種生成的聲音質量都不相同。有許多它們的比較結果,這樣一個潛在用戶很容易選擇合適的編碼器。需要記住的是高位速編碼表現優秀的編碼器(如LAME這個在高位速廣泛使用的編碼器)未必在低位速的表現也同樣好。

⑻ mp3和mp4中的mp,3,4都是什麼意思啊

mp3主要是以播放音頻為主,一般位速不可以超過320kbps
采樣不可以超過48khz
mp4主要是以播放視頻為主,支持的視頻格式多,屏幕大,解析度大,內存一般用小硬碟
現在的mp3很多都支持視頻,不過這些mp3機的視頻一般都很差勁,屏幕小,解析度也小,支持的格式也單一,很少使用到小硬碟,而且音質和畫質都不理想

⑼ Mp3音樂所採用的聲音數據壓縮編碼的標準是什麼

聲音數據壓縮編碼的標準是MPEG Audio Layer 3。

相關介紹:

MP3是一種音頻壓縮技術,利用MPEG Audio Layer 3的技術,將音樂以1:10 甚至 1:12 的壓縮率,壓縮成容量較小的文件。它是在1991年由位於德國埃爾朗根的研究組織Fraunhofer-Gesellschaft的一組工程師發明和標准化的。

(9)mp3編碼演算法擴展閱讀

1991年,MP3標準的制定由Leon van de Kerkhof(Layer I)和Gerhard Stoll(Layer II)完成。所有這些演算法最終都在1992年成為了MPEG的第一個標准組MPEG-1的一部分,並且生成了1993年公布的國際標准ISO/IEC 11172-3。

MPEG音頻上的更進一步的工作最終成為了1994年制定的第二個MPEG標准組MPEG-2標準的一部分,這個標准正式的稱呼是1995年首次公布的ISO/IEC 13818-3。

⑽ 什麼是視頻編碼的演算法 它有哪幾種典型的演算法 試比較各種典型的視頻編碼演算法。 謝謝了!

1、無聲時代的FLC
FLC、FLI是Autodesk開發的一種視頻格式,僅僅支持256色,但支持色彩抖動技術,因此在很多情況下很真彩視頻區別不是很大,不支持音頻信號,現在看來這種格式已經毫無用處,但在沒有真彩顯卡沒有音效卡的DOS時代確實是最好的也是唯一的選擇。最重要的是,Autodesk的全系列的動畫製作軟體都提供了對這種格式的支持,包括著名的3D Studio X,因此這種格式代表了一個時代的視頻編碼水平。直到今日,仍舊有不少視頻編輯軟體可以讀取和生成這種格式。但畢竟廉頗老矣,這種格式已經被無情的淘汰。

2、載歌載舞的AVI
AVI——Audio Video Interleave,即音頻視頻交叉存取格式。1992年初Microsoft公司推出了AVI技術及其應用軟體VFW(Video for Windows)。在AVI文件中,運動圖像和伴音數據是以交織的方式存儲,並獨立於硬體設備。這種按交替方式組織音頻和視像數據的方式可使得讀取視頻數據流時能更有效地從存儲媒介得到連續的信息。構成一個AVI文件的主要參數包括視像參數、伴音參數和壓縮參數等。AVI文件用的是AVI RIFF形式,AVI RIFF形式由字串「AVI」標識。所有的AVI文件都包括兩個必須的LIST塊。這些塊定義了流和數據流的格式。AVI文件可能還包括一個索引塊。
只要遵循這個標准,任何視頻編碼方案都可以使用在AVI文件中。這意味著AVI有著非常好的擴充性。這個規范由於是由微軟制定,因此微軟全系列的軟體包括編程工具VB、VC都提供了最直接的支持,因此更加奠定了AVI在PC上的視頻霸主地位。由於AVI本身的開放性,獲得了眾多編碼技術研發商的支持,不同的編碼使得AVI不斷被完善,現在幾乎所有運行在PC上的通用視頻編輯系統,都是以支持AVI為主的。AVI的出現宣告了PC上啞片時代的結束,不斷完善的AVI格式代表了多媒體在PC上的興起。
說到AVI就不能不提起英特爾公司的Indeo video系列編碼,Indeo編碼技術是一款用於PC視頻的高性能的、純軟體的視頻壓縮/解壓解決方案。Indeo音頻軟體能提供高質量的壓縮音頻,可用於互聯網、企業內部網和多媒體應用方案等。它既能進行音樂壓縮也能進行聲音壓縮,壓縮比可達8:1而沒有明顯的質量損失。Indeo技術能幫助您構建內容更豐富的多媒體網站。目前被廣泛用於動態效果演示、游戲過場動畫、非線性素材保存等用途,是目前使用最廣泛的一種AVI編碼技術。現在Indeo編碼技術及其相關軟體產品已經被Ligos Technology 公司收購。隨著MPEG的崛起,Indeo面臨著極大的挑戰。

3、容量與質量兼顧的MPEG系列編碼
和AVI相反,MPEG不是簡單的一種文件格式,而是編碼方案。
MPEG-1(標准代號ISO/IEC11172)制定於1991年底,處理的是標准圖像交換格式(standard interchange format,SIF)或者稱為源輸入格式(Source Input Format,SIF)的多媒體流。是針對1.5Mbps以下數據傳輸率的數字存儲媒質運動圖像及其伴音編碼(MPEG-1 Audio,標准代號ISO/IEC 11172-3)的國際標准,伴音標准後來衍生為今天的MP3編碼方案。MPEG-1規范了PAL制(352*288,25幀/S)和NTSC制(為352*240,30幀/S)模式下的流量標准, 提供了相當於家用錄象系統(VHS)的影音質量,此時視頻數據傳輸率被壓縮至1.15Mbps,其視頻壓縮率為26∶1。使用MPEG-1的壓縮演算法,可以把一部120分鍾長的多媒體流壓縮到1.2GB左右大小。常見的VCD就是MPEG-1編碼創造的傑作。MPEG-1編碼也不一定要按PAL/NTSC規范的標准運行,你可以自由設定影像尺寸和音視頻流量。隨著光頭拾取精度的提高,有人把光碟的信息密度加大,並適度降低音頻流流量,於是出現了只要一張光碟就存放一部電影的DVCD。DVCD碟其實是一種沒有行業標准,沒有國家標准,更談不上是國際標準的音像產品。
當VCD開始向市場普及時,電腦正好進入了486時代,當年不少朋友都夢想擁有一塊硬解壓卡,來實現在PC上看VCD的夙願,今天回過頭來看看,覺得真有點不可思議,但當時的現狀就是486的系統不藉助硬解壓是無法流暢播放VCD的,上萬元的486系統都無法流暢播放的MPEG-1被打上了貴族的標志。隨著奔騰的發布,PC開始奔騰起來,直到後來Windows Media Player也直接提供了MPEG-1的支持,至此MPEG-1使用在PC上已經完全無障礙了。
MPEG-2(標准代號IOS/IEC13818)於1994年發布國際標准草案(DIS),在視頻編碼演算法上基本和MPEG-1相同,只是有了一些小小的改良,例如增加隔行掃描電視的編碼。它追求的是大流量下的更高質量的運動圖象及其伴音效果。MPEG-2的視頻質量看齊PAL或NTSC的廣播級質量,事實上MPEG-1也可以做到相似效果,MPEG-2更多的改進來自音頻部分的編碼。目前最常見的MPEG-2相關產品就是DVD了,SVCD也是採用的MPEG-2的編碼。MPEG-2還有一個更重要的用處,就是讓傳統的電視機和電視廣播系統往數碼的方向發展。
MPEG-3最初為HDTV制定,由於MPEG-2的快速發展,MPEG-3還未徹底完成便宣告淘汰。
MPEG-4於1998年公布,和MPEG-2所針對的不同,MPEG-4追求的不是高品質而是高壓縮率以及適用於網路的交互能力。MPEG-4提供了非常驚人的壓縮率,如果以VCD畫質為標准,MPEG-4可以把120分鍾的多媒體流壓縮至300M。MPEG-4標准主要應用於視像電話(Video Phone),視像電子郵件(Video Email)和電子新聞(Electronic News)等,其傳輸速率要求較低,在4800-64000bits/sec之間,解析度為176X144。MPEG-4利用很窄的帶寬,通過幀重建技術,壓縮和傳輸數據,以求以最少的數據獲得最佳的圖象質量。
MJPEG,這並不是專門為PC准備的,而是為專業級甚至廣播級的視頻採集與在設備端回放的准備的,所以MJPEG包含了為傳統模擬電視優化的隔行掃描電視的演算法,如果在PC上播放MJPEG編碼的文件,效果會很難看(如果你的顯卡不支持MJPEG的動態補償),但一旦輸出到電視機端,你立刻會發現這種演算法的好處。

4、屬於網路的流媒體
RealNetworks RealVideo,採用的是 RealNetworks 公司自己開發的 Real G2 Codec,它具有很多先進的設計,例如,SVT (Scalable Video Technology);雙向編碼(Two—Encoding,類似於VBR)。RealMedia 音頻部分採用的是 RealAudio ,可以接納很多音頻編碼方案,可實現聲音在單聲道、立體聲音樂不同速率下的壓縮。最新的RealAudio竟然採用ATRAC3編碼方案,以挑戰日益成熟的MP3。
Windows Media,視頻編碼採用的是非常先進的 MPEG-4 視頻壓縮技術,被稱作 Microsoft MPEG-4 Video Codec,音頻編碼採用的是微軟自行開發的一種編碼方案,目前沒有公布技術資料,在低流量下提供了令人滿意的音質和畫質。最新的Windows Media Encoding Utility V8.0將流技術推向到一個新的高度,我們常見的ASF、WMV、WMA就是微軟的流媒體文件。
事實上我們常見的MPG文件,也具有流媒體的最大特徵——邊讀邊放。

二、常見的編碼與常見的文件格式的對應關系及其常用用途

1、Audodesk FLC
這是一種古老的編碼方案,常見的文件後綴為FLC和FLI。由於FLC僅僅支持256色的調色板,因此它會在編碼過程中盡量使用抖動演算法(也可以設置不抖動),以模擬真彩的效果。這種演算法在色彩值差距不是很大的情況下幾乎可以達到亂真的地步,例如紅色A(R:255,G:0,B:0)到紅色B(R:255,G:128,B:0)之間的抖動。這種格式現在已經很少被採用了,但當年很多這種格式被保留下來,這種格式在保存標准256色調色板或者自定義256色調色板是是無損的,這種格式可以清晰到像素,非常適合保存線框動畫,例如CAD模型演示。現在這種格式很少見了。

2、Microsoft RLE
這是微軟開發為AVI格式開發的一種編碼,文件擴展名為AVI,使用了RLE壓縮演算法,這是一種無損的壓縮演算法,我們常見的tga格式的圖像文件就使用了RLE演算法。
什麼是RLE演算法呢?這是一種很簡單的演算法,舉一個很簡單的例子:
假設一個圖像的像素色彩值是這樣排列的:紅紅紅紅紅紅紅紅紅紅紅紅藍藍藍藍藍藍綠綠綠綠,經過RLE壓縮後就成為了:紅12藍6綠4。這樣既保證了壓縮的可行性,而且不會有損失。而且可以看到,但顏色數越少時,壓縮效率會更高。由於Microsoft RLE僅僅支持256色,而且沒有抖動演算法,在色彩處理方面,FLC明顯的比Microsoft RLE要好很多。當然這也不表示Microsoft RLE一無是處,和FLC一樣,Microsoft RLE在處理相鄰像素時也沒有色染,可以清晰的表現網格。因此同樣可以優秀的表現單色字體和線條。只要色彩不是很復雜,FLC能做的,Microsoft RLE也可以做到。由於AVI可以擁有一個音頻流,而且Windows系統給與了直接的支持,Microsoft RLE最常用的用途是,在256色顯示模式下,通過配合抓屏生成AVI的工具製作一個軟體的操作演示過程,以達到圖文並茂,形聲兼備的效果。

3、Microsoft Video1
這也是由微軟提供的一個AVI編碼,任何Windows系統都自帶了了它的Codec,這個編碼支持真彩,畫面質量很不錯,Microsoft Video1的壓縮效率非常低下,編碼後的文件龐大得讓人受不了。這個Microsoft Video1究竟有什麼用呢?一般被用在保存一些沒有漸變的小型視頻素材方面。

4、Indeo video R3.2
這個編碼由intel架構實驗室開發,對應的文件格式是AVI,相對之前的流行的編碼,Indeo video R3.2最大的特點就是高壓縮比(當然,比起現在的壓縮方案,實在是不值得一提),intel聲稱壓縮比可達8:1而沒有明顯的質量損失,解碼速度也非常快,對系統要求不高,由於Windows9X中自帶Indeo video R3.2的Codec,所以Indeo video R3.2一度成為了最流行的AVI編碼方案。有不少游戲的過場動畫和啟動動畫都是Indeo video R3.2編碼的。Indeo video R3.2同樣不適合高要求的環境,在要表現細線條或大色彩值變化的漸變時,Indeo video R3.2會表現得非常糟糕。如果畫面的色彩值差異不是很大,也沒有明顯的色彩區域界限,Indeo video R3.2還是合適的,例如海天一色的場景。Indeo video R3.2已經基本被淘汰,如果不是為了播放以前遺留的一些Indeo video R3.2編碼視頻,恐怕Windows ME/2000都不會有Indeo video R3.2的Codec了。

5、Indeo video 5.10
這個編碼方案同樣也是intel架構實驗室開發的,它繼承了Indeo video R3.2的優點,對應的文件格式仍然是AVI,解碼速度同樣非常快。Windows ME/2000自帶了Indeo video 5.1的Codec,很多游戲也適用Indeo video 5.10來編碼自己的演示動畫。在沒有DivX普及前,這幾乎是最流行的AVI編碼了,由於微軟和intel的同時支持,這種編碼方案被廣泛採用。

6、None
顧名思義,這是一個沒有損失的視頻編碼方案,對應的文件擴展名為AVI。這種編碼幾乎是不壓縮的,文件大得驚人!那麼這種編碼有什麼用途呢?用途就是保存視頻素材,因為是無損的,保存素材非常合適,代價就是大量的存儲空間。

7、MPEG1
我們熟知的VCD就是MPEG1編碼的,對應的文件擴展名為MPG、MPEG或者DAT。事實上MPEG1可以工作於非PAL制和非NTSC制標准下。它可以自由設置數據流量和畫面尺寸,只是這樣非標準的文件無法直接刻錄成VCD。

8、MPEG2
DVD的視頻部分就是採用的MPEG2,SVCD同樣也採用了MPEG2編碼。對應的文件擴展名一般為VOB、MPG。MPEG2的設計目標就是提供接近廣播級的高品質輸出。

9、DivX
DivX是近2年開始被大家認識的,DivX 視頻編碼技術可以說是一種對 DVD 造成威脅的新生視頻壓縮格式(有人說它是 DVD 殺手)對應的文件擴展名為AVI或者DivX,它由 Microsoft mpeg-4v3 修改而來,使用 MPEG-4 壓縮演算法。據說是美國禁止出口的編碼技術。DivX最大的特點就是高壓縮比和不錯的畫質,更可貴的是,DivX的對系統要求也不高,只要主頻300的CPU就基本可以很流暢的播放了,因此從DivX誕生起,立刻吸引了大家的注意力。DivX擁有比Indeo video 5.10高太多的壓縮效率,編碼質量也遠遠比Indeo video 5.10好,我實在想不出Indeo video 5.10還會有什麼前途。

10、PICVideo MJPEG
MJPEG是很多視頻卡支持的一種視頻編碼,隨卡提供了Codec,安裝完成後可以象使用其它編碼一樣生成AVI文件。MJPEG編碼常用於非線性系統,批上了一層很專業的外衣。MJPEG的編碼質量是相當高的,是一種以質量為最高要求的編碼,這種編碼的設置比較復雜,可以得到很高的壓縮比,但犧牲了解碼速度,如果要保證解碼速度,編碼後的壓縮比確不是很理想,如果您希望從專業的非線性系統上捕捉視頻,然後自行進行處理,這種格式是很有必要去了解一些的。

11、RealNetworks RealVideo
REAL VIDEO(RA、RAM)格式由Real Networks公司開發的,一開始就定位在視頻流應用方面的,也可以說是視頻流技術的始創者。它可以在用 56K MODEM 撥號上網的條件實現不間斷的視頻播放。從RealVideo的定位來看,就是犧牲畫面質量來換取可連續觀看性。其實RealVideo也可以實現不錯的畫面質量,由於RealVideo可以擁有非常高的壓縮效率,很多人把VCD編碼成RealVideo格式的,這樣一來,一張光碟上可以存放好幾部電影。REAL VIDEO存在顏色還原不準確的問題,RealVideo就不太適合專業的場合,但RealVideo出色的壓縮效率和支持流式播放的特徵,使得RealVideo在網路和娛樂場合佔有不錯的市場份額。

12、Windows Media video
Windows Media video就是微軟為了和現在的Real Networks的RealVideo競爭而發展出來的一種可以直接在網上觀看視頻節目的文件壓縮格式!由於它使用了MPEG4的壓縮演算法,所以壓縮率和圖像的質量都很不錯。我們經常看到的ASF和WMV就是Windows Media video。Windows Media video的編碼質量明顯好於RealVideo,因為Windows Media video是微軟的傑作,所以Windows系統給Windows Media video給與了很好的支持,Windows Media Player可以直接播放這些文件。

各種主流音頻編碼(或格式)的介紹

1、PCM編碼
PCM 脈沖編碼調制是Pulse Code Molation的縮寫。前面的文字我們提到了PCM大致的工作流程,我們不需要關心PCM最終編碼採用的是什麼計算方式,我們只需要知道PCM編碼的音頻流的優點和缺點就可以了。PCM編碼的最大的優點就是音質好,最大的缺點就是體積大。我們常見的Audio CD就採用了PCM編碼,一張光碟的容量只能容納72分鍾的音樂信息。

2、WAVE
這是一種古老的音頻文件格式,由微軟開發。WAV是一種文件格式,符合 PIFF Resource Interchange File Format規范。所有的WAV都有一個文件頭,這個文件頭音頻流的編碼參數。WAV對音頻流的編碼沒有硬性規定,除了PCM之外,還有幾乎所有支持ACM規范的編碼都可以為WAV的音頻流進行編碼。很多朋友沒有這個概念,我們拿AVI做個示範,因為AVI和WAV在文件結構上是非常相似的,不過AVI多了一個視頻流而已。我們接觸到的AVI有很多種,因此我們經常需要安裝一些Decode才能觀看一些AVI,我們接觸到比較多的DivX就是一種視頻編碼,AVI可以採用DivX編碼來壓縮視頻流,當然也可以使用其他的編碼壓縮。同樣,WAV也可以使用多種音頻編碼來壓縮其音頻流,不過我們常見的都是音頻流被PCM編碼處理的WAV,但這不表示WAV只能使用PCM編碼,MP3編碼同樣也可以運用在WAV中,和AVI一樣,只要安裝好了相應的Decode,就可以欣賞這些WAV了。
在Windows平台下,基於PCM編碼的WAV是被支持得最好的音頻格式,所有音頻軟體都能完美支持,由於本身可以達到較高的音質的要求,因此,WAV也是音樂編輯創作的首選格式,適合保存音樂素材。因此,基於PCM編碼的WAV被作為了一種中介的格式,常常使用在其他編碼的相互轉換之中,例如MP3轉換成WMA。

3、 MP3編碼
請參閱 MP3全攻略 一文

4、OGG編碼
網路上出現了一種叫Ogg Vorbis的音頻編碼,號稱MP3殺手!Ogg Vorbis究竟什麼來頭呢?OGG是一個龐大的多媒體開發計劃的項目名稱,將涉及視頻音頻等方面的編碼開發。整個OGG項目計劃的目的就是向任何人提供完全免費多媒體編碼方案!OGG的信念就是:OPEN!FREE!Vorbis這個詞彙是特里·普拉特柴特的幻想小說《Small Gods》中的一個"花花公子"人物名。這個詞彙成為了OGG項目中音頻編碼的正式命名。目前Vorbis已經開發成功,並且開發出了編碼器。
Ogg Vorbis是高質量的音頻編碼方案,官方數據顯示:Ogg Vorbis可以在相對較低的數據速率下實現比MP3更好的音質!Ogg Vorbis這種編碼也遠比90年代開發成功的MP3先進,她可以支持多聲道,這意味著什麼?這意味著Ogg Vorbis在SACD、DTSCD、DVD AUDIO抓軌軟體(目前這種軟體還沒有)的支持下,可以對所有的聲道進行編碼,而不是MP3隻能編碼2個聲道。多聲道音樂的興起,給音樂欣賞帶來了革命性的變化,尤其在欣賞交響時,會帶來更多臨場感。這場革命性的變化是MP3無法適應的。
和MP3一樣,Ogg Vorbis是一種靈活開放的音頻編碼,能夠在編碼方案已經固定下來後還能對音質進行明顯的調節和新演算法的改良。因此,它的聲音質量將會越來越好,和MP3相似,Ogg Vorbis更像一個音頻編碼框架,可以不斷導入新技術逐步完善。和MP3一樣,OGG也支持VBR。

5、MPC 編碼
MPC是又是另外一個令人刮目相看的實力派選手,它的普及過程非常低調,也沒有什麼復雜的背景故事,她的出現目的就只有一個,更小的體積更好的音質!MPC以前被稱作MP+,很顯然,可以看出她針對的競爭對手是誰。但是,只要用過這種編碼的人都會有個深刻的印象,就是她出眾的音質。

6、mp3PRO 編碼
2001年6月14日,美國湯姆森多媒體公司(Thomson Multimedia SA)與佛朗赫弗協會(Fraunhofer Institute)於6月14日發布了一種新的音樂格式版本,名稱為mp3PRO,這是一種基於mp3編碼技術的改良方案,從官方公布的特徵看來確實相當吸引人。從各方面的資料顯示,mp3PRO並不是一種全新的格式,完全是基於傳統mp3編碼技術的一種改良,本身最大的技術亮點就在於SBR(Spectral Band Replication 頻段復制),這是一種新的音頻編碼增強演算法。它提供了改善低位率情況下音頻和語音編碼的性能的可能。這種方法可在指定的位率下增加音頻的帶寬或改善編碼效率。SBR最大的優勢就是在低數據速率下實現非常高效的編碼,與傳統的編碼技術不同的是,SBR更像是一種後處理技術,因此解碼器的演算法的優劣直接影響到音質的好壞。高頻實際上是由解碼器(播放器)產生的,SBR編碼的數據更像是一種產生高頻的命令集,或者稱為指導性的信號源,這有點駇idi的工作方式。我們可以看到,mp3PRO其實是一種mp3信號流和SBR信號流的混合數據流編碼。有關資料顯示,SBR技術可以改善低數據流量下的高頻音質,改善程度約為30%,我們不管這個30%是如何得來的,但可以事先預知這種改善可以讓64kbps的mp3達到128kbps的mp3的音質水平(註:在相同的編碼條件下,數據速率的提升和音質的提升不是成正比的,至少人耳聽覺上是這樣的),這和官方聲稱的64kbps的mp3PRO可以媲美128kbps的mp3的宣傳基本是吻合的。

7、WMA
WMA就是Windows Media Audio編碼後的文件格式,由微軟開發,WMA針對的不是單機市場,是網路!競爭對手就是網路媒體市場中著名的Real Networks。微軟聲稱,在只有64kbps的碼率情況下,WMA可以達到接近CD的音質。和以往的編碼不同,WMA支持防復制功能,她支持通過Windows Media Rights Manager 加入保護,可以限制播放時間和播放次數甚至於播放的機器等等。WMA支持流技術,即一邊讀一邊播放,因此WMA可以很輕松的實現在線廣播,由於是微軟的傑作,因此,微軟在Windows中加入了對WMA的支持,WMA有著優秀的技術特徵,在微軟的大力推廣下,這種格式被越來越多的人所接受。

8、RA
RA就是RealAudio格式,這是各位網蟲接觸得非常多的一種格式,大部分音樂網站的在線試聽都是採用了RealAudio,這種格式完全針對的就是網路上的媒體市場,支持非常豐富的功能。最大的閃爍點就是這種格式可以根據聽眾的帶寬來控制自己的碼率,在保證流暢的前提下盡可能提高音質。RA可以支持多種音頻編碼,包括ATRAC3。和WMA一樣,RA不但都支持邊讀邊放,也同樣支持使用特殊協議來隱匿文件的真實網路地址,從而實現只在線播放而不提供下載的欣賞方式。這對唱片公司和唱片銷售公司很重要,在各方的大力推廣下,RA和WMA是目前互聯網上,用於在線試聽最多的音頻媒體格.

熱點內容
創建郵箱地址伺服器連接錯誤 發布:2025-01-13 09:49:24 瀏覽:723
linux編輯文檔 發布:2025-01-13 09:47:51 瀏覽:435
二手製冷壓縮機 發布:2025-01-13 09:43:59 瀏覽:585
網魚電腦密碼多少 發布:2025-01-13 09:33:46 瀏覽:464
如何取消子賬號密碼 發布:2025-01-13 09:22:41 瀏覽:347
抖音搜索有緩存 發布:2025-01-13 09:17:28 瀏覽:590
c語言字元數組連接 發布:2025-01-13 08:55:11 瀏覽:901
國二c語言編程題目 發布:2025-01-13 08:45:41 瀏覽:285
ipad軟體如何加密 發布:2025-01-13 08:28:59 瀏覽:278
android的文件操作 發布:2025-01-13 08:24:48 瀏覽:173