音頻視頻存儲技術

發布時間: 2022-07-12 02:18:06

① 音視頻設備里的數字音頻技術有什麼特點

數字音頻技術具有以下特點:
(1)數據量大
聲音、圖像以及視頻和動畫的數據量都十分龐大。1min立體聲音采樣頻率為44.1kHz,16位量化精度的數據量大約為10 MB，存儲b一首4min的歌曲約需40M；一副640x480的RGB彩色圖像的存儲量為900kB;1s(25幀/秒)的視頻數據量為22MB,一張650 MB的CD-ROM光碟只能存儲約30 s的視頻。
(2)數據存在大量冗餘
聲音、圖像以及視頻和動畫的大量數據中存在著大量的冗餘。圖像相鄰像素之間、視頻序列前後幀之間具有很大的相關性，人耳與人眼具有掩蔽效應等聽覺和視覺特性，因此，可根據數據的內在聯系將數據中的冗餘信息去除，通過壓縮編碼減少數據量。
(3)數據存儲容量大，傳輸效率較高
數字音視頻數據量大，在存儲與傳輸的過程中必須進行壓縮編碼。音視頻數字信號經過壓縮後,可以在6-8 MHz的傳輸信道傳輸2-4套標准清晰度電視(SDTV)節目或一套高清晰度電視( HDTV)節目，而一張壓縮格式的DVD存儲容量可達7-8CB。
(4)便於進行編輯加工
傳統磁帶重復聽某段音樂或觀看某段畫面時需不停地倒帶、快進,編輯過程也是順序的線性。數字音視頻則不同，它可以瞬時定位，非線性邏輯組織,還可以利用非線性編輯軟體做特效。
(5)信息傳輸存儲的可靠性高
數字信號不會產生雜訊和失真的積累，便於存儲、控制、修改。數字音視頻可以不失真地進行無數次復制，而模擬音視頻信號每轉錄一次，就會有一次誤差積累，產生信號失真。模擬音視頻長時間存放後質量會降低，而數字音視頻可以長時間存放而沒有任何失真。
(6)有效保護信息和進行版權管理
數字音視頻可以方便地與密碼及認證技術相結合，便於實現信息加密/解密以及加擾/解擾,適用於專業應用(軍用、商用、民用)或條件接收、視頻點播、雙向互動傳送等應用。
(7)具有可擴展性，便於與其他數字設備融合
數字音視頻易於與其他系統配合使用，與其他數字設備融合,在各類通信信道和網路上進行傳輸。易於集成化和大規模生產,其性能一致性好，且成本低。xunwei

② 聲音文件的存儲格式及其區別

1. WAV格式，是微軟公司開發的一種聲音文件格式，也叫波形聲音文件，是最早的數字音頻格式，被Windows平台及其應用程序廣泛支持。WAV格式支持許多壓縮演算法，支持多種音頻位數、采樣頻率和聲道，採用44.1kHz的采樣頻率，16位量化位數，跟CD一樣，對存儲空間需求太大不便於交流和傳播。
2. MIDI是Musical Instrument Digital Interface的縮寫，又稱作樂器數字介面，是數字音樂/電子合成樂器的統一國際標准。它定義了計算機音樂程序、數字合成器及其它電子設備交換音樂信號的方式，規定了不同廠家的電子樂器與計算機連接的電纜和硬體及設備間數據傳輸的協議，可以模擬多種樂器的聲音。MIDI文件就是MIDI格式的文件，在MIDI文件中存儲的是一些指令。把這些指令發送給音效卡，由音效卡按照指令將聲音合成出來。
3. 大家都很熟悉CD這種音樂格式了，擴展名CDA，其取樣頻率為44.1kHz，16位量化位數，跟WAV一樣，但CD存儲採用了音軌的形式，又叫「紅皮書」格式，記錄的是波形流，是一種近似無損的格式。
4. MP3全稱是MPEG-1 Audio Layer 3，它在1992年合並至MPEG規范中。MP3能夠以高音質、低采樣率對數字音頻文件進行壓縮。換句話說，音頻文件(主要是大型文件，比如WAV文件）能夠在音質丟失很小的情況下(人耳根本無法察覺這種音質損失)把文件壓縮到更小的程度。
5. MP3Pro是由瑞典Coding科技公司開發的，其中包含了兩大技術：一是來自於Coding科技公司所特有的解碼技術，二是由MP3的專利持有者法國湯姆森多媒體公司和德國Fraunhofer集成電路協會共同研究的一項解碼技術。MP3Pro可以在基本不改變文件大小的情況下改善原先的MP3音樂音質。它能夠在用較低的比特率壓縮音頻文件的情況下，最大程度地保持壓縮前的音質。
6. WMA (Windows Media Audio)是微軟在互聯網音頻、視頻領域的力作。WMA格式是以減少數據流量但保持音質的方法來達到更高的壓縮率目的，其壓縮率一般可以達到1:18。此外，WMA還可以通過DRM（Digital Rights Management）方案加入防止拷貝，或者加入限制播放時間和播放次數，甚至是播放機器的限制，可有力地防止盜版。
7. MP4採用的是美國電話電報公司（AT&T）所研發的以「知覺編碼」為關鍵技術的a2b音樂壓縮技術，由美國網路技術公司(GMO)及RIAA聯合公布的一種新的音樂格式。MP4在文件中採用了保護版權的編碼技術，只有特定的用戶才可以播放，有效地保證了音樂版權的合法性。另外MP4的壓縮比達到了1:15，體積較MP3更小，但音質卻沒有下降。不過因為只有特定的用戶才能播放這種文件，因此其流傳與MP3相比差距甚遠。
8. SACD（SA＝SuperAudio）是由Sony公司正式發布的。它的采樣率為CD格式的64倍，即2.8224MHz。SACD重放頻率帶寬達100kHz，為CD格式的5倍，24位量化位數，遠遠超過CD，聲音的細節表現更為豐富、清晰。
9. QuickTime是蘋果公司於1991年推出的一種數字流媒體，它面向視頻編輯、Web網站創建和媒體技術平台，QuickTime支持幾乎所有主流的個人計算平台，可以通過互聯網提供實時的數字化信息流、工作流與文件回放功能。現有版本為QuickTime 1.0、2.0、3.0、4.0和5.0，在5.0版本中還融合了支持最高A/V播放質量的播放器等多項新技術。
10. VQF格式是由YAMAHA和NTT共同開發的一種音頻壓縮技術，它的壓縮率能夠達到1:18，因此相同情況下壓縮後VQF的文件體積比MP3小30%～50%，更便利於網上傳播，同時音質極佳，接近CD音質(16位44.1kHz立體聲)。但VQF未公開技術標准，至今未能流行開來。
11. DVD Audio 是新一代的數字音頻格式，與DVD Video尺寸以及容量相同，為音樂格式的DVD光碟，取樣頻率為「48kHz/96kHz/192kHz」和「44.1kHz/88.2kHz/176.4kHz」可選擇，量化位數可以為16、20或24比特，它們之間可自由地進行組合。低采樣率的192kHz、176.4kHz雖然是2聲道重播專用，但它最多可收錄到6聲道。而以2聲道192kHz/24b或6聲道96kHz/24b收錄聲音，可容納74分鍾以上的錄音，動態范圍達144dB，整體效果出類拔萃
12. Sony公司的MD（MiniDisc）大家都很熟悉了。MD之所以能在一張小小的盤中存儲60～80分鍾採用44.1khz采樣的立體聲音樂，就是因為使用了ATRAC演算法（自適應聲學轉換編碼）壓縮音源。這是一套基於心理聲學原理的音響解碼系統，它可以把CD唱片的音頻壓縮到原來數據量的大約1/5而聲音質量沒有明顯的損失。ATRAC利用人耳聽覺的心理聲學特性（頻譜掩蔽特性和時間掩蔽特性）以及人耳對信號幅度、頻率、時間的有限分辨能力，編碼時將人耳感覺不到的成分不編碼，不傳送，這樣就可以相應減少某些數據量的存儲，從而既保證音質又達到縮小體積的目的。
13. RealAudio是由Real Networks公司推出的一種文件格式，最大的特點就是可以實時傳輸音頻信息，尤其是在網速較慢的情況下，仍然可以較為流暢地傳送數據，因此RealAudio主要適用於網路上的在線播放。現在的RealAudio文件格式主要有RA(RealAudio)、RM（RealMedia，RealAudio G2）、RMX(RealAudio Secured)等三種，這些文件的共同性在於隨著網路帶寬的不同而改變聲音的質量，在保證大多數人聽到流暢聲音的前提下，令帶寬較寬敞的聽眾獲得較好的音質。
14. Liquid Audio是一家提供付費音樂下載的網站。它通過在音樂中採用自己獨有的音頻編碼格式來提供對音樂的版權保護。Liquid Audio的音頻格式就是所謂的LQT。如果想在PC中播放這種格式的音樂，你就必須使用Liquid Player和Real Jukebox其中的一種播放器。這些文件也不能夠轉換成MP3和WAV格式，因此這使得採用這種格式的音頻文件無法被共享和刻錄到CD中。如果非要把Liquid Audio文件刻錄到CD中的話，就必須使用支持這種格式的刻錄軟體和CD刻錄機。
15. Audible擁有四種不同的格式：Audible1、2、3、4。Audible.com網站主要是在互聯網上販賣有聲書籍，並對它們所銷售商品、文件通過四種Audible.com 專用音頻格式中的一種提供保護。每一種格式主要考慮音頻源以及所使用的收聽的設備。格式1、2和 3採用不同級別的語音壓縮，而格式4採用更低的采樣率和MP3相同的解碼方式，所得到語音吐辭更清楚，而且可以更有效地從網上進行下載。Audible 所採用的是他們自己的桌面播放工具，這就是Audible Manager，使用這種播放器就可以播放存放在PC或者是傳輸到攜帶型播放器上的Audible格式文件。
16．VOC文件，在DOS程序和游戲中常會遇到這種文件，它是隨聲霸卡一起產生的數字聲音文件，與WAV文件的結構相似，可以通過一些工具軟體方便地互相轉換。
17．AU文件，在Internet上的多媒體聲音主要使用該種文件。AU文件是UNIX操作系統下的數字聲音文件，由於早期Internet上的Web伺服器主要是基於UNIX的，所以這種文件成為WWW上唯一使用的標准聲音文件。
18．AIFF(.AIF) 是蘋果公司開發的聲音文件格式，被Macintosh平台和應用程序所支持。
19． Amiga聲音(.SVX)：Commodore所開發的聲音文件格式，被Amiga平台和應用程序所支持，不支持壓縮。
20．MAC聲音(.snd) ：Apple計算機公司所開發的聲音文件格式，被Macintosh平台和多種Macintosh應用程序所支持，支持某些壓縮。
21.S48(stereo、48kHz)採用MPEG-1 layer 1、MPEG-1 layer 2（簡稱Mp1,Mp2）聲音壓縮格式，由於其易於編輯、剪切，所以在廣播電台應用較廣。
22．AAC實際上是高級音頻編碼的縮寫。AAC是由Fraunhofer IIS-A、杜比和AT&T共同開發的一種音頻格式，它是MPEG-2規范的一部分。AAC所採用的運演算法則與MP3的運演算法則有所不同，AAC通過結合其他的功能來提高編碼效率。AAC的音頻演算法在壓縮能力上遠遠超過了以前的一些壓縮演算法（比如MP3等）。它還同時支持多達48個音軌、15個低頻音軌、更多種采樣率和比特率、多種語言的兼容能力、更高的解碼效率。總之，AAC可以在比MP3文件縮小30%的前提下提供更好的音質。
23.數字音頻以音質優秀、傳播無損耗、可進行多種編輯和轉換而成為主流，並且應用於各個方面。

③ 視頻和音頻的數據存儲類型主要有哪些

音頻:MP3、FLAC、APE、OGG、WAV、MPC、AC3 ABS AU CDA DAC M3U MID MIDI MP1 MP2 MP3 MP4 RA RAM VQF WAV
視頻:ASF AVI DAT DIVX M1V M2V MOV MPC MPEG MPG MPV QT RM RMM RT SMT SMIL DVS VOB WMV AU CDA MIDI

④ 計算機是怎樣通過硬體存儲音視頻

硬體存儲設備分很多種。常見的光碟是將數據的高低電平「蝕刻」在光碟上對應的「坑坑窪窪」。刻完的光碟和沒刻的光碟是有明顯區別的，不信可以去看。其他存儲介質同理，都是存儲的數據的高低電平，或者說比特流，0和1。音視頻存儲的時候也都是轉換成數據比特流存儲的。

⑤ 請問視頻，音頻和圖像都是以何種形式儲存到電腦上的啊

在電腦上，所有文件（包括程序、游戲、操作系統、文字檔案、圖片、視頻、聲音文件等）都是以二進制存在電腦上的。作為文件，XP操作系統是這樣做的，在硬碟中放置一個文件目錄表和一個文件分配表（其實不止一個，有備份）裡面存著每個文件的名稱、大小、起始地址等等信息。（像不像派出所的戶口信息？）不管找哪個文件，操作系統都幫你找到。而真正的文件（其實就是一大串01001011這樣的信息）被存在硬碟的某一處。一般操作系統的文件靠前一些。

電腦是以二進制串描述東西的，比如一個32位串可以表示某一種顏色，那這種32位串可以表示多少種顏色啊？（世界上還有它表示不了的顏色嗎？）但硬碟上某一處的0100111具體表示什麼，只有電腦知道。

⑥ 音頻，視頻如何在計算機硬碟中存儲原理是啥

聲音是通過聲音的編碼儲存的。主要介紹波形編碼中的脈沖編碼調制。PCM通過采樣、量化、編碼三個步驟將連續變化的模擬信號轉換為數字編碼。

采樣：一次振動中，必須有2個點的采樣，關於為什麼有2個點采樣，我在視頻課程中已經介紹了，這里不再贅述。人耳能夠感覺到的最高頻率為20kHz，因此要滿足人耳的聽覺要求，則需要至少每秒進行40k次采樣，用40kHz表達，這個40kHz就是采樣率。

量化：每個聲音樣本若用8位存儲，樣本只能存儲0－255個信息，每個聲音樣本若用16位存儲，則可以存儲0－65535個信息，說明量化精度越高，聲音質量越好。

編碼：量化後的抽樣信號十進制數字信號，應將十進制數字代碼變換成二進制編碼。

常用的采樣率：

8kHz為電話采樣。

11.025kHz能達到AM調幅廣播的聲音品質。

22.05kHzFM調頻廣播所用采樣率。

44.1kHz音頻CD，也常用於MPEG－1音頻（VCD，SVCD，MP3）所用采樣率。

48kHzminiDV、數字電視、DVD、DAT、電影和專業音頻所用的數字聲音所用采樣率。

(6)音頻視頻存儲技術擴展閱讀

聲音數字化過程：

比如用麥克風錄下10秒的聲音。聲音的波形，是一條平滑的曲線，而電腦正試圖在電腦上盡可能地模擬這條平滑的曲線。第一步是對曲線進行采樣，假設計算機每秒對曲線進行一次采樣，然後計算機在計算機上模擬10秒的聲音。

但這一次我們發現模擬波形和離開原來的實際波形差異很大，可以提高計算機的采樣頻率，從1每秒每秒采樣2次，采樣頻率越高，計算機模擬曲線更接近於原始聲音，將恢復原來的聲音。

然後第二步是量化模擬聲音，和定量手段如考試成績是51歲，60歲，65年，23歲，95年，78個這樣的點，但在公布成績，學校發現太多，成績發布太麻煩的話，那麼學校的規定，低於60點，作為一個合格的60－70分之間，71－100。

把這些不同的分數分為三個不同的年級，然後當學校公布成績的時候，就會說，我校今年不合格的人數3人，合格的人數100人，優秀的人數500人，這是量化的。

一旦量化完成，最後一步就是編碼。假設量化級別1（如不合格級別）等於0001，級別2（如合格級別）等於0011，以此類推，然後將這些級別記錄為相應的0和1序列。在這里，計算機完成了將聲音數字化的過程。

⑦ 視頻,圖片,音頻這些格式的文件在內存中是以什麼數據結構存儲的呢

有很多的,具體點是:視頻是mv
rm
rvb等等了,圖片是jpg
很多的,音頻是mp3
wmv等等格式了.具體的你得問編這些程序的人了

⑧ 網站上的圖片、音頻、視頻等文件都以何種方式保存

存進電腦里的東西都是以二進制編碼存放的，視頻音頻和圖像都有各自的編碼，以0、1為基礎組成的一系列串。最終就是視頻音頻和圖像了。

1、mp3

MP3一種音頻壓縮技術，其全稱是動態影像專家壓縮標准音頻層面3（Moving Picture Experts Group Audio Layer III），簡稱為MP3。它被設計用來大幅度地降低音頻數據量。利用 MPEG Audio Layer 3 的技術，將音樂以1:10 甚至 1:12 的壓縮率。

2、wma

WMA(Windows Media Audio)，它是微軟公司推出的與MP3格式齊名的一種新的音頻格式。由於WMA在壓縮比和音質方面都超過了MP3，更是遠勝於RA(Real Audio)，即使在較低的采樣頻率下也能產生較好的音質。

3、avi

AVI英文全稱為Audio Video Interleaved，即音頻視頻交錯格式，是微軟公司於1992年11月推出、作為其Windows視頻軟體一部分的一種多媒體容器格式。

4、rm

RM格式是RealNetworks公司開發的一種流媒體視頻文件格式，可以根據網路數據傳輸的不同速率制定不同的壓縮比率，從而實現低速率的Internet上進行視頻文件的實時傳送和播放。

5、rmvb

RealMedia可變比特率（RMVB）是RealNetworks公司開發的RealMedia多媒體數字容器格式的可變比特率（VBR）擴展版本。

⑨ 音頻視頻壓縮技術概述

數字技術的出現與應用為人類帶來了深遠的影響，人們如今已生活在一個幾乎數字化的世界之中，而數字音頻技術則稱得上是應用最為廣泛的數字技術之一，CD、 VCD等早已走進千家萬戶，數字化廣播正在全球范圍內逐步得到開展，正是這些與廣大消費者密切相關的產品及應用成為了本文將要介紹的主題：數字音頻壓縮技術得以產生和發展的動力。

1、音頻壓縮技術的出現及早期應用

音頻壓縮技術指的是對原始數字音頻信號流（PCM編碼）運用適當的數字信號處理技術，在不損失有用信息量，或所引入損失可忽略的條件下，降低（壓縮）其碼率，也稱為壓縮編碼。它必須具有相應的逆變換，稱為解壓縮或解碼。音頻信號在通過一個編解碼系統後可能引入大量的雜訊和一定的失真。

數字信號的優勢是顯而易見的，而它也有自身相應的缺點，即存儲容量需求的增加及傳輸時信道容量要求的增加。以CD為例，其采樣率為44.1KHz，量化精度為16比特，則1分鍾的立體聲音頻信號需占約10M位元組的存儲容量，也就是說，一張CD唱盤的容量只有1小時左右。當然，在帶寬高得多的數字視頻領域這一問題就顯得更加突出。是不是所有這些比特都是必需的呢？研究發現，直接採用PCM碼流進行存儲和傳輸存在非常大的冗餘度。事實上，在無損的條件下對聲音至少可進行4：1壓縮，即只用25％的數字量保留所有的信息，而在視頻領域壓縮比甚至可以達到幾百倍。因而，為利用有限的資源，壓縮技術從一出現便受到廣泛的重視。

對音頻壓縮技術的研究和應用由來已久，如A律、u律編碼就是簡單的准瞬時壓擴技術，並在ISDN話音傳輸中得到應用。對語音信號的研究發展較早，也較為成熟，並已得到廣泛應用，如自適應差分PCM（ADPCM）、線性預測編碼（LPC）等技術。在廣播領域，NICAM（Near Instantaneous Companded Audio Multiplex - 准瞬時壓擴音頻復用）等系統中都使用了音頻壓縮技術。

2、音頻壓縮演算法的主要分類及典型代表

一般來講，可以將音頻壓縮技術分為無損（lossless）壓縮及有損（lossy）壓縮兩大類，而按照壓縮方案的不同，又可將其劃分為時域壓縮、變換壓縮、子帶壓縮，以及多種技術相互融合的混合壓縮等等。各種不同的壓縮技術，其演算法的復雜程度（包括時間復雜度和空間復雜度）、音頻質量、演算法效率（即壓縮比例），以及編解碼延時等都有很大的不同。各種壓縮技術的應用場合也因之而各不相同。

（1）時域壓縮（或稱為波形編碼）技術是指直接針對音頻PCM碼流的樣值進行處理，通過靜音檢測、非線性量化、差分等手段對碼流進行壓縮。此類壓縮技術的共同特點是演算法復雜度低，聲音質量一般，壓縮比小（CD音質> 400kbps），編解碼延時最短（相對其它技術）。此類壓縮技術一般多用於語音壓縮，低碼率應用（源信號帶寬小）的場合。時域壓縮技術主要包括 G.711、ADPCM、LPC、CELP，以及在這些技術上發展起來的塊壓擴技術如NICAM、子帶ADPCM（SB-ADPCM）技術如G.721、 G.722、Apt-X等。

（2）子帶壓縮技術是以子帶編碼理論為基礎的一種編碼方法。子帶編碼理論最早是由Crochiere等於1976年提出的。其基本思想是將信號分解為若乾子頻帶內的分量之和，然後對各子帶分量根據其不同的分布特性採取不同的壓縮策略以降低碼率。通常的子帶壓縮技術和下面介紹的變換壓縮技術都是根據人對聲音信號的感知模型（心理聲學模型），通過對信號頻譜的分析來決定子帶樣值或頻域樣值的量化階數和其它參數選擇的，因此又可稱為感知型（Perceptual）壓縮編碼。這兩種壓縮方式相對時域壓縮技術而言要復雜得多，同時編碼效率、聲音質量也大幅提高，編碼延時相應增加。一般來講，子帶編碼的復雜度要略低於變換編碼，編碼延時也相對較短。

由於在子帶壓縮技術中主要應用了心理聲學中的聲音掩蔽模型，因而在對信號進行壓縮時引入了大量的量化雜訊。然而，根據人類的聽覺掩蔽曲線，在解碼後，這些雜訊被有用的聲音信號掩蔽掉了，人耳無法察覺；同時由於子帶分析的運用，各頻帶內的雜訊將被限制在頻帶內，不會對其它頻帶的信號產生影響。因而在編碼時各子帶的量化階數不同，採用了動態比特分配技術，這也正是此類技術壓縮效率高的主要原因。在一定的碼率條件下，此類技術可以達到「完全透明」的聲音質量（EBU音質標准）。

子帶壓縮技術目前廣泛應用於數字聲音節目的存儲與製作和數字化廣播中。典型的代表有著名的MPEG-1層Ⅰ、層Ⅱ（MUSICAM），以及用於Philips DCC中的PASC（Precision Adaptive Subband Coding，精確自適應子帶編碼）等。

（3）變換壓縮技術與子帶壓縮技術的不同之處在於該技術對一段音頻數據進行「線性」的變換，對所獲得的變換域參數進行量化、傳輸，而不是把信號分解為幾個子頻段。通常使用的變換有DFT、DCT（離散餘弦變換）、MDCT等。根據信號的短時功率譜對變換域參數進行合理的動態比特分配可以使音頻質量獲得顯著改善，而相應付出的代價則是計算復雜度的提高。

變換域壓縮具有一些不完善之處，如塊邊界影響、預回響、低碼率時聲音質量嚴重下降等。然而隨著技術的不斷進步，這些缺陷正逐步被消除，同時在許多新的壓縮編碼技術中也大量採用了傳統變換編碼的某些技術。

有代表性的變換壓縮編碼技術有DolbyAC-2、AT&T的ASPEC（Audio Spectral Perceptual Entropy Coding）、PAC（PerceptualAudioCoder）等。

3、音頻壓縮技術的標准化和MPEG-1

由於數字音頻壓縮技術具有廣闊的應用范圍和良好的市場前景，因而一些著名的研究機構和大公司都不遺餘力地開發自己的專利技術和產品。這些音頻壓縮技術的標准化工作就顯得十分重要。CCITT（現ITU-T）在語音信號壓縮的標准化方面做了大量的工作，制訂了如G.711、G.721、G.728等標准，並逐漸受到業界的認同。

在音頻壓縮標准化方面取得巨大成功的是MPEG-1音頻（ISO/IEC11172-3）。在MPEG-1中，對音頻壓縮規定了三種模式，即層Ⅰ、層Ⅱ（即MUSICAM，又稱MP2），層Ⅲ（又稱MP3）。由於在制訂標准時對許多壓縮技術進行了認真的考察，並充分考慮了實際應用條件和演算法的可實現性（復雜度），因而三種模式都得到了廣泛的應用。VCD中使用的音頻壓縮方案就是MPEG-1層Ⅰ；而MUSICAM由於其適當的復雜程度和優秀的聲音質量，在數字演播室、DAB、DVB等數位元組目的製作、交換、存儲、傳送中得到廣泛應用；MP3是在綜合MUSICAM和ASPEC的優點的基礎上提出的混合壓縮技術，在當時的技術條件下，MP3的復雜度顯得相對較高，編碼不利於實時，但由於MP3在低碼率條件下高水準的聲音質量，使得它成為軟解壓及網路廣播的寵兒。可以說，MPEG-1音頻標準的制訂方式決定了它的成功，這一思路甚至也影響到後面將要談到的MPEG-2和MPEG-4音頻標準的制訂。

最新進展

1、多聲道音頻信號壓縮與DolbyAC-3

隨著技術的不斷進步和生活水準的不斷提高，原有的立體聲形式已不能滿足受眾對聲音節目的欣賞要求，具有更強定位能力和空間效果的三維聲音技術得到蓬勃發展。而在三維聲音技術中最具代表性的就是多聲道環繞聲技術。

更准確地說，環繞聲應該是一種聲音恢復形式，其新技術的含量實際表現在隨著這種形式發展起來的一些數字壓縮標准上。環繞聲技術發展至今已相當成熟，已日漸成為未來聲音形式的主流。有鑒於此，1992年CCIR（ITU-R）以建議的形式約定了多聲道聲音系統的結構及向下兼容變換的標准，即CCIR Recommendation 775。其中主要約定了大家熟知的5.1聲道形式及7.1聲道形式，而在對環繞聲壓縮的研究上也產生了許多專利技術，如DolbySurroundPro -Logic、THX、DolbyAC-3、DTS及MPEG-2等。這些技術在不同的場合，尤其是在影劇院、家庭影院系統，及將來的高清晰度電視（HDTV）等系統中得到廣泛的應用。

（1）Dolby AC-3技術是由美國杜比實驗室主要針對環繞聲開發的一種音頻壓縮技術。在5.1聲道的條件下，可將碼率壓縮至384kbps，壓縮比約為10：1。Dolby AC-3最初是針對影院系統開發的，但目前已成為應用最為廣泛的環繞聲壓縮技術之一。

Dolby AC-3是一種感知型壓縮編碼技術。

在Dolby AC-3中，音頻輸入以音頻塊為單位，塊長度為512個樣值，在48KHz采樣率時即為10.66毫秒，各聲道單獨處理；音頻輸入在經過3Hz高通濾波器去除直流成分後，通過另一高頻帶通濾波器以檢測信號的瞬變情況，並用它來控制TDAC變換的長度，以期在頻域解析度和時域解析度之間得到最好的折中效果； TDAC變換的長度一般為512點，而數據塊之間的重疊長度為256點，即TDAC每5.33毫秒進行一次；在瞬變條件下，TDAC長度被等分為256 點，這樣DolbyAC-3的頻域解析度為93.75Hz，時域最小解析度為2.67毫秒；在圖1中的定點/浮點轉換類似於MPEG-1中比例因子計算的作用，主要是為了獲得寬的動態范圍，而在分離後的指數部分經編碼後則構成了整個信號大致的頻譜，又被稱為頻譜包絡；比特分配主要是通過計算解碼後的頻譜包絡（視為功率譜密度）和掩蔽曲線的相關性來進行的；由於比特分配中採用了前/後向混合自適應比特分配以及公共比特池等技術，因而可使有限的碼率在各聲道之間、不同的頻率分量之間獲得合理的分配；在對尾數的量化過程中，可對尾數進行抖晃處理，抖晃所使用的偽隨機數發生器可在不同的平台上獲得相同的結果；AC -3的幀結構由同步字、CRC、同步信息（SI）、碼流信息（BSI）、音頻塊和附加數據等組成，幀長度與TDAC變換的長度有關，在長度為512點時，幀長為32毫秒，即每秒31.25幀。

通過以上敘述可見，在Dolby AC-3中，使用了許多先進的、行之有效的壓縮技術。如前/後向混合自適應比特分配、公共比特池、TDAC濾波、頻譜包絡編碼、及低碼率條件下使用的多聲道高頻耦合等。而其中許多技術對其它的多聲道環繞聲壓縮技術的發展都產生了一定的影響。

可以說，AC-3的出現是杜比公司幾十年來在聲音降噪及編碼技術方面的結晶（從一定的角度來看，編碼技術實際上就是降低編碼雜訊影響的技術），在技術上它具有很強的優勢。因而即使作為一項專利技術，DolbyAC-3仍然在影院系統、HDTV、消費類電子產品（如LD、DVD）及直播衛星等方面獲得了廣泛的應用，得到了眾多廠商的支持，成為業界事實上的標准。

（2）MPEG-2BC（後向兼容方式），即ISO/IEC13818- 3，是另一種多聲道環繞聲音頻壓縮技術。早在1992年初，該方面的討論工作便已初步開展，並於94年11月正式獲得通過。MPEG-2BC主要是在 MPEG-1和CCIRRec.775的基礎上發展起來的。與MPEG-1相比較，MPEG-2BC主要在兩方面做了重大改進。一是支持多聲道聲音形式，二是為某些低碼率應用場合，如多語聲節目、體育比賽解說等而進行的低采樣率擴展。同時，標准規定的碼流形式還可與MPEG-1的第1和第2層做到前、後向兼容，並可依據CCIR Rec.775做到與雙聲道、單聲道形式的向下兼容，還能夠與Dolby Surround形式兼容。

在MPEG-2BC中，由於考慮到其前、後向兼容性以及環繞聲音形式的新特點，在壓縮演算法中除承襲了MPEG-1的絕大部分技術外，為在低碼率條件下進一步提高聲音質量，還採用了多種新技術。如動態傳輸通道切換、動態串音、自適應多聲道預測、中央聲道部分編碼(Phantom Coding of Center)、預編碼(Predistortion)等。

然而，MPEG-2BC的發展和應用並不如MPEG-1那樣一帆風順。通過對一些相關論文的比較可以發現，MPEG-2BC的編碼框圖在標准化過程中發生了重大的變化，上述的許多新技術都是在後期引入的。事實上，正是與 MPEG-1的前、後向兼容性成為MPEG-2BC最大的弱點，使得MPEG-2BC不得不以犧牲碼率的代價來換取較好的聲音質量。一般情況下，MPEG -2BC需640kbps以上的碼率才能基本達到EBU「無法區分」聲音質量要求。由於MPEG-2BC標准化的進程過快，其演算法自身仍存在一些缺陷。這一切都成為MPEG-2BC在世界范圍內得到廣泛應用的障礙。

（3）DVD（DigitalVersatileDisk）是新一代的多媒體數據存儲和交換的標准。在視頻DVD的伴音方式及音頻DVD的聲音格式選擇上，AC-3和MPEG-2BC之間的爭奪十分激烈，最後達成的協議如表1 所示。可見，多聲道環繞聲音頻壓縮技術標准亟待統一。

⑩ 常見的音頻、視頻、圖像文件格式及其特點

一、視頻文件格式
（1）、AVI格式：
AVI它於1992年被Microsoft公司推出，AVI是非編中最常用的視音文件格式，可以被稱為影音格式的鼻祖。它的英文全稱為Audio Video Interleaved，即音頻視頻交錯格式，所謂「音頻視頻交錯」，就是可以將視頻和音頻交織在一起進行同步播放。這種視頻格式的優點是圖像質量好，可以跨越多平台使用，其缺點是體積過於龐大，而且更糟糕的是壓縮標准不統一，最普遍的現象就是高版本Windows媒體播放器播放不了採用早期編碼編輯的AVI格式視頻，而低版本Windows媒體播放器又播放不了採用最新編碼編輯的AVI格式視頻。在我們的非編中，不論早期的DVStorm還是現如今的EDIUS所使用的視頻文件都是AVI格式，因為它兼容性好，調用方便，圖像質量好。
另外還有DV-AVI格式（攝像機採集常用），DV的英文全稱是Digital Video Format，是由索尼、松下、JVC等多家廠商聯合提出的一種家用數字視頻格式。目前非常流行的數碼攝像機就是使用這種格式記錄視頻數據的。它可以通過電腦的IEEE 1394埠傳輸視頻數據到電腦，也可以將電腦中編輯好的的視頻數據回錄到數碼攝像機中。這種視頻格式的文件擴展名一般是.avi，所以也叫DV-AVI格式。
（2）、MPEG格式：
它的英文全稱為Moving Picture Expert Group，即運動圖像專家組，家裡常看的VCD、SVCD、DVD就是這種格式。MPEG文件格式是運動圖像壓縮演算法的國際標准，它採用了有損壓縮方法減少運動圖像中的冗餘信息而達到高壓縮比的目的，當然這是在保證影像質量的基礎上進行的。MPEG的平均壓縮比為50∶1，最高可達200∶1，壓縮效率之高由此可見一斑。MPEG已成功應用於電視節目存儲、傳輸和播出領域。目前MPEG格式有三個壓縮標准，分別是MPEG－1、MPEG－2、和MPEG－4。
MPEG－1：制定於1992年，它是針對1.5Mbps以下數據傳輸率的數字存儲媒體運動圖像及其伴音編碼而設計的國際標准。也就是我們通常所見到的VCD製作格式。使用PEG-1的壓縮演算法，可把一部120分鍾長的電影壓縮到1.2GB左右大小。這種視頻格式的文件擴展名包括.mpg、.mlv、.mpe、.mpeg及VCD光碟中的.dat文件等。
MPEG－2：制定於1994年，設計目標為高級工業標準的圖像質量以及更高的傳輸率。這種格式主要應用在DVD/SVCD的製作(壓縮)方面，同時在HDTV(高清數子電視)和一些要求比較高的視頻編輯、處理方面有廣泛應用，例如現用的數字衛星接收機就採用的PEG-2標准。使用MPEG-2的壓縮演算法，可以把一部120分鍾長的電影壓縮到4到8GB的大小（文件的大小和數據傳輸碼流有關，規定的碼流為4~8Mbps）。這種視頻格式的文件擴展名包括.mpg、.mpe、.mpeg、.m2v、m2p及DVD光碟上的.vob文件等。其中m1v和m2v都表示該影音文件中不包含音頻文件，只有視頻部分。
MPEG－4：制定於1998年，MPEG－4是為了播放流式媒體的高質量視頻而專門設計的，它可利用很窄的帶度，通過幀重建技術，壓縮和傳輸數據，以求使用最少的數據獲得最佳的圖像質量。目前MPEG-4最有吸引力的地方在於它能夠保存接近於DVD畫質的小體積視頻文件。另外，這種文件格式還包含了以前MPEG壓縮標准所不具備的比特率的可伸縮性、交互性甚至版權保護等一些特殊功能。這種視頻格式的文件擴展名包括.asf、.mov和DivX AVI等。
(3)、DivX格式（DVDrip）
這是由MPEG－4衍生出的另一種視頻編碼(壓縮)標准，也即我們通常所說的DVDrip格式，它採用了MPEG-4的壓縮演算法同時又綜合了MPEG-4與MP3各方面的技術，說白了就是使用MPEG-4壓縮技術對DVD碟片的視頻圖像進行高質量壓縮，同時用MP3或AC3對音頻進行壓縮處理，然後再將視頻與音頻合成並加上相應的外掛字幕文件而形成的視頻格式。其畫質直逼DVD並且體積只有DVD的1/10~1/12。這種編碼對機器的要求也不高，所以DivX視頻編碼技術可以說是一種對DVD造成威脅最大的新生視頻壓縮格式。
（4）MOV格式（QuickTime）
MOV文件最早是Apple公司開發的一種音頻、視頻文件格式。很早微軟就將該格式引入PC的windows操作系統，我們只需在PC機中安裝QuickTime媒體播放軟體就可播放MOV格式的影音文件。*．MOV文件支持25位彩色，支持領先的集成壓縮技術，提供150多種視頻效果，並配有提供了200多種MIDI兼容音響設備的聲音裝置。新版的QuickTime進一步擴展了原有功能，包含了基於Internet應用的關鍵特性。QuickTime因具有跨平台、存儲空間要求小等技術特點，得到業界的廣泛認可，目前已成為數字媒體軟體技術領域的工業標准。現在一般非編中都安裝有此軟體。
（5）、ASF格式
它的英文全稱為Advanced Streaming format，它是微軟為了和現在的Real Player競爭而推出的一種視頻格式，用戶可以直接使用Windows自帶的Windows Media
Player對其進行播放。其它視頻播放器需安裝相應插件才可正常播放。由於它使用了MPEG-4的壓縮演算法，所以壓縮率和圖像的質量都很不錯(高壓縮率有利於視頻流的傳輸，但圖像質量肯定會受損，所以有時候ASF格式的畫面質量不如VCD是正常的)。
（6）WMV格式
它的英文全稱為Windows Media Video，也是微軟推出的一種採用獨立編碼方式並且可以直接在網上實時觀看視頻節目的文件壓縮格式。WMV文件主要優點包括：本地或網路回放、可擴充的媒體類型、部件下載、可伸縮的媒體類型、流的優先順序化、多語言支持、環境獨立性、豐富的流間關系以及擴展性等。
（7）RM格式
英文全稱為Real Media。 RM格式是RealNetworks公司開發的一種新型流式視頻文件格式，它麾下共有三員大將：RealAudio、RealVideo和RealFlash。，用戶可以使用RealPlayer或RealOne Player對符合RealMedia技術標準的網路音、視頻資源進行實況轉播並且RealMedia可以根據不同的網路傳輸速率制定出不同的壓縮比率，從而實現在低速率的網路上進行影像數據實時傳送和播放。RM和ASF格式可以說各有千秋，通常RM視頻更柔和一些，而ASF視頻則相對清晰一些。現在RealPlayer播放軟體在網上都可以下載到，是上網瀏覽視頻流文件的必備工具。
（8）SWF格式
SWF是基於微軟公司Shockwave技術的流式動畫格式，是用Flash軟體製作成的格式。由於它體積小，功能強，交互能力好，現在很多移動播放器都支持SWF格式的文件，也越來越多地應用到網路動畫中。
二、音頻文件格式
（1）CD格式
CD格式是比較常見的，平常聽的CD碟片，每一首歌就是以CDA音軌的格式存儲在光碟中的，這種格式的音樂音質最好，但存儲容量很大，一張650MB的光碟最多存儲十幾首歌曲，由於音質好，至今仍受到許多音樂愛好者的青睞。標准CD格式是44.1K的采樣頻率，速率88K/秒，16位量化位數，因為CD音軌可以說是近似無損的，因此它的聲音基本上是忠於原聲的。
（2）WAV格式
WAV是微軟公司開發的一種聲音文件格式，用於保存WINDOWS平台的音頻信息資源，被WINDOWS平台及其應用程序所支持。支持多種音頻位數、采樣頻率和聲道，標准格式的WAV文件和CD格式一樣，也是44.1K的采樣頻率，速率88K/秒，16位量化位數，WAV格式的聲音文件質量和CD相差無幾，也是目前PC機上廣為流行的聲音文件格式，我們非編上用的配音文件就是這種各式，幾乎所有的音頻編輯軟體都「認識」WAV格式。
這里順便提一下由蘋果公司開發的AIFF（Audio Interchange File Format）格式和為UNIX系統開發的AU格式，它們都和WAV非常相像，在大多數的音頻編輯軟體中也都支持它們這幾種常見的音樂格式。
（3） MP3格式
所謂MP3也就是MPEG Audio Layer-3，指的是MPEG標准中的音頻部分。需要注意的是，MPEG音頻文件的壓縮是一種有損壓縮，它是犧牲了聲音文件中12KHz~ 16KHz高音頻部分的質量來換取文件的尺寸。相同長度的音樂文件，用*.mp3格式來儲存，一般只有*.wav文件的1/10~1/15，而音質要次於CD格式或WAV格式的聲音文件。由於其文件尺寸小，音質好，直到現在，這種格式的音樂還作為主流音頻格式地位存在。
（4）APE格式
APE是目前流行的數字音樂文件格式之一。與MP3這類有損壓縮方式不同，APE是一種無損壓縮技術，也就是說當你從CD上讀取的音頻數據文件壓縮成APE格式後，你還可以再將APE格式的文件還原，而還原後的音頻文件與壓縮前幾乎沒有損失。APE的文件大小大概為CD的一半，也就是說一張普通的音樂CD（650MB左右）用APE格式保存後，只需用300左右的磁碟空間，隨著寬頻的普及，APE格式受到了許多音樂愛好者的喜愛，特別是對於希望通過網路傳輸音頻CD的朋友來說，APE可以幫助他們節約大量的資源。
（5）MIDI格式
MIDI（Musical Instrument Digital Interface）的衍生格式有MID和RMI格式，MIDI文件與WAV文件有很大區別，它只是記錄音頻中的信息，然後再告訴音效卡如何再現音樂的一組指令，故文件大小一般只有幾十到幾百K（1分鍾的音樂只用大約5～10KB）。MIDI文件在用不同技術指標的音效卡和音箱播放時其效果差別很大，重放的效果完全依賴音效卡的檔次。MIDI文件主要用於電子樂器的數據交互和樂曲創作等。
（6）WMA格式
WMA (Windows Media Audio) 格式來是自於微軟的重量級選手，後台強硬，音質要強於MP3格式，更遠勝於RA格式，它具有比MP3更高的壓縮率，這種文件要在Windows媒體播放器8.0以上版本才可順利播放。WMA在微軟的大規模推廣下已經得到了越來越多站點的承認和大力支持，在音樂領域中直逼mp3，在網路廣播方面，也正在瓜分RealPlayer打下的天下。因此，幾乎所有的音頻格式都感受到了WMA格式的壓力。
（7）RA(RealAudio)格式
RealAudio主要適用於網路上的在線音樂欣賞。現在real的文件格式主要有RA（RealAudio）、RM（RealMedia）、RMS（RealAudio Secured）、RMX等格式。它是RealNetworks公司開發的。特點是在極低的比特率環境下提供可聽的音頻質量。不適於網路傳播之外的用途，因為音質不是太好。
（8）、OGG格式（OGG Vorbis）
Ogg Vorbis 是一種音頻壓縮格式，類似於MP3等現有的通過有損壓縮演算法進行音頻壓縮的音樂格式。現在創建的OGG文件可以在未來的任何播放器上播放，因為這種格式文件可以不斷地進行大小和音質的改良，而不影響原有的編碼器或播放器。在壓縮技術上， Ogg Vorbis的最主要特點是使用了VBR（可變比特率）和ABR（平均比特率）方式進行編碼，這種格式的文件是近年來在網上流行的一種音頻格式。
三、常用圖片文件格式解釋
圖像世界中不同的格式各自以不同的方式來表示圖形信息，我們常用到的圖形格式有：
⑴.BMP――(Bimap) 是Microsoft公司圖形文件自身的點點陣圖格式, 支持1~24bit色彩，在保存為這種格式時彈出的對話框會詢問用於Windows或是0S/2系統。BMP格式保存的圖像質量不變，文件也比較大，因為要保存每個像素的信息。
⑵.JPEG――是一種較常用的有損壓縮方案，常用來壓縮存儲批量圖片（壓縮比達20倍），我們在相應程序中以"jpg"存儲時，會進一步詢問使用哪檔圖像品質來壓縮，而在圖形程序中打開時會自動解壓。JPEG全部名稱為：Joint photographic exptrs group。盡管它是一種主流格式，在需要輸出高質量圖像時不使用JPG 而應選EPS格式或TIF格式，特別是在以JPG格式進行圖形編輯時，不要經常進行保存操作。
⑶.GIF―― (Graphics Interchange Format)是一種圖像交換格式，可提供壓縮功能，但只支持256色，很少用於照片級圖像處理工作。在PhotoShop中把對顏色數要求不高的圖片變為索引色，再以GIF格式保存，使文件縮小後用更快的速度在網上傳輸。
⑷.GIF89a――即89年的標准，以區別於87a。可以實現網上特殊效果圖形的傳送, 在PhotoShop中通過"文件"菜單的"Export"輸出選項，指定某種顏色成為透明色或是製作出由模糊逐漸清晰的漸顯效果。
⑸. PNG―― 是網景公司開發的支持新一代WWW標准而制定的較為新型的圖形格式，它綜合了JPG和GIF格式的優點，支持24bit色彩（256*256*256），壓縮不失真並支持透明背景和漸顯圖像的製作，所以稱它為傳統GIF的替代格式。在Web頁面中，瀏覽器支持的格式有JPG 、GIF和PNG。
⑹.TIF――是一種跨平台的點陣圖格式, 全稱為Tag Image File Format意為標簽圖像文件格式, 同時支持PC與蘋果機，採用的LZW壓縮演算法是一種無損失的壓縮方案，常用來存儲大幅圖片。此種格式也可以不壓縮, 它支持24個通道，並可與"3DS"交換文件。
⑺.PCX――也是一種跨平台格式, 是Windows與DOS之間進行圖形文件交換的橋梁, 在DOS下為256色, 在PhotoShop中有16兆色的PCX，當Windows普及後這種古老的格式已不受歡迎。
⑻.TGA――支持32位軟體和8位α通道電視, 是Windows與3DS進行圖形交換的格式。在實用中可以將動畫通過視頻軟體轉入電視。
⑼.WMF―― (Metafile) 是一種矢量圖形格式, Word中內部存儲的圖片或繪制的圖形對象屬於這種格式。無論放大還是縮小，圖形的清晰度不變，WMF是一種清晰簡潔的文件格式。
⑽.EPS――Adobe公司矢量繪圖軟體Illustrator本身的向量圖格式，EPS格式常用於點陣圖與矢量圖之間交換文件。在PhotoShop打開EPS格式時是通過"文件"菜單的"導入"命令來進行點陣化轉換的。
總的來說, 目前計算機平面靜態圖形文件分為兩大類：一類是點陣圖，它是一種光柵圖形，即點點陣圖，在編輯點陣圖時針對的是像素點而不是形狀，點陣圖放大會產生失真，存儲時所以佔有較大空間是因為要保留每個點坐標的信息；另一類是由Windows的函數集描述圖像，佔有少量空間及內存，因為是用數學函數描繪的，放大不會失真，但比較復雜的圖像運算量非常大。在以矢量圖保存一條曲線時，只要有起點位置及標示曲線的信息(曲率半徑、顏色等)。

閱讀全文

熱點內容

安卓手機微信聊天記錄如何轉移到蘋果手機發布：2025-03-15 07:11:59 瀏覽：747

支付怎麼添加銀行卡支付密碼是什麼情況發布：2025-03-15 07:10:34 瀏覽：902

linux進入根目錄發布：2025-03-15 06:51:48 瀏覽：45

美國人用什麼伺服器發布：2025-03-15 06:51:43 瀏覽：219

為什麼安卓4k只能錄5分鍾發布：2025-03-15 06:49:31 瀏覽：54

為什麼安卓機拍視頻60幀沒防抖發布：2025-03-15 06:48:50 瀏覽：212

訪問量QQ 發布：2025-03-15 06:41:30 瀏覽：14

ajax多文件上傳發布：2025-03-15 06:08:37 瀏覽：842

游戲編程工作室發布：2025-03-15 06:07:13 瀏覽：374

榮放先鋒版的配置有哪些發布：2025-03-15 06:06:37 瀏覽：484

音頻視頻存儲技術

與音頻視頻存儲技術相關的資訊