寬頻編解碼方式
1. 語音編解碼的PCMU(G.711U)
類型:Audio
制定者:ITU-T
所需頻寬:64Kbps(90.4)
特性:PCMU和PCMA都能提供較好的語音質量,但是它們佔用的帶寬較高,需要64kbps。
優點:語音質量優
缺點:佔用的帶寬較高
應用領域:voip
版稅方式:Free
備註:PCMUandPCMA都能夠達到CD音質,但是它們消耗的帶寬也最多(64kbps)。如果網路帶寬比較低,可以選用低比特速率的編碼方法,如G.723或G.729,這兩種編碼的方法也能達到傳統長途電話的音質,但是需要很少的帶寬(G723需要5.3/6.3kbps,G729需要8kbps)。如果帶寬足夠並且需要更好的語音質量,就使用PCMU和 PCMA,甚至可以使用寬頻的編碼方法G722(64kbps),這可以提供有高保真度的音質。
2. 在網路中「 寬頻傳輸」,「基帶傳輸」,「頻帶傳輸」各是什麼…
電信號也叫信號,信號的每秒鍾變化的次數叫頻率,單位赫茲(HZ)。信號的頻率有高有低,就象聲音有高有低一樣,低頻到高頻的范圍叫頻帶,不同的信號有不同的頻帶。
基帶傳輸
在數據通信中,由計算機或終端等數字設備直接發出的二進制數字信號形式稱為方波,即「1」或「0」,分別用高(或低)電平或低(或高)電平表示,人們把方 波固有的頻帶稱為基帶(由消息直接轉換成的未經調制變換的信號所佔的頻帶,理論上基帶信號的頻譜是從0到無窮大),方波電信號稱為基帶信號。
在數字信號頻譜中,把直流(零頻)開始到能量集中的一段頻率范圍稱為基本頻帶,簡稱為基帶。因此,數字信號被稱為數字基帶信號,在信道中直接傳輸這種基帶 信號就稱為基帶傳輸。在基帶傳輸中,整個信道只傳輸一種信號,通信信道利用率低。一般來說,要將信源的數據經過變換變為直接傳輸的數字基帶信號,這項工作 由編碼器完成。在發送端,由編碼器實現編碼;在接收端由解碼器進行解碼,恢復發送 端原發送的數據。基帶傳輸是一種最簡單最基本的傳輸方式。是典型的矩形電脈沖信號,其頻譜包括直流、低頻和高頻等多種成份。
由於在近距離范圍內,基帶信號的功率衰減不大,從而信道容量不會發生變化,因此,在區域網中通常使用基帶傳輸技術。
在基帶傳輸中,需要對數字信號進行編碼來表示數據。
頻帶傳輸
遠距離通信信道多為模擬信道,例如,傳統的電話(電話信道)只適用於傳輸音頻范圍(300-3400Hz)的模擬信號,不適用於直接傳輸頻帶很寬、但能量集中在低頻段的數字基帶信號。
頻帶傳輸就是先將基帶信號變換(調制)成便於在模擬信道中傳輸的、具有較高頻率范圍的模擬信號(稱為頻帶信號),再將這種頻帶信號在模擬信道中傳輸。
計算機網路的遠距離通信通常採用的是頻帶傳輸。
基帶信號與頻帶信號的轉換是由調制解調技術完成的。
寬頻傳輸
通過藉助頻帶傳輸,可以將鏈路容量分解成兩個或更多的信道,每個信道可以攜帶不同的信號,這就是寬頻傳輸。寬頻傳輸中的所有信道都可以同時發送信號。如CATV、ISDN等。
寬頻傳輸和基帶傳輸的特性
基帶傳輸:
由計算機或終端產生的數字信號,頻譜都是從零開始的,這種未經調制的信號所佔用的頻率范圍叫基本頻帶(這個頻帶從直流起可高到數百千赫,甚至若干 兆赫),簡稱基帶(base band)。這種數字信號就稱基帶信號。舉個簡單的例字拉:在有線信道中,直接用電傳打字機進行通信時傳輸的信號就是基帶信號。而傳送數據時,以原封不動 的形式,把基帶信號送入線路,稱為基帶傳輸。基帶傳輸不需要數據機,設備化費小,適合短距離的數據輸,比如一個企業、工廠,就可以採用這種方式將大量 終端連接到主計算機。另外就是傳輸介質,區域網中一般都採用基帶同軸電纜作傳輸介質,不過如果你打算用光纖,我也絕對沒有異議。
頻帶傳輸:
上面的傳輸方式適用於一個單位內部的區域網傳輸,但除了市內的線路之外,長途線路是無法傳送近似於0的分量的,也就是說,在計算機的遠程通信中, 是不能直接傳輸原始的電脈沖信號的(也就是基帶信號了)。因此就需要利用頻帶傳輸,就是用基帶脈沖對載波波形的某些參量進行控制,使這些參量隨基帶脈沖變 化,這就是調制。經過調制的信號稱為已調信號。已調信號通過線路傳輸到接收端,然後經過解調恢復為原始基帶脈沖。這種頻帶傳輸不僅克服了目前許多長途電話 線路不能直接傳輸基帶信號的缺點,而且能實現多路復用的目的,從而提高了通信線路的利用率。不過頻帶傳輸在發送端和接收端都要設置數據機。
但是,在基帶傳輸中我們常常會有一個深有體會的問題,就是等等等——在這種情況下,我們就非常羨慕並嚮往一種傳輸了,這種傳輸的名字就叫 ——寬頻傳輸。所謂寬頻,就是指比音頻(4KHZ)帶寬還要寬的頻帶,簡單一點就是包括了大部分電磁波頻譜的頻帶 拉。使用這種寬頻帶進行傳輸的系統就稱為寬頻傳輸系統,它簡直就可以容納所——有的廣播,並且還可以進行高速率的數據傳輸。對於區域網而言,寬頻這個術語 專門用於使用傳輸模擬信號的同軸電纜,可見寬頻傳輸系統是模擬信號傳輸系統,它允許在同一信道上進行數字信息和模擬信息服務。基帶和寬頻的區別還在於數據 傳輸速率不同。基帶數據傳輸速率為0~10 Mb/s,更典型的是1Mb/s~2.5Mb/s,通常用於傳輸數字信息。寬頻是傳輸模擬信號,數據傳輸速率范圍為0~400Mb/s,而通常使用的傳輸 速率是5Mb/s~10 Mb/s,而且一個寬頻信道可以被劃分為多個邏輯基帶信道。這樣就能把聲音、圖像和數據信息的傳輸綜合在一個物理信道中進行,以滿足你對網路非常過分的要 求。總之,寬頻傳輸一定是採用頻帶傳輸技術的, 但頻帶傳輸不一定就是寬頻傳輸。
3. 編碼和解碼的工作機制是什麼
把所使用的每一種二進制代碼狀態都賦於特定的含義,表示一個特定的信號或對象,叫編碼。如用四位二進制數的0000~1001這十種狀太,分別表示0~9這十個十進制數碼,稱為8421編碼。反過來把代碼的特定含義翻譯出來,稱為解碼。
計算機在處理各種文字元號或數碼時,必須把這些信息進行二進制編碼,在編碼時所使用的第一種二進制代碼狀態都賦予了特定的含義,即表示一個確定的信號或者對象,實現這種功能的電路叫編碼器,如用於鍵盤的BCD碼,ASCII碼編碼器等。
單片機外圍電路用解碼器較多,所以在這節課我們主要與大家一起來學習下解碼器的工作原理(購買了本站產品的朋友,在我們配套的多媒體教學光碟中有相關的教學內容,建議大家觀看),把代碼的含義『翻譯』成相應的輸出信號,以表示其原意。其功能恰恰與編碼器相反。
解碼器可以將輸入代碼的狀態翻譯成相應的輸出信號,以高、低電平的形式在各自的輸出埠送出,以表示其意願。解碼器有多個輸入端和多個輸出端。假如輸入的端個數為,每個輸出端只能有兩個狀態,則輸出端個數最多有2n個。常用解碼器輸入、輸出端頭數來稱呼解碼器,如3線-8線解碼器,4線-10線解碼器等。我們經常用到的74138就是一個三線-八線解碼器,朋友們可以到我們網站的《晶元資料》頻道下載74138的中文資料。
編碼、解碼的概念我們了解下,下面我們就來重點來講一下三-八解碼器的工作原理,這在我們51單片機的介面電路中也是經常用到的。
74138的工作原理如下圖所示:
從上圖可看出,74138有三個輸入端:A0、A1、A2和八個輸出端Q0~Q7。當輸入端A0、A1、A2的編碼為000時,解碼器輸出為Q0=0,而Q1~Q7=1。即Q0對應於A0、A1、A2為000狀態,低電平有效。A0、A1、A2的另外7種組合見後面的真值表。
圖中S1、S2、S3為使能控制端,起到控制解碼器是否能進行解碼的作用。只有S1為高電平,S2、S3均為低電平時,才能進行解碼,否則不論輸入羰輸入為何值,每個輸出端均為1。
下圖是輸入端A0、A1、A2為000,控制端S1=1、S1=0、S2=0的電平示意圖(紅色數字為埠電平),大家可按下圖進行分析,也可以分析輸出端另外七種組合時的輸出情況。
74138 三線-八線解碼器真值表:
4. 寬頻碼分多址的關鍵技術
WCDMA產業化的關鍵技術包括射頻和基帶處理技術,具體包括射頻、中頻數字化處理,RAKE接收機、信道編解碼、功率控制等關鍵技術和多用戶檢測、智能天線等增強技術。
射頻和中頻
射頻部分是傳統的模擬結構,實現射頻和中頻信號轉換。射頻上行通道部分主要包括自動增益控制(射頻部分是傳統的模擬結構,實現射頻和中頻信號轉換。射頻上行通道部分主要包括自動增益控制(RFAGC),接收濾波器(Rx濾波器)和下變頻器。射頻的下行通道部分主要包括二次上變頻,寬頻線性功放和射頻發射濾波器。中頻部分主要包括上行的去混迭濾波器、下變頻器、ADC和下行的中頻平滑濾波器,上變頻器和DAC。與GSM信號和第一代信號不同,WCDMA的信號帶寬為達到5MHz的寬頻信號。寬頻信號的射頻功放的線性和效率是普遍存在的矛盾。
RAKE接收機
RAKE接收機專為CDMA系統設計的經典的分集接收器,其理論基礎就是:當傳播時延超過一個碼片周期時,多徑信號實際上可被看作是互不相關的。
帶DLL的相關器是一個遲早門的鎖相環。它由兩個相關器(早和晚)組成,和解調相關器分別相差±1/2(或1/4)個碼片。遲早門的相關結果相減可以用於調整碼相位。延遲環路的性能取決於環路帶寬。
延遲估計的作用是通過匹配濾波器獲取不同時間延遲位置上的信號能量分布,識別具有較大能量的多徑位置,並將它們的時間量分配到RAKE接收機的不同接收徑上。匹配濾波器的測量精度可以達到1/4-1/2碼片,而RAKE接收機的不同接收徑的間隔是一個碼片。實際實現中,如果延遲估計的更新速度很快(比如幾十ms一次),就可以無須遲早門的鎖相環。
由於信道中快速衰落和雜訊的影響,實際接收的各徑的相位與原來發射信號的相位有很大的變化,因此在合並以前要按照信道估計的結果進行相位的旋轉,實際的CDMA系統中的信道估計是根據發射信號中攜帶的導頻符號完成的。根據發射信號中是否攜帶有連續導頻,可以分別採用基於連續導頻的相位預測和基於判決反饋技術的相位預測方法。
在系統中對每個用戶都要進行多徑的搜索和解調,而且WCDMA的碼片速率很高,其基帶硬體的處理量很大,在實際實現中有一定困難。
信道編解碼
信道編解碼主要是降低信號傳播功率和解決信號在無線傳播環境中不可避免的衰落問題。編解碼技術結合交織技術的使用可以提高誤碼率性能,與無編碼情況相比,傳統的卷積碼可以將誤碼率提高兩個數量級達到10-3~10-4,而Turbo碼可以將誤碼率進一步提高到10-6。WCDMA候選的信道編解碼技術中原來包括Reed-Solomon和Turbo碼,Turbo碼因為編解碼性能能夠逼近Shannon極限而最後被採用作為3G的數據編解碼技術。卷積碼主要是用於低數據速率的語音和信令。Turbo編碼由兩個或以上的基本編碼器通過一個或以上交織器並行級聯構成,如圖3:
Turbo碼的原理是基於對傳統級聯碼的演算法和結構上的修正,內交織器的引入使得迭代解碼的正反饋得到了很好的消除。Turbo的迭代解碼演算法包括SOVA(軟輸出Viterbi演算法)、MAP(最大後驗概率演算法)等。由於MAP演算法的每一次迭代性能的提高都優於Viterbi演算法,因此MAP演算法的迭代解碼器可以獲得更大的編碼增益。實際實現的MAP演算法是Log-MAP演算法,它將MAP演算法置於對數域中進行計算,減少了計算量。
Turbo解碼演算法實現的難點在於高速數據時的解碼速率和相應的迭代次數,現有的DSP都內置了解碼器所需的基本演算法,使得Turbo解碼可以依賴DSP晶元直接實現而無需採用ASIC。
5. 監控視頻壓縮編解碼的介紹
(一)、M-JPEG
M-JPEG(Motion- Join Photographic Experts Group)技術即運動靜止圖像(或逐幀)壓縮技術,廣泛應用於非線性編輯領域可精確到幀編輯和多層圖像處理,把運動的視頻序列作為連續的靜止圖像來處理,這種壓縮方式單獨完整地壓縮每一幀,在編輯過程中可隨機存儲每一幀,可進行精確到幀的編輯,此外M-JPEG的壓縮和解壓縮是對稱的,可由相同的硬體和軟體實現。但M-JPEG只對幀內的空間冗餘進行壓縮。不對幀間的時間冗餘進行壓縮,故壓縮效率不高。採用M-JPEG數字壓縮格式,當壓縮比7:1時,可提供相當於Betecam SP質量圖像的節目。
JPEG標准所根據的演算法是基於DCT(離散餘弦變換)和可變長編碼。JPEG的關鍵技術有變換編碼、量化、差分編碼、運動補償、霍夫曼編碼和遊程編碼等
M-JPEG的優點是:可以很容易做到精確到幀的編輯、設備比較成熟。缺點是壓縮效率不高。
此外,M-JPEG這種壓縮方式並不是一個完全統一的壓縮標准,不同廠家的編解碼器和存儲方式並沒有統一的規定格式。這也就是說,每個型號的視頻伺服器或編碼板有自己的M-JPEG版本,所以在伺服器之間的數據傳輸、非線性製作網路向伺服器的數據傳輸都根本是不可能的。
(二)、MPEG系列標准
MPEG是活動圖像專家組(Moving Picture Exports Group)的縮寫,於1988年成立,是為數字視/音頻制定壓縮標準的專家組,目前已擁有300多名成員,包括IBM、SUN、BBC、NEC、INTEL、AT&T等世界知名公司。MPEG組織最初得到的授權是制定用於「活動圖像」編碼的各種標准,隨後擴充為「及其伴隨的音頻」及其組合編碼。後來針對不同的應用需求,解除了「用於數字存儲媒體」的限制,成為現在制定「活動圖像和音頻編碼」標準的組織。MPEG組織制定的各個標准都有不同的目標和應用,目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21標准。
1.MPEG-1標准
MPEG-1標准於1993年8月公布,用於傳輸1.5Mbps數據傳輸率的數字存儲媒體運動圖像及其伴音的編碼。該標准包括五個部分:
第一部分說明了如何根據第二部分(視頻)以及第三部分(音頻)的規定,對音頻和視頻進行復合編碼。第四部分說明了檢驗解碼器或編碼器的輸出比特流符合前三部分規定的過程。第五部分是一個用完整的C語言實現的編碼和解碼器。
該標准從頒布的那一刻起,MPEG-1取得一連串的成功,如VCD和MP3的大量使用,Windows95以後的版本都帶有一個MPEG-1軟體解碼器,可攜式MPEG-1攝像機等等。
2.MPEG-2標准
MPEG組織於1994年推出MPEG-2壓縮標准,以實現視/音頻服務與應用互操作的可能性。MPEG-2標準是針對標准數字電視和高清晰度電視在各種應用下的壓縮方案和系統層的詳細規定,編碼碼率從每秒3兆比特~100兆比特,標準的正式規范在ISO/IEC13818中。MPEG-2不是MPEG-1的簡單升級,MPEG-2在系統和傳送方面作了更加詳細的規定和進一步的完善。MPEG-2特別適用於廣播級的數字電視的編碼和傳送,被認定為SDTV和HDTV的編碼標准。
MPEG-2圖像壓縮的原理是利用了圖像中的兩種特性:空間相關性和時間相關性。這兩種相關性使得圖像中存在大量的冗餘信息。如果我們能將這些冗餘信息去除,只保留少量非相關信息進行傳輸,就可以大大節省傳輸頻帶。而接收機利用這些非相關信息,按照一定的解碼演算法,可以在保證一定的圖像質量的前提下恢復原始圖像。一個好的壓縮編碼方案就是能夠最大限度地去除圖像中的冗餘信息。
MPEG-2的編碼圖像被分為三類,分別稱為I幀,P幀和B幀。
I幀圖像採用幀內編碼方式,即只利用了單幀圖像內的空間相關性,而沒有利用時間相關性。P幀和B幀圖像採用幀間編碼方式,即同時利用了空間和時間上的相關性。P幀圖像只採用前向時間預測,可以提高壓縮效率和圖像質量。P幀圖像中可以包含幀內編碼的部分,即P幀中的每一個宏塊可以是前向預測,也可以是幀內編碼。B幀圖像採用雙向時間預測,可以大大提高壓縮倍數。
MPEG-2的編碼碼流分為六個層次。為更好地表示編碼數據,MPEG-2用句法規定了一個層次性結構。它分為六層,自上到下分別是:圖像序列層、圖像組(GOP)、圖像、宏塊條、宏塊、塊。
MPEG-2標准在廣播電視領域中的主要應用如下:
(1)視音頻資料的保存
一直以來,電視節目、音像資料等都是用磁帶保存的。這種方式有很多弊端:易損,佔地大,成本高,難於重新使用。更重要的是難以長期保存,難以查找、難以共享。隨著計算機技術和視頻壓縮技術的發展,高速寬頻計算機網路以及大容量數據存儲系統給電視台節目的網路化存儲、查詢、共享、交流提供了可能。
採用MPEG-2壓縮編碼的DVD視盤,給資料保存帶來了新的希望。電視節目、音像資料等可通過MPEG-2編碼系統編碼,保存到低成本的CD-R光碟或高容量的可擦寫DVD-RAM上,也可利用DVD編著軟體(如Daikin Scenarist NT、Spruce DVDMaestro等)製作成標準的DVD視盤,既可節約開支,也可節省存放空間。
(2)電視節目的非線性編輯系統及其網路
在非線性編輯系統中,節目素材是以數字壓縮方式存儲、製作和播出的, 視頻壓縮技術是非線性編輯系統的技術基礎。目前主要有M-JPEG和MPEG-2兩種數字壓縮格式。
M-JPEG技術即運動靜止圖像(或逐幀)壓縮技術,可進行精確到幀的編輯,但壓縮效率不高。
MPEG-2採用幀間壓縮的方式,只需進行I幀的幀內壓縮處理,B幀和P幀通過偵測獲得,因此 ,傳輸和運算的數據大多由幀之間的時間相關性得到,相對來說,數據量小,可以實現較高的壓縮比。隨著逐幀編輯問題的解決,MPEG-2將廣泛應用於非線性編輯系統,並大大地降低編輯成本,同時MPEG-2的解壓縮是標準的,不同廠家設計的壓縮器件壓縮的數據可由其他廠家設計解壓縮器來解壓縮,這一點保證了各廠家的設備之間能完全兼容。
由於採用MPEG-2 IBP視頻壓縮技術,數據量成倍減少,降低了存儲成本,提高了數據傳輸速度,減少了對計算機匯流排和網路帶寬的壓力,可採用純乙太網組建非線性編輯網路系統已成為可能,而在目前乙太網是最為成熟的網路,系統管理比較完善,價格也比較低廉。
基於MPEG-2的非線性編輯系統及非線性編輯網路將成為未來的發展方向。
(3)衛星傳輸
MPEG-2已經通過ISO認可,並在廣播領域獲得廣泛的應用,如數字衛星視頻廣播(DVB-S)、DVD視盤和視頻會議等。目前,全球有數以千萬計的DVB-S用戶,DVB-S信號採用MPEG-2壓縮格式編碼,通過衛星或微波進行傳輸,在用戶端經MPEG-2衛星接收解碼器解碼,以供用戶觀看。此外,採用MPEG-2壓縮編碼技術,還可以進行遠程電視新聞或節目的傳輸和交流。
(4)電視節目的播出
在整個電視技術中播出是一個承上啟下的環節,對播出系統進行數字化改造是非常必要的,其中最關鍵一步就是構建硬碟播出系統。MPEG-2硬碟自動播出系統因編播簡便、儲存容量大、視頻指標高等優點,而為人們所青睞。但以往MPEG-2播出設備因非常昂貴,而只有少量使用。隨著MPEG-2技術的發展和相關產品成本的下降,MPEG-2硬碟自動系統播出可望得到普及。
3.MPEG-4標准
運動圖像專家組MPEG 於1999年2月正式公布了MPEG-4(ISO/IEC14496)標准第一版本。同年年底MPEG-4第二版亦告底定,且於2000年年初正式成為國際標准。
MPEG-4與MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具體壓縮演算法,它是針對數字電視、互動式繪圖應用(影音合成內容)、互動式多媒體(WWW、資料擷取與分散)等整合及壓縮技術的需求而制定的國際標准。MPEG-4標准將眾多的多媒體應用集成於一個完整的框架內,旨在為多媒體通信及應用環境提供標準的演算法及工具,從而建立起一種能被多媒體傳輸、存儲、檢索等應用領域普遍採用的統一數據格式。
MPEG-4的編碼理念是:MPEG-4標准同以前標準的最顯著的差別在於它是採用基於對象的編碼理念,即在編碼時將一幅景物分成若干在時間和空間上相互聯系的視頻音頻對象,分別編碼後,再經過復用傳輸到接收端,然後再對不同的對象分別解碼,從而組合成所需要的視頻和音頻。這樣既方便我們對不同的對象採用不同的編碼方法和表示方法,又有利於不同數據類型間的融合,並且這樣也可以方便的實現對於各種對象的操作及編輯。例如,我們可以將一個卡通人物放在真實的場景中,或者將真人置於一個虛擬的演播室里,還可以在互聯網上方便的實現交互,根據自己的需要有選擇的組合各種視頻音頻以及圖形文本對象。
MPEG-4系統的一般框架是:對自然或合成的視聽內容的表示;對視聽內容數據流的管理,如多點、同步、緩沖管理等;對靈活性的支持和對系統不同部分的配置。
與MPEG-1、MPEG-2相比,MPEG-4具有如下獨特的優點:
(1) 基於內容的交互性
MPEG-4提供了基於內容的多媒體數據訪問工具,如索引、超級鏈接、上下載、刪除等。利用這些工具,用戶可以方便地從多媒體資料庫中有選擇地獲取自己所需的與對象有關的內容,並提供了內容的操作和位流編輯功能,可應用於互動式家庭購物,淡入淡出的數字化效果等。MPEG-4提供了高效的自然或合成的多媒體數據編碼方法。它可以把自然場景或對象組合起來成為合成的多媒體數據。
(2)高效的壓縮性
MPEG-4基於更高的編碼效率。同已有的或即將形成的其它標准相比,在相同的比特率下,它基於更高的視覺聽覺質量,這就使得在低帶寬的信道上傳送視頻、音頻成為可能。同時MPEG-4還能對同時發生的數據流進行編碼。一個場景的多視角或多聲道數據流可以高效、同步地合成為最終數據流。這可用於虛擬三維游戲、三維電影、飛行模擬練習等
(3)通用的訪問性
MPEG-4提供了易出錯環境的魯棒性,來保證其在許多無線和有線網路以及存儲介質中的應用,此外,MPEG-4還支持基於內容的的可分級性,即把內容、質量、復雜性分成許多小塊來滿足不同用戶的不同需求,支持具有不同帶寬,不同存儲容量的傳輸信道和接收端。
這些特點無疑會加速多媒體應用的發展,從中受益的應用領域有:網際網路多媒體應用;廣播電視;互動式視頻游戲;實時可視通信;互動式存儲媒體應用;演播室技術及電視後期製作;採用面部動畫技術的虛擬會議;多媒體郵件;移動通信條件下的多媒體應用;遠程視頻監控;通過ATM網路等進行的遠程資料庫業務等。MPEG-4主要應用如下:
(1)應用於網際網路視音頻廣播
由於上網人數與日俱增,傳統電視廣播的觀眾逐漸減少,隨之而來的便是廣告收入的減少,所以現在的固定式電視廣播最終將轉向基於TCP/IP的網際網路廣播,觀眾的收看方式也由簡單的遙控器選擇頻道轉為網上視頻點播。視頻點播的概念不是先把節目下載到硬碟,然後再播放,而是流媒體視頻(streaming video),點擊即觀看,邊傳輸邊播放。
現在網際網路中播放視音頻的有:Real Networks公司的 Real Media,微軟公司的 Windows Media,蘋果公司的 QuickTime,它們定義的視音頻格式互不兼容,有可能導致媒體流中難以控制的混亂,而MPEG-4為網際網路視頻應用提供了一系列的標准工具,使視音頻碼流具有規范一致性。因此在網際網路播放視音頻採用MPEG-4,應該說是一個安全的選擇。
(2)應用於無線通信
MPEG-4高效的碼率壓縮,交互和分級特性尤其適合於在窄帶移動網上實現多媒體通信,未來的手機將變成多媒體移動接收機,不僅可以打移動電視電話、移動上網,還可以移動接收多媒體廣播和收看電視。
(3)應用於靜止圖像壓縮
靜止圖像(圖片)在網際網路中大量使用,現在網上的圖片壓縮多採用JPEG技術。MPEG-4中的靜止圖像(紋理)壓縮是基於小波變換的,在同樣質量條件下,壓縮後的文件大小約是JPEG壓縮文件的十分之一。把網際網路上使用的JPEG圖片轉換成MPEG-4格式,可以大幅度提高圖片在網路中的傳輸速度。
(4)應用於電視電話
傳統用於窄帶電視電話業務的壓縮編碼標准,如H261,採用幀內壓縮、幀間壓縮、減少象素和抽幀等辦法來降低碼率,但編碼效率和圖像質量都難以令人滿意。MPEG-4的壓縮編碼可以做到以極低碼率傳送質量可以接受的聲像信號,使電視電話業務可以在窄帶的公用電話網上實現。
(5)應用於計算機圖形、動畫與模擬
MPEG-4特殊的編碼方式和強大的交互能力,使得基於MPEG-4的計算機圖形和動畫可以從各種來源的多媒體資料庫中獲取素材,並實時組合出所需要的結果。因而未來的計算機圖形可以在MPEG-4語法所允許的范圍內向所希望的方向無限發展,產生出今天無法想像的動畫及模擬效果。
(6)應用於電子游戲
MPEG-4可以進行自然圖像與聲音同人工合成的圖像與聲音的混合編碼,在編碼方式上具有前所未有的靈活性,並且能及時從各種來源的多媒體資料庫中調用素材。這可以在將來產生象電影一樣的電子游戲,實現極高自由度的互動式操作。
(三)H.264
H.264是ITU-T的VCEG(視頻編碼專家組)和ISO/IEC的MPEG(活動圖像編碼專家組)的聯合視頻組(JVT:joint video team)開發的一個新的數字視頻編碼標准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。1998年1月份開始草案徵集,1999年9月,完成第一個草案,2001年5月制定了其測試模式TML-8,2002年6月的 JVT第5次會議通過了H.264的FCD板。2003年3月正式發布。
H.264和以前的標准一樣,也是DPCM加變換編碼的混合編碼模式。但它採用回歸基本的簡潔設計,不用眾多的選項,獲得比H.263++好得多的壓縮性能;加強了對各種信道的適應能力,採用網路友好的結構和語法,有利於對誤碼和丟包的處理;應用目標范圍較寬,以滿足不同速率、不同解析度以及不同傳輸(存儲)場合的需求;它的基本系統是開放的,使用無需版權。
在技術上,H.264標准中有多個閃光之處,如統一的VLC符號編碼,高精度、多模式的位移估計,基於4×4塊的整數變換、分層的編碼語法等。這些措施使得H.264演算法具有很的高編碼效率,在相同的重建圖像質量下,能夠比H.263節約50%左右的碼率。H.264的碼流結構網路適應性強,增加了差錯恢復能力,能夠很好地適應IP和無線網路的應用。 H.264的演算法在概念上可以分為兩層:視頻編碼層(VCL:Video Coding Layer)負責高效的視頻內容表示,網路提取層(NAL:Network Abstraction Layer)負責以網路所要求的恰當的方式對數據進行打包和傳送。在VCL和NAL之間定義了一個基於分組方式的介面,打包和相應的信令屬於NAL的一部分。這樣,高編碼效率和網路友好性的任務分別由VCL和NAL來完成。
VCL層包括基於塊的運動補償混合編碼和一些新特性。與前面的視頻編碼標准一樣,H.264沒有把前處理和後處理等功能包括在草案中,這樣可以增加標準的靈活性。
NAL負責使用下層網路的分段格式來封裝數據,包括組幀、邏輯信道的信令、定時信息的利用或序列結束信號等。例如,NAL支持視頻在電路交換信道上的傳輸格式,支持視頻在Internet上利用RTP/UDP/IP傳輸的格式。NAL包括自己的頭部信息、段結構信息和實際載荷信息,即上層的VCL數據。(如果採用數據分割技術,數據可能由幾個部分組成)。 H.264支持1/4或1/8像素精度的運動矢量。在1/4像素精度時可使用6抽頭濾波器來減少高頻雜訊,對於1/8像素精度的運動矢量,可使用更為復雜的8抽頭的濾波器。在進行運動估計時,編碼器還可選擇增強內插濾波器來提高預測的效果。
在H.264的運動預測中,一個宏塊(MB)可以按圖2被分為不同的子塊,形成7種不同模式的塊尺寸。這種多模式的靈活和細致的劃分,更切合圖像中實際運動物體的形狀,大大提高了運動估計的精確程度。在這種方式下,在每個宏塊中可以包含有1、2、4、8或16個運動矢量。
在H.264中,允許編碼器使用多於一幀的先前幀用於運動估計,這就是所謂的多幀參考技術。例如2幀或3幀剛剛編碼好的參考幀,編碼器將選擇對每個目標宏塊能給出更好的預測幀,並為每一宏塊指示是哪一幀被用於預測。 H.264與先前的標准相似,對殘差採用基於塊的變換編碼,但變換是整數操作而不是實數運算,其過程和DCT基本相似。這種方法的優點在於:在編碼器中和解碼器中允許精度相同的變換和反變換,便於使用簡單的定點運算方式。也就是說,這里沒有反變換誤差。 變換的單位是4×4塊,而不是以往常用的8×8塊。由於用於變換塊的尺寸縮小,運動物體的劃分更精確,這樣,不但變換計算量比較小,而且在運動物體邊緣處的銜接誤差也大為減小。為了使小尺寸塊的變換方式對圖像中較大面積的平滑區域不產生塊之間的灰度差異,可對幀內宏塊亮度數據的16個4×4塊的DC系數(每個小塊一個,共16個)進行第二次4×4塊的變換,對色度數據的4個4×4塊的DC系數(每個小塊一個,共4個)進行2×2塊的變換。
H.264為了提高碼率控制的能力,量化步長的變化的幅度控制在12.5%左右,而不是以不變的增幅變化。變換系數幅度的歸一化被放在反量化過程中處理以減少計算的復雜性。為了強調彩色的逼真性,對色度系數採用了較小量化步長。 在先前的H.26x系列和MPEG-x系列標准中,都是採用的幀間預測的方式。在H.264中,當編碼Intra圖像時可用幀內預測。對於每個4×4塊(除了邊緣塊特別處置以外),每個像素都可用17個最接近的先前已編碼的像素的不同加權和(有的權值可為0)來預測,即此像素所在塊的左上角的17個像素。顯然,這種幀內預測不是在時間上,而是在空間域上進行的預測編碼演算法,可以除去相鄰塊之間的空間冗餘度,取得更為有效的壓縮。
如圖4所示,4×4方塊中a、b、...、p為16 個待預測的像素點,而A、B、...、P是已編碼的像素。如m點的值可以由(J+2K+L+2)/ 4 式來預測,也可以由(A+B+C+D+I+J+K+L)/ 8 式來預測,等等。按照所選取的預測參考的點不同,亮度共有9類不同的模式,但色度的幀內預測只有4類模式。 H.264 草案中包含了用於差錯消除的工具,便於壓縮視頻在誤碼、丟包多發環境中傳輸,如移動信道或IP信道中傳輸的健壯性。
為了抵禦傳輸差錯,H.264視頻流中的時間同步可以通過採用幀內圖像刷新來完成,空間同步由條結構編碼(slice structured coding)來支持。同時為了便於誤碼以後的再同步,在一幅圖像的視頻數據中還提供了一定的重同步點。另外,幀內宏塊刷新和多參考宏塊允許編碼器在決定宏塊模式的時候不僅可以考慮編碼效率,還可以考慮傳輸信道的特性。
除了利用量化步長的改變來適應信道碼率外,在H.264中,還常利用數據分割的方法來應對信道碼率的變化。從總體上說,數據分割的概念就是在編碼器中生成具有不同優先順序的視頻數據以支持網路中的服務質量QoS。例如採用基於語法的數據分割(syntax-based data partitioning)方法,將每幀數據的按其重要性分為幾部分,這樣允許在緩沖區溢出時丟棄不太重要的信息。還可以採用類似的時間數據分割(temporal data partitioning)方法,通過在P幀和B幀中使用多個參考幀來完成。
在無線通信的應用中,我們可以通過改變每一幀的量化精度或空間/時間解析度來支持無線信道的大比特率變化。可是,在多播的情況下,要求編碼器對變化的各種比特率進行響應是不可能的。因此,不同於MPEG-4中採用的精細分級編碼FGS(Fine Granular Scalability)的方法(效率比較低),H.264採用流切換的SP幀來代替分級編碼。
四、H.264的性能比較
TML-8為H.264的測試模式,用它來對H.264的視頻編碼效率進行比較和測試。測試結果所提供的PSNR已清楚地表明,相對於MPEG-4(ASP:Advanced Simple Profile)和H.263++(HLP:High Latency Profile)的性能,H.264的結果具有明顯的優越性。
H.264的PSNR比MPEG-4(ASP)和H.263++(HLP)明顯要好,在6種速率的對比測試中,H.264的PSNR比MPEG-4(ASP)平均要高2dB,比H.263(HLP)平均要高3dB。6個測試速率及其相關的條件分別為:32 kbit/s速率、10f/s幀率和QCIF格式;64 kbit/s速率、15f/s幀率和QCIF格式;128kbit/s速率、15f/s幀率和CIF格式;256kbit/s速率、15f/s幀率和QCIF格式;512 kbit/s速率、30f/s幀率和CIF格式;1024 kbit/s速率、30f/s幀率和CIF格式。
6. 調制 解調 編碼 解碼的關系與區別
調變
是一種將訊號注入載波,以此訊號對載波加以調制的技術,以便將原始訊號轉變成適合傳送的電波訊號,
常用於無線電波的廣播與通訊、利用電話線的數據通訊等各方面。
依調變訊號的不同,可區分為數位調變及類比調變,這些不同的調變,是以不同的方法,將訊號和載波合成的技術。調制的逆過程叫做解調,用以解出原始的訊號。
編碼是根據一定的協議或格式把模擬信息轉換成比特流的過程。
在計算機硬體中,編碼(coding)是在一個主題或單元上為數據存儲,管理和分析的目的而轉換信息為編碼值(典型地如數字)的過程。在軟體中,編碼意味著邏輯地使用一個特定的語言如C或C++來執行一個程序。在密碼學中,編碼是指在編碼或密碼中寫的行為。
將數據轉換為代碼或編碼字元,並能譯為原數據形式。是計算機書寫指令的過程,程序設計中的一部分。在地圖自動制圖中,按一定規則用數字與字母表示地圖內容的過程,通過編碼,使計算機能識別地圖的各地理要素。
n位二進制數可以組合成2的n次方個不同的信息,給每個信息規定一個具體碼組,這種過程也叫編碼。
數字系統中常用的編碼有兩類,一類是二進制編碼,另一類是二—十進制編碼。
解碼
就是編碼的逆過程。