衡量壓縮編碼
❶ 數據壓縮
數據壓縮技術主要研究數據的表示、傳輸和轉換方法,目的是減少數據所佔據的存儲空間和縮短數據傳輸時所需要的時間。
衡量數據壓縮的3個主要指標:一是壓縮前後所需的信息存儲量之比要大;二是實現壓縮的演算法要簡單,壓縮、解壓縮速度快,要盡可能做到實時壓縮和解壓縮;三是恢復效果要好,要盡可能完全恢復原始數據。
數據壓縮主要應用於兩個方面。一是傳輸:通過壓縮發送端的原始數據,並在接收端進行解壓恢復,可以有效地減少傳輸時間和增加信道帶寬。二是存儲:在存儲時壓縮原始數據,在使用時進行解壓,可大大提高存儲介質的存儲量。
數據壓縮按照壓縮的失真度分成兩種類型:一種叫作無損壓縮,另一種叫作有損壓縮。
無損壓縮是指使用壓縮後的數據進行重構(或者叫作還原、解壓縮),重構後的數據與原來的數據完全相同;無損壓縮用於要求重構的信號與原始信號完全一致的場合。一個很常見的例子是磁碟文件的壓縮。根據目前的技術水平,無損壓縮演算法一般可以把普通文件的數據壓縮到原來的1/4~1/2。一些常用的無損壓縮演算法有霍夫曼(Huffman)演算法、算術演算法、遊程演算法和LZW(Lenpel-Ziv & Welch)壓縮演算法。
1)霍夫曼演算法屬於統計式壓縮方法,其原理是根據原始數據符號發生的概率進行編碼。在原始數據中出現概率越高的符合,相應的碼長越短,出現概率越少的符合,其碼長越長。從而達到用盡可能少的符號來表示原始數據,實現對數據的壓縮。
2)算術演算法是基於統計原理,無損壓縮效率最高的演算法。即將整段要壓縮的數據映射到一段實數半封閉的范圍[0,1)內的某一區段。該區段的范圍或寬度等於該段信息概率。即是所有使用在該信息內的符號出現概率全部相乘後的概率值。當要被編碼的信息越來越長時,用來代表該信息的區段就會越來越窄,用來表示這個區段的位就會增加。
3)遊程演算法是針對一些文本數據特點所設計的壓縮方法。主要是去除文本中的冗餘字元或位元組中的冗餘位,從而達到減少數據文件所佔的存儲空間。壓縮處理流程類似於空白壓縮,區別是在壓縮指示字元之後加上一個字元,用於表明壓縮對象,隨後是該字元的重復次數。本演算法具有局限性,很少單獨使用,多與其他演算法配合使用。
4)LZW演算法的原理是用字典詞條的編碼代替在壓縮數據中的字元串。因此字典中的詞條越多,壓縮率越高,加大字典的容量可以提高壓縮率。字典的容量受計算機的內存限制。
有損壓縮是指使用壓縮後的數據進行重構,重構後的數據與原來的數據有所不同,但不影響人對原始資料表達的信息造成誤解。有損壓縮適用於重構信號不一定非要和原始信號完全相同的場合。例如,圖像和聲音的壓縮就可以採用有損壓縮,因為其中包含的數據往往多於我們的視覺系統和聽覺系統所能接收的信息,丟掉一些數據而不至於對聲音或者圖像所表達的意思產生誤解,但可大大提高壓縮比。
❷ 語音編碼的語音信號壓縮編碼的評價系統
語音質量是衡量語音編碼演算法優劣的關鍵性能之一。語音質量通常分為四類:
(1)廣播級:寬頻(0-7000Hz)高質量的語音,感覺不出雜訊存在
(2)網路或電話級:200Hz-3200Hz,信噪比大於30db。
(3)通信級:完全可以聽懂,但和長途電話相比,有明顯失真。
(4)合成級:80%-90%可懂度,音質較差,聽起來像機器講話,失去了講話者的個人特徵。
語音質量有主觀和客觀兩種評價方法 評價指標:清晰度或可懂度、音質。前者是指語音是否容易聽清楚;後者指語音聽起來有多自然。
(1)可懂度評價DRT:DiagnosticRhymerTest
(2)音質評價:
MOS:MeanOpinionScore平均意見得分
DAM:判斷滿意度得分。
MOS得分為五級:優、良、可、差和壞。滿分為5分,相當調頻廣播質量;4分以上是長途電話網標准;3.5分為通信標准;3.0分仍有較好的可懂度,保持自然度;2.5分只維持可懂度,是戰術通信標准。 (1)波形失真度,用信噪比來度量
(2)頻譜失真測量
(3)譜包絡失真測量
❸ 圖像壓縮技術的優劣的三個指標
壓縮比:壓縮比是指壓縮過程中輸入數據量和輸出數據量之比
峰值信噪比:峰值信噪比用來衡量與原始圖像相比較的重建圖像的質量
時間復雜度:時間復雜度是指圖像壓縮演算法編解碼的速度
❹ 從那些方面衡量音頻壓縮編碼的好壞
采樣,碼率。
❺ 求解:多媒體技術------單選,簡答,論述。><!!!
1:c 2:c 3:c 4:c 5:a 6:B 7: A 8: A 9:C 10:D 11:C 12:C 13D 14:C 15:D
僅供參考
❻ 數字圖像壓縮編碼有什麼最新的演算法或改進的演算法
以下是幾種格式的專業解釋:
HDTV
一,HDTV的概念
要解釋HDTV,我們首先要了解DTV。DTV是一種數字電視技術,是目前傳統模擬電視技術的接班人。所謂的數字電視,是指從演播室到發射、傳輸、接收過程中的所有環節都是使用數字電視信號,或對該系統所有的信號傳播都是通過由二進制數字所構成的數字流來 完成的。數字信號的傳播速率為每秒19.39兆位元組,如此大的數據流傳輸速度保證了數字電視的高清晰度,克服了模擬電視的先天不足。同時,由於數字電視可以允許幾種制式信號的同時存在,因此每個數字頻道下又可分為若干個子頻道,能夠滿足以後頻道不斷增多的 需求。HDTV是DTV標准中最高的一種,即High Definision TV,故而稱為HDTV。
二,HDTV中要求音、視頻信號達到哪些標准?
HDTV規定了視頻必須至少具備720線非交錯式(720p,即常說的逐行)或1080線交錯式隔行(1080i,即常說的隔行)掃描(DVD標准為 480線),屏幕縱橫比為16:9。音頻輸出為5.1聲道(杜比數字格式),同時能兼容接收其它較低格式的 信號並進行數字化處理重放。
HDTV有三種顯示格式,分別是:720P(1280×720P,非交錯式),1080 i(1920×1080i,交錯式),1080P(1920×1080i,非交錯式),其中網路上流傳的以720P和1080 i最為常見,而在微軟WMV-HD站點上1080P的樣片相對較多。
三,如何收看HDTV節目?
目前有兩種方式可欣賞到HDTV節目。一種是在電視上實時收看HDTV,需要滿足兩個條件,首先是電視可接收到HDTV信號,這需要額外添加相關的硬體,其次是電視符合HDTV標准,主要是指電視的解析度和接收埠而言。
另一種是在電腦上通過軟體播放。目前我國只有極少部分地區可接收到HDTV數字信號,而且HDTV電視的價格仍高高在上,不是普通消費者所能承受的。因此,在網路中找尋HDTC源,下載後在個人電腦上播放,成了大多數HDTV迷們的一個嘗鮮方法。
四,哪些是可用於電腦播放的HDTV文件?
網路中流傳的HDTV主要以兩類文件的方式存在,一類是經過MPEG-2標准壓縮,以.tp和.ts為後綴的視頻流文件,一類是經過WMV-HD (Windows Media Video High Definition)標准壓縮過的.wmv文件,還有少數文件後綴為.avi或.mpg,其性質與.wmv是完全一樣的。
HDTV文件都比較大,即使是經過重新編碼過後的.wmv文件也非同小可。以一部普通電影的時間長度來計算,.wmv文件將會有4G以上,而同樣時間長度的.tp和.ts文件能達到8G以上,有的甚至達到20多G。因此,除了通過文件後綴名,還可以通過文 件大小來判斷是否為HDTV文件。
五,如何在個人電腦上播放HDTV節目?
對於.wmv文件,只要系統安裝了Windows Media Player 9 或更高版本,就可以正常播放,一些播放軟體的最新版本已經開始支持WMV-HD,如WINDVD6等,也可以直接使用這些軟體播放HDTV。有些HDTV文件在壓縮過程中採用了其它標準的編碼格式,就需要安裝對應的解碼器,遇到Windows Media Player 9不能正常播放時,可以再安裝ffdshow,它帶有各種最常用的解碼器。
播放以.tp和.ts為後綴的視頻流文件要稍微麻煩一點,因為文件中分別包含有AC3音頻信息和MPEG-2視頻信息。好在現下有已經不少專門播放.tp 和.ts文件的軟體問世了,Moonlight-Elecard MPEG Player 就是其中一款比較常見的支持HDTV播放的軟體,目前最新的版本為2.x。安裝完後,也可以運行其它播放軟體來調用Moonlight- Elecard MPEG Player的解碼器進行播放。
六,如何鑒別HDTV的顯示格式?
目前我們無法僅從文件名稱、大小上來判定一個HDTV文件的顯示格式是720P還是1080i,或是1080P,但是有不少軟體可以在播放時顯示影片的圖像信息,如WINDVD、zplay等,在軟體的控制面板中選擇對應的選項就可以看到詳細的信息。
七,為什麼我只能看到圖像,卻聽不到聲音?
這是因為未安裝AC3音頻解碼器,導致HDTV文件中的音頻信息不能被正確識別的原因。解決的方法是下載並安裝對應的音頻解碼器,常用的有 AC3Filter,這些音、視頻解碼器只需安裝一次即可,播放HDTV文件時系統會自動調用,而不必每次播 放的時候都打開其控制界面。
八,為什麼我播放HDTV時會出現丟幀現象?
在家用電腦上播放HDTV,對其硬體配置要求較高,主要是與CPU、顯存、內存緊緊相關,如果這三樣中有一樣性能過低,就會產生一些播放問題。播放 HDTV時會出現丟幀現象是顯存容量不夠造成的,尤其是在播放1080 i格式HDTV的時候,1920×1080的像素量,需要足夠大的顯存才能滿足其數據吞吐,因此顯存至少需要64M以上,建議128M。由於是2D顯示,所以對顯卡核心的運算能力要求反而不是很高。
九,為什麼我播放HDTV時會經常出現畫面和語音停頓的現象?
一些採用了WMV-HD重新編碼的HDTV文件,因為有著較高的壓縮率,在播放時就需要非常高的CPU運算能力來進行實時解碼,一般來說P4 2.0G/AMD 2000 以上及同級別的CPU可達到這個要求。同時,由於HDTV的數據流較大,需要足夠的內存來支持,推薦在256M以上。如果你的電腦滿足不了這樣的配置,就可能會在播放過程中產生畫面與語音不同步、畫面經常停頓、爆音等現象。嚴重的話甚至無法順利觀看。如果 這種現象不太嚴重,則可以通過優化系統和一些小技巧來改善。
十,如何優化系統以保證順利地播放HDTV?
除非你的電腦硬體配置的確很強,否則就很可能需要對系統進行一些優化,以便可以順利地播放HDTV。首先是在播放HDTV前關閉所有沒有用的後台程序或進程,盡量增加系統的空閑資源為播放HDTV服務;其次是選擇一款佔用系統資源較低的軟體來播放HDTV 。Windows Media Player、WINDVD等軟體佔用系統資源較多,在硬體配置本就不高的系統上會影響HDTV的播放效果,這時可以選擇使用BSPlayer。 BSPlayer是一款免費軟體,最大的特點就是佔用系統資源很小,尤其在播放HDTV文件時,與其它幾個資源佔用大戶相比效果更為明顯。另外,運行播放軟體後立即打開任務管理器(僅在Windows 2000/XP中有效),將播放軟體的進程級別設置為最高,這樣也可以為HDTV的播放調用更多的系統資源。除此之外,安裝更高版本的 DirectX,也能更好地支持HDTV的播放。
十一,還有什麼其它的技巧?
如果你的PC可以流利地播放HDTV,那麼你唯一會感到遺憾的,可能就是抱怨顯示器太小和音箱太不夠勁了。音箱的問題沒有好的方法可以解決,必竟PC音箱和家庭影院的音箱兩者是不可同比的,然而我們可以通過調高顯示器的解析度來提高畫面的清晰度和細節感。 現在主流的顯示器為17寸純平CRT(因為改變標准解析度只會給LCD帶來負面影響,因此這種方法只針對普通的CRT顯示器),中低檔的17寸顯示器很難達到1600×1200以上的解析度,即使達到了其水平掃描率也在60Hz以下,但是請不要忘了,電視 信號的水平掃描率也就是在這個水平上。720P的水平掃描率為60Hz,1080i則有50Hz和60Hz兩種,分別為我國和美國地區的標准。也就是說,即使你在顯示器水平掃描率為60Hz的狀態下全屏觀看HDTV或DVD等其它視頻,你是感覺不到晃眼的 ,這主要是由於人眼對於動態和靜態物體的感應不同造成的。因此你可以在觀看HDTV的時候,放心地將顯示器水平掃描率設為60Hz,進而將解析度調高,平時使用再調回標准解析度即可。
存放HDTV文件的硬碟分區必須轉換為NTFS格式,因為一部HDTV電影通常是幾個4.3GB的視頻文件組成(為了方便刻錄在DVD上面),而FAT32是無法管理2GB以上的文件的,因此務必轉換分區格式。
H.264
JVT(Joint Video Team,視頻聯合工作組)於2001年12月在泰國Pattaya成立。它由ITU-T和ISO兩個國際標准化組織的有關視頻編碼的專家聯合組成。JVT的工作目標是制定一個新的視頻編碼標准,以實現視頻的高壓縮比、高圖像質量、良好的網路適應性等目標。目前JVT的工作已被ITU-T接納,新的視頻壓縮編碼標准稱為H.264標准,該標准也被ISO接納,稱為AVC(Advanced Video Coding)標准,是MPEG-4的第10部分。
H.264標准可分為三檔:
基本檔次(其簡單版本,應用面廣);
主要檔次(採用了多項提高圖像質量和增加壓縮比的技術措施,可用於SDTV、HDTV和DVD等);
擴展檔次(可用於各種網路的視頻流傳輸)。
H.264不僅比H.263和MPEG-4節約了50%的碼率,而且對網路傳輸具有更好的支持功能。它引入了面向IP包的編碼機制,有利於網路中的分組傳輸,支持網路中視頻的流媒體傳輸。H.264具有較強的抗誤碼特性,可適應丟包率高、干擾嚴重的無線信道中的視頻傳輸。H.264支持不同網路資源下的分級編碼傳輸,從而獲得平穩的圖像質量。H.264能適應於不同網路中的視頻傳輸,網路親和性好。
H.261是最早出現的視頻編碼建議,目的是規范ISDN網上的會議電視和可視電話應用中的視頻編碼技術。它採用的演算法結合了可減少時間冗餘的幀間預測和可減少空間冗餘的DCT變換的混合編碼方法。和ISDN信道相匹配,其輸出碼率是p×64kbit/s。p取值較小時,只能傳清晰度不太高的圖像,適合於面對面的電視電話;p取值較大時(如 p>6),可以傳輸清晰度較好的會議電視圖像。H.263 建議的是低碼率圖像壓縮標准,在技術上是H.261的改進和擴充,支持碼率小於64kbit/s的應用。但實質上H.263以及後來的H.263 和H.263 已發展成支持全碼率應用的建議,從它支持眾多的圖像格式這一點就可看出,如Sub-QCIF、QCIF、CIF、4CIF甚至16CIF等格式。
MPEG-1標準的碼率為1.2Mbit/s左右,可提供30幀CIF(352×288)質量的圖像,是為CD-ROM光碟的視頻存儲和播放所制定的。MPEG-l標准視頻編碼部分的基本演算法與H.261/H.263相似,也採用運動補償的幀間預測、二維DCT、VLC遊程編碼等措施。此外還引入了幀內幀(I)、預測幀(P)、雙向預測幀(B)和直流幀(D)等概念,進一步提高了編碼效率。在MPEG-1的基礎上,MPEG-2標准在提高圖像解析度、兼容數字電視等方面做了一些改進,例如它的運動矢量的精度為半像素;在編碼運算中(如運動估計和DCT)區分「幀」和「場」;引入了編碼的可分級性技術,如空間可分級性、時間可分級性和信噪比可分級性等。近年推出的MPEG-4標准引入了基於視聽對象(AVO:Audio-Visual Object)的編碼,大大提高了視頻通信的交互能力和編碼效率。 MPEG-4中還採用了一些新的技術,如形狀編碼、自適應DCT、任意形狀視頻對象編碼等。但是MPEG-4的基本視頻編碼器還是屬於和H.263相似的一類混合編碼器。
總之,H.261建議是視頻編碼的經典之作,H.263是其發展,並將逐步在實際上取而代之,主要應用於通信方面,但H.263眾多的選項往往令使用者無所適從。MPEG系列標准從針對存儲媒體的應用發展到適應傳輸媒體的應用,其核心視頻編碼的基本框架是和H.261一致的,其中引人注目的MPEG-4的「基於對象的編碼」部分由於尚有技術障礙,目前還難以普遍應用。因此,在此基礎上發展起來的新的視頻編碼建議H.264克服了兩者的弱點,在混合編碼的框架下引入了新的編碼方式,提高了編碼效率,面向實際應用。同時,它是兩大國際標准化組織的共同制定的,其應用前景應是不言而喻的。
JVT的H.264
H.264是ITU-T的VCEG(視頻編碼專家組)和ISO/IEC的MPEG(活動圖像編碼專家組)的聯合視頻組(JVT:joint video team)開發的一個新的數字視頻編碼標准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。1998年1月份開始草案徵集,1999年9月,完成第一個草案,2001年5月制定了其測試模式TML-8,2002年6月的 JVT第5次會議通過了H.264的FCD板。2003年3月正式發布。
H.264和以前的標准一樣,也是DPCM加變換編碼的混合編碼模式。但它採用「回歸基本」的簡潔設計,不用眾多的選項,獲得比H.263 好得多的壓縮性能;加強了對各種信道的適應能力,採用「網路友好」的結構和語法,有利於對誤碼和丟包的處理;應用目標范圍較寬,以滿足不同速率、不同解析度以及不同傳輸(存儲)場合的需求;它的基本系統是開放的,使用無需版權。
在技術上,H.264標准中有多個閃光之處,如統一的VLC符號編碼,高精度、多模式的位移估計,基於4×4塊的整數變換、分層的編碼語法等。這些措施使得H.264演算法具有很的高編碼效率,在相同的重建圖像質量下,能夠比H.263節約50%左右的碼率。H.264的碼流結構網路適應性強,增加了差錯恢復能力,能夠很好地適應IP和無線網路的應用。
H.264的技術亮點
(1) 分層設計
H.264的演算法在概念上可以分為兩層:視頻編碼層(VCL:Video Coding Layer)負責高效的視頻內容表示,網路提取層(NAL:Network Abstraction Layer)負責以網路所要求的恰當的方式對數據進行打包和傳送。在VCL和NAL之間定義了一個基於分組方式的介面,打包和相應的信令屬於NAL的一部分。這樣,高編碼效率和網路友好性的任務分別由VCL和NAL來完成。
VCL層包括基於塊的運動補償混合編碼和一些新特性。與前面的視頻編碼標准一樣,H.264沒有把前處理和後處理等功能包括在草案中,這樣可以增加標準的靈活性。
NAL負責使用下層網路的分段格式來封裝數據,包括組幀、邏輯信道的信令、定時信息的利用或序列結束信號等。例如,NAL支持視頻在電路交換信道上的傳輸格式,支持視頻在Internet上利用RTP/UDP/IP傳輸的格式。NAL包括自己的頭部信息、段結構信息和實際載荷信息,即上層的VCL數據。(如果採用數據分割技術,數據可能由幾個部分組成)。
(2) 高精度、多模式運動估計
H.264支持1/4或1/8像素精度的運動矢量。在1/4像素精度時可使用6抽頭濾波器來減少高頻雜訊,對於1/8像素精度的運動矢量,可使用更為復雜的8抽頭的濾波器。在進行運動估計時,編碼器還可選擇「增強」內插濾波器來提高預測的效果。
在H.264的運動預測中,一個宏塊(MB)可以按圖2被分為不同的子塊,形成7種不同模式的塊尺寸。這種多模式的靈活和細致的劃分,更切合圖像中實際運動物體的形狀,大大提高了運動估計的精確程度。在這種方式下,在每個宏塊中可以包含有1、2、4、8或16個運動矢量。
在H.264中,允許編碼器使用多於一幀的先前幀用於運動估計,這就是所謂的多幀參考技術。例如2幀或3幀剛剛編碼好的參考幀,編碼器將選擇對每個目標宏塊能給出更好的預測幀,並為每一宏塊指示是哪一幀被用於預測。
(3) 4×4塊的整數變換
H.264與先前的標准相似,對殘差採用基於塊的變換編碼,但變換是整數操作而不是實數運算,其過程和DCT基本相似。這種方法的優點在於:在編碼器中和解碼器中允許精度相同的變換和反變換,便於使用簡單的定點運算方式。也就是說,這里沒有「反變換誤差」。變換的單位是4×4塊,而不是以往常用的8×8塊。由於用於變換塊的尺寸縮小,運動物體的劃分更精確,這樣,不但變換計算量比較小,而且在運動物體邊緣處的銜接誤差也大為減小。為了使小尺寸塊的變換方式對圖像中較大面積的平滑區域不產生塊之間的灰度差異,可對幀內宏塊亮度數據的16個4×4塊的DC系數(每個小塊一個,共16個)進行第二次4×4塊的變換,對色度數據的4個4×4塊的DC系數(每個小塊一個,共4個)進行2×2塊的變換。
H.264為了提高碼率控制的能力,量化步長的變化的幅度控制在12.5%左右,而不是以不變的增幅變化。變換系數幅度的歸一化被放在反量化過程中處理以減少計算的復雜性。為了強調彩色的逼真性,對色度系數採用了較小量化步長。
(4) 統一的VLC
H.264中熵編碼有兩種方法,一種是對所有的待編碼的符號採用統一的VLC(UVLC :Universal VLC),另一種是採用內容自適應的二進制算術編碼(CABAC:Context-Adaptive Binary Arithmetic Coding)。CABAC是可選項,其編碼性能比UVLC稍好,但計算復雜度也高。UVLC使用一個長度無限的碼字集,設計結構非常有規則,用相同的碼表可以對不同的對象進行編碼。這種方法很容易產生一個碼字,而解碼器也很容易地識別碼字的前綴,UVLC在發生比特錯誤時能快速獲得重同步。
圖3顯示了碼字的語法。這里,x0,x1,x2,…是INFO比特,並且為0或1。圖4列出了前9種碼字。如:第4號碼字包含INFO01,這一碼字的設計是為快速再同步而經過優化的,以防止誤碼。
(5) 幀內預測
在先前的H.26x系列和MPEG-x系列標准中,都是採用的幀間預測的方式。在H.264中,當編碼Intra圖像時可用幀內預測。對於每個4×4塊(除了邊緣塊特別處置以外),每個像素都可用17個最接近的先前已編碼的像素的不同加權和(有的權值可為0)來預測,即此像素所在塊的左上角的17個像素。顯然,這種幀內預測不是在時間上,而是在空間域上進行的預測編碼演算法,可以除去相鄰塊之間的空間冗餘度,取得更為有效的壓縮。
如圖4所示,4×4方塊中a、b、...、p為16 個待預測的像素點,而A、B、...、P是已編碼的像素。如m點的值可以由(J+2K+L+2)/ 4 式來預測,也可以由(A B C D I J K L)/ 8 式來預測,等等。按照所選取的預測參考的點不同,亮度共有9類不同的模式,但色度的幀內預測只有1類模式。
(6) 面向IP和無線環境
H.264 草案中包含了用於差錯消除的工具,便於壓縮視頻在誤碼、丟包多發環境中傳輸,如移動信道或IP信道中傳輸的健壯性。
為了抵禦傳輸差錯,H.264視頻流中的時間同步可以通過採用幀內圖像刷新來完成,空間同步由條結構編碼(slice structured coding)來支持。同時為了便於誤碼以後的再同步,在一幅圖像的視頻數據中還提供了一定的重同步點。另外,幀內宏塊刷新和多參考宏塊允許編碼器在決定宏塊模式的時候不僅可以考慮編碼效率,還可以考慮傳輸信道的特性。
除了利用量化步長的改變來適應信道碼率外,在H.264中,還常利用數據分割的方法來應對信道碼率的變化。從總體上說,數據分割的概念就是在編碼器中生成具有不同優先順序的視頻數據以支持網路中的服務質量QoS。例如採用基於語法的數據分割(syntax-based data partitioning)方法,將每幀數據的按其重要性分為幾部分,這樣允許在緩沖區溢出時丟棄不太重要的信息。還可以採用類似的時間數據分割(temporal data partitioning)方法,通過在P幀和B幀中使用多個參考幀來完成。
在無線通信的應用中,我們可以通過改變每一幀的量化精度或空間/時間解析度來支持無線信道的大比特率變化。可是,在多播的情況下,要求編碼器對變化的各種比特率進行響應是不可能的。因此,不同於MPEG-4中採用的精細分級編碼FGS(Fine Granular Scalability)的方法(效率比較低),H.264採用流切換的SP幀來代替分級編碼。
H.264的性能測試
TML-8為H.264的測試模式,用它來對H.264的視頻編碼效率進行比較和測試。測試結果所提供的PSNR已清楚地表明,相對於MPEG-4(ASP:Advanced Simple Profile)和H.263 (HLP:High Latency Profile)的性能,H.264的結果具有明顯的優越性,如圖5所示。
H.264的PSNR比MPEG-4(ASP)和H.263 (HLP)明顯要好,在6種速率的對比測試中,H.264的PSNR比MPEG-4(ASP)平均要高2dB,比H.263(HLP)平均要高3dB。6個測試速率及其相關的條件分別為:32 kbit/s速率、10f/s幀率和QCIF格式;64 kbit/s速率、15f/s幀率和QCIF格式;128kbit/s速率、15f/s幀率和CIF格式;256kbit/s速率、15f/s幀率和QCIF格式;512 kbit/s速率、30f/s幀率和CIF格式;1024 kbit/s速率、30f/s幀率和CIF格式。
實現難度
對每個考慮實際應用的工程師而言,在關注H.264的優越性能的同時必然會衡量其實現難度。從總體上說,H.264性能的改進是以增加復雜性為代價而獲得的。目前全球也只有中國杭州海康威視數字技術有限公司在安防領域實現了H.264的實際應用,這一次我們走到了世界的前端!
1080p
1080P是標准層面上的HDTV或者硬體層面上FULL HD的最高標准之一,而FULL HD就是能夠完全顯示1920*1080像素或者說物理解析度達到1920*1080的平板電視機。需要注意的是,FULL HD和先前很多廠家宣傳的1080P並不是同樣的概念。
但是我們走進賣場會發現大多數品牌商家都打著1080P的旗幟對外宣傳,多少對我們的選購產生了阻礙.其實目前市場中的大多數平板電視都不是FULL HD,所謂的1080P只是支持1080P信號的接收並通過計算演變在屏幕上顯示,大多數大屏幕平板電視都為1366*768,等離子中的部分產品更低,要達到FULL HD的概念,就必須屏幕達到1920*1080的物理解析度以及至少30Hz的刷新率.
WAF
We Are Family 的簡稱 [我們是一家人]
WAF是韓國的一個影視製作小組,他們製作的DVDRIP是目前網上除了HDTV之外質量最好的,清晰度和音質都是上乘之作。
WAF的作品有以下特點:
1:嚴格控制每CD的容量,每CD的容量大小一般不超過0.05M(大家見過不少CD1是702M,CD2卻是698M的現象吧)。
2:經過控制的容量,利於刻盤,(有些小組製作的容量經常可以超過702M,一CD盤的容量,這時候超刻技術就受重視了^_^)
3:分割片子時注意場景轉換,極少造成一段場景有分裂感(例如4CD的《特洛伊》和4CD的《黑鷹》)。
4:每個片子壓制的尺寸都以OAR為准,即導演原始版。
5:尺寸統一,幾乎都是800線。(例:WAF20CD DTS版BOB,800*448,見過15CD的HDTVRIP版,居然有兩種尺寸!)我不清楚,一部大片為什麼大家會忍受得了解析度為640甚至以下的版本?
6:有極強的負責任的製作態度,發現有瑕疵的一般都會推出修復版.
7:喜歡WAF的DTS和AC3音頻和高碼率壓縮的視頻.
8:WAF每部片分割成的CD數一般都比別的小組製作的要多,這是為了保證必要的畫質和音質的質量。試想想有個加長版《角鬥士》使用DTS音軌,卻只分割成2CD,每CD有70多分鍾長,不知這樣壓縮出來的片子畫質能好到什麼程度?
所以說,WAF小組出品的DVDRip一般都是網上最清晰的版本。
問題補充:
普通家用電視的解析度是多少?是不是屏幕越大解析度越高?
電視的NTSC標准為720x480 刷新率為60Hz , PAL為720x576,刷新率為50Hz。 我國電視廣播採用 PAL制。
逐行電視接收隔行信號經過差補後可以達到逐行輸出,同時75Hz刷新率 ,或者隔行輸出,同時100Hz刷新率。
雖然PAL制可達576線,但普通電視的實際可分辨水平線數只有300~500。高清電視理論上可達720P 和1080i,就是說最多逐行720線。所以按理論來說,搞清電視用1024x768的VGA輸入也勉強可以表現出來了,但實際因為聚焦不準,文字顯示比能顯示1024x768的顯示器差很多,畫面顯示則沒什麼問題。
HDTV是不是沒有經過壓縮,最原始的視頻?
網路中流傳的HDTV主要以兩類文件的方式存在,一類是經過MPEG-2標准壓縮,以.tp和.ts為後綴的視頻流文件,一類是經過WMV-HD (Windows Media Video High Definition)標准壓縮過的.wmv文件,還有少數文件後綴為.avi或.mpg,其性質與.wmv是完全一樣的。
H.264等壓縮格式是不是為了方便網上傳播?
在技術上,H.264標准中有多個閃光之處,如統一的VLC符號編碼,高精度、多模式的位移估計,基於4塊的整數變換、分層的編碼語法等。這些措施使得H.264得演算法具有很高的編碼效率,在相同的重建圖像質量下,能夠比H.263節約50%左右的碼率。H.264的碼流結構網路適應性強,增加了差錯恢復能力,能夠很好地適應IP和無線網路的應用。
H.264能以較低的數據速率傳送基於聯網協議(IP)的視頻流,在視頻質量、壓縮效率和數據包恢復丟失等方面,超越了現有的MPEG-2、MPEG-4和H.26x視頻通訊標准,更適合窄帶傳輸。
網上流傳的Rip格式是什麼意思?DVDRip
DVDRip理解:其實就是一種DVD的備份技術。
DVD我們都知道,目前非常優秀的媒體格式,MPEG2編碼的視頻;AC3、DTS的音軌。但是我們也知道DVD載體是DVD光碟,D5一張就有4.7G。顯然,直接將DVD文件進行網路傳送毫無實際價值可言,將這樣的文件打包傳到伺服器上只會佔用伺服器的硬碟和大量的網路帶寬。還沒有多少人的網路帶寬可以讓他毫不動容地去下載一個7、8GB的文件只為了看兩個小時電影,更不要說將它們保存下來,DVD刻錄機這樣的產品目前也不是一般人能擁有的。
這就需要rip了,將DVD的視頻、音頻、字幕剝離出來,再經過壓縮或者其他處理,然後重新合成成多媒體文件。在更小的文件尺寸上達到DVD的是視聽享受。
❼ 衡量數據壓縮方法的指標有哪些
衡量數據壓縮方法的指標:壓縮比、速度、效果。
數據壓縮是指在不丟失信息的前提下,縮減數據量以減少存儲空間,提高其傳輸、存儲和處理效率的一種技術方法。或按照一定的演算法對數據進行重新組織,減少數據的冗餘和存儲的空間。數據壓縮包括有損壓縮和無損壓縮。
數據壓縮分為兩類,有三種分法:
1、即時壓縮和非即時壓縮
即時壓縮是將語音信號轉化為數字信號,同時進行壓縮,然後即時通過Internet傳送出去。即時壓縮一般應用在影像、聲音數據的傳送中。
非即時壓縮是在需要的情況下才進行,沒有即時性。非即時壓縮一般不需要專門的設備,直接在計算機中安裝並使用相應的壓縮軟體即可。
2、數字壓縮和文件壓縮
數字壓縮是專指一些具有時間性的數據,這些數據常常是即時採集、即時處理或傳輸的。
文件壓縮是專指對將要保存在磁碟等物理介質的數據進行壓縮,如一篇文章數據、一段音樂數據、一段程序編碼數據等的壓縮。
3、無損壓縮與有損壓縮
無損壓縮利用數據的統計冗餘進行壓縮,所以無損壓縮的壓縮比一般比較低。這類方法廣泛應用於文本數據、程序和特殊應用場合的圖像數據等需要精確存儲數據的壓縮。
有損壓縮方法利用了人類視覺、聽覺對圖像、聲音中的某些頻率成分不敏感的特性,允許壓縮的過程中損失一定的信息。有損壓縮廣泛應用於語音、圖像和視頻數據的壓縮。
拓展資料:數據壓縮的應用:
一種非常簡單的壓縮方法是行程長度編碼,這種方法使用數據及數據長度這樣簡單的編碼代替同樣的連續數據,這是無損數據壓縮的一個實例。這種方法經常用於辦公計算機以更好地利用磁碟空間、或者更好地利用計算機網路中的帶寬。對於電子表格、文本、可執行文件等這樣的符號數據來說,無損是一個非常關鍵的要求,因為除了一些有限的情況,大多數情況下即使是一個數據位的變化都是無法接受的。
對於視頻和音頻數據,只要不損失數據的重要部分一定程度的質量下降是可以接受的。通過利用人類感知系統的局限,能夠大幅度地節約存儲空間並且得到的結果質量與原始數據質量相比並沒有明顯的差別。這些有損數據壓縮方法通常需要在壓縮速度、壓縮數據大小以及質量損失這三者之間進行折中。
有損圖像壓縮用於數碼相機中,大幅度地提高了存儲能力,同時圖像質量幾乎沒有降低。用於DVD的有損MPEG-2編解碼視頻壓縮也實現了類似的功能。
在有損音頻壓縮中,心理聲學的方法用來去除信號中聽不見或者很難聽見的成分。人類語音的壓縮經常使用更加專業的技術,因此人們有時也將「語音壓縮」或者「語音編碼」作為一個獨立的研究領域與「音頻壓縮」區分開來。不同的音頻和語音壓縮標准都屬於音頻編解碼范疇。例如語音壓縮用於網際網路電話,而音頻壓縮被用於CD翻錄並且使用MP3播放器解碼。
理論壓縮的理論基礎是資訊理論(它與演算法資訊理論密切相關)以及率失真理論,這個領域的研究工作主要是由Claude Shannon奠定的,他在二十世紀四十年代末期及五十年代早期發表了這方面的基礎性的論文。Doyle和Carlson在2000年寫道數據壓縮「有所有的工程領域最簡單、最優美的設計理論之一」。密碼學與編碼理論也是密切相關的學科,數據壓縮的思想與統計推斷也有很深的淵源。
許多無損數據壓縮系統都可以看作是四步模型,有損數據壓縮系統通常包含更多的步驟,例如它包括預測、頻率變換以及量化。
❽ 多媒體數據壓縮算術研究 論文筆記
多媒體圖像壓縮技術
姓名:Vencent Lee
摘要:多媒體數據壓縮技術是現代網路發展的關鍵性技術之一。由於圖像和聲音信號中存在各種各樣的冗餘,為數據壓縮提供了可能。數據壓縮技術有無損壓和有損壓縮兩大類,這些壓縮技術又各有不同的標准。
一、多媒體數據壓縮技術
仙農(C.E.Shannon)在創立資訊理論時,提出把數據看作是信息和冗餘度的組合。早期的數據壓縮之所以成為資訊理論的一部分是因為它涉及冗餘度問題。而數據之所以能夠被壓縮是因為其中存在各種各樣的冗餘;其中有時間冗餘性、空間冗餘性、信息熵冗餘、先驗知識冗餘、其它冗餘等。時間冗餘是語音和序列圖像中常見的冗餘,運動圖像中前後兩幀間就存在很強的相關性,利用幀間運動補興就可以將圖像數據的速率大大壓縮。語音也是這樣。尤其是濁音段,在相當長的時間內(幾到幾十毫秒)語音信號都表現出很強的周期性,可以利用線性預測的方法得到較高的壓縮比。空間冗餘是用來表示圖像數據中存在的某種空間上的規則性,如大面積的均勻背景中就有很大的空間冗餘性。信息熵冗餘是指在信源的符號表示過程中由於未遵循資訊理論意義下最優編碼而造成的冗餘性,這種冗餘性可以通過熵編碼來進行壓縮,經常使用的如Huff-man編碼。先驗知識冗餘是指數據的理解與先驗知識有相當大的關系,如當收信方知道一個單詞的前幾個字母為administrato時,立刻就可以猜到最後一個字母為r,那麼在這種情況下,最後一個字母就不帶任何信息量了,這就是一種先驗知識冗餘。其它冗餘是指那些主觀無法感受到的信息等帶來的冗餘。
通常數據壓縮技術可分為無損壓縮(又叫冗餘壓縮)和有損壓縮(又叫熵壓縮)兩大類。無損壓縮就是把數據中的冗餘去掉或減少,但這些冗餘量是可以重新插入到數據中的,因而不會產生失真。該方法一般用於文本數據的壓縮,它可以保證完全地恢復原始數據;其缺點是壓縮比小(其壓縮比一般為2:1至5:1)。有損壓縮是對熵進行壓縮,因而存在一定程度的失真;它主要用於對聲音、圖像、動態視頻等數據進行壓縮,壓縮比較高(其壓縮比一般高達20:1以上。最新被稱為「E—igen—ID」的壓縮技術可將基因數據壓縮1.5億倍)。對於多媒體圖像採用的有損壓縮的標准有靜態圖像壓縮標准(JPEG標准,即『JointPhotographicExpertGroup』標准)和動態圖像壓縮標准(MPEG標准,即『MovingPictureExpertGroup』標准)。
JPEG利用了人眼的心理和生理特徵及其局限性來對彩色的、單色的和多灰度連續色調的、靜態圖像的、數字圖像的壓縮,因此它非常適合不太復雜的以及一般來源於真
實景物的圖像。它定義了兩種基本的壓縮演算法:一種是基於有失真的壓縮演算法,另一種是基於空間線性預測技術(DPCM)無失真的壓縮演算法。為了滿足各種需要,它制定了四種工作模式:無失真壓縮、基於DCT的順序工作方式、累進工作方式和分層工作方式。
MPEG用於活動影像的壓縮。MPEG標准具體包三部分內容:(1)MPEG視頻、(2)MPEG音頻、(3)MP系統(視頻和音頻的同步)。MPEG視頻是標準的核心分,它採用了幀內和幀間相結合的壓縮方法,以離散余變換(DCT)和運動補償兩項技術為基礎,在圖像質量基不變的情況下,MPEG可把圖像壓縮至1/100或更MPEG音頻壓縮演算法則是根據人耳屏蔽濾波功能。利用音響心理學的基本原理,即「某些頻率的音響在重放其頻率的音頻時聽不到」這樣一個特性,將那些人耳完全不到或基本上聽到的多餘音頻信號壓縮掉,最後使音頻號的壓縮比達到8:1或更高,音質逼真,與CD唱片可媲美。按照MPEG標准,MPEG數據流包含系統層和壓層數據。系統層含有定時信號,圖像和聲音的同步、多
分配等信息。壓縮層包含經壓縮後的實際的圖像和聲數據,該數據流將視頻、音頻信號復合及同步後,其數據輸率為1.5MB/s。其中壓縮圖像數據傳輸率為1.2M壓縮聲音傳輸率為0.2MB/s。
MPEG標準的發展經歷了MPEG—I,MPEG一2、MPEG一4、MPEG-7、MPEG一21等不同層次。在MPEG的不同標准中,每—個標准都是建立在前面的標准之上的,並與前面的標准向後的兼容。目前在圖像壓縮中,應用得較多的是MPEG一4標准,MPEG-是在MPEG-2基礎上作了很大的擴充,主要目標是多媒體應用。在MPEG一2標准中,我們的觀念是單幅圖像,而且包含了一幅圖像的全部元素。在MPEG一4標准下,我們的觀念變為多圖像元素,其中的每—個多圖像元素都是獨立編碼處理的。該標准包含了為接收器所用的指令,告訴接收器如何構成最終的圖像。
上圖既表示了MPEG一4解碼器的概念,又比較清楚地描繪了每個部件的用途。這里不是使用單一的視頻或音頻解碼器,而是使用若干個解碼器,其中的每一個解碼器只接收某個特定的圖像(或聲音)元素,並完成解碼操作。每個解碼緩沖器只接收屬於它自己的靈敏據流,並轉送給解碼器。復合存儲器完成圖像元素的存儲,並將它們送到顯示器的恰當位置。音頻的情況也是這樣,但顯然不同點是要求同時提供所有的元素。數據上的時間標記保證這些元素在時間上能正確同步。MPEG一4標准對自然元素(實物圖像)和合成元素進行區分和規定,計算機生成的動畫是合成元素的一個例子。比如,一幅完整的圖像可以包含一幅實際的背景圖,並在前面有一幅動畫或者有另外一幅自然圖像。這樣的每一幅圖像都可以作最佳壓縮,並互相獨立地傳送到接收器,接收器知道如何把這些元素組合在一起。在MPEG一2標准中,圖像被看作一個整體來壓縮;而在MPEG一4標准下,對圖像中的每一個元素進行優化壓縮。靜止的背景不必壓縮到以後的I幀之中去,否則會使帶寬的使用變得很緊張。而如果這個背景圖像靜止10秒鍾,就只要傳送一次(假設我們不必擔心有人在該時間內切人此頻道),需要不斷傳送的僅是前台的比較小的圖像元素。對有些節目類型,這樣做會節省大量的帶寬。MPEG一4標准對音頻的處理也是相同的。例如,有一位獨唱演員,伴隨有電子合成器,在MPEG一2標准下,我們必須先把獨唱和合成器作混合,然後再對合成的音頻信號進行壓縮與傳送。在MPEG一4標准下,我們可以對獨唱作單獨壓縮,然後再傳送樂器數字介面的聲軌信號,就可以使接收器重建伴音。當然,接收器必須能支持MIDI放音。與傳送合成的信號相比,分別傳送獨唱信號和MIDI數據要節省大量的帶寬。其它的節目類型同樣可以作類似的規定。MPEG一7標准又叫多媒體內容描述介面標准。圖像可以用色彩、紋理、形狀、運動等參數來描述,MPEG一7標準是依靠眾多的參數對圖像與聲音實現分類,並對它們的資料庫實現查詢。
二、多媒體數據壓縮技術的實現方法
目前多媒體壓縮技術的實現方法已有近百種,其中基於信源理論編碼的壓縮方法、離散餘弦變換(DCT)和小波分解技術壓縮演算法的研究更具有代表性。小波技術突破了傳統壓縮方法的局限性,引入了局部和全局相關去冗餘的新思想,具有較大的潛力,因此近幾年來吸引了眾多的研究者。在小波壓縮技術中,一幅圖像可以被分解為若干個叫做「小片」的區域;在每個小片中,圖像經濾波後被分解成若干個低頻與高頻分量。低頻分量可以用不同的解析度進行量化,即圖像的低頻部分需要許多的二進制位,以改善圖像重構時的信噪比。低頻元素採用精細量化,高頻分量可以量化得比較粗糙,因為你不太容易看到變化區域的雜訊與誤差。此外,碎片技術已經作為一種壓縮方法被提出,這種技術依靠實際圖形的重復特性。用碎片技術壓縮圖像時需要佔用大量的計算機資源,但可以獲得很好的結果。藉助於從DNA序列研究中發展出來的模式識別技術,能減少通過WAN鏈路的流量,最多時的壓縮比率能達到90%,從而為網路傳送圖像和聲音提供更大的壓縮比,減輕風絡負荷,更好地實現網路信息傳播。
三、壓縮原理
由於圖像數據之間存在著一定的冗餘,所以使得數據的壓縮成為可能。資訊理論的創始人Shannon提出把數據看作是信息和冗餘度(rendancy)的組合。所謂冗餘度,是由於一副圖像的各像素之間存在著很大的相關性,可利用一些編碼的方法刪去它們,從而達到減少冗餘壓縮數據的目的。為了去掉數據中的冗餘,常常要考慮信號源的統計特性,或建立信號源的統計模型。圖像的冗餘包括以下幾種:
(1) 空間冗餘:像素點之間的相關性。
(2) 時間冗餘:活動圖像的兩個連續幀之間的冗餘。
(3) 信息熵冗餘:單位信息量大於其熵。
(4) 結構冗餘:圖像的區域上存在非常強的紋理結構。
(5) 知識冗餘:有固定的結構,如人的頭像。
(6) 視覺冗餘:某些圖像的失真是人眼不易覺察的。
對數字圖像進行壓縮通常利用兩個基本原理:
(1) 數字圖像的相關性。在圖像的同一行相鄰像素之間、活動圖像的相鄰幀的對應像素之間往往存在很強的相關性,去除或減少這些相關性,也就去除或減少圖像信息中的冗餘度,即實現了對數字圖像的壓縮。
(2) 人的視覺心理特徵。人的視覺對於邊緣急劇變化不敏感(視覺掩蓋效應),對顏色分辨力弱,利用這些特徵可以在相應部分適當降低編碼精度,而使人從視覺上並不感覺到圖像質量的下降,從而達到對數字圖像壓縮的目的。
編碼壓縮方法有許多種,從不同的角度出發有不同的分類方法,比如從資訊理論角度出發可分 為兩大類:
(1)冗餘度壓縮方法,也稱無損壓縮,信息保持編碼或熵編碼。具體講就是解碼圖像和壓縮 編碼前的圖像嚴格相同,沒有失真,從數學上講是一種可逆運算。
(2)信息量壓縮方法,也稱有損壓縮,失真度編碼或熵壓縮編碼。也就是講解碼圖像和原始圖像是有差別的,允許有一定的失真。
應用在多媒體中的圖像壓縮編碼方法,從壓縮編碼演算法原理上可以分類為:
(1)無損壓縮編碼種類 •哈夫曼編碼 •算術編碼 •行程編碼 •Lempel zev編碼
(2)有損壓縮編碼種類 •預測編碼:DPCM,運動補償 •頻率域方法:正文變換編碼(如DCT),子帶編碼 •空間域方法:統計分塊編碼 •模型方法:分形編碼,模型基編碼 •基於重要性:濾波,子采樣,比特分配,矢量量化
(3)混合編碼 •JBIG,H261,JPEG,MPEG等技術標准
衡量一個壓縮編碼方法優劣的重要指標
(1)壓縮比要高,有幾倍、幾十倍,也有幾百乃至幾千倍;
(2)壓縮與解壓縮要快,演算法要簡單,硬體實現容易;
(3)解壓縮的圖像質量要好。
四、JPEG圖像壓縮演算法
1..JPEG壓縮過程
JPEG壓縮分四個步驟實現:
1.顏色模式轉換及采樣;
2.DCT變換;
3.量化;
4.編碼。
2.1.顏色模式轉換及采樣
RGB色彩系統是我們最常用的表示顏色的方式。JPEG採用的是YCbCr色彩系統。想要用JPEG基本壓縮法處理全彩色圖像,得先把RGB顏色模式圖像數據,轉換為YCbCr顏色模式的數據。Y代表亮度,Cb和Cr則代表色度、飽和度。通過下列計算公式可完成數據轉換。
Y=0.2990R+0.5870G+0.1140B
Cb=-0.1687R-0.3313G+0.5000B+128
Cr=0.5000R-0.4187G-0.0813B+128
人類的眼晴對低頻的數據比對高頻的數據具有更高的敏感度,事實上,人類
的眼睛對亮度的改變也比對色彩的改變要敏感得多,也就是說Y成份的數據是比較重要的。既然Cb成份和Cr成份的數據比較相對不重要,就可以只取部分數據來處理。以增加壓縮的比例。JPEG通常有兩種采樣方式:YUV411和YUV422,它們所代表的意義是Y、Cb和Cr三個成份的資料取樣比例。
2.2.DCT變換
DCT變換的全稱是離散餘弦變換(Discrete Cosine Transform),是指將一組光強數據轉換成頻率數據,以便得知強度變化的情形。若對高頻的數據做些修飾,再轉回原來形式的數據時,顯然與原始數據有些差異,但是人類的眼睛卻是不容易辨認出來。
壓縮時,將原始圖像數據分成8*8數據單元矩陣,例如亮度值的第一個矩陣內容如下:
JPEG將整個亮度矩陣與色度Cb矩陣,飽和度Cr矩陣,視為一個基本單元稱作MCU。每個MCU所包含的矩陣數量不得超過10個。例如,行和列采樣的比例皆為4:2:2,則每個MCU將包含四個亮度矩陣,一個色度矩陣及一個飽和度矩陣。
當圖像數據分成一個8*8矩陣後,還必須將每個數值減去128,然後一一代入DCT變換公式中,即可達到DCT變換的目的。圖像數據值必須減去128,是因為DCT轉換公式所接受的數字范圍是在-128到+127之間。
DCT變換公式:
x,y代表圖像數據矩陣內某個數值的坐標位置
f(x,y)代表圖像數據矩陣內的數個數值
u,v代表DCT變換後矩陣內某個數值的坐標位置
F(u,v)代表DCT變換後矩陣內的某個數值
u=0 且 v=0 c(u)c(v)=1/1.414
u>0 或 v>0 c(u)c(v)=1
經過DCT變換後的矩陣數據自然數為頻率系數,這些系數以F(0,0)的值最大,稱為DC,其餘的63個頻率系數則多半是一些接近於0的正負浮點數,一概稱之為AC。
3.3、量化
圖像數據轉換為頻率系數後,還得接受一項量化程序,才能進入編碼階段。
量化階段需要兩個8*8矩陣數據,一個是專門處理亮度的頻率系數,另一個則是
針對色度的頻率系數,將頻率系數除以量化矩陣的值,取得與商數最近的整數,
即完成量化。
當頻率系數經過量化後,將頻率系數由浮點數轉變為整數,這才便於執行最
後的編碼。不過,經過量化階段後,所有數據只保留整數近似值,也就再度損失
了一些數據內容,JPEG提供的量化表如下:
2.4、編碼
Huffman編碼無專利權問題,成為JPEG最常用的編碼方式,Huffman編碼通常是以完整的MCU來進行的。
編碼時,每個矩陣數據的DC值與63個AC值,將分別使用不同的Huffman編碼表,而亮度與色度也需要不同的Huffman編碼表,所以一共需要四個編碼表,才能順利地完成JPEG編碼工作。
DC編碼
DC是彩採用差值脈沖編碼調制的差值編碼法,也就是在同一個圖像分量中取得每個DC值與前一個DC值的差值來編碼。DC採用差值脈沖編碼的主要原因是由於在連續色調的圖像中,其差值多半比原值小,對差值進行編碼所需的位數,會比對原值進行編碼所需的位數少許多。例如差值為5,它的二進製表示值為101,如果差值為-5,則先改為正整數5,再將其二進制轉換成1的補碼即可。所謂1的補碼,就是將每個Bit若值為0,便改成1;Bit為1,則變成0。差值5應保留的位數為3,下表即列出差值所應保留的Bit數與差值內容的對照。
在差值前端另外加入一些差值的霍夫曼碼值,例如亮度差值為5(101)的位數為3,則霍夫曼碼值應該是100,兩者連接在一起即為100101。下列兩份表格分別是亮度和色度DC差值的編碼表。根據這兩份表格內容,即可為DC差值加上霍夫曼碼值,完成DC的編碼工作。
AC編碼
AC編碼方式與DC略有不同,在AC編碼之前,首先得將63個AC值按Zig-zag排序,即按照下圖箭頭所指示的順序串聯起來。
63個AC值排列好的,將AC系數轉換成中間符號,中間符號表示為RRRR/SSSS,RRRR是指第非零的AC之前,其值為0的AC個數,SSSS是指AC值所需的位數,AC系數的范圍與SSSS的對應關系與DC差值Bits數與差值內容對照表相似。
如果連續為0的AC個數大於15,則用15/0來表示連續的16個0,15/0稱為ZRL(Zero Rum Length),而(0/0)稱為EOB(Enel of Block)用來表示其後所
剩餘的AC系數皆等於0,以中間符號值作為索引值,從相應的AC編碼表中找出適當的霍夫曼碼值,再與AC值相連即可。
例如某一組亮度的中間符為5/3,AC值為4,首先以5/3為索引值,從亮度AC的Huffman編碼表中找到1111111110011110霍夫曼碼值,於是加上原來100(4)即是用來取[5,4]的Huffman編碼1111111110011110100,[5,4]表示AC值為4的前面有5個零。
由於亮度AC,色度AC霍夫曼編碼表比較長,在此省略去,有興趣者可參閱相關書籍。
實現上述四個步驟,即完成一幅圖像的JPEG壓縮。
❾ 圖像壓縮比如何計算
壓縮比=壓縮前所佔空間大小/實際所佔空間大小
圖像數據量=圖像的總像素*圖像位深度/8(Byte)
圖像的總像素=水平方向像素*垂直方向像素數
eg:有張jpeg格式的圖像,其實際佔用空間為160KB,該圖像的壓縮比
圖像信息
解析度 1024*512
寬度 1024像素
高度 512像素
水平解析度 96dpi
垂直解析度 96 dpi
位深度 24
壓縮前所佔空間大小=1024*512*24/8=1536KB
壓縮比=1536/160=9.6
9.6:1
❿ 評論壓縮編碼方法優劣的主要指標是什麼的大小
1壓縮倍數大小 2重建圖像的質量 3壓縮演算法的復雜程度