壓縮比編碼
① 如何計算壓縮比急!!
採用ASCII編碼:長度為14*8=112bit
採用Huffman編碼:
編碼表為:
空格:01
a :111
t :110
i :000
m :1011
s :1010
u :1001
d :1000
e :0011
n :0010
佔用長度為:2*3+3*2+3*2+3+6*4=45bit
編碼率為45/112=40.2%
② 如何計算Huffman編碼的編碼效率和壓縮比
赫夫曼編碼的具體方法:先按出現的概率大小排隊,把兩個最小的概率相加,作為新的概率 和剩餘的概率重新排隊,再把最小的兩個概率相加,再重新排隊,直到最後變成1。每次相 加時都將「0」和「1」賦與相加的兩個概率,讀出時由該符號開始一直走到最後的「1」, 將路線上所遇到的「0」和「1」按最低位到最高位的順序排好,就是該符號的赫夫曼編碼。
例如a7從左至右,由U至U″″,其碼字為1000;
a6按路線將所遇到的「0」和「1」按最低位到最高位的順序排好,其碼字為1001…
用赫夫曼編碼所得的平均比特率為:Σ碼長×出現概率
上例為:0.2×2+0.19×2+0.18×3+0.17×3+0.15×3+0.1×4+0.01×4=2.72 bit
可以算出本例的信源熵為2.61bit,二者已經是很接近了。
哈夫曼編碼進行壓縮的壓縮率是根據平均碼長來計算的,壓縮率比較低。例如:用三位二進行數進行的等長編碼平均長度為3,而根據哈夫曼樹編碼的平均碼長為:
4*0.07+2*0.19+5*0.02+4*0.06+2*0.32+5*0.03+2*0.21+4*0.10=2.61
2.61/3=0.87=87%
其平均碼長是等長碼的87%,所以平均壓縮率為13%。
(2)壓縮比編碼擴展閱讀:
霍夫曼編碼的基本方法先對圖像數據掃描一遍,計算出各種像素出現的概率,按概率的大小指定不同長度的唯一碼字,由此得到一張該圖像的霍夫曼碼表。編碼後的圖像數據記錄的是每個像素的碼字,而碼字與實際像素值的對應關系記錄在碼表中。
赫夫曼編碼是可變字長編碼(VLC)的一種。 Huffman於1952年提出一種編碼方法,該方法完全依據字元出現概率來構造異字頭的平均長 度最短的碼字,有時稱之為最佳編碼,一般就稱Huffman編碼。下面引證一個定理,該定理保證了按字元出現概率分配碼長,可使平均碼長最短。
③ 電影不同格式的壓縮比例各是多少
AVI一種電腦上比較常見的媒體文件格式,英文全名為AudioVideoInterleaved。通常情況下,AVI文件可以包含多個類型的媒體流,最典型的情況是一個音頻流和一個視頻流。
AVI格式包含多種編碼格式,比如DivX、XviD等等,這些可以統稱為AVI格式文件,所以AVI格式是個比較大的范疇。下面我們就來介紹一下Divx和XviD這兩種常見的格式。
提供無硬體視頻回放功能:
AVI格式和VFW軟體雖然是為當前的MPC設計的,但它也可以不斷提高以適應MPC的發展。根據AVI格式的參數,其視窗的大小和幀率可以根據播放環境的硬體能力和處理速度進行調整。在低檔MPC機上或在網路上播放時,VFW的視窗可以很小,色彩數和幀率可以很低。
而在Pentium級系統上,對於64K色、320×240的壓縮視頻數據可實現每秒25幀的回放速率。這樣,VFW就可以適用於不同的硬體平台,使用戶可以在普通的MPC上進行數字視頻信息的編輯和重放,而不需要昂貴的專門硬體設備。
以上內容參考:網路-AVI
④ JPEG是矢量圖像壓縮編碼標准
JPEG(Joint Photographic Experts Group) 是一個由 ISO和IEC兩個組織機構聯合組成的一個專家組,負責制定靜態的數字圖像數據壓縮編碼標准,這個專家組開發的演算法稱為JPEG演算法,並且成為國際上通用的標准,因此又稱為JPEG標准。JPEG是一個適用范圍很廣的靜態圖像數據壓縮標准,既可用於灰度圖像又可用於彩色圖像。
JPEG專家組開發了兩種基本的壓縮演算法,一種是採用以離散餘弦變換(Discrete Cosine Transform,DCT)為基礎的有損壓縮演算法,另一種是採用以預測技術為基礎的無損壓縮演算法。使用有損壓縮演算法時,在壓縮比為25:1的情況下,壓縮後還原得到的圖像與原始圖像相比較,非圖像專家難於找出它們之間的區別,因此得到了廣泛的應用。例如,在V-CD和DVD-Video電視圖像壓縮技術中,就使用JPEG的有損壓縮演算法來取消空間方向上的冗餘數據。為了在保證圖像質量的前提下進一步提高壓縮比,近年來JPEG專家組正在制定JPEG 2000(簡稱JP 2000)標准,這個標准中將採用小波變換(wavelet)演算法。
JPEG壓縮是有損壓縮,它利用了人的視角系統的特性,使用量化和無損壓縮編碼相結合來去掉視角的冗餘信息和數據本身的冗餘信息。壓縮編碼大致分成三個步驟:
1.使用正向離散餘弦變換(forward discrete cosine transform,FDCT)把空間域表示的圖變換成頻率域表示的圖。
2.使用加權函數對DCT系數進行量化,這個加權函數對於人的視覺系統是最佳的。
3.使用霍夫曼可變字長編碼器對量化系數進行編碼。
解碼或者叫做解壓縮的過程與壓縮編碼過程正好相反。
JPEG演算法與彩色空間無關,因此「RGB到YUV變換」和「YUV到RGB變換」不包含在JPEG演算法中。JPEG演算法處理的彩色圖像是單獨的彩色分量圖像,因此它可以壓縮來自不同彩色空間的數據,如RGB, YCbCr和CMYK。
JPEG壓縮編碼演算法的主要計算步驟如下:
1.正向離散餘弦變換(FDCT)。
2.量化(quantization)。
3.Z字形編碼(zigzag scan)。
4.使用差分脈沖編碼調制(differential pulse code molation,DPCM)對直流系數(DC)進行編碼。
5.使用行程長度編碼(run-length encoding,RLE)對交流系數(AC)進行編碼。
6.熵編碼(entropy coding)。
2. 量化
量化是對經過FDCT變換後的頻率系數進行量化。量化的目的是減小非「0」系數的幅度以及增加「0」值系數的數目。量化是圖像質量下降的最主要原因。
對於有損壓縮演算法,JPEG演算法使用均勻量化器進行量化,量化步距是按照系數所在的位置和每種顏色分量的色調值來確定。因為人眼對亮度信號比對色差信號更敏感,因此使用了兩種量化表:亮度量化值和色差量化值。此外,由於人眼對低頻分量的圖像比對高頻分量的圖像更敏感,因此圖中的左上角的量化步距要比右下角的量化步距小。
3. Z字形編排
量化後的系數要重新編排,目的是為了增加連續的「0」系數的個數,就是「0」的遊程長度,方法是按照Z字形的式樣編排,如圖5-17所示。這樣就把一個8 ? 8的矩陣變成一個1 ? 64的矢量,頻率較低的系數放在矢量的頂部。
4. 直流系數的編碼
8 ? 8圖像塊經過DCT變換之後得到的DC直流系數有兩個特點,一是系數的數值比較大,二是相鄰8 ? 8圖像塊的DC系數值變化不大。根據這個特點,JPEG演算法使用了差分脈沖調制編碼(DPCM)技術,對相鄰圖像塊之間量化DC系數的差值(Delta)進行編碼,
Delta=DC(0, 0)k-DC(0, 0)k-1 ........ (5-5)
5. 交流系數的編碼
量化AC系數的特點是1 ? 64矢量中包含有許多「0」系數,並且許多「0」是連續的,因此使用非常簡單和直觀的遊程長度編碼(RLE)對它們進行編碼。
JPEG使用了1個位元組的高4位來表示連續「0」的個數,而使用它的低4位來表示編碼下一個非「0」系數所需要的位數,跟在它後面的是量化AC系數的數值。
6. 熵編碼
使用熵編碼還可以對DPCM編碼後的直流DC系數和RLE編碼後的交流AC系數作進一步的壓縮。
在JPEG有損壓縮演算法中,使用霍夫曼編碼器來減少熵。使用霍夫曼編碼器的理由是可以使用很簡單的查表(lookup table)方法進行編碼。壓縮數據符號時,霍夫曼編碼器對出現頻度比較高的符號分配比較短的代碼,而對出現頻度較低的符號分配比較長的代碼。這種可變長度的霍夫曼碼表可以事先進行定義。