vlc演算法

發布時間: 2023-08-15 16:27:54

❶ 關於文件高壓縮率的問題

很簡單。 MPEG=運動圖像專家組(Moving Picture Experts Group)的簡稱。90年7月到94年11月，一群老頭在國際標准化組織（ISO）和國際電工委員會（IEC）聯合技術委員會（JTC）經過乏味而冗長的技術討論後制定了這一標准。ISO授權發布，所以作為全球公認的行業標准得到業內遵守。
MPEG可以完成對視頻和音頻的壓縮。這里我們當然只談視頻壓縮部分
實際上壓縮要乾的事情就是去除訊息源的3重冗餘度。包括：空間冗餘度、時間（動態）冗餘度、結構（靜態）冗餘度

同一幀訊源圖像中相鄰像素之間的幅度值相近，即同一行上的相鄰像素之間幅值相近，相鄰行之間同樣位置上的像素幅值相近。這被稱為圖像的空間冗餘度；
相鄰兩幀訊源圖像同一位置上像素幅度值相近，體現了訊源圖像的時間（動態）冗餘度；
訊源圖像上每個像素所用bit數的多少表示了比特結構，多用的比特數為冗餘量，體現了靜態（結構）冗餘度。

MPEG是怎樣去除這些冗餘度的呢？它主要從兩個方面入手：

1、利用圖像信號的統計特性進行壓縮

也就是：
採用運動補償（MC）去除時間冗餘度；
採用離散餘弦變換（DCT）和遊程長度編碼（RLC）去除空間冗餘度；
採用可變長度編碼（VLC）去除靜態（比特結構）冗餘度
這3種計算的具體實現我等一下會講到。現在你只需要明白，它們其實並不太復雜，至少不像它們的名字那樣讓人望而生畏

2、利用人的視覺生理特性設計壓縮

人眼對構成圖像的不同頻率成分、物體的不同運動程度等具有不同的敏感度，這是由人眼的視覺生理特性所決定的，如人的眼睛含有對亮度敏感的柱狀細胞1.8億個，含有對色彩敏感的椎狀細胞0.08億個，由於柱狀細胞的數量遠大於椎狀細胞，所以眼睛對亮度的敏感程度要大於對色彩的敏感程度。據此，可控制圖像適合於人眼的視覺特性，從而達到壓縮圖像數據量的目的。例如，人眼對低頻信號的敏感程度大於對高頻信號的敏感程度，可用較少的bit數來表示高頻信號；人眼對靜態物體的敏感程度大於對動態物體的敏感程度，可減少表示動態物體的bit數；人眼對亮度信號的敏感程度大於對色度信號的敏感程度，可在行、幀方向縮減表示色度信號的bit數；人眼對圖像中心信息的敏感程度大於對圖像邊緣信息的敏感程度，可對邊緣信息少分配bit數；人眼對圖像水平向及垂直向信息敏感於傾斜向信息，可減少表示傾斜向信息高頻成分的bit數等。在實際工作中，由於眼睛對亮度、色度敏感程度不一樣，故可將其分開處理。（這一段引用2003年度北京廣播學院電視工程專業教材）
所以我們將單元分量RGB改變為YUV(或YCrCb)全局分量，在編碼時強調亮度信息，可去掉一些色度信息，如4:4:4變為4:2:2，這就意味著改變了視頻的比特結構。去處掉的就是所謂的靜態（比特結構）冗餘度了。

引用教才部分所說的這個辦法，把結構冗餘信息去除（RGB->YUV），就可以實現適度的壓縮。去除結構冗餘度對圖像質量無影響，所以可以稱作"無損壓縮"。但是無損壓縮的壓縮比不高，壓縮能力有限。為了提高壓縮比，MPEG標准採用了對圖像質量有損傷的"有損壓縮"技術，即上面說的去除時間和空間的冗餘度。這些是要付出代價的----但這個帳很劃算
仔細說說上面那幾個演算法吧~ 可能需要一點點離散數學/高等數學基礎，您才能較好理解不過就算不是很明白也無所謂，您只需要了解這些處理所起的作用就Ok了~

首先說運動補償預測。這個好像是這里和ccf的會員們最熟悉的一環了，懂得人多我更要小心描述了

什麼叫運動補償呢？將前一圖像幀的相應的塊(microblock)按求得的運動矢量進行位移，這就是運動補償過程。為了壓縮視頻信號的時間冗餘度，MPEG採用了運動補償預測（Motion Compensated Prediction）。
運動補償預測假定：通過把畫面以一定的提前時間（pre）平移，可以局部地預測當前畫面。這里的局部意味著在畫面內的每個地方位移的幅度和方向可以是不相同的。採用運動估值的結果進行運動補償，以便盡可能地減小預測誤差。運動估值包括了從視頻序列中提取運動信息的一套技術，該技術與所處理圖像序列的特點決定著運動補償性能的優劣。
所謂預測，實際上是由前一（n-1）圖像幀導出當前（n）幀所考慮像素的預測值，而後由運動矢量編碼傳輸n幀的實際像素值與其預測值之間的差值。例如，設宏塊（MB）為M×N的矩形塊，將（n-1）幀的宏塊與n幀的宏塊進行比較。這實際上是一個進行宏塊匹配的運動補償過程，即將n幀中16×16像素的宏塊與n-1幀中限定搜索區(SR)內全部16×16像素的宏塊進行比較。這一過程試圖判斷在n-1幀的那個MB到n幀中運動到了哪裡。若n-1幀圖像亮度信號為f [n -1 (i , j)]，n幀圖像亮度信號為f [ n (i , j)]，其中(i , j)為n幀的M×N宏塊的任意位置,並將n幀中的一個M×N的宏塊看作是從n-1幀中平移而來的，而且規定同一個宏塊內的所有像素都具有同樣的位移值(k，l) 。這樣，通過在n-1幀限定搜索區（SR）內進行搜索，總可以搜索到某一宏塊，使得該宏塊與n幀中要匹配的宏塊的差值的絕對值達到最小，並得到運動矢量的運動數據，在n-1幀和運動數據的控制下，獲得n幀的一個相應的預測值。照此辦理，直到n幀的M×N宏塊的任意位置（i , j）的像素全部通過n-1幀的像素預測出來。大家都知道，不緊緊是n和n-1這樣相鄰的兩幀可以進行MCP，實際上MPEG-1和MPEG-2可以當前幀之前若干幀的某一幀為基準進行MCP。
為了改善預測效果，可以採用分場預測。這一點在silky sama的聖經里說的很清楚了。
需要說明的是：MPEG定義了基於幀、基於場及雙場的圖像預測，也定義了16×8的運動補償。
對逐行掃描方式，可以採用基於幀的圖像預測；隔行掃描方式，也可以採用基於場的圖像預測。因此，MPEG-2編碼器要對每個圖像先判斷是幀模式壓縮還是場模式壓縮。在隔行掃描方式下：運動少的場景時，採用基於幀的圖像預測，因為基於幀的圖像兩相鄰行間幾乎沒有位移，幀內相鄰行間相關性強於場內相關性，從整個幀中去除的空間冗餘度比從個別場中去除得多；劇烈運動的場景時，採用基於場的圖像預測，因為基於幀的相鄰兩行間存在1場延遲時間，相鄰行像素間位移較大，幀內相鄰行間相關性會有較大下降，基於場的圖像兩相鄰行間相關性強於幀內相鄰行間相關性，在1幀內，場間運動有很多高頻分量（silky重點提過），從場間去除的高頻分量比從整個幀中去除的多。由上述可見，選擇基於幀的圖像預測還是基於場的圖像預測的關鍵是行間相關性。所以，在進行DCT之前，要作幀DCT編碼或場DCT編碼的選擇，對16×16 的原圖像或亮度進行運動補償後所獲得的差值作幀內相鄰行間和場內相鄰行間相關系數的計算。若幀內相鄰行間相關系數大於場內相鄰行間相關系數，就選擇幀DCT編碼，反之選場DCT編碼。
MPEG採用了Ahmed（一個巨牛的數學家）等人於70年代提出的離散餘弦變換（DCT-Discrete Cosine Transform）壓縮演算法，降低視頻信號的空間冗餘度。
DCT將運動補償誤差或原畫面信息塊轉換成代表不同頻率分量的系數集，這有兩個優點：其一，信號常將其能量的大部分集中於頻率域的1個小范圍內，這樣一來，描述不重要的分量只需要很少的比特數；其二，頻率域分解映射了人類視覺系統的處理過程，並允許後繼的量化過程滿足其靈敏度的要求。
關於這一點在我手頭的教程中有詳盡的描述，讓我直接引用：

視頻信號的頻譜線在0-6MHz范圍內，而且1幅視頻圖像內包含的大多數為低頻頻譜線，只在占圖像區域比例很低的圖像邊緣的視頻信號中才含有高頻的譜線。因此，在視頻信號數字處理時，可根據頻譜因素分配比特數：對包含信息量大的低頻譜區域分配較多的比特數，對包含信息量低的高頻譜區域分配較少的比特數，而圖像質量並沒有可察覺的損傷，達到碼率壓縮的目的。然而，這一切要在低熵(Entropy)值的情況下，才能達到有效的編碼。能否對一串數據進行有效的編碼，取決於每個數據出現的概率。每個數據出現的概率差別大，就表明熵值低，可以對該串數據進行高效編碼。反之，出現的概率差別小，熵值高，則不能進行高效編碼。視頻信號的數字化是在規定的取樣頻率下由A/D轉換器對視頻電平轉換而來的，每個像素的視頻信號幅度隨著每層的時間而周期性地變化。每個像素的平均信息量的總和為總平均信息量，即熵值。由於每個視頻電平發生幾乎具有相等的概率，所以視頻信號的熵值很高。熵值是一個定義碼率壓縮率的參數，視頻圖像的壓縮率依賴於視頻信號的熵值，在多數情況下視頻信號為高熵值，要進行高效編碼，就要將高熵值變為低熵值。怎樣變成低熵值呢？這就需要分析視頻頻譜的特點。大多數情況下，視頻頻譜的幅度隨著頻率的升高而降低。其中低頻頻譜在幾乎相等的概率下獲得0到最高的電平。與此相對照，高頻頻譜通常得到的是低電平及稀少的高電平。顯然，低頻頻譜具有較高的熵值，高頻頻譜具有較低的熵值。據此，可對視頻的低頻分量和高頻分量分別處理，獲得高頻的壓縮值。

由上面的引用可見，碼率壓縮基於變換編碼和熵值編碼兩種演算法。前者用於降低熵值，後者將數據變為可降低比特數的有效編碼方式。在MPEG標准中，變換編碼採用的是DCT，變換過程本身雖然並不產生碼率壓縮作用，但是變換後的頻率系數卻非常有利於碼率壓縮。實際上壓縮數字視頻信號的整個過程分為塊取樣、DCT、量化、編碼4個主要過程進行-----首先在時間域將原始圖像分成N(水平)×N（垂直）取樣塊，根據需要可選擇4×4、4×8、8×8、8×16、16×16等塊，這些取樣的像素塊代表了原圖像幀各像素的灰度值，其范圍在139-163之間，並依序送入DCT編碼器，以便將取樣塊由時間域轉換為頻率域的DCT系數塊。DCT系統的轉換分別在每個取樣塊中進行，這些塊中每個取樣是數字化後的值，表示一場中對應像素的視頻信號幅度值。
DCT和它解壓時的反運算的具體演算法如下。

當u,v = 0 時，離散餘弦正變換（DCT）後的系數若為F(0,0)=1，則離散餘弦反變換（IDCT）後的重現函數f(x,y)=1/8,是個常數值，所以將F(0,0)稱為直流(DC)系數；當 u,v≠0時，正變換後的系數為F(u,v)=0，則反變換後的重現函數f(x,y)不是常數，此時正變換後的系數F(u,v)為交流（AC）系數。

DCT轉換的一個具體應用見下面這個圖：（偶們作員工培訓的一張幻燈片，剛好合適）
http://pic.zingking.com/rzhy/kean/DCTpro.jpg

看上圖變換原理可察覺兩點：其一，DCT後的64個DCT頻率系數與DCT前的64個像素塊相對應，DCT前後都是64個點，它只是1個本身沒有壓縮作用的無損變換過程。其二，單獨1場圖像的全部DCT系數塊的頻譜幾乎都集中在最左上角的系數塊中，僅從該塊的頻譜中就可以形成1幅壓縮圖像；DCT輸出的頻率系數矩陣最左上角的直流（DC）系數幅度最大，圖中為315，由於代表了x軸和y軸上的DC分量，所以它表示了輸入矩陣全部幅度的平均值；以DC系數為出發點向下、向右的其它DCT系數，離DC分量越遠，頻率越高，幅度值越小，圖中最右下角為-0.11，即圖像信息的大部分集中於直流系數及其附近的低頻頻譜上，離DC系數越來越遠的高頻頻譜幾乎不含圖像信息，甚至於只含雜波。顯然，DCT本身雖然沒有壓縮作用，卻為以後壓縮時的"取"、"舍" 奠定了必不可少的基礎。

❷ 怎麼才能降低壓縮文件的壓縮率

❸ 如何用VLC接收不同視頻格式（H263、H264 CIF 4CIF）的組播媒體流

以下是幾種格式的專業解釋：

HDTV

一，HDTV的概念

要解釋HDTV，我們首先要了解DTV。DTV是一種數字電視技術，是目前傳統模擬電視技術的接班人。所謂的數字電視，是指從演播室到發射、傳輸、接收過程中的所有環節都是使用數字電視信號，或對該系統所有的信號傳播都是通過由二進制數字所構成的數字流來完成的。數字信號的傳播速率為每秒19.39兆位元組，如此大的數據流傳輸速度保證了數字電視的高清晰度，克服了模擬電視的先天不足。同時，由於數字電視可以允許幾種制式信號的同時存在，因此每個數字頻道下又可分為若干個子頻道，能夠滿足以後頻道不斷增多的需求。HDTV是DTV標准中最高的一種，即High Definision TV，故而稱為HDTV。

二，HDTV中要求音、視頻信號達到哪些標准？

HDTV規定了視頻必須至少具備720線非交錯式（720p，即常說的逐行）或1080線交錯式隔行（1080i，即常說的隔行）掃描（DVD標准為 480線），屏幕縱橫比為16:9。音頻輸出為5.1聲道(杜比數字格式)，同時能兼容接收其它較低格式的信號並進行數字化處理重放。

HDTV有三種顯示格式，分別是：720P（1280×720P，非交錯式），1080 i（1920×1080i，交錯式），1080P（1920×1080i，非交錯式），其中網路上流傳的以720P和1080 i最為常見，而在微軟WMV-HD站點上1080P的樣片相對較多。

三，如何收看HDTV節目？

目前有兩種方式可欣賞到HDTV節目。一種是在電視上實時收看HDTV，需要滿足兩個條件，首先是電視可接收到HDTV信號，這需要額外添加相關的硬體，其次是電視符合HDTV標准，主要是指電視的解析度和接收埠而言。
另一種是在電腦上通過軟體播放。目前我國只有極少部分地區可接收到HDTV數字信號，而且HDTV電視的價格仍高高在上，不是普通消費者所能承受的。因此，在網路中找尋HDTC源，下載後在個人電腦上播放，成了大多數HDTV迷們的一個嘗鮮方法。

四，哪些是可用於電腦播放的HDTV文件？

網路中流傳的HDTV主要以兩類文件的方式存在，一類是經過MPEG-2標准壓縮，以.tp和.ts為後綴的視頻流文件，一類是經過WMV-HD （Windows Media Video High Definition）標准壓縮過的.wmv文件，還有少數文件後綴為.avi或.mpg，其性質與.wmv是完全一樣的。

HDTV文件都比較大，即使是經過重新編碼過後的.wmv文件也非同小可。以一部普通電影的時間長度來計算，.wmv文件將會有4G以上，而同樣時間長度的.tp和.ts文件能達到8G以上，有的甚至達到20多G。因此，除了通過文件後綴名，還可以通過文件大小來判斷是否為HDTV文件。

五，如何在個人電腦上播放HDTV節目？

對於.wmv文件，只要系統安裝了Windows Media Player 9 或更高版本，就可以正常播放，一些播放軟體的最新版本已經開始支持WMV-HD，如WINDVD6等，也可以直接使用這些軟體播放HDTV。有些HDTV文件在壓縮過程中採用了其它標準的編碼格式，就需要安裝對應的解碼器，遇到Windows Media Player 9不能正常播放時，可以再安裝ffdshow，它帶有各種最常用的解碼器。

播放以.tp和.ts為後綴的視頻流文件要稍微麻煩一點，因為文件中分別包含有AC3音頻信息和MPEG-2視頻信息。好在現下有已經不少專門播放.tp 和.ts文件的軟體問世了，Moonlight-Elecard MPEG Player 就是其中一款比較常見的支持HDTV播放的軟體，目前最新的版本為2.x。安裝完後，也可以運行其它播放軟體來調用Moonlight- Elecard MPEG Player的解碼器進行播放。

六，如何鑒別HDTV的顯示格式？

目前我們無法僅從文件名稱、大小上來判定一個HDTV文件的顯示格式是720P還是1080i，或是1080P，但是有不少軟體可以在播放時顯示影片的圖像信息，如WINDVD、zplay等，在軟體的控制面板中選擇對應的選項就可以看到詳細的信息。

七，為什麼我只能看到圖像，卻聽不到聲音？

這是因為未安裝AC3音頻解碼器，導致HDTV文件中的音頻信息不能被正確識別的原因。解決的方法是下載並安裝對應的音頻解碼器，常用的有 AC3Filter，這些音、視頻解碼器只需安裝一次即可，播放HDTV文件時系統會自動調用，而不必每次播放的時候都打開其控制界面。

八，為什麼我播放HDTV時會出現丟幀現象？

在家用電腦上播放HDTV，對其硬體配置要求較高，主要是與CPU、顯存、內存緊緊相關，如果這三樣中有一樣性能過低，就會產生一些播放問題。播放 HDTV時會出現丟幀現象是顯存容量不夠造成的，尤其是在播放1080 i格式HDTV的時候，1920×1080的像素量，需要足夠大的顯存才能滿足其數據吞吐，因此顯存至少需要64M以上，建議128M。由於是2D顯示，所以對顯卡核心的運算能力要求反而不是很高。

九，為什麼我播放HDTV時會經常出現畫面和語音停頓的現象？

一些採用了WMV-HD重新編碼的HDTV文件，因為有著較高的壓縮率，在播放時就需要非常高的CPU運算能力來進行實時解碼，一般來說P4 2.0G/AMD 2000+ 以上及同級別的CPU可達到這個要求。同時，由於HDTV的數據流較大，需要足夠的內存來支持，推薦在256M以上。如果你的電腦滿足不了這樣的配置，就可能會在播放過程中產生畫面與語音不同步、畫面經常停頓、爆音等現象。嚴重的話甚至無法順利觀看。如果這種現象不太嚴重，則可以通過優化系統和一些小技巧來改善。

十，如何優化系統以保證順利地播放HDTV？

除非你的電腦硬體配置的確很強，否則就很可能需要對系統進行一些優化，以便可以順利地播放HDTV。首先是在播放HDTV前關閉所有沒有用的後台程序或進程，盡量增加系統的空閑資源為播放HDTV服務；其次是選擇一款佔用系統資源較低的軟體來播放HDTV 。Windows Media Player、WINDVD等軟體佔用系統資源較多，在硬體配置本就不高的系統上會影響HDTV的播放效果，這時可以選擇使用BSPlayer。 BSPlayer是一款免費軟體，最大的特點就是佔用系統資源很小，尤其在播放HDTV文件時，與其它幾個資源佔用大戶相比效果更為明顯。另外，運行播放軟體後立即打開任務管理器（僅在Windows 2000/XP中有效），將播放軟體的進程級別設置為最高，這樣也可以為HDTV的播放調用更多的系統資源。除此之外，安裝更高版本的 DirectX，也能更好地支持HDTV的播放。

十一，還有什麼其它的技巧？

如果你的PC可以流利地播放HDTV，那麼你唯一會感到遺憾的，可能就是抱怨顯示器太小和音箱太不夠勁了。音箱的問題沒有好的方法可以解決，必竟PC音箱和家庭影院的音箱兩者是不可同比的，然而我們可以通過調高顯示器的解析度來提高畫面的清晰度和細節感。現在主流的顯示器為17寸純平CRT（因為改變標准解析度只會給LCD帶來負面影響，因此這種方法只針對普通的CRT顯示器），中低檔的17寸顯示器很難達到1600×1200以上的解析度，即使達到了其水平掃描率也在60Hz以下，但是請不要忘了，電視信號的水平掃描率也就是在這個水平上。720P的水平掃描率為60Hz，1080i則有50Hz和60Hz兩種，分別為我國和美國地區的標准。也就是說，即使你在顯示器水平掃描率為60Hz的狀態下全屏觀看HDTV或DVD等其它視頻，你是感覺不到晃眼的，這主要是由於人眼對於動態和靜態物體的感應不同造成的。因此你可以在觀看HDTV的時候，放心地將顯示器水平掃描率設為60Hz，進而將解析度調高，平時使用再調回標准解析度即可。

存放HDTV文件的硬碟分區必須轉換為NTFS格式，因為一部HDTV電影通常是幾個4.3GB的視頻文件組成（為了方便刻錄在DVD上面），而FAT32是無法管理2GB以上的文件的，因此務必轉換分區格式。

H.264

JVT（Joint Video Team，視頻聯合工作組）於2001年12月在泰國Pattaya成立。它由ITU-T和ISO兩個國際標准化組織的有關視頻編碼的專家聯合組成。JVT的工作目標是制定一個新的視頻編碼標准，以實現視頻的高壓縮比、高圖像質量、良好的網路適應性等目標。目前JVT的工作已被ITU-T接納，新的視頻壓縮編碼標准稱為H.264標准，該標准也被ISO接納，稱為AVC（Advanced Video Coding）標准，是MPEG-4的第10部分。
H.264標准可分為三檔：
基本檔次（其簡單版本，應用面廣）；
主要檔次（採用了多項提高圖像質量和增加壓縮比的技術措施，可用於SDTV、HDTV和DVD等）；
擴展檔次（可用於各種網路的視頻流傳輸）。
H.264不僅比H.263和MPEG-4節約了50％的碼率，而且對網路傳輸具有更好的支持功能。它引入了面向IP包的編碼機制，有利於網路中的分組傳輸，支持網路中視頻的流媒體傳輸。H.264具有較強的抗誤碼特性，可適應丟包率高、干擾嚴重的無線信道中的視頻傳輸。H.264支持不同網路資源下的分級編碼傳輸，從而獲得平穩的圖像質量。H.264能適應於不同網路中的視頻傳輸，網路親和性好。

H.261是最早出現的視頻編碼建議，目的是規范ISDN網上的會議電視和可視電話應用中的視頻編碼技術。它採用的演算法結合了可減少時間冗餘的幀間預測和可減少空間冗餘的DCT變換的混合編碼方法。和ISDN信道相匹配，其輸出碼率是p×64kbit/s。p取值較小時，只能傳清晰度不太高的圖像，適合於面對面的電視電話；p取值較大時（如 p＞6），可以傳輸清晰度較好的會議電視圖像。H.263 建議的是低碼率圖像壓縮標准，在技術上是H.261的改進和擴充，支持碼率小於64kbit/s的應用。但實質上H.263以及後來的H.263+和H.263++已發展成支持全碼率應用的建議，從它支持眾多的圖像格式這一點就可看出，如Sub-QCIF、QCIF、CIF、4CIF甚至16CIF等格式。
MPEG-1標準的碼率為1.2Mbit/s左右，可提供30幀CIF（352×288）質量的圖像，是為CD-ROM光碟的視頻存儲和播放所制定的。MPEG-l標准視頻編碼部分的基本演算法與H.261/H.263相似，也採用運動補償的幀間預測、二維DCT、VLC遊程編碼等措施。此外還引入了幀內幀（I）、預測幀（P）、雙向預測幀（B）和直流幀（D）等概念，進一步提高了編碼效率。在MPEG-1的基礎上，MPEG-2標准在提高圖像解析度、兼容數字電視等方面做了一些改進，例如它的運動矢量的精度為半像素；在編碼運算中（如運動估計和DCT）區分「幀」和「場」；引入了編碼的可分級性技術，如空間可分級性、時間可分級性和信噪比可分級性等。近年推出的MPEG-4標准引入了基於視聽對象（AVO：Audio-Visual Object）的編碼，大大提高了視頻通信的交互能力和編碼效率。 MPEG-4中還採用了一些新的技術，如形狀編碼、自適應DCT、任意形狀視頻對象編碼等。但是MPEG-4的基本視頻編碼器還是屬於和H.263相似的一類混合編碼器。
總之，H.261建議是視頻編碼的經典之作，H.263是其發展，並將逐步在實際上取而代之，主要應用於通信方面，但H.263眾多的選項往往令使用者無所適從。MPEG系列標准從針對存儲媒體的應用發展到適應傳輸媒體的應用，其核心視頻編碼的基本框架是和H.261一致的，其中引人注目的MPEG-4的「基於對象的編碼」部分由於尚有技術障礙，目前還難以普遍應用。因此，在此基礎上發展起來的新的視頻編碼建議H.264克服了兩者的弱點，在混合編碼的框架下引入了新的編碼方式，提高了編碼效率，面向實際應用。同時，它是兩大國際標准化組織的共同制定的，其應用前景應是不言而喻的。
JVT的H.264
H.264是ITU-T的VCEG（視頻編碼專家組）和ISO/IEC的MPEG（活動圖像編碼專家組）的聯合視頻組（JVT：joint video team）開發的一個新的數字視頻編碼標准，它既是ITU-T的H.264，又是ISO/IEC的MPEG-4的第10 部分。1998年1月份開始草案徵集，1999年9月，完成第一個草案，2001年5月制定了其測試模式TML-8，2002年6月的 JVT第5次會議通過了H.264的FCD板。2003年3月正式發布。
H.264和以前的標准一樣，也是DPCM加變換編碼的混合編碼模式。但它採用「回歸基本」的簡潔設計，不用眾多的選項，獲得比H.263++好得多的壓縮性能；加強了對各種信道的適應能力，採用「網路友好」的結構和語法，有利於對誤碼和丟包的處理；應用目標范圍較寬，以滿足不同速率、不同解析度以及不同傳輸（存儲）場合的需求；它的基本系統是開放的，使用無需版權。
在技術上，H.264標准中有多個閃光之處，如統一的VLC符號編碼，高精度、多模式的位移估計，基於4×4塊的整數變換、分層的編碼語法等。這些措施使得H.264演算法具有很的高編碼效率，在相同的重建圖像質量下，能夠比H.263節約50％左右的碼率。H.264的碼流結構網路適應性強，增加了差錯恢復能力，能夠很好地適應IP和無線網路的應用。
H.264的技術亮點
（1）分層設計
H.264的演算法在概念上可以分為兩層：視頻編碼層（VCL：Video Coding Layer）負責高效的視頻內容表示，網路提取層（NAL：Network Abstraction Layer）負責以網路所要求的恰當的方式對數據進行打包和傳送。在VCL和NAL之間定義了一個基於分組方式的介面，打包和相應的信令屬於NAL的一部分。這樣，高編碼效率和網路友好性的任務分別由VCL和NAL來完成。
VCL層包括基於塊的運動補償混合編碼和一些新特性。與前面的視頻編碼標准一樣，H.264沒有把前處理和後處理等功能包括在草案中，這樣可以增加標準的靈活性。
NAL負責使用下層網路的分段格式來封裝數據，包括組幀、邏輯信道的信令、定時信息的利用或序列結束信號等。例如，NAL支持視頻在電路交換信道上的傳輸格式，支持視頻在Internet上利用RTP/UDP/IP傳輸的格式。NAL包括自己的頭部信息、段結構信息和實際載荷信息，即上層的VCL數據。（如果採用數據分割技術，數據可能由幾個部分組成）。
（2）高精度、多模式運動估計
H.264支持1/4或1/8像素精度的運動矢量。在1/4像素精度時可使用6抽頭濾波器來減少高頻雜訊，對於1/8像素精度的運動矢量，可使用更為復雜的8抽頭的濾波器。在進行運動估計時，編碼器還可選擇「增強」內插濾波器來提高預測的效果。
在H.264的運動預測中，一個宏塊（MB）可以按圖2被分為不同的子塊，形成7種不同模式的塊尺寸。這種多模式的靈活和細致的劃分，更切合圖像中實際運動物體的形狀，大大提高了運動估計的精確程度。在這種方式下，在每個宏塊中可以包含有1、2、4、8或16個運動矢量。
在H.264中，允許編碼器使用多於一幀的先前幀用於運動估計，這就是所謂的多幀參考技術。例如2幀或3幀剛剛編碼好的參考幀，編碼器將選擇對每個目標宏塊能給出更好的預測幀，並為每一宏塊指示是哪一幀被用於預測。
（3） 4×4塊的整數變換
H.264與先前的標准相似，對殘差採用基於塊的變換編碼，但變換是整數操作而不是實數運算，其過程和DCT基本相似。這種方法的優點在於：在編碼器中和解碼器中允許精度相同的變換和反變換，便於使用簡單的定點運算方式。也就是說，這里沒有「反變換誤差」。變換的單位是4×4塊，而不是以往常用的8×8塊。由於用於變換塊的尺寸縮小，運動物體的劃分更精確，這樣，不但變換計算量比較小，而且在運動物體邊緣處的銜接誤差也大為減小。為了使小尺寸塊的變換方式對圖像中較大面積的平滑區域不產生塊之間的灰度差異，可對幀內宏塊亮度數據的16個4×4塊的DC系數（每個小塊一個，共16個）進行第二次4×4塊的變換，對色度數據的4個4×4塊的DC系數（每個小塊一個，共4個）進行2×2塊的變換。
H.264為了提高碼率控制的能力，量化步長的變化的幅度控制在12.5%左右，而不是以不變的增幅變化。變換系數幅度的歸一化被放在反量化過程中處理以減少計算的復雜性。為了強調彩色的逼真性，對色度系數採用了較小量化步長。
（4）統一的VLC
H.264中熵編碼有兩種方法，一種是對所有的待編碼的符號採用統一的VLC（UVLC ：Universal VLC），另一種是採用內容自適應的二進制算術編碼（CABAC：Context-Adaptive Binary Arithmetic Coding）。CABAC是可選項，其編碼性能比UVLC稍好，但計算復雜度也高。UVLC使用一個長度無限的碼字集，設計結構非常有規則，用相同的碼表可以對不同的對象進行編碼。這種方法很容易產生一個碼字，而解碼器也很容易地識別碼字的前綴，UVLC在發生比特錯誤時能快速獲得重同步。
圖3顯示了碼字的語法。這里，x0，x1，x2，…是INFO比特，並且為0或1。圖4列出了前9種碼字。如：第4號碼字包含INFO01，這一碼字的設計是為快速再同步而經過優化的，以防止誤碼。
（5）幀內預測
在先前的H.26x系列和MPEG-x系列標准中，都是採用的幀間預測的方式。在H.264中，當編碼Intra圖像時可用幀內預測。對於每個4×4塊（除了邊緣塊特別處置以外），每個像素都可用17個最接近的先前已編碼的像素的不同加權和（有的權值可為0）來預測，即此像素所在塊的左上角的17個像素。顯然，這種幀內預測不是在時間上，而是在空間域上進行的預測編碼演算法，可以除去相鄰塊之間的空間冗餘度，取得更為有效的壓縮。
如圖4所示，4×4方塊中a、b、...、p為16 個待預測的像素點，而A、B、...、P是已編碼的像素。如m點的值可以由（J＋2K＋L＋2）/ 4 式來預測，也可以由（A+B+C+D+I+J+K+L）/ 8 式來預測，等等。按照所選取的預測參考的點不同，亮度共有9類不同的模式，但色度的幀內預測只有1類模式。
（6）面向IP和無線環境
H.264 草案中包含了用於差錯消除的工具，便於壓縮視頻在誤碼、丟包多發環境中傳輸，如移動信道或IP信道中傳輸的健壯性。
為了抵禦傳輸差錯，H.264視頻流中的時間同步可以通過採用幀內圖像刷新來完成，空間同步由條結構編碼（slice structured coding）來支持。同時為了便於誤碼以後的再同步，在一幅圖像的視頻數據中還提供了一定的重同步點。另外，幀內宏塊刷新和多參考宏塊允許編碼器在決定宏塊模式的時候不僅可以考慮編碼效率，還可以考慮傳輸信道的特性。
除了利用量化步長的改變來適應信道碼率外，在H.264中，還常利用數據分割的方法來應對信道碼率的變化。從總體上說，數據分割的概念就是在編碼器中生成具有不同優先順序的視頻數據以支持網路中的服務質量QoS。例如採用基於語法的數據分割（syntax-based data partitioning）方法，將每幀數據的按其重要性分為幾部分，這樣允許在緩沖區溢出時丟棄不太重要的信息。還可以採用類似的時間數據分割（temporal data partitioning）方法，通過在P幀和B幀中使用多個參考幀來完成。
在無線通信的應用中，我們可以通過改變每一幀的量化精度或空間/時間解析度來支持無線信道的大比特率變化。可是，在多播的情況下，要求編碼器對變化的各種比特率進行響應是不可能的。因此，不同於MPEG-4中採用的精細分級編碼FGS（Fine Granular Scalability）的方法（效率比較低），H.264採用流切換的SP幀來代替分級編碼。
H.264的性能測試
TML-8為H.264的測試模式，用它來對H.264的視頻編碼效率進行比較和測試。測試結果所提供的PSNR已清楚地表明，相對於MPEG-4（ASP：Advanced Simple Profile）和H.263++（HLP：High Latency Profile）的性能，H.264的結果具有明顯的優越性，如圖5所示。
H.264的PSNR比MPEG-4（ASP）和H.263++（HLP）明顯要好，在6種速率的對比測試中，H.264的PSNR比MPEG-4（ASP）平均要高2dB，比H.263（HLP）平均要高3dB。6個測試速率及其相關的條件分別為：32 kbit/s速率、10f/s幀率和QCIF格式；64 kbit/s速率、15f/s幀率和QCIF格式；128kbit/s速率、15f/s幀率和CIF格式；256kbit/s速率、15f/s幀率和QCIF格式；512 kbit/s速率、30f/s幀率和CIF格式；1024 kbit/s速率、30f/s幀率和CIF格式。
實現難度
對每個考慮實際應用的工程師而言，在關注H.264的優越性能的同時必然會衡量其實現難度。從總體上說，H.264性能的改進是以增加復雜性為代價而獲得的。目前全球也只有中國杭州海康威視數字技術有限公司在安防領域實現了H.264的實際應用，這一次我們走到了世界的前端！

1080p

1080P是標准層面上的HDTV或者硬體層面上FULL HD的最高標准之一,而FULL HD就是能夠完全顯示1920*1080像素或者說物理解析度達到1920*1080的平板電視機。需要注意的是，FULL HD和先前很多廠家宣傳的1080P並不是同樣的概念。
但是我們走進賣場會發現大多數品牌商家都打著1080P的旗幟對外宣傳,多少對我們的選購產生了阻礙.其實目前市場中的大多數平板電視都不是FULL HD,所謂的1080P只是支持1080P信號的接收並通過計算演變在屏幕上顯示,大多數大屏幕平板電視都為1366*768,等離子中的部分產品更低,要達到FULL HD的概念,就必須屏幕達到1920*1080的物理解析度以及至少30Hz的刷新率.

WAF

We Are Family 的簡稱 [我們是一家人]
WAF是韓國的一個影視製作小組，他們製作的DVDRIP是目前網上除了HDTV之外質量最好的，清晰度和音質都是上乘之作。
WAF的作品有以下特點：
1：嚴格控制每CD的容量，每CD的容量大小一般不超過0.05M（大家見過不少CD1是702M,CD2卻是698M的現象吧）。
2：經過控制的容量，利於刻盤，（有些小組製作的容量經常可以超過702M，一CD盤的容量，這時候超刻技術就受重視了^_^）
3：分割片子時注意場景轉換，極少造成一段場景有分裂感（例如4CD的《特洛伊》和4CD的《黑鷹》）。
4：每個片子壓制的尺寸都以OAR為准，即導演原始版。
5：尺寸統一，幾乎都是800線。（例：WAF20CD DTS版BOB，800*448，見過15CD的HDTVRIP版，居然有兩種尺寸！）我不清楚，一部大片為什麼大家會忍受得了解析度為640甚至以下的版本？
6：有極強的負責任的製作態度，發現有瑕疵的一般都會推出修復版．
7：喜歡WAF的DTS和AC3音頻和高碼率壓縮的視頻．
8：WAF每部片分割成的CD數一般都比別的小組製作的要多，這是為了保證必要的畫質和音質的質量。試想想有個加長版《角鬥士》使用DTS音軌，卻只分割成2CD，每CD有70多分鍾長，不知這樣壓縮出來的片子畫質能好到什麼程度？
所以說，WAF小組出品的DVDRip一般都是網上最清晰的版本。

問題補充:

普通家用電視的解析度是多少？是不是屏幕越大解析度越高？

電視的NTSC標准為720x480 刷新率為60Hz ， PAL為720x576，刷新率為50Hz。我國電視廣播採用 PAL制。

逐行電視接收隔行信號經過差補後可以達到逐行輸出，同時75Hz刷新率，或者隔行輸出，同時100Hz刷新率。

雖然PAL制可達576線，但普通電視的實際可分辨水平線數只有300~500。高清電視理論上可達720P 和1080i，就是說最多逐行720線。所以按理論來說，搞清電視用1024x768的VGA輸入也勉強可以表現出來了，但實際因為聚焦不準，文字顯示比能顯示1024x768的顯示器差很多，畫面顯示則沒什麼問題。

HDTV是不是沒有經過壓縮，最原始的視頻？

網路中流傳的HDTV主要以兩類文件的方式存在，一類是經過MPEG-2標准壓縮，以.tp和.ts為後綴的視頻流文件，一類是經過WMV-HD （Windows Media Video High Definition）標准壓縮過的.wmv文件，還有少數文件後綴為.avi或.mpg，其性質與.wmv是完全一樣的。

H.264等壓縮格式是不是為了方便網上傳播？

在技術上,H.264標准中有多個閃光之處,如統一的VLC符號編碼,高精度、多模式的位移估計,基於4塊的整數變換、分層的編碼語法等。這些措施使得H.264得演算法具有很高的編碼效率,在相同的重建圖像質量下,能夠比H.263節約50%左右的碼率。H.264的碼流結構網路適應性強,增加了差錯恢復能力,能夠很好地適應IP和無線網路的應用。

H.264能以較低的數據速率傳送基於聯網協議（IP）的視頻流,在視頻質量、壓縮效率和數據包恢復丟失等方面,超越了現有的MPEG-2、MPEG-4和H.26x視頻通訊標准,更適合窄帶傳輸。

網上流傳的Rip格式是什麼意思？DVDRip

DVDRip理解:其實就是一種DVD的備份技術。

DVD我們都知道，目前非常優秀的媒體格式，MPEG2編碼的視頻；AC3、DTS的音軌。但是我們也知道DVD載體是DVD光碟，D5一張就有4.7G。顯然，直接將DVD文件進行網路傳送毫無實際價值可言，將這樣的文件打包傳到伺服器上只會佔用伺服器的硬碟和大量的網路帶寬。還沒有多少人的網路帶寬可以讓他毫不動容地去下載一個7、8GB的文件只為了看兩個小時電影，更不要說將它們保存下來，DVD刻錄機這樣的產品目前也不是一般人能擁有的。
這就需要rip了，將DVD的視頻、音頻、字幕剝離出來，再經過壓縮或者其他處理，然後重新合成成多媒體文件。在更小的文件尺寸上達到DVD的是視聽享受。
另外,團IDC網上有許多產品團購,便宜有口碑

閱讀全文

熱點內容

shell腳本如何發送發布：2025-03-11 00:14:37 瀏覽：606

dnf資料庫修改發布：2025-03-11 00:13:53 瀏覽：936

python字典對象發布：2025-03-11 00:08:02 瀏覽：900

python27formac 發布：2025-03-11 00:04:03 瀏覽：308

蘋果8p為什麼一直要輸id密碼發布：2025-03-10 23:55:31 瀏覽：12

java文件上傳實例發布：2025-03-10 23:51:29 瀏覽：194

ftp對象控制發布：2025-03-10 23:48:06 瀏覽：330

手機配置哪些不能給別人看發布：2025-03-10 23:47:28 瀏覽：470

通常在哪個目錄存放配置文件信息發布：2025-03-10 23:42:25 瀏覽：199

ftp伺服器什麼意思發布：2025-03-10 23:42:17 瀏覽：864

vlc演算法

與vlc演算法相關的資訊