解壓靜音
❶ 多媒體知識
多媒體知識全接觸 教程第一篇 多媒體基本概念
1.多媒體的定義
「多媒體」一詞譯自英文「Multimedia」,而該詞又是由mutiple和media復合而成的。媒體(medium)原有兩重含義,一是指存儲信息的實體,如磁碟、光碟、磁帶、半導體存儲器等,中文常譯作媒質;二是指傳遞信息的載體,如數字、文字、聲音、圖形等,中文譯作媒介。所以與多媒體對應的一詞是單媒體(Monomedia),從字面上看,多媒體就是由單媒體復合而成的啦。
多媒體技術從不同的角度有著不同的定義。比如有人定義「多媒體計算機是一組硬體和軟體設備;結合了各種視覺和聽覺媒體,能夠產生令人印象深刻的視聽效果。在視覺媒體上,包括圖形、動畫、圖像和文字等媒體,在聽覺媒體上,則包括語言、立體聲響和音樂等媒體。用戶可以從多媒體計算機同時接觸到各種各樣的媒體來源」。還有人定義多媒體是「傳統的計算媒體----文字、圖形、圖像以及邏輯分析方法等與視頻、音頻以及為了知識創建和表達的互動式應用的結合體」。概括起來就是:多媒體技術,即是計算機互動式綜合處理多媒體信息----文本、圖形、圖像和聲音,使多種信息建立邏輯連接,集成為一個系統並具有交互性。簡言之,多媒體技術就是具有集成性、實時性和交互性的計算機綜合處理聲文圖信息的技術(這句話的三性可是精髓哦!)。多媒體在我國也有自己的定義,一般認為多媒體技術指的就是能對多種載體(媒介)上的信息和多種存儲體(媒介)上的信息進行處理的技術。
2.多媒體的關鍵技術
由於多媒體系統需要將不同的媒體數據表示成統一的結構碼流,然後對其進行變換、重組和分析處理,以進行進一步的存儲、傳送、輸出和交互控制。所以,多媒體的傳統關鍵技術主要集中在以下四類中:數據壓縮技術、大規模集成電路(VLSI)製造技術、大容量的光碟存儲器(CD-ROM)、實時多任務操作系統。因為這些技術取得了突破性的進展,多媒體技術才得以迅速的發展,而成為像今天這樣具有強大的處理聲音、文字、圖像等媒體信息的能力的高科技技術。
但說到當前要用於互聯網路的多媒體關鍵技術,有些專家卻認為可以按層次分為媒體處 理與編碼技術、多媒體系統技術、多媒體信息組織與管理技術、多媒體通信網路技術、多媒 體人機介面與虛擬現實技術,以及多媒體應用技術這六個方面。而且還應該包括多媒體同步 技術、多媒體操作系統技術、多媒體中間件技術、多媒體交換技術、多媒體資料庫技術、超 媒體技術、基於內容檢索技術、多媒體通信中的QoS管理技術、多媒體會議系統技術、多媒 體視頻點播與交互電視技術、虛擬實景空間技術等等。
3.一般多媒體系統的組成部分
一般的多媒體系統由如下四個部分的內容組成:
多媒體硬體系統、多媒體操作系統、媒體處理系統工具和用戶應用軟體。
★ 多媒體硬體系統:包括計算機硬體、聲音/視頻處理器、多種媒體輸入/輸出設備及信號轉換裝置、通信傳輸設備及介面裝置等。其中,最重要的是根據多媒體技術標准而研製生成的多媒體信息處理晶元和板卡、光碟驅動器等。
★ 多媒體操作系統:或稱為多媒體核心系統(Multimedia kernel system),具有實時任務調度、多媒體數據轉換和同步控制對多媒體設備的驅動和控制,以及圖形用戶界面管理等。
★ 媒體處理系統工具:或稱為多媒體系統開發工具軟體,是多媒體系統重要組成部分。
★ 用戶應用軟體:根據多媒體系統終端用戶要求而定製的應用軟體或面向某一領域的用戶應用軟體系統,它是面向大規模用戶的系統產品。
第二篇 多媒體計算機的組成
1.多媒體個人機的解釋
在多媒體計算機之前,傳統的微機或個人機處理的信息往往僅限於文字和數字,只能算是計算機應用的初級階段,同時,由於人機之間的交互只能通過鍵盤和顯示器,故交流信息的途徑缺乏多樣性。為了改換人機交互的介面,使計算機能夠集聲、文、圖、像處理於一體,人類發明了有多媒體處理能力的計算機。我們這里重點談談個人機(就是現在說的PC啦)。所以現在你該明白,所謂多媒體個人機(Multimedia Personal Computer, MPC)無非就是具有了多媒體處理功能的個人計算機(如早期的586機型),它的硬體結構與一般所用的個人機並無太大的差別,只不過是多了一些軟硬體配置而已。一般用戶如果要擁有MPC大概有兩種途徑:一是直接夠買具有多媒體功能的PC機;二是在基本的PC機上增加多媒體套件而構成MPC。到奔Ⅱ橫行的今天,對計算機廠商和開發人員來說,MPC已經成為一種必須具有的技術規范。
2.多媒體計算機的基本配置(及可選配置)
一般來說,多媒體個人計算機(MPC)的基本硬體結構可以歸納為七部分:
★ 至少一個功能強大、速度快的中央處理器(CPU);
★ 可管理、控制各種介面與設備的配置;
★ 具有一定容量(盡可能大)的存儲空間;
★ 高解析度顯示介面與設備;
★ 可處理音響的介面與設備;
★ 可處理圖像的介面設備;
★ 可存放大量數據的配置等;
這樣提供的配置是最基本MPC的硬體基礎,它們構成MPC的主機。除此以外,MPC能擴充的配置還可能包括如下幾個方面:
★ 光碟驅動器:包括可重寫光碟驅動器(CD-R)、WORM光碟驅動器和CD-ROM驅動器。其中CD-ROM驅動器為MPC帶來了價格便宜的650M存儲設備,存有圖形、動畫、圖像、聲音、文本、數字音頻、程序等資源的CD-ROM早已廣泛使用,因此現在光碟機對廣大用戶來說已經是必須配置的了。而可重寫光碟、WORM光碟價格較貴,目前還不是非常普及。另外,DVD出現在市場上也有些時日了,它的存儲量更大,雙面可達17GB,是升級換代的理想產品。
★ 音頻卡:在音頻卡上連接的音頻輸入輸出設備包括話筒、音頻播放設備、MIDI合成器、耳機、揚聲器等。數字音頻處理的支持是多媒體計算機的重要方面,音頻卡具有A/D和D/A音頻信號的轉換功能,可以合成音樂、混合多種聲源,還可以外接MIDI電子音樂設備。
★ 圖形加速卡:圖文並茂的多媒體表現需要解析度高,而且同屏顯示色彩豐富的顯示卡的
支持,同時還要求具有Windows的顯示驅動程序,並在Windows下的像素運算速度要快。所以現在帶有圖形用戶介面GUI加速器的局部匯流排顯示適配器使得Windows的顯示速度大大加快。
★ 視頻卡:可細分為視頻捕捉卡、視頻處理卡、視頻播放卡以及TV編碼器等專用卡,其功能是連接攝像機、VCR影碟機、TV等設備,以便獲取、處理和表現各種動畫和數字化視頻媒體。
★ 掃描卡:它是用來連接各種圖形掃描儀的,是常用的靜態照片、文字、工程圖輸入設備。
★ 列印機介面:用來連接各種列印機,包括普通列印機、激光列印機、彩色列印機等,列印機現在已經是最常用的多媒體輸出設備之一了。
★ 交互控制介面:它是用來連接觸摸屏、滑鼠、光筆等人機交互設備的,這些設備將大大方便用戶對MPC的使用。
★ 網路介面:是實現多媒體通信的重要MPC擴充部件。計算機和通信技術相結合的時代已經來臨,這就需要專門的多媒體外部設備將數據量龐大的多媒體信息傳送出去或接收進來,通過網路介面相接的設備包括視頻電話機、傳真機、LAN和ISDN等。
3.媒體播放器在WEB中的應用
我們知道,由於聲音點播和影視點播應用還沒有完全直接集成到現在的Web瀏覽器中,這就需要一個單獨的應用程序來幫助,通常我們使用媒體播放器(Media player)來播放聲音和影視。典型的媒體播放器要執行好幾個功能,包括解壓縮、消除抖動、錯誤糾正和用戶播放等功能。現在可以使用像插件這種技術把媒體播放器的用戶介面放在Web客戶機的用戶界面上,瀏覽器在當前Web頁面上保留屏幕空間,並且由媒體播放器來管理。目前,大多數客戶機使用如下幾種方法來讀取聲音和影視文件:
★ 通過Web瀏覽器把聲音/影視從Web伺服器傳送給媒體播放器;
★ 直接把聲音/影視從Web伺服器傳送給媒體播放器
★ 直接把聲音/影視從多媒體流放伺服器傳送給媒體播放器;
在這個過程中,媒體播放器的主要功能表現在如下四個方面:
★ 解壓縮:幾乎所有的聲音和電視圖象都是經過壓縮之後存放在存儲器中的,因此無論播放來自於存儲器或者來自網路上的聲音和影視都要解壓縮。
★ 去抖動:由於到達接收端的每個聲音信息包和電視圖象信息包的時延不是一個固定的數值,如果不加任何措施就原原本本地把數據送到媒體播放器播放,聽起來就會有抖動的感覺,甚至對聲音和電視圖象所表達的信息無法理解。在媒體播放器中,限制這種抖動的簡單方法是使用緩存技術,就是把聲音或者電視圖象數據先存放在緩沖存儲器中,經過一段延時之後再播放。
★ 錯誤處理:由於在網際網路上往往會出現讓人不能接收的交通擁擠,信息包中的部分信息在傳輸過程中就可能會丟失。如果連續丟失的信息包太多,用戶接收的聲音和圖象質量就不能容忍。採取的辦法往往是重傳。
★ 用戶可控制的介面:這是用戶直接控制媒體播放器播放媒體的實際介面。媒體播放器為用戶提供的控制功能通常包括聲音的音量大小、暫停/重新開始和跳轉等等。
第三篇 圖像和圖形
1.有關色彩的基本常識
我們知道,只要是彩色都可用亮度、色調和飽和度來描述,人眼中看到的任一彩色光都是這三個特徵的綜合效果。那麼亮度、色調和飽和度分別指的是什麼呢?
★ 亮度:是光作用於人眼時所引起的明亮程度的感覺,它與被觀察物體的發光強度有關;★ 色調:是當人眼看到一種或多種波長的光時所產生的彩色感覺,它反映顏色的種類,是決定顏色的基本特性,如紅色、棕色就是指色調;
★ 飽和度:指的是顏色的純度,即摻入白光的程度,或者說是指顏色的深淺程度,對於同一色調的彩色光,飽和度越深顏色越鮮明或說越純。通常我們把色調和飽和度通稱為色度。 現在你該明白了,亮度是用來表示某彩色光的明亮程度,而色度則表示顏色的類別與深淺程度。除此之外,自然界常見的各種顏色光,都可由紅(R)、綠(G)、藍(B)三種顏色光按不同比例相配而成;同樣絕大多數顏色光也可以分解成紅、綠、藍三種色光,這就形成了色度學中最基本的原理----三原色原理(RGB)。
2.目前常見的圖形(圖像)格式
一般來說,目前的圖形(圖像)格式大致可以分為兩大類:一類為點陣圖;另一類稱為描繪類、矢量類或面向對象的圖形(圖像)。前者是以點陣形式描述圖形(圖像)的,後者是以數學方法描述的一種由幾何元素組成的圖形(圖像)。一般說來,後者對圖像的表達細致、真實,縮放後圖形(圖像)的解析度不變,在專業級的圖形(圖像)處理中運用較多。
在介紹圖形(圖像)格式前,我們實在有必要先了解一下圖形(圖像)的一些相關技術指標:解析度、色彩數、圖形灰度。
★ 解析度:分為屏幕解析度和輸出解析度兩種,前者用每英寸行數表示,數值越大圖形(圖像)質量越好;後者衡量輸出設備的精度,以每英寸的像素點數表示;
★ 色彩數和圖形灰度:用位(bit)表示,一般寫成2的n次方,n代表位數。當圖形(圖像)達到24位時,可表現1677萬種顏色,即真彩。灰度的表示法類似;
下面我們就通過圖形文件的特徵後綴名(就是如圖.bmp這樣的)來逐一認識當前常見的圖形文件格式:BMP、DIB、PCP、DIF、WMF、GIF、JPG、TIF、EPS、PSD、CDR、IFF、TGA、PCD、MPT。
★ BMP(bit map picture):PC機上最常用的點陣圖格式,有壓縮和不壓縮兩種形式,該格式可表現從2位到24位的色彩,解析度也可從480x320至1024x768。該格式在Windows環境下相當穩定,在文件大小沒有限制的場合中運用極為廣泛。
★ DIB(device independent bitmap):描述圖像的能力基本與BMP相同,並且能運行於多種硬體平台,只是文件較大。
★ PCP(PC paintbrush):由Zsoft公司創建的一種經過壓縮且節約磁碟空間的PC點陣圖格式,它最高可表現24點陣圖形(圖像)。過去有一定市場,但隨著JPEG的興起,其地位已逐漸日落終天了。
★ DIF(drawing interchange formar):AutoCAD中的圖形文件,它以ASCII方式存儲圖形,表現圖形在尺寸大小方面十分精確,可以被CorelDraw,3DS等大型軟體調用編輯。
★ WMF(Windows metafile format):Microsoft Windows圖元文件,具有文件短小、圖案造型化的特點。該類圖形比較粗糙,並只能在Microsoft Office中調用編輯。
★ GIF(graphics interchange format):在各種平台的各種圖形處理軟體上均可處理的經過壓縮的圖形格式。缺點是存儲色彩最高只能達到256種。
★ JPG(joint photographics expert group):可以大幅度地壓縮圖形文件的一種圖形格式。對於同一幅畫面,JPG格式存儲的文件是其他類型圖形文件的1/10到1/20,而且色彩數最高可達到24位,所以它被廣泛應用於Internet上的homepage或internet上的圖片庫。
★ TIF(tagged image file format):文件體積龐大,但存儲信息量亦巨大,細微層次的信息較多,有利於原稿階調與色彩的復制。該格式有壓縮和非壓縮兩種形式,最高支持的色彩數可達16M。
★ EPS(encapsulated PostScript):用PostScript語言描述的ASCII圖形文件,在PostScript圖形列印機上能列印出高品質的圖形(圖像),最高能表示32點陣圖形(圖像)。該格式分為Photoshop EPS格式adobeillustrator EPS和標准EPS格式,其中後者又可以分為圖形格式和圖像格式。
★ PSD(photoshop standard):Photoshop中的標准文件格式,專門為Photoshop而優化的格式。
★ CDR(coreldraw):CorelDraw的文件格式。另外,CDX是所有CorelDraw應用程序均能使用的圖形(圖像)文件,是發展成熟的CDR文件。
★ IFF(image file format):用於大型超級圖形處理平台,比如AMIGA機,好萊塢的特技大片多採用該圖形格式處理。圖形(圖像)效果,包括色彩紋理等逼真再現原景。當然,該格式耗用的內存外存等的計算機資源也十分巨大。
★ TGA(tagged graphic):是True vision公司為其顯示卡開發的圖形文件格式,創建時期較早,最高色彩數可達32位。VDA,PIX,WIN,BPX,ICB等均屬其旁系。
★ PCD(Photo CD):由KODAK公司開發,其它軟體系統對其只能讀取。
★ MPT(macintosh paintbrush)或MAC:Macintosh機所使用的灰度圖形(圖像)模式,在macintosh paintbrush中使用,其解析度只能是720x567。
除此之外,Macintosh機專用的圖形(圖像)格式還有PNT、PICT、PICT2等。
第四篇 聲音(音頻)
1.多媒體中的音頻處理技術
多媒體涉及到多方面的音頻處理技術,如:音頻採集、語音編碼/解碼、文一-語轉換、音樂合成、語音識別與理解、音頻數據傳輸、音頻一-視頻同步、音頻效果與編輯等。其中數字音頻是個關鍵的概念,它指的是一個用來表示聲音強弱的數據序列,它是由模擬聲音經抽樣(即每隔一個時間間隔在模擬聲音波形上取一個幅度值)量化和編碼(即把聲音數據寫成計算機的數據格式)後得到的。計算機數字CD、數字磁帶(DAT)中存儲的都是數字聲音。模擬一-數字轉換器把模擬聲音變成數字聲音;數字一-模擬轉換器可以恢復出模擬來的聲音。
一般來講,實現計算機語音輸出有兩種方法:一是錄音/重放,二是文一-語轉換。第二種方法是基於聲音合成技術的一種聲音產生技術,它可用於語音合成和音樂合成。而第一種方法是最簡單的音樂合成方法,曾相繼產生了應用調頻(FM)音樂合成技術和波形表(wavetable)音樂合成技術。
2.樂器數字介面MIDI的概念
現在我們用的最多的音頻名詞之一MIDI(musical instrument digital interface)是作為「樂器數字介面」的縮寫出現的,並用它來泛指數字音樂的國際標准。由於它定義了計算機音樂程序、合成器及其他電子設備交換信息和電子信號的方式,所以可以解決不同電子樂器之間不兼容的問題。另外,標準的多媒體PC平台能夠通過內部合成器或連接到計算機MIDI埠的外部合成器播放MIDI文件,利用MIDI文件演奏音樂,所需的存儲量最少。
至於MIDI文件,是指存放MIDI信息的標准文件格式。MIDI文件中包含音符、定時和多達16個通道的演奏定義。文件包括每個通道的演奏音符信息:鍵通道號、音長、音量和力度(擊鍵時,鍵達到最低位置的速度)。由於MDDI文件是一系列指令,而不是波形,它需要的磁碟空間非常少;並且現裝載MIDI文件比波形文件容易的多。這樣,在設計多媒體節目時,我們可以指定什麼時候播放音樂,將有很大的靈活性。在以下幾種情況下,使用MIDI文件比使用波形音頻更合適:需要播放長時間高質量音樂,如想在硬碟上存儲的音樂大於4分鍾,而硬碟又沒有足夠的存儲容量;需要以音樂作背景音響效果,同時從CD-ROM中裝載其它數據,如圖像、文字的顯示;需要以音樂作背景音響效果,同時播放波形音頻或實現文一語轉換,以實現音樂和語音的同時輸出。
3.常見的聲音文件格式
再接下來我們介紹七種目前最為流行的多媒體聲音文件效果讓你認識認識:
★ WAVE,擴展名為WAV:該格式記錄聲音的波形,故只要采樣率高、采樣位元組長、機器速度快,利用該格式記錄的聲音文件能夠和原聲基本一致,質量非常高,但這樣做的代價就是文件太大。
★ MOD,擴展名MOD、ST3、XT、S3M、FAR、669等:該格式的文件里存放樂譜和樂曲使用的各種音色樣本,具有回放效果明確,音色種類無限等優點。但它也有一些致命弱點,以至於現在已經逐漸淘汰,目前只有MOD迷及一些游戲程序中尚在使用。
★ MPEG-3,擴展名MP3:現在最流行的聲音文件格式,因其壓縮率大,在網路可視電話通信方面應用廣泛,但和CD唱片相比,音質不能令人非常滿意。
★ Real Audio,擴展名RA:這種格式真可謂是網路的靈魂,強大的壓縮量和極小的失真使其在眾多格式中脫穎而出。和MP3相同,它也是為了解決網路傳輸帶寬資源而設計的,因此主要目標是壓縮比和容錯性,其次才是音質。
★ Creative Musical Format,擴展名CMF:Creative公司的專用音樂格式,和MIDI差不多,只是音色、效果上有些特色,專用於FM音效卡,但其兼容性也很差。
★ CD Audio音樂CD,擴展名CDA:唱片採用的格式,又叫「紅皮書」格式,記錄的是波形流,絕對的純正、HIFI。但缺點是無法編輯,文件長度太大。
★ MIDI,擴展名MID:目前最成熟的音樂格式,實際上已經成為一種產業標准,其科學性、兼容性、復雜程度等各方面當然遠遠超過本文前面介紹的所有標准(除交響樂CD、Unplug CD外,其它CD往往都是利用MIDI製作出來的),它的General MIDI就是最常見的通行標准。作為音樂工業的數據通信標准,MIDI能指揮各音樂設備的運轉,而且具有統一的標准格式,能夠模仿原始樂器的各種演奏技巧甚至無法演奏的效果,而且文件的長度非常小。
總之,如果有專業的音源設備,那麼要聽同一首曲子的HIFI程度依次是:
原聲樂器演奏 〉 MIDI 〉 CD唱片 〉 MOD 〉 所謂音效卡上的MIDI 〉 CMF,而MP3及RA要看它的節目源是採用MIDI、CD還是MOD了。
另外,在多媒體材料中,存儲聲音信息的文件格式也是需要認識的,共有:
WAV文件、VOC文件、MIDI文件、RMI文件、PCM文件以及AIF文件等若干種。
★ WAV文件:Microsoft公司的音頻文件格式,它來源於對聲音模擬波形的采樣。用不同的采樣頻率對聲音的模擬波形進行采樣可以得到一系列離散的采樣點,以不同的量化位數(8位或16位)把這些采樣點的值轉換成二進制數,然後存入磁碟,這就產生了聲音的WAV文件,即波形文件。Microsoft Sound System軟體Sound Finder可以轉換AIF SND和VOD文件到WAV格式。
★ VOC文件:Creative公司波形音頻文件格式,也是聲霸卡(sound blaster)使用的音頻文件格式。每個VOC文件由文件頭塊(header block)和音頻數據塊(data block)組成。文件頭包含一個標識版本號和一個指向數據塊起始的指針。數據塊分成各種類型的子塊。如聲音數據靜音標識ASCII碼文件重復的結果重復以及終止標志,擴展塊等。
★ MIDI文件:Musical Instrument Digital Interface(樂器數字介面)的縮寫。它是由世界上主要電子樂器製造廠商建立起來的一個通信標准,以規定計算機音樂程序 電子合成器和其它電子設備之間交換信息與控制信號的方法。MIDI文件中包含音符定時和多達16個通道的樂器定義,每個音符包括鍵通道號持續時間音量和力度等信息。所以MIDI文件記錄的不是樂曲本身,而是一些描述樂曲演奏過程中的指令。
★ RMI文件:Microsoft公司的MIDI文件格式,它可以包括圖片標記和文本。
★ PCM文件:模擬音頻信號經模數轉換(A/D變換)直接形成的二進制序列,該文件沒有附加的文件頭和文件結束標志。在聲霸卡提供的軟體中,可以利用VOC-HDR程序,為PCM格式的音頻文件加上文件頭,而形成VOC格式。Windows的Convert工具可以把PCM音頻格式的文件轉換成Microsoft的WAV格式的文件。
★ AIF文件:Apple計算機的音頻文件格式。Windows的Convert工具同樣可以把AIF格式的文件換成Microsoft的WAV格式的文件。
第五篇 視頻(動畫)
1.動態圖像的組成
動態圖像,包括動畫和視頻信息,是連續漸變的靜態圖像或圖形序列,沿時間軸順次更換顯示,從而構成運動視感的媒體。當序列中每幀圖像是由人工或計算機產生的圖像時,我們常稱作動畫;當序列中每幀圖像是通過實時攝取自然景象或活動對象時,我們常成為影像視頻,或簡稱為視頻。動態圖像演示常常與聲音媒體配合進行,二者的共同基礎是時間連續性。一般意義上談到視頻時,往往也包含聲音媒體。但在這里,視頻(動畫)特製不包含聲音媒體的動態圖像。
2.動畫的定義
什麼是動畫?所謂動畫,就是通過以每秒15到20幀的速度(相當接近於全運動視頻幀速)順序地播放靜止圖像幀以產生運動的錯覺。因為眼睛能足夠長時間地保留圖像以允許大腦以連續的序列把幀連接起來,所以能夠產生運動的錯覺。我們可以通過在顯示時改變圖像來生成簡單的動畫。最簡單的方法是在兩個不同幀之間的反復。這種方法對於指示「是」或「不是」的情況來說是很好的解決方法。另一種製作動畫的方法是以循環的形式播放幾個圖像幀以生成旋轉的效果,並且可以依靠計算時間來獲得較好的回放,或用記時器來控制動畫。
3.常見的視頻文件格式
視頻信息在計算機中存放的格式有很多,目前最流行的兩種格式是:
蘋果公司的Quicktime和微軟的AVI。
★ Quicktime:是蘋果公司採用的面向最終用戶桌面系統的低成本、全運動視頻的方式,現在在軟體壓縮和解壓縮中也開始採用這種方式了。其向量量化是Quicktime軟體的壓縮技術之一,它在最高為30幀/秒下提供的視頻解析度是320x240,其壓縮率能從25到200。
★ AVI:類似於Quicktime,是微軟公司採用的音頻視頻交錯格式,也是一種桌面系統上的低成本、低解析度的視頻格式。AVI可在160x120的視窗中以15幀/秒回放視頻,並可帶有8位的聲音,也可以在VGA或超級VGA監視器上回放。AVI很重要的一個特點是可伸縮性,使用AVI演算法時的性能依賴於與它一起使用的基礎硬體。
第六篇 多媒體數據壓縮和編碼技術標准
目前,被國際社會廣泛認可和應用的通用壓縮編碼標准大致有如下四種:
H.261、JPEG、 MPEG和DVI。
★ H.261:由CCITT(國際電報電話咨詢委員會)通過的用於音頻視頻服務的視頻編碼解碼器(也稱Px64標准),它使用兩種類型的壓縮:一幀中的有損壓縮(基於DCT)和用於幀間壓縮的無損編碼,並在此基礎上使編碼器採用帶有運動估計的DCT和DPCM(差分脈沖編碼調制)的混合方式。這種標准與JPEG及MPEG標准間有明顯的相似性,但關鍵區別是它是為動態使用設計的,並提供完全包含的組織和高水平的交互控制。
★ JPEG:全稱是Joint Photogragh Coding Experts Group(聯合照片專家組),是一種基於DCT的靜止圖像壓縮和解壓縮演算法,它由ISO(國際標准化組織)和CCITT(國際電報電話咨詢委員會)共同制定,並在1992年後被廣泛採納後成為國際標准。它是把冗長的圖像信號和其它類型的靜止圖像去掉,甚至可以減小到原圖像的百分之一(壓縮比100:1)。但是在這個級別上,圖像的質量並不好;壓縮比為20:1時,能看到圖像稍微有點變化;當壓縮比大於20:1時,一般來說圖像質量開始變壞。
★ MPEG:是Moving Pictures Experts Group(動態圖像專家組)的英文縮寫,實際上是指一組由ITU和ISO制定發布的視頻、音頻、數據的壓縮標准。它採用的是一種減少圖像冗餘信息的壓縮演算法,它提供的壓縮比可以高達200:1,同時圖像和音響的質量也非常高。現在通常有三個版本:MPEG-1、MPEG-2、MPEG-4以適用於不同帶寬和數字影像質量的要求。它的三個最顯著優點就是兼容性好、壓縮比高(最高可達200:1)、數據失真小。
★ DVI:其視頻圖像的壓縮演算法的性能與MPEG-1相當,即圖像質量可達到VHS的水平,壓縮後的圖像數據率約為1.5Mb/s。為了擴大DVI技術的應用,Intel公司最近又推出了DVI演算法的軟體解碼演算法,稱為Indeo技術,它能將為壓縮的數字視頻文