圖像數字化是以哪種進制存儲
A. 計算機中儲存的文字圖形圖像等是不是都是被數字化的並以文件形式存放的數據
是的,電腦中所有數據都是以二進制數據進行存儲、傳輸、計算的。
文字圖形圖像的內容都是數字,並以文件的形式存儲。
B. 在flash中,數字化圖像數據在計算機中一般有哪兩種存儲方式
1、以點陣圖的形式存儲;
2、以矢量的形式存儲。
C. 圖片的數字化和需要的工具
隨著數字技術的不斷發展和應用,現實生活中的許多信息都可以用數字形式的數據進行處理和存儲,數字圖像就是這種以數字形式進行存儲和處理的圖像。利用計算機可以對它進行常現圖像處理技術所不能實現的加工處理,還可以將它在網上傳輸,可以多次拷貝而不失真。
一、獲得圖像的方法
許多帶有圖像的文件都使用模擬圖像如35mm幻燈片、透射片或反射片。要獲得一個數字圖像必須將圖像中的像素轉換成數字信息,以便在計算機上進行處理和加工。將模擬圖像轉換成數字圖像的工作,通常可由掃描儀來完成。掃描儀測量從圖片發出或反射的光,依次記錄光點的數值並產生一個彩色或黑白的數字拷貝。這個圖像被翻譯成一系列的數字後存儲在計算機的硬碟上或者其他的電子介質上,如可移動式硬碟,圖形CD或記錄磁帶等。一旦圖像被轉換成數字文件,它就能夠被電子化地從一台計算機傳輸到另一台計算機上。
需了解的術語
模擬圖像——一個以連續形式存儲的數據。如在海邊用傳統相機拍攝的照片就是模擬圖像。
數字圖像——用二進制數字處理的數據(如通和斷),如用數碼相機拍攝的數字照片。
掃描儀——一個數字化的輸入設備,產生比特圖的拷貝,用以電子化地加工處理。
二、設計規劃數字化的方法
一個應用范圍廣泛的軟體可以支持數字化的圖像處理,如產生數字圖形,修改數字圖片,進行一些諸如頁面設計之類的技術加工,並將一些圖素組合在一個圖像中。
通過應用這些軟體所產生的圖像被分成為兩大類,即矢量圖形和點陣圖圖像。
矢量圖形經常用於線段繪圖,標識語句作圖和任何需要平滑過渡邊緣清晰的圖像。矢量圖形的一個優點就是它們能夠被任意放大、縮小而不損失細節和清晰度,也不會扭曲。
點陣圖圖像通常是圖片或照片一類的圖像,如用掃描儀得到的圖像。點陣圖圖像利用掃描儀中的軟體將圖片的信息「映射」到虛擬的圖形柵格中對應的空間,彩色像素填充每一個小格中,由此組成整個圖像。與矢量圖形不同的是,如果沒有非常好的圖像質量,點陣圖圖像是不能被任意放大的。當圖像擴大時,像素柵格尺寸也相應增加,清晰度就下降了。因此為了獲得足夠的圖像細節,選擇掃描點陣圖圖像的尺寸很重要。點陣圖圖像文件通常要比矢量圖形文件大得多,因為再生圖像時需要更多的信息。
用來描述圖形圖像文件的格式有許多,其中兩個應用最廣的是TIFF(Tagged Image File Format)格式和EPS(Ecapsulated Postscript)格式。TIFF是常用的點陣圖圖像格式,而矢量圖形則類似於EPS文件。不同類型的圖形圖像文件能夠被組合在一起,以一種通用的文件格式來設計和排版。
在設計排版完成以後,所有的圖素都被集中在一個文件中,這個文件可包含存儲於不同文件格式中的矢量圖形和點陣圖圖像。這個文件可轉換為輸出設備所要求的光柵圖形格式文件(一種點陣圖形式)。輸出設備中光柵的大小是固定的,它取決於輸出設備的解析度。此時文件中的所有圖素,無論原來是什麼格式,都將被點陣圖化以便輸出設備能夠再現圖像。
需要了解的術語
矢量圖形——一種可以任意縮放但不損失細節的圖形文件。
點陣圖圖像——一種以像素或點的格式進行存儲的圖像文件。
光柵圖像處理器——是一種軟硬體合一的設備,能將圖形文件轉換成輸出所需的一系列點的數據。
解析度——也稱解像度,單位長度上像素的數量,常用單位是dpi(像素點/英寸)。
三、數字圖像再現的方法
利用不同的技術可以在一台寬幅輸出設備上產生數字圖像,其中液體噴墨技術、靜電技術、固體噴墨技術、熱轉換技術和照相技術是當今採用的幾種主要的技術。
這里對幾種技術做大致的介紹:
噴墨技術
根據需要通過施加壓力迫使油墨滴落到需要產生圖像的介質上。
連續性——油墨在壓力下連續地形成墨滴的射流,噴射到需要形成圖像的介質上。
熱效應——在噴嘴口產生氣泡,氣泡的壓力把墨滴推到介質上。
固態墨——油墨以固態形式存儲,需要時將其熔化,用類似液態油墨噴射的方法印在介質上。
熱敏蠟或熱敏樹脂轉換技術
蠟或樹脂用於膠片載體,通常是輥軸狀的。蠟或樹脂通過加熱被轉印到介質上,每一種顏色必須分開轉印。
染料熱升華技術
類似於熱敏轉換技術,當受控的熱源發熱時,熱升華染料被蒸發從載體輥上轉印到介質上去。
靜電技術
特殊的介質上帶有靜電電荷的圖像,靜電吸引了彩色的微粒形成彩色圖像,典型的靜電列印機打出的圖像每種顏色是分開的。
霧化濺射技術
單獨放置的彩墨通過噴嘴直接噴濺到介質上去。
數字圖像能夠應用於紙介質、乙烯基薄膜介質、纖維織物、塑料和許多其他材料上,可根據需要選擇最合適的輸出設備和介質。
四、後處理
使用特殊的介質、油墨或滾壓成像的圖像,都能夠經受得住日曬和日常氣候條件變化的影響。同樣,不幹膠也給數字圖像應用於備種物體表面提供了機會。你可以在公共汽車、飛機、建築物、陶瓷製品、針織物等任何可以裝飾圖案的表面上看到數字圖像。
數字圖像技術正在改變我們處理圖像的方式,它具備許多優點:
當它進入可視信息交流時,數字圖像改變了原有習慣。幾年前,成本、色彩、幅面和印刷周期是大幅面圖像需求者所面對的四大難題。現在數字技術已經成功地進入角色,使得大幅面圖像的製作比以往更加方便實用和實惠。
下面介紹數字圖像技術是如何突破這四大難題的:
成本——數字打樣或預印的成本都明顯低於傳統打樣,使生產全彩色圖像的短版活及單張打樣的價格都在可接受范圍內。
色彩——對於許多項目來說,傳統打樣實在是太貴了,而數字圖像是一種色彩處理工藝,省去了昂貴的打樣步驟。
尺寸——數字圖像技術實際上可以處理任何尺寸的畫面,現有輸出設備的幅寬可以從幾英寸到60英尺以上,對於更大的圖片可以採用分片拼裝的方法來完成。
印刷周期——數字圖像處理是一個自動化的過程,可快速地運作和改變圖像,利用數字圖像技術不僅能夠即要即得,而且可以分別修改圖像內容和文字信息。◎
D. 一個圖像是怎樣數字化的呢
圖像數字化過程 要在計算機中處理圖像,必須先把真實的圖像(照片、畫報、圖書、圖紙等)通過數字化轉變成計算機能夠接受的顯示和存儲格式,然後再用計算機進行分析處理。圖像的數字化過程主要分采樣、量化與編碼三個步驟。1.采樣
采樣的實質就是要用多少點來描述一幅圖像,采樣結果質量的高低就是用前面所說的圖像解析度來衡量。簡單來講,對二維空間上連續的圖像在水平和垂直方向上等間距地分割成矩形網狀結構,所形成的微小方格稱為像素點。一副圖像就被采樣成有限個像素點構成的集合。例如:一副640*480解析度的圖像,表示這幅圖像是由640*480=307200個像素點組成。
如圖2-2-15所示,左圖是要采樣的物體,右圖是采樣後的圖像,每個小格即為一個像素點。采樣頻率是指一秒鍾內采樣的次數,它反映了采樣點之間的間隔大小。采樣頻率越高,得到的圖像樣本越逼真,圖像的質量越高,但要求的存儲量也越大。
在進行采樣時,采樣點間隔大小的選取很重要,它決定了采樣後的圖像能真實地反映原圖像的程度。一般來說,原圖像中的畫面越復雜,色彩越豐富,則采樣間隔應越小。由於二維圖像的采樣是一維的推廣,根據信號的采樣定理,要從取樣樣本中精確地復原圖像,可得到圖像采樣的奈奎斯特(Nyquist)定理:圖像采樣的頻率必須大於或等於源圖像最高頻率分量的兩倍。2.量化
量化是指要使用多大范圍的數值來表示圖像采樣之後的每一個點。量化的結果是圖像能夠容納的顏色總數,它反映了采樣的質量。
例如:如果以4位存儲一個點,就表示圖像只能有16種顏色;若採用16位存儲一個點,則有216=65536種顏色。所以,量化位數越來越大,表示圖像可以擁有更多的顏色,自然可以產生更為細致的圖像效果。但是,也會佔用更大的存儲空間。兩者的基本問題都是視覺效果和存儲空間的取捨。
假設有一幅黑白灰度的照片,因為它在水平於垂直方向上的灰度變化都是連續的,都可認為有無數個像素,而且任一點上灰度的取值都是從黑到白可以有無限個可能值。通過沿水平和垂直方向的等間隔采樣可將這幅模擬圖像分解為近似的有限個像素,每個像素的取值代表該像素的灰度(亮度)。對灰度進行量化,使其取值變為有限個可能值。
經過這樣采樣和量化得到的一幅空間上表現為離散分布的有限個像素,灰度取值上表現為有限個離散的可能值的圖像稱為數字圖像。只要水平和垂直方向采樣點數足夠多,量化比特數足夠大,數字圖像的質量就比原始模擬圖像毫不遜色。
在量化時所確定的離散取值個數稱為量化級數。為表示量化的色彩值(或亮度值)所需的二進制位數稱為量化字長,一般可用8位、16位、24位或更高的量化字長來表示圖像的顏色;量化字長越大,則越能真實第反映原有的圖像的顏色,但得到的數字圖像的容量也越大。
例如:圖2-2-16,沿線段AB(左圖)的連續圖像灰度值的曲線(右圖),取白色值最大,黑色值最小。 先採樣:沿線段AB等間隔進行采樣,取樣值在灰度值上是連續分布的,如圖2-2-17左圖;
再量化:連續的灰度值再進行數字化(8個級別的灰度級標尺),如圖2-2-17右圖。 3.壓縮編碼數字化後得到的圖像數據量十分巨大,必須採用編碼技術來壓縮其信息量。在一定意義上講,編碼壓縮技術是實現圖像傳輸與儲存的關鍵。
目前已有許多成熟的編碼演算法應用於圖像壓縮。常見的有圖像的預測編碼、變換編碼、分形編碼、小波變換圖像壓縮編碼等。
當需要對所傳輸或存儲的圖像信息進行高比率壓縮時,必須採取復雜的圖像編碼技術。但是,如果沒有一個共同的標准做基礎,不同系統間不能兼容,除非每一編碼方法的各個細節完全相同,否則各系統間的連接十分困難。
為了使圖像壓縮標准化,20世紀90年代後,國際電信聯盟(ITU)、國際標准化組織ISO和國際電工委員會IEC今年來已經制定並繼續制定一系列靜止和活動圖像編碼的國際標准,現已批準的標准主要有JPEG標准、MPEG標准、H.261等。這些標准和建議是在相應領域工作的各國專家合作研究的成果和經驗的總結。這些國際標準的出現也使圖像編碼尤其使視頻圖像編碼壓縮技術得到了飛速發展。目前,按照這些標准做的硬體、軟體產品和專用集成電路已經在市場上大量涌現(如圖像掃描儀、數碼相機、數碼攝錄像機等),這對現代圖像通信的迅速發展和開拓圖像編碼新的應用領域發揮了重要作用。
E. 一個圖像是如何數字化的
2.2.2 圖像數字化過程 要在計算機中處理圖像,必須先把真實的圖像(照片、畫報、圖書、圖紙等)通過數字化轉變成計算機能夠接受的顯示和存儲格式,然後再用計算機進行分析處理。圖像的數字化過程主要分采樣、量化與編碼三個步驟。1.采樣
采樣的實質就是要用多少點來描述一幅圖像,采樣結果質量的高低就是用前面所說的圖像解析度來衡量。簡單來講,對二維空間上連續的圖像在水平和垂直方向上等間距地分割成矩形網狀結構,所形成的微小方格稱為像素點。一副圖像就被采樣成有限個像素點構成的集合。例如:一副640*480解析度的圖像,表示這幅圖像是由640*480=307200個像素點組成。
如圖2-2-15所示,左圖是要采樣的物體,右圖是采樣後的圖像,每個小格即為一個像素點。采樣頻率是指一秒鍾內采樣的次數,它反映了采樣點之間的間隔大小。采樣頻率越高,得到的圖像樣本越逼真,圖像的質量越高,但要求的存儲量也越大。
在進行采樣時,采樣點間隔大小的選取很重要,它決定了采樣後的圖像能真實地反映原圖像的程度。一般來說,原圖像中的畫面越復雜,色彩越豐富,則采樣間隔應越小。由於二維圖像的采樣是一維的推廣,根據信號的采樣定理,要從取樣樣本中精確地復原圖像,可得到圖像采樣的奈奎斯特(Nyquist)定理:圖像采樣的頻率必須大於或等於源圖像最高頻率分量的兩倍。2.量化
量化是指要使用多大范圍的數值來表示圖像采樣之後的每一個點。量化的結果是圖像能夠容納的顏色總數,它反映了采樣的質量。
例如:如果以4位存儲一個點,就表示圖像只能有16種顏色;若採用16位存儲一個點,則有216=65536種顏色。所以,量化位數越來越大,表示圖像可以擁有更多的顏色,自然可以產生更為細致的圖像效果。但是,也會佔用更大的存儲空間。兩者的基本問題都是視覺效果和存儲空間的取捨。
假設有一幅黑白灰度的照片,因為它在水平於垂直方向上的灰度變化都是連續的,都可認為有無數個像素,而且任一點上灰度的取值都是從黑到白可以有無限個可能值。通過沿水平和垂直方向的等間隔采樣可將這幅模擬圖像分解為近似的有限個像素,每個像素的取值代表該像素的灰度(亮度)。對灰度進行量化,使其取值變為有限個可能值。
經過這樣采樣和量化得到的一幅空間上表現為離散分布的有限個像素,灰度取值上表現為有限個離散的可能值的圖像稱為數字圖像。只要水平和垂直方向采樣點數足夠多,量化比特數足夠大,數字圖像的質量就比原始模擬圖像毫不遜色。
在量化時所確定的離散取值個數稱為量化級數。為表示量化的色彩值(或亮度值)所需的二進制位數稱為量化字長,一般可用8位、16位、24位或更高的量化字長來表示圖像的顏色;量化字長越大,則越能真實第反映原有的圖像的顏色,但得到的數字圖像的容量也越大。
例如:圖2-2-16,沿線段AB(左圖)的連續圖像灰度值的曲線(右圖),取白色值最大,黑色值最小。 先採樣:沿線段AB等間隔進行采樣,取樣值在灰度值上是連續分布的,如圖2-2-17左圖;
再量化:連續的灰度值再進行數字化(8個級別的灰度級標尺),如圖2-2-17右圖。 3.壓縮編碼數字化後得到的圖像數據量十分巨大,必須採用編碼技術來壓縮其信息量。在一定意義上講,編碼壓縮技術是實現圖像傳輸與儲存的關鍵。
目前已有許多成熟的編碼演算法應用於圖像壓縮。常見的有圖像的預測編碼、變換編碼、分形編碼、小波變換圖像壓縮編碼等。
當需要對所傳輸或存儲的圖像信息進行高比率壓縮時,必須採取復雜的圖像編碼技術。但是,如果沒有一個共同的標准做基礎,不同系統間不能兼容,除非每一編碼方法的各個細節完全相同,否則各系統間的連接十分困難。
為了使圖像壓縮標准化,20世紀90年代後,國際電信聯盟(ITU)、國際標准化組織ISO和國際電工委員會IEC今年來已經制定並繼續制定一系列靜止和活動圖像編碼的國際標准,現已批準的標准主要有JPEG標准、MPEG標准、H.261等。這些標准和建議是在相應領域工作的各國專家合作研究的成果和經驗的總結。這些國際標準的出現也使圖像編碼尤其使視頻圖像編碼壓縮技術得到了飛速發展。目前,按照這些標准做的硬體、軟體產品和專用集成電路已經在市場上大量涌現(如圖像掃描儀、數碼相機、數碼攝錄像機等),這對現代圖像通信的迅速發展和開拓圖像編碼新的應用領域發揮了重要作用。
F. 圖像的數字化是什麼
圖像的數字化是首先要把一幅畫面分解為若干個像素,這便相當於「取樣」。組成畫面的像素越多,相當於所取的樣值越多,出來的圖像也越清晰。
對每一像素要進化量化。一是對亮度進行量化,一是對色彩進行量化。所有顏色都是由紅、綠、藍三原色調配而成的,所以對色彩的量化還要分解為對三原色的量化,利用三者不同的比例,組成不同的顏色。如果用8位二進制數,也就是用一個位元組對亮度進行量化,則每一像素可以有256種不同亮度。如果對每一原色,也各用一個位元組量化,便可調配出256×256×256=16777216種顏色。
對量化的值用二進制數表現出來,便是編碼。
如果一個畫面由1024×768=786432個像素組成,每一像素的亮度和色彩共用4個位元組量化,則每幀畫面便擁有3145728位元組的數據。要獲得動作流暢的畫面,需要每秒提供30幀畫面,也就是需要數據的傳輸速度達94371840位元組/秒。
G. 圖像是如何數字化的呢
首先要把圖片打格子分成若干小塊,每塊用一個數字來表示一種顏色。如果圖像是純黑白兩色的,那每塊只用1或0表示即可。若圖像是16色的,每塊用4位二進數表示,因為2^4=16,即4位二進制有16種組合,每種組合表示一種顏色就行了。真彩色點陣圖的每個小塊,都是由不同等級的紅綠藍三種色彩組合的,如圖所示,每種顏色有2^8個等級,所以共有2^24種顏色, 因此每小塊需要24位二進制數來表示。
可見,數字圖像越艷麗,則需要記錄的二進制數就越多越長。除此之外,打的格子越密,則一副圖的總數據量就越大,此例中鴨子圖片分成了11×14=154塊,按真彩色點陣圖來計算,則總數據量為154×24=3696比特。這些小格子顯然是太大了,不能表現圖片的細節,實際中的格子要密得多,例如1024×768,這是大家都熟悉的顯示分辯率。
看這張滑雪圖,人體的色彩變化比較大,而天空和雪的色彩卻非常單調,可以想像,代表每個小格顏色的數值也應該非常接近,圖右下的原始數據是8個相鄰格子的色彩數據,由於兩個相鄰格子的數據差異很小,所以可以用第一個格式數據當作第二個格子數據的預測值,經實際測量後,把真實值與預測值的差值求出來,並用這個差值來表示第二個格子的色彩。那麼,實際記錄下的就是第三行差值。但恢復數據時,用前面一個值加上差值,就是當前的色彩值,只要有第一位的基礎值,後面的色彩值就可以滾雪球式的一個個求出來。
用差值來記錄色彩,只是簡單地進行了很多個減法運算,在還原時再加回來,數據並沒有一丁點的損失,因此被稱為無損壓縮,如果把很少的差值徹底丟棄,在還原時把一個格子的色彩信息代表了周圍很多格子的色彩,則壓縮率更高,但格子之間的微小差別就丟失了,這種方法屬於有損壓縮。
點陣圖是每個格子都獨立記錄的,因此數據量很大,這就是bmp格式,而經過了上述的預測差值運算後,就變成了有損壓縮格式,jpg格式就是其中之一。畫質基本相同的兩幅圖,jpg格式的數據量要比bmp小得多。jpg是有損壓縮的,但畫質的損失非常小。Jpg格式是很智能的,例如對上面有大面積相似色彩的山水照給予較大的壓縮率,而對非常熱鬧的人群照給予較小的壓縮率。
上面說的只是靜態的圖像,而視頻圖像壓縮得更大,一秒鍾視頻會切換幾十張畫面,而這些畫面的絕大部分都是相同的,採集是每幅都是獨立採的,生成的avi格式的數據量是很大的,不僅每幅畫面本身可以壓縮,更重要的是幅與幅之間也可以壓縮,這就形成了數據量小得多的mpeg格式。也可以採用壓縮率更高的rm格式,rm格式的畫質比mpeg差得不多,但數據量卻小了很多倍,更方便在網上傳輸。
不同的視頻,幅與幅之間的相似度是不同的,韓劇的相似度很大,甭說一秒了,甚至幾分鍾內演員都坐在沙發上聊,除了嘴巴外每幅畫面都基本一樣,對這種視頻可以採用較大的壓縮率,而對動感性很強的武打片,則採用較小的壓縮率,這種格式就是rmvb。跟rm格式不同的是,它的壓縮率是可變的,vb就是可變比特率的意思。rmvb比rm更先進,相同數據量的rmvb視頻會比rm視頻清晰,而相同清晰度的視頻,rmvb格式的數據量會更小。
一旦進行了有損壓縮,數據缺失了,畫質就很難復原了,但這也並不是不可能,這裡面有個關鍵的概念–先驗信息。例如這張民國美女黑白照片的嘴唇,要壓縮成這個灰度,右側的彩色圖例中有五種可能,但通過先驗信息(先驗信息也就是我們以前已經知道了的知識)知道,美女的嘴唇不可能是綠的、藍的和紫的,只能是右下的紅色,把它還原成紅色就對了。
鋼琴和弦的每一小組樂音都是由不超過五個純音符的組合,這些排列組合的總數還是不少的,但好在根據先驗信息我們知道,只有極少數的組合是經常出現的,絕大多數的組合是基本不會出現的,如果我們得到了一組模糊不清的組合,它跟經常出現的某個組合與基本不會出現的某個組合的相似度一樣,那我們就毫不猶豫地認定它就是那個經常出現的組合。
當然,實際上它不是那個經常出現的組合,而是那個基本不會出現的組合,這種可能性也是不能排除的,就好比那個民國美女真的長了一副藍嘴唇一樣,我們依靠先驗信息做的判斷就杯具了,但這是沒辦法的事。
現在的核磁共振技術在短時間內只能獲得比較粗糙的圖像,但我們知道被照器官的每一小塊部分與相鄰部分的相關性是很強的,而且我們對這些器官也具有很多先驗信息,這就可以幫助我們像還原民國美女圖那樣,在粗糙的圖像上還原出高畫質的圖像,可信度還可以做得非常高。
H. 什麼是音頻數字化,圖像數字化,請詳細講解
從字面上來說,數字化 (Digital) 就是以數字來表示,例如用數字去記錄一張桌子的長寬尺寸,各木料間的角度,這就是一種數字化。跟數位常常一起被提到的字是模擬 (Analog/Analogue) ,模擬的意思就是用一種相似的東西去表達,例如將桌子用傳統相機將三視圖拍下來,就是一種模擬的記錄方式。
兩個概念:
1、分貝(dB):聲波振幅的度量單位,非絕對、非線性、對數式度量方式。以人耳所能聽到的最靜的聲音為1dB,那麼會造成人耳聽覺損傷的最大聲音為100dB。人們正常語音交談大約為20dB。10dB意味著音量放大10倍,而20dB卻不是20倍,而是100倍(10的2次方)。
2、頻率(Hz):人們能感知的聲音音高。男性語音為180Hz,女性歌聲為600Hz,鋼琴上C調至A調間為440Hz,電視機發出人所能聽到的聲音是17kHz,人耳能夠感知的最高聲音頻率為20kHz。
將音頻數字化,其實就是將聲音數字化。最常見的方式是透過脈沖編碼調制PCM(Pulse Code Molation) 。運作原理如下。首先我們考慮聲音經過麥克風,轉換成一連串電壓變化的信號,如圖一所示。這張圖的橫座標為秒,縱座標為電壓大小。要將這樣的信號轉為 PCM 格式的方法,是先以等時距分割。我們假設用每 0.01 秒分割,則得到圖二。
我們把分割線與信號圖形交叉處的座標位置記錄下來,可以得到如下資料,(0.01,11.65) 、(0.02,14.00) 、 (0.03,16.00) 、 (0.04,17.74) … ..(0.18,15.94) 、 (0.19,17.7) 、 (0.20,20) 。好了,我們現在已經把這個波形以數字記錄下來了。由於我們已經知道時間間隔是固定的 0.01 秒,因此我們只要把縱座標記錄下來就可以了,得到的結果就是 11.65 14.00 16.00 17.74 19.00 19.89 20.34 20.07 19.44 18.59 17.47 16.31 15.23 14.43 13.89 13.71 14.49 15.94 17.70 20.00 這一數列。這一串數字就是將以上信號數字化的結果。看吧,我們確實用數字記錄了事物。在以上的範例中,我們的采樣頻率是 100Hz(1/0.01 秒 ) 。其實電腦中的 .WAV 檔的內容就是類似這個樣子,文件頭中記錄了采樣頻率和可容許最大記錄振幅,後面就是一連串表示振幅大小的數字,有正有負。常見CD唱盤是以PCM格式記錄,而它的采樣頻率 (Sample Rate) 是 44100Hz ,振幅采樣精度/數位是 16Bits ,也就是說振幅最小可達 -32768(-2^16/2) ,最大可達 +32767(2^16/2-1) 。CD唱盤是以螺旋狀由內到外儲存資料,可以存儲74分鍾的音樂。CD唱盤的規格為什麼是 44.1kHz、16Bits呢?關於 44.1kHz 這個數字的選取分為兩個層面。首先人耳的聆聽范圍是 20Hz 到 20kHz ,根據 Nyquist Functions ,理論上只要用 40kHz 以上的采樣頻率就可以完整記錄 20kHz 以下的信號。那麼為什麼要用 44.1kHz 這個數字呢?那是因為在 CD 發明前硬碟還很貴,所以主要將數字音頻信號儲存媒體是錄像帶,用黑白來記錄 0 與 1 。而當時的錄像帶格式為每秒 30 張,而一張圖又可以分為 490 條線,每一條線又可以儲存三個取樣信號,因此每秒有 30*490*3=44100 個取樣點,而為了研發的方便, CD唱盤也繼承了這個規格,這就是 44.1kHz 的由來。在這里我們可以發現無論使用多麼高的采樣精度/數位,記錄的數字跟實際的信號大小總是有誤差,因此數字化無法完全記錄原始信號。我們稱這個數字化造成失真稱為量化失真。
--------------------------------------------------------------------------------
數字化的最大好處是資料傳輸與保存的不易失真。記錄的資料只要數字大小不改變,記錄的資料內容就不會改變。如果我們用傳統類比的方式記錄以上信號,例如使用錄音帶表面的磁場強度來表達振幅大小,我們在復制資料時,無論電路設計多麼嚴謹,總是無法避免雜訊的介入。這些雜訊會變成復制後資料的一部份,造成失真,且復制越多次信噪比 ( 信號大小與噪音大小的比值 ) 會越來越低,資料的細節也越來越少。如果多次復制過錄音帶,對以上的經驗應該不陌生。在數字化的世界裡,這串數字轉換為二進制,以電壓的高低來判讀1與0,還可以加上各種檢查碼,使得出錯機率很低,因此在一般的情況下無論復制多少次,資料的內容都是相同,達到不失真的目的。
那麼,數字化的資料如何轉換成原來的音頻信號呢?在計算機的音效卡中一塊晶元叫做 DAC(Digital to Analog Converter) ,中文稱數模轉換器。DAC的功能如其名是把數字信號轉換回模擬信號。我們可以把DAC想像成 16 個小電阻,各個電阻值是以二的倍數增大。當 DAC 接受到來自計算機中的二進制 PCM 信號,遇到 0 時相對應的電阻就開啟,遇到 1 相對應的電阻不作用,如此每一批 16Bits 數字信號都可以轉換回相對應的電壓大小。我們可以想像這個電壓大小看起來似乎會像階梯一樣一格一格,跟原來平滑的信號有些差異,因此再輸出前還要通過一個低通濾波器,將高次諧波濾除,這樣聲音就會變得比較平滑了。
從前面的內容可以看出,音頻數字化就是將模擬的(連續的)聲音波形數字化(離散化),以便利用數字計算機進行處理的過程,主要包參數括采樣頻率(Sample Rate)和采樣數位/采樣精度(Quantizing,也稱量化級)兩個方面,這二者決定了數字化音頻的質量。采樣頻率是對聲音波形每秒鍾進采樣的次數。根據這種采樣方法,采樣頻率是能夠再現聲音頻率的一倍。人耳聽覺的頻率上限在2OkHz左右,為了保證聲音不失真,采樣頻率應在4OkHz左右。經常使用的采樣頻率有11.025kHz、22.05kHz和44.lkHz等。采樣頻率越高,聲音失真越小、音頻數據量越大。采樣數位是每個采樣點的振幅動態響應數據范圍,經常採用的有8位、12位和16位。例如,8位量化級表示每個采樣點可以表示256個(0-255)不同量化值,而16位量化級則可表示65536個不同量化值。采樣量化位數越高音質越好,數據量也越大。
反映音頻數字化質量的另一個因素是通道(或聲道)個數。記錄聲音時,如果每次生成一個聲波數據,稱為單聲道;每次生成二個聲波數據,稱為立體聲(雙聲道),立體聲更能反映人的聽覺感受。
除了上述因素外,數字化音頻的質量還受其它一些因素(如揚聲器質量,麥克風優劣,計算機音效卡A/D與D/A(模/數、數/模)轉換晶元品質,各個設備連接線屏蔽效果好壞等)的影響。
綜上所述,聲音數字化的采樣頻率和量化級越高,結果越接近原始聲音,但記錄數字聲音所需存儲空間也隨之增加。可以用下面的公式估算聲音數字化後每秒所需的存儲量(假定不經壓縮):
存儲量=(采樣頻率*采樣數位)/8(位元組數)
若採用雙聲道錄音,存儲量再增加一倍。例如,數字激光唱盤(CD-DA,紅皮書標准)的標准采樣頻率為44.lkHz,采樣數位為16位,立體聲,可以幾乎無失真地播出頻率高達22kHz的聲音,這也是人類所能聽到的最高頻率聲音。激光唱盤一分鍾音樂需要的存儲量為:
44.1*1000*l6*2*60/8=10,584,000(位元組)=10.584MBytes
這個數值就是微軟Windows系統中WAVE(.WAV)聲音文件在硬碟中所佔磁碟空間的存儲量。由MICROSOFT公司開發的WAV聲音文件格式,是如今計算機中最為常見的聲音文件類型之一,它符合RIFF文件規范,用於保存WINDOWS平台的音頻信息資源,被WINDOWS平台機器應用程序所廣泛支持。另外,WAVE格式支持MSADPCM、CCIPTALAW、CCIPT-LAW和其他壓縮演算法,支持多種音頻位數,采樣頻率和聲道,但其缺點是文件體積較大,所以不適合長時間記錄。因此,才會出現各種音頻壓縮編/解碼技術的出現,例如,MP3,RM,WMA,VQF,ASF等等它們各自有自己的應用領域,並且不斷在競爭中求得發展。