聲音在電腦中是以什麼形式存儲
① 請問視頻,音頻和圖像都是以何種形式儲存到電腦上的啊
在電腦上,所有文件(包括程序、游戲、操作系統、文字檔案、圖片、視頻、聲音文件等)都是以二進制存在電腦上的。作為文件,XP操作系統是這樣做的,在硬碟中放置一個文件目錄表和一個文件分配表(其實不止一個,有備份)裡面存著每個文件的名稱、大小、起始地址等等信息。(像不像派出所的戶口信息?)不管找哪個文件,操作系統都幫你找到。而真正的文件(其實就是一大串01001011這樣的信息)被存在硬碟的某一處。一般操作系統的文件靠前一些。
電腦是以二進制串描述東西的,比如一個32位串可以表示某一種顏色,那這種32位串可以表示多少種顏色啊?(世界上還有它表示不了的顏色嗎?)但硬碟上某一處的0100111具體表示什麼,只有電腦知道。
② 聲音文件是怎麼存儲的呢
存儲在計算機里的都是以二進制形式存在的,但是音頻是波形的。所以要存到電腦里的話首先要解決的就是如何表示的問題,也是就是編碼。然後要通過介質播放出來,這就是解碼。一般的格式都有這些編碼和解碼功能的。CD也是以二進制形式存儲的。 常見的有WAV,MP3,WMA,OGG,APE,AAC等。他們一般在編碼的基礎上對音頻進行了壓縮,解碼的同時還要進行解壓。
③ 電腦聲音是怎麼儲存的
聲音是通過聲音的編碼儲存的。主要介紹波形編碼中的脈沖編碼調制。PCM通過采樣、量化、編碼三個步驟將連續變化的模擬信號轉換為數字編碼。
采樣:一次振動中,必須有2個點的采樣,關於為什麼有2個點采樣,我在視頻課程中已經介紹了,這里不再贅述。人耳能夠感覺到的最高頻率為20kHz,因此要滿足人耳的聽覺要求,則需要至少每秒進行40k次采樣,用40kHz表達,這個40kHz就是采樣率。
量化:每個聲音樣本若用8位存儲,樣本只能存儲0-255個信息,每個聲音樣本若用16位存儲,則可以存儲0-65535個信息,說明量化精度越高,聲音質量越好。
編碼:量化後的抽樣信號十進制數字信號,應將十進制數字代碼變換成二進制編碼。
常用的采樣率:
8kHz 為電話采樣。
11.025kHz能達到AM調幅廣播的聲音品質。
22.05kHz FM調頻廣播所用采樣率。
44.1kHz 音頻 CD, 也常用於 MPEG-1 音頻(VCD, SVCD, MP3)所用采樣率。
48kHz miniDV、數字電視、DVD、DAT、電影和專業音頻所用的數字聲音所用采樣率。
(3)聲音在電腦中是以什麼形式存儲擴展閱讀
聲音數字化過程:
比如用麥克風錄了一段10秒鍾的聲音。聲音的波形,它是一段光滑的曲線,而計算機就是要盡可能的把這個光滑的曲線在電腦上模擬出來。所以第一步就是,對這曲線進行采樣,比如計算機每秒對這個曲線采樣1次,采樣之後,計算機就把這個10秒的聲音在電腦上模擬出來了。
但這時候我們發現,模擬出來的波形和左邊原始真實的波形相差很大,可以提高計算機的采樣頻率,從每秒1次變成每秒鍾采樣2次,采樣的頻率越高,計算機模擬出來的曲線就越接近於原始聲音的曲線,也就越能還原出原始的聲音。
然後第二步,就是把剛才模擬出來的聲音進行量化,量化的意思就是比如考試成績有51、60、65、23、95、78這樣的分數,但在公布成績的時候,學校發現分數太多,一個一個的公布太麻煩,然後學校規定,60分以下不合格,60-70分之間為合格,71-100為優秀。
把這些不同的分數分成3個不同的等級,之後學校公布成績的時候就說,我校本年度成績不合格人數3人,成績合格人數100人,成績優秀人數500人,這個就是量化。
完成了量化之後就是最後一步,進行編碼。假設量化等級一級(比如不合格這個等級)等於0001,二級(合格這個等級)等於0011,然後以此類推,依次把這些等級記錄成對應的一串0和1就可以了。到這里計算機就完成了把聲音數字化的過程。
④ 文本聲音圖像視頻是如何儲存到計算機里的
通過合理的編碼(或者說數字化)即可保存各種多媒體信息。
對於文本而言,需要制定適當的字元編碼方式。
對於聲音而言,聲音的本質就是振動,因此可以直接存儲波形數據(WAV),也可以對波形進行分解後存儲其幅頻特性並壓縮(MP3)。
對於圖像而言,可以把圖像分解成若干個小點,然後直接存儲每一個點的亮度/顏色(BMP),也可以考慮利用相鄰點的關系、存儲基本的亮度/顏色以及一個區塊變化的幅頻特性並壓縮(JPG)。
對於視頻而言,視頻的本質就是不斷變化(或不變)的圖像。因此可以看做單位時間內若干幀圖像的處理。因此可以考慮相鄰圖像變化的幅頻特性並壓縮(M-JPG)。
⑤ 聲音和圖像在計算機中如何被保存
聲音,也就是音頻,按情況區分。聲音的本質就是介質的振動,所以音頻文件的本質就是怎麼把這些振動情況保存下來。常見的方式有兩種:一種方式是將每個細微時刻的聲音的幅值都保存下來,相當於保存聲音的原始波形;另一種方法則是將聲音在頻域進行分解,將各個時間片內各頻域的聲音幅值保存下來,播放時則相應要重新進行合成。
圖像的本質其實跟聲音差不多,也是若干個規律或不規律的采樣點。所以常見的方式也有兩種:一種方式是將圖像劃分為若干個點,保存每個點的亮度、色度值(或色度分量值);另一種方式是將圖像在頻域進行分解,將一個塊內各個頻域的信號保存下來,顯示時則重新進行合成。