音頻存儲環節
A. 聲音文件是怎麼存儲的呢
存儲在計算機里的都是以二進制形式存在的,但是音頻是波形的。所以要存到電腦里的話首先要解決的就是如何表示的問題,也是就是編碼。然後要通過介質播放出來,這就是解碼。一般的格式都有這些編碼和解碼功能的。CD也是以二進制形式存儲的。 常見的有WAV,MP3,WMA,OGG,APE,AAC等。他們一般在編碼的基礎上對音頻進行了壓縮,解碼的同時還要進行解壓。
B. 怎麼把手機里的音頻存到U盤上
無需依賴電腦,通過 USB OTG 數據線即可連接U 盤。
溫馨提醒:
此功能僅適用於支持 USB OTG 數據線的手機。
如果手機採用 Type-C 介面,請購買華為認可的 Micro USB 轉 Type-C 接頭,或者帶 Type-C 介面的 USB OTG 數據線。
以華為P50 Pro手機為例:
1.通過 USB OTG 數據線將手機和 U 盤連接。
2.打開文件管理 > 瀏覽 > U 盤,瀏覽 U 盤的數據,選擇需要復制的數據,拷貝到目標文件夾。
溫馨提醒:使用該功能前,請提前備份好數據(微信、QQ等第三方應用需單獨備份)將您的設備升級到最新版本。
3.拷貝完畢,點擊設置 > 存儲 > U 盤 > 彈出。
C. 音頻在計算機中的存儲不經過哪個過程
音頻表示聲音或者音樂。它和文字數字等不同,它是隨時間變化的。但是計算機並沒有無限數量的內存單元,音頻在計算機中的存儲要經過采樣量化編碼等過程。
1.采樣我們不能記錄一段時間內的所有一頻信號,但是可以記錄其中的一些。采樣就是我們在模擬信號上選擇數量有限的點來度量它們的值並記錄下來。采樣率是指每秒鍾需要多少個樣本。通常來說每秒40000個樣本的采樣率對音頻信號是足夠好的。
2.量化從每個樣本得到的是真實的數字,但是為沒一個樣本使用一個二進制無符號數會更簡便。量化是指將樣本的值截取為最接近的整數值。如果實際值為。7.2則截取為7實際的值為。
7.8則截取為83.編碼編碼是把量化的樣本值編碼成二進制形式。每樣本位:也稱位深度。是指對於每個樣本分配多少位。以前是8位,現在大多是16、24、32位位率:位深度乘以每秒樣本數就是位率。如果每秒40000個樣本每樣本16位則位率為40000*16=640000b/s=640KB/s。
4.聲音編碼標准現在主流的mp3標准。採用每秒44100個樣本以及每樣本16位,位率為705600b/s。這是一種有損壓縮。
D. 電腦聲音是怎麼儲存的
聲音是通過聲音的編碼儲存的。主要介紹波形編碼中的脈沖編碼調制。PCM通過采樣、量化、編碼三個步驟將連續變化的模擬信號轉換為數字編碼。
采樣:一次振動中,必須有2個點的采樣,關於為什麼有2個點采樣,我在視頻課程中已經介紹了,這里不再贅述。人耳能夠感覺到的最高頻率為20kHz,因此要滿足人耳的聽覺要求,則需要至少每秒進行40k次采樣,用40kHz表達,這個40kHz就是采樣率。
量化:每個聲音樣本若用8位存儲,樣本只能存儲0-255個信息,每個聲音樣本若用16位存儲,則可以存儲0-65535個信息,說明量化精度越高,聲音質量越好。
編碼:量化後的抽樣信號十進制數字信號,應將十進制數字代碼變換成二進制編碼。
常用的采樣率:
8kHz 為電話采樣。
11.025kHz能達到AM調幅廣播的聲音品質。
22.05kHz FM調頻廣播所用采樣率。
44.1kHz 音頻 CD, 也常用於 MPEG-1 音頻(VCD, SVCD, MP3)所用采樣率。
48kHz miniDV、數字電視、DVD、DAT、電影和專業音頻所用的數字聲音所用采樣率。
(4)音頻存儲環節擴展閱讀
聲音數字化過程:
比如用麥克風錄了一段10秒鍾的聲音。聲音的波形,它是一段光滑的曲線,而計算機就是要盡可能的把這個光滑的曲線在電腦上模擬出來。所以第一步就是,對這曲線進行采樣,比如計算機每秒對這個曲線采樣1次,采樣之後,計算機就把這個10秒的聲音在電腦上模擬出來了。
但這時候我們發現,模擬出來的波形和左邊原始真實的波形相差很大,可以提高計算機的采樣頻率,從每秒1次變成每秒鍾采樣2次,采樣的頻率越高,計算機模擬出來的曲線就越接近於原始聲音的曲線,也就越能還原出原始的聲音。
然後第二步,就是把剛才模擬出來的聲音進行量化,量化的意思就是比如考試成績有51、60、65、23、95、78這樣的分數,但在公布成績的時候,學校發現分數太多,一個一個的公布太麻煩,然後學校規定,60分以下不合格,60-70分之間為合格,71-100為優秀。
把這些不同的分數分成3個不同的等級,之後學校公布成績的時候就說,我校本年度成績不合格人數3人,成績合格人數100人,成績優秀人數500人,這個就是量化。
完成了量化之後就是最後一步,進行編碼。假設量化等級一級(比如不合格這個等級)等於0001,二級(合格這個等級)等於0011,然後以此類推,依次把這些等級記錄成對應的一串0和1就可以了。到這里計算機就完成了把聲音數字化的過程。
E. 怎樣對聲音素材進行刪除.合並,復制處理
第5章 音頻素材製作與處理
本章主要學習音頻相關的基礎知識,包括模擬音頻與數字音頻的概念和各自的特點;數字音頻所具有的優勢;模擬音頻轉換為數字音頻的過程和技術指標;常用的數字音頻文件格式;語音合成技術與識別技術的基本原理。本章需要在實驗環節掌握Adobe Audition 2.0音頻處理軟體的基本操作,主要包括錄音、編輯和效果處理三個方面。
& 學習指導
1、模擬音頻 聲音是振動的波,是隨時間連續變化的物理量。因此,自然界的聲音信號是連續的模擬信號,即模擬音頻信號。
聲波與普通波形一樣,可以用三個物理量來描述:振幅、周期和頻率。
(1)振幅:振幅是聲音波形振動的幅度,表示聲音的強弱。
(2)周期:周期是聲音波形完成一次全振動的時間。
(3)頻率:頻率是聲音波形在一秒鍾內完成全振動的次數,表示聲音的音調。
聲音具有三個要素:音調、音色和音強。
(1)音調:音調代表聲音的高低。與頻率有關,頻率越高,音調越高。
(2)音色:音色是聲音的特色。聲音分純音和復音兩種類型。純音的振幅和周期均為常數;復音是具有不同頻率和不同振幅的混合聲音,是影響聲音特色的主要因素。自然界的大部分聲音是復音。在復音中,頻率最低的聲音是「基音」,是聲音的基調。其他頻率的聲音是「諧音」。基音和諧音是構成聲音音色的重要因素。人的聲音、其它生物的聲音以及自然界各種聲響都具有自己獨特的音色。人們往往是依據音色來辨別聲源種類的。
(3)音強:音強是聲音的強度。音強與聲波的振幅成正比,振幅越大,音強越大。
2、模擬音頻的特點
(1)頻率范圍:模擬音頻信號由許多頻率不同的信號組成,每個信號都有各自的頻率范圍,稱為「頻域」或「頻帶」。人耳可聽到的聲音頻率在20Hz-20KHz之間,稱為「可聽域」。頻率高於20KHz的聲音信號稱為「超音頻信號」,頻率低於20Hz的聲音信號稱為「亞音信號」或者「次音信號」。多媒體技術所處理的聲音信號主要是20Hz-20KHz的音頻信號,它包括音樂、語音及自然界的各種聲響。另外,不同種類的聲源頻帶是不同的,例如人類語音頻帶在100Hz -10KHz;高級音響設備頻帶在20Hz-20KHz;而寬頻音響設備的頻帶在10Hz-40KHz。總之,頻帶越寬聲音的表現力越好。
(2)模擬音頻具有連續性。
(3)模擬音頻抗干擾能力差:模擬信號的一個重要的缺點就是雜訊容限較低,抗干擾能力差,雜訊是影響模擬音頻錄音質量的重要原因。音頻信號幅度與雜訊幅度的比值越大越好。音響放大器和揚聲器等還原設備的質量能夠直接影響重放的音質。音質與音色和頻率范圍有關。悅耳的音色、寬廣的頻率范圍,能夠獲得更好的音質。
3、數字音頻 數字音頻是以二進制的方式記錄的音頻,是模擬音頻的數字化表達。
4、數字音頻的優勢 相比模擬音頻信號,數字音頻信號具有很多優勢。
(1)在聲音存儲方面。模擬音頻記錄在磁帶或者唱片等模擬介質中。模擬介質難保存、易老化,造成音質下降。同時,磁帶的存儲效率很低,音頻錄制往往需要大量的磁帶介質進行存儲,成本很高。數字音頻可以文件的形式存儲在光存儲介質或磁存儲介質中,可以實現永久保存,並且存儲成低。
(2)在聲音處理方面。模擬音頻錄制難度高,需要盡量做到一次成功,後期處理難度大。數字音頻技術在聲音處理方面具有極大的優勢,在後期的音頻處理過程中,可以非常容易地進行多種修正以及加工。
(3)在聲音的壓縮方面。模擬音頻的壓縮率很難提高。數字音頻的壓縮優勢明顯。例如目前流行的MP3音頻格式,壓縮率達到10%左右的同時還能保持良好的音質,利於在互聯網上傳播。
5、模擬音頻/數字音頻轉換 模擬音頻信號轉換為數字音頻信號的過程就是對於模擬音頻信號的數字化過程。模擬音頻信號的數字化過程與普通模擬信號數字化過程類似,需要三個步驟:采樣、量化和編碼。
(1)采樣:采樣就是每隔一定的時間間隔T,抽取模擬音頻信號的一個瞬時幅度值樣本,實現對模擬音頻信號在時間上的離散化處理。
(2)量化:量化就是將采樣後的聲音幅度劃分成為多個幅度區間,將落入同一區間的采樣樣本量化為同一個值。量化實現了對模擬信號在幅度上的離散化處理。
(3)編碼:編碼就是將采樣和量化之後的音頻信號轉換為「1」和「0」代表的數字信號。
6、模/數轉換質量的技術指標 影響模/數轉換後的數字音頻信號質量的技術指標主要包括采樣頻率、采樣精度、聲道數和編碼演算法。
(1)采樣頻率。采樣頻率是對聲音波形每秒鍾進采樣的次數。奈奎斯特理論指出:采樣頻率不應低於模擬音頻信號最高頻率的兩倍,這樣才能將數字化的聲音還原為原始聲音。采樣頻率越高,聲音失真越小,音頻數據量越大。
(2)采樣精度。采樣精度表示對聲音振幅的量化精度,即將聲音波形的幅度劃分為多少個幅度區間。8位量化表示,將聲音波形的幅度劃分為28個區間。
(3)聲道數。聲道數表示同一時間產生的聲音波形數。如果每次生成一個聲波數據,稱為單聲道;每次生成二個聲波數據,稱為立體聲。立體聲表達的聲音效果豐富,但存儲空間會增加一倍。
(4)編碼演算法。編碼演算法的作用一方面是採用一定的格式來記錄數據,二是採用一定的演算法來壓縮數據。壓縮比是壓縮編碼的基本指標,表示壓縮的程度,是壓縮後的音頻數據量與壓縮前的音頻數據量的比值。壓縮程度越大,信息丟失越多、信號還原後失真越大。根據不同的應用,應該選用不同的壓縮編碼演算法。
7、數字音頻的存儲空間 模擬音頻數字化過程中的采樣頻率和采樣精度越高,結果越接近原始聲音,但記錄數字聲音所需存儲空間也隨之增加。未經壓縮的音頻文件所需的存儲空間的計算公式如下:
存儲容量(位元組)=(采樣頻率×采樣精度)/8×聲道數×時間
8、數字音頻文件格式 數字化音頻以文件的形式存儲在計算機內。由於音頻數字化過程中採用的技術指標不同,產生了不同的音頻文件格式。常見的數字音頻格式如下:
(1)WAV格式。微軟公司開發的一種聲音文件格式,也叫波形聲音文件,是最早的數字音頻格式。
(2)MIDI格式。也稱作樂器數字介面,是數字音樂/電子合成樂器的統一國際標准。MIDI文件中存儲的是一些指令,由音效卡按照指令將聲音合成出來。
(3)CDA格式。CDA格式是CD音樂格式,取樣頻率為44.1kHz,16位量化位數,CDA格式記錄的是波形流,是一種近似無損的格式。
(4)MP3格式。MP3格式是MPEG-1 Audio Layer 3,能夠以高音質、低采樣率對數字音頻文件進行壓縮。
(5)WMA格式。是微軟公司開發的網路音頻格式。
(6)MP4格式。採用了「知覺編碼」壓縮技術,加入了保護版權的編碼技術。MP4的壓縮比高於MP3,但音質卻沒有下降。
(7)QuickTime格式。蘋果公司推出的一種數字流媒體。
(8)RealAudio格式。Real Networks公司推出的一種文件格式,可以實時傳輸音頻信息。RealAudio文件格式主要有RA、RM、RMX三種,能夠隨著網路帶寬的不同而調整聲音的質量,在保證大多數人聽到流暢聲音的前提下,令帶寬較寬的聽眾獲得更好的音質。
(9)VOC格式。常用在DOS程序和游戲中,是隨音效卡一起產生的數字聲音文件。
(10)AU 格式。應用於互聯網上的多媒體聲音,是UNIX操作系統下的數字聲音文件。
(11)MAC格式。蘋果公司開發的聲音文件格式,廣泛應用與Macintosh平台軟體。
(12)AAC格式。是MPEG-2規范的一部分。壓縮能力強、壓縮質量高。可以在比MP3文件縮小30%的前提下提供更好的音質。
9、語音合成 語音合成是指利用計算機合成語音的一種技術,使計算機能夠產生高清晰度、高自然度的連續語音,具有類似於人一樣的說話的能力。
語音合成可以通過將預先錄制並存儲的語音信號重新播放來實現。也可以採用數字信號處理的方法,通過激勵一個類似人們發聲時聲道諧振特性的時變數字濾波器,調整濾波器的相關參數,生成各種音調的語音。
語音合成可分為三個層次,分別是文字到語音、概念到語音、意向到語音。要合成出高質量的語言,必須遵循人類語言的表達規則,如語義學規則、詞彙規則、語音學規則。
10、語音合成技術分類 按照合成方法分類。分為參數合成法、基音同步疊加法和基於資料庫的語音合成法。
(1)參數合成法。通過調整合成器參數實現語音合成。
(2)基音同步疊加法。通過對時域波形拼接實現語音合成。
(3)基於資料庫的語音合成法。採用預先錄制語音單元並保存在資料庫中,再從資料庫中選擇並拼接出各種語音內容。
按照技術方式分類。分為波形編輯合成、參數分析合成以及規則合成。
(1)波形編輯合成。將語句、短語、詞或音節作為合成單元。這些單元被分別錄音後進行壓縮編碼,組成一個語音庫。重放時,取出相應單元的波形數據,串接或編輯在一起,經解碼還原出語音。這種合成方式也稱為錄音編輯合成。
(2)參數分析合成。以音節、半音節或音素為合成單元。按照語音理論,對所有合成單元的語音進行分析,提取有關語音參數,這些參數經編碼後組成一個合成語音庫;輸出時,根據待合成的語音的信息,從語音庫中取出相應的合成參數,經編輯和連接,順序送入語音合成器。在合成器中,通過合成參數的控制,將語音波形重新還原出來。
(3)規則合成。規則合成存儲的是較小的語音單位,如音素、雙音素、半音節或音節的聲學參數,以及由音素組成音節、再由音節組成詞或句子的各種規則。當輸入字母符號時,合成系統利用規則自動地將它們轉換成連續的語音波形。
11、文語轉換系統 文語轉換系統是語音合成的第一個層次,是將文字內容轉換為語音輸出的語音合成系統。
12、語音合成技術的需求和特點 語音合成技術具有四個方面的需求和特點:自然度、清晰度、表現力和復雜度。
13、語音識別 語音識別技術是讓計算機通過識別和理解,將語音轉變為文本或命令的技術,讓計算機能夠聽懂人類的語言。
14、語音識別系統分類 語音識別系統按照其構成與規模有多種不同的分類標准。根據對說話人說話方式的要求,可以分為孤立字語音識別系統,連接字語音識別系統以及連續語音識別系統;根據對說話人的依賴程度可以分為特定人和非特定人語音識別系統;根據詞彙量大小,可以分為小詞彙量、中等詞彙量、大詞彙量以及無限詞彙量語音識別系統。
15、語音識別的關鍵技術 語音識別技術主要包括特徵提取技術、模式匹配技術及模型訓練技術。此外,還涉及到語音識別單元的選取。語音識別單元有單詞、音節和音素三種。
(1)特徵提取技術。在豐富的語音信號中提取出對語音識別有用的信息,通過對語音信號進行分析處理,去除對語音識別無關緊要的冗餘信息,獲得影響語音識別的重要信息。
(2)模型訓練技術。按照一定準則,從已知模式中獲取表徵該模式本質特徵的模型參數。
(3)模式匹配技術。根據一定準則,使未知模式與模型庫中的某一個模型獲得最佳匹配。
16、音頻處理軟體Adobe Audition 該軟體是集音頻的錄制、混合、編輯和控制於一身的音頻處理工具軟體。可以輕松創建音樂、製作廣播短片、修復錄制缺陷。基本功能包括以下方面:
(1)錄音。
(2)混音。將不同音軌中的聲音混合在一起,綜合輸出經過混合的聲音效果。
(3)聲音編輯。例如聲音的淡入淡出、聲音移動和剪輯、音調調整、播放速度調整等。
(4)效果處理。軟體帶有不同類型的效果器,如壓縮器、限制器、均衡器、合唱效果器、延遲效果器、回升效果器等,能夠實時處理聲音的效果。
(5)降噪:實現在不影響音質的情況下,去除雜訊。
(6)聲音壓縮。軟體具有支持目前幾乎所有流行的音頻文件類型,並能夠實現類型的轉換和文件壓縮。
(7)協同創作。能夠與多種音樂軟體協同運行,實現音樂創作。
17、音頻處理軟體Adobe Audition基本操作 Adobe Audition 2.0 音頻處理軟體具有三種編輯模式界面,分別是多軌編輯模式、單軌編輯模式以及CD模式。多軌與單軌界面大致可以分為菜單欄、工具欄、文件/效果器列表欄、音軌顯示區、基本功能區和電平顯示區。
常用的音頻編輯方法主要是對音頻波形進行裁剪、切分、合並、鎖定、編組、刪除、復制以及對音頻進行包絡編輯和時間伸縮編輯。
音頻特效處理主要使用各種效果器,主要包括均衡效果處理、混響效果處理、壓限效果處理、延遲效果處理等。
& 習題解析
一、單選題
1.人耳可以聽到的聲音頻率范圍為 。
A)20-20kHz
B)200-15 kHz
C)50-20 kHz
D)10-20 kHz
答案:A
解析:人耳聽到的聲音頻帶范圍是有限的,頻率低於20Hz和高於20000Hz的聲音信號人類聽不到,即表示人耳的可聽域在20-20000Hz之間。
2. 格式的數字音頻是微軟公司開發的網路音頻格式。
A)WAV
B)WMA
C)MP3
D)RM
答案:B
解析:WMA格式是Windows Media Audio的縮寫,是微軟公司開發的網路音頻格式。其壓縮率一般可以達到1:18。
3.聲音的三個要素中不包括 。
A)音調
B)音質
C)音色
D)音強
答案:B
解析:聲音具有三個要素:音調、音色和音強。
4.描述模擬音頻信號的三個物理量中, 表示聲音的音調。
A)振幅
B)音色
C)頻率
D)音強
答案:C
解析:自然界的聲音信號是連續的模擬信號,可以用三個物理量來描述:振幅、周期、頻率。其中,頻率是聲音波形在一秒鍾內完成全振動的次數,表示聲音的音調。
5.描述模擬音頻信號的三個物理量中, 表示聲音的強弱。
A)振幅
B)音色
C)頻率
D)周期
答案:A
解析:自然界的聲音信號是連續的模擬信號,可以用三個物理量來描述:振幅、周期、頻率。其中,振幅是聲音波形振動的幅度,表示聲音的強弱。
6.人們主要依據聲音的 特點來區分和辨別聲源的種類。
A)振幅
B)音色
C)音強
D)音調
答案:B
解析:人的聲音、其它生物的聲音以及自然界各種聲響都具有自己獨特的音色。人們往往是依據音色來辨別聲源種類的。
7.人類語音的頻帶寬度是 Hz。
A)200-3400
B)100-10000
C)20-20000
D)20-15000
答案:B
解析:人類語音的頻帶寬度為100Hz-10000Hz。
8.模擬音頻的聲音質量主要與音色和 有關。
A)聲音強度
B)頻率范圍
C)聲音音調
D)基音
答案:B
解析:模擬音頻的聲音質量簡稱「音質」,與音色和頻率范圍有關。悅耳的音色、寬廣的頻率范圍,能夠獲得更好的音質。
9.將模擬聲音信號轉換為數字音頻信號的數字化過程是 。
A)采樣→編碼→量化
B)編碼→采樣→量化
C)量化→編碼→采樣
D)采樣→量化→編碼
答案:D
解析:模擬音頻信號的數字化過程與普通模擬信號數字化過程類似,需要三個步驟:采樣、量化和編碼。
10.將模擬音頻信號在時間上進行離散化處理,這一過程叫 。
A)量化
B)編碼
C)采樣
D)壓縮
答案:C
解析:要使模擬音頻信號數字化,首先要在時間上對其進行離散化處理,這一過程叫采樣。
11.以下數字音頻文件格式中, 稱為樂器數字介面,是數字音樂/電子合成樂器的統一國際標准。
A)MP3
B)WAV
C)MIDI
D)QuickTime
答案:C
解析:MIDI格式是Musical Instrument Digital Interface的縮寫,又稱作樂器數字介面,是數字音樂/電子合成樂器的統一國際標准。在MIDI文件中存儲的是一些指令,把這些指令發送給音效卡,由音效卡按照指令將聲音合成出來。
12.影響數字音頻信號質量的主要技術指標是 。
A)采樣頻率和量化精度
B)壓縮和解壓縮
C)錄音和播放
D)模擬和壓縮
答案:A
解析:影響數字音頻信號質量的主要技術指標主要包括采樣頻率、采樣精度、聲道數和編碼演算法。這些指標決定了數字化音頻的質量。
13.奈奎斯特采樣理論指出,采樣頻率不低於聲音信號最高頻率的 倍。
A)3
B)1/2
C)1/3
D)2
F. 小學信息技術音頻文件的存儲格式
1.WAV文件格式
WAV格式是音頻文件中使用最廣泛的未壓縮格式之一。它的全稱是Waveform Audio格式,在1991年由微軟和IBM共同推出。音頻容器使用未壓縮技術,主要用於在CD中存儲錄音。
盡管目前這種格式在用戶使用端不是很流行,但它仍然廣泛運用於音頻錄制。因為WAV遵循標準的14位編碼,並且採用未壓縮技術,所以它的文件比較大。理想情況下,一分鍾未壓縮WAV文件的大小約為10 MB。不過,用戶仍然可以選擇使用無損壓縮技術來壓縮WAV文件。
2.AIFF文件格式
和WAV一樣,AIFF文件也是未壓縮的。AIFF文件格式基於IFF(可互換文件格式),最初由蘋果公司推出,這也是蘋果公司製造的設備主要支持該格式音頻的原因。AIFF格式是在存儲CD錄音的WAV格式之前3年推出的。目前,蘋果用戶主要使用的AIFF-C格式就是AIFF格式的壓縮版本。
3.PCM音頻文件
PCM音頻格式也是一種常用的未壓縮格式,它主要用於把音頻文件存儲到CD和DVD中。PCM代表脈沖編碼調制,是一種可以將模擬音頻文件轉換為數字格式的技術。為了達到理想情況,機器會以不同的間隔對音頻文件進行采樣,這就對應生成了文件的采樣率。線性脈沖編碼調制(LPCM)便是用於存儲音頻文件的PCM格式的子類型之一。
PCM、WAV與AIFF的差別
AIFF與WAV之間的實際差異並不突出,二者只是版權歸屬不同。WAV歸微軟所有,而AIFF歸蘋果所有。但二者的相同點是非常顯著的,即這兩種格式都需要依賴PCM技術將模擬聲音轉換為數字格式。也就是說,PCM是AIFF和WAV都包含的技術。而具體選擇哪種格式主要取決於用戶擁有的設備類型。
G. 聲音文件是怎麼存儲的呢
摘要 存儲在計算機里的都是以二進制形式存在的,但是音頻是波形的。所以要存到電腦里的話首先要解決的就是如何表示的問題,也是就是編碼。然後要通過介質播放出來,這就是解碼。一般的格式都有這些編碼和解碼功能的。CD也是以二進制形式存儲的。 常見的有WAV,MP3,WMA,OGG,APE,AAC等。他們一般在編碼的基礎上對音頻進行了壓縮,解碼的同時還要進行解壓。
H. 聲音文件的存儲格式及其區別
1. WAV格式,是微軟公司開發的一種聲音文件格式,也叫波形聲音文件,是最早的數字音頻格式,被Windows平台及其應用程序廣泛支持。WAV格式支持許多壓縮演算法,支持多種音頻位數、采樣頻率和聲道,採用44.1kHz的采樣頻率,16位量化位數,跟CD一樣,對存儲空間需求太大不便於交流和傳播。
2. MIDI是Musical Instrument Digital Interface的縮寫,又稱作樂器數字介面,是數字音樂/電子合成樂器的統一國際標准。它定義了計算機音樂程序、數字合成器及其它電子設備交換音樂信號的方式,規定了不同廠家的電子樂器與計算機連接的電纜和硬體及設備間數據傳輸的協議,可以模擬多種樂器的聲音。MIDI文件就是MIDI格式的文件,在MIDI文件中存儲的是一些指令。把這些指令發送給音效卡,由音效卡按照指令將聲音合成出來。
3. 大家都很熟悉CD這種音樂格式了,擴展名CDA,其取樣頻率為44.1kHz,16位量化位數,跟WAV一樣,但CD存儲採用了音軌的形式,又叫「紅皮書」格式,記錄的是波形流,是一種近似無損的格式。
4. MP3全稱是MPEG-1 Audio Layer 3,它在1992年合並至MPEG規范中。MP3能夠以高音質、低采樣率對數字音頻文件進行壓縮。換句話說,音頻文件(主要是大型文件,比如WAV文件)能夠在音質丟失很小的情況下(人耳根本無法察覺這種音質損失)把文件壓縮到更小的程度。
5. MP3Pro是由瑞典Coding科技公司開發的,其中包含了兩大技術:一是來自於Coding科技公司所特有的解碼技術,二是由MP3的專利持有者法國湯姆森多媒體公司和德國Fraunhofer集成電路協會共同研究的一項解碼技術。MP3Pro可以在基本不改變文件大小的情況下改善原先的MP3音樂音質。它能夠在用較低的比特率壓縮音頻文件的情況下,最大程度地保持壓縮前的音質。
6. WMA (Windows Media Audio)是微軟在互聯網音頻、視頻領域的力作。WMA格式是以減少數據流量但保持音質的方法來達到更高的壓縮率目的,其壓縮率一般可以達到1:18。此外,WMA還可以通過DRM(Digital Rights Management)方案加入防止拷貝,或者加入限制播放時間和播放次數,甚至是播放機器的限制,可有力地防止盜版。
7. MP4採用的是美國電話電報公司(AT&T)所研發的以「知覺編碼」為關鍵技術的a2b音樂壓縮技術,由美國網路技術公司(GMO)及RIAA聯合公布的一種新的音樂格式。MP4在文件中採用了保護版權的編碼技術,只有特定的用戶才可以播放,有效地保證了音樂版權的合法性。另外MP4的壓縮比達到了1:15,體積較MP3更小,但音質卻沒有下降。不過因為只有特定的用戶才能播放這種文件,因此其流傳與MP3相比差距甚遠。
8. SACD(SA=SuperAudio)是由Sony公司正式發布的。它的采樣率為CD格式的64倍,即2.8224MHz。SACD重放頻率帶寬達100kHz,為CD格式的5倍,24位量化位數,遠遠超過CD,聲音的細節表現更為豐富、清晰。
9. QuickTime是蘋果公司於1991年推出的一種數字流媒體,它面向視頻編輯、Web網站創建和媒體技術平台,QuickTime支持幾乎所有主流的個人計算平台,可以通過互聯網提供實時的數字化信息流、工作流與文件回放功能。現有版本為QuickTime 1.0、2.0、3.0、4.0和5.0,在5.0版本中還融合了支持最高A/V播放質量的播放器等多項新技術。
10. VQF格式是由YAMAHA和NTT共同開發的一種音頻壓縮技術,它的壓縮率能夠達到1:18,因此相同情況下壓縮後VQF的文件體積比MP3小30%~50%,更便利於網上傳播,同時音質極佳,接近CD音質(16位44.1kHz立體聲)。但VQF未公開技術標准,至今未能流行開來。
11. DVD Audio 是新一代的數字音頻格式,與DVD Video尺寸以及容量相同,為音樂格式的DVD光碟,取樣頻率為「48kHz/96kHz/192kHz」和「44.1kHz/88.2kHz/176.4kHz」可選擇,量化位數可以為16、20或24比特,它們之間可自由地進行組合。低采樣率的192kHz、176.4kHz雖然是2聲道重播專用,但它最多可收錄到6聲道。而以2聲道192kHz/24b或6聲道96kHz/24b收錄聲音,可容納74分鍾以上的錄音,動態范圍達144dB,整體效果出類拔萃
12. Sony公司的MD(MiniDisc)大家都很熟悉了。MD之所以能在一張小小的盤中存儲60~80分鍾採用44.1khz采樣的立體聲音樂,就是因為使用了ATRAC演算法(自適應聲學轉換編碼)壓縮音源。這是一套基於心理聲學原理的音響解碼系統,它可以把CD唱片的音頻壓縮到原來數據量的大約1/5而聲音質量沒有明顯的損失。ATRAC利用人耳聽覺的心理聲學特性(頻譜掩蔽特性和時間掩蔽特性)以及人耳對信號幅度、頻率、時間的有限分辨能力,編碼時將人耳感覺不到的成分不編碼,不傳送,這樣就可以相應減少某些數據量的存儲,從而既保證音質又達到縮小體積的目的。
13. RealAudio是由Real Networks公司推出的一種文件格式,最大的特點就是可以實時傳輸音頻信息,尤其是在網速較慢的情況下,仍然可以較為流暢地傳送數據,因此RealAudio主要適用於網路上的在線播放。現在的RealAudio文件格式主要有RA(RealAudio)、RM(RealMedia,RealAudio G2)、RMX(RealAudio Secured)等三種,這些文件的共同性在於隨著網路帶寬的不同而改變聲音的質量,在保證大多數人聽到流暢聲音的前提下,令帶寬較寬敞的聽眾獲得較好的音質。
14. Liquid Audio是一家提供付費音樂下載的網站。它通過在音樂中採用自己獨有的音頻編碼格式來提供對音樂的版權保護。Liquid Audio的音頻格式就是所謂的LQT。如果想在PC中播放這種格式的音樂,你就必須使用Liquid Player和Real Jukebox其中的一種播放器。這些文件也不能夠轉換成MP3和WAV格式,因此這使得採用這種格式的音頻文件無法被共享和刻錄到CD中。如果非要把Liquid Audio文件刻錄到CD中的話,就必須使用支持這種格式的刻錄軟體和CD刻錄機。
15. Audible擁有四種不同的格式:Audible1、2、3、4。Audible.com網站主要是在互聯網上販賣有聲書籍,並對它們所銷售商品、文件通過四種Audible.com 專用音頻格式中的一種提供保護。每一種格式主要考慮音頻源以及所使用的收聽的設備。格式1、2和 3採用不同級別的語音壓縮,而格式4採用更低的采樣率和MP3相同的解碼方式,所得到語音吐辭更清楚,而且可以更有效地從網上進行下載。Audible 所採用的是他們自己的桌面播放工具,這就是Audible Manager,使用這種播放器就可以播放存放在PC或者是傳輸到攜帶型播放器上的Audible格式文件。
16.VOC文件,在DOS程序和游戲中常會遇到這種文件,它是隨聲霸卡一起產生的數字聲音文件,與WAV文件的結構相似,可以通過一些工具軟體方便地互相轉換。
17.AU文件,在Internet上的多媒體聲音主要使用該種文件。AU文件是UNIX操作系統下的數字聲音文件,由於早期Internet上的Web伺服器主要是基於UNIX的,所以這種文件成為WWW上唯一使用的標准聲音文件。
18.AIFF(.AIF) 是蘋果公司開發的聲音文件格式,被Macintosh平台和應用程序所支持。
19. Amiga聲音(.SVX):Commodore所開發的聲音文件格式,被Amiga平台和應用程序所支持,不支持壓縮。
20.MAC聲音(.snd) :Apple計算機公司所開發的聲音文件格式,被Macintosh平台和多種Macintosh應用程序所支持,支持某些壓縮。
21.S48(stereo、48kHz)採用MPEG-1 layer 1、MPEG-1 layer 2(簡稱Mp1,Mp2)聲音壓縮格式,由於其易於編輯、剪切,所以在廣播電台應用較廣。
22.AAC實際上是高級音頻編碼的縮寫。AAC是由Fraunhofer IIS-A、杜比和AT&T共同開發的一種音頻格式,它是MPEG-2規范的一部分。AAC所採用的運演算法則與MP3的運演算法則有所不同,AAC通過結合其他的功能 來提高編碼效率。AAC的音頻演算法在壓縮能力上遠遠超過了以前的一些壓縮演算法(比如MP3等)。它還同時支持多達48個音軌、15個低頻音軌、更多種采樣率和比特率、多種語言的兼容能力、更高的解碼效率。總之,AAC可以在比MP3文件縮小30%的前提下提供更好的音質。
23.數字音頻以音質優秀、傳播無損耗、可進行多種編輯和轉換而成為主流,並且應用於各個方面。
I. 音頻,視頻如何在計算機硬碟中存儲原理是啥
聲音是通過聲音的編碼儲存的。主要介紹波形編碼中的脈沖編碼調制。PCM通過采樣、量化、編碼三個步驟將連續變化的模擬信號轉換為數字編碼。
采樣:一次振動中,必須有2個點的采樣,關於為什麼有2個點采樣,我在視頻課程中已經介紹了,這里不再贅述。人耳能夠感覺到的最高頻率為20kHz,因此要滿足人耳的聽覺要求,則需要至少每秒進行40k次采樣,用40kHz表達,這個40kHz就是采樣率。
量化:每個聲音樣本若用8位存儲,樣本只能存儲0-255個信息,每個聲音樣本若用16位存儲,則可以存儲0-65535個信息,說明量化精度越高,聲音質量越好。
編碼:量化後的抽樣信號十進制數字信號,應將十進制數字代碼變換成二進制編碼。
常用的采樣率:
8kHz為電話采樣。
11.025kHz能達到AM調幅廣播的聲音品質。
22.05kHzFM調頻廣播所用采樣率。
44.1kHz音頻CD,也常用於MPEG-1音頻(VCD,SVCD,MP3)所用采樣率。
48kHzminiDV、數字電視、DVD、DAT、電影和專業音頻所用的數字聲音所用采樣率。
(9)音頻存儲環節擴展閱讀
聲音數字化過程:
比如用麥克風錄下10秒的聲音。聲音的波形,是一條平滑的曲線,而電腦正試圖在電腦上盡可能地模擬這條平滑的曲線。第一步是對曲線進行采樣,假設計算機每秒對曲線進行一次采樣,然後計算機在計算機上模擬10秒的聲音。
但這一次我們發現模擬波形和離開原來的實際波形差異很大,可以提高計算機的采樣頻率,從1每秒每秒采樣2次,采樣頻率越高,計算機模擬曲線更接近於原始聲音,將恢復原來的聲音。
然後第二步是量化模擬聲音,和定量手段如考試成績是51歲,60歲,65年,23歲,95年,78個這樣的點,但在公布成績,學校發現太多,成績發布太麻煩的話,那麼學校的規定,低於60點,作為一個合格的60-70分之間,71-100。
把這些不同的分數分為三個不同的年級,然後當學校公布成績的時候,就會說,我校今年不合格的人數3人,合格的人數100人,優秀的人數500人,這是量化的。
一旦量化完成,最後一步就是編碼。假設量化級別1(如不合格級別)等於0001,級別2(如合格級別)等於0011,以此類推,然後將這些級別記錄為相應的0和1序列。在這里,計算機完成了將聲音數字化的過程。