SWB演算法
『壹』 怎麼通過手機找藍牙耳機
高清語音的優點同樣可以在現有網路中體現出來。隨著窄帶網路和設備向高清語音過渡,一種名為帶寬擴展(BWE)的語音處理技術可以用來在接收終端設備上模擬類似於高清語音的通話質量,為不支持高清語音的設備提供了一個折中的解決方案。
從窄帶到高清語音
傳統電話系統的帶寬被限制在大約300Hz到3.4kHz的音頻頻率范圍內(圖表1),這一范圍通常被稱為窄帶語音。盡管現在的電話系統是數字式的,但其還是傳承了與傳統模擬系統相同的帶寬。從語音質量的角度來看,窄帶語音缺乏自然語音保真度,常常被形容為單薄和模糊不清。盡管如此,窄帶頻率范圍內完整語句的語音辨別度大概是99%。
高清語音在采樣頻率為16kHz時音頻帶寬大約為50Hz至7kHz,因此與窄帶語音相比具有更清晰的語音信號。雖然寬頻語音並沒有顯著提高語音清晰度,但是窄帶范圍之外的3.4kHz至7kHz提高了單詞中的摩擦音(例如f、s和th) 的識別度。寬頻語音能夠提供更加自然真實的語音,在主觀音頻質量方面比窄帶語音有了顯著的提高。高清語音擴展出的50Hz至300Hz的低頻降低了窄帶語音尖細的特點,而擴展出的高頻則提高了發音清晰度。
在主觀語音質量聽力測試中,寬頻語音在平均意見得分(MOS)中得到4.5分,而窄帶語音則為3.2分(1分為質量差,5分為優秀)。寬頻語音質量的提高減少了聽力負擔和聽者的疲勞,特別是當聽者處於嘈雜的環境下。移動網路運營商Orange在其網站上提供了一個音頻樣本作為高清語音優點的例證。2010年6月Orange公司所做的另一項調查進一步向終端用戶證明了高清語音的價值:
* 96%的客戶對高清語音通話表示滿意;
* 86%的測試者表示,兼容高清語音將是他們未來購買手機時的一個選擇標准;
* 76%的測試者願意更換手機以獲得高清語音功能。
此外,2006年愛立信和T-Mobile進行的用戶試用調查也證實了高清語音的優點。在150個抽樣用戶中,超過70%的人認為使用了高清語音手機後通話質量更好,在嘈雜的環境中對話質量有所提高。
使用高清語音需要語音通信系統中的所有環節都支持寬頻語音頻率范圍。採用高清語音技術的關鍵是在蜂窩網路和手持電話中協同部署AMR-WB編解碼。做為一種寬頻語音編碼,AMR-WB的有效音頻帶寬是窄帶編碼AMR-NB的兩倍。要完成一個高清語音通話,基站和手持電話之間協同傳輸以AMR-WB編碼的語音,在這一過程中沒有進行語音修改或從終端到終端的轉換編碼。如果高清語音連接無法實現,系統就會取而代之使用窄帶AMR-NB編碼。
擴展語音帶寬
可以預計,在引入高清語音的過程中,通信系統中的某些環節會因無法支持而將語音轉換為窄帶頻率,這實際上是在降低語音質量,增加聽力負擔。人工帶寬擴展(BWE)通過在通信系統的終端環節為窄帶語音信號加入人工生成的語音內容,彌補在傳輸過程中損失的高頻和低頻語音內容。通過這種方法,BWE將高清語音的優勢拓展到了窄帶和過渡的混合帶寬的語音通信系統中。
BWE演算法使用產生語音的聲源過濾模型來估算和產生擴展頻率范圍內的語音內容。根據該模型,語音是由一個聲源(例如聲帶)再加上一個模擬聲道的模型產生的。BWE演算法根據窄帶語音估算出一個寬頻聲源模型,然後利用該模型的參數估算出其丟失的寬頻頻率內容。在實際應用中,BWE獨立於源編碼和發送路徑處理過程的,因此它可以與傳統的窄帶和混合帶寬的電話網路共存。
BWE主要應用於藍牙耳機和免提設備。在這些設備的接收終端上,窄帶CVSD編碼語音信號首先進行解碼,然後經過BWE的處理產生給受話方的擴展帶寬語音信號。BWE也可以應用在高清語音電話網路上,將語音信號擴展到帶寬為14kHz的超寬頻(SWB)頻率范圍。
高清語音和音效增強