摘要:通信工程師設(shè)備環(huán)境培訓(xùn)音頻壓縮編碼技術(shù):對于不同類型的音頻信號而言,其信號帶寬是不同的,如電話音頻信號為200Hz。
1.音頻壓縮編碼技術(shù)
對于不同類型的音頻信號而言,其信號帶寬是不同的,如電話音頻信號為200Hz。
4kHz,調(diào)幅廣播音頻信號為50Hz-7kHz,調(diào)頻廣播音頻信號為20Hz-15kHz,激光唱盤音頻信號為10Hz-20kHz。隨著對音頻信號音質(zhì)要求的增加,信號頻率范圍逐漸增加,要求描述信號的數(shù)據(jù)童也就隨之增加,從而帶來處理這些數(shù)據(jù)的時間增長和傳輸、存儲這些數(shù)據(jù)的容量增加。
音頻信號壓縮編碼方法
一般來說,音頻信號的壓縮編碼有以下幾種主要類型。
①波形編碼
波形編碼是在信號采樣和量化過程中考慮到人的聽覺特性,使編碼信號盡可能與原輸入信號匹配,又能適應(yīng)人的應(yīng)用要求,如全頻帶編碼(包括脈沖編碼調(diào)制PCM,瞬時、準(zhǔn)瞬時壓擴(kuò)PCM,自適應(yīng)差分ADPCM等);子帶編碼(包括自適應(yīng)變換編碼ATC、心理學(xué)模型等);矢最馕化。波形編碼的特點是在高碼率條件下可獲得卨質(zhì)量的音頻信號,適于高保處度語音和音樂信號的壓縮技術(shù)。
②參數(shù)編碼
參數(shù)編碼是將音頻信號以某種模型表示,再抽出合適的模型參數(shù)和參考激勵信號進(jìn)行編碼;聲音重放時,再根據(jù)這些參數(shù)重建即可,這就是通常講的聲碼器(Vocoder)。參數(shù)編碼壓縮比很高,但計算量大,且不適合高保真度要求的場合。用此類方法構(gòu)成聲碼器的有:線性預(yù)測(LPC)聲碼器、通道聲碼器(Channel Vocoder)、共振峰聲碼器(Format Vocoder)等。
③混合編碼
混合編碼是一種吸取波形和參數(shù)編碼的優(yōu)點,進(jìn)行綜合的編碼方法,如多脈沖線性預(yù)測MP-LPC,矢量和激勵線性預(yù)測VSELP,碼本激勵線性預(yù)測CELP,短延時碼本激勵線性預(yù)測編碼U>CEIJP,長時延線性預(yù)測規(guī)則碼激勵RPE-LTP等。
不同質(zhì)攝要求時的音頻編碼技術(shù)選擇
①電話質(zhì)量的音頻壓縮編碼
電話質(zhì)量語音信號頻率規(guī)定在300HZ?3.4kHz,如采用標(biāo)準(zhǔn)的脈沖編碼調(diào)制PCM,當(dāng)采樣頻率為8kHz和8bitS化時,所得數(shù)據(jù)速率為64kbit/s,即一個數(shù)字話路。CCITT制定的PCM標(biāo)準(zhǔn)G.711,速率為64kbit/s,采用非線性量化,其質(zhì)最相當(dāng)于12bii線性量化。
電話信號的自適應(yīng)差分脈沖編碼調(diào)制ADPCM標(biāo)準(zhǔn)G.721,速率為32kbit/s。這一技術(shù)是對信號和它的預(yù)測值的差分信號進(jìn)行最化,同時再根據(jù)鄰近差分信號的特性自適應(yīng)改變量化參數(shù),從而提髙壓縮比,又能保持一定信號質(zhì)最。因此ADPCM對中等電話質(zhì)量要求的信號能進(jìn)行高效編碼,而且可以在調(diào)幅廣播和交互式激光唱盤音頻信號壓縮中應(yīng)用。
為了適應(yīng)低速率語音通信的要求,必須采用參數(shù)編碼或混合編碼技術(shù),如線性預(yù)測編碼(LPC)、矢量量化(VQ)以及其他的綜合分析技術(shù)。其中較為典型的碼本激勵線性預(yù)測編碼CELP實際上是一個閉環(huán)LPC系統(tǒng),由輸入語苷信號確定最佳參數(shù),再根據(jù)某種最小誤差準(zhǔn)則從碼本中找出最佳激勵碼本矢量。CELP具有較強(qiáng)的抗干擾能力,在4-16kbit/s傳輸速率下,即可獲得較高質(zhì)量的語音信號。短時延碼本激勵線性預(yù)測編碼LD-CELP的標(biāo)準(zhǔn)G.728,速率為16kbit/s,其質(zhì)量與32kbit/s的G.721標(biāo)準(zhǔn)基本相當(dāng)。采用長時延線性預(yù)測規(guī)則碼本激勵RPE-LTP標(biāo)準(zhǔn)GSM,速率為13kbit/s。
②調(diào)幅廣播質(zhì)最的音頻壓縮編碼
調(diào)幅廣播質(zhì)量音頻信號的頻率范圍是50Hz-7kHz.G.722標(biāo)準(zhǔn)是采用16kHz采樣14bit量化,信號數(shù)據(jù)速率為224kbit/s,采用子帶編碼方法,將輸入音頻信號經(jīng)濾波器分成卨子帶和低子帶兩個部分,分別進(jìn)行ADPCM編碼,再混合形成輸出碼流,224kbit/s可以被壓縮成64kbit/s,誠后進(jìn)行數(shù)據(jù)插人(最髙插人速率達(dá)16kbit/s),因此利用G.722標(biāo)準(zhǔn)可以在窄帶綜合業(yè)務(wù)數(shù)據(jù)網(wǎng)N-ISDN中的一個B信道上傳送調(diào)幅廣播質(zhì)量的音頻信號。
③髙保真環(huán)繞立體聲音頻壓縮編碼
高保真環(huán)繞立體聲音頻信號頻宰范圍是50Hz-20kHz,采用44.1kHz采樣頻率,16bit量化進(jìn)行數(shù)字化轉(zhuǎn)換,其數(shù)據(jù)速率每聲道達(dá)705kbit/s。國際標(biāo)準(zhǔn)化組織ISO和CCITT聯(lián)合制垃的MPEG標(biāo)準(zhǔn).成為國際上公認(rèn)的髙保真環(huán)繞立體聲音頻壓縮標(biāo)準(zhǔn)。MPEG音頻第一和第二層次編碼是將輸入音頻信號進(jìn)行采樣頻率為48kHz,44.1kHz,32kHz的采樣,經(jīng)濾波器組將其分為32個子帶,同時利用人耳掩蔽效應(yīng),根據(jù)音頻信號的性質(zhì)計算各頻率分量的人耳掩蔽門限,選擇各子帶的量化參數(shù),獲得高的壓縮比。MPEG第三層次是在J:述處理后再引人輔助子帶、非均勻量化和熵編碼技術(shù),冉進(jìn)一步提髙壓縮比。MPEG音頻壓縮技術(shù)的數(shù)據(jù)速率為每聲道32?448kbit/s,適合于CD-DA光盤應(yīng)用。
返回目錄:
相關(guān)匯總推薦:
通信專業(yè)實務(wù)互聯(lián)網(wǎng)技術(shù)數(shù)據(jù)通信基礎(chǔ)教程
通信專業(yè)實務(wù)考試設(shè)備與環(huán)境教程匯總
通信工程師備考資料免費領(lǐng)取
去領(lǐng)取