首頁 > 通信工程師 > 動力與環(huán)境 > 用EP7211實現傳呼信息實時語音合成和播放[2]

用EP7211實現傳呼信息實時語音合成和播放[2]

動力與環(huán)境責任編輯：popthrone 2012-01-11

摘要：2具體實現下面分別介紹字符語音庫的建立、字符語音合成算法、本PDA系統(tǒng)的框架結構和語音中斷服務例程。2.1建立字符語音庫我們選用G.729語音壓縮編碼標準來建立語音庫。該標準采用的算法是共軛結構的代數碼激勵線性預測（CS-ACELP），是基于CELP（碼激勵線性預測）編碼模型的算法。這種編碼規(guī)范的嚴格性使性能達到或超過了3

2 具體實現

下面分別介紹字符語音庫的建立、字符語音合成算法、本PDA系統(tǒng)的框架結構和語音中斷服務例程。

2.1 建立字符語音庫

我們選用G.729語音壓縮編碼標準來建立語音庫。該標準采用的算法是共軛結構的代數碼激勵線性預測（CS-ACELP），是基于CELP（碼激勵線性預測）編碼模型的算法。這種編碼規(guī)范的嚴格性使性能達到或超過了32Kbps的G.726 ADPCM編碼，具有很高的語音質量；同時，它是在語音信號8KHz取樣的基礎上得到16bit線性PCM后進行編碼的，壓縮后的數據速率僅為8Kbps，具有相當于8:1的高壓縮率。其算法延遲少于16ms。由于G.726編解碼器能夠實現很高的語音質量和很低的算法延時，因此被廣泛地應用。

字符語音庫是一個單字發(fā)音語音數據的集合，中段數據之間相互獨立，不具有相關性。語音庫包含了國標一、二級字庫中的所有6763個漢字、10個阿拉伯數字和26個英文字符的標準普通話語音數據。每個漢字或字符發(fā)音時長為0.65s，采用8KHz抽樣頻率，使用了G.729A語音編碼算法對上述的語音數據進行壓縮，壓縮后數據速率為8Kbps，相當于具有8:1的高壓縮率。在漢字中，同音字占了相當大的比例，而在語音合成中對于同音字的處理是沒有區(qū)別的，故近7000個漢字，我們只存儲1123個不同的發(fā)音。經過同音字處理和采用G.729標準壓縮字符語音數據，則最終建立的語音庫文件大小為729950字節(jié)，完全符合本PDA系統(tǒng)的數據存儲要求；否則，語音庫數據量太大，本PDA系統(tǒng)不能接受！

建立一個語音壓縮數據庫的具體步驟如下：

*將數字和常用漢字的標準發(fā)音獨立地錄入到數據文件中，作為基礎數據。使用cooledit2000軟件完成語音的錄入。

*對于輸入數據，按照每幀10ms（80個樣點）的長度，將A_law語音通過簡單換算變成16bit PCM數據，作為編碼算法的輸入。

*按照G.729A算法標準，對數據進行編碼。

*將編碼后的數據轉換為二進制比特流，寫入語音庫文件中。壓縮后數據速率為8Kbps，具有相當于8:1的高壓縮率。

用C語言實現這一過程的程序流程如圖1所示。