用EP7211實現傳呼信息實時語音合成和播放[2]

動力與環(huán)境 責任編輯:popthrone 2012-01-11

摘要:2具體實現下面分別介紹字符語音庫的建立、字符語音合成算法、本PDA系統(tǒng)的框架結構和語音中斷服務例程。2.1建立字符語音庫我們選用G.729語音壓縮編碼標準來建立語音庫。該標準采用的算法是共軛結構的代數碼激勵線性預測(CS-ACELP),是基于CELP(碼激勵線性預測)編碼模型的算法。這種編碼規(guī)范的嚴格性使性能達到或超過了3

  2 具體實現

  下面分別介紹字符語音庫的建立、字符語音合成算法、本PDA系統(tǒng)的框架結構和語音中斷服務例程。

  2.1 建立字符語音庫

  我們選用G.729語音壓縮編碼標準來建立語音庫。該標準采用的算法是共軛結構的代數碼激勵線性預測(CS-ACELP),是基于CELP(碼激勵線性預測)編碼模型的算法。這種編碼規(guī)范的嚴格性使性能達到或超過了32Kbps的G.726 ADPCM編碼,具有很高的語音質量;同時,它是在語音信號8KHz取樣的基礎上得到16bit線性PCM后進行編碼的,壓縮后的數據速率僅為8Kbps,具有相當于8:1的高壓縮率。其算法延遲少于16ms。由于G.726編解碼器能夠實現很高的語音質量和很低的算法延時,因此被廣泛地應用。

  字符語音庫是一個單字發(fā)音語音數據的集合,中段數據之間相互獨立,不具有相關性。語音庫包含了國標一、二級字庫中的所有6763個漢字、10個阿拉伯數字和26個英文字符的標準普通話語音數據。每個漢字或字符發(fā)音時長為0.65s,采用8KHz抽樣頻率,使用了G.729A語音編碼算法對上述的語音數據進行壓縮,壓縮后數據速率為8Kbps,相當于具有8:1的高壓縮率。在漢字中,同音字占了相當大的比例,而在語音合成中對于同音字的處理是沒有區(qū)別的,故近7000個漢字,我們只存儲1123個不同的發(fā)音。經過同音字處理和采用G.729標準壓縮字符語音數據,則最終建立的語音庫文件大小為729950字節(jié),完全符合本PDA系統(tǒng)的數據存儲要求;否則,語音庫數據量太大,本PDA系統(tǒng)不能接受!

  建立一個語音壓縮數據庫的具體步驟如下:

  *將數字和常用漢字的標準發(fā)音獨立地錄入到數據文件中,作為基礎數據。使用cooledit2000軟件完成語音的錄入。

  *對于輸入數據,按照每幀10ms(80個樣點)的長度,將A_law語音通過簡單換算變成16bit PCM數據,作為編碼算法的輸入。

  *按照G.729A算法標準,對數據進行編碼。

  *將編碼后的數據轉換為二進制比特流,寫入語音庫文件中。壓縮后數據速率為8Kbps,具有相當于8:1的高壓縮率。

  用C語言實現這一過程的程序流程如圖1所示。

  字符語音庫的建立是在Windows平臺及Visual C++編程環(huán)境下實現的,最終壓縮處理后數據量的大小為729950字節(jié),每個字符語音數據的大小是650字節(jié)。

[1]  [2]  [3]  [4]  [5]  [6]  

更多資料
更多課程
更多真題
溫馨提示:因考試政策、內容不斷變化與調整,本網站提供的以上信息僅供參考,如有異議,請考生以權威部門公布的內容為準!

通信工程師備考資料免費領取

去領取

距離2025 通信工程師考試

還有
  • 2
  • 1
  • 4
專注在線職業(yè)教育24年

項目管理

信息系統(tǒng)項目管理師

廠商認證

信息系統(tǒng)項目管理師

信息系統(tǒng)項目管理師

!
咨詢在線老師!