基于非線性理論的漢語語音編碼技術(shù)研究.pdf_第1頁
已閱讀1頁,還剩115頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、語音的數(shù)字化分析和處理是語音信號(hào)數(shù)字傳輸和數(shù)字存儲(chǔ)的重要過程。隨著語音通信技術(shù)的發(fā)展,高音質(zhì)、低帶寬等優(yōu)點(diǎn)一直是人們追求的目標(biāo),語音壓縮編碼在實(shí)現(xiàn)這一目標(biāo)的過程中擔(dān)當(dāng)著十分重要的角色。
  目前語音信號(hào)的分析與壓縮編碼都是采用線性理論和線性預(yù)測(cè)編碼技術(shù),而語音信號(hào)的產(chǎn)生系統(tǒng)是一個(gè)復(fù)雜的非線性時(shí)變系統(tǒng),具有混沌性和分形特征,所以采用線性方法來對(duì)語音進(jìn)行處理無法從根本上提高語音傳輸和存儲(chǔ)的性能。因此,論文在深入研究了語音信號(hào)非線性特性

2、的基礎(chǔ)上,結(jié)合徑向基神經(jīng)網(wǎng)絡(luò)(簡(jiǎn)稱RBF神經(jīng)網(wǎng)絡(luò),Radical Basis Function Network)構(gòu)造了一個(gè)語音信號(hào)非線性預(yù)測(cè)模型,并基于該模型設(shè)計(jì)出一個(gè)非線性預(yù)測(cè)編碼系統(tǒng)。論文主要研究工作和創(chuàng)新點(diǎn)如下:
  (1)語音信號(hào)的混沌性檢測(cè)和分形特征
  在非線性理論的基礎(chǔ)上,針對(duì)漢語語音音素非線性特征參數(shù)的求解算法進(jìn)行了研究,提出采用Wolf算法計(jì)算出33個(gè)漢語語音音素的最大Lyapunov指數(shù),所得結(jié)果證明了漢

3、語語音信號(hào)具有混沌性。然后采用GP算法求解出33個(gè)漢語語音音素的關(guān)聯(lián)維數(shù),根據(jù)所得結(jié)果說明濁音信號(hào)的產(chǎn)生系統(tǒng)是低維系統(tǒng),而部分清音的發(fā)音系統(tǒng)是高維系統(tǒng)。
  (2)語音信號(hào)的相空間重構(gòu)及其參數(shù)確定
  對(duì)語音信號(hào)非線性預(yù)測(cè)的理論依據(jù)以及預(yù)測(cè)工具進(jìn)行了分析,并研究相空間重構(gòu)參數(shù)——延遲時(shí)間和嵌入維數(shù)的確定方法。針對(duì)C-C算法存在的局限性,采用結(jié)合自相關(guān)算法、虛假近鄰法的方法分別求解出漢語語音音素的延遲時(shí)間和嵌入維數(shù)。針對(duì)實(shí)驗(yàn)中

4、采樣率的選擇和語音源的問題,論文運(yùn)用統(tǒng)計(jì)分析的方法進(jìn)行了研究,所得結(jié)果表明計(jì)算出的延遲時(shí)間和嵌入維數(shù)對(duì)不同的采樣率和語音源具有較強(qiáng)的魯棒性。
  (3)基于RBF神經(jīng)網(wǎng)絡(luò)的漢語語音非線性預(yù)測(cè)模型
  將漢語語音音素的非線性特征參數(shù)與RBF神經(jīng)網(wǎng)絡(luò)分析方法相結(jié)合,提出根據(jù)所計(jì)算出的33個(gè)漢語語音音素的延遲時(shí)間及嵌入維數(shù)作為RBF神經(jīng)網(wǎng)絡(luò)模型中三層網(wǎng)絡(luò)神經(jīng)元個(gè)數(shù),構(gòu)造出一個(gè)基于RBF神經(jīng)網(wǎng)絡(luò)的漢語語音信號(hào)非線性預(yù)測(cè)模型,并將該預(yù)

5、測(cè)模型與現(xiàn)有的ADPCM線性預(yù)測(cè)模型進(jìn)行了性能比較,仿真結(jié)果表明非線性預(yù)測(cè)模型預(yù)測(cè)誤差較小,說明所提出的非線性預(yù)測(cè)模型具有更好的預(yù)測(cè)性能。
  (4)基于小波變換的語音增強(qiáng)處理
  針對(duì)語音信號(hào)的預(yù)測(cè)編碼性能在噪聲環(huán)境下會(huì)迅速下降的問題,研究了基于小波變換的語音增強(qiáng)處理技術(shù),著重對(duì)小波去噪算法中的閾值去噪法進(jìn)行了研究。一方面,針對(duì)閾值去噪算法中的傳統(tǒng)閾值的選取難以適應(yīng)非平穩(wěn)噪聲的這一缺點(diǎn),將MCRA算法應(yīng)用于小波域計(jì)算其噪聲

6、方差,得到隨實(shí)時(shí)變化的噪聲估計(jì),并利用譜平坦度自適應(yīng)調(diào)整閾值;另一方面,針對(duì)傳統(tǒng)的軟硬閾值函數(shù)的不足,在Breiman提出的非負(fù)死區(qū)閾值函數(shù)的基礎(chǔ)上進(jìn)行了改進(jìn),設(shè)計(jì)出一種改進(jìn)的閾值函數(shù),并從連續(xù)性、單調(diào)性等方面進(jìn)行分析,驗(yàn)證其合理性。
  (5)語音E-CENP編碼系統(tǒng)的設(shè)計(jì)
  運(yùn)用構(gòu)造出的非線性預(yù)測(cè)模型,結(jié)合增強(qiáng)處理和CELP語音編碼算法,設(shè)計(jì)了一個(gè)非線性預(yù)測(cè)編碼系統(tǒng)——E-CENP。系統(tǒng)中,預(yù)處理部分加入了所提出的小波

7、變換的語音增強(qiáng)處理,預(yù)測(cè)器部分采用了所設(shè)計(jì)的RBF神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測(cè)模型。仿真結(jié)果表明:與CELP線性預(yù)測(cè)編碼系統(tǒng)相比,該非線性預(yù)測(cè)編碼系統(tǒng)具有編碼語音質(zhì)量高、魯棒性好等優(yōu)點(diǎn)。
  論文運(yùn)用非線性的理論和方法,構(gòu)造了一個(gè)E-CENP語音編碼系統(tǒng),與CELP編碼系統(tǒng)相比,該編碼系統(tǒng)編解碼后恢復(fù)出的語音信號(hào)的音質(zhì)比較高而且魯棒性較好,說明所提出的非線性理論的研究方法適合于具有非線性特性的語音,為語音信號(hào)的處理技術(shù)提供了新的思路和新的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論