漢語語文轉(zhuǎn)換中NHMM算法和音庫詞庫設(shè)計的研究.pdf_第1頁
已閱讀1頁,還剩62頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、在語音識別領(lǐng)域,漢語語文轉(zhuǎn)換是一個熱點話題,隱馬爾可夫模型(HMM)是語文轉(zhuǎn)換中常用的方法。它能很好地描述語音信號的平穩(wěn)性和可變性,近年來倍受國內(nèi)外學(xué)者的高度重視,但其識別性能卻不能令人滿意。在語文轉(zhuǎn)換的音庫詞庫設(shè)計模式方面,也存在多種不同設(shè)計模式。而不同的模式會有不同的占比空間率和轉(zhuǎn)換效率,如何找到一種高效的音庫詞庫設(shè)計模式則變得尤為重要。本論文將對這兩方面的改進提出一種的新的算法和設(shè)計模式,以提高語文轉(zhuǎn)換的轉(zhuǎn)換效率。
  

2、語文轉(zhuǎn)換在采樣量化過程中的算法研究一直是一個研究難點,且對于語音環(huán)境的要求也非常復(fù)雜,本論文擬改變以往的傳統(tǒng)HMM研究方法,引入了一種改進型的識別算法NHMM,進一步提高了語文轉(zhuǎn)換中的轉(zhuǎn)換效率。傳統(tǒng)的HMM算法,雖然被廣泛應(yīng)用,但是它自身也存在著一定缺陷,比如說由于它只是一個概率和統(tǒng)計理論算法,并且是離散型概率統(tǒng)計算法,所以它不能很好的描述語音信號的時間相依性,且對于量化時的誤差分析也沒有著重考慮,這樣會在一定程度上降低語文轉(zhuǎn)換的識別率

3、。因此,本文提出了一種能夠引入加權(quán)函數(shù)的算法——NHMM算法。NHMM算法是本論文在HMM算法的基礎(chǔ)上提出的一種改進型算法,就是為了進一步減少語音信號在量化的過程中出現(xiàn)的較大誤差。為了提高語音信號的識別率,在NHMM算法中,加入了一個新變量——量化誤差E,作為加權(quán)值,加入到HMM算法的參數(shù)序列中,讓其作為HMM算法的一個參數(shù)參與運算,這樣將量化誤差作為考慮因素的改進型HMM算法在識別率上,相比傳統(tǒng)的HMM算法有了很大的提高。
  

4、 在設(shè)計音庫詞庫方面,在查閱大量的關(guān)于漢語語文轉(zhuǎn)換的相關(guān)文獻的過程中,發(fā)現(xiàn)很多研究都是將重點放在語文轉(zhuǎn)換中的音庫設(shè)計上,都是在力求音庫文件的最大覆蓋性,但詳盡化的音庫文件設(shè)計必然導(dǎo)致庫體容量的快速增大,這對終端的硬件配置提出了非常大的挑戰(zhàn),如果占用大量系統(tǒng)資源,必然導(dǎo)致其可行性下降。本論文的研究切入點是盡量精簡語文轉(zhuǎn)換的音庫文件,這必然導(dǎo)致在語文轉(zhuǎn)換時,對人的口語錄入的準確性進行了忽略考慮。從粗糙采樣的設(shè)計理念出發(fā),模糊化采樣精度,進

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論