基于HMM和ANN的漢語語音非特定人識別.pdf

上傳人：奔*** IP屬地：河北更新時間：2024-03-09 格式：pdf 頁數(shù)：62 大?。?.77MB 人氣指數(shù)：12 舉報 版權(quán)申訴

已閱讀1頁，還剩61頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、隨著現(xiàn)代計算機技術(shù)的發(fā)展，人與計算機之間的通信接口已經(jīng)不局限于鼠標和鍵盤。越來越多的新通訊手段被引入到計算機，技術(shù)的發(fā)展讓語音數(shù)字處理和語音識別技術(shù)進展使語音逐漸成為一個有效的輸入。廣大人民夢想出現(xiàn)能直接聽懂人的語言的機器，直接通過語音下指令，語音識別的技術(shù)指的是讓計算機通過對語音的處理和轉(zhuǎn)化，把人的語音溝通變成為相應(yīng)的指令或者是文字。
　　語音識別技術(shù)相關(guān)領(lǐng)域的多學(xué)科研究，其中包括了聲學(xué)，語言學(xué)，數(shù)字信號處理，計算機科學(xué)，人

2、工神經(jīng)網(wǎng)絡(luò)在不同領(lǐng)域的研究等等為語音識別技術(shù)的發(fā)展作出了貢獻。語音信號自身的特點造成的困難，這些特點包括可變性，動態(tài)，瞬時性和連續(xù)性。計算機語音識別處理和語音識別過程中基本上是相同的。目前主流的語音識別技術(shù)是基于統(tǒng)計模式識別的基本理論。
　　語音識別技術(shù)研究現(xiàn)在的困難是確定最優(yōu)化的識別結(jié)果，以及神經(jīng)網(wǎng)絡(luò)的參數(shù)訓(xùn)練。具有大量的神經(jīng)元的人工神經(jīng)網(wǎng)絡(luò)并行分布式計算的原則，高效率的學(xué)習(xí)算法以及能夠模仿人類的認知系統(tǒng)，所以它非常適合于解

3、決類似的語音識別這種問題，對于底層和頂層均很試用。我們知道神經(jīng)網(wǎng)絡(luò)來源于對人腦功能的模擬，具有自組織性、自適應(yīng)性、和連續(xù)學(xué)習(xí)的能力。神經(jīng)網(wǎng)絡(luò)是可以訓(xùn)練的，也就是說可以通過不斷的經(jīng)驗訓(xùn)練來積累和改進。加上具有并行性的特質(zhì)，神經(jīng)網(wǎng)絡(luò)具有魯棒性和快速判決的能力，適用于應(yīng)對算法不能明確描述的場景，但是具有不限量的學(xué)習(xí)樣本可以使用。
　　本文研究了語音識別中孤立詞語音識別的方法和特點，分別對語音信號特征參數(shù)LPCC和MFCC的提取進行了

4、分析，通過探討端點檢測對語音識別系統(tǒng)的影響，并結(jié)合提高語音識別系統(tǒng)穩(wěn)健性的方案，對傳統(tǒng)的端點檢測方法做了一定的改進，采用基于MFCC的距離測量法提高了語音識別系統(tǒng)端點檢測方法的準確性。基于語音識別中的倒譜技術(shù)，實現(xiàn)了語音識別中LPC、LPCC、MFCC等幾種特征參數(shù)的提取方法；分析了神經(jīng)網(wǎng)絡(luò)建模方法及其特點。另外還從隱馬爾可夫模型的幾個基本的步驟開始(評估步驟、解碼步驟、訓(xùn)練步驟)入手進行討論了其作為如何使用語音識別應(yīng)用主要數(shù)學(xué)模型當前

5、的基本原理，并對這些技術(shù)在分析語音識別中如何應(yīng)用。最后在此理論基礎(chǔ)上，針對非特定人的漢語孤立詞識別問題，研究構(gòu)造了基于HMM和神經(jīng)網(wǎng)絡(luò)建模的語音識別算法。該算法的意義主要在于在以隱馬爾可夫模型(HMM)為基本語音模型的基礎(chǔ)上，引入BP神經(jīng)網(wǎng)絡(luò)進行二次識別，有效的利用了隱馬爾可夫模型的強時序信號處理能力和BP神經(jīng)網(wǎng)絡(luò)的強模式分類和泛化性能，改善了孤立詞識別系統(tǒng)的抗噪性能。以往的算法主要是用傳統(tǒng)的DTW或HMM方法，該算法則將神經(jīng)網(wǎng)絡(luò)應(yīng)用于

眾賞文庫> 全部分類> 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

基于HMM和ANN的漢語語音非特定人識別.pdf

文檔簡介

溫馨提示

最新文檔

評論

基于HMM和ANN的漢語語音非特定人識別.pdf

文檔簡介

溫馨提示

最新文檔

評論

免費下載