版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、說話人識別又被稱作聲紋識別,是生物識別研究的一個重要方向。近年來,隨著生物技術(shù)和信息技術(shù)的高速發(fā)展,語音識別技術(shù)也日漸成熟并逐步得到普及,使得用語音與計算機之間的交流也成為了一種現(xiàn)實。在此過程中,用于研究說話人識別的理論和算法也在不斷提出和改進。其中,高斯混合模型(GMM)由于其識別性能良好、方法簡單和復(fù)雜度小,在目前說話人識別領(lǐng)域中應(yīng)用最為廣泛。經(jīng)典的GMM在對每個說話人建立模型時,其混合階數(shù)K與具體應(yīng)用有關(guān),通常由人根據(jù)實驗結(jié)果給定
2、,因此具有一定的隨意性。針對在說話人識別過程中,經(jīng)典的GMM混合階數(shù)的確定具有一定隨意性的問題,本文提出采用吸引子傳播聚類方法(AP聚類)自動獲取GMM的階數(shù),進而實現(xiàn)說話人識別的方法。這個方法避免了人為實驗摸索去獲得GMM的混合階數(shù),顯著提高了說話人識別的精度和效率。
本文首先介紹了說話人識別的相關(guān)背景知識,以及其研究的意義;分析了說話人識別的研究現(xiàn)狀、發(fā)展趨勢以及存在問題。其次詳細闡述了語音信號的預(yù)處理和特征提取的過程。其
3、中,語音信號的預(yù)處理過程主要包括語音采樣、數(shù)字化、預(yù)加重、分幀加窗和端點檢測。然后介紹了語音信號特征參數(shù)的分類,并分析了線性預(yù)測系數(shù)(LPC)、線性預(yù)測倒譜參數(shù)(LPCC)、梅爾頻率倒譜系數(shù)(MFCC)三種常用的特征參數(shù)的優(yōu)缺點。第三,對說話人識別模型的建立進行了深入研究,詳細闡述了矢量量化模型(VQ)、隱馬爾可夫模型(HMM)和高斯混合模型(GMM)等常用建模方法的基本原理。第四,給出了說話人識別系統(tǒng)的設(shè)計流程圖。然后,詳細介紹了AP
4、(AffinityPropagation,吸引子傳播)聚類算法基本原理,并給出了利用AP聚類算法自動獲取GMM混合階數(shù)的具體實現(xiàn)過程。首先,采用Mel頻率倒譜系數(shù)法(MFCC)與差分倒譜相結(jié)合的方法,提取語音特征參數(shù);其次,采用吸引子傳播聚類方法(AP聚類)對語音特征參數(shù)進行聚類處理,從而自動獲得GMM的階數(shù);在此基礎(chǔ)上進行GMM模型的訓(xùn)練。第五,對模型進行了實驗并對實驗結(jié)果進行了分析。本文采用訓(xùn)練好的GMM模型對Timit標(biāo)準(zhǔn)語音庫以
5、及自制網(wǎng)絡(luò)志愿者語音庫進行說話人識別測試實驗,通過實驗來驗證AP聚類的有效性和得到的GMM混合階數(shù)K的合理性。實驗結(jié)果顯示,經(jīng)典的GMM階數(shù)K為32和由AP聚類算法獲得階數(shù)K,兩種方法的識別時間分別為0.06s和0.09s,識別準(zhǔn)確率分別為90.4%和97.6%。實驗結(jié)果表明,比起通過實驗探索再憑經(jīng)驗值選取混合階數(shù)K的方法,采用AP聚類算法自動獲取GMM混合階數(shù)K,可以在識別時間大致相同情況下得到更優(yōu)的識別效果。也就是說,引入AP聚類自
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于GMM和SVM的說話人識別方法研究.pdf
- 基于GMM-UBM的快速說話人識別方法.pdf
- 說話人識別方法的研究.pdf
- 基于ANN和GMM融合的語音情感識別方法的研究.pdf
- 基于高層信息融合的短語音說話人識別方法研究.pdf
- 基于Fisher準(zhǔn)則和數(shù)據(jù)融合的說話人識別方法研究.pdf
- 說話人識別中提高GMM性能方法的研究.pdf
- 基于VP樹和GMM的說話人識別研究.pdf
- 說話人識別方法與策略的研究.pdf
- 基于SVM和GMM的說話人辨識方法研究.pdf
- 基于GMM的說話人識別技術(shù)研究.pdf
- 基于GMM的說話人識別算法的研究.pdf
- 基于GMM說話人分類的說話人識別系統(tǒng)研究.pdf
- 基于VQ與GMM的說話人識別.pdf
- 基于MFCC和GMM的說話人識別系統(tǒng)研究.pdf
- 基于GMM和SVM的說話人識別系統(tǒng)研究.pdf
- 基于ICA和GMM的無約束說話人識別研究.pdf
- 基于說話人轉(zhuǎn)換的語音識別方法.pdf
- 噪聲環(huán)境下說話人識別方法研究.pdf
- 基于PLDA模型的說話人識別方法研究.pdf
評論
0/150
提交評論