版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、基于隱馬爾可夫模型的語音識(shí)別技術(shù)已進(jìn)入識(shí)別性能平臺(tái),但魯棒性能低,不適合于復(fù)雜環(huán)境下的應(yīng)用。人類語音的產(chǎn)生和感覺本質(zhì)上均是雙模態(tài)的(音頻和視頻),語音信號(hào)是由發(fā)音器官產(chǎn)生的,不同的發(fā)音可能具有不同的嘴型。在語音識(shí)別過程中,音頻信息和視頻信息具有很好的互補(bǔ)性,因此近來年音頻-視頻混合語音識(shí)別(AVSR)得到了重視。AVSR技術(shù)的關(guān)鍵問題是臉部視頻特征的提取和音、視頻特征的結(jié)合方式。而如何準(zhǔn)確地將人臉和嘴唇實(shí)時(shí)檢測(cè)和定位,是視頻特征提取的關(guān)
2、鍵。該文通過分析和學(xué)習(xí)諸多前人在人臉特征點(diǎn)定位方面的算法,提出了一套簡(jiǎn)單有效的人臉嘴部區(qū)域的自動(dòng)定位和分割方法,并在此基礎(chǔ)上進(jìn)行視頻特征的提取。 1、彩色頭肩像中人臉的檢測(cè)和定位。該文分析了人臉的特點(diǎn)和對(duì)算法的要求,介紹了一些常用的人臉檢測(cè)算法,同時(shí)指出他們存在的局限性,提出了一種設(shè)定參數(shù)門限的基于高斯膚色模型的人臉檢測(cè)及定位算法。在算法測(cè)試中,從實(shí)驗(yàn)數(shù)據(jù)可以看出,與傳統(tǒng)的算法相比,改進(jìn)的門限設(shè)定算法能夠大幅地減少運(yùn)算量,使算法
3、的實(shí)時(shí)性得到較大提高,并且仍保持較好的性能。 2、基于人臉初定位的嘴部區(qū)域(ROI)定位。該文在兩種主流研究方法中,選擇了基于象素的利用統(tǒng)計(jì)理論的方法——主元分析法(PCA),提出在Cr和Gray兩種空間基于PCA的最小剩余誤差能量的ROI定位算法,并在算法中引入了受限窗掃描策略,通過實(shí)驗(yàn)可以看出,這種改進(jìn)后的算法,不僅盡可能地滿足了實(shí)時(shí)性的需要,而且大大改善了主元分析法對(duì)光照敏感的不足,使算法的魯棒性得到了較大的提高。
4、 3、視覺特征的提取和評(píng)價(jià)。該文在ROI準(zhǔn)確定位的基礎(chǔ)上,通過ROI在特征子空間的投影,實(shí)現(xiàn)了視覺特征的提取,并對(duì)所提取的特征進(jìn)行正確性和有效性兩方面的評(píng)價(jià)。在此,引入了相似度P作為特征準(zhǔn)確性評(píng)價(jià)的度量值,并通過特定人孤立數(shù)字的DTW識(shí)別實(shí)驗(yàn)驗(yàn)證了基于以上算法提取的特征的有效性。 4、以MATLAB6.5為開發(fā)語言,對(duì)各種算法進(jìn)行了實(shí)現(xiàn)與測(cè)試。實(shí)驗(yàn)結(jié)果表明,該文提出的算法具有受亮度影響小,定位精度高,魯棒性好的優(yōu)點(diǎn),而且對(duì)單模態(tài)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于膚色模型和主成分分析的人臉特征提取.pdf
- 基于顏色模型和紋理特征的膚色檢測(cè)系統(tǒng)研究.pdf
- 基于雙膚色模型的膚色分割方法的研究.pdf
- 基于膚色和主成分分析的人臉檢測(cè)和識(shí)別的算法研究.pdf
- 基于生物視覺特征的計(jì)算模型研究.pdf
- 基于核主元分析的結(jié)構(gòu)振動(dòng)信號(hào)特征提取研究.pdf
- 基于特征部位和膚色的不良視頻檢測(cè)的算法研究.pdf
- 基于膚色分割和人臉特征的人臉檢測(cè)研究.pdf
- 基于視覺特征和主題模型的自然場(chǎng)景分類.pdf
- 基于膚色特征和眼睛定位的人臉檢測(cè).pdf
- 基于膚色和塊特征的人手部檢測(cè).pdf
- 基于膚色和特征臉的人臉識(shí)別技術(shù).pdf
- 基于層次特征的視覺注意模型研究.pdf
- 基于視覺注意模型和Gist特征的圖像檢索方法.pdf
- 基于膚色模型和AdaBoost算法的人臉檢測(cè)研究.pdf
- 基于膚色模型和模板匹配的人臉檢測(cè)研究.pdf
- 基于膚色模型的人臉檢測(cè)及特征點(diǎn)定位方法研究.pdf
- 基于膚色和幾何特征的人臉檢測(cè)算法研究.pdf
- 基于自適應(yīng)膚色模型與幾何特征的人臉檢測(cè).pdf
- 基于膚色和haar方差特征的人臉檢測(cè)方法研究.pdf
評(píng)論
0/150
提交評(píng)論