基于視覺特征提取和核判決分析方法的人臉識別.pdf_第1頁
已閱讀1頁,還剩120頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、人臉識別技術(shù)是模式識別領(lǐng)域的重要研究課題,這是由于人臉表情豐富、隨年齡增長而變化,人臉圖像受成像的光照、角度和距離等影響,人臉的自動識別非常困難,特別是要求機器在學(xué)習(xí)之后要有足夠的泛化識別能力;同時人臉識別還涉及到圖像處理、模式識別、生理學(xué)等知識。人臉識別廣泛應(yīng)用于人機交互、監(jiān)控系統(tǒng)、門禁系統(tǒng)和檔案管理等方面。人臉是具有自然相似結(jié)構(gòu),卻又有彈性的局部可變形的非剛體目標,因此人臉識別的研究還有對大量同類目標識別問題具有推動作用。

2、人臉識別是一種特定內(nèi)容的模式識別,從狹義上講,就是將特定人臉上的特征提取和檢測出來并與已知類別的標準樣本的特征進行模式識別的操作,因此主要涉及特征提取和分類判決分析兩方面。本文研究的工作主要是利用基于視覺特征提取方法,獲得有效的人臉圖像識別特征;并結(jié)合性能或速度改進了的核判決分析方法進行人臉圖像識別。研究的內(nèi)容主要包括:綜合論述了人類視覺系統(tǒng)中與人臉識別有關(guān)的神經(jīng)生理學(xué)和心理學(xué)研究成果;基于視覺皮層上皮細胞感受野的Gabor模型,提出了

3、將遞推Gabor濾波用于人臉圖像特征的提取,并結(jié)合基于QR分解的核判決分析方法進行人臉識別的方法;基于視覺皮層上皮細胞感受野的高斯微分模型,提出了具有尺度和方向選擇性的Hermite變換用于人臉圖像特征的提取,并結(jié)合以類間分布最大化、總的分布最小化為準則的核判決分析方法進行人臉識別的方法;基于傳輸?shù)饺四X的視覺皮層的信號是壓縮后具有傅立葉變換性質(zhì)的信息,提出了在壓縮域提取人臉圖像的離散余弦特征描述,并結(jié)合零空間核判決分析方法進行人臉識別的

4、方法;基于人類視覺系統(tǒng)被當作一個多通道模型進行描述,并且Mart理論指出信息處理的是分不同層次的,提出了利用多分辨改變的離散余弦變換提取人臉圖像特征,并結(jié)合基于Chernoff準則的核判決分析方法進行人臉識別的方法。主要的研究成果如下: 1.提出了基于遞推Gabor濾波獲得人臉圖像特征與基于QR分解的核判決分析方法相結(jié)合的人臉識別方法。利用Gabor函數(shù)對人類視覺系統(tǒng)中大腦皮層上皮細胞感受野的逼近能力,Gabor濾波可以對圖像局

5、部信息分析中考慮視覺特性。遞推Gabor濾波方法利用前向和反向遞推計算獲得濾波結(jié)果,克服了通過卷積運算或時頻轉(zhuǎn)換進行濾波處理計算復(fù)雜度高的缺點,其計算復(fù)雜度僅與數(shù)據(jù)長度成正比,并具有較好的穩(wěn)定性。因此多分辨遞推Gabor濾波對人臉圖像進行處理,有利于獲得具有空間頻率、空間位置和方向取向選擇性的圖像特征表達,在一定程度上克服光照、表情以及姿態(tài)等變化的影響,同時降低計算量。核判決分析方法具有很好的非線性映射能力和特征提取能力,其能夠提取特征

6、空間中的最佳鑒別特征,這些特征對應(yīng)于輸入空間中的非線性最佳鑒別特征。在具體運用的過程中,可以采用先可以通過重心矩陣進行QR分解,進行類間散布的最大化處理,然后再進行類內(nèi)散布的最小化處理兩個步驟,減小了計算的復(fù)雜度。實驗仿真表明,遞推Gabor濾波方法能夠較好地提取人臉圖像特征,對比結(jié)果表明了該方法的有效性。 2.提出了基于Hermite特征和核判決分析方法的人臉識別方法。在研究中,人們發(fā)現(xiàn)視覺感受野的形狀類似于高斯函數(shù)與其拉普拉

7、斯變換之和,視覺系統(tǒng)對亮度對比度的感知問題可轉(zhuǎn)化為數(shù)學(xué)中的特征函數(shù)問題,這些特征函數(shù)既不是正弦函數(shù)或Gabor函數(shù),而是微分算子的特征函數(shù)。隨著基于高斯微分描述的視覺皮層細胞感受野的分布模型的提出,Martens在此基礎(chǔ)上建立了Hermite變換,該變換是建立高斯微分算子的基礎(chǔ)上,其濾波器的沖擊響應(yīng)與視覺皮層中細胞的感受野分布相似。人臉圖像通過該變換進行多分辨分析,可獲得具有空間頻率特性、空間位置和方向取向選擇性的局部特征。由于Gabo

8、r濾波器和Hermite濾波器具有相似性,Gabor濾波器提取的特征有利于分類判決,因此在選擇Hermite變換的參數(shù)時充分考慮了其提取的特征的鑒別特性。建立以類間散布最大化、總散布最小化為判決準則的核判決分析方法,有效地從整體上保證了分類變換達到最佳。通過實驗仿真比較表明,該方法具有較好的特征提取能力和識別效果。 3.提出了在壓縮域基于離散余弦特征和零空間核判決分析的人臉識別方法。離散余弦變換(DCT)與傅立葉變換相關(guān),它將圖

9、像被分成具有不同視覺特性重要性的頻譜子帶,離散余弦變換的系數(shù)可以很好地描述圖像特征,低頻系數(shù)包含了圖像較多的能量,能夠平滑由于表情或少許姿態(tài)引起的變化;直流分量主要包含了圖像的亮度信息。從壓縮人臉圖像中通過部分解碼提取DCT系數(shù),節(jié)約IDCT所需的時間;并通過分塊內(nèi)系數(shù)和相鄰分塊間的部分系數(shù)的水平、垂直方向的一階正交多項式作為圖像的特征,減弱了照度變化的影響。判決分析中,由于小樣本問題,類內(nèi)散布矩陣通常是奇異的,在其零空間中包含著用于判

10、決分析的信息,尤其當類間散布矩陣在該零空間的某一投影軸的投影不為零時,判決信息更顯著,零空間方法能夠提取該部分信息,因此將零空間方法與核判決分析方法相結(jié)合可獲得在高維特征空間由類間散布矩陣的補空間和類內(nèi)散布矩陣的零空間的交集構(gòu)成的識別子空間。實驗仿真結(jié)果表明,該方法能夠從壓縮數(shù)據(jù)中較好地提取特征描述,與其它通常的方法相比,具有較好的識別效果。 4.提出了利用多分辨改變的離散余弦(MDCT)提取圖像特征與基于Chernoff準則的

11、核判決分析方法相結(jié)合的人臉識別方法。通常人類視覺系統(tǒng)被當作一個多通道模型進行描述;并且Marr理論指出信息處理的是分不同層次的。MDCT在理論上和多相濾波器屬于同一類時間/頻率映射機制,其結(jié)合了臨界取樣,具有良好的頻率分辨性和靈活的窗轉(zhuǎn)換,因此容易實現(xiàn)對不同分辨率的處理。利用多分辨分析,將人臉圖像分解為不同的解析度,然后利用MDCT進行處理,實現(xiàn)了人臉圖像的多分辨MDCT分析,提取了不同頻段上反應(yīng)不同分辨率的結(jié)構(gòu)特征提取的圖像特征,這與

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論