版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、隨著移動設(shè)備的不斷普及和互聯(lián)網(wǎng)的持續(xù)發(fā)展,以圖像為載體的信息交流方式越來越普遍。如何能夠自動理解拍攝圖像傳達的語義信息是人們實際且迫切的需求。圖像識別作為解決這類問題不可或缺的手段,主要關(guān)心如何對圖像中的物體及對其所處的場景進行分析判斷。通常,物體識別包括個體識別、次級類別識別以及類別間的識別,而場景識別(又稱為場景分類)則是根據(jù)圖像內(nèi)容給出其代表的語義標簽(如山脈、海岸線等),可為物體識別等任務(wù)提供有效的上下文信息。為解決這兩類模式識
2、別問題,本文從對圖像識別系統(tǒng)關(guān)鍵模塊的現(xiàn)狀分析出發(fā),重點研究了特征設(shè)計中的多尺度信息和方法論中的正則化手段在圖像光照預(yù)處理、人臉性別識別、物體識別和場景識別中的應(yīng)用。
首先,針對光照條件對圖像識別的影響,本文考慮解決光源變化帶來的圖像顏色漂移問題,以達到色彩恒常目的。目前,不存在任何一種通用的單個色彩恒常算法能適用于不同紋理特性的圖像。為此,提出一種基于紋理金字塔特征匹配和正則化局部回歸(TPM RLR)的色彩恒常算法來融合單
3、個算法的光照估計結(jié)果。TPM RLR算法結(jié)合多尺度表達構(gòu)建紋理金字塔,并利用威布爾分布參數(shù)提取圖像的紋理特征。然后,根據(jù)自定義的圖像相似性測度查找到與待校正圖像紋理最相似的參考圖像集。在融合階段,綜合基于先驗知識的方法與基于數(shù)據(jù)驅(qū)動方法的優(yōu)點,在lαβ對立色彩空間內(nèi)采用正則化局部回歸合并單個算法。在兩個自然圖像數(shù)據(jù)集上的實驗結(jié)果表明,TPM RLR融合算法能顯著提高光照估計的準確度,其角度誤差中值比單個算法至少降低了29%,同時其校正效
4、果在主觀和客觀評價上均優(yōu)于現(xiàn)有的融合算法。
其次,以人臉這種特殊物體為研究對象,討論了基于人臉的性別識別問題。首先,提出一種基于多尺度學習模式(MSLP)的人臉特征,該特征通過不同方法PCA/ICA/K-means學習得到多尺度卷積模板,然后對卷積后的圖像按照響應(yīng)強度順序進行編碼,從而形成一個緊湊且具有較高鑒別力的直方圖特征來描述人臉。鑒于線性表達分類器(LinearRC)在人臉識別中的成功應(yīng)用,同時又考慮到性別識別和人臉識別
5、在數(shù)據(jù)分布上的差異,系統(tǒng)分析了LinearRC在性別識別上的應(yīng)用。另外,從原型生成的角度出發(fā),提出一種基于偏最小二乘的線性表達分類器(LRC PLS)及其群組分類器。在人臉性別識別上的大量實驗證明, MSLP特征明顯優(yōu)于人工設(shè)計特征,LRC PLS較其他線性表達分類器性能穩(wěn)定、耗時較短,且其群組分類器可進一步提高識別精度。
鑒于原型概念在性別識別中的成功應(yīng)用,從字典學習角度出發(fā),進而提出一種基于多尺度查詢圖像擴展的協(xié)同表達分類
6、器(QCRC CP),以解決較復雜環(huán)境下的物體識別問題(即處理多姿態(tài)的、多視角的、更一般化等情況下的物體識別)。QCRC CP先將單張查詢圖像通過放縮擴展成一個查詢集,并利用典型相關(guān)分析生成與查詢集最相關(guān)的一組類原型作為每一類的字典原子。這種字典構(gòu)造方法結(jié)合以往原型選擇方法與原型生成方法的優(yōu)點,利用數(shù)據(jù)局部性剔除掉噪聲,生成與查詢樣本相關(guān)且最能代表該類別的原型集。最后,在新構(gòu)造的字典上,采用基于最小規(guī)范化殘差的多變量協(xié)同表達分類器判定查
7、詢圖像的類別。在多姿態(tài)人臉識別、樹葉類別識別、字符識別和通用物體識別上的實驗表明,QCRC CP分類器獲得了令人滿意的結(jié)果,且其字典構(gòu)造方法優(yōu)于基于原型選擇和原型生成的字典學習算法。例如,QCRC CP在字符識別上的識別率比其他線性表達分類器提高了10%以上。
最后,在場景識別中,考慮到合適的距離度量能有效反映高維空間中樣本間的語義距離,提出一種基于正則化線性判別分析(RLDA)的全參數(shù)馬氏距離度量學習算法。當訓練樣本數(shù)目少且
8、特征維數(shù)高時,距離度量學習算法復雜度過高,且容易出現(xiàn)過擬合問題。為此,提出一種新的算法框架,即將度量學習的參數(shù)矩陣分解為一個射影矩陣與一個非負對角陣的乘積,從而可顯著降低要估計的參數(shù)個數(shù)。首先,采用不同參數(shù)調(diào)制的RLDA生成一個射影向量集合。然后基于邊信息,在構(gòu)建的訓練數(shù)據(jù)集上通過l2范數(shù)正則化的非負最小二乘對射影向量進行選擇和加權(quán)。該訓練集是由射影后的相似樣本對子集與相異樣本對子集中樣本對的差向量平方組成。另外,為了保持訓練庫中兩個子
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 協(xié)同表達優(yōu)化新方法及其在圖像識別中的應(yīng)用.pdf
- 正則化方法在圖像處理中的應(yīng)用.pdf
- 基于多尺度計算的尿沉渣圖像識別方法研究.pdf
- 基于多尺度分析和仿生模式識別的紋理圖像識別.pdf
- 基于Fisher變換多尺度圖像識別算法的設(shè)計和實現(xiàn).pdf
- 孔隙度方法在肝臟超聲圖像識別中的研究與應(yīng)用.pdf
- 正則化方法在圖像恢復中的應(yīng)用研究.pdf
- 正則化方法及其在動態(tài)載荷識別中的應(yīng)用.pdf
- 深度學習在圖像識別中的研究及應(yīng)用.pdf
- SOFM算法在圖像識別中的應(yīng)用研究.pdf
- 多特征融合技術(shù)的研究及其在醫(yī)學圖像識別中的應(yīng)用.pdf
- sofm算法在圖像識別中的應(yīng)用研究
- 圖像識別技術(shù)在ITS車牌識別中的應(yīng)用研究.pdf
- 圖像處理與圖像識別新技術(shù)在智能交通中的應(yīng)用研究.pdf
- 蟻群算法在醫(yī)學圖像識別中的研究與應(yīng)用.pdf
- 增量學習及其在圖像識別中的應(yīng)用.pdf
- 五小波在圖像識別中的應(yīng)用
- 基于多尺度分形的森林火災(zāi)圖像識別算法研究.pdf
- 圖像邊緣檢測的研究及在不良圖像識別中的應(yīng)用.pdf
- 變分正則化模型與算法及其在多通道圖像重構(gòu)中的應(yīng)用.pdf
評論
0/150
提交評論