基于神經(jīng)反應模型和稀疏表示的圖像分類算法研究.pdf_第1頁
已閱讀1頁,還剩115頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、圖像分類是機器學習和計算機視覺領域中一個非常重要的研究內容,在國防安全、工業(yè)信息化、醫(yī)學工程和互聯(lián)網(wǎng)科技等方面均有廣泛的應用。由于圖像易受光照條件、拍攝角度、復雜背景、旋轉變換或尺度放縮等因素的影響,從而對圖像進行分類是一個非常具有挑戰(zhàn)性的課題。因此,研究高效而具有魯棒性的圖像分類算法,具有重要的理論意義與實際應用價值。
  提取圖像具有代表性的特征,是圖像分類過程中的一個關鍵部分。為了從復雜的圖像中提取有效的圖像特征,以及克服訓

2、練數(shù)據(jù)不足的現(xiàn)實問題,本文基于神經(jīng)反應模型和稀疏表示方法,著重研究了具有魯棒性和區(qū)分性的圖像分類方法,提出了一系列算法,并取得了較好的分類效果。論文的主要內容如下:
  首先,本文提出了一種基于稀疏表示的神經(jīng)反應算法。該算法是一個多層的結構,試圖模擬人類大腦皮層中的視覺處理機制,通過交替進行非負稀疏表示和最大化聯(lián)合操作來構建。非負稀疏表示能夠提取圖像中的顯著特征,而最大化聯(lián)合操作使得模型對于平移等變換具有不變性。為進一步提高算法的

3、性能,本文依據(jù)算法的結構特點,還設計了兩種簡單而有效的模板選取方法。通過仿真實驗,驗證了該算法能大幅提高原始的神經(jīng)反應模型的性能,并在復雜圖像的分類問題中取得較好的效果。
  然后,通過引入ELM(extreme learning machine)的理論,本文提出了一種基于神經(jīng)反應模型的多層結構算法。該算法主要包含兩個階段,即多層的ELM特征映射階段和ELM學習階段。其中,多層的ELM特征映射階段是一個多層的結構,它是以遞歸的方式

4、通過交替進行特征圖構建和最大化聯(lián)合操作來建立的。特別地,我們使用隨機生成的輸入權重構建特征圖,且無需對權重參數(shù)進行優(yōu)化調節(jié),這使得模型的結構更加簡單,有更高的計算效率。在ELM學習階段,本文提出了一種基于彈性網(wǎng)正則化約束的優(yōu)化模型,為ELM方法學習輸出權重,并相應地設計了問題的優(yōu)化算法。彈性網(wǎng)正則化約束能夠為ELM方法學習更緊致和有選擇性的輸出權重,這將有益于ELM方法的特征學習過程。實驗結果顯示,與傳統(tǒng)的深度學習方法相比,該算法能夠在

5、獲得更高分類精度的前提下,花費更少的計算時間。
  最后,針對實際問題中訓練數(shù)據(jù)不足的情況,本文提出了一種半監(jiān)督的基于圖正則化約束的稀疏表示算法。該算法能夠充分利用已標記數(shù)據(jù)和未標記數(shù)據(jù)的信息,學習未標記數(shù)據(jù)的類別信息。學習得到的類別信息,不僅能夠保持與原始數(shù)據(jù)相同的流形結構,而且具有較好的區(qū)分性,有利于對圖像進行分類。為了充分挖掘未標記數(shù)據(jù)中隱含的結構信息,通過賦予鄰域內未標記數(shù)據(jù)額外的權重,定義了一種新的類間相似度矩陣和類內相

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論