版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、視覺對象分類是對一組視覺圖像自動地進行對象分類或者判定某幅圖像是否屬于某個類別,定位并提取出圖像中感興趣的目標,這是計算機視覺和模式識別領域中一個熱點難點問題,對圖像內(nèi)容理解、圖像檢索等有著重要的意義。由于在現(xiàn)實世界中圖像是千變?nèi)f化的,存在著視角、亮度、尺度等變化,且其數(shù)據(jù)量在與日俱增,使得傳統(tǒng)的手工視覺對象提取非常困難。因而需要引入機器學習的方法,根據(jù)圖像的底層視覺特征對其語義概念進行分類和學習,建立復雜的視覺對象分類模型。目前國內(nèi)外
2、通常使用圖像的底層視覺特征如顏色、紋理、形狀以及對象的空間關(guān)系等信息來表示圖像的內(nèi)容,但從計算機所表達出的視覺特征到圖像的實際語義表達之間存在著巨大的“語義鴻溝”。本文的研究方向是視覺對象分類,主要針對在使用傳統(tǒng)的機器學習方法時使用人工標記費時費力的缺點,以及在“Bag of Words ”圖像表示模型中存在的語義描述能力有限的缺點,對現(xiàn)有的多示例學習算法進行了改進。主要研究內(nèi)容如下:
⑴結(jié)合分割區(qū)域的多示例學習。該算法是
3、在MILES 算法的基礎上,與結(jié)合分割進行多示例學習并進行目標檢測與提取。該方法在“Bag of Words ”圖像表示模型的基礎上,將一副圖像看作一個包,表示該圖像的若干視覺單詞作為包中示例,并把視覺單詞辭典作為特征空間,通過對包中示例個數(shù)統(tǒng)計將其映射到特征空間中,考慮到1-norm SVM具有較好的稀疏性,隨后用其來挑選重要特征的同時對圖像進行分類;此后為了實現(xiàn)目標的提取,需要對判定為正的圖像進行示例判定,然后根據(jù)判定為正的示例所在
4、位置作為相應的目標“種子”點,進一步與圖像分割結(jié)果相結(jié)合,最終實現(xiàn)了目標提取。在Caltech 101 標準圖像集上進行實驗的實驗證明了該算法的有效性。
⑵基于視覺短語的多示例學習。針對“Bag of Words ”圖像表示模型中,視覺單詞的產(chǎn)生過程僅采用無監(jiān)督聚類方法,忽略了視覺單詞相互之間的空間信息,導致其語義描述能力有限且區(qū)分性能弱等缺點,本章提出了一種高階的視覺特征取代視覺單詞,即通過視覺單詞在空間中的空間相互關(guān)系
5、構(gòu)建具有語義區(qū)分能力的視覺短語,可以提高“Bag of Words ” 圖像表示模型的準確性。鑒于傳統(tǒng)的基于“Bag of Words ”模型的分類方法性能容易受到圖像中背景、遮擋、尺度變化明顯等因素影響導致分類精度較低等問題,本文在視覺短語的基礎上,結(jié)合多示例學習思想,提出了一種用于圖像分類的多視覺短語學習方法,使最終的分類模型可以反映出圖像類別的區(qū)域特性。在一些標準的圖像測試集合Caltech 101和Scene 15 進行實驗,實
6、驗結(jié)果表明該算法的具有很好的分類性能,與現(xiàn)有算法相比分類準確率相對提高了約9%和7%左右。
⑶多核多示例學習。視覺對象往往需要多種特征來進行描述的,在采用一種特征的情況的下分類會不準確,考慮到多示例學習可以處理微弱標記的圖像且分類精度較高,然而在多示例學習中,通常只可以用一個特征對示例進行描述。因而考慮采用多核的方法在多示例學習中引入多種特征。因而,提出了一個多核多示例學習框架,用于解決多示例情況下的多特征學習問題。該框架
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于多示例多標簽學習的圖像分類標注.pdf
- 基于多示例多標記學習的自然場景圖像分類.pdf
- 基于多示例學習的話者屬性分類研究.pdf
- 基于多核多示例學習的洗車行為識別方法研究.pdf
- 基于主動學習的多示例文本分類研究.pdf
- 一種基于集成學習的多示例分類模型.pdf
- 基于多示例學習的超聲乳腺腫瘤良惡性分類.pdf
- 多示例學習算法研究.pdf
- 基于多示例學習的心電圖分析和圖像分類算法研究.pdf
- 基于多示例學習的中文文本表示及分類研究.pdf
- 基于多示例學習的淺表器官超聲圖像分類方法研究.pdf
- 基于直推式多示例學習的圖像分類算法研究.pdf
- 基于特征學習的多示例多標記學習研究.pdf
- 快速多核學習分類研究及應用.pdf
- 基于主動學習的多示例多標簽學習算法研究.pdf
- 多示例多標記哈希學習方法研究.pdf
- 基于多核學習的醫(yī)學圖像模式分類.pdf
- 多核學習下的場景分類方法研究.pdf
- 基于多示例多標簽分類的Web文本挖掘研究.pdf
- 自然場景圖像中多示例多標記分類研究.pdf
評論
0/150
提交評論