基于空間關(guān)系的圖像檢索與分類研究.pdf_第1頁
已閱讀1頁,還剩113頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、隨著個人媒體設(shè)備的普及和第二代互聯(lián)網(wǎng)技術(shù)的發(fā)展,互聯(lián)網(wǎng)中的圖像數(shù)量急劇增長。如何快速有效的組織和管理這些圖像成為一個研究熱點。而對圖像的組織和管理離不開對圖像內(nèi)容的理解。近些年比較熱門的研究方向如圖像檢索,圖像標(biāo)注,圖像分類,物體識別都基于對圖像內(nèi)容的理解。作為一個二維數(shù)據(jù),圖像中存在豐富的空間分布信息,包括圖像中包含的物體之間的空間關(guān)系和物體本身的空間結(jié)構(gòu)。這些空間信息對于圖像的檢索和分類有很重要的意義。
  本文圍繞圖像中空間

2、信息的表示和提取方法對圖像檢索和圖像分類,以及物體識別進(jìn)行了研究。論文的主要工作與創(chuàng)新體現(xiàn)在以下幾個方面:
  1:提出了一種自動的圖像空間關(guān)系提取和表示法,并將其應(yīng)用到圖像檢索之中。傳統(tǒng)的基于空間關(guān)系的圖像檢索是基于人工標(biāo)注了物體位置和種類的圖像庫,不適應(yīng)現(xiàn)有海量數(shù)據(jù)的互聯(lián)網(wǎng)圖像檢索。文中給出了一種圖像空間關(guān)系的表示法,并給出了基于物體識別的自動提取算法,進(jìn)而給出了其索引匹配和查詢排序等相應(yīng)算法。有別于人工標(biāo)注結(jié)果,目前物體識別

3、技術(shù)尚不完善,存在大量的誤判。本文給出的算法優(yōu)點在于它對識別誤判有很好的魯棒性。文中還給出了一個原型系統(tǒng)及其排序性能的評測。實驗證明,該系統(tǒng)在NDCG@m,MAP等測度上均優(yōu)于現(xiàn)有同類系統(tǒng)。
  2:針對圖像分類問題,提出了一種對圖像拍攝角度不一致的情況有較好魯棒性的空間圓塔匹配模型。對于體積較小的物體,人們對其拍照時的拍攝視角往往較為隨意,而視角不同時物體的外觀往往不同,進(jìn)而使同類圖像的距離變大。本文對目前較成功的空間金字塔匹配

4、模型(Spatial PyramidMatching, SPM)的層次結(jié)構(gòu)進(jìn)行了改進(jìn),提出了一種圓塔匹配模型(SpatialTower Matching, STM)。該模型對金字塔模型的改動較小,同時并未增加金字塔模型的計算復(fù)雜度,但在Caltech-101,Caltech-256和15-Scenes三個標(biāo)準(zhǔn)數(shù)據(jù)集的實驗表明,該模型對金字塔模型的分類性能有較顯著的提升。而同期發(fā)表的金字塔模型的其他改進(jìn)算法,在計算復(fù)雜度明顯增加的情況下,

5、分類性能改進(jìn)微小。
  3:針對圖像分類問題,提出了另一個對圖像拍攝視角不一致有較好魯棒性的旋轉(zhuǎn)不變性金字塔匹配模型(Rotation-Invariant Pyramid Matching,RISPM)。文中首先使用邊緣提取和梯度統(tǒng)計得到圖像的主方向,然后使用一個新穎的平滑旋轉(zhuǎn)算法對圖像的主方向進(jìn)行歸一化。最后結(jié)合傳統(tǒng)金字塔匹配算法對旋轉(zhuǎn)后的圖像進(jìn)行分類。文中對圖像旋轉(zhuǎn)算法進(jìn)行了優(yōu)化,預(yù)先計算了的旋轉(zhuǎn)映射矩陣,因而在圖像分類時,平

6、滑圖像旋轉(zhuǎn)對金字塔匹配的效率影響微小。這種算法與金字塔匹配算法較為獨立,因此可以和其他同類算法結(jié)合使用。實驗使用Caltech-101、Caltech-256和15-Scenes三個數(shù)據(jù)集進(jìn)行評測。實驗表明,結(jié)合了圖像主方向歸一化的SPM算法圖像分類性能顯著提升。
  4:傳統(tǒng)有監(jiān)督的物體識別算法需要人工對訓(xùn)練數(shù)據(jù)集中圖像的物體種類和位置進(jìn)行標(biāo)注,消耗大量人力且通用性差。文中給出了一種無監(jiān)督的物體識別算法:使用改進(jìn)的LDA模型對可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論