圖像檢索中縮小語(yǔ)義差距的幾個(gè)關(guān)鍵技術(shù)研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩110頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、圖像檢索涉及到的研究范圍比較廣。本文僅對(duì)圖像檢索中所涉及到的圖像分割、圖像的自動(dòng)語(yǔ)義標(biāo)注以及標(biāo)注圖像的語(yǔ)義分類等幾個(gè)關(guān)鍵性問(wèn)題,進(jìn)行了深入和系統(tǒng)的研究,提出了一些新的思想和方法。
  在眾多的圖像分割方法中,基于特征空間聚類的混合模型方法常常能獲得穩(wěn)定的分割結(jié)果,而且 EM算法為模型參數(shù)提供了有效的極大似然解。然而混合模型方法是以像素的獨(dú)立性假設(shè)為前提,沒有考慮鄰近像素間的類別相關(guān)性。而且 EM算法的貪心本質(zhì)使其對(duì)初始值的選擇具有

2、很強(qiáng)的依賴性。另外,估計(jì)混合分量的個(gè)數(shù)仍是一個(gè)尚未解決的問(wèn)題。為此本文在混合模型的參數(shù)求解過(guò)程中,利用空間域?yàn)V波方法對(duì)EM算法中的E步驟進(jìn)行了限制,以使模型參數(shù)的求解受到像素位置關(guān)系的約束。這樣,分割結(jié)果不僅依賴于像素的統(tǒng)計(jì)特性,還兼顧了它的空間位置信息。在混合模型中引入這種位置約束方法,在一定程度上減小了算法陷入局部極值的可能性。而且,濾波的平滑能力降低了分割區(qū)域的空間混雜現(xiàn)象,使圖像過(guò)分割區(qū)域所對(duì)應(yīng)的混合分量趨于重合,這為模型選擇提

3、供了一種新的實(shí)現(xiàn)途徑。本文給出的算法從事先給定的混合分量個(gè)數(shù)開始迭代,通過(guò)合并具有相似參數(shù)的混合分量,算法可以自動(dòng)地進(jìn)行混合分量個(gè)數(shù)的選擇。整個(gè)算法只需一個(gè)迭代過(guò)程,實(shí)現(xiàn)了參數(shù)估值和模型選擇的無(wú)縫結(jié)合。
  由于 EM算法是一類迭代算法,而且算法每次迭代需要訪問(wèn)所有的數(shù)據(jù)點(diǎn),這無(wú)疑限制了圖像的分割速度。以濾波方法在混合模型中增加對(duì)像素位置關(guān)系的約束,并沒有在模型中引入與像素位置相關(guān)的參數(shù),因此,可以采用圖像減采樣方法降低模型參數(shù)學(xué)

4、習(xí)所需訪問(wèn)的數(shù)據(jù)量。本文把圖像劃分為由局部像素構(gòu)成的若干子塊,將每個(gè)子塊視為低分辨率下的一個(gè)像素,其特征值為原始分辨率子塊內(nèi)所有像素特征值的一個(gè)統(tǒng)計(jì)量,縮小了每個(gè)圖像區(qū)域內(nèi)的視覺差異性,同時(shí)也凸顯了不同圖像區(qū)域間的差異性。為了提高小樣本數(shù)據(jù)的統(tǒng)計(jì)可靠性,對(duì)參加模型求解的像素塊采取加權(quán)處理方式,并利用濾波前后像素后驗(yàn)概率間的差異來(lái)調(diào)整像素權(quán)值,自適應(yīng)地加強(qiáng)小樣本數(shù)據(jù)的統(tǒng)計(jì)特性。
  對(duì)于圖像的自動(dòng)語(yǔ)義標(biāo)注,本文并沒有考慮建立一個(gè)通用

5、的統(tǒng)計(jì)模型,來(lái)模擬圖像區(qū)域和標(biāo)注字之間的復(fù)雜相關(guān)性,而是將視覺特征和標(biāo)注字信息分別看作對(duì)圖像進(jìn)行描述的兩種不同語(yǔ)言,并采用基于實(shí)例的機(jī)器翻譯方法對(duì)圖像進(jìn)行標(biāo)注。將基于實(shí)例的機(jī)器翻譯思想應(yīng)用于自動(dòng)圖像標(biāo)注中,把帶有標(biāo)注的訓(xùn)練樣本集當(dāng)作一種標(biāo)注經(jīng)驗(yàn),在給出了一幅圖像的視覺描述后,從經(jīng)驗(yàn)庫(kù)中檢索出與之視覺相似的圖像,并且通過(guò)模仿這些例子圖像的標(biāo)注,對(duì)圖像實(shí)施標(biāo)注。對(duì)于圖像的視覺特征,采取了基于區(qū)域的描述方式,并采用推土機(jī)距離作為圖像間視覺相似

6、性的判別依據(jù)。為了增加檢索出的示例圖像的可靠性,對(duì)推土機(jī)距離作了改進(jìn),增加了圖像視覺間匹配的自適應(yīng)性。與基準(zhǔn)統(tǒng)計(jì)標(biāo)注模型標(biāo)注性能的比較,證實(shí)了算法的有效性。
  圖像的標(biāo)注為語(yǔ)義分類提供了有效的判別依據(jù),但由于每幅圖像只能獲得有限的標(biāo)注字,以及標(biāo)注字固有的語(yǔ)義不確定性,為標(biāo)注信息的合理運(yùn)用增添了難度。本文通過(guò)判別標(biāo)注字與視覺特征之間的相關(guān)性,降低標(biāo)注字的語(yǔ)義模糊性,因此可將每個(gè)標(biāo)注字視為一個(gè)單純的語(yǔ)義聚類,并通過(guò)單標(biāo)注字類別的合并

7、,獲得最終的語(yǔ)義類別。由于語(yǔ)義一致的圖像并不一定具有視覺相似性,而利用視覺與標(biāo)注字之間的相關(guān)性,能將視覺連貫性較差的圖像過(guò)濾出來(lái),這樣可以利用視覺連貫性較好的圖像,進(jìn)行語(yǔ)義類別提取和歸類。而對(duì)視覺連貫性較差的圖像,則利用已經(jīng)生成的語(yǔ)義類別,采用標(biāo)注字信息對(duì)其歸類。這種做法能夠較好地保證聚類結(jié)果的語(yǔ)義一致性,而聚類的數(shù)目可以由所提取出的語(yǔ)義類別數(shù)確定,解決了非監(jiān)督學(xué)習(xí)中的聚類數(shù)目選擇的問(wèn)題。采用外部聚類有效性判別準(zhǔn)則驗(yàn)證了對(duì)標(biāo)注圖像進(jìn)行自

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論