版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、隨著互聯(lián)網(wǎng)和移動網(wǎng)絡的發(fā)展,人們可以隨時隨地接入互聯(lián)網(wǎng)獲取信息。而搜索是人們通過互聯(lián)網(wǎng)獲取信息的主要途徑之一。傳統(tǒng)的搜索方法使用文本的方式進行檢索,通常得到的也是文本信息。而互聯(lián)網(wǎng)上如圖片、視頻、聲音等多媒體信息爆炸式地增長,遠遠超過了文字信息。為了達到檢索多媒體內(nèi)容的目的,傳統(tǒng)的基于文字的信息檢索只能通過檢索多媒體內(nèi)相關(guān)文本的方式,把相關(guān)文本對應的多媒體內(nèi)容返回給用戶,其并不能根據(jù)多媒體的內(nèi)容來進行檢索。而最近在基于內(nèi)容檢索技術(shù)上的突
2、破打破了這一局面。針對互聯(lián)網(wǎng)上存在的大量重復的圖片,人們通過一些圖片特征進行匹配或索引,實現(xiàn)了以圖搜圖的目的。然而,這種方式僅限于搜索與查詢圖片相似的圖片,而用戶的檢索意圖往往是復雜多樣的,單一的使用文本或圖片檢索無法滿足用戶復雜的檢索意圖。
另一方面,手機、平板電腦等移動終端漸漸成為了人們接入互聯(lián)網(wǎng)的主要途徑。而這些移動設備本身提供了諸如語音、拍照、手勢等大量交互方式。這些交互方式為我們豐富用戶檢索意圖的表達提供了方便。
3、目前手機上的檢索仍然采用傳統(tǒng)臺式電腦的文本檢索和網(wǎng)頁方式,沒有充分利用移動設備的優(yōu)勢。本文充分發(fā)掘移動設備的交互優(yōu)勢,結(jié)合文本與圖片,創(chuàng)造性地提出了一種利用語音/文字輸入,結(jié)合視覺信息篩選的圖像檢索方式。
本論文的研究內(nèi)容主要集中在基于內(nèi)容的圖像檢索方法,分別在檢索的查詢條件構(gòu)建,特征的構(gòu)建、組織,以及視頻序列的索引結(jié)構(gòu)上。本論文的主要工作和創(chuàng)新之處歸納為以下幾點:
(1)論文提出一種在移動終端上利用多模態(tài)輸
4、入方便構(gòu)建查詢條件的方式以及整個系統(tǒng)的實現(xiàn)方法。首先用戶用語音輸入來描述想要搜索的目標,系統(tǒng)利用視覺和文本對應關(guān)系,根據(jù)用戶描述中所包含的的關(guān)鍵詞,采用聚類算法為用戶推薦一些圖片素材,用戶選擇一系列符合用戶意圖的素材,并且通過調(diào)整素材的大小和位置構(gòu)造出一幅拼圖。系統(tǒng)根據(jù)用戶的文字輸入得到候選圖片,再根據(jù)拼圖的元素及元素間位置關(guān)系,對圖片進行過濾,返回給用戶既滿足文本查詢條件,也滿足視覺查詢條件的圖片結(jié)果。論文提出了有效的算法,根據(jù)視覺特
5、征和位置關(guān)系對圖片進行過濾。提出的算法最終使得整個系統(tǒng)成為可能。
(2)論文提出了利用拼圖中的多樣例圖片以及相對位置關(guān)系對海量圖片進行索引和檢索的算法。對于大規(guī)模海量圖片,構(gòu)造一個有空間位置關(guān)系的拼圖進行檢索,需要考慮組成拼圖的各個視覺元素的存在性和相對位置關(guān)系。本文打破了以往只能根據(jù)絕對位置進行匹配、校驗的方式,采用自然分割獲取視覺單詞,利用視覺單詞確定每個目標的存在性以及位置,最后對每對目標的相對位置進行校驗,判斷位置
6、關(guān)系是否符合要求。通過對比試驗,本文證明了相對位置校驗相比絕對位置方法的優(yōu)越性。此外,本文還第一次提出將多樣例圖片搜索方法引入相似圖片檢索,將查詢圖片先粗分割成若干簡單元素變成多樣例圖片,通過查找簡單元素并進行相對位置校驗,找到與之相似的圖片。
(3)論文還提出了對視頻序列的高效視覺索引方法。為了把視覺索引方法引入視頻,論文提出了一種利用局部特征匹配進行視頻的劃分方法,把視頻分割成幾段可以用共享特征描述的場景。不同于傳統(tǒng)的
7、使用關(guān)鍵幀來索引視頻,文章提出了對于每個場景提取一個虛擬幀來描述其內(nèi)容的方法。虛擬幀包含了少量場景內(nèi)最穩(wěn)定的特征,用更少的特征保存了盡可能多的視頻信息。作者將虛擬幀與關(guān)鍵幀進行試驗比較,證明了虛擬幀比關(guān)鍵幀在對視頻的描述上具有更好的緊湊性和有效性,因此更適于對視頻的視覺索引。
總而言之,本文從基于內(nèi)容的角度出發(fā),針對多模態(tài)輸入、圖像特征、多樣例檢索以及對視頻的索引進行討論,提出思考問題的新的角度和解決問題的新的方法。同時,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 多模態(tài)媒體信息檢索技術(shù)研究.pdf
- 面向大規(guī)模多模態(tài)圖像檢索的關(guān)鍵技術(shù)研究及系統(tǒng)實現(xiàn).pdf
- 多模態(tài)視頻信息檢索.pdf
- 多模態(tài)醫(yī)學圖像融合技術(shù)研究.pdf
- 基于內(nèi)容的多模態(tài)視頻檢索.pdf
- 基于內(nèi)容的多模態(tài)醫(yī)學圖像的檢索系統(tǒng)研究.pdf
- 多模態(tài)影像腦部疾病檢索研究.pdf
- 基于內(nèi)容的圖像檢索技術(shù)在多類別商品圖像檢索中的應用.pdf
- 基于內(nèi)容的圖像檢索技術(shù)在多類別商品圖像檢索中的應用
- 多特征融合的圖像檢索技術(shù)研究.pdf
- 多模態(tài)和大型圖像配準技術(shù)研究.pdf
- 多模態(tài)醫(yī)學圖像配準和融合技術(shù)研究.pdf
- 基于多特征簽名的圖像檢索技術(shù)研究.pdf
- 多模態(tài)醫(yī)學圖像配準研究
- 基于多特征的醫(yī)學圖像檢索技術(shù)研究.pdf
- 多模態(tài)醫(yī)學圖像配準與融合技術(shù)的研究.pdf
- 多模態(tài)醫(yī)學圖像配準與融合技術(shù)研究.pdf
- 多模態(tài)骨腫瘤圖像的配準技術(shù)及應用.pdf
- 多模式圖像檢索方法研究.pdf
- 多模態(tài)醫(yī)學圖像配準研究.pdf
評論
0/150
提交評論