面向基于內(nèi)容多媒體應(yīng)用的視頻對(duì)象分割.pdf_第1頁(yè)
已閱讀1頁(yè),還剩132頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、隨著互聯(lián)網(wǎng)和多媒體技術(shù)的迅速發(fā)展,我們?cè)诿刻斓纳钪卸紩?huì)接觸到大量的圖像和視頻信息。圖像和視頻的壓縮技術(shù)已經(jīng)取得了巨大的成就,有效地解決了存儲(chǔ)和傳輸?shù)膯?wèn)題,目前的多媒體應(yīng)用迫切需要的是基于內(nèi)容的功能。為了有效地提供基于內(nèi)容的功能,必須從視頻場(chǎng)景中分割出有意義的視頻對(duì)象,以獲得視頻內(nèi)容的基于對(duì)象的表示。視頻對(duì)象分割最初的研究動(dòng)機(jī)是為了實(shí)現(xiàn)MPEG-4基于內(nèi)容的編碼功能,現(xiàn)在它已經(jīng)成為支持任何一種基于內(nèi)容的多媒體應(yīng)用的關(guān)鍵技術(shù),其中包括視頻

2、索引和檢索、智能視頻監(jiān)控、人機(jī)交互以及視頻編輯等應(yīng)用。 視頻對(duì)象分割方法基本上可分為兩類:即自動(dòng)分割方法和半自動(dòng)分割方法。在詳細(xì)回顧已有方法的基礎(chǔ)上,本文提出了一種更細(xì)化的分類標(biāo)準(zhǔn),強(qiáng)調(diào)了視頻對(duì)象跟蹤算法在自動(dòng)和半自動(dòng)分割方法中的通用性。對(duì)于自動(dòng)分割,本文提出了兩種運(yùn)動(dòng)對(duì)象分割算法以及一種人臉對(duì)象分割算法。對(duì)于半自動(dòng)分割,本文提出了一個(gè)交互式視頻對(duì)象分割工具以及一種同樣可用于自動(dòng)分割中的視頻對(duì)象跟蹤算法。 具體來(lái)說(shuō),本文

3、的主要?jiǎng)?chuàng)新工作如下:(1)使用光流場(chǎng)的運(yùn)動(dòng)信息,提出了基于假設(shè)檢驗(yàn)的運(yùn)動(dòng)對(duì)象分割算法。初始分割采用分水嶺分割算法,接著根據(jù)顏色相似性進(jìn)行區(qū)域合并;然后利用光流場(chǎng)估計(jì)和全局運(yùn)動(dòng)估計(jì)獲得全局運(yùn)動(dòng)的殘余誤差;最后以各個(gè)區(qū)域的殘余誤差數(shù)據(jù)進(jìn)行假設(shè)檢驗(yàn)來(lái)確定運(yùn)動(dòng)區(qū)域,組合所有的運(yùn)動(dòng)區(qū)域來(lái)生成具有準(zhǔn)確邊緣的完整視頻對(duì)象。 (2)在時(shí)空分割框架下提出了一種自動(dòng)視頻對(duì)象分割算法。時(shí)域分割采用了基于F檢驗(yàn)的變化檢測(cè)方法;針對(duì)空域分割提出了一種彩色

4、圖像的分裂合并算法;然后考慮以前幀分割出的運(yùn)動(dòng)對(duì)象的累積結(jié)果,進(jìn)行時(shí)空分割結(jié)果的融合;最后提出了一種利用邊緣信息來(lái)消除顯露的背景區(qū)域的后處理方法。 (3)針對(duì)半自動(dòng)分割的第一步,開(kāi)發(fā)了一個(gè)交互式視頻對(duì)象分割工具來(lái)方便用戶定義感興趣的視頻對(duì)象。用戶交互結(jié)合了畫標(biāo)記和區(qū)域選擇這兩種方式,所提出的快速種子區(qū)域合并算法用來(lái)從分割區(qū)域中提取出視頻對(duì)象。靈活的用戶交互方式和種子區(qū)域合并算法相互配合,最大程度上減少了用戶交互的工作量。

5、 (4)提出了一種雙向投影的方法用于視頻對(duì)象跟蹤,它有機(jī)地結(jié)合了前向投影和后向投影各自的優(yōu)點(diǎn)。前向投影用來(lái)在當(dāng)前幀中粗略定位視頻對(duì)象的邊界,接著在其膨脹區(qū)域內(nèi)進(jìn)行實(shí)際的分水嶺分割。然后在較小的搜索范圍內(nèi)只對(duì)一些分割區(qū)域進(jìn)行后向投影,提高了跟蹤的效率,而且在后向投影中融合了象素分類和區(qū)域分類,保證了跟蹤的可靠性。所提出的雙向投影方法不僅可用于半自動(dòng)視頻對(duì)象分割的第二步,也可作為一個(gè)獨(dú)立的跟蹤模塊用于自動(dòng)視頻對(duì)象分割中。 (5)提出

6、了一種基于二叉劃分樹(shù)的人臉?lè)指钏惴?。首先結(jié)合象素分類和分水嶺分割的結(jié)果來(lái)獲得膚色區(qū)域;然后利用谷底檢測(cè)和熵閾值化的方法提取出臉部特征來(lái)修正膚色區(qū)域。為了從膚色區(qū)域中分割出人臉區(qū)域,提出了一種新的區(qū)域合并算法,在合并過(guò)程中考慮了相鄰區(qū)域之間公用邊界的影響,并用二叉劃分樹(shù)來(lái)表示整個(gè)區(qū)域合并過(guò)程。接著利用一系列描述人臉的幾何特征和形狀特征的模糊隸屬度函數(shù),給二叉劃分樹(shù)的每個(gè)結(jié)點(diǎn)賦值來(lái)表示該結(jié)點(diǎn)的人臉相似度。最后提出了一種在二叉劃分樹(shù)中的結(jié)點(diǎn)選

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論