流形降維方法在視頻內(nèi)容分析中的應(yīng)用研究.pdf_第1頁
已閱讀1頁,還剩57頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、隨著計(jì)算機(jī)、網(wǎng)絡(luò)和數(shù)字化技術(shù)的發(fā)展和普及,網(wǎng)上多媒體數(shù)據(jù)量急劇增加,計(jì)算機(jī)自動處理、分析、挖掘、檢索網(wǎng)上海量多媒體數(shù)據(jù)(特別是視頻數(shù)據(jù))已經(jīng)成為信息社會的迫切需求,視頻信息處理和內(nèi)容分析的研究迎來了巨大的發(fā)展機(jī)遇,也面臨著許多挑戰(zhàn)。 過去10多年來,人們在鏡頭邊界檢測、場景分析、視頻摘要等許多方面取得很大研究進(jìn)展,主要成績有:研究了各種低級視覺特征(例如顏色、邊緣、紋理等)的提取方法和表示能力;采用了多種數(shù)學(xué)模型(例如隱馬爾科夫

2、模型HMM、高斯混合模型GMM等)進(jìn)行視頻內(nèi)容分析,以發(fā)現(xiàn)各種模型對視頻信息的建模和表達(dá)能力;探索了各種基于機(jī)器視覺、模式識別的方法,以發(fā)現(xiàn)更加有效的時(shí)空特征,以及更適合視頻特征提取與識別的方法。 在這些研究中,已經(jīng)有很多方法能夠進(jìn)入實(shí)際應(yīng)用,如鏡頭邊界檢測技術(shù)等。但是,在所取得的大量研究進(jìn)展之背后,我們還應(yīng)清楚地看到一些難以解決的問題,例如涉及高層語義的場景分析問題仍然沒有切實(shí)可行的解決方案,因?yàn)檎Z義鴻溝的存在,基于語義的視頻

3、內(nèi)容分析的研究尚無重大進(jìn)展。 近年來提出的一些非線性降維方法,例如流形降維方法,在視頻內(nèi)容分析中可能會發(fā)揮重要作用,因?yàn)樗芨玫亟沂倦[藏在觀察數(shù)據(jù)中的某些內(nèi)在規(guī)律,這是傳統(tǒng)線性方法(例如主分量分析PCA)無法做到的。 本文采用流形降維方法處理視頻內(nèi)容分析中兩個(gè)實(shí)際問題:鏡頭邊界分類和場景分析。我們用一種流形降維方法即拉普拉斯特征映射來發(fā)現(xiàn)鏡頭邊界附近圖像序列的時(shí)域變化模式,用圖像序列在其低維流形空間的映射來表示鏡頭邊界

4、的特征,以期反映鏡頭邊界的本質(zhì)特性;同時(shí),我們針對鏡頭邊界分類問題的樣本不平衡特性,設(shè)計(jì)了一種樣本大小相關(guān)的KNN分類器,以學(xué)習(xí)每一種類型的鏡頭邊界的模式。實(shí)驗(yàn)表明,流形空間表示的圖像幀序列模式能很好地反映鏡頭內(nèi)容變化的本質(zhì)特性。 對于視頻場景分析,至今也沒有取得良好進(jìn)展,其主要原因是語義鴻溝問題。本文提出了一種介于鏡頭和場景之間的結(jié)構(gòu)特征,它能在一定程度上刻畫類似場景的結(jié)構(gòu)信息,但又不涉及高層語義信息提取的難題。我們用拉普拉斯

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論