版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、三維頭部姿態(tài)跟蹤(3D head pose tracking)是計(jì)算機(jī)視覺和人機(jī)交互領(lǐng)域中的重要問題,也是近年來越來越引起重視的研究方向,其主要目的是通過對輸入圖像序列的分析確定頭部在三維空間中的姿態(tài)參數(shù)。三維頭部姿態(tài)跟蹤技術(shù)在人機(jī)交互、智能監(jiān)控、視頻壓縮編碼、人臉識別、表情識別、疲勞檢測、基于身體控制的游戲和娛樂等領(lǐng)域有廣泛的應(yīng)用前景。
目前常用的頭部姿態(tài)估計(jì)方法可以分成兩大類:基于統(tǒng)計(jì)學(xué)習(xí)的方法和基于注冊跟蹤的方法?;?/p>
2、于統(tǒng)計(jì)學(xué)習(xí)的方法假設(shè)頭部姿態(tài)參數(shù)和人臉的某些特征之間存在一定的對應(yīng)關(guān)系,并通過對大量具有不同姿態(tài)的樣本圖像進(jìn)行訓(xùn)練來確定這種關(guān)系。此類方法容易受到特征定義的影響,并且往往要對姿態(tài)參數(shù)進(jìn)行插值操作,因此結(jié)果不夠精確?;谧愿櫟姆椒ㄍǔ<僭O(shè)頭部為剛性物體,通過幀與幀之間的特征點(diǎn)跟蹤計(jì)算姿態(tài)參數(shù)。所選擇的特征在不同的實(shí)現(xiàn)中有很大的差異。一種方法是選擇嘴角、鼻尖和眼角等顯著特征點(diǎn)進(jìn)行跟蹤,當(dāng)所選的特征點(diǎn)被遮擋時(shí)會影響跟蹤結(jié)果。另一種方法是在
3、跟蹤過程中動態(tài)選擇特征點(diǎn),當(dāng)一些特征點(diǎn)丟失后自動進(jìn)行補(bǔ)充,此類方法有更魯棒的表現(xiàn)。總體來說,基于注冊跟蹤的方法易于實(shí)現(xiàn),同時(shí)具有較高的跟蹤精度。
已有的頭部姿態(tài)跟蹤算法大都假設(shè)被跟蹤對象沒有身體運(yùn)動或者很小的身體運(yùn)動,如用戶坐在椅子上的情況。人們在日常生活中很多時(shí)候都是通過頭部姿態(tài)來表達(dá)自己的注意力方向、態(tài)度和心理感受的,而在這些活動中,人們可能是坐在固定位置,也有可能是在身體運(yùn)動過程中的。這里我們定義身體運(yùn)動情況下的頭部
4、姿態(tài)跟蹤為大范圍頭部姿態(tài)跟蹤。相對于傳統(tǒng)的小范圍頭部姿態(tài)跟蹤技術(shù),大范圍頭部姿態(tài)跟蹤技術(shù)可以更方便的應(yīng)用在人機(jī)交互、智能監(jiān)控和行為識別等多個(gè)領(lǐng)域。
本文選用基于注冊的方法來解決大范圍頭部姿態(tài)跟蹤問題,但是當(dāng)人體大范圍運(yùn)動時(shí),過大的姿態(tài)參數(shù)變化會降低注冊算法的精度,逐幀跟蹤的方法在長時(shí)間跟蹤后會導(dǎo)致一定的誤差累計(jì),并且為了進(jìn)行三維姿態(tài)參數(shù)計(jì)算,還需要提供對應(yīng)頭部特征點(diǎn)的深度信息。因此,本文提出基于局部特征描述符的注冊算法和視
5、角表觀模型相結(jié)合的跟蹤方法,該方法將整個(gè)姿態(tài)跟蹤過程分為三個(gè)主要部分:一是獲取視頻信息和對應(yīng)的深度信息,深度信息既可以使用立體攝像機(jī)獲得也可以通過立體匹配技術(shù)獲得;二是通過基于局部描述符的注冊算法計(jì)算兩幀之間的姿態(tài)參數(shù)變化;三是使用外觀模型消除跟蹤過程中的誤差累計(jì)。與以前的工作相比,本文主要有以下幾個(gè)方面的貢獻(xiàn):
1.提出一種基于尺度不變特征變換(Scale-Invariant Feature Transform,以下簡稱
6、SIFT)描述符的注冊算法。首先在兩幀灰度圖像中找到匹配的SIFT特征點(diǎn),然后通過立體攝像機(jī)或者立體匹配技術(shù)獲得這些匹配點(diǎn)的深度信息,為了克服錯(cuò)誤匹配點(diǎn)的影響,最后使用基于隨機(jī)抽樣一致性(RANSAC)的運(yùn)動估計(jì)方法來計(jì)算頭部運(yùn)動?;赟IFT特征匹配的注冊算法具有較高的跟蹤精度,當(dāng)兩幀圖像間發(fā)生一定尺度變化時(shí)仍然可以完成跟蹤,是一種適合大范圍頭部姿態(tài)跟蹤的注冊算法。該算法是第一個(gè)針對大范圍頭部姿態(tài)跟蹤提出的注冊算法,在領(lǐng)域內(nèi)產(chǎn)生了一定
7、的影響,我們發(fā)表的介紹該算法的文章已被多個(gè)國際同行引用。
2.提出一種緊湊的特征描述符KPB-SIFT(Kernel Proiection Based SIFT,以下簡稱KPB-SIFT)。首先使用SIFT檢測算法計(jì)算特征點(diǎn)的位置、尺度和主方向,然后通過對特征點(diǎn)鄰域內(nèi)的有向梯度信息進(jìn)行核映射的方式獲得低維描述符。與SIFT相比,KPB-SIFT可顯著提高描述符的匹配速度,并且具有較強(qiáng)的區(qū)分度,在發(fā)生光照變化和幾何形變等情況
8、下都有魯棒的表現(xiàn)。
3.提出一種視角表觀模型。該模型通過多次注冊的方法消除逐幀跟蹤時(shí)的誤差累計(jì),其原理就是當(dāng)前幀除了和它的前一幀進(jìn)行注冊外,還可以和一兩個(gè)關(guān)鍵幀進(jìn)行多次注冊以減少誤差累積。具體來說,就是從輸入序列中選擇一些關(guān)鍵幀組成描述頭部的表觀模型,每個(gè)關(guān)鍵幀都被附加上對應(yīng)的姿態(tài)參數(shù),除此外還對每個(gè)關(guān)鍵幀精確提取頭部區(qū)域作為頭部視角,當(dāng)被跟蹤對象大范圍運(yùn)動時(shí),只要當(dāng)前幀的頭部視角與模型中的關(guān)鍵幀頭部視角接近時(shí),當(dāng)前幀就與
9、關(guān)鍵幀進(jìn)行注冊。多次注冊的結(jié)果通過卡爾曼濾波器(Kalman filter)進(jìn)行平滑已獲得最終的姿態(tài)參數(shù)。視角表觀模型不僅可以減少跟蹤過程中的誤差累計(jì),在頭部進(jìn)出攝像機(jī)視角、頭部離攝像機(jī)較遠(yuǎn)等情況下,視角表觀模型還可以用來快速恢復(fù)頭部姿態(tài)參數(shù)。
4.提出一種適合稠密立體匹配的快速局部特征描述符(Speeded-Up LocalDescriptor,以下簡稱SULD),用來作為立體匹配過程中的對應(yīng)點(diǎn)查找方法。為了生成局部描述
10、符,首先使用哈爾(Haar)函數(shù)對圖像進(jìn)行濾波,其次對濾波響應(yīng)圖進(jìn)行多次高斯平滑,然后計(jì)算采樣點(diǎn)并獲得采樣向量,最后對采樣向量進(jìn)行歸一化并生成描述符。通過使用Haar函數(shù)響應(yīng)信息和緊湊的描述符形式,SULD方法在描述符生成階段和匹配階段都可以快速的進(jìn)行計(jì)算。使用SULD描述符作為相似度評價(jià)方法,可以解決人臉等弱紋理圖像的立體匹配問題,進(jìn)而生成對應(yīng)的深度信息,為基于單目攝像機(jī)的頭部姿態(tài)跟蹤提供深度約束。頭部深度信息還可以在人機(jī)交互、表情識
11、別、游戲和娛樂等領(lǐng)域得到廣泛的應(yīng)用。
在整個(gè)研究過程中,還實(shí)現(xiàn)了一個(gè)集視頻采集、深度獲取、姿態(tài)計(jì)算和結(jié)果評測與一體的頭部姿態(tài)跟蹤原型系統(tǒng)-HPObserver。HPObserver為驗(yàn)證各關(guān)鍵技術(shù)和后續(xù)研究工作提供了一個(gè)完整方便的測試平臺。
使用多組頭部運(yùn)動序列進(jìn)行的實(shí)驗(yàn)表明,提出的方法能完成對頭部運(yùn)動的跟蹤,即使在人體大范圍運(yùn)動、頭部進(jìn)出攝像機(jī)視角、人臉部分遮擋、臉部表情明顯變化等情況下都能魯棒的完成跟蹤。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 大范圍新型激光告警系統(tǒng)關(guān)鍵技術(shù)研究.pdf
- 基于視覺的目標(biāo)跟蹤關(guān)鍵技術(shù)研究.pdf
- 擬人機(jī)器人頭部視覺聽覺跟蹤關(guān)鍵技術(shù)研究.pdf
- 移動增強(qiáng)現(xiàn)實(shí)大范圍定位與注冊關(guān)鍵技術(shù)研究.pdf
- 基于粒子濾波的視覺目標(biāo)跟蹤方法關(guān)鍵技術(shù)研究.pdf
- 基于紅外LED的實(shí)時(shí)視覺跟蹤若干關(guān)鍵技術(shù)研究.pdf
- 自準(zhǔn)直像視覺跟蹤測量關(guān)鍵技術(shù)研究.pdf
- 高速運(yùn)動目標(biāo)多維姿態(tài)視覺測量關(guān)鍵技術(shù)研究.pdf
- GNSS姿態(tài)測量關(guān)鍵技術(shù)研究.pdf
- 頭部可運(yùn)動的頭戴式視線跟蹤系統(tǒng)關(guān)鍵技術(shù)研究.pdf
- 基于RANSAC的視線跟蹤關(guān)鍵技術(shù)研究.pdf
- 視覺目標(biāo)檢測和跟蹤中的若干關(guān)鍵技術(shù)研究.pdf
- 盾構(gòu)掘進(jìn)姿態(tài)控制關(guān)鍵技術(shù)研究.pdf
- 基于視覺標(biāo)識跟蹤的增強(qiáng)現(xiàn)實(shí)系統(tǒng)關(guān)鍵技術(shù)的研究.pdf
- 基于機(jī)器視覺的測量系統(tǒng)關(guān)鍵技術(shù)研究.pdf
- 大范圍微結(jié)構(gòu)表面形貌測試中若干關(guān)鍵技術(shù)的研究.pdf
- 焊縫跟蹤系統(tǒng)關(guān)鍵技術(shù)研究.pdf
- 基于群體智能的機(jī)器視覺的關(guān)鍵技術(shù)研究.pdf
- 基于數(shù)據(jù)關(guān)聯(lián)的多目標(biāo)跟蹤關(guān)鍵技術(shù)研究.pdf
- 基于FPGA的GPS SDR跟蹤環(huán)路關(guān)鍵技術(shù)研究.pdf
評論
0/150
提交評論