基于深度學習的人體動作識別研究.pdf_第1頁
已閱讀1頁,還剩81頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、人體動作識別因為其廣泛的現(xiàn)實應用前景,成為圖像處理、計算機視覺、機器學習等領域的研究熱點,但仍然是一個具有挑戰(zhàn)性的課題。在人腦視覺機理的啟發(fā)下,深度學習的提出使得機器學習取得突破性的進展,也為人體動作識別的研究帶來了新的方向。深度學習基于一系列算法,通過分層非線性轉(zhuǎn)換無監(jiān)督地獲取數(shù)據(jù)的高層抽象。不同于傳統(tǒng)的識別方法手工提取特征,深度學習能夠自動地從低層次的特征中學習出高層次的特征,解決了特征選取過于依賴任務本身和調(diào)整過程耗費時間等問題。

2、本文重點研究在復雜場景下的人體動作識別及運動視頻中時空特征的提取問題,克服環(huán)境差異和時間變化給識別造成的困難。本文在研究深度學習典型模型卷積神經(jīng)網(wǎng)絡和深度置信網(wǎng)絡的基礎上,提出了具有創(chuàng)新性的人體動作識別模型。
  本文的具體研究工作如下:
 ?。?)研究了復雜場景下RGB圖像中人體的動作識別問題。卷積神經(jīng)網(wǎng)絡由于局部權(quán)值共享和池化的特殊結(jié)構(gòu),對于特定的姿態(tài)、光照、環(huán)境雜亂變化均具有不變性,在圖像處理方面具有天然的優(yōu)越性。因此

3、,本文提出一個改進的卷積神經(jīng)網(wǎng)絡模型,提取2D圖像序列中的動作特征,并經(jīng)過softmax回歸進行分類。其中,為了更有效的預訓練卷積核權(quán)值,本文還利用卷積自動編碼器替代傳統(tǒng)的后向傳播算法進行初始化工作。試驗表明該模型有效地解決了復雜場景下動作識別問題,較傳統(tǒng)方法具有更高的識別率。
  (2)針對運動視頻中的時空特征進行研究。為了使識別方法更具實用價值,本文提出了一個多分辨率的3D卷積神經(jīng)網(wǎng)絡模型。在保留高分辨率的原始輸入流的前提下,

4、增加一個包含動作的低分辨率輸入流,形成一個新的雙流3D卷積神經(jīng)網(wǎng)絡框架。這樣既能夠利用3D卷積核提取連續(xù)視頻幀中的時空信息,又加快了網(wǎng)絡的運算速度。實驗證明,此方法無需任何先驗信息取得了和傳統(tǒng)算法相近的結(jié)果。
  (3)前兩個研究點均為基于RGB圖像序列的特征提取方法,第三個研究點則提出了一個基于RGB-D視頻數(shù)據(jù)的識別模型。該模型通過傳感器Kinect獲取深度圖像序列,并進行一定處理獲取低層時空信息,再通過一個金字塔型的深度置信

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論