版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、<p><b> 摘 要</b></p><p> 運動目標(biāo)的檢測是計算機(jī)視覺和圖像編碼領(lǐng)域的重要研究之一,無論是在軍事,還是醫(yī)學(xué)和科研等領(lǐng)域都有廣泛的應(yīng)用。</p><p> 本文主要介紹了一些目前較為常用運動目標(biāo)檢測的方法,并以數(shù)字圖像處理技術(shù)為基礎(chǔ),設(shè)計出高效的運動目標(biāo)檢測方法。目前,運動目標(biāo)檢測主要有以下三種方法:基于幀間差分法,基于背景差分
2、的方法和基于光流場的方法。本文根據(jù)所處理的視頻圖像的特點以及可行性,主要研究幀間差分法和背景差法。以幀間差分法為例,利用相鄰幀圖像間強(qiáng)相關(guān)性的特點,采用幀間差分目標(biāo)檢測的方法。在對圖像差分之前,先進(jìn)行圖像預(yù)處理,再進(jìn)行相鄰幀差分得到運動信息,再對目標(biāo)的邊緣輪廓和背景進(jìn)行數(shù)學(xué)形態(tài)學(xué)濾波來去除背景噪聲,提取出目標(biāo)輪廓,該方法的優(yōu)點是操作簡便、速度快、易于硬件實現(xiàn)。在論文后期引入了人臉的定位、人臉的識別功能,其中臉部的定位主要根據(jù)臉部膚色的亮
3、度值、臉部形狀特點、眼球亮度值以及眼部對稱性等特點,利用最小矩陣查找臉部區(qū)域并標(biāo)記;而人臉的識別則根據(jù)輸入圖片與訓(xùn)練庫中的圖片做比照,完成圖片的識別。</p><p> 關(guān)鍵詞:圖像處理;目標(biāo)檢測;幀間差分:閾值分割;人臉識別 </p><p><b> Abstract</b></p><p> Moving target detect
4、ion is one of the important research field of computer vision and image coding, whether it is in the military, medicine and research and other fields have a wide range of applications.</p><p> This paper de
5、scribes some of the more commonly used moving target detection method based on digital image processing technology, the design of efficient moving target detection method. , Moving target detection are mainly the followi
6、ng three methods: based on inter-frame difference method based on background difference method and the method based on optical flow field. Based on the characteristics and the feasibility of the processed video image mai
7、nly study the inter-frame difference method and</p><p> Keywords: Image processing; target detection; the interframe difference: threshold segmentation; Face Recognition</p><p><b> 目 錄&
8、lt;/b></p><p><b> 1 緒 論1</b></p><p> 1.1 課題研究的目的和意義1</p><p> 1.2 課題的現(xiàn)狀1</p><p> 1.2.1國內(nèi)研究現(xiàn)狀1</p><p> 1.2.2國外研究現(xiàn)狀1</p><
9、p> 1.3課題的典型應(yīng)用2</p><p> 2 數(shù)字圖像處理理論基礎(chǔ)4</p><p> 2.1 數(shù)字圖像處理的基本概念4</p><p> 2.1.1 數(shù)字圖像4</p><p> 2.1.2數(shù)字圖像處理基本內(nèi)容5</p><p> 2.1.3數(shù)字圖像處理特點6</p>
10、<p> 2.2數(shù)字圖像處理基本算法7</p><p> 2.2.1圖像像素間關(guān)系9</p><p> 2.3 數(shù)字圖像處理方法10</p><p> 2.4 數(shù)字圖像處理的應(yīng)用領(lǐng)域10</p><p> 3 運動目標(biāo)檢測11</p><p> 3.1運動目標(biāo)檢測的現(xiàn)狀與發(fā)展11&l
11、t;/p><p> 3.2 圖像背景提取與更新算法11</p><p> 3.2.1 手動背景法11</p><p> 3.2.2 統(tǒng)計中值法12</p><p> 3.2.3 算術(shù)平均法12</p><p> 3.2.4 Surendra算法13</p><p> 3.2.5
12、 其他算法14</p><p> 3.3 運動目標(biāo)檢測算法研究14</p><p> 3.3.1 幀間差法15</p><p> 3.3.2 背景減法17</p><p> 4 運動物體檢測的實現(xiàn)17</p><p> 4.1硬件實現(xiàn)17</p><p> 4.1.1 C
13、CD 攝像機(jī)的簡介17</p><p> 4.1.2 CCD 攝像機(jī)的工作原理18</p><p> 4.1.3 CCD 攝像機(jī)的分類18</p><p> 4.1.4數(shù)據(jù)采集卡19</p><p> 4.2軟件實現(xiàn)19</p><p> 4.2.1基本思想19</p><p&
14、gt; 4.2.2程序流程圖19</p><p> 4.2.3運動物體檢測的實現(xiàn)20</p><p> 4.2.4人臉識別23</p><p><b> 5總結(jié)與展望30</b></p><p><b> 致 謝31</b></p><p><b&
15、gt; 參考文獻(xiàn)32</b></p><p><b> 附錄34</b></p><p><b> 第一章緒論</b></p><p> 1.1課題研究的目的與意義</p><p> 當(dāng)人們感知到的環(huán)境信息,對動態(tài)視覺信息的視覺信息占很大一部分。這些動態(tài)的視覺信息對的感知已
16、成為計算機(jī)視覺領(lǐng)域的一個重要研究方向。在現(xiàn)實生活中,大量有意義的視覺信息都包含在運動中。雖然人類的視覺可以看到運動的物體,可以看到靜止的物體,但在許多場合,如航空和軍用飛機(jī)的指導(dǎo),交通監(jiān)控,重要場所的安全和汽車的自動駕駛和輔助駕駛等,人們傾向于對移動的物體更感興趣。近幾年來,運動目標(biāo)的檢測一直都是圖像處理和計算機(jī)視覺領(lǐng)域的一個活躍的分支,也是動態(tài)圖像分析的基礎(chǔ)。它結(jié)合了許多相關(guān)領(lǐng)域的圖像處理、模式識別、人工智能和知識的自動控制,是一種從
17、地層序列圖像中對目標(biāo)的自動檢測以及提取目標(biāo)位置信息。目前,運動物體檢測已被廣泛應(yīng)用于視頻監(jiān)控、醫(yī)療診斷、智能交通、運動分析等領(lǐng)域。因此本文的研究具有重要的理論意義和實用價值。</p><p> 1.2課題的研究現(xiàn)狀</p><p> 1.2.1國內(nèi)研究現(xiàn)狀</p><p> 在國內(nèi),運動圖像分析已在人體運動檢測、智能交通、機(jī)器人視覺等很多領(lǐng)域展開了深層次研究。
18、但總的來說,國內(nèi)的研究主要還是停留在理論方面,尚且還未出現(xiàn)比較大型的并能夠應(yīng)用于實際的成型系統(tǒng)。我國從1986年開始正式立項研究圖像檢測,在理論研究上圖像檢測算法取得了很大的發(fā)展。2002年劉永信等人深入探討了遞歸最小二乘法在圖像背景重建中的應(yīng)用,該應(yīng)用中用到了Kalman濾波理論的漸消記憶[1];同年,張輝等人研究了如何實現(xiàn)對聚類的自動檢和測出格點檢測;1999年,王栓等人提出了一種運動目標(biāo)檢測算法,其算法基于差分圖像,其檢測結(jié)果是符
19、號化了的圖像,其中外接矩形表示運動目標(biāo),并根據(jù)連續(xù)性約束假設(shè),實現(xiàn)了對運動目標(biāo)的跟蹤[2];2003年隋嘩等人講述了在交通監(jiān)控系統(tǒng)中應(yīng)用視頻圖像流來跟蹤運動目標(biāo),并針對目標(biāo)分類的具體過程和原則進(jìn)行詳細(xì)的闡述,基于目標(biāo)檢測提出了雙差分的目標(biāo)檢測算法,對目標(biāo)進(jìn)行分類時采用了連續(xù)時間限制和最大估計的原則[3]。</p><p> 1.2.2國外研究現(xiàn)狀</p><p> 目前,運動目標(biāo)檢測技
20、術(shù)發(fā)展較為成熟的是美國、歐洲和日本等發(fā)達(dá)國家。1955年,Wax提出目標(biāo)檢測與跟蹤的基本概念:1964年,Sittler在包括數(shù)據(jù)關(guān)聯(lián)等內(nèi)容的多目標(biāo)檢測與跟蹤理論方面取得了重大進(jìn)展。上世紀(jì)七十年代初期,隨著Kalman濾波技術(shù)在雷達(dá)跟蹤中的應(yīng)用,目標(biāo)跟蹤理論開始被人們關(guān)注;Bar-Shalom和llSinger將濾波理論與數(shù)據(jù)關(guān)聯(lián)進(jìn)行有機(jī)結(jié)合,進(jìn)一步發(fā)展和完善了運動目標(biāo)跟蹤理論。八十年代期初,由于興起高速處理芯片,目標(biāo)檢測的研究進(jìn)入了新
21、的篇章。1997年,在卡內(nèi)基梅隆大學(xué)的帶領(lǐng)下,許多高校相繼參與了視覺監(jiān)控重大項目VSAM(Visual Surveillance and Monitoring)[4] ,主要研究在各場景下如民用、戰(zhàn)場等進(jìn)行監(jiān)測的自動視頻理解技術(shù);2000年初,以麻省理工學(xué)院為首的26家高校及部分公司合作的重大項目HID(Human Identification at a Distance)計劃,該項目的主要任務(wù)就是開發(fā)大范圍的、多模式的視覺檢測技術(shù),來
22、滿足在遠(yuǎn)距離時對人的檢測、分類和識別,增強(qiáng)國防和民用場合的自動保護(hù)能力,從而免受恐怖襲擊;此外還有,</p><p> 1.3課題的典型應(yīng)用</p><p><b> ?。?)智能視頻監(jiān)控</b></p><p> 出于對銀行、金庫、海關(guān)、監(jiān)獄等敏感場所的安全考慮,實時地檢測到關(guān)鍵地點可疑對象就顯得尤為重要。自從“911”事件后,各國出于對
23、自身安全的考慮,加大了在反對恐怖主義的斗爭中的投入,在各個大型公共場所安裝視頻監(jiān)控,及時對進(jìn)行監(jiān)控已經(jīng)十分普及。</p><p><b> ?。?)人機(jī)交互</b></p><p> 原始的人機(jī)交互方式是由計算機(jī)鍵盤和鼠標(biāo)完成的,針對高級用戶接口,人們期望未來的計算機(jī)能夠如人一樣靈活和便捷地交流,辟如通過手語來翻譯、用手勢來實現(xiàn)控制等。計算機(jī)采用無接觸式的方式對人在
24、計算機(jī)前的視頻信號進(jìn)行采集,再利用相關(guān)理論對視頻信號加以分析,辨別人的動作,了解人的意圖。這種人機(jī)交互界面以人為中心,終將是今后的主要研究與發(fā)展的方向[5]。而以上技術(shù)實現(xiàn)的基礎(chǔ)就是先對人的手部和面部進(jìn)行檢測和跟蹤。</p><p><b> ?。?)運動分析</b></p><p> 首先分割圖像中的人體部分,在圖像序列中分析感興趣的關(guān)節(jié)運動并加以跟蹤,然后建立人
25、體的幾何模型用以解釋人體運動的行為理論,能夠積極地推動運動性能的提高?;谏鲜鲞\動分析的原理,運動分析可以應(yīng)用在體育領(lǐng)域、舞術(shù)訓(xùn)練等領(lǐng)域。例如從大量的關(guān)于體育運動的數(shù)據(jù)庫中根據(jù)內(nèi)容進(jìn)行快速檢測搜索等。此外,在遠(yuǎn)距離的情況下對人的對身份鑒別時,常以步態(tài)分析作為獨特的生物特征。</p><p><b> ?。?)視頻壓縮</b></p><p> 不論是對視頻的存儲還是
26、對視頻的傳輸而言,視頻壓縮技術(shù)都是一個非常重要的技術(shù)。目前已有的壓縮算法大多是對圖像進(jìn)行編碼層次的壓縮,壓縮效果不太理想,不能滿足高要求的壓縮需要。而采用一種新的壓縮方式如基于幀間運動的壓縮,很大程度地減少視頻的占用空間,特別是有運動目標(biāo)存在的靜止場景,先將運動目標(biāo)檢測出來,然后對目標(biāo)進(jìn)行提取,通過傳輸靜止的背景圖像、運動的目標(biāo)圖像和目標(biāo)的運動軌跡,就能夠輕易地還原出原始視頻。這種對運動目標(biāo)的檢測和提取不僅降低傳輸,對存儲費用也有所降低
27、。</p><p><b> ?。?)交通檢測</b></p><p> 目標(biāo)檢測研究還被應(yīng)用到天空中和陸地上。以交通為例,如高峰期路面車流量的控制、道路上車輛異常行為的檢測、行人行為是否違章的判定等。值得一提的是,車輛異常行為的檢測在預(yù)防交通事故和交通事故的處理等方面有重大的使用價值。</p><p><b> ?。?)醫(yī)療診斷&
28、lt;/b></p><p> 臨床醫(yī)學(xué)上,常用X射線、α射線和核磁共振等方法實現(xiàn)病理部位的成像,進(jìn)而利用運動目標(biāo)檢測方法來對病理部位分析[6];追蹤微細(xì)胞并觀察其生長過程時常常采用目標(biāo)檢測與跟蹤方法,該方法在觀察人工植入器官使用情況中也體現(xiàn)出了不可忽視的作用。</p><p><b> ?。?)精確制導(dǎo)</b></p><p> 近
29、年來,幾次局部戰(zhàn)爭的爆發(fā),都充分體現(xiàn)出精確制導(dǎo)武器精確打擊已成為現(xiàn)代戰(zhàn)爭的主要作戰(zhàn)武器,并且已經(jīng)占據(jù)了主導(dǎo)地位。作為一個精確制導(dǎo)武器導(dǎo)引頭的關(guān)鍵技術(shù),其核心是目標(biāo)識別和跟蹤技術(shù),導(dǎo)彈和其他進(jìn)攻性武器仍然能夠自動檢測到目標(biāo),即使在自然條件復(fù)雜、自然干擾和人為干擾的影響下,目標(biāo)識別和跟蹤技術(shù)也能提高導(dǎo)彈和其他進(jìn)攻性武器的攻擊,以增強(qiáng)效果。</p><p> 第二章 數(shù)字圖像處理理論基礎(chǔ)</p><
30、;p> 數(shù)字圖像處理,始于20世紀(jì)50年代,那時候的電子計算機(jī)已經(jīng)有了一定的發(fā)展,計算機(jī)處理圖像和圖形信息已經(jīng)出現(xiàn)。大約20世紀(jì)60年代初期,數(shù)字圖像處理形成一門獨立的學(xué)科。圖像處理是為了對圖像質(zhì)量加以改善,處理對象是人對象,目的是為了改善人的視覺效果。處理過程中,輸入的是低質(zhì)量的圖像,輸出的是改善質(zhì)量后的圖像,常用的圖像處理方法有圖像增強(qiáng)、復(fù)原、編碼、壓縮等。圖像處理技術(shù)在許多應(yīng)用領(lǐng)域受到廣泛重視并取得了重大的開拓性成就,屬于
31、這些領(lǐng)域的有航空航天、生物醫(yī)學(xué)工程、工業(yè)檢測、機(jī)器人視覺、公安司法、軍事制導(dǎo)、文化藝術(shù)等,使圖像處理成為一門引人注目、前景遠(yuǎn)大的新型學(xué)科。隨著圖像處理技術(shù)的深入發(fā)展,隨著計算機(jī)技術(shù)和人工智能、思維科學(xué)研究的迅速發(fā)展,數(shù)字圖像處理向更高、更深層次發(fā)展。 隨著數(shù)字多媒體技術(shù)的不斷發(fā)展,數(shù)字圖像處理技術(shù)被廣泛應(yīng)用于可視電話、電視會議、監(jiān)控系統(tǒng)、智能交通監(jiān)控、目標(biāo)跟蹤、機(jī)器人導(dǎo)航等各種民用、商用及工業(yè)生產(chǎn)領(lǐng)域中。</p><
32、p> 2.1 數(shù)字圖像處理的基本概念</p><p> 2.1.1 數(shù)字圖像 </p><p> 所謂數(shù)字圖像就是把傳統(tǒng)圖像的畫面分割成被稱為像素(picture element, 簡稱pixel。有時候也用pel這一簡寫詞)的小的離散點,各像素的灰度值也是用離散值即整數(shù)值來表示的[7]。數(shù)字圖像(digital imagine)和傳統(tǒng)的圖像即模擬圖像(picture)是有差別
33、的。為了從一般的照片,景物等模擬圖像中得到數(shù)字圖像,需要對傳統(tǒng)的模擬圖像進(jìn)行采樣和量化(采樣和量化統(tǒng)稱為數(shù)字化)。 </p><p> ?。?)采樣 采樣(sampling)是一種操作,它通過把在時間和空間上都連續(xù)的圖像變成離散點(采樣點,即像素)的集合來實現(xiàn)。圖像大多數(shù)是連續(xù)分布在二維平面上,要想將圖片輸入到計算機(jī)中,第一步要要經(jīng)過掃描把二維信號變成一維信號,最普遍的掃描方法是在二維平面內(nèi),以一定的時間間隔依
34、次地從上順序地按水平方向的直線(掃描線)掃描,然后取出濃淡值的線掃描。通過上述方法得到的一維信號,只需求出每一個特定間隔的數(shù)值,就能夠?qū)崿F(xiàn)離散的信號的獲取。運動圖像在進(jìn)行行掃描時,除開垂直和水平兩個方向,還可以在時間軸上進(jìn)行掃描。假設(shè)縱向的像素數(shù)為M,橫向的像素數(shù)為N,采樣后,圖像的大小可以由“M*N”個像素表示。 </p><p> ?。?)量化 采樣后,雖然圖像分解成在空間上和時間上離散分布的像素,但是像素
35、的值(灰度值)任然是連續(xù)的。像素的值,是指白色-灰色-黑色的濃淡值,也被稱為光的強(qiáng)度值或亮度值或灰度值。量化就是把這些連續(xù)的濃淡值變成離散的整數(shù)值的過程。假如把這些灰度值量化為8bit,那么灰度值將被分成0-255,包含256個級別,這些級別各自對應(yīng)各個灰度值的濃淡程度,也被稱為灰度標(biāo)度或灰度等級。當(dāng)0-255的值對應(yīng)白-黑的時,可以以0為白,255為黑;亦可以以0為黑,255為白。這決定于圖像采用什么方法輸入以及對圖像進(jìn)行處理的不同觀
36、點等,在編程時這是特別需要注意的一點。但在只有黑白二值的二值圖像的情形,一般設(shè)0為白,1為黑。對連續(xù)的灰度值賦予量化級的,即灰度值方法有:均勻量化,線性量化,對數(shù)量化,最大量化,錐形量化等。 </p><p> ?。?)采樣、量化和圖像細(xì)節(jié)的關(guān)系 上述的量化過程,要先確定灰度級的級數(shù)K和數(shù)值N。在對圖像進(jìn)行處理中,一般都取2的整數(shù)冪,即: </p><p> N=
37、 (2.1) </p><p> K= (2.2) </p><p> 在計算機(jī)中,一幅數(shù)字圖像所占用的二進(jìn)制存儲位數(shù)b為:</p><p> b=log=N*N*m(bit)
38、 (2.3) </p><p> 例如,一幅數(shù)字圖像,灰度級為256級(m=8),包含像素512×512個,大約需要210萬個存儲位。伴隨N和m的增加,計算機(jī)需要的存儲量也相應(yīng)增加。 從圖像數(shù)字化的過程可以看到,數(shù)字圖像是連續(xù)圖像的近似。這種近似的程度主要取決于采樣樣本的大小和數(shù)量(N值)以及量化的級數(shù)K(或m值)。N和K的值越大,圖像越清晰。</p><p> 2.1.2數(shù)
39、字圖像處理基本內(nèi)容</p><p><b> (1)圖像輸入</b></p><p> 圖像處理首先是獲取處理對象的可見模擬圖像,并將其轉(zhuǎn)換為計算機(jī)能接受的數(shù)字圖像,再送回到計算機(jī)進(jìn)行處理。對于信息不可見的對象,首先要對其“可見光圖像生成”或“信息的可視力化”等處理,該過程叫做圖像的輸入。</p><p> (2)圖像存儲與檢索</
40、p><p> 原始圖像或處理后的圖像信息基于處理,傳輸,或保存圖像信息的需要,常常要按一定的規(guī)則存儲在電腦中,以便在需要時可以很容易地找到它們,也就是所謂的圖像檢索[8]。圖像處理中,這種對圖像群體的保管工作是不可或缺的。</p><p><b> (3)圖像增強(qiáng)</b></p><p> 圖像增強(qiáng)是各種處理過程的總稱,根據(jù)所需要信息的不同,
41、它將待處理圖像交換成不同的狀態(tài)以便自身進(jìn)行獲取,簡而言之就是用來改善圖像質(zhì)量的處理手段。比如修正變形、減弱噪聲、改善對比度、消除模糊等都屬于圖像增強(qiáng)的范疇?;诟鞣N原因,很難獲得理想的圖像品質(zhì),從而使得在圖像預(yù)處理階段圖像增強(qiáng)尤為重要。</p><p><b> (4)圖像編碼</b></p><p> 對圖像編碼的研究屬于源信息理論的信源編碼,其主要目的是利用人
42、類視覺特性和圖像信號的一般特征圖像的編碼效率,來實現(xiàn)圖像壓縮。利用圖像編碼,可以有效提高圖像信息的傳輸效率,圖像信息的存儲容量也得到節(jié)省,但同時,壓縮圖像數(shù)據(jù)是保密的。</p><p><b> (5)圖像特征提取</b></p><p> 通過圖像信息測度對象,識別或理解,取決于對象的圖像特征的數(shù)量,如線,邊緣,面積,形狀,顏色,紋理,等等。通過不同的處理方法,
43、將包含圖像信息的必要特點顯現(xiàn)出來,再進(jìn)行量化處理的過程稱為圖像特征提取。</p><p> (6)圖像識別與理解</p><p> 圖像識別可以簡單地看為利用基于顏色特征的圖像特征提取的分類,如新鮮的桃子按成熟度分級,根據(jù)杏仁形狀特征分類等。圖像理解是實現(xiàn)人類認(rèn)識客觀事物的圖像信息的可視化仿真系統(tǒng)。比方解釋圖像中的田間景物,使之成為指導(dǎo)田間自動作業(yè)機(jī)的好幫手。圖像識別僅僅涉及圖像理解的
44、分類,只停留在一種簡單的層面上;而圖像理解,達(dá)到一定程度的智能化,屬于更高層次。兩者之間有著密切的關(guān)系,往往很難在嚴(yán)格意義上加以區(qū)分。</p><p><b> (7)圖像重建</b></p><p> 圖像重建依賴于CT技術(shù)的發(fā)展,主要是根據(jù)采集得到的數(shù)據(jù)來重建圖像,是一種新型的數(shù)字圖像處理技術(shù)。圖像重建主要有以下算法有迭代法、傅立葉反投影法、代數(shù)方法和卷積反投
45、影法。</p><p><b> (8)圖像輸出</b></p><p> 圖像輸出是指利用計算機(jī)將輸入的圖像、輸出的圖像以及中間處理結(jié)果的圖像內(nèi)容再現(xiàn),是獲取處理結(jié)果、觀察處理結(jié)果所必要的。</p><p> 2.1.3數(shù)字圖像處理的特點</p><p> 將數(shù)字圖像處理與人的視覺處理、模擬圖像處理相比較,可得
46、出以下特點:</p><p><b> (1)再現(xiàn)性</b></p><p> 只要保證輸入圖像不變和不變的處理方法,數(shù)字圖像處理的結(jié)果不會改變,可以很好地再現(xiàn),即可重復(fù)性。人們視覺處理的隨意性問題也不存在,也不會像模擬圖像處理那樣出現(xiàn)與圖像質(zhì)量的不一致的情況。</p><p><b> (2)定量性</b><
47、/p><p> 有一點是其他處理方式無法比擬的,那就是數(shù)字圖像處理很輕易就能得到定量的結(jié)果。</p><p><b> (3)適應(yīng)性</b></p><p> 數(shù)字圖像處理適用于可見光的圖像處理,同樣也適用于其他波段頻譜圖像的處理;可以處理動態(tài)圖像也可處理靜態(tài)圖像;處理對象能像顯微圖像那么小,也可像航空乃至衛(wèi)星照片那么大,能涉及到各個領(lǐng)域。&
48、lt;/p><p><b> (4)靈活性</b></p><p> 只需圖像處理程序稍稍修改,即使是同一幅圖像,也可得到不同的結(jié)果。數(shù)字圖像處理涉及到非線形運算、線性運算以及一切用邏輯表達(dá)或數(shù)學(xué)公式的運算等。</p><p><b> (5)精度高</b></p><p> 隨著圖像量化數(shù)和象
49、素數(shù)的增加,數(shù)字圖像處理的精度得到提高。但就目前的發(fā)展,圖像數(shù)字化的精度已經(jīng)達(dá)到很高的程度。</p><p><b> (6)處理速度較慢</b></p><p> 相比人的視覺處理速度,數(shù)字圖像處理的速度明顯處于劣勢。伴隨著不斷提高的處理精度,數(shù)字圖像處理需要更長的時間。這一點是數(shù)字圖像處理能否實用化的關(guān)鍵。慶幸的是,圖像專用硬件和計算機(jī)硬件以及圖像處理軟件技術(shù)
50、的發(fā)展,令處理速度得到不斷的提高。</p><p><b> (7)存儲容量大</b></p><p> 數(shù)字圖像處理對計算機(jī)是否配備有足夠的內(nèi)、外存儲空間有很高要求,并且越高的處理精度,需要具備更大的存儲空間。這一點是圖像處理過程中不可忽視的問題,隨著不斷推出的新型存儲器,存儲容量有望得到迅速的提高,處理精度以期有進(jìn)一步的提高。</p><p
51、> 2. 2 數(shù)字圖像處理的基本運算</p><p> 利用計算機(jī)處理圖像的過程中,有幾個基本的但非常有用的操作形式,它是數(shù)字圖像處理的基礎(chǔ)。</p><p><b> (1)灰度直方圖</b></p><p> 數(shù)字圖像處理中,灰度直方圖不失為一種簡單又有用的工具。它涵蓋了一幅圖像的灰度級內(nèi)容?;叶戎狈綀D描述的是圖像中具有該灰度
52、級的像素個數(shù),是關(guān)于灰度級的函數(shù),其函數(shù)的橫坐標(biāo)表示灰度級,縱坐標(biāo)表示該灰度值出現(xiàn)的像素個數(shù)。</p><p> 圖像的概率密度函數(shù)通過除以圖像的面積來歸一化灰度直方圖,圖像的累積分布函數(shù)是通過將面積的函數(shù)進(jìn)行歸一化處理。這一點在很大程度上方便了圖像的統(tǒng)計處理。利用灰度直方圖也可方便地進(jìn)行閡值分割操作、圖像均衡處理。</p><p><b> (2)點運算</b>
53、</p><p> 點運算(Point Operation)是一種既簡單又重要的技術(shù),它允許用戶改變圖像數(shù)據(jù)占據(jù)的灰色地帶,一個圖像的點運算的直方圖可以根據(jù)預(yù)定模式改變。點運算可以看作是從“從像素到像素”的重復(fù)行為。像素之間不發(fā)生關(guān)系,各個像素進(jìn)行獨立的處理[9]。假設(shè)輸入圖像為A(x,y),輸出圖像為B(x,y),那么點運算可用下述表達(dá)示表示:</p><p><b> (
54、2-1)</b></p><p> 由式(2-1)看出灰度變換函數(shù)f(D)決定點運算,輸出與輸入灰度級兩者存在映射關(guān)系。利用點運算調(diào)整圖像的對比度、亮度,進(jìn)而將用戶感興趣的特征突出以方便觀察。</p><p><b> (3)代數(shù)運算</b></p><p> 通過對兩幅圖像進(jìn)行點對點的加、減、乘、除運算并得到輸出圖像的運算過
55、程被稱為代數(shù)運算。上述的4種代數(shù)運算的數(shù)學(xué)表達(dá)式如下:</p><p><b> (2-2)</b></p><p><b> (2-3)</b></p><p><b> (2-4)</b></p><p><b> (2-5)</b></
56、p><p> 其中輸入圖像為A(x,y)和B(x,y),而輸出圖像為C(x,y)。</p><p> 圖像代數(shù)運算在圖像處理領(lǐng)域得到了廣泛的應(yīng)用。圖像相加運算不僅能夠有效地抑制隨機(jī)噪聲,而且能增強(qiáng)效果。在某一場景中,圖像相減的方法則可以檢測出運動圖像序列并加以控制。</p><p><b> (4)幾何運算</b></p>&l
57、t;p> 圖像的幾何變換是指隨著生產(chǎn)規(guī)模的需要,原始圖像進(jìn)行形狀和位置的變化。幾何運算是圖像處理和分析的基本內(nèi)容,它不僅提供了一些特殊的效果可能產(chǎn)生的圖像,而且簡化了圖像處理和分析的過程,尤其是當(dāng)圖像有一定的規(guī)則,圖像可以通過另一個圖像的幾何變換。 </p><p> a)位置變換(鏡像、旋轉(zhuǎn)) </p><p> 圖像鏡像變換對圖像的形狀沒有改變。鏡像變換包括水平鏡像和垂直鏡
58、像。圖像的水平鏡像操作是以圖像垂直中軸線為中心鏡像,將圖像左右半部分進(jìn)行對換;圖像的垂直鏡像操作是以圖像水平中軸線為中心鏡像,將圖像上下半部分進(jìn)行對換。</p><p> b)圖像的形狀變換(縮放) </p><p> 假設(shè)圖像X軸方向縮放比率kx,Y軸方向縮放比率是ky,原始圖中點(x0,y0)對應(yīng)于新圖中的點(x1,y1)可表示為:</p><p> x1
59、=x0*kx;y1=y0*ky </p><p> 當(dāng)kx>1且ky>1時,原圖像被放大。放大圖像時,產(chǎn)生了新的像素,可通過插值算法來近似處理。</p><p> 例如,當(dāng)fx = fy = 0.5時,圖像被縮成一半,縮小后的圖像中的(0,1)像素對應(yīng)于原圖中的(0,2)像素,(1,0)像素對應(yīng)于原圖中的(2,0)像素,其它像素可依此法類推。在原始的
60、圖像基礎(chǔ)上,每行像素隔一個取一點,此取點操作每隔一行進(jìn)行。位置變換實際上是把原始圖像每行中的像素重復(fù)取值一遍,然后每行重復(fù)一次。</p><p> 2.2.1圖像像素間關(guān)系</p><p> 一幅數(shù)字圖像由有限個像素組成,每個像素都有兩個屬性:顏色屬性和空間屬性。像素普遍是根據(jù)矩陣網(wǎng)格采樣得到,所以圖像常用矩陣的二維形式來描述。像素所在的位置用矩陣中的行列表示,像素顏色則用整數(shù)或整數(shù)向
61、量表示[10]。像素之間存在連通性、距離和鄰接性等關(guān)鍵聯(lián)系。</p><p><b> (1)距離</b></p><p> 根據(jù)不同定義,像素Q(x, y)和P(i, j)兩者的距離,可分為棋盤距離、城區(qū)距離、歐氏距離及顏色距離。</p><p> 歐氏距離D:又名幾何距離,根據(jù)幾何學(xué)有:</p><p><
62、;b> (2-8)</b></p><p> 網(wǎng)格上從起點走到終點所需要的步數(shù)可由兩個像素的距離來表示。</p><p> 城區(qū)距離 ,只有垂直和水平方向移動被允許,定義如下:</p><p><b> (2-9)</b></p><p> 棋盤距離沿對角線移動,定義為:</p>
63、<p><b> (2-10)</b></p><p> 顏色距離,定義如下:</p><p><b> (2-11)</b></p><p> 其中,=l,2,3,為修正系數(shù),和對應(yīng)像素Q和P的顏色向量分量。顏色距離和像素的所處的相對位置沒有關(guān)系,反映出顏色的像素差異。</p><
64、p><b> ?。?)鄰接性</b></p><p> 鄰接性是圖像處理中的關(guān)鍵概念。假設(shè)兩個任意像素的距離,就稱這兩個像素為4-鄰域,亦稱4-鄰接[11]。像素p的坐標(biāo)(x, y),那么(x+1,y)、(x-1,y)、(x,y+1)、(x,y-l)這四個坐標(biāo)就是p垂直和水平的鄰近像素,記作,即p的4-鄰域。</p><p><b> (3) 連通
65、性</b></p><p> 區(qū)域是由像素組成的集合,這些像素不僅有鄰接性,而且任取兩個像素,其顏色屬性符合某個特定的相似準(zhǔn)則。在這個集合中,任意兩個像素間都存在著完全屬于該集合的路徑。如果兩個像素之間存在一條路徑,則這些像素是連通的。</p><p> 2.3 數(shù)字圖像處理方法</p><p> 數(shù)字圖像處理方法包括兩大類:變換域處理法又稱頻域法
66、和空間域處理法又稱空域法。</p><p><b> (1)頻域法</b></p><p> 頻域法的步驟:先對圖像做正交變換操作,以獲得變換系數(shù)陣列,然后再做各種處理操作,處理完成后通過逆變換實現(xiàn)從頻域到空間域的轉(zhuǎn)變。</p><p><b> (2)空域法</b></p><p> 空域
67、法只需將圖像看作是平面中各個像素組成的集合,不需做任何變換直接對其進(jìn)行相觀的處理操作即可。</p><p> 2.4 數(shù)字圖像處理的應(yīng)用領(lǐng)域</p><p> 伴隨多媒體技術(shù)的飛速發(fā)展,圖像處理技術(shù)得到了空前的重視,許多新的應(yīng)用應(yīng)運而生。最關(guān)鍵的是圖像技術(shù)已從實驗室滲透到工業(yè)領(lǐng)域,商業(yè)和辦公,甚至到了人們的日常生活。目前,該技術(shù)已大量被應(yīng)用到工業(yè)檢測,生物醫(yī)學(xué),航空航天,郵政編碼,機(jī)器
68、人視覺,文檔處理,金融,公安、司法,軍事指導(dǎo),機(jī)械,銀行,文化和藝術(shù),運輸,多媒體網(wǎng)絡(luò)通信和電子商務(wù)等領(lǐng)域中。</p><p><b> 第三章運動目標(biāo)檢測</b></p><p> 3.1 運動目標(biāo)檢測的現(xiàn)狀與發(fā)展</p><p> 運動目標(biāo)檢測是圖像處理與計算機(jī)視覺的一個分支,在理論和實踐上都有重大意義,長久以來一直被國內(nèi)外學(xué)者所關(guān)注
69、。在實際中,視頻監(jiān)控利用攝像機(jī)對某一特定區(qū)域進(jìn)行監(jiān)視,是一個細(xì)致和連續(xù)的過程,它可以由人來完成,但是人執(zhí)行這種長期枯燥的例行監(jiān)測是不可靠,而且費用也很高,因此引入運動監(jiān)測非常有必要。它可以減輕人的負(fù)擔(dān),并且提高了可靠性。概括起來運動監(jiān)測主要包括三個內(nèi)容:運動目標(biāo)檢測,方向判斷和圖像跟蹤。運動目標(biāo)檢測是整個監(jiān)測過程的基礎(chǔ),運動目標(biāo)的提取準(zhǔn)確與否,直接關(guān)系到后續(xù)高級過程的完成質(zhì)量。</p><p> 運動目標(biāo)檢測在
70、國外已經(jīng)取得了一些的研究成果,許多相關(guān)技術(shù)已經(jīng)開始應(yīng)用到實際系統(tǒng)中,但是國內(nèi)研究相對落后 ,與國外還有較大差距。過去的視頻目標(biāo)提取可分為以下兩種情況 ,一種按空間同性的準(zhǔn)則 ,用濾波器譬如形態(tài)學(xué)濾波器對圖像作預(yù)處理操作;之后為實現(xiàn)區(qū)域的邊緣檢測,對該圖像的信息如色度、亮度等作空間上的分割;最后作運動估計,并將相似的運動區(qū)域合并,得到最終的視頻目標(biāo)提取結(jié)果。比較典型的算法有光流算法、主動輪廓模型算法,該方法得到較為準(zhǔn)確結(jié)果的同時也帶來了巨
71、大的運算量。另一種算法則按時間變化檢 ,通過圖像上的變化區(qū)域和不變區(qū)域的幀差檢測 ,實現(xiàn)靜止背景和運動物體的分割。此外,還有時時空亮度梯度信息結(jié)合方法、空結(jié)合的方法等等。本文將圍繞以幀差檢測為基礎(chǔ)的方法展開分析和討論。</p><p> 3.2圖像背景提取與更新算法</p><p> 運動目標(biāo)檢測時,區(qū)分出背景范圍和運動目標(biāo)是很重要的一步,攝像機(jī)靜止不動并且焦距固定是最常見的情況。此刻
72、,圖像中背景區(qū)域也是固定不變的。此時,不管是使用幀間差法,還是使用背景差法,建立質(zhì)量良好的背景在運動目標(biāo)識別中顯得格外重要。當(dāng)背景發(fā)生變化,比如背景中運動物體頻繁出現(xiàn),或者樹枝等小物體的晃動、光照強(qiáng)度發(fā)生改變等,使提取背景作為參考圖像時不夠準(zhǔn)確,這時就會導(dǎo)致無法正確地將運動物體從視頻序列中分割出來[12]。為解決以上問題,有人提出了背景建立和自適應(yīng)的背景模型,通過背景模型的實時更新,能準(zhǔn)確地檢測到運動目標(biāo)??紤]實用性和實時性,討論以下背
73、景提取算法。</p><p> 3.2.1 手動背景法</p><p> 手動背景法選取背景圖像的方法:在人觀察到?jīng)]有前景物體時啟動該幀圖像。這樣的背景提取方法,新增人力和自然資源的需求,并在許多情況下很難獲得無前景的背景圖像,如小型車輛監(jiān)控系統(tǒng),高速公路的訪問控制系統(tǒng)等。此方法無法實現(xiàn)自適應(yīng)背景的更新功能,而且對于亮度,光線等變化帶來的背景誤差要使用其他方法進(jìn)行校正。</p&g
74、t;<p> 3.2.2 統(tǒng)計中值法</p><p> 當(dāng)運動物體較少時,圖像中占主要部分的是連續(xù)多幀圖像中背景的像素值,因此一段時間內(nèi)不會有太大改變,背景圖像可由取中值獲得。從統(tǒng)計學(xué)角度講,統(tǒng)計中值算法是指統(tǒng)計連續(xù)幀圖像中,單個像素點Ai(x,y),(i=1,2,…N)的亮度值Bi。取一時間段將視頻序列圖像的亮度值Bi排序,得到中值Mi(x,y)作為背景。該算法涉及到的圖像幀的像素點數(shù)量巨大,
75、從而導(dǎo)致用于取中值的圖像幀數(shù)量N值大。換言之,利用統(tǒng)計中值法需要大量的計算,處理慢。同時用于存儲數(shù)據(jù)內(nèi)存的單元被大量占用。</p><p> 3.2.3 算術(shù)平均法</p><p> 算術(shù)平均法提取背景圖像,可以歸結(jié)為時間的像素的亮度和顏色信息和平均值的一定時期內(nèi),由對應(yīng)于像素作為背景圖像的平均值。在讀取視頻,一個像素的觀察,會發(fā)現(xiàn)在沒有前景運動目標(biāo),該點的灰度值保持穩(wěn)定,變化不大,只
76、有當(dāng)前場景中運動目標(biāo)的灰度的劇烈變化,會一點。它可以連續(xù)讀N的圖像,圖像的點的灰度或彩色信息的統(tǒng)計方法,在像素的戲劇性的變化變得平滑,取其平均值的像素值作為背景圖像。它還可以過濾圖像中的背景噪聲的點突變。</p><p> 算術(shù)平均法提取背景圖像,可以歸結(jié)為對像素點的色彩信息和亮度在特定的時間段內(nèi)取平均值,背景圖像對應(yīng)像素點的數(shù)值用均值替代。讀取視頻后,觀察某一像素點,會發(fā)現(xiàn)在沒有前景運動目標(biāo),該點的灰度值保持
77、穩(wěn)定,變化不大,當(dāng)前景存在運動目標(biāo)通過時,這一點的灰度值會發(fā)生劇烈的變化?;谶@樣的發(fā)現(xiàn),可以連續(xù)讀入N幀圖像,統(tǒng)計圖像色彩信息或各點的灰度,讓像素點從變化劇烈到平緩。即可將背景圖像中的突變噪聲點濾除。統(tǒng)計公式為:</p><p><b> ?。?-1)</b></p><p> 公式中:B (x, y)表示背景圖像,Ii(x,y)表示第i幀序列圖像,N表示平均幀數(shù)
78、。在實際場景中,一段時間內(nèi),同一區(qū)域很少有可能總是存在運動物體。而通過平均法得到的背景就會消除亮暗分布不均勻的情況。</p><p> 算術(shù)平均法的特點是模型簡單,計算方便,得到背景的圖像效果較好。然而,該算法得到背景圖像需要較大的圖像幀??紤]物體運動數(shù)量的影響,增加的幀的平均數(shù),背景圖像的質(zhì)量得到增強(qiáng)。對于序列圖像的算術(shù)平均值,如果N值太小,從背景圖像中不容易過濾移動的物體,容易在背景圖像中留下陰影。運動物體
79、多且軌跡很固定時,也要增大N的值,使平均值接近真實背景。此時,需要較長的時間建立背景。該算法還具有一定程度的自適應(yīng)更新功能。經(jīng)過背景提取后所獲得的圖像幀可當(dāng)作新的信息量,與背景圖像進(jìn)行加權(quán)平均或統(tǒng)計平均,進(jìn)而實現(xiàn)背景的自適應(yīng)更新。</p><p> 3.2.4 Surendra算法</p><p> Surendra算法可以自適應(yīng)地獲取背景圖像,該算法實現(xiàn)提取背景的原理是判斷差值圖像
80、的亮度值,當(dāng)亮度大于閾值,背景圖像中對應(yīng)位置上的像素點保持不變,否則用當(dāng)前幀替換背景圖像[13]。該算法包括下面幾個步驟:</p><p> (1)把第1幀圖像I1當(dāng)做背景圖B1。</p><p> (2)選閾值T,迭代次數(shù)取m為1,最大的迭代數(shù)為MAXSTEP。</p><p> (3)幀差分圖像的計算</p><p> 1
81、 |Ii-Ii-1|>T</p><p> Di= (2-2)</p><p> 0 |Ii-Ii-1|≤ T</p><p> (4) 背景圖像Bi的更新,</p><p> Bi-1(x,y) Di=1&
82、lt;/p><p> Bi= (2-3)</p><p> αIi(x,y)+(1-α)Ii-1(x,y) Di=0 </p><p> 在(x, y)處, Bi(x,y)為背景圖
83、像的灰度值,Di(x,y)為差分二值圖像的灰度值,第i幀輸入的圖像為Ii(x,y),α為更新速度。</p><p> (5)m自增,即m=m+1,進(jìn)行第(3)步的運算。當(dāng)滿足m=MAXSTEP時迭代結(jié)束,此時Bi(x,y)可當(dāng)作背景圖像。</p><p> Surendra算法提取背景及目標(biāo)提取都需對圖像二值化。</p><p> 閾值的選擇是簡單的,但直接影
84、響目標(biāo)分割,閾值增加時,雖可某種程度減少對環(huán)境的影響,同時也會忽略掉差分結(jié)果中變化不明顯的區(qū)域;閾值減小,又會有相反的效果。上面提到的相關(guān)算法,閾值的選擇是由靜態(tài)閾值固定。這樣閾值選取方法在實際使用中是不可取的,因為在視頻監(jiān)控應(yīng)用中,監(jiān)視器不能在任意時間評估質(zhì)量監(jiān)控并修改相應(yīng)閾值。因此,許多人提出了選取方法的閾值。但目前還沒有一個通用的方法,也不存在一個客觀標(biāo)準(zhǔn)判斷分割是否成功。</p><p> 閾值法包括全
85、局閾值法和局部閾值法。全局閾值法是指整幅圖像只用一個相同的閾值來做二值化處理;局部閾值法是針對敏感度不均勻的圖像,斜率變化緩慢時,圖像被分割成多個子塊。然后在每個子塊中分別找到該子塊中的最佳閾值,這種方法稱作局部閾值法。本文選用循環(huán)分割法來自適應(yīng)地得到在二值化一幅圖像時所需要的全局閾值T[14]?;静襟E如下:</p><p> (1)選擇一個T的初始估計值</p><p> (2)用
86、T分割圖像。這樣做會生成兩組像素:G1由所有灰度值大于T的像素組成,而所有灰度值小于或等于T的像素則組成G2。</p><p> (3)對區(qū)域G1中的所有像素計算平均灰度值μ1,對區(qū)域G2中的所有像素計算平均灰度值μ2。</p><p> (4)按下式計算新的閾值。</p><p> T=1/2(μ2+μ1)</p><p> 重復(fù)步
87、驟(2)到(4),當(dāng)逐次迭代所得到的T值之差小于預(yù)先定義的參數(shù)時結(jié)束重復(fù)。</p><p> 當(dāng)對象與背景中的類似圖像的尺寸,良好的初始值是圖像的平均灰度值。如果對象與背景的區(qū)域是不一樣的,一個像素的組合將直方圖中占主導(dǎo)地位,平均灰度值是不是一個好的初步選擇。在這個時候,初始值是比較合適的T是如一個類的初始值的灰度值的中間。</p><p> 圖像中對象和背景占據(jù)相近面積時,良好的初始
88、值是圖像的平均灰度值。如果背景與對象占據(jù)的面積不相近時,那么在直方圖中存在一個像素組合占主導(dǎo)地位,平均灰度值不再最好的選擇。在這個時候,選擇像灰度值的中間值作為初始值才更合適。對車輛檢測進(jìn)行仿真時,由于車輛與背景面積相差較大,選用的初值就是最大灰度和最小灰度和的一半。進(jìn)行閾值計算時還應(yīng)注意迭代速度和精度的矛盾。</p><p> 3.2.5 其他算法</p><p> 國內(nèi)外已有的背景
89、提取與更新算法遠(yuǎn)不止上述幾種,如混合高斯模型,分塊統(tǒng)計算法等也是目前比較常見的算法,其主體思想與算術(shù)平均法類似,只是在做法上有區(qū)別。由于絕大多數(shù)算法都是基于PC機(jī)的實現(xiàn),很少將算法的實時性作為參考要素。</p><p> 3.3運動目標(biāo)檢測算法研究</p><p> 攝像頭固定往往才是實際應(yīng)用中被考慮的情況。故對運動檢測算法做研究時,假設(shè)固定攝像頭,只檢測視場內(nèi)的目標(biāo),新目標(biāo)定義為離開
90、視場后又一次進(jìn)入的物體。較為普遍的運動目標(biāo)檢測方法是基于圖像序列中空間或時間信息的。方法如下:</p><p><b> (1)光流法</b></p><p> 圖像上,對應(yīng)目標(biāo)的亮度信息(光流)隨目標(biāo)運動會發(fā)生運動。想要由運動場來區(qū)分運動目標(biāo)和背景,只需提取幾幀圖像,并保證圖像在時間上相鄰,再將各像素點運動的方向和大小計算出。該方法即使提前不知道場景的任何信息,
91、也能將獨立的運動目標(biāo)檢測出,能較好的適應(yīng)變化的復(fù)雜背景。但是,出于依賴光流估計的準(zhǔn)確程度的考慮,計算方法復(fù)雜且計算量大,除非硬件支持十分完善,否則實時檢測不易達(dá)到。</p><p><b> (2)背景減法</b></p><p> 確定視頻背景模型中已存儲的或者實時獲得的灰度值,再將實時視頻流中圖像像素點灰度值取出,將兩者進(jìn)行比較,運動像素被認(rèn)為是不符合要求的像
92、素點。此法是視頻監(jiān)控中最常用的。雖然提取運動目標(biāo)較完整,但對環(huán)境變化過于敏感,比如光照等,從而導(dǎo)致檢測出的結(jié)果包含運動目標(biāo)的陰影。隨時間推移,場景中會發(fā)生很大改變,比方停運動目標(biāo)對背景的遮擋、光線等的變化、留物的出現(xiàn)等,這時候就需要實時更新背景,這是檢測效果是否準(zhǔn)確的關(guān)鍵。</p><p><b> (3)幀間差法</b></p><p> 幀間差法根據(jù)當(dāng)前圖像與
93、參考圖像的差別來獲得運動目標(biāo)輪廓。此法對景中光線變化不敏感,運算量小,適合對動態(tài)環(huán)境進(jìn)行檢測。不過,會有空洞現(xiàn)象產(chǎn)生在運動實體內(nèi),運動目標(biāo)的提取不完整,對下一步分析和處理有影響。</p><p> 對上述3種算法,只研究幀間差法和背景差法的仿真。光流法由于很難達(dá)到實時性要求,因此不做研究。</p><p> 3.3.1 幀間差法</p><p> 基于幀間差分
94、的運動檢測即幀差法,它根據(jù)相鄰幀或隔幀圖像間亮度變化的大小來檢測運動目標(biāo),幀間差分公式如下:</p><p> Di(x,y)=Ii(x,y)-Ii-1(x,y) (2-4)</p><p> Ii(x,y),Ii-1(x,y)為前后兩幀圖像,幀差分運動檢測只針對前景區(qū)域進(jìn)行,運動檢測公式如下,其中T為門限值。</p><p><
95、;b> 1,Di>T</b></p><p> Mi(x,y)= (2-5)</p><p><b> 0,Di≤T</b></p><p> 運用幀間差分方法進(jìn)行運動目標(biāo)的檢測,可以有效的檢測出運動物體,可以使背景像素不隨時間積累,迅速更新,因
96、此這種算法有比較強(qiáng)的適應(yīng)場景變化能力。但是幀差法表示的是相鄰兩幀同位置的變化量,因此很有可能將比較大的運動目標(biāo),或者運動目標(biāo)內(nèi)部顏色差異不大的像素判斷錯誤,在實體內(nèi)部產(chǎn)生拉伸、空洞現(xiàn)象[15]。而且當(dāng)前景運動很慢且時間間隔選擇不合適時,容易出現(xiàn)物體不被檢測到的情況,并且可能產(chǎn)生“雪花”般的噪聲,圖像局部的干擾造成上述問題。做幀間差法時,選擇合適的時間間隔是關(guān)鍵,這由運動目標(biāo)的速度決定。比如目標(biāo)運動快速,則時間間隔選擇較短,若選擇不合適,
97、會導(dǎo)致前后兩幀目標(biāo)不重疊,而使目標(biāo)有兩個;比如目標(biāo)運動緩慢,則時間間隔選擇較長,若選擇不恰當(dāng),會導(dǎo)致前后兩幀目標(biāo)全部重疊而無法對目標(biāo)進(jìn)行檢測。還有一點,時間間隔的選取還與場景中多個運動目標(biāo)的速度是否一致有關(guān)。</p><p> 3.3.2 背景減法</p><p> 背景減法實際上是指背景圖像與實時輸入的場景圖像差分的過程,此法分割的運動目標(biāo)準(zhǔn)確。背景差分算法也存在缺點,隨時間的流逝,
98、已建好的背景圖像易被運動物體滯留、樹葉的遮擋、場景的光線等因素破壞[16]。這時候就需要用背景建模和背景更新算法來彌補(bǔ)。論文中假設(shè)背景處于理想情況。二維數(shù)字圖像的平面坐標(biāo)表示為(x, y),基于背景減法的二值化數(shù)學(xué)表達(dá)式如下:</p><p> Di(x,y)=|Ii(x,y)-Bi(x,y)| (2-6)</p><p><b> 1
99、,Di>T</b></p><p> Mi(x,y)= (2-7)</p><p><b> 0,Di≤T</b></p><p> 圖像序列中當(dāng)前幀的灰度圖像為Ii(x,y),Bi (x, y)為當(dāng)前幀背景的灰度圖像,Mi(x,y)表示相減后的二值化結(jié)果,T表
100、示對應(yīng)的相減后灰度圖像的閾值。 </p><p> 背景差分算法可有效地檢測運動目標(biāo)。由于背景建模算法的引入,使得背景對噪聲有一定的抑制作用。同時,與幀間差分法的檢測結(jié)果相比,背景差分算法檢測出的運動物體輪廓更清楚。故背景更新與背景建模比較理想時,背景差分算法的檢測效果比幀間差分略好。</p><p> 第四章 運動物體檢測的實現(xiàn)</p><p> 目前我們獲
101、取運動目標(biāo)信息是利用對動態(tài)圖像進(jìn)行分析處理,進(jìn)而檢測出運動目標(biāo)。動態(tài)圖像又稱圖像序列,組成部分是一序列的圖像。圖像序列采集圖像通過傳感器如攝像機(jī)、數(shù)碼相機(jī)等,且圖像隨時間變化。在不同時刻,對幀圖像或多幀圖像進(jìn)行采集,相機(jī)與景物之間的相對運動信息及景物本身發(fā)生變化的運動信息都被包含在內(nèi)。像點、線、區(qū)域等標(biāo)記的位置或圖像幀的灰度變化和運動方向速度等屬性的改變都由上述信息表現(xiàn)出來。從圖像中將變化區(qū)域提取出來是運動目標(biāo)檢測的目的。利用攝像機(jī)獲取
102、運動目標(biāo)的視頻圖像,視頻信號由視頻采集卡傳輸?shù)接嬎銠C(jī),在計算機(jī)上完成相關(guān)處理,按特定時間間隔從視頻圖像中得到序列圖像,檢測出運動目標(biāo)前要對這些序列圖像進(jìn)行特定的處理。</p><p><b> 4.1硬件實現(xiàn)</b></p><p> 在工業(yè)圖像處理應(yīng)用系統(tǒng)的最初始端便是圖像獲取,它主要是由攝像機(jī)、圖像采集卡和光源組成。先通過CCD 攝像機(jī)得到圖像,圖像輸入計算機(jī)
103、前圖像采集卡完成視頻模擬信號到數(shù)字圖像的轉(zhuǎn)換,以便后面的處理。隨著快速發(fā)展的數(shù)字技術(shù),數(shù)碼攝像機(jī)具備較高性能,可完成圖像的采集。圖像獲取流程圖如下:</p><p> 圖4-1 圖像獲取原理圖</p><p> 4.1.1 CCD 攝像機(jī)的簡介</p><p> 監(jiān)控系統(tǒng)中,攝像機(jī)又名CCD是Charge Coupled Device的縮寫,也就是電荷耦合器件
104、。實際上,攝像機(jī)包括攝像頭和鏡頭兩部分,鏡頭與攝像頭一般是分開購買的,鏡頭的焦距是用戶根據(jù)攝像頭與物體的距離及目標(biāo)的大小計算的結(jié)果,故每個鏡頭根據(jù)用戶的實際使用情況不同而有所差異[17]。CCD是攝像頭的關(guān)鍵傳感部件,它主要具有以下特點:壽命長、抗震動、靈敏度高、畸變小、體積小、無殘影、抗磁場。它能完成光線到電荷的轉(zhuǎn)變,并對其轉(zhuǎn)移和儲存,取出儲存電荷后還會導(dǎo)致電壓發(fā)生改變。故而是理想的新型器件攝像元件,可取代攝像管傳感器。</p&
105、gt;<p> 4.1.2 CCD 攝像機(jī)的工作原理</p><p> CCD通過光學(xué)成像系統(tǒng)將被攝物體成像在CCD 上,圖像照在像敏單元上發(fā)生光電效應(yīng),按亮度強(qiáng)弱把物體的反射光線轉(zhuǎn)變成相應(yīng)數(shù)目的載流子,一個時鐘周期內(nèi),在轉(zhuǎn)移脈沖的作用下CCD的移位寄存器中收到門極上轉(zhuǎn)移的電子量,經(jīng)圖像采集卡中放大電路放大信號,要想獲得數(shù)字信號需將模擬信號經(jīng)A/D轉(zhuǎn)換[18]。計算機(jī)或者其他處理器保存數(shù)字信號以
106、完成圖像處理,同時獲得有關(guān)信息和數(shù)據(jù)。</p><p> 4.1.3 CCD攝像機(jī)的分類</p><p> ?。?)依成像色彩劃分 </p><p> 彩色攝像機(jī):景物細(xì)部辨別較為適合,像衣著或景物顏色的辨別。 黑白攝像機(jī):在光線不充足地區(qū)且檢測景物的移動或方位時,黑白攝像機(jī)可選用。 </p><p> ?。?)依分辨率靈敏度等
107、劃分</p><p> 像素低于38萬為一般型,較為普遍的產(chǎn)品有25萬像素(512*492)、分辨率為400線。 影像像素高于38萬的為高分辨率型。</p><p> ?。?)按CCD靶面大小劃分 </p><p> CCD芯片已經(jīng)開發(fā)出多種尺寸: 目前采用的芯片大多數(shù)為1/3"和1/4"。在購買攝像頭時,特別是對攝像角度有比較嚴(yán)格要
108、求的時候,CCD靶面的大小,CCD與鏡頭的配合情況將直接影響視場角的大小和圖像的清晰度。</p><p> ?。?)按同步方式劃分 </p><p> 內(nèi)同步:同步信號由攝像機(jī)內(nèi)同步信號發(fā)生電路產(chǎn)生。 外同步:借助外同步信號發(fā)生器,使攝像機(jī)的外同步輸入端獲得同步信號。</p><p> 功率同步(又稱線性鎖定):屬垂直推動同步,由攝像機(jī)AC電源完成。&l
109、t;/p><p> 外VD同步:在攝像機(jī)信號電纜上輸入VD同步脈沖的完成外VD同步。 多攝像機(jī)外同步:多臺攝像機(jī)外同步固定時,可保證每臺攝像機(jī)作業(yè)條件相同,即使某一臺攝像機(jī)切換景物,攝像機(jī)的畫面也能保持不失真。</p><p> 4.1.4數(shù)據(jù)采集卡</p><p> 圖像采集卡(Image Capture Card),又稱圖像捕捉卡,是一種硬件設(shè)備,可對
110、數(shù)字化視頻圖像信息進(jìn)行獲取,還可實現(xiàn)播放和保存。大部分圖像采集卡不僅能獲取視頻信息,還能得到伴音,實現(xiàn)在數(shù)字化時同步保存和播放視頻和音頻。它是圖像處理必需的設(shè)施,把圖像信號采集到電腦,保存為數(shù)據(jù)文件的形式。利用相應(yīng)軟件,編輯處理數(shù)字化的視頻信號,如添加濾鐿、字幕和音效、剪切畫面、設(shè)置轉(zhuǎn)場效果和各種視頻特效的加入等,編輯后視頻信號被轉(zhuǎn)成標(biāo)準(zhǔn)格式,以便傳播。</p><p> 大部分圖像采集卡都能實現(xiàn)壓縮,采集視頻
111、信號前先壓縮視頻信號,再把壓縮的視頻數(shù)據(jù)經(jīng)PCI接口傳到主機(jī)。PC視頻采集卡一般采用幀內(nèi)壓縮,數(shù)字化的視頻會被存儲成AVI文件,高級的視頻采集卡能直接實時實現(xiàn)數(shù)字視頻數(shù)據(jù)壓縮成MPEG-1格式。視頻采集卡對模擬視頻序列中的每幀圖像進(jìn)行采集,并實時的完成數(shù)據(jù)存儲。故每一幀所需的處理時間是實現(xiàn)實時采集的關(guān)鍵。當(dāng)每幀的處理時間大于相鄰兩幀的相隔時間,會丟失數(shù)據(jù),也就是幀被丟失。采集卡都是把獲取的視頻序列先進(jìn)行壓縮處理,然后再存入硬盤,也就是說
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 運動服飾行業(yè)分析畢業(yè)論文
- 圖像融合畢業(yè)論文
- 圖像重建畢業(yè)論文
- 圖像增強(qiáng)畢業(yè)論文
- 圖像處理畢業(yè)論文
- 遙感圖像空間增強(qiáng)方法分析【畢業(yè)論文】
- 遙感圖像輻射增強(qiáng)方法分析【畢業(yè)論文】
- 數(shù)字圖像處理與分析畢業(yè)論文
- 畢業(yè)論文---視頻圖像中運動物體的檢測
- 監(jiān)控圖像處理畢業(yè)論文
- 圖像增強(qiáng)算法畢業(yè)論文
- 畢業(yè)論文圖像檢索.doc
- 圖像配準(zhǔn)畢業(yè)論文
- 基于matlab的圖像處理與分析【畢業(yè)論文】
- 排球運動畢業(yè)論文
- 排球運動畢業(yè)論文
- 畢業(yè)論文-圖像邊緣檢測算法的分析實現(xiàn)
- 醫(yī)學(xué)數(shù)字圖像畢業(yè)論文
- 圖像縮放合成處理畢業(yè)論文
- 圖像邊緣檢測技術(shù)畢業(yè)論文
評論
0/150
提交評論