傳感器數(shù)字表頭圖像的數(shù)據(jù)讀取與利用畢業(yè)論文_第1頁
已閱讀1頁,還剩42頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、<p><b>  學位論文原創(chuàng)性聲明</b></p><p>  本人鄭重聲明:所呈交的論文是本人在導師的指導下獨立進行研究所取得的研究成果。除了文中特別加以標注引用的內(nèi)容外,本論文不包括任何其他個人或集體已經(jīng)發(fā)表或撰寫的成果作品。本人完全意識到本聲明的法律后果由本人承擔。</p><p>  作者簽名: </p>

2、<p><b>  年 月 日</b></p><p>  學位論文版權使用授權書</p><p>  本學位論文作者完全了解學校有關保障、使用學位論文的規(guī)定,同意學校保留并向有關學位論文管理部門或機構送交論文的復印件和電子版,允許論文被查閱和借閱。本人授權省級優(yōu)秀學士論文評選機構將本學位論文的全部或部分內(nèi)容編入有關數(shù)據(jù)進行檢索,可以采用影印、縮印或

3、掃描等復制手段保存和匯編本學位論文。</p><p>  本學位論文屬于1、保密囗,在 年解密后適用本授權書</p><p><b>  2、不保密囗 。</b></p><p>  作者簽名: </p><p>  年 月 日</p><p>  導師簽名: &

4、lt;/p><p>  年 月 日</p><p><b>  摘 要 </b></p><p>  隨著計算機軟硬件技術的高速發(fā)展,計算機數(shù)字圖像處理技術在各個領域得到了廣泛的應用,如計算機圖像識別、圖像檢索、圖像工業(yè)化應用等。尤其是計算機識別技術,通過數(shù)字圖像處理中的模式識別技術,可以將人眼無法識別的圖像進行分類處理,可以快速準確的

5、檢索、匹配和識別出各種東西。而本文研究基于數(shù)字顯示表頭圖像的數(shù)字讀取方法,以利于無線傳感網(wǎng)絡中的傳輸與終端分析。本此設計的主要研究內(nèi)容是選取車牌、電表等實用標識、計量標牌或表頭的數(shù)字照片,利用數(shù)字圖像處理技術快速得到準確度高的數(shù)字信息,用于無線傳感網(wǎng)絡的傳輸和終端處理。</p><p>  本次設計的過程分為5個步驟:圖像采集、圖像預處理、圖像分割、輪廓跟蹤、圖像辨別。采集圖像的設備選取了自己的手機攝像頭,通過直

6、接拍照進行圖像采集。而后面的進行圖像處理的過程都是以VC++作為平臺完成的。通過圖像平滑、圖像增強等進行圖像預處理,再用二值化處理進行圖像分割,最后利用輪廓跟蹤的相關算法實現(xiàn)對數(shù)字圖像的特征進行圖像辨別來確定數(shù)字信號,通過MFC模塊反映出來。在經(jīng)過不斷調試和改善之后,設計能成功地將采集到的車牌號和液晶顯示屏讀取出來,實現(xiàn)了數(shù)字圖像的數(shù)據(jù)讀取與利用的相關功能。</p><p>  關鍵詞:數(shù)字圖像處理;圖像辨別;二

7、值化處理;輪廓跟蹤</p><p><b>  Abstract</b></p><p>  With the rapid development of computer hardware and software technology, computer digital image processing technology in various fields ha

8、s been widely used, such as image recognition, image retrieval, and other industrial applications. Especially computer recognition technology, through digital image processing pattern recognition technology, the human ey

9、e can not recognize the image classification, can quickly and accurately search, match and identify a variety of things. In this paper, based </p><p>  The design process is divided into five steps: image ac

10、quisition, image pre-processing, image segmentation, contour tracking, image identification. Image acquisition devices selected his cell phone camera, image acquisition through direct camera. The image processing procedu

11、re are behind VC + + as a platform to complete. Performed by the image smoothing, and other image pre-processing image enhancement, and then binarizing the image segmentation, contour tracking algorithms Finally, the rea

12、lizat</p><p>  Key Words:digital image processing;graphic distinguish;binarizing;contour tracking</p><p><b>  目 錄</b></p><p><b>  第1章 緒論1</b></p>&l

13、t;p>  1.1 課題研究的背景及意義1</p><p>  1.2 國內(nèi)外研究現(xiàn)狀分析1</p><p>  1.3 研究內(nèi)容與具體安排2</p><p>  第2章 數(shù)字圖像處理及開發(fā)工具VC++的介紹4</p><p>  2.1 數(shù)字圖像處理4</p><p>  2.1.1 數(shù)字圖像處理的簡

14、介4</p><p>  2.1.2 圖像格式介紹4</p><p>  2.1.3 數(shù)字圖像處理中的基本圖像類型5</p><p>  2.2 基于計算機視覺處理圖像的簡單介紹6</p><p>  2.2.1視覺技術的研究6</p><p>  2.2.2 計算機視覺研究的對象與方法6</p>

15、;<p>  2.2.3 計算機視覺的應用領域7</p><p>  2.3數(shù)字圖像處理方法介紹9</p><p>  2.3.1 圖像預處理9</p><p>  2.3.2 圖像分割介紹11</p><p>  2.3.3 模板匹配12</p><p>  2.3.4 輪廓跟蹤13<

16、/p><p>  2.3.5 輪廓跟蹤與模板匹配比較14</p><p>  2.4VC++與MFC功能模塊的介紹14</p><p>  2.4.1VC++平臺簡介14</p><p>  2.4.2 MFC模塊的功能介紹15</p><p>  第3章 數(shù)字圖像處理的實現(xiàn)過程及算法17</p>

17、<p>  3.1 圖像采集17</p><p>  3.2 圖像預處理方法——圖像平滑17</p><p>  3.3 圖像分割——二值化處理18</p><p>  3.4 輪廓跟蹤算法實現(xiàn)19</p><p>  3.5 基于輪廓跟蹤的圖像辨別算法20</p><p>  第4章 實驗結果及結

18、論22</p><p>  4.1 實驗結果22</p><p>  4.2 遇到的問題和解決方案23</p><p><b>  4.3 結論23</b></p><p><b>  第5章 總結25</b></p><p><b>  參考文獻27&

19、lt;/b></p><p><b>  附錄27</b></p><p>  附1 圖像預處理的算法程序28</p><p>  附2 圖像分割的算法程序30</p><p>  附3 輪廓跟蹤的算法程序33</p><p>  附4 圖像辨別的算法程序36</p>

20、<p><b>  致謝38</b></p><p><b>  第1章 緒論</b></p><p>  1.1 課題研究的背景及意義</p><p>  論文研究的是獲得傳感器數(shù)字表頭圖像的數(shù)據(jù)讀取高效方法,提供無線傳感網(wǎng)等應用所需要的準確、集約的圖像隱含的數(shù)字信息。</p><p&g

21、t;  傳感器數(shù)字表頭圖像的數(shù)據(jù)讀取與利用這個課題所運用的主要知識就是數(shù)字圖像處理這門學科。而數(shù)字圖像處理是指利用計算機對圖像進行各種處理的一門技術。20世紀20年代,圖象處理首次得到應用,60年代末,圖象處理技術不斷完善,逐漸成為一個新興的學科。利用數(shù)字圖象處理主要是為了修改圖形,改善圖象質量,或是從圖像中提起有效信息,還有利用數(shù)字圖象處理可以對圖像進行體積壓縮,便于傳輸和保存。</p><p>  數(shù)字圖像處

22、理在各個領域都有著非常重要的應用,隨著數(shù)字時代的到來,視頻領域的數(shù)字化也必將到來,視頻圖像的處理技術也將會發(fā)生日新月異的變化。在多媒體技術的各個領域中,視頻處理技術占有非常重要的地位,被廣泛的應用于智能交通、汽車電子、網(wǎng)絡多媒體通信、實時監(jiān)視系統(tǒng)、高清晰度數(shù)字電視等諸多方面。因此,現(xiàn)今對該技術領域的應用研究已日趨活躍和繁榮。而這其中的圖像辨別更是有著重要的應用。研究此課題,不僅可以明白 VC++在圖像處理中的應用,而且還可以明確圖像辨別

23、的重要應用意義。</p><p>  1.2 國內(nèi)外研究現(xiàn)狀分析</p><p>  數(shù)字圖像處理作為一門新興學科,它的發(fā)展非常迅速。數(shù)字圖像處理作為一門學科大約形成于20世紀60年代初期。早期的圖像處理的目的是改善圖像的質量,它以人為對象,以改善人的視覺效果為目的。圖像處理中,輸入的是質量低的圖像,輸出的是改善質量后的圖像,常用的圖像處理方法有圖像增強、復原、編碼、壓縮等。首次獲得實際成

24、功應用的是美國噴氣推進實驗室(JPL)。他們對航天探測器徘徊者7號在1964年發(fā)回的幾千張月球照片使用了圖像處理技術,由計算機成功地繪制出月球表面地圖,獲得了巨大的成功。隨后又對探測飛船發(fā)回的近十萬張照片進行更為復雜的圖像處理,以致獲得了月球的地形圖、彩色圖及全景鑲嵌圖,獲得了非凡的成果,為人類登月創(chuàng)舉奠定了堅實的基礎,也推動了數(shù)字圖像處理這門學科的誕生。在以后的宇航空間技術,如對火星、土星等星球的探測研究中,數(shù)字圖像處理技術都發(fā)揮了巨

25、大的作用。數(shù)字圖像處理取得的另一個巨大成就是在醫(yī)學上獲得的成果。1972年英國EMI公司工程師Housfield發(fā)明了用于頭顱診斷的X射線計算機斷層攝影裝置,也就是我們通常所說的CT(Computer Tomograph)。CT的基本方法是根據(jù)人的頭部截</p><p>  本次畢業(yè)設計,我主要的研究方向是對車牌號的識別。國外的研究人員對于車牌識別的研究工作開展較早,研究方向主要是分析車牌圖像,提取車牌信息,確定

26、車牌號。現(xiàn)如今,國外在車牌檢測、識別方面的研究已取得一些令人矚目的成績,開發(fā)出了很多技術成熟的車牌識別產(chǎn)品。例如英國IPI公司研究開發(fā)的RTVNPR系統(tǒng),它是一款便攜式的設備,可以應用在道路收費站、交通檢測口等場所;新加坡Optasia公司自行研發(fā)的車牌識別系統(tǒng)IMPS,可以在各種天氣條件和光照環(huán)境下準確定位識別,給出和車牌一致的處理結果。另外,日本、加拿大、德國、意大利等各發(fā)達國家都有適合于本國車牌的識別系統(tǒng)。</p>

27、<p>  我國對車牌識別技術的研究工作開始于20世紀90年代,當前比較成熟的產(chǎn)品有:北京漢王公司采用DSP芯片作為識別算法的運行硬件平臺的“漢王眼”;深圳吉通電子有限公司的“車牌通";上海高德威智能交通系統(tǒng)有限公司的汽車牌照識別器;川大智勝軟件股份有限公司的zTZ000車牌自動識別系統(tǒng)等等。這些產(chǎn)品都達到了較好的識別效果。除此之外,上海交通大學計算機科學和工程系、西安交通大學的圖像處理和識別研究室、浙江大學的自動化

28、系、清華大學人工智能國家重點實驗室等也都在進行類似的研究[2]。</p><p>  而對車牌識別的研究,應用最為廣泛的技術是傳統(tǒng)的模式識別技術。20世紀90年代初期A.S.johnson等學者使用了數(shù)字圖像處理技術、計算機圖形視覺技術并結合模式識別基本理論,研發(fā)出了可以應用到實際領域的車輛牌照識別系統(tǒng)。此系統(tǒng)大致分成①圖像分割;②特征提?。虎崮0鍢嬙?;④字符識別等四個部分。由于相異閾值所對應的直方圖結果是不同的

29、,車牌區(qū)域圖像直方圖的閾值區(qū)間可以經(jīng)過大量的統(tǒng)計學實驗來確定,進而依據(jù)特定閾值所代表的直方圖將車牌圖像進行分割,最后通過預先編輯好的漢字、數(shù)字模板逐一進行模式匹配,從而識別出車牌字符。20世紀末,R.A.Lotfo等學者采用了視覺分析的字符識別算法分析輸入到自動識別的的車牌圖像,其主要步驟如下:①車牌圖像進行二值化并將車牌區(qū)域定位;②根據(jù)邊界跟蹤算法及相關技術手段獲得車牌字符的特征;③使用統(tǒng)計最相鄰分類器與字符模板庫中的字符進行比較,推

30、斷出幾個準車牌號碼結果并檢查這些準車牌號碼,最終得出一個實際存在正確的車牌號碼??偠灾?,20世紀末期車牌自動識別系統(tǒng)的字符識別正確率有所提高,但另一方面,由于算法和技術尚未完善的原因車牌自動識別系統(tǒng)的實時性較差,車牌字符識別的速</p><p>  1.3 研究內(nèi)容與具體安排</p><p>  數(shù)字圖像的提取與利用就是要將所需圖像采集并通過計算機應用相應的算法把圖像反映在電腦上。<

31、;/p><p>  本次設計我利用C語言在MFC模塊中編寫相應程序,最終生成一個可執(zhí)行文件,根據(jù)攝像頭采取不同圖像,如:車牌號、液晶顯示屏,然后將不同的數(shù)字圖形在 PC 機上進行辨別,實現(xiàn)圖形的分辨,最后將生成圖形保存。</p><p>  數(shù)字圖像信息的提取及利用實現(xiàn)的算法:圖像采集,圖像預處理,圖像分割,輪廓跟蹤,圖像辨別五個部分。而在設計過程中所研究的核心就是圖像辨別算法的實現(xiàn)。模式識別

32、是現(xiàn)今使用非常廣泛的圖像辨別方法,基于模式識別的相關算法也很多,而且每種算法都有各自特點,要根據(jù)不同的實際圖形的特點選擇恰當?shù)乃惴?。本設計所采用的是基于圖形邊緣特征的角度判別得算法,此種算法是通過對圖形輪廓進行跟蹤、提取邊緣的特征,判斷圖形角度的大小,來分辨不同圖像[4]。</p><p><b>  具體結構安排如下:</b></p><p>  第一章:緒論,介紹

33、了課題研究目的及意義和國內(nèi)外研究現(xiàn)狀。</p><p>  第二章:數(shù)字圖像處理和開發(fā)工具VC++的介紹,不僅介紹了數(shù)字圖像處理的基本知識以及處理方法,也對基于計算機視覺圖像處理進行了簡單分析,最后介紹了VC++與MFC功能模塊。</p><p>  第三章:數(shù)字圖像處理的實現(xiàn)過程及算法,詳細地介紹了整個設計的原理和思路,并闡述了相關的算法及程序。</p><p>

34、  第四章:實驗結果及結論,采集了清晰、蒙塵的車牌號以及液晶顯示器進行實驗成功實現(xiàn)了設計的功能,得出了實驗的結論,并敘述了設計過程中遇到的問題及解決方案。</p><p>  第五章:總結??偨Y了整個設計的思路、過程及實現(xiàn)的功能以及通過本次設計的收獲和不足。</p><p>  第2章 數(shù)字圖像處理及開發(fā)工具VC++的介紹</p><p>  2.1 數(shù)字圖像處理&

35、lt;/p><p>  2.1.1 數(shù)字圖像處理的簡介</p><p>  數(shù)字圖像處理就是利用計算機對圖像信息進行加工,以滿足人的視覺心理或者應用需求的行為。實質上它是一段能夠被計算機還原顯示和輸出為一幅圖像的數(shù)字碼。當今是一個充滿信息的時代,圖像作為人類感知世界的視覺基礎,是人類獲取信息、表達信息和傳遞信息的重要手段[5]。</p><p>  圖像處理技術的主要內(nèi)

36、容包括圖像壓縮,增強和復原,匹配、描述和識別3 個部分。常見的處理有圖像數(shù)字化、圖像編碼、圖像增強、圖像復原、圖像分割和圖像分析等。圖像處理一般指數(shù)字圖像處理,雖然某些處理也可以用光學方法或模擬技術實現(xiàn),但它們遠不及數(shù)字圖像處理那樣靈活和方便,因而數(shù)字圖像處理成為圖像處理的主要方面。以圖片分析和理解為目的的分割、描述和識別將用于各種自動化的系統(tǒng),如字符和圖形識別、用機器人進行產(chǎn)品的裝配和檢驗、自動軍事目標識別和跟蹤、指紋識別、X 光照片

37、和血樣的自動處理等。在這類應用中,往往需綜合應用模式識別和計算機視覺等技術,圖像處理更多的是作為前置處理而出現(xiàn)的[6]。</p><p>  隨著計算機的高速發(fā)展,處理器的處理速度的提高和存儲器存儲容量的增大,圖像處理系統(tǒng)的發(fā)展十分迅速,圖像處理技術也得到了空前的發(fā)展和應用。目前,圖像處理技術已經(jīng)廣泛應用于工業(yè)、農(nóng)業(yè)、醫(yī)學、交通、軍事等各個領域。因此,可以說圖像處理技術正逐漸成為其他科學技術領域中不可缺少的一項重

38、要工具,它已經(jīng)成為了信息技術相關領域的核心。</p><p>  圖像處理在各個方面都有著很重要的應用,而圖像識別技術在基于圖像處理的基礎上可以應用于農(nóng)業(yè)上,如用計算機視覺的方法進行果形識別;基于數(shù)學形態(tài)學和神經(jīng)網(wǎng)絡的方法對番茄病害果進行識別;采用機器視覺的方法辨別黃花梨果形識別;當然還可以加 以改進應用于視頻監(jiān)控的物體辨別等等。</p><p>  2.1.2 圖像格式介紹</p&

39、gt;<p>  數(shù)字化圖像數(shù)據(jù)有兩種存儲方式:位圖存儲和矢量存儲。我們平常是以圖像分辨率和顏色數(shù)來描述數(shù)字圖象的。</p><p><b>  1.位圖方式</b></p><p>  位圖方式是將圖像的每一個象素點轉換為一個數(shù)據(jù),比如:8個象素點的數(shù)據(jù)就占據(jù)一個字節(jié)(一個字節(jié)就是8個二進制數(shù),1個二進制數(shù)存放象素點)。位圖方式能夠制作出色彩和色調變化

40、豐富的圖像,可以逼真地表現(xiàn)自然界的景象,同時也可以很容易地在不同軟件之間交換文件,這就是位圖圖像的優(yōu)點;而其缺點則是它無法制作真正的3D圖像,并且圖像縮放和旋轉時會產(chǎn)生失真的現(xiàn)象,同時文件較大,對內(nèi)存和硬盤空間容量的需求也較高。</p><p><b>  2.矢量圖像</b></p><p>  矢量圖像存儲的是圖像信息的輪廓部分,而不是圖像的每一個象素點。該存儲方

41、式的缺點是經(jīng)常耗費大量的時間做一些復雜的分析演算工作,圖像的顯示速度較慢;但圖像縮放不會失真;圖像的存儲空間也要小得多。所以,矢量圖比較適合存儲各種圖表和工程設計圖[7]。</p><p>  2.1.3 數(shù)字圖像處理中的基本圖像類型</p><p>  在計算機中,按照顏色和灰度的多少可以將圖像分為:二值圖像、灰度圖像、索引圖像和真彩色 RGB 圖像四種基本類型。目前,大多數(shù)圖像處理軟件

42、都支持這四種類型的圖像。</p><p><b>  1.二值圖像</b></p><p>  一幅二值圖像的二維矩陣僅由 0、1 兩個值構成,“0”代表黑色,“1”代白色。由于每一像素(矩陣中每一元素)取值僅有 0、1 兩種可能,所以計算機中二值圖像的數(shù)據(jù)類型通常為 1 個二進制位。二值圖像通常用于文字、線條圖的掃描識別(OCR)和掩膜圖像的存儲。</p>

43、;<p><b>  2.灰度圖像</b></p><p>  灰度圖像矩陣元素的取值范圍通常為[0,255]。因此其數(shù)據(jù)類型一般為 8 位無符號整數(shù)的,這就是人們經(jīng)常提到的 256 灰度圖像?!?”表示純黑色,“255”表示純白色,中間的數(shù)字從小到大表示由黑到白的過渡色。二值圖像可以看成是灰度圖像的一個特例。</p><p><b>  3.

44、索引圖像</b></p><p>  索引圖像的文件結構比較復雜,除了存放圖像的二維矩陣外,還包括一個稱之為顏色索引矩陣MAP的二維數(shù)組。MAP的大小由存放圖像的矩陣元素值域決定,它的每一行的三個元素分別指定該行對應顏色的紅、綠、藍單色值。索引圖像一般用于存放色彩要求比較簡單的圖像。</p><p>  4.真彩色 RGB 圖像</p><p>  RG

45、B 圖像分別用紅(R)、綠(G)、藍(B)三原色的組合來表示每個像素的顏色。RGB 圖像每一個像素的顏色值(由RGB三原色表示)直接存放在圖像矩陣中。RGB圖像的數(shù)據(jù)類型一般為8位無符號整形,通常用于表示和存放真彩色圖像,當然也可以存放灰度圖像[8]。</p><p>  2.2 基于計算機視覺處理圖像的簡單介紹</p><p>  近年來,圖像技術受到人們廣泛的關注。在人類接收的信息中有

46、80 %來自視覺即圖像(Image)信息,這是人類最有效和最重要的信息獲取、交流方式。隨著計算機的普及,人們越來越多地利用計算機幫助人類獲取與處理視覺(圖像) 信息。圖像技術就是對視覺圖像獲取與加工處理技術的總稱。根據(jù)抽象程度和處理方法的不同,圖像技術可分為三個層次:圖像處理、圖像分析和圖像理解。這三個層次的有機結合也稱為圖像工程[9]。圖像處理是較低層的操作,主要在圖像象素級上進行處理。比較狹義的圖像處理主要包括對圖像分割以改善視覺效

47、果,或對圖像壓縮編碼以減少傳輸時間或存儲容量。圖像分析則是進入中層的操作,分割和特征提取是把原來以象素描述的圖像轉變成簡潔的非圖形形式的符號描述。即圖像分析是一個圖像進而數(shù)據(jù)出的處理,數(shù)據(jù)可以是對某一特征測量所得的結果,或是基于測量的符號表示。圖像理解也經(jīng)常被稱為計算機視覺,主要是高層操作。圖像理解進一步研究圖像中的目標和它們之間的聯(lián)系,其處理過程和方法與人類的思維推理有不少類似之處[10]。</p><p> 

48、 2.2.1視覺技術的研究</p><p>  人類很多研究都是以延伸人類能力為目的的,早期的工作是在體力上延伸,計算機發(fā)明以來,就拓展到對人類腦力和感知能力的延伸上。對人類視覺感知能力的計算機模擬導致了計算機視覺的產(chǎn)生。計算機視覺也經(jīng)常被稱為圖像理解,是指研究完成一項任務所需的視覺信息及如何從圖像中獲取這些信息的研究領域。其基本目的有三個:</p><p>  (1) 根據(jù)一幅或多幅二維

49、投影圖像計算出觀察點到目標物體的距離;</p><p>  (2) 根據(jù)一幅或多幅二維投影圖像計算出觀察點到目標物體的運動參數(shù);</p><p>  (3) 根據(jù)一幅或多幅二維投影圖像計算出觀察點到目標物體的表面物理特性。</p><p>  要達到的最終目的是實現(xiàn)對于三維景物世界的理解,即實現(xiàn)人的視覺系統(tǒng)的某些功能。也就是利用二維投影圖像來重構三維物體的可視部分。

50、</p><p>  2.2.2 計算機視覺研究的對象與方法</p><p>  1.以模型世界為主要對象的視覺基本方法研究</p><p>  這個階段以Roberts的開創(chuàng)性工作為標志。在Roberts的工作中引入了三維物體與二維成像的關系,采用了一些簡單的邊緣特征提取方法并引入了組合線段的方法。這些早期的工作對視覺的發(fā)展起了促進作用,但對于稍微復雜的景物便難于

51、奏效。因為他對三維關系的分析僅僅是靠簡單的邊緣線段的約束關系,并沒有充分考慮人類或其他動物視覺系統(tǒng)感知三維空間關系的方式[11]。</p><p>  2.以計算理論為核心的視覺模型研究</p><p>  20世紀70年代開始,對計算機視覺的研究進入更為理性化的階段,主要集中于各種本征特性的恢復,包括三維形狀、運動、光源等的恢復。主要出發(fā)點是從生理學、光學和射影幾何的方法出發(fā),研究成像及

52、其逆問題。在這一階段中,以Marr為代表的一些研究者提出了以表示為核心、以算法為中間轉換過程的一般性視覺處理模型。在其理論中強調表示的重要性以及從不同層次上去研究信息處理問題,在計算理論和算法實現(xiàn)上又特別強調計算理論的重要性。在三維信息的感知方面,根據(jù)人類感知深度的不同提出了一系列Shape from X 的方法。這一階段有代表性的工作包括:</p><p>  (1) 對視覺知覺現(xiàn)象中側抑制現(xiàn)象的模擬。主要是通

53、過采用不同尺度的LOG算子實現(xiàn)對不同尺度邊緣信息的感知;</p><p>  (2) 對雙眼深度線索的分析導致對立體視覺的研究;</p><p>  (3) 對單眼深度線索的分析導致了Shape from X技術的出現(xiàn)(這里X 包括陰影、紋理、遮擋、聚焦、線條透視等) ;</p><p>  (4) 對運動物體成像過程的研究導致光流計算以及從運動恢復結構等技術的出現(xiàn)

54、。</p><p>  3.以應用為目標的計算機視覺方法</p><p>  進入20世紀90年代之后,隨著關于人工智能研究的反思,在計算機視覺的研究方面也開始考慮過去的方法是否正確,同時研究的方向開始從單純的理論框架研究轉入結合軀干運動、結合應用的研究。在以往的研究中,生物視覺的一些重要特點沒有得到足夠的重視,如主動性、視覺系統(tǒng)中的高分辨率中央凹陷與外圍視覺的結合等。因此在80 年代末、

55、90 年代初先后提出了主動視覺、定性視覺等新方法、新思路。利用主動視覺方法使得一些本來復雜的計算得到簡化,一些病態(tài)問題可以轉化為良性態(tài)問題,從而得到圓滿解決[12]。</p><p>  2.2.3 計算機視覺的應用領域</p><p>  計算機視覺的應用領域主要包括對照片、視頻資料如航空照片、衛(wèi)星照片、視頻片段等的解釋、精確制導、移動機器人視覺導航、醫(yī)學輔助診斷、工業(yè)機器人的手眼系統(tǒng)、

56、地圖繪制、物體三維形狀分析與識別及智能人機接口等。早期進行數(shù)字圖像處理的目的之一就是要通過采用數(shù)字技術提高照片的質量,輔助進行航空照片和衛(wèi)星照片的讀取判別與分類。由于需要判讀的照片數(shù)量很多,于是希望有自動的視覺系統(tǒng)進行判讀解釋,在這樣的背景下,產(chǎn)生了許多航空照片和衛(wèi)星照片判讀系統(tǒng)與方法。自動判讀的進一步應用就是直接確定目標的性質,進行實時的自動分類,并與制導系統(tǒng)相結合。目前常用的制導方式包括激光制導、電視制導和圖像制導,在導彈系統(tǒng)中常常

57、將慣性制導與圖像制導結合,利用圖像進行精確的末制導[13]。</p><p>  工業(yè)機器人的手眼系統(tǒng)是計算機視覺應用最為成功的領域之一,由于工業(yè)現(xiàn)場的諸多因素,如光照條件、成像方向均是可控的,因此使得問題大為簡化,有利于構成實際的系統(tǒng)。與工業(yè)機器人不同,對于移動機器人而言,由于它具有行為能力,于是就必須解決行為規(guī)劃問題,即是對環(huán)境的了解。隨著移動式機器人的發(fā)展,越來越多地要求提供視覺能力,包括道路跟蹤、回避障礙

58、、特定目標識別等。目前移動機器人視覺系統(tǒng)研究仍處于實驗階段,大多采用遙控和遠視方法。</p><p>  在醫(yī)學上采用的圖像處理技術大致包括壓縮、存儲、傳輸和自動/ 輔助分類判讀,此外還可用于醫(yī)生的輔助訓練手段。與計算機視覺相關的工作包括分類、判讀和快速三維結構的重建等方面。長期以來,地圖繪制是一件耗費人力、物力和時間的工作。以往的做法是人工測量,現(xiàn)在更多的是利用航測加上立體視覺中恢復三維形狀的方法繪制地圖,大大

59、提高了地圖繪制的效率。同時,通用物體三維形狀分析與識別一直是計算機視覺的重要研究目標,并在景物的特征提取、表示、知識的存儲、檢索以及匹配識別等方面都取得了一定的進展,構成了一些用于三維景物分析的系統(tǒng)。</p><p>  近年來,基于生物特征的鑒別技術得到了廣泛重視,主要集中在對人臉、虹膜、指紋、聲音等特征上,這其中大多都與視覺信息有關。與生物特征識別密切相關的另一個重要應用是用于構成智能人機接口。現(xiàn)在計算機與人

60、的交流還是機械式的,計算機無法識別用戶的真實身份,除鍵盤、鼠標外,其他輸入手段還不成熟。利用計算機視覺技術可以使計算機檢測到用戶是否存在、鑒別用戶身份、識別用戶的體勢。此外,這種人機交互方式還可推廣到一切需要人機交互的場合,如入口安全控制、過境人員的驗放等。在計算機視覺的研究過程中,應考慮將功能模擬與認知模擬相結合。人類延伸其他能力的過程中,功能模擬起到了主要作用,但視覺是涉及心理和生理兩方面的過程,因此必須在功能模擬的同時重視認知模擬

61、。計算理論的進步與感知手段的改進有助于計算機視覺的研究。在計算機視覺中計算理論占有十分重要的地位,計算理論的進步,新的計算模型的提出可以解決以往一些困難的問題;另一方面,感知手段的進步也可以起到同樣的作用。采用主動視覺可從另一個側面去處理面對的視覺問題。要實現(xiàn)完整的視覺系統(tǒng),視覺知識的獲取、管理和利用是必不可少的。一個相對完備的視覺系統(tǒng)同時也是一個知識管理系統(tǒng),在</p><p>  2.3數(shù)字圖像處理方法介紹&

62、lt;/p><p>  2.3.1 圖像預處理</p><p>  在圖像分析中,對輸入圖像進行特征抽取、分割和匹配前所進行的處理。圖像預處理的主要目的是消除圖像中無關的信息,恢復有用的真實信息,增強有關信息的可檢測性和最大限度地簡化數(shù)據(jù),從而改進特征抽取、圖像分割、匹配和識別的可靠性。預處理過程一般有數(shù)字化、幾何變換、歸一化、平滑、復原和增強等步驟。</p><p>

63、  特別是對于車牌號的識別,圖像預處理顯得更加重要。對于一些存在污跡或磨損褪色的車牌號,必須經(jīng)過圖像增強、圖像復原等預處理手段才能進行準確的識別。</p><p><b>  1. 數(shù)字化</b></p><p>  一幅原始照片的灰度值是空間變量(位置的連續(xù)值)的連續(xù)函數(shù)。在M×N點陣上對照片灰度采樣并加以量化(歸為2b個灰度等級之一),可以得到計算機能夠

64、處理的數(shù)字圖像。為了使數(shù)字圖像能重建原來的圖像,對M、N和b值的大小就有一定的要求。在接收裝置的空間和灰度分辨能力范圍內(nèi),M、N和b的數(shù)值越大,重建圖像的質量就越好。當取樣周期等于或小于原始圖像中最小細節(jié)周期的一半時,重建圖像的頻譜等于原始圖像的頻譜,因此重建圖像與原始圖像可以完全相同。由于M、N和b三者的乘積決定一幅圖像在計算機中的存儲量,因此在存儲量一定的條件下需要根據(jù)圖像的不同性質選擇合適的M、N和b值,以獲取最好的處理效果。&l

65、t;/p><p><b>  2.幾何變換</b></p><p>  用于改正圖像采集系統(tǒng)的系統(tǒng)誤差和儀器位置的隨機誤差所進行的變換。對于衛(wèi)星圖像的系統(tǒng)誤差,如地球自轉、掃描鏡速度和地圖投影等因素所造成的畸變,可以用模型表示,并通過幾何變換來消除。隨機誤差如飛行器姿態(tài)和高度變化引起的誤差,難以用模型表示出來,所以一般是在系統(tǒng)誤差被糾正后,通過把被觀測的圖和已知正確幾何位

66、置的圖相比較,用圖中一定數(shù)量的地面控制點解雙變量多項式函數(shù)組而達到變換的目的。</p><p><b>  3.歸一化</b></p><p>  使圖像的某些特征在給定變換下具有不變性質的一種圖像標準形式。圖像的某些性質,例如物體的面積和周長,本來對于坐標旋轉來說就具有不變的性質。在一般情況下,某些因素或變換對圖像一些性質的影響可通過歸一化處理得到消除或減弱,從而可

67、以被選作測量圖像的依據(jù)。例如對于光照不可控的遙感圖片,灰度直方圖的歸一化對于圖像分析是十分必要的?;叶葰w一化、幾何歸一化和變換歸一化是獲取圖像不變性質的三種歸一化方法。</p><p><b>  4.平滑</b></p><p>  消除圖像中隨機噪聲的技術。對平滑技術的基本要求是在消去噪聲的同時不使圖像輪廓或線條變得模糊不清。常用的平滑方法有中值法、局部求平均法和

68、 k 近鄰平均法。局部區(qū)域大小可以是固定的,也可以是逐點隨灰度值大小變化的。此外,有時應用空間頻率域帶通濾波方法。</p><p><b>  5.復原</b></p><p>  校正各種原因所造成的圖像退化,使重建或估計得到的圖像盡可能逼近于理想無退化的像場。在實際應用中常常發(fā)生圖像退化現(xiàn)象。例如大氣流的擾動,光學系統(tǒng)的像差,相機和物體的相對運動都會使遙感圖像發(fā)生

69、退化?;镜膹驮夹g是把獲取的退化圖像 g(x,y)看成是退化函數(shù) h(x,y)和理想圖像 f(x,y)的卷積。它們的傅里葉變換存在關系</p><p><b>  (2.1)</b></p><p>  根據(jù)退化機理確定退化函數(shù)后,就可從此關系式求出 F(u,v),再用傅里葉反變換求出 f(x,y)。通常把 稱為反向濾波器。實際應用時,由于 H(u,v)隨離開 uv

70、 平面原點的距離增加而迅速下降,為了避免高頻范圍內(nèi)噪聲的強化,當 u2+v2 大于某一界限值 W 時,使 M(u,v)等于 1。W0 的選擇應使 H(u,v)在 u2+v2≤W 范圍內(nèi)不會出現(xiàn)零點。圖像復原的代數(shù)方法是以最小二乘法最佳準則為基礎。尋求一估值弮,使優(yōu)度準則函數(shù)值最小。這種方法比較簡單,可推導出最小二乘法維納濾波器。當不存在噪聲時,維納濾波器成為理想的反向濾波器。</p><p><b> 

71、 6.增強</b></p><p>  對圖像中的信息有選擇地加強和抑制,以改善圖像的視覺效果,或將圖像轉變?yōu)楦m合于機器處理的形式,以便于數(shù)據(jù)抽取或識別。例如一個圖像增強系統(tǒng)可以通過高通濾波器來突出圖像的輪廓線,從而使機器能夠測量輪廓線的形狀和周長。圖像增強技術有多種方法,反差展寬、對數(shù)變換、密度分層和直方圖均衡等都可用于改變圖像灰調和突出細節(jié)。</p><p>  2.3.

72、2 圖像分割介紹</p><p>  圖像分割就是指把圖像分成各具特性的區(qū)域并提取出感興趣目標的技術和過程,此處特性可以是像素的灰度、顏色、紋理等預先定義的目標可以對應單個區(qū)域,也可以對應多個區(qū)域。</p><p>  圖像分割是由圖像處理到圖像分析的關鍵步驟,在圖像工程中占據(jù)重要的位置。一方面,它是目標表達的基礎,對特征測量有重要的影響;另一方面,因為圖像分割及其基于分割的目標表達、特征

73、抽取和參數(shù)測量的將原始圖像轉化為更抽象更緊湊的形式,使得更高層的圖像分析和理解成為可能。</p><p>  圖像分割是圖像理解的基礎,而在理論上圖像分割又依賴圖像理解,彼此是緊密關聯(lián)的。圖像分割在一般意義下是十分困難的問題,目前的圖像分割一般作為圖像的前期處理階段,是針對分割對象的技術,是與問題相關的,如最常用到的利用閾值化處理進行的圖像分割。</p><p>  圖像分割有三種不同的途

74、徑,其一是將各象素劃歸到相應物體或區(qū)域的象素聚類方法即區(qū)域法,其二是通過直接確定區(qū)域間的邊界來實現(xiàn)分割的邊界方法,其三是首先檢測邊緣象素再將邊緣象素連接起來構成邊界形成分割。</p><p><b>  1.閾值與圖像分割</b></p><p>  閾值是在分割時作為區(qū)分物體與背景象素的門限,大于或等于閾值的象素屬于物體,而其它屬于背景。這種方法對于在物體與背景之間

75、存在明顯差別(對比)的景物分割十分有效。實際上,在任何實際應用的圖像處理系統(tǒng)中,都要用到閾值化技術。為了有效地分割物體與背景,人們發(fā)展了各種各樣的閾值處理技術,包括全局閾值、自適應閾值、最佳閾值等等。</p><p><b>  2.梯度與圖像分割</b></p><p>  當物體與背景有明顯對比度時,物體的邊界處于圖像梯度最高的點上,通過跟蹤圖像中具有最高梯度的點

76、的方式獲得物體的邊界,可以實現(xiàn)圖像分割。這種方法容易受到噪聲的影響而偏離物體邊界,通常需要在跟蹤前對梯度圖像進行平滑等處理,再采用邊界搜索跟蹤算法來實現(xiàn)。</p><p>  3.邊界提取與輪廓跟蹤</p><p>  為了獲得圖像的邊緣人們提出了多種邊緣檢測方法,如Sobel, Canny edge, LoG。在邊緣圖像的基礎上,需要通過平滑、形態(tài)學等處理去除噪聲點、毛刺、空洞等不需要的

77、部分,再通過細化、邊緣連接和跟蹤等方法獲得物體的輪廓邊界。</p><p>  4. Hough 變換</p><p>  對于圖像中某些符合參數(shù)模型的主導特征,如直線、圓、橢圓等,可以通過對其參數(shù)進行聚類的方法,抽取相應的特征。</p><p><b>  5.區(qū)域增長</b></p><p>  區(qū)域增長方法是根據(jù)同

78、一物體區(qū)域內(nèi)象素的相似性質來聚集象素點的方法,從初始區(qū)域(如小鄰域或甚至于每個象素)開始,將相鄰的具有同樣性質的象素或其它區(qū)域歸并到目前的區(qū)域中從而逐步增長區(qū)域,直至沒有可以歸并的點或其它小區(qū)域為止。區(qū)域內(nèi)象素的相似性度量可以包括平均灰度值、紋理、顏色等信息。區(qū)域增長方法是一種比較普遍的方法,在沒有先驗知識可以利用時,可以取得最佳的性能,可以用來分割比較復雜的圖像,如自然景物。但是,區(qū)域增長方法是一種迭代的方法,空間和時間開銷都比較大。

79、</p><p>  2.3.3 模板匹配</p><p>  模板匹配是最早出現(xiàn),也是最簡單的模式識別方法之一,匹配是模式識別的一種分類操作,主要是判斷同一類的兩個實體(如點、曲線、形狀等)之間的相似性。要進行模板匹配,首先需要存儲一些已知模板,然后考慮所有可能的變化,將待識別模板與已知模板相比較,從而得出二者之間的相似性度量。為保證模板的通用性,已知模板一般是通過訓練得到的。</

80、p><p>  依照此系統(tǒng)的要求所實現(xiàn)模板匹配的算法如下:先要確定模板的形式,如3×3或4×4的模板如圖(2-1)所示。然后將目標圖形放到確定的模板中去,通過以圖形包括的模板中點的不同,找出圖形之間的差異,從而實現(xiàn)分辨圖形的目的,典型圖形(三角形,矩形,圓形)模板匹配示意圖,見圖(2-2)。通過圖(2-2)可以看出模板越大、點數(shù)月多,判別的信息就越多,準確性越高。</p><p

81、>  圖2-1 3×3,4×4的模板</p><p>  圖2-2 典型圖形(三角形,矩形,圓形)模板匹配示意圖</p><p>  具體算法描述為:先找圖形的中心點坐標,方法有:</p><p> ?。?)找到圖像的各頂點,使其坐標做差,算出頂點到圖形中心的距離,從而得到圖形的中心坐標;</p><p> ?。?)

82、通過對分割后的圖像的所用坐標求和,在用圖形總共像素數(shù)取平均。</p><p>  然后根據(jù)圖形的中心點與模板其它點之間的距離,得到這些點在圖像上的實際坐標,然后判斷這些點是否被圖形包含,從而判斷是否實現(xiàn)模板匹配。對于一個圖形的辨別還要考慮到其圖形的大小的問題,模板匹配算法可以簡單的實現(xiàn)對于大小變化圖形的識別。方法是:建立圖形中心點到某一端點的距離同模板相對應的點與中心點間距離的比例系數(shù)關系,從而實現(xiàn)訓練模板使之能

83、適應圖形大小的變化。</p><p>  2.3.4 輪廓跟蹤</p><p><b>  1.輪廓跟蹤介紹</b></p><p>  輪廓跟蹤是現(xiàn)今一種發(fā)展成熟的邊緣提取算法,它是根據(jù)提取圖像中有序邊緣點的邊緣序列實現(xiàn)輪廓特征的提取。所謂輪廓(contour)就是把邊緣連接起來。輪廓可以是斷開的,也可以是封閉的。封閉輪廓對應于區(qū)域的邊界,而

84、區(qū)域內(nèi)的像素可以通過填充算法來填滿。斷開的輪廓可能是區(qū)域邊界的一部分,也可能是圖像線條特征,如手寫體筆畫、圖畫中的線條等。區(qū)域之間的對比度太弱或邊緣檢測閾值設置太高都有可能產(chǎn)生間斷的輪廓。而根據(jù)輪廓跟蹤算法描述,此系統(tǒng)處理的是封閉的輪廓。</p><p><b>  2.輪廓編碼與存儲</b></p><p>  對于輪廓的表示此系統(tǒng)采用鏈碼方式。鏈碼一種邊界的編碼表

85、示法,它規(guī)定了邊緣表中每一個邊緣點所對應的輪廓方向,其中的輪廓方向被量化為 4-鄰接鏈碼或 8-鄰接鏈碼中的一個,如圖(2-3)所示。圖(2-3)(b)是 8-鄰接鏈碼的表示法,8-鄰接鏈碼從邊緣表中第一個邊緣開始,沿著輪廓按逆時針方向行走,行走方向用八鏈碼中的一個表示。本次統(tǒng)采用的就是這種 8-鄰接鏈碼的表示法。鏈碼是一種非常重要的曲線描述方法,主要是因為它節(jié)省存儲空間。</p><p> ?。╝)

86、 (b)</p><p>  圖 2-3 連接邊緣點方向的鏈碼示意圖,(a)4-鄰接鏈碼,(b) 8-鄰接鏈碼</p><p>  2.3.5 輪廓跟蹤與模板匹配比較</p><p>  對比模板匹配與基于輪廓跟蹤的角度判別算法,本系統(tǒng)采用的是基于輪廓跟蹤的角度判別算法,原因輪廓跟蹤對于圖形的旋轉很敏感。解決此問題的方法有:</

87、p><p>  (1)使模板也旋轉同圖形旋轉一樣的角度,但此法難以實現(xiàn),因為在判別圖像前根本不知道圖像是否有旋轉,若提供算法對任何圖形都采用統(tǒng)一的模板旋轉算法是非常難以實現(xiàn)的。如考慮圖形定點分布情況,則圓形和矩形就很難分辨,因為對于圖像查找來說,理論上都會找出四個定點,就還得根據(jù)圖像邊的走向進一步判斷。</p><p> ?。?)加大模板的大小,增加更多的模板信息來區(qū)分圖形,此種方法雖然實現(xiàn)上

88、不存在什么問題,但是此法會使判斷的算法復雜,加大處理負擔。</p><p>  相比下基于輪廓跟蹤的角度判別算法,它只跟圖形的輪廓信息判斷,對圖像的大小與旋轉都不敏感。雖然基于輪廓跟蹤的角度判別算法對于圖像輪廓噪聲敏感,但對于此系統(tǒng)來說采集的圖像比較標準,且采集的精確度在允許范圍內(nèi),對于噪聲的影響不是非常嚴重,可以用算法減少噪聲的干擾。</p><p>  2.4VC++與MFC功能模塊的

89、介紹</p><p>  2.4.1VC++平臺簡介</p><p>  VC++是Microsoft公司推出的開發(fā)Win32應用程序(Windows95/98/2000/XP/NT)的面向對象的可視化集成工具。隨著VC++所提供的Microsoft基礎類庫(Microsoft Foundation Class Library,簡寫為MFC),對Windows95/NT所用的Win32應

90、用程序接口(Win 32 Application Programming Interface-API)進行了徹底的封裝,從而可以使用完全的面向對象的方法來進行Win 32應用程序的開發(fā),這樣大大縮短了應用程序開發(fā)周期,降低了開發(fā)成本,也將程序員從大量的復雜勞動中解放出來。 </p><p>  VC++ Developer Studio包含有編寫程序代碼的文本編輯器、設計用戶界面(菜單、對話框、圖標等)

91、的資源編輯器,建立項目配置的項目管理器、檢查程序錯誤的集成調試器等工具,同時它還提供了功能強大的應用程序向導工具AppWizard和類向導工具ClassWizard。AppWizard用于生成各種不同類型的具有Windows界面風格的應用程序的基本框架,在生成應用程序框架后,使用ClassWizard便可輕松完成創(chuàng)建新類、定義消息處理函數(shù)、重載虛擬函數(shù)等操作。 </p><p>  VC++的資源編輯器

92、能以所見所得的形式直接編輯應用程序用戶界面,為所有資源分配ID標識號。ClassWizard能把對話框模板與自動生成的類定義或與已有的類代碼連接起來,為菜單項、控件等資源生成空的處理函數(shù)模板,創(chuàng)建自消息映射的編程工作便簡化為用資源編輯器直觀的設計界面,完善對話框類代碼。在空的處理模板出填寫響應用戶操作的代碼,是一種完善的可視化編程方法。</p><p>  2.4.2 MFC模塊的功能介紹</p>

93、<p>  MFC(Microsoft Foundation Classes),是微軟公司提供的一個類庫(class libraries),以C++類的形式封裝了Windows的API,并且包含一個應用程序框架,以減少應用程序開發(fā)人員的工作量。其中包含的類包含大量Windows句柄封裝類和很多Windows的內(nèi)建控件和組件的封裝類。但是并不需要將所有的類都記住,只需要了解以下比較重要的類:</p><p&g

94、t;  CWnd:窗口,它是大多數(shù)“看得見的東西”的父類(Windows里幾乎所有看得見的東西都是一個窗口,大窗口里有許多小窗口),比如視圖CView、框架窗口CFrameWnd、工具條CToolBar(現(xiàn)為CMFCToolBar)、對話框CDialog、按鈕CButton等等;一個例外是菜單(CMenu)不是從窗口派生的。該類很大,一開始也不必學,知道就行了。</p><p>  CDocument文檔,負責內(nèi)

95、存數(shù)據(jù)與磁盤的交互。最重要的是OnOpenDocument(讀入),OnSaveDocument(寫盤),Serialize(序列化讀寫)。</p><p>  CView視圖,負責內(nèi)存數(shù)據(jù)與用戶的交互。包括數(shù)據(jù)的顯示、用戶操作的響應(如菜單的選取、鼠標的響應等等)。最重要的是OnDraw(重畫窗口),通常用CWnd::Invalidate()來啟動它。另外,它通過消息映射表處理菜單、工具條、快捷鍵和其他用戶消息

96、。你自己的許多功能都要加在里面,你打交道最多的就是它。</p><p>  CDC設備文本。無論是顯示器還是打印機,都是畫圖給用戶看。這圖就抽象為CDC。CDC與其他GDI(圖形設備接口)一起,完成文字和圖形、圖像的顯示工作。把CDC想象成一張紙,每個窗口都有一個CDC相聯(lián)系,負責畫窗口。CDC有個常用子類CClientDC(窗口客戶區(qū)),畫圖通常通過CClientDC完成。</p><p&g

97、t;  CDialog對話框</p><p>  CWinApp應用程序類。似于C中的main函數(shù),是程序執(zhí)行的入口和管理者,負責程序建立、消滅,主窗口和文檔模板的建立。最常用函數(shù)InitInstance():初始化。</p><p>  CGdiObject及子類,用于向設備文本畫圖。它們都需要在使用前選的DC。</p><p><b>  CPen筆,

98、畫線。</b></p><p>  CBrush刷子,填充。</p><p>  CFont字體,控制文字輸出的字體。</p><p><b>  CBitmap位圖</b></p><p>  CPalette調色板</p><p>  CRgn區(qū)域,指定一塊區(qū)域可以用于做特殊處理。

99、</p><p>  CFile文件。最重要的不外是Open(打開),Read(讀入),Write(寫)。</p><p>  CString字符串。封裝了C中的字符數(shù)組,非常實用。</p><p>  CPoint點,就是(x,y)對。</p><p>  CRect矩形,就是(left,top,right,bottom)。</p&g

100、t;<p>  CSize大小,就是(cx,cy)對(寬、高)。</p><p>  第3章 數(shù)字圖像處理的實現(xiàn)過程及算法</p><p>  一個數(shù)字圖像處理的系統(tǒng)一般分為:圖像采集,圖像預處理,圖像分割,輪廓跟蹤,圖像辨別五個部分??傁到y(tǒng)實現(xiàn)框圖,如圖3-1所示。</p><p>  圖 3-1 總的系統(tǒng)實現(xiàn)框圖</p><p&

101、gt;  圖像采集實現(xiàn)是,通過對視頻數(shù)據(jù)的獲取,將連續(xù)的圖像信息按固定的采集頻率變成離散圖像,并通過對信號幅度離散分層的量化處理,將圖像保存以待后續(xù)處理。</p><p>  圖像預處理指的是,圖像平滑,它實現(xiàn)去除或衰減圖像上的噪聲和假輪廓,即衰減高頻分量,增強低頻分量。</p><p>  圖像分割指的是,將圖像劃分為一些區(qū)域,在同一區(qū)域內(nèi),圖像的特征相近,而不同的區(qū)域,圖形特征相差較遠

102、,本系統(tǒng)的圖像特征指的是圖像本身的像素灰度值,它實現(xiàn)的是將圖形從背景中分離出來。</p><p>  輪廓跟蹤是,根據(jù)輪廓跟蹤算法實現(xiàn)對圖形輪廓信息的提取與存儲,為后續(xù)的圖像辨別算法提供信息。</p><p>  圖像辨別實現(xiàn)的是,通過數(shù)學運算對圖形的輪廓信息,進行邊緣曲率計算,通過判斷角度大小,判斷是否是拐角,再通過拐角的數(shù)目實現(xiàn)圖形辨別。</p><p><

103、;b>  3.1 圖像采集</b></p><p>  圖像采集是圖像處理的先決條件,沒有圖像就根本談不上圖像處理。而且圖像采集效果的好壞也直接影響圖像處理的后續(xù)部分,因為如果圖像采集的非常好,其各種不良因素:如噪聲,假輪廓等因素的影響是不會很明顯的,這會使圖像的后續(xù)處理效果更好。</p><p>  本次設計我是使用手機攝像頭對物體圖像進行采集。首先選取好合適的圖像采集

104、對象,再選取一個正對著的方向,近距離進行實物拍攝。拍攝好設計所需的研究對象的照片之后,將采集的圖像上傳到電腦上面并以bmp格式保存好照片文件。之后利用VC++6.0里的 MFC板塊建立好相關的工程,然后獲取保存好的照片文件進行讀取圖像處理。這樣就完成了圖像采集的工作。</p><p>  3.2 圖像預處理方法——圖像平滑</p><p>  一個圖形處理過程首先是要經(jīng)過預處理的。通過采集

105、設備獲取到待識別圖形或物體的平面圖像,為了避免一些外界干擾信息,在做這些預處理時,把待識別圖形或物體平鋪在白色背景的紙上。使得到的圖片盡量保持待識別圖形或物體的完整形狀。圖像的預處理工作有很多,除噪聲,抗干擾等等,因此首先我們得對圖像進行一些必要的預處理,以免為后面的工作帶來不必要的麻煩,預處理的好壞直接影響到圖像處理工作,當然最好的預處理就是沒有預處理。</p><p>  本次設計,我采用的圖像平滑主要的實現(xiàn)

106、方法是中值濾波法。其基本原理是把圖像或序列中心點位置的值用該域的中值替代,具有運算簡單、速度快、除噪效果好等優(yōu)點。</p><p>  具體方法是取某種結構的二維滑動模板,將板內(nèi)像素按照像素值的大小進行排序,生成單調上升(或下降)的為二維數(shù)據(jù)序列。二維中值濾波輸出為</p><p><b>  (3.1)</b></p><p>  其中,f(

107、x,y),g(x,y)分別為原始圖像和處理后圖像。W為二維模板,通常為2*2,3*3區(qū)域。</p><p>  在DIBAPI中定義Template()函數(shù),該函數(shù)用指定的模板(任意大小)來對圖像進行操作,參數(shù)iTempH指定模板的高度,參數(shù)iTempW指定模板的寬度,參數(shù)iTempMX和iTempMY指定模板的中心元素坐標,參數(shù)fpArray指定模板元素,fCoef指定系數(shù)。實現(xiàn)相關功能的程序見附錄中附1。&l

108、t;/p><p>  3.3 圖像分割——二值化處理</p><p>  圖像分割是圖像處理中關鍵的步驟,因為它去除了圖像中大量的無用信息如背景等。為后續(xù)圖像處理減少了負擔。</p><p>  而要將圖像進行分割就必須先將圖像進行二值化處理。圖像的二值化處理就是將圖像上的點的灰度置為0或255,也就是將整個圖像呈現(xiàn)出明顯的黑白效果。即將256個亮度等級的灰度圖像通過適

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論