基于數(shù)字成像的物體表面輪廓的提取和分析畢業(yè)論文_第1頁
已閱讀1頁,還剩50頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、<p><b>  摘 要</b></p><p>  圖像由于攜帶豐富的信息得到人們的青睞,而目前獲取圖像的方法有拍照,視屏截圖,利用計算機產生彩圖,激光掃描等等。從圖像中獲取景物的三維信息屬于一個多學科交叉的研究領域,它涉及到射影幾何學、數(shù)字圖像處理、計算機圖形學、計算機視覺等許多學科的理論,是目前研究的熱點之一。三維重建就是通過二維圖像中基元(如點、線、面)來恢復目標的三維空

2、間信息,需要研究三維空間中點、線、面的三維坐標與二維圖像中對應點、線、面的二維坐標之間的關系,實現(xiàn)定量分析物體的大小和空間物體的相互位置關系。其主要過程是通過對圖像的特征提取、特征匹配、圖像關鍵特征的重建、三角化以及數(shù)據(jù)融合生成物體完整的三維結構。這種三維信息或三維模型在虛擬植物可視化、數(shù)字娛樂、產品外觀設計、虛擬場景的模擬等諸多領域具有廣泛的應用價值。本文提出了利用數(shù)字圖像處理的方法對圖像進行處理以獲得目標圖像的輪廓,并得到目標圖像的

3、輪廓關鍵點上的坐標,這對接下來的三維重建目標十分關鍵。在本文中圖像采集之后,首先將其數(shù)字化。數(shù)字化之后,計算機利用數(shù)字圖像處理技術對圖像進行彩色預處理、去除背景、圖像平滑、彩色轉灰度、圖像銳化、灰度二值化、腐蝕膨脹、濾波、輪廓提取等</p><p>  關鍵詞: 數(shù)字成像; 圖像處理; 三維重建; 輪廓; 坐標</p><p><b>  Abtract</b>&l

4、t;/p><p>  Image which due to the rich information to get the favour of people,At present, image acquisition methods are taking pictures, screen shots, and produce images by computer, laser scanning etc..Three-

5、dimensional information obtained from two-dimensional images is an interdisciplinary research field, it involves many subjects of projective geometry, digital image processing, computer graphics, computer vision theory,

6、is a research hotspot. Three-dimensional reconstruction is through 2D image primi</p><p>  Key words : Digital imaging; image processing; 3D reconstruction; contour; coordinate</p><p>&

7、lt;b>  目 錄</b></p><p><b>  摘要1</b></p><p>  Abstract2</p><p><b>  目錄3</b></p><p><b>  第一章 緒論5</b></p><p> 

8、 1.1論文研究的背景5</p><p>  1.1.1三維測量技術的背景5</p><p>  1.12數(shù)字圖像處理的發(fā)展情況6</p><p>  1.2數(shù)字成像與輪廓提取技術在國內外的發(fā)展7</p><p>  1.3論文研究的主要內容7</p><p>  1.4論文的安排8</p>

9、<p>  第二章 光學成像系統(tǒng)和圖像系統(tǒng)的設計8</p><p>  2.1光學成像系統(tǒng)的搭建8</p><p>  2.1.1攝像系統(tǒng)的方案選擇8</p><p>  2.1.2攝像機的參數(shù)選擇13</p><p>  2.1.3光照系統(tǒng)的設計14</p><p>  2.1.4光學成像系統(tǒng)的搭

10、建效果16</p><p>  2.2攝像機的標定16</p><p>  2.2.1攝像機的標定原理16</p><p>  2.2.2攝像機的標定過程17</p><p>  2.3圖像采集18</p><p>  2.3.1圖像采集的工作過程18</p><p>  2.3.2

11、D-S4004HC圖像采集卡19</p><p>  2.3.3PCI-2312光電隔離DI/D0卡20</p><p>  2.3.4軟件設計流程21</p><p>  第三章 數(shù)字圖像處理的基本理論23</p><p>  3.1數(shù)字圖像處理的基本知識23</p><p>  3.1.1數(shù)字圖像的表示方

12、法24</p><p>  3.1.2數(shù)字圖像的顏色模型25</p><p>  3.2圖像平滑25</p><p>  3.2.1中值濾波26</p><p>  3.2.2均值濾波26</p><p>  3.3圖像銳化27</p><p>  3.3.1一階微分運算27<

13、;/p><p>  3.3.2基于拉氏算子的圖像銳化處理28</p><p>  3.4圖像表示方法相互轉化29</p><p>  3.4.1彩色圖像轉為灰度圖像29</p><p>  3.4.2灰度圖像二值化29</p><p>  3.5二值圖像的形態(tài)學處理30</p><p> 

14、 3.5.1圖像膨脹30</p><p>  3.5.2圖像腐蝕30</p><p>  3.6MATLAB軟件的簡介31</p><p>  第四章 數(shù)字圖像處理的實現(xiàn)32</p><p>  4.1圖像的讀取與顯示33</p><p>  4.2彩色圖像預處理33</p><p>

15、;  4.3彩色圖像轉為灰度圖34</p><p>  4.4圖像的銳化與邊緣檢測35</p><p>  4.4.1圖像的銳化35</p><p>  4.4.2圖像的邊緣檢測35</p><p>  4.5灰度圖像的二值化36</p><p>  4.6二值圖像的處理37</p><

16、p>  4.6.1腐蝕膨脹處理37</p><p>  4.6.2二值圖像的中值濾波38</p><p>  4.6.3連通域標記法濾波39</p><p>  4.6.4水杯各分面的輪廓提取41</p><p>  4.7 提取水杯分面的輪廓坐標43</p><p>  4.7.1建立四個分面的二維坐

17、標系43 </p><p>  4.7.2 四個分面的三維坐標系 44</p><p>  4.7.3選取特征點44</p><p>  第五章 系統(tǒng)介紹與誤差分析46</p><p>  5.1系統(tǒng)各環(huán)節(jié)的誤差分析46</p><p>  5.1.1儀器產生

18、的誤差46</p><p>  5.1.2數(shù)字圖像處理過程中的誤差46</p><p>  5.1.3環(huán)境引起的誤差47</p><p><b>  總結與展望48</b></p><p><b>  參考文獻:49</b></p><p><b>  第

19、一章 緒論</b></p><p>  1.1論文研究的背景</p><p>  1.1.1三維測量技術的背景</p><p>  21世紀是信息化的時代,而在信息學研究中以圖像為載體的信息處理占據(jù)重要位置,圖像工程已經滲透到各個學科,從工業(yè)機器上的視覺檢測,醫(yī)學上的病變診斷,多媒體通信與娛樂,等各個方面都有巨大的用途。其中數(shù)字成像系統(tǒng)應用十分廣泛?,F(xiàn)在

20、這種技術可以被用于地形數(shù)據(jù)的可視化,這樣可以由二維等高線重構出具有光照效果的三維地形圖;還有在醫(yī)學方面比如CT/MRI(核磁共振成像)可以應用于人體斷層解剖圖像的可視化,同樣是得到一個序列的二維輪廓線來重構三維形體,比如人的血管、神經等。</p><p>  三維測量技術是近年來幾何量測量技術中的重點研究領域,該技術以獲取被測物體三維輪廓數(shù)據(jù)為目的,主要包括數(shù)據(jù)測量與數(shù)據(jù)后續(xù)處理。伴隨著光電傳感器件以及計算機技術

21、的日趨成熟,三維測量技術得到了不斷豐富和發(fā)展,越來越廣泛的應用對該技術的發(fā)展也提出了更新的要求,同時催化了一些相關技術領域的發(fā)展,如攝像機標定技術,圖像工程,數(shù)據(jù)補償技術,顏色渲染技術,測量視角自動選擇技術等等。</p><p>  1.1.2數(shù)字圖像處理的發(fā)展情況</p><p>  根據(jù)激光掃描的物體尺寸是在一個相對穩(wěn)定的范圍之內的特點。由此就產生了通過分析目標物體的圖像信息,來完成圖

22、像面的提取和關鍵點坐標的提取,而代替人工提取關鍵點坐標的過程。產生這些想法的原因主要是因為數(shù)字圖像處理技術的飛速發(fā)展,下來簡單介紹一下數(shù)字圖像處理的發(fā)展情況。</p><p>  圖像是人類視覺的基礎,是自然景物的客觀反映,是人類認識世界和人類本身的重要源泉。它所攜帶的巨大信息量可以將客觀事物的原形真實地展現(xiàn)在人們的眼前。圖像可以分為模擬圖像和數(shù)字圖像。人眼看到的任何自然界的圖像都是連續(xù)的模擬圖像,它的形狀和形態(tài)

23、表現(xiàn)由圖像各位置的顏色所決定。數(shù)字圖像是由模擬圖像經過采樣、量化、編碼等步驟離散化得到的。由于計算機只能處理數(shù)字信息,因此必須把模擬圖像轉化為數(shù)字圖像之后,才可以進行處理。數(shù)字圖像處理是指通過計算機對圖像進行去除噪聲、增強、復原、分割、提取特征等處理的方法和技術。廣義的圖像處理技術,還包括了圖像理解、圖像分析、圖像識別,等等。</p><p>  數(shù)字圖像處理主要應用于下面一些領域:</p><

24、;p>  (1)通信。通信應用包括圖像傳輸、電視電話、電視會議、數(shù)字圖像處理技術主要用于圖像壓縮甚至在圖像理解的基礎·上進行壓縮。</p><p>  (2)宇宙探測與遙感。由于太空技術的發(fā)展,需要用到數(shù)字圖像處理大量的星體圖片;同樣遙感也需要此項技術,這可以應用于地形地質,礦藏探查,森林、水利、海洋、農業(yè)等資源調查,自然災害預測,氣象衛(wèi)星云圖處理,以及軍事目標識別。</p><

25、;p>  (3)生物醫(yī)學領域。數(shù)字圖像處理在生物醫(yī)學工程方面的應用十分廣泛,而且很有成效。除了CT技術之外,還有一類是對醫(yī)用顯微圖像的處理分析,如紅細胞、白細胞分類,染色體分析,癌細胞識別等。此外,在X光肺部圖像增晰、超聲波圖像處理、心電圖分析、立體定向放射治療等醫(yī)學診斷方面都廣泛地應用圖像處理技術。</p><p>  (4)工業(yè)生產中的應用。在生產線對產品及部件進行無損探傷是圖像處理的重要應用領域。主要

26、有產品質量檢測、生產過程的自動控制、CAD/CAM等。</p><p>  經過上述對數(shù)字圖像以及其領域的闡述,我們知道數(shù)字圖像的應用范圍十分廣泛,因此可以將數(shù)字圖像處理的方法引入到激光掃描圖像處理中來。通過獲取激光掃描對象的圖像,再用數(shù)字圖像處理的方法對圖像進行處理,獲取關鍵點位置坐標,以達到目標物體三維重建的目的。 </p><p>  1.2數(shù)字成像與輪廓提取技術在國內外的發(fā)展<

27、;/p><p>  視覺信息作為人類獲取外界信息的主要手段,據(jù)分析,人類通過視覺獲取的信息占其總獲取信息量的70%—80%左右?,F(xiàn)在的信息處理,以圖像的二維處理和計算機視覺的三維圖像處理已在蓬勃發(fā)展,即為有效的例證。圖像處理的應用領域已經擴展到人類生活和工作的各個方面,以圖像處理為工具的輪廓提取也已經漸漸增加起來。</p><p>  輪廓提取與表面重建是計算機視覺中的重要研究課題,其在虛擬現(xiàn)

28、實、自控車輛、機器人環(huán)境分析、監(jiān)控系統(tǒng)中的物體跟蹤與識別、生物醫(yī)學圖像處理、工業(yè)在線自動檢測、形狀反求等方面有著廣泛的應用前景。反求和重構的一種測量</p><p>  方法,是目前國內外研究的熱點。根據(jù)斷層圖像提取的實體輪廓可以通過表面重建得到物體的CAD模型,或直接應用于快速成形系統(tǒng)。 近年來,將物理原理引入物體的形狀恢復吸引了學者們的研究興趣,基于可變形模型的輪廓提取與表面重建就是其中的一類??勺冃文P涂梢?/p>

29、為在內力和外力作用下的能量極小化樣條模型,內力來自幾何模型,約束它的形狀;外力來自圖像特征,引導它的行為,將其吸引至圖像特征處。因此,基于可變形模型的斷層圖像輪廓提取與表面重建研究,在科學研究及工程應用中有著重要的意義。 </p><p>  1.3論文研究的主要內容</p><p>  論文研究的對象是一個具有明顯棱角的物體,因此本論文中根據(jù)實際情況以普通水杯為例,來詳細地闡述怎樣根據(jù)數(shù)

30、字圖像處理的方法獲取它的分面信息,然后根據(jù)不同面的信息,怎樣獲取各個面的關鍵坐標點的值。</p><p>  首先要根據(jù)目標物體的形狀信息,來確定怎樣搭建光學成像系統(tǒng)。光學成像系統(tǒng)首先要保證必須得到水杯的各個面的具體信息,所以成像系統(tǒng)選擇的是數(shù)字攝像機在物體正面、側面、背面以及頂面的掃描,而激光掃描儀的選擇將直接影響到水杯的成像質量。</p><p>  采集回來的圖片要經過一系列數(shù)字圖像

31、處理的工作,首先進行目標物體的提取、彩色轉灰度、圖像平滑、銳化、二值化、膨脹腐蝕、二值濾波等得處理,得到到效果比較好的二值圖像,然后再二值圖像的基礎之上,選擇比較理想的輪廓提取方法得到圖像的輪廓。圖像的輪廓得到之后,要根據(jù)二值圖像經過濾波之后的圖像,確定產品的分面信息以及分面之后得到各個面的關鍵點的坐標。</p><p>  上述工作完成之后,還需要討論整個系統(tǒng)所產生的誤差,本文給出了減小誤差的方法。最后得出通過

32、對物體的圖像進行數(shù)字圖像處理能夠完成對目標物的三維重建與恢復工作。</p><p><b>  1.4論文安排</b></p><p>  論文一共分為六個章節(jié),下面對每個章節(jié)做個概述。</p><p>  第一章 緒論。主要介紹了論文的研究背景、目的和意義,以及本論文的章節(jié)安排。</p><p>  第二章 圖像采集卡

33、對圖像的采集。主要介紹了攝像機系統(tǒng)方案。</p><p>  第三章 數(shù)字圖像處理的基本理論。本章介紹了數(shù)字圖像處理的基本知識,圖像表示方法之間的轉換,典型的數(shù)字圖像處理的算法比如圖像平滑/濾波、腐蝕膨脹等以及圖像處理實現(xiàn)的軟件平臺。</p><p>  第四章 數(shù)字圖像的實現(xiàn)過程。本章從圖像的讀取開始,根據(jù)圖像的特點結合上一章圖像處理的基本理論,對圖像進行平滑銳化、膨脹腐蝕、圖像濾波、輪

34、廓提取以及面坐標生成等處理,接著根據(jù)各分面的相互對照關系,從二維坐標系映射出三維坐標系,便可以得到輪廓的三維坐標。</p><p>  第五章 結果分析和誤差分析。本章根據(jù)論文的結果,分析了系統(tǒng)的誤差以及產生誤差的原因,并針對這些誤差提出的解決方案。</p><p>  第六章 總結和展望。主要討論了論文的成果和不足,有待于以后的改進。</p><p>  第二章

35、光學成像系統(tǒng)和圖像采集系統(tǒng)的設計</p><p>  在這一章,為了達到用數(shù)字圖像處理的方法對水杯輪廓進行提取的目的,就必須設計合理的圖像光學成像系統(tǒng),很好地完成對圖像數(shù)據(jù)的采集工作。本章主要介紹兩個方面的內容,一個是光學成像系統(tǒng)的搭建,它包括攝像系統(tǒng)的配置和光學系統(tǒng)的設計;另一個方面敘述了圖像采集系統(tǒng)的實現(xiàn)過程,以及圖像采集工作的軟件設計流程。本章的框圖如下圖所示:</p><p>  

36、圖2.1 圖像的光學成像系統(tǒng)和圖像采集系統(tǒng)</p><p>  2.1光學成像系統(tǒng)的搭建</p><p>  在圖像光學系統(tǒng)中包括攝像系統(tǒng)和光照系統(tǒng)。其中攝像系統(tǒng)包括攝像機系統(tǒng)的方案選擇以及攝像機的參數(shù)選擇。光照系統(tǒng)主要介紹了光照的設計問題。</p><p>  2.1.1攝像系統(tǒng)的方案選擇 </p><p>  在本論文中,使用的是CCD攝

37、像機,結合論文的目的,本系統(tǒng)采用了雙目測量的原理。由于有極線幾何原理和光學三角形原理的理論支撐,基于雙目立體成像原理的三維測量方法具有穩(wěn)定可靠、精度高、速度快等優(yōu)點, 目前已經廣泛應用于逆向工程、物體識別、工業(yè)質量檢測及機器人自導引等領域。雙目測量基本任務之一是從相機獲取的圖像信息出發(fā),計算被測對象在三維空間中的幾何信息,并由此進行被測對象的識別操作,而空間被測對象表面某點的三維幾何位置與其在圖像中對應點之間的相互關系是由攝像機成像的幾

38、何模型決定的,攝像機成像的幾何模型是由兩攝像機的相對位置和他們在世界坐標系中的三維位置和方向決定的。</p><p>  在本系統(tǒng)的雙目測量中,兩相機的相對位置可有兩種選擇,一種是兩相機放置在同一平面內,這樣兩個相機一般會有共同的視場區(qū),然后通過一系列的算法重構出被測對象的三維信息。這種放置方式構成了傳統(tǒng)的經緯儀三維測量系統(tǒng)的測量模型。而另一種放置方式是兩相機相互垂直交叉放置,一個相機測量一個面的形狀信息,然后通

39、過兩個相機的相對位置來構建被測對象的三維坐標信息,在這種放置方中,兩相機一般沒有共同的視場區(qū),這種測量方法的基礎其實就是單目測量,然后通過兩組單目測量系統(tǒng)進一步構建三維測量系統(tǒng),嚴格的說該方法不屬于三維測量的方法,該方法一般適用于被測對象具有對稱性的場合。下面分別介紹下兩種方法的測量原理。</p><p>  (1)經緯儀三維測量系統(tǒng)</p><p>  平行放置法是由人類視覺感知模型得到

40、的啟示:可以利用兩個相機代替人眼,從而構成了三維視覺測量系統(tǒng)。該模型的相機安裝位置和被測對象的位置關系如圖2.2所示:</p><p>  圖2.2 經緯儀三維測量系統(tǒng)模型</p><p>  現(xiàn)假設物理坐標系OXYZ和左相機CCD1的坐標系重合,p為空間被測對象上的任何一點,p點在兩幅圖像上的成像點為 (u1,v1)和( u2,v2),則根據(jù)攝像機透視變換模型有</p>&

41、lt;p><b>  (2.1)</b></p><p><b>  (2.2)</b></p><p>  現(xiàn)假設攝像頭的兩個坐標系之間的關系為:</p><p><b>  (2.3)</b></p><p>  其中R為兩個相機之間的旋轉矩陣,T為兩個相機之間的平移

42、矩陣</p><p><b>  (2.4)</b></p><p><b>  則由式2.3得:</b></p><p><b>  (2.5)</b></p><p>  其中,從2.5式可以看出只要知道了兩個相機的、、、以及兩個相機之間的空間位置關系(即旋轉矩陣和平移向量

43、),則可以得到兩個相機共同視場下的任何一點的空間坐標信息。</p><p>  由上面的分析可知該種方法能實現(xiàn)三維信息的精確測量,但是它存在一個問題,就是在兩幅圖像上找同名點比較困難。如果無法找到同名點,那么這種方法就是失敗的,在實際中很多人使用人機交互的方法來找同名點,但是本系統(tǒng)要求的自動化水平比較高,要求在無人操作的情況下能完成系統(tǒng)的功能。所以本系統(tǒng)沒有采用這種方法。采用的是下面的方法。</p>

44、<p>  (2)兩攝像頭垂直放置法測量系統(tǒng)</p><p>  兩個攝像頭垂直放置法的測量模型如圖2.4所示,該模型的物理坐標系為OXYZ,物理坐標系的坐標原點在整個測量系統(tǒng)的底面中心處,攝像頭1的坐標系為O1X1Y1,攝像頭1相對于物理坐標系OXYZ的位置為:</p><p><b>  (2.6)</b></p><p>  

45、其中為攝像頭1相對于物理坐標系為OXYZ的旋轉矩陣,為平移向量。攝像頭2相對于物理坐標系OXYZ的位置為:</p><p>  (2.7)其中為攝像頭2相對于物理坐標系為OXYZ的旋轉矩陣,為平移向量。</p><p>  圖2.3 兩攝像頭垂直放置法測量系統(tǒng)模型</p><p>  現(xiàn)在假設要求圖2.4中面ABCD的位置信息,只要求出ABCD四點的三維坐標值也就

46、確定了該面的位置信息。不妨以A為例,因為坐標系OXYZ的X,Y軸分別平行于O1X1Y1坐標系的X1,Y1軸,XOY平面平行于X1O1Y1平面,所以物理坐標系上的任意一點投影到O1X1Y1坐標系上時,旋轉向量R1的值為單位陣。</p><p>  A點在物理坐標系中的X和Y方向的坐標(x,y),而A點在攝像機1圖像中的坐標為,即相當于把物體上的A點投影到X1O1Y1平面,所以有:</p><p&

47、gt;<b>  (2.8)</b></p><p>  其中和分別為攝像機1在x,y方向上的放大倍數(shù),為攝像機1的平移向量。根據(jù)上式可以求出A點x,y軸坐標。</p><p>  因為坐標系OXYZ的Y,Z軸分別平行于02X2Y2坐標系的Y2,Z2軸,所以物理坐標系上的任意一點投影到02X2Y2坐標系上時,旋轉向量R2的值為單位陣。</p><p

48、>  A點在物理坐標系中的Y和Z方向的坐標(y,z) A點在攝像機2圖像中的坐標為,則</p><p><b>  (2.9)</b></p><p>  其中和分別為攝像機2在y,z方向上的放大倍數(shù),為攝像機2的平移向量。根據(jù)上式可以求出A點y,z軸坐標。</p><p>  綜上所述,就可以求出A點在物理坐標系中的坐標(x,y,z),

49、根據(jù)同樣的理論就可以求出B,C,D在物理坐標系中OXYZ的坐標。通過以上的分析可以看出,在測量精度要求不高且被測對象具有明顯對稱性的場合下,該測量系統(tǒng)具有簡單,快捷,對環(huán)境要求不嚴格的特點。</p><p>  2.1.2攝像機的參數(shù)選擇</p><p>  攝像機是本系統(tǒng)獲取被測對象信息的唯一途徑,它的作用就像人的眼睛,它在本系統(tǒng)中起著非常重要的作用,所以在盡可能降低系統(tǒng)總成本的情況下選

50、擇一個合適的攝像機在本系統(tǒng)中顯得至關重要,攝像機一般要根據(jù)以下幾個參數(shù)進行選擇。</p><p><b>  (1)靈敏度</b></p><p>  作為圖像傳感器最重要的技術指標之一,靈敏度是衡量圖像傳感器對于光線的敏感度,一般監(jiān)控用的低端CMOS的靈敏度高達10V/Lux-sec以上,高過大部分的CCD傳感器,靈敏度指標主要體現(xiàn)在畫質的亮度和低光效果上,靈敏度越

51、高畫面越清晰。</p><p><b>  (2)動態(tài)范圍</b></p><p>  動態(tài)范圍是衡量圖像傳感器對于明暗光線差別較大的場景下的表現(xiàn)。在實際應用中,體現(xiàn)在圖像傳感器是否可以在一幅圖像中既可以清晰顯示較暗的場景,又可以清晰顯示光線充足的場景. 動態(tài)范圍越高,表明在明暗差別較大的場景下,圖像傳感器表現(xiàn)越好。目前高端CMOS可實現(xiàn)高達100dB以上的動態(tài)范圍,

52、而常見CCD的動態(tài)范圍基本在60dB左右。從動態(tài)范圍上講,CMOS略勝一籌。</p><p><b>  (3)焦距</b></p><p>  目前,市場上同一產品下會有3.6mm、4mm、6mm、8mm、12mm等不同規(guī)格的焦距指標,對于具有相同的成像面積的兩個攝像機,鏡頭焦距越短的攝像機視角就越大,具體選擇多大焦距的鏡頭還得看要拍攝的距離,焦距大一些,相應你要看

53、到的圖像范圍就要比現(xiàn)在看到的小一些了。每個焦距的鏡頭都只能在一定范圍內達到最佳的監(jiān)看效果。在本系統(tǒng)中,拍攝的距離為2-3米,拍攝的場景是1m×1m的區(qū)域。所以選用了焦距為6mm的攝像機。</p><p><b>  (4)線數(shù)</b></p><p>  目前,市場上對于民用級選用的購攝像機一般有380線、420線、480線、520等不同的規(guī)格,線數(shù)代表攝像

54、機的清晰度,即在監(jiān)視器上水平掃描的線數(shù),線數(shù)越高,圖像的清晰度越好。</p><p>  根據(jù)以上四個指標和成本的綜合權衡,本系統(tǒng)選用了安視寶公司的ASB-H88B系列攝像機,鏡頭焦距為6mm,如圖3.4所示,動態(tài)范圍為48dB,采用的成像器件為1/3英寸的Sony Color CCD ,PAL格式的有效像素為512(H)×582(V) ,NTSC格式的有效像素為512(H)×492(V) ,

55、水平分辨率為420TVL,經過實驗,該攝像頭很好的滿足了本系統(tǒng)的要求【2-3】。</p><p>  圖2.4 ASB-H88B攝像頭</p><p>  2.1.3光照系統(tǒng)的設計</p><p>  光源設計也是圖像測量系統(tǒng)的一個重要組成部分。被測對象就是在光源的照射下,成像圖像傳感器的感光面上,最后通過放大輸出被測對象的圖像信息。而隨著光源光譜成分的變化,以及

56、光源強度分布隨時間等的變化,攝像機輸出的圖像信號也會發(fā)生變化。本系統(tǒng)中要求光照度在成像區(qū)盡可能的分布均勻,若光照度分布不均勻,成像區(qū)就有可能出現(xiàn)有些區(qū)域的光照度太高,有些區(qū)域的光照度太低,當攝像頭選定以后,它的動態(tài)范圍也就確定了,若光照度變化太大(包括空間上的變化和時間上的變化),超出了攝像頭的動態(tài)范圍,在高照度區(qū)就會出現(xiàn)畫面失真的現(xiàn)象,在低照度區(qū)就會出現(xiàn)無法檢測出被測對象的現(xiàn)象。因而,在恰當?shù)剡x擇光源,有利于我們獲得理想的圖像信號,為

57、后續(xù)的圖像處理降低了難度。在照明系統(tǒng)的設計中,首先考慮光源的選擇,常見的光源可分為自然光源和人工光源兩大類。由于本系統(tǒng)的工作環(huán)境在工廠,工廠里的自然光會受到工廠中自身的照明系統(tǒng)和工廠中的其他設備的影響,因而本系統(tǒng)中不適合使用自然光源。</p><p><b>  (1)光源的選擇</b></p><p>  為了獲得良好的、穩(wěn)定的測量條件,本系統(tǒng)中使用人工光源。目前,

58、人工光源主要有如白熾燈、鹵素燈、激光器等,此為還有今年來發(fā)展迅猛的LED燈。白熾燈、鹵素燈是使物體溫度升高而發(fā)光的溫度輻射光源,是利用溫度輻射原理而制成的,其發(fā)熱量大,溫度很快升高,其發(fā)出的光譜范圍寬,是連續(xù)光譜,使測量系統(tǒng)容易受外界雜散光的干擾,不利于測量。激光器在本系統(tǒng)中的成本相對比較高。LED燈泡的發(fā)光源可以近似的認為是點光源,若受到其他物體的遮擋,很容易使成像區(qū)出現(xiàn)陰影區(qū),也不利于本系統(tǒng)的測量要求。因而本系統(tǒng)選用了LED日光燈作

59、為系統(tǒng)的光源,如圖2.5所示。由于它的結構是管狀的,基本能保證成像區(qū)的光照光照度滿足系統(tǒng)的要求。</p><p>  圖2.5 LED日光燈</p><p>  (2)光照系統(tǒng)的設計</p><p>  光照系統(tǒng)設計時,本著盡可能使成像區(qū)的光照度均勻的原則,設計的光照系統(tǒng)如圖2.6所示</p><p>  圖2.6 光照系統(tǒng)模型</

60、p><p>  由圖知,本系統(tǒng)專門為成像系統(tǒng)設計了一個封閉的成像環(huán)境,這樣就消除了外界光線對系統(tǒng)的干擾,成像系統(tǒng)的光照度只由系統(tǒng)內部的光照度決定。1號和2號LED日光燈的設計主要為1號攝像頭拍攝圖像提供合適的光照條件,3號和4號LED日光燈的設計主要為2號攝像頭拍攝圖像提供合適的光照條件。</p><p>  2.1.4光學成像體統(tǒng)的搭建效果</p><p>  根據(jù)以

61、上的分析,圖像測量系統(tǒng)由成像系統(tǒng)和光照系統(tǒng)組成的搭建效果如下圖所示:</p><p>  圖2.7 光學成像系統(tǒng)的結構圖</p><p><b>  2.2攝像機的標定</b></p><p>  2.2.1攝像機的標定原理</p><p><b>  (1)標定放大倍數(shù)</b></p>

62、<p>  市場上購買的相機一般不提供相機的內部參數(shù), 所以當相機用于測量時, 必須進行標定。在本系統(tǒng)中,經過試驗發(fā)現(xiàn)相機的內參對系統(tǒng)測量精度影響不大,所以本系統(tǒng)中只標定了相機的放大倍數(shù)(即被測對象實際大小和它在圖像上大小的關系)。</p><p>  標定方法如下:在實際測量之前,先在測量系統(tǒng)中放置一個標定物D(本系統(tǒng)用的是一個實心立方體),假設它在攝像機1的成像范圍中實際長度是和,而成像的長度為

63、和,所以攝像機1在X,Y方向上的放大倍數(shù)分別為:</p><p><b>  (2.10)</b></p><p><b>  (2.11)</b></p><p>  同理可求,攝像機2的放大倍數(shù)和。</p><p><b>  (2)標定平移矩陣</b></p>

64、<p>  先在圖像上點幾個邊緣點,獲得其圖像坐標值,然后測出其在物理坐標系中的值,放大倍數(shù)已經求出,所以只需把這些坐標點的值帶入式2.8和式2.9中就可求出和的值。</p><p>  2.2.2攝像機的標定過程</p><p>  攝像機的標定是由人機交互的方式完成的,標定由以下幾個步驟完成。</p><p>  (1)點圖2.8中尺寸標定按鈕,物

65、體圖像就出現(xiàn)在界面的第二列中。</p><p><b>  (2)在圖像上取點</b></p><p>  單擊“開始取點”按鈕,使物體的兩幅圖像顯示在界面的第二列中,其中上面的圖像是攝像機1拍攝的,記為圖1,下面的圖像是攝像機2拍攝的,記為圖2。然后操作員在這兩幅圖中用鼠標分別點4個點,這四個點的位置要盡量點在標定物的邊緣上(或是有特征的地方),這樣比較容易測量出這

66、些點對應的實際坐標,并將圖1的4個點A、B、C、D的坐標存在point類型的數(shù)組中,記為point1[4],將圖2的4個點E、F、G、H的坐標值存在存在point類型的數(shù)組中,記為point2[4]。</p><p>  A點坐標存放在point1[0]中,B點坐標存放在point1[1]中,C點坐標存放在point1[2]中,D點坐標存放在point1[3]中。</p><p>  E點

67、坐標存放在point2[0]中,F(xiàn)點坐標存放在point2[1]中,G點坐標存放在point2[2]中,H點坐標存放在point2[3]中。</p><p><b>  (3)坐標轉化</b></p><p>  單擊“停止取點”,數(shù)組point1[4]和數(shù)組point2[4]中存的坐標值是,以窗口左上角為原點的坐標值,point1[4]數(shù)組中的坐標轉化為以圖1中心(

68、01)為原點的坐標值,point1[4]數(shù)組中的坐標轉化為以圖2中心(02)為原點的坐標值。</p><p>  轉化之后的結果,仍然放在point1[4] 數(shù)組和point1[4] 數(shù)組中。</p><p>  (4)求兩個攝像機的放大倍數(shù)</p><p>  兩個攝像機分別有4個放大倍數(shù)需要標定,攝像機1的和和攝像機2的和。</p><p&g

69、t;<b>  (2.12)</b></p><p><b>  (2.13)</b></p><p><b>  (4)求平移向量</b></p><p>  把E、F、G、H的圖像坐標值和物理坐標值以及和的值帶入式2.8中可求出。把A、B、C、D的圖像坐標值和物理坐標值以及和的值帶入式2.9中可求

70、出</p><p>  根據(jù)計算可得到如下的結果:</p><p><b>  (2.14)</b></p><p><b>  (2.15)</b></p><p><b>  2.3圖像的采集</b></p><p>  2.3.1圖像采集的工作過程

71、</p><p>  圖像采集部分是本系統(tǒng)完成后續(xù)圖像處理部分的基礎和保障,正確、實時的采集圖像數(shù)據(jù)是圖像采集部分的關鍵。在本系統(tǒng)中,計算機執(zhí)行抓拍動作是成像區(qū)的限位開關信號被觸發(fā)。其工作原理如下,在圖像成像區(qū)的生產線上安裝了一個限位開關,當生產線上的產品傳輸?shù)匠上駞^(qū)的正中間時,這個限位開關被觸發(fā)。限位開關信號通過輸入輸出卡連接到計算機上,當這個開關被觸發(fā)時,它會給輸入輸出卡一個中斷信號,同時,輸入輸出卡會發(fā)給計

72、算機一個信號,當計算機端檢測到這個信號時,通知視頻采集卡執(zhí)行抓拍動作,并把抓拍到的圖像保存到計算機中等待處理。</p><p>  由于生產線的傳輸速度比較低,而限位開關從觸發(fā)到被計算機響應時間非常短,所以當計算機執(zhí)行抓拍動作時,產品還在成像區(qū)的正中間,基本不會偏離成像區(qū)的中間位置,即使出現(xiàn)了微小的偏離現(xiàn)象,通過多次的實驗知,這個偏離也在系統(tǒng)的誤差范圍內。流程圖如下:</p><p>  

73、圖 2.9 圖像采集流程圖</p><p>  在等待限位開關的信號時,通過PCI-2312型號的16路輸入輸出卡把信號傳輸給計算機。由于本系統(tǒng)用了兩個攝像頭來采集產品的形狀和坐標信息,因此視頻采集卡應至少含有兩路視頻輸入口??紤]到系統(tǒng)以后升級時可能增加攝像頭,需要多預留1-2路視頻輸入口,因此本系統(tǒng)選用了含有4路視頻輸入口的DS-4004HC圖像采集卡。</p><p>  2.3.2

74、 DS-4004HC圖像采集卡</p><p>  本測試系統(tǒng)采用的是??低暪镜腄S-4004HC型號的視頻采集卡,DS-4004HC系列壓縮板卡是??低暤牡谌曇纛l壓縮卡。它采用高可靠性、低功耗的視頻處理器,可用于音視頻數(shù)據(jù)流的實時采集和壓縮編碼。 DS-4004HC型號的采集卡具有以下功能和性能: </p><p>  DS-4004HC支持4路音頻輸入和4路視頻輸入。<

75、/p><p>  DS-4004HC采用DM642—DSP處理器實現(xiàn)對音視頻的實時壓縮。</p><p>  開放的SDK使用戶根據(jù)自己的需要編寫應用軟件。</p><p>  可根據(jù)用戶的需要設置編碼的幀格式、碼率、圖像質量。</p><p>  支持運動檢測、OSD、LOGO和區(qū)域屏蔽以及水印技術。</p><p> 

76、 預覽分辨率和編碼分辨率可達4CIF,進行壓縮不丟幀。</p><p><b>  采集卡如圖所示:</b></p><p>  圖2.10 圖像采集卡</p><p>  2.3.3 PCI-2312光電隔離DI/DO卡</p><p>  PCI-2312是一塊光電隔離輸入輸出板,具有16路開光量隔離輸入和16路開

77、關隔離輸出。主要用于工業(yè)控制及相關領域,它的性能和功能介紹如下:</p><p>  (1)16路開關量輸入通道,16路開關量輸出通道(光電隔離)。</p><p>  (2)輸入輸出信號最高切換頻率10KHz(方波)</p><p>  (3)輸入輸出電壓為5V~24V</p><p>  (4)輸入輸出電壓為5V~24V</p&g

78、t;<p>  (5)工作溫度:-10℃~55℃</p><p>  (6)儲存溫度:-20℃~80℃</p><p>  PCI-2312光電隔離DI/DO卡如圖所示:</p><p>  圖2.11 PCI-2312光電隔離DI/DO卡</p><p>  2.3.4 軟件設計流程</p><p>

79、;  上面介紹了圖像的采集工作過程,下面主要介紹一下利用軟件來設計圖像采集的過程。</p><p>  圖2.12 采集圖像的軟件設計流程</p><p>  初始化是由函數(shù)InitDSPs()函數(shù)完成的。若初始化成功,該函數(shù)返回可用的編碼通道,否則返回零,表示初始化失敗,可能沒有找到相應的DSP模塊,系統(tǒng)退出。</p><p>  若系統(tǒng)初始化完成了,接著判斷該采

80、集卡有幾個可用通道,并打開相應的通道,獲取通道由GetTotalDSPs()函數(shù)完成,打開通道由ChannelOpen(int ChannelNum) 函數(shù)完成,該函數(shù)有一個參數(shù),表示具體的通道號,若打開失敗,直接退出系統(tǒng),若成功,則返回該通道的通道句柄,以后該通道的相關操作都需要該通道句柄。</p><p>  在成功初始化采集卡并打開通道的情況下,接著就設置預覽模式。設置預覽模式由函數(shù)SetPreviewOv

81、erlayMode()完成,返回0表示顯卡支持板卡的Overlay預覽方式,并啟動Overlay預覽模式。Overlay(覆蓋)是一種數(shù)字視頻的顯示技術,它允許數(shù)字信號不經過顯示芯片處理,而直接通過顯存輸出到顯示器屏幕上。Overlay顯示模式最大的用途在于優(yōu)化視頻播放。由于不同的視頻有不同基準色調、亮度、對比度和飽和度,對于不同的電腦、不同的視頻文件,為了獲得最好的顯示效果就需要對各種顯示屬性進行調節(jié),普通顯示模式顯然無法勝任,因而就

82、使用Overlay顯示模式進行單獨調節(jié)。Overlay顯示模式具有速度快、畫質好、占用系統(tǒng)資源少等特點,特別適合于視頻文件的播放。</p><p>  在成功設置預覽模式后就啟動預覽模式,啟動預覽由StartVideoPreview (HANDLE hChannelHandle,HWND WndHandle, RECT *rect,BOOLEAN bOverlay, int VideoFormat, int Fr

83、ameRate) 函數(shù)完成 ,該函數(shù)有六個參數(shù),HANDLE hChannelHandle表示通道句柄,是ChannelOpen()函數(shù)的返回值;HWND WndHandle,顯示窗口句柄;RECT *rect,顯示窗口內的矩形區(qū)域;BOOLEAN bOverlay,是否啟用Overlay預覽模式;* int VideoFormat,視頻預覽格式(目前無效);int FrameRate,視頻預覽幀率(PAL:1-25,NTSC:1-3

84、0)。若函數(shù)成功則返回零,并開始預覽圖像,若失敗則返回相應的錯誤號。 </p><p>  設置完預覽模式后,整個采集卡的配置工作就完成了。接著就等待抓拍信號,觸發(fā)抓拍操作。抓拍過程主要有兩個函數(shù)來完成,int GetOriginalImage(HANDLE hChannelHandle,UCHAR*ImageBuf,ULONG*Size)和int SaveYUVToBmpFile(char *FileNam

85、e, unsigned char *yuv, int Width,int Height);GetOriginalImage()用來獲取原始圖像yuv422格式數(shù)據(jù),其中,HANDLE hChannelHandle表示通道句柄,UCHAR *ImageBuf表示原始yuv422格式圖像指針,ULONG *Size表示原始yuv422格式圖像尺寸,函數(shù)調用前是ImageBuf的大小,調用后是實際圖像所占用的字節(jié)數(shù)。而函數(shù)SaveYUVToB

86、mpFile()完成圖像格式轉換并將圖像數(shù)據(jù)保存到硬盤上。其中char *FileName表示要保存的圖片文件名及路徑,unsigned char *yuv表示yuv422格式圖像指針,int Width表示保存圖像寬度,int Heigh</p><p>  第三章 數(shù)字圖像處理的基本理論</p><p>  本章主要介紹了數(shù)字圖像處理的基本理論,包括數(shù)字圖像處理的基本知識、圖像表示方法

87、之間的轉換、圖像平滑、腐蝕膨脹等基本理論以及圖像處理的工具軟件Matlab的介紹。這些關于數(shù)字圖像的基本理論是后面數(shù)字圖像處理實現(xiàn)過程的理論指導。</p><p>  3.1 數(shù)字圖像處理的基本知識</p><p>  3.1.1 數(shù)字圖像的表示方法</p><p><b>  (1)彩色圖像</b></p><p> 

88、 彩色圖像不僅有亮度信息,還包含顏色信息。彩色的表示方法很多,最常見的是三基色模型,例如RGB(Red/Green/Blue,紅、綠、藍)三基色模型,利用RGB三基色可以混合成任意顏色。因此,RGB模型在各種彩色成像設備和彩色顯示設備中使用,常規(guī)的彩色圖像也都是用RGB三基色來表示的,每個像素包括RGB三基色數(shù)據(jù),每個基色用1個字節(jié)(8位二進制位)表示,則每個像素的數(shù)據(jù)為3個字節(jié)(即24位二進制位),這就是人們常說的24位真彩色。<

89、;/p><p><b>  (2)灰度圖像</b></p><p>  灰度圖像是數(shù)字圖像的最基本形式,灰度圖像可以由黑白照片數(shù)字化得到,或從彩色圖像進行去色處理得到。灰度圖像只表達圖像的亮度信息而沒有顏色信息,因此,灰度圖像的每個像素點上只包含一個量化的灰度級(即灰度值),用來表示該點的亮度水平,并且通常由一個字節(jié)(8個二進制位)來存儲灰度值。</p>&

90、lt;p>  如果灰度值用1個字節(jié)表示,則可以表示的正整數(shù)范圍是0~255,也就是說,像素灰度值取值在0~255之間,灰度級數(shù)為256級。注意到人眼對灰度的分辨能力通常在20~60級,因此,灰度值存儲以字節(jié)為單位既保證了人眼的分辨能力,又符合計算機數(shù)據(jù)尋址的習慣。在特殊應用中,可能需要采用更高的灰度級數(shù),例如CT圖像的灰度級數(shù)高達數(shù)千,需要采用12位或16位二進制位存儲數(shù)據(jù),但這類圖像通常都采用專用的顯示設備和軟件來進行顯示和處理

91、。</p><p><b>  (3)二值圖像</b></p><p>  二值圖像(Binary image)是指每個像素不是黑就是白(即每個像素值只有兩種選擇0或255),其灰度值沒有中間過渡的圖像。其中像素為0代表黑,像素為255代表白。</p><p>  3.1.2數(shù)字圖像的顏色模型</p><p><b

92、>  (1)RGB模型</b></p><p>  RGB模型是最典型最常用的面向硬件設備的彩色模型,它與人的視覺系統(tǒng)結果密切相連。根據(jù)人眼結構,所有顏色都可以看作是三個基本顏色——紅(R,red),綠(G,green)和藍(B,blue)的不同組合。CIE所規(guī)定的紅綠藍這三種基本色的波長分別為700nm,546.1nm,435.8nm。</p><p>  RGB模型可

93、以建立在笛卡爾坐標系統(tǒng)里,其中三個軸分別為R、G、B。如圖4.5所示:</p><p>  圖3.1 RGB彩色模型</p><p>  RGB模型的空間是個正立方體,原點對應黑色,離原點最遠的頂點對應白色。在這個模型中,從黑到白的灰度值分布在從原點到離原點最遠頂點間的連線上,而立方體內其余各點對應不同的顏色,可用從原點到該點的矢量表示。對于一般的RGB分量中的某一分量,其取值范圍為[0,

94、255]。但為方便起見,總將立方體歸一化為單位立方體,這樣所有的R,G,B的值都在區(qū)間[0,1]之中。根據(jù)這個模型,每幅彩色圖像包括三個獨立的基色平面,或者說可以分解到三個平面上。</p><p><b>  (2)HSV模型</b></p><p>  HSV是指Hue(色相)、Saturation(飽和度)和Value(值或明度)。HSV模型的三維表示從RGB立方

95、體演化而來。設想從RGB沿立方體對角線的白色頂點向黑色頂點觀察,就可以看到立方體的六邊形外形。六邊形邊界表示色彩,水平軸表示純度,明度沿垂直軸測量。</p><p>  圖3.2 HSV彩色模型</p><p>  H參數(shù)表示色彩信息,即所處的光譜顏色的位置。該參數(shù)用角度量來表示,紅、綠、藍分別相隔120度?;パa色分別相差180度。純度S為一比例值,范圍從0到1,它表示成所選顏色的純度和該

96、顏色最大的純度之間的比率。S=0時,只有灰度。表示色彩的明亮程度,范圍從0到1。有一點要注意:它和光強度之間并沒有直接的聯(lián)系。</p><p>  圓錐的頂面對應于V=1. 它包含RGB模型中的R=1,G=1,B=1 三個面,所代表的顏色較亮。色彩H由繞V軸的旋轉角給定。紅色對應于角度0°,綠色對應于角度120°,藍色對應于角度240°。在HSV顏色模型中,每一種顏色和它的補色相差1

97、80°。飽和度S取值從0到1,所以圓錐頂面的半徑為1。</p><p>  在圓錐的頂點(即原點)處,V=0,H和S無定義,代表黑色。圓錐的頂面中心處S=0,V=1,H無定義,代表白色。從該點到原點代表亮度漸暗的灰色,即具有不同灰度的灰色。對于這些點,S=0,H的值無定義。可以說,HSV模型中的V軸對應于RGB顏色空間中的主對角線。 在圓錐頂面的圓周上的顏色,V=1,S=1,這種顏色是純色。</p

98、><p><b>  3.2圖像平滑</b></p><p>  圖像平滑主要目的是減少噪聲。圖像中的噪聲種類很多。對圖像信號幅度和相位的影響十分復雜,有些噪聲和圖像信號互相獨立不相關,有些是相關的,噪聲本身之間也有些相關。因此要減少圖像中的噪聲,必須針對具體情況采用不同的方法,否則很難獲得滿意的處理效果。</p><p>  圖像中的噪聲往往和信

99、號交織在一起,尤其是乘性噪聲。如果平滑不當,就會使圖像本身的細節(jié)如邊界輪廓,線條等變得模糊不清,從而使圖像降質;所以圖像平滑過程總是要付出一定的細節(jié)模糊代價。如何既能平滑掉圖像中的噪聲,而又盡量保持圖像細節(jié)即少付出一些細節(jié)模糊代價是圖像平滑研究的主要問題之一。</p><p>  椒鹽噪聲是由圖像傳感器,傳輸信道,解碼處理等產生的黑白相間的亮暗點噪聲。</p><p>  所謂高斯噪聲是指

100、它的概率密度函數(shù)服從高斯分布(即正態(tài)分布)的一類噪聲。</p><p><b>  3.2.1中值濾波</b></p><p>  中值濾波是基于排序統(tǒng)計理論的一種能有效抑制噪聲的非線性信號處理技術,中值濾波的基本原理是把數(shù)字圖像或數(shù)字序列中一點的值用該點的一個鄰域中各點值的中值代替,讓周圍的像素值接近的真實值,從而消除孤立的噪聲點。方法是用某種結構的二維滑動模板,將

101、板內像素按照像素值的大小進行排序,生成單調上升(或下降)的為二維數(shù)據(jù)序列。二維中值濾波輸出為g(x,y)=med{f(x-k,y-l),(k,l∈W)} ,其中,f(x,y),g(x,y)分別為原始圖像和處理后圖像。W為二維模板,通常為2*2,3*3區(qū)域,也可以是不同的的形狀,如線狀,圓形,十字形,圓環(huán)形等。并且中值濾波適合處理椒鹽噪聲(黑白亮點)。</p><p>  由于中值濾波是非線性運算,在輸入和輸出之間

102、的頻率上不存在一一對應關系,故不能用一般線性濾波器頻率特性的研究方法。設G為輸入信號頻譜,F(xiàn)為輸出信號頻譜,定義H=G/F為中值濾波器的頻率響應特性,實現(xiàn)表明H是與G有關,呈不規(guī)則波動不大的曲線,其均值比較平坦,可以認為信號經中值濾波后,傳輸函數(shù)近似為1,即中值濾波對信號的頻域影響不大,頻譜基本不變。</p><p><b>  3.2.2均值濾波</b></p><p&

103、gt;  均值濾波能消除圖像中的高頻分量,對低頻分量沒有影響。均值濾波也稱為線性濾波,均值濾波采用模板計算的思想,模板操作實現(xiàn)一種鄰域運算,即某個像素點的結果不僅與本像素灰度有關,而且與其鄰域點的像素值有關。在實際應用中,要根據(jù)不同的需要選擇使用不同的模板尺寸,如3*3、5*5等。</p><p>  最簡單的均值濾波是將原圖中的一個像素的灰度值和它周圍鄰近8個像素點的灰度值相加,然后將所求的平均值作為新圖中的該

104、像素的灰度值。鄰域平均法用數(shù)學公式表達:</p><p>  設f(i,j)為給定的含有噪聲的圖像,經過鄰域平均法處理后的圖像為g(i,j),則g(i,j)=∑f(i,j)/N,(i,j)∈M,M是所取鄰域內各鄰近像素的坐標,N是鄰域中所包含的臨近像素個數(shù)。與中值濾波相比均值濾波適合處理高斯噪聲(隨機噪聲)。</p><p>  由于本文處理的水杯在圖像的中間位置,不會出現(xiàn)在邊緣上,所以選

105、擇3*3均值濾波和5*5均值濾波。</p><p><b>  3.3圖像銳化</b></p><p>  圖像在平滑處理之后,會出現(xiàn)圖像邊緣和圖像輪廓模糊的情況。為了減少這類不利效果的影響,就需要利用圖像銳化技術,使圖像的邊緣變得清晰。圖像銳化處理的目的是為了使圖像的邊緣、輪廓線以及圖像的細節(jié)變得清晰,經過平滑的圖像變得模糊的根本原因是因為圖像受到了平均或積分運算,

106、因此可以對其進行逆運算(如微分運算)就可以使圖像變得清晰。從頻率域來考慮,圖像模糊的實質是因為其高頻分量被衰減,因此可以用高通濾波器來使圖像清晰。但要注意能夠進行銳化處理的圖像必須有較高的性噪比,否則銳化后圖像性噪比反而更低,從而使得噪聲增加的比信號還要多,因此一般是先去除或減輕噪聲后再進行銳化處理。</p><p>  3.3.1一階微分運算</p><p>  一階微分主要指梯度模運算

107、,圖像的梯度模值包含了邊界及細節(jié)信息。梯度模算子用于計算梯度模值,通常認為它是邊界提取算子,具有極值性、位移不變性和旋轉不變性。</p><p>  圖像在點處的梯度定義為一個二維列矢量:</p><p><b> ?。?-1)</b></p><p>  梯度的幅值即模值,為:</p><p><b>  (

108、3-2)</b></p><p>  梯度的方向在最大變化率方向上,方向角可表示為:</p><p>  (3-3) </p><p>  對于離散函數(shù),也有相應的概念和公式,只是用差分代替微分。差分可取為后向差分,前向差分或前向差分。</p><p>  在x,y方向上的一階后向差分分別定義為:</p&g

109、t;<p><b>  (3-4)</b></p><p><b>  (3-5)</b></p><p><b>  梯度定義為:</b></p><p><b>  (3-6)</b></p><p><b>  其模和方向分別

110、為:</b></p><p><b>  (3-7)</b></p><p><b>  (3-8)</b></p><p>  在不引起歧義時,為了方便,一般將梯度矢量的模值簡稱為梯度。實用中,梯度模還有很多近似式,此處不加列舉。</p><p>  3.3.2基于拉氏算子的圖像銳化原

111、理</p><p>  拉普拉斯算子是最簡單的各向同性微分算子,具有旋轉不變性,比較適用于改善因為光線的漫反射造成的圖像模糊[]。其原理是,在攝像記錄圖像的過程中,光點將光漫反射到其周圍區(qū)域,這個過程滿足擴散方程:</p><p><b>  (3-9) </b></p><p>  經過推導,可以發(fā)現(xiàn)當圖像的模糊是由光的漫反射造成時,不模糊

112、圖像等于模糊圖像減去它的拉普拉斯變換的常數(shù)倍。另外,人們還發(fā)現(xiàn),即使模糊不是由于光的漫反射造成的,對圖像進行拉普拉斯變換也可以使圖像更清晰[]。</p><p>  拉普拉斯銳化的一維處理表達式是:</p><p><b>  (3-10)</b></p><p>  在二維情況下,拉普拉斯算子使走向不同的輪廓能夠在垂直的方向上具有類似于一維那

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論