畢業(yè)論文--圖像二值化中閾值選取方法的研究_第1頁
已閱讀1頁,還剩39頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、<p><b>  畢 業(yè) 論 文</b></p><p>  2013 年 4 月</p><p> 題 目圖像二值化中閾值選取方法的研究</p><p><b>  摘要</b></p><p>  在人類獲取的信息中,視覺信息約占60%,聽覺約占20%,其它約占20%。由此

2、可見,視覺信息對人類非常重要。同時,圖像是人類獲取視覺信息的主要途徑。圖像二值化是圖像預處理中的一項重要技術(shù),在模式識別、光學字符識別、醫(yī)學成像等方面都有重要應用。</p><p>  論文介紹了圖像及數(shù)字圖像處理技術(shù)的一些概念和相關知識,對Matlab7.0 軟件的發(fā)展和軟件在圖像處理中的應用做了簡要介紹,還介紹了灰度圖像二值化方法以及利用Matlab7.0軟件工具進行算法的實現(xiàn)。</p><

3、;p>  課題重點實現(xiàn)了圖像分割技術(shù)中灰度圖像二值化方法,如Otsu算法、Bernsen算法,并對這些算法運行的實驗結(jié)果進行分析與比較。</p><p>  關鍵詞:圖像處理,二值化,Matlab,Otsu算法,Bernsen算法</p><p><b>  Abstract</b></p><p>  Human beings obta

4、in a lot of information, among which the visual information is about 60%, the sense of hearing about 20%, and others about 20%. Therefore, the visual information is very important for human beings. Moreover, the images a

5、re the primary way, by which a lot of information is obtained. Image binarization, as an important technology in image pre-processing, is widely-employed in pattern recognition, optical character recognition, medical ima

6、ging and so forth. </p><p>  In this paper, some notions and relative knowledge in digital image processing technology are introduced; then, the development of Matlab7.0 and its application in image processi

7、ng briefly introduced; in addition, the method of grayscale image binarization and how to implement these algorithms based on Matlab7.0 are presented. This paper mainly implements the grayscale image binarization method

8、in image segmentation technology, such as Otsu algorithm and Bernsen algorithm, and analyzes and compa</p><p>  Key words: Image processing, Binarization, Matlab, Otsu algorithm, Bernsen algorithm</p>

9、<p><b>  目 錄</b></p><p><b>  摘要I</b></p><p>  AbstractII</p><p><b>  目 錄III</b></p><p>  第一章 緒 論1</p><p>  1

10、.1 圖像與數(shù)字圖像1</p><p>  1.2 數(shù)字圖像處理技術(shù)內(nèi)容與發(fā)展現(xiàn)狀2</p><p>  1.3 灰度圖像二值化原理及意義5</p><p>  第二章 軟件工具——MATLAB6</p><p>  2.1 MATLAB概述6</p><p>  2.2 MATLAB的工作環(huán)境6</

11、p><p>  2.3 MATLAB圖像處理工具箱8</p><p>  2.4 工具箱實現(xiàn)的常用功能9</p><p>  第三章 圖像二值化方法11</p><p>  3.1 課題研究對象11</p><p>  3.2 二值化方法研究動態(tài)14</p><p>  3.3 全局閾值法

12、18</p><p>  3.4 局部閾值法19</p><p>  第四章 Otsu方法和Bernsen方法20</p><p>  4.1 Otsu算法分析20</p><p>  4.2 Otsu方法流程圖22</p><p>  4.3 Bernsen算法分析23</p><p&

13、gt;  4.4 Bernsen方法流程圖23</p><p>  第五章 Otsu方法和Bernsen方法實驗比較25</p><p>  5.1 Otsu方法實驗結(jié)果分析25</p><p>  5.2 Bernsen方法實驗結(jié)果分析27</p><p>  5.3 0tsu方法和Bernsen方法實驗結(jié)果比較29</p&

14、gt;<p><b>  5.4 結(jié)論30</b></p><p><b>  參考文獻31</b></p><p><b>  致謝31</b></p><p><b>  第一章 緒 論</b></p><p>  1.1 圖像與

15、數(shù)字圖像</p><p>  圖像就是用各種觀測系統(tǒng)觀測客觀世界獲得的且可以直接或間接作用與人眼而產(chǎn)生視覺的實體。視覺是人類從大自然中獲取信息的最主要的手段。據(jù)統(tǒng)計,在人類獲取的信息中,視覺信息約占60%,聽覺信息約占20%,其他方式加起來才約占20%。由此可見,視覺信息對人類非常重要。同時,圖像又是人類獲取視覺信息的主要途徑,是人類能體驗的最重要、最豐富、信息量最大的信息源。 </p><

16、p>  通常,客觀事物在空間上都是三維的(3D)的,但是從客觀景物獲得的圖像卻是屬于二維(2D)平面的。</p><p>  圖像存在方式多種多樣,可以是可視的或者非可視的,抽象的或者實際的,適于計算機處理的和不適于計算機處理的。但就其本質(zhì)來說,可以將圖像分為以下兩大類。</p><p>  模擬圖像。包括光學圖像、照相圖像、電視圖像等。比如人在顯微鏡下看到的圖像就是一幅光學模擬圖像

17、。對模擬圖像的處理速度快,但精度和靈活性差,不易查找和判斷。</p><p>  數(shù)字圖像。數(shù)字圖像是將連續(xù)的模擬圖像經(jīng)過離散化處理后得到的計算機能夠辨識的點陣圖像。在嚴格意義上講,數(shù)字圖像是經(jīng)過等距離矩形網(wǎng)格采樣,對幅度進行等間隔量化的二維函數(shù)。因此,數(shù)字圖像實際上就是被量化的二維采樣數(shù)組。</p><p>  一幅數(shù)字圖像都是由若干個數(shù)據(jù)點組成的,每個數(shù)據(jù)點稱為像素(pixel)。比如

18、一幅128×400,就是指該圖像是由水平方向上128列像素和垂直方向上400行像素組成的矩形圖。每一個像素具有自己的屬性,如顏色(color)、灰度(gray scale)等,顏色和灰度是決定一幅圖像表現(xiàn)的關鍵因素。其中顏色量化等級包括單色、四色、16色、128色、24位真彩色等,量化等級越高,則量化誤差越小,圖像的顏色表現(xiàn)力越強。同樣,灰度是單色圖像中像素亮度的表征,量化等級越高,表現(xiàn)力越強。但是隨著量化等級的增加,數(shù)據(jù)量將

19、大大增加,使得圖像處理的計算量和復雜度相應的增加。</p><p>  與模擬圖像相比,數(shù)字圖像具有以下顯著優(yōu)點:</p><p>  精度高。目前的計算機技術(shù)可以將一幅模擬圖像數(shù)字化為任意的二維數(shù)組,即數(shù)字圖像可以由無限個像素組成,每個像素的亮度可以量化為12位(即4096個灰度級),這樣的精度是數(shù)字圖像處理與彩色照片的效果相差無幾。</p><p>  處理方便

20、。數(shù)字圖像在本質(zhì)上是一組數(shù)據(jù),所以可以用計算機對他進行任意方式的修改,如放大、縮小、改變顏色、復制和刪除某一部分等。</p><p>  重復性好。模擬圖像,如照片,即便是使用非常好的底片和相紙,也會隨著時間的流逝而褪色、發(fā)黃,而數(shù)字圖像可以存儲在光盤中,上百年后再用計算機重現(xiàn)也不會有絲毫的改變。</p><p>  1.2 數(shù)字圖像處理技術(shù)內(nèi)容與發(fā)展現(xiàn)狀</p><p

21、>  數(shù)字圖像處理就是采用一定的算法對數(shù)字圖像進行處理,以獲得人眼視覺或者某種接受系統(tǒng)所需要的圖像處理過程。圖像處理的基礎是數(shù)字,主要任務是進行各種算法設計和算法實現(xiàn)。</p><p>  目前,圖像處理技術(shù)已經(jīng)在許多不同的應用領域中得到重視,并取得了巨大成就。根據(jù)應用領域要求的不同,數(shù)字圖像處理技術(shù)可以分為許多分支技術(shù)。重要的分支技術(shù)有:</p><p>  圖像變換。圖像陣列很大

22、時,若直接在空域中處理,計算量將很大。為此,通常采用各種圖像變換方法,如傅立葉變換、沃爾什變換、離散余弦變換、小波變換等間接處理技術(shù),將空域處理轉(zhuǎn)換到變換域處理,這樣可以有效地減少計算量,提高處理性能。</p><p>  圖像增強與復原。主要目的是增強圖像中的有用信息,削弱干擾和噪聲,使圖像更加清晰,或者將其轉(zhuǎn)換為更適合人或機器分析的形式。圖像增強并不是要求真實地反映原始圖像,而圖像復原則要求盡量消除或減少獲取

23、圖像過程中所產(chǎn)生的某些退化,使圖像能夠反映原始圖像的真實面貌。</p><p>  圖像壓縮編碼。在滿足一定保真度條件下,對圖像信息進行編碼,可以壓縮圖像信息量,簡化圖像的邊式,從而大大壓縮圖像描述的數(shù)據(jù)量,以便存儲和傳輸;圖像壓縮在不同應用背景下可以采用不失真壓縮和失真壓縮。</p><p>  圖像分割。圖像分割是數(shù)字圖像處理中的關鍵技術(shù)之一,是為了將圖像中有意義的特征提取出來。它是進

24、一步進行圖像識別、分析和理解的基礎。圖像的有意義特征包括圖像的邊緣、區(qū)域等。</p><p>  圖像分析。對圖像中的不同對象進行分割、分類、識別、描述和解釋。</p><p>  圖像識別。圖像識別屬于模式識別的范疇,其主要內(nèi)容是在圖像經(jīng)過某些預處理(增強、復原、壓縮)后,進行圖像分割和提取,從而進行判別分類。圖像分類常用的經(jīng)典識別方法有統(tǒng)計模式分類和句法模式分類。近年來,新發(fā)展起來的模

25、糊模式識別和人工神經(jīng)網(wǎng)絡模式分類在圖像識別中越來越受到重視。</p><p>  圖像隱藏。是指媒體信息的相互隱藏,常見的有數(shù)字水印和圖像的信息偽裝等。</p><p>  以上圖像處理內(nèi)容也并非孤立存在的,往往相互聯(lián)系,而一個實用的圖像處理系統(tǒng)通常需要將幾種圖像處理技術(shù)結(jié)合起來,才能得到所需要的結(jié)果。例如,圖像變換是圖像編碼技術(shù)的基礎,而圖像增強與復原一般又是圖像處理的最終目的,也可以作

26、為進一步圖像處理工作的準備;通過圖像分割得到的圖像特征既可以作為最后結(jié)果,也可以作為下一步圖像分析的基礎。</p><p>  不同的圖像處理技術(shù)應用與不同的領域,發(fā)展出不同的分支學科,如遙感圖像處理、醫(yī)學圖像處理等,其他如計算機圖形學、模式識別、人工智能和機器人視覺等學科領域也與圖像處理有著密切的關系。</p><p>  圖像處理技術(shù)的發(fā)展大致經(jīng)歷了初創(chuàng)期、發(fā)展期、普及期和實用化期4個

27、階段。初創(chuàng)期開始于20世紀60年代,當時的圖像采用像素型光柵進行少秒顯示,大多采用中、大型機對其處理。在這一時期,由于圖像存儲成本高、處理設備昂貴,其應用面很窄。進入20世紀70年代的發(fā)展期,開始大量采用中、小型機進行處理,圖像處理也逐漸改用光柵掃描方式,特別是CT和衛(wèi)星遙感圖像的出現(xiàn),對圖像處理技術(shù)的發(fā)展起到了很好的推動作用。到了20世紀80年代,圖像處理技術(shù)進入普及期,此時的微機已經(jīng)能夠擔當起圖形圖像處理的任務。超大規(guī)模集成電路(V

28、ery Large Scale Integration, VLSI)的出現(xiàn)更使處理速度大大提高,設備造價也進一步降低,極大地促進了圖形圖像系統(tǒng)的普及和應用。20世紀90年代是圖像處理技術(shù)的實用化時期,圖像處理的信息量巨大,對處理速度的要求極高。</p><p>  針對現(xiàn)有的實際應用,數(shù)字圖像處理具有以下特點。</p><p>  信息量大,要求處理速度比較快。目前,數(shù)字圖像處理的信息大多

29、是二維信息,處理信息量很大。比如一幅128×128低分辨率的黑白圖像,要求64Kbit的數(shù)據(jù)量;對高分辨率彩色512×512圖像,則要求128Kbit數(shù)據(jù)量;如果要處理30幀/s的視頻圖像,則每秒要求處理500Kbit~22.5Mbit數(shù)據(jù)量。因此對計算機的計算速度、存儲容量等要求較高。</p><p>  占用頻帶較寬。與語音信息相比,數(shù)字圖像占用的頻帶要大幾個數(shù)量級。如電視圖像的帶寬約56

30、MHz,而語音帶寬僅為4KHz左右。所以數(shù)字圖像在成像、傳輸、存儲、處理、顯示等各個環(huán)節(jié)的實現(xiàn)上,技術(shù)難度較大,成本高,且對頻帶壓縮技術(shù)提出了更高的要求。</p><p>  數(shù)字圖像中各個像素間的相關性強,壓縮潛力大。在圖像畫面上,經(jīng)常有很多像素有相同或接近的灰度。就電視畫面而言,同一行中相鄰兩個像素或相鄰兩行間的像素,其相關系數(shù)可達0.9以上。一般而言,相鄰兩幀之間的相關性比幀內(nèi)相關性還要大。</p&g

31、t;<p>  圖像質(zhì)量評價受主觀因素影響。數(shù)字圖像處理后的圖像一般需要給人觀察和評價,而人的視覺系統(tǒng)很復雜,受環(huán)境條件、視覺性能、人的情緒、愛好以及知識狀況影響很大,因此評價結(jié)果受人的主觀因素影響較大。為此,如何客觀評價圖像質(zhì)量還有待進一步深入的研究。另外,計算機視覺是模仿人的視覺,人類的感知原理必然嚴重影響計算機視覺的研究。</p><p>  圖像處理技術(shù)綜合性強。數(shù)字圖像處理技術(shù)中設計的基礎

32、知識和專業(yè)技術(shù)相當廣泛,通常涉及通信技術(shù)、計算機技術(shù)、電子技術(shù)、電視技術(shù)以及更多的數(shù)學、物理等方面的基礎知識。例如,圖像編碼的理論基礎是信息論和抽象數(shù)學的結(jié)合,而圖像識別則需要掌握隨機過程和信號處理方面的知識。此外,不少課題還需要更加專業(yè)的知識,如小波變換、神經(jīng)網(wǎng)絡、分形理論等。</p><p>  另外,圖像處理是一門應用性很強的學問,必須與計算機技術(shù)的發(fā)展相適應。隨著電子技術(shù)和計算機技術(shù)的不斷提高和普及,數(shù)字

33、圖像處理技術(shù)進入高速發(fā)展時期。</p><p>  1.3 灰度圖像二值化原理及意義</p><p>  灰度圖像是指只含亮度信息,不含色彩信息的圖像。將彩色圖像轉(zhuǎn)化成為灰度圖像的過程稱為圖像的灰度化處理。彩色圖像中的每個像素的顏色有R、G、B三個分量決定,而每個分量有255種值可取,這樣一個像素點可以有1600多萬的顏色的變化范圍。而灰度圖像是R、G、B三個分量相同的一種特殊的彩色圖像,

34、一個像素點的變化范圍為255種,所以在數(shù)字圖像處理中一般先將各種格式的圖像轉(zhuǎn)變成灰度圖像以使后續(xù)的圖像的計算量變得少一些?;叶葓D像的描述與彩色圖像一樣仍然反映了整幅圖像的整體和局部的色度和亮度等級的分布和特征。圖像的灰度化處理可先求出每個像素點的R、G、B三個分量的平均值,然后將這個平均值賦予給這個像素的三個分量。</p><p>  圖像的二值化處理就是將圖像上的點的灰度置為0或1,也就是使整個圖像呈現(xiàn)出明顯的

35、黑白效果。即將128個亮度等級的灰度圖像通過適當?shù)拈撝颠x取而獲得仍然可以反映圖像整體和局部特征的二值化圖像。</p><p>  在數(shù)字圖像處理中,二值化圖像占有非常重要的地位,特別是在實用的圖像處理中,以二值圖像處理實現(xiàn)而構(gòu)成的系統(tǒng)是很多的,要進行二值圖像的處理與分析,首先要把灰度圖像二值化,得到二值化圖像,這樣子有利于再對圖像做進一步處理時,圖像的集合性質(zhì)只與像素的值為0或1的點的位置有關,不再涉及像素的多級

36、值,使處理變得簡單,而且數(shù)據(jù)的處理和壓縮量小。二值圖像在圖像分析中應用非常廣泛,二值圖像就是指只有兩個灰度級的圖像,二值圖像具有存儲空間小,處理速度快,可以方便地對圖像進行布爾邏輯運算等特點。更重要的是,在二值圖像的基礎上,還可以進一步對圖像處理,獲得該圖像的一些幾何特征或者其他更多特征。</p><p>  第二章 軟件工具——MATLAB</p><p>  2.1 MATLAB概述&

37、lt;/p><p>  MATLAB是Matrix Laboratory的縮寫,是由美國MathWorks公司推出的計算機軟件,經(jīng)過多年的逐步發(fā)展與不斷完善,現(xiàn)已成為國際公認的最優(yōu)秀的科學計算與數(shù)學應用軟件之一,是近幾年來在國內(nèi)外廣泛流行的一種可視化科學計算軟件。它集數(shù)值分析,矩陣運算,信號處理和圖形顯示于一體,構(gòu)成了一個方便的,界面友好的用戶環(huán)境,而且還具有可擴展性特征。</p><p> 

38、 MathWorks公司針對不同領域的應用,推出了信號處理,控制系統(tǒng),神經(jīng)網(wǎng)絡,圖像處理,小波分析,魯棒控制,非線性系統(tǒng)控制設計,系統(tǒng)辨識,優(yōu)化設計,統(tǒng)計分析等30多個具有專門功能的工具箱,這些工具箱是由該領域內(nèi)的學術(shù)水平較高的專家編寫的,無需用戶自己編寫所用的專業(yè)基礎程序,可直接對工具箱進行運用。同時,工具箱內(nèi)的函數(shù)源程序也是開放性的,多為M文件,用戶可以查看這些文件的代碼并進行更改,MALAB支持用戶對其函數(shù)進行二次開發(fā),用戶的應用

39、程序也可以作為新的函數(shù)添加到相應的工具箱中。</p><p>  MATLAB中的數(shù)字圖像是以矩陣形式表示的,這意味著MATLAB強大的矩陣運算能力用于圖像處理非常有利,矩陣運算的語法對MATLAB中的數(shù)字圖像同樣適用。</p><p>  2.2 MATLAB的工作環(huán)境</p><p>  MATLAB的工作環(huán)境簡單明了,易于操作,使用的MATLAB軟件一般是6.

40、x版本。其工作環(huán)境包括五個部分:命令窗口(Command Window),MATLAB的主窗口用戶可以直接在此窗口輸入命令,系統(tǒng)將自動顯示信息;啟動平臺(Launch Pad),當用戶需要啟動某個工具箱的應用程序時,可以在啟動平臺中實現(xiàn)。工作空間(Workspace),MATLAB工作空間作為一個獨立的窗口,其操作相當方便。它包含著用戶已建立的變量,而且變量在工作空間中是以矩陣的形式存儲;命令歷史記錄(Command History),

41、主要顯示在命令中已執(zhí)行過的命令;當前路徑窗口(Current Directory),主要顯示當前工作在什么路徑下進行,包括M文件的打開路徑,雙擊M文件名打開該文件進行編輯。如圖2.1所示。</p><p>  圖2.1 MATLAB6.X</p><p>  論文中使用的MATLAB軟件為7.0版本,如圖2.2所示。</p><p>  圖2.2 MATLAB7.0

42、</p><p>  MATLAB7.0針對編程環(huán)境、代碼效率、數(shù)據(jù)可視化、數(shù)學計算、文件I/O操作等方面都有進行不斷升級、增加了新功能。為此、相對于以前的版本,也具有一些新的特性。就其開發(fā)環(huán)境方面來說:</p><p>  重新設計的桌面環(huán)境,針對多文檔界面提供了簡便的管理和訪問方法,允許用戶自定義桌面外貌,創(chuàng)建常用命令的快捷方式。</p><p>  增強數(shù)組編

43、輯器(Array Editor)和工作空間瀏覽器(Workspace Browser)功能,用于數(shù)據(jù)的顯示、編輯和處理。</p><p>  在當前目錄瀏覽器(Current Directory Browser)工具中,增加了代碼效率分析、覆蓋度的分析等功能。</p><p>  增加了M-Lint編碼分析,能輔助用戶完成程序性能分析,提高程序執(zhí)行效率。</p><p&

44、gt;  對M文件編輯器(M-Editor)進行了功能增強,可以支持多種格式的源代碼文件可視化編輯,如C/C++、HTML、Java等。</p><p>  2.3 MATLAB圖像處理工具箱</p><p>  數(shù)字圖像處理工具箱函數(shù)包括以下15類:</p><p>  (1) 圖像顯示函數(shù);</p><p>  (2) 圖像文件輸入、輸出

45、函數(shù);</p><p>  (3) 圖像幾何操作函數(shù);</p><p>  (4) 圖像像素值及統(tǒng)計函數(shù);</p><p>  (5) 圖像分析函數(shù);</p><p>  (6) 圖像增強函數(shù);</p><p>  (7) 線性濾波函數(shù);</p><p>  (8) 二維線性濾波器設計函數(shù);&l

46、t;/p><p>  (9) 圖像變換函數(shù);</p><p>  (10) 圖像鄰域及塊操作函數(shù);</p><p>  (11) 二值圖像操作函數(shù);</p><p>  (12) 基于區(qū)域的圖像處理函數(shù);</p><p>  (13) 顏色圖操作函數(shù);</p><p>  (14) 顏色空間轉(zhuǎn)換函數(shù)

47、;</p><p>  (15) 圖像類型和類型轉(zhuǎn)換函數(shù)。</p><p>  MATLAB圖像處理工具箱支持四種圖像類型,分別為真彩色圖像、索引圖像、灰度圖像、二值圖像,由于有的函數(shù)對圖像類型有限制,這四種類型可以用工具箱的類型轉(zhuǎn)換函數(shù)相互轉(zhuǎn)換。MATLAB可操作的圖像文件包括BMP、HDF、JPEG、PCX、TIFF、XWD等格式。</p><p>  2.4

48、工具箱實現(xiàn)的常用功能</p><p>  就圖像處理的基本過程討論工具箱所實現(xiàn)的常用功能。</p><p><b>  常用圖像操作:</b></p><p>  圖像的讀寫與顯示操作:用imread()讀取圖像,imwrite()輸出圖像,把圖像顯示于屏幕有imshow(),image()等函數(shù)。imcrop()對圖像進行剪裁,圖像的插值縮放

49、可用imresize()函數(shù)實現(xiàn),旋轉(zhuǎn)用imrotate()實現(xiàn)。</p><p><b>  圖像增強功能:</b></p><p>  圖像增強是數(shù)字圖像處理過程中常用的一種方法,目的是采用一系列技術(shù)去改善圖像的視覺效果或?qū)D像轉(zhuǎn)換成一種更適合于人眼觀察和機器自動分析的形式。常用的圖像增強方法有以下幾種:</p><p>  灰度直方圖均衡

50、化。均勻量化的自然圖像的灰度直方圖通常在低灰度區(qū)間上頻率較大,低的圖像中較暗區(qū)域中細節(jié)看不清楚,采用直方圖修整可使原圖灰度集中的區(qū)域拉開或使灰度分布均勻,從而增大反差,使圖像的細節(jié)清晰,達到增強目的。直方圖均衡化可用histeq()函數(shù)實現(xiàn)。 </p><p>  灰度變換法。照片或電子方法得到的圖像,常表現(xiàn)出低對比度即整個圖像較亮或較暗,為此需要對圖像中的每一像素的灰度級進行標度變換,擴大圖像灰度范圍,以達到改

51、善圖像質(zhì)量的目的。這一灰度調(diào)整過程可用imadjust()函數(shù)實現(xiàn)</p><p>  平滑與銳化濾波。平滑技術(shù)用于平滑圖像中的噪聲,基本采用在空間域上的求平均值或中值,或在頻域上采取低通濾波。因在灰度連續(xù)變化的圖像中,我們通常認為與相鄰像素灰度相差很大的突變點為噪聲點,灰度突變代表了一種高頻分量,低通濾波則可以削弱圖像的高頻成分,平滑了圖像信號,但也可能使圖像目標區(qū)域的邊界變得模糊。而銳化技術(shù)采用的是頻域上的高

52、通濾波方法,通過增強高頻成分而減少圖像中的模糊,特別是模糊的邊緣部分得到了增強,但同時也放大了圖像的噪聲。在MATLAB中,各種濾波方法都是在空間域中通過不同的軍紀模板即濾波算子實現(xiàn),可用fspecial()函數(shù)創(chuàng)建預定義的濾波算子,然后用filter2()或conv2()函數(shù)在實現(xiàn)卷積運算的基礎上進行濾波。</p><p>  邊緣檢測和圖像分割功能</p><p>  邊緣檢測是一種重

53、要的區(qū)域處理方法,邊緣是所要提取目標和背景的分界線,提取出邊緣才能將目標和背景區(qū)分開來。如果一個像素落在邊界上,那么它的鄰域?qū)⒊蔀橐粋€灰度級變化的帶。對這種變化最有用的兩個特征就是灰度的變化率和方向。邊緣檢測算子可以檢查每個像素的鄰域并對灰度變化率進行量化,也包括對方向的確定,其中大多數(shù)是基于方向倒數(shù)掩模求卷積的方法。</p><p>  MATLAB工具箱提供的edge()函數(shù)可針對sobel算子、prewit

54、t算子、Roberts算子、log算子和canny算子實現(xiàn)邊緣檢測的功能?;诨叶鹊膱D像分割方法也可以用簡單的MATLAB代碼實現(xiàn)。</p><p><b>  圖像變換功能</b></p><p>  圖像變換技術(shù)是圖像處理的重要工具,常運用于圖像壓縮、濾波、編碼和后續(xù)的特征抽取或信息分析過程。MATLAB工具箱提供了常用的變換函數(shù),如fft2()與ifft2()函

55、數(shù)分別實現(xiàn)二維快速傅立葉變換與其逆變換,dct2()與idct2()函數(shù)實現(xiàn)二維離散余弦變換與其逆變換,Radon()與iradon()函數(shù)實現(xiàn)Radon變換與逆Radon變換。</p><p>  除以上基本圖像處理功能,MATLAB還提供了如二值圖像的膨脹運算dilate()函數(shù)、腐蝕運算erode()函數(shù)等基本數(shù)學形態(tài)學與二值圖像的操作函數(shù)。</p><p>  第三章 圖像二值化方

56、法</p><p>  3.1 課題研究對象</p><p>  論文主要研究BMP格式的灰度圖像文件。BMP(Bitmap Picture)文件格式是Windows系統(tǒng)交換圖形、圖像數(shù)據(jù)的一種標準格式。BMP圖像的數(shù)據(jù)由四個部分組成,如表3.1所示。</p><p>  表3.1 BMP圖像文件結(jié)構(gòu)</p><p>  第一部分為位圖文件頭

57、BITMAPFILEHEADER,它是個結(jié)構(gòu)體,其定義如下:</p><p>  typedef struct tagBITMAPFILEHEADER { </p><p>  WORD bfType;</p><p>  DWORD bfSize;</p><p>  WORD bfReserved1;</p>&

58、lt;p>  WORD bfReserved2;</p><p>  DWORD bfOffBits;</p><p>  } BITMAPFILEHEADER;</p><p>  這個結(jié)構(gòu)的長度是固定的,為14個字節(jié)(WORD為無符號16位二進制整數(shù),DWORD為無符號32位二進制整數(shù))。</p><p>  第二部分為位圖信

59、息頭BITMAPINFOHEADER,也是一個結(jié)構(gòu),其定義如下: </p><p>  typedef struct tagBITMAPINFOHEADER { </p><p>  DWORD biSize; </p><p>  LONG biWidth;</p><p>  LONG biHeight; </p>

60、<p>  WORDbiPlanes;</p><p>  WORD biBitCount; </p><p>  DWORD biCompression; </p><p>  DWORDbiSizeImage;</p><p>  LONG biXPelsPerMeter;</p><p>

61、;  LONG biYPelsPerMeter;</p><p>  DWORD biClrUsed;</p><p>  DWORD biClrImportant;</p><p>  } BITMAPINFOHEADER;</p><p>  這個結(jié)構(gòu)的長度是固定的,為40個字節(jié)(LONG為32位二進制整數(shù))。其中,biCompr

62、ession的有效值為BI_RGB、BI_RLE8、BI_RLE4、BI_BITFIELDS,這都是一些Windows定義好的常量。由于RLE4和RLE8的壓縮格式用的不多,一般僅討論biCompression的有效值為BI_RGB,即不壓縮的情況。</p><p>  第三部分為調(diào)色板(Palette),當然,這里是對那些需要調(diào)色板的位圖文件而言的。真彩色圖像是不需要調(diào)色板的,BITMAPINFOHEADER后

63、直接是位圖數(shù)據(jù)。調(diào)色板實際上是一個數(shù)組,共有biClrUsed個元素(如果該值為零,則有2的biBitCount次方個元素)。數(shù)組中每個元素的類型是一個RGBQUAD結(jié)構(gòu),占4個字節(jié),其定義如下:</p><p>  typedef struct tagRGBQUAD { </p><p>  BYTE rgbBlue;</p><p>  BYTE

64、rgbGreen;</p><p>  BYTE rgbRed;</p><p>  BYTE rgbReserved;</p><p>  } RGBQUAD;</p><p>  第四部分就是實際的圖像數(shù)據(jù)。對于用到調(diào)色板的位圖,圖像數(shù)據(jù)就是該像素顏色在調(diào)色板中的索引值,對于真彩色圖像,圖像數(shù)據(jù)就是實際的R、G、B值。下面

65、就2色、16色、128色和真彩色位圖分別介紹。</p><p>  對于2色位圖,用1位就可以表示該像素的顏色(一般0表示黑色,1表示白色),所以一個字節(jié)可以表示8個像素。對于16色位圖,用4位就可以表示一個像素的顏色,所以一個字節(jié)可以表示2個像素。對于128色位圖,一個字節(jié)剛好可以表示1個像素。</p><p>  下面有兩點值得注意:</p><p>  (1)

66、 每一行的字節(jié)數(shù)必須是4的整倍數(shù),如果不是,則需要補齊。</p><p>  (2) BMP文件的數(shù)據(jù)存放是從下到上,從左到右的,也就是說,從文件中最先讀到的是圖像最下面的一行的左邊的第一個像素,然后是左邊的第二個像素,接下來是倒數(shù)第二行左邊第一個像素,左邊第二個像素。依次類推,最后得到的是最上面的最右邊的一個像素。</p><p>  DIB(Device Independent Bit

67、map)圖像格式是設備無關位圖文件,描述圖像能力基本與BMP相同,并且能夠運行多種硬件平臺,只是文件格式較大。</p><p>  3.2 二值化方法研究動態(tài)</p><p>  作為一種高效智能的人機交互手段,身份證的快速識別技術(shù)可以廣泛的應用于公民身份核查、暫住人口調(diào)查、旅店業(yè)登記核查、罪犯追逃等公安業(yè)務當中,大大提高了工作人員的錄入速度,減少了用戶的等待時間,提高了工作效率。由于身份

68、證圖像背景復雜,由激光防偽陰影網(wǎng)格線及各種版面噪聲構(gòu)成;且因激光防偽標志和打印條件的千差萬別,再加上身份證圖像質(zhì)量偏差,給身份證的字符識別帶來了很大的困難。必須經(jīng)過預處理,除去大量的噪聲信號,才能更好的進行字符的定位、分割,以及識別。而二值化是預處理中非常重要的一步,也是最為關鍵的一步,它直接影響到OCR 系統(tǒng)的性能。研究者在分析和討論了多種圖像二值化的優(yōu)缺點后,在吸取各種方法優(yōu)點的基礎上,提出了一種新的身份證掃描圖像的二值化方法——嵌

69、入式多閾值動態(tài)自適應的二值化方法。</p><p>  圖像二值化是圖像處理中的一項基本技術(shù),也是很多圖像處理技術(shù)的預處理過程。在顆粒分析、模式識別技術(shù)、光學字符識別(OCR)、醫(yī)學數(shù)據(jù)可視化中的切片配準等應用中,圖像二值化是它們進行數(shù)據(jù)預處理的重要技術(shù)。由于圖像二值化過程將會損失原圖像的許多有用信息,因此在進行二值化預處理過程中,能否保留原圖的主要特征非常關鍵。在不同的應用中,圖像二值化時閾值的選擇是不同的。因

70、此,自適應圖像閾值的選取方法非常值得研究。研究者對圖像二值化方法進行了討論,在此基礎上提出了一個新的圖像二值化算法。該算法基于數(shù)學形態(tài)學理論,較好地保留了圖像二值化時原圖的邊緣特征。</p><p>  激光雕刻中圖像處理的二值化處理激光雕刻是近十幾年隨著激光技術(shù)的發(fā)展而產(chǎn)生的一種新的雕刻技術(shù),它與計算機圖形學、圖像處理等學科的結(jié)合,應用在各種材料上進行文字、圖案加工。如何能得到光滑且能真實反映原圖像的雕刻圖像是

71、其中的主要問題,但是激光器的開關只有兩種狀態(tài),因此,圖像的二值化處理就成為了關鍵性技術(shù),其中閾值的選取是決定二值化圖像好壞的因素?,F(xiàn)實世界中黑白二值圖像很少用,大多數(shù)圖像都是灰度圖像或是彩色圖像。要使這些圖像適用于激光雕刻中,就需要對其進行二值化處理,研究者針對激光雕刻總結(jié)了適用于雕刻的二值化處理方法,然而沒有一種方法適合于所有圖像雕刻的,因而實際中要選擇一種合適的二值化處理方法,使得得到的二值圖像效果最好。</p>&l

72、t;p>  在信息社會中人的身份識別得到廣泛關注。指紋識別技術(shù)除了在傳統(tǒng)的法律公安上得到應用之外,還有更廣闊的應用前景,如計算機用戶的確認、訪問網(wǎng)絡資源的口令、銀行ATM 機和信用卡的使用、各類智能IC 卡的雙重確認,以及雇員證明、海關身份鑒定、家用電子門鎖等一個完整的自動指紋識別系統(tǒng)(AFIS) 包括指紋采集、指紋圖像預處理、指紋特征提取和比對等幾個模塊。在自動指紋識別系統(tǒng)中,指紋圖像的預處理是正確進行特征提取、比對等操作的基礎

73、,而二值化是指紋圖像預處理中必不可少的一步。目前,國內(nèi)外學者在這方面已經(jīng)做了大量的工作,常用的二值化方法有固定閾值法、自適應閾值法、局部自適應閾值法等。由于指紋圖像是一種方向性很強的圖像,這些方法僅僅利用了指紋圖像的灰度信息,而忽略了指紋圖像的方向信息,因此這些方法對指紋圖像的二值化效果并不十分理想。爾后提出了一種改進的二值化方法:利用梯度法求取塊方向圖,將其量化成8個標準方向,以塊方向代替點方向并利用灰度信息對指紋圖像進行二值化。最后

74、將該方法和局部自適應閾值二值化方法及改進前的方法進行比較,可以發(fā)現(xiàn):采用該方法二值化效果有了明顯提高,對于不同質(zhì)量的指紋圖像有著令人滿意的</p><p>  結(jié)合Canny 算子的圖像二值化方法,對經(jīng)典的二值化方法Otsu 算法和Bernsen 算法中存在的缺點進行了分析后提出圖像二值化方法,該方法綜合考慮了邊緣信息和灰度信息,通過邊緣附近種子點在高閾值二值化圖像中的填充和低閾值圖像對它的修補而得到二值化結(jié)果圖

75、像,較好地解決了經(jīng)典二值化方法中存在的抗噪能力差、邊緣粗糙、偽影現(xiàn)象等缺點,實驗結(jié)果證明,該方法能夠較好地解決低對比度圖像和目標像素灰度不均勻圖像的二值化問題。</p><p>  采用信號匹配的支票圖像二值化提出了一種基于信號匹配的低信噪比圖像的信號提取方法,解決類似支票日期域的這種既有復雜背景,又有印章噪聲干擾的圖像二值化問題。這種二值化方法完全不同于傳統(tǒng)的方法,它從信號處理的角度出發(fā),利用了部分先驗知識和理

76、想狀態(tài)下的投影輪廓信號,再通過用不同閾值分割的投影信號與之匹配,匹配度最大時的閾值即為圖像分割的最佳閾值。 本方法比其他的傳統(tǒng)的二值化方法更具有自適應性和魯棒性,通過大量的實驗數(shù)據(jù),以及與常用的其他算法進行的比較得到了驗證。</p><p>  基于灰度的車牌圖像二值化算法不均勻光照下的圖像二值化是數(shù)字圖像處理中的一個難題,汽車牌照自動識別系統(tǒng)工作在復雜的光照環(huán)境下,經(jīng)常會出現(xiàn)車牌光照不均的現(xiàn)象,給圖像二值化帶來

77、困難。為此,研究者提出一種解決辦法,首先使用同態(tài)濾波去掉車牌圖像的不均勻光照的影響,然后使用改進的Bernsen 算法對車牌圖像進行二值化。實驗表明,使用該算法能有效地克服不均勻光照的影響,二值化效果良好,車牌識別率得到顯著的提高;針對常用車牌識別二值化算法存在的問題,提出了基于分形維數(shù)的二值化的方法。根據(jù)分形維數(shù)反映圖像復雜程度的定義,通過計算兩次突變的分維數(shù),來確定圖像的灰度值范圍,并利用該灰度值范圍確定閾值。并通過實驗,表明利用分

78、形維數(shù)所得到的閾值進行二值化處理較傳統(tǒng)方法有較大改進,且該方法解決了在自然光和不同光照背景下對車牌識別的干擾問題,也可以從復雜背景中提取出傾斜的車牌;偏白或泛白背景的車牌圖像二值化方法,在車輛牌照識別系統(tǒng)中,由于攝像機畸變、動態(tài)范圍太窄、車輛牌照被污染等原因,灰度化的車輛牌照圖像背景變得模糊,接近于字體的灰度或者動態(tài)范圍不高,使得前景字體跟背景難以分開。該文采用高帽與低帽形態(tài)濾波增強車牌</p><p>  基于

79、自組織特征映射(SOFM)神經(jīng)網(wǎng)絡的圖像融合二值化方法介紹了SOFM 神經(jīng)網(wǎng)絡的特點及學習算法,根據(jù)SOFM 的聚類確定圖像第一閾值作為循環(huán)迭代的初始值,對整幅圖像進行循環(huán)迭代得到第二閾值,使用第二閾值對原始圖像進行二值化,得到第一幅待融合圖像;通過改進的Bernsen方法對原始圖像進行二值化,得到第二幅待融合圖像;最后根據(jù)圖像灰度值選小的原則作為圖像融合方法,得到最終的二值化圖像。該方法既能有效地消除偽影,又能較好地分離字符和文字。模

80、擬實驗結(jié)果表明,該方法的二值化效果明顯優(yōu)于Bernsen方法和Otsu方法,且具有良好的適應性。</p><p>  基于貝葉斯算法的二值化算法。針對在圖像二值化過程中動態(tài)選取閾值難的問題,在分析了全局閾值法和局部閾值法各自優(yōu)缺點的基礎上。提出了一種基于貝葉斯算法的全局閾值法和局部閾值法相結(jié)合的二值化方法。經(jīng)實驗證明,該方法既能夠有效地消除光照不均勻?qū)D像的影響,較好地保留目標圖像的細節(jié),又能夠有效地消除偽影,提

81、高處理速度。</p><p>  在模式識別中,二值化效果的好壞直接影響著識別效果,首先通過改進的Bernsen方法對原始圖像進行二值化,得到第一幅源圖像;然后根據(jù)自組織神經(jīng)網(wǎng)絡計算閾值,對圖像進行二值化,得到第二幅源圖像;再根據(jù)灰度值最小的原則作為圖像融合方法,得到最終的二值化圖像,最后給出模擬實驗,實驗結(jié)果表明該方法是有效的。提出了一種新的圖像二值化方法。</p><p>  圖像的帶

82、參數(shù)的二值化方法。該方法不僅在實現(xiàn)傳統(tǒng)的黑白二值化方面。有強于Windows的繪圖軟件的黑白二值化功能。而且可以實現(xiàn)任意灰度間隔的二值化。因此該方法除能用于任意灰度起點的一般意義上的二值化外.特別適宜于圖像的挖掘和隱藏。</p><p>  圖像處理中閾值法計算簡單,具有較高的運算效率,是圖像分割中廣泛采用的方法,主要分為全局閾值法和局部閾值法。針對顆粒圖像,提出了一種基于形態(tài)學的最大類間方差Otsu二值化算法,

83、實驗證明,該算法這一算法能較好地保留原圖像中的特征,二值化后的圖像效果不錯。</p><p>  數(shù)碼管圖像的目標和背景分離不明顯,直方圖分布較復雜。針對該問題,提出基于拉普拉斯高斯(Laplacian of Gaussian,LOG)算子邊緣檢測的全局二值化方法對其進行處理,該方法通過提取圖像邊緣部分的像素灰度獲得圖像二值化的閾值。處理結(jié)果表明,與傳統(tǒng)的幾種方法相比,該方法能夠快速選取良好的二值化閾值,較好地區(qū)

84、分目標和背景,在相當大模板寬度內(nèi)圖像二值化的結(jié)果都令人滿意。</p><p>  遺傳算法是當前許多科學實驗領域廣泛應用的一種非線性并行算法。一種基于遺傳算法的灰度圖二值化方法研究了遺傳算法在數(shù)字圖像的灰度圖二值化中的應用,提出了一種新的灰度圖二值化方法。該方法通過對每個子群體的優(yōu)化計算和動態(tài)改進的適應度函數(shù),確定新的分割閾值。實驗驗證該方法對于噪聲干擾的一般質(zhì)量圖像有著良好的效果。</p><

85、;p>  基于邊緣特征的二值化閾值選取方法,閾值選取是圖象處理與分析的基礎。針對幾種常用的圖像二值化自動選取閾值方法,通過計算機仿真對實驗結(jié)果進行了比較研究。在此基礎上,提出了一種新的圖像二值化算法。該算法著重于在圖像二值化時保留圖像的邊緣特征。實驗結(jié)果表明,這個基于邊緣特征檢測算子的算法能很好地保留原圖的邊緣特征,并能處理低質(zhì)量的圖像。</p><p>  圖像二值化是指用灰度變換來研究灰度圖像的一種常用

86、方法,即設定某一閾值將灰度圖像的像素分成大于閾值的像素群和小于閾值的像素群兩部分。例如輸人灰度圖像函數(shù)為,輸出二值圖像函數(shù)為,則</p><p><b>  (3-1)</b></p><p>  閾值(threshold )是把目標和背景區(qū)分開的標尺,選取適當?shù)拈撝稻褪羌纫M可能保存圖像信息,又要盡可能減少背景和噪聲的干擾,這是選擇閾值的原則。</p>

87、<p>  灰度圖像的二值化處理有很多種方法,主要分為全局閾值法和局部閾值法。</p><p><b>  3.3 全局閾值法</b></p><p>  全局閾值法是指在二值化過程中只使用一個全局閾值的方法。它將圖像的每個像素的灰度值與進行比較,若大于,則取為前景色(白色);否則,取為背景色。根據(jù)文本圖像的直方圖或灰度空間分布確定一個閾值,以此實現(xiàn)灰度文

88、本圖像到二值圖像的轉(zhuǎn)化。其中全局閾值法又可分為基于點的閾值法和基于區(qū)域的閾值法。閾值分割法的結(jié)果很大程度上依賴于對閾值的選擇,因此該方法的關鍵是如何選擇合適的閾值。</p><p>  典型的全局閾值方法包括Otsu方法、最大熵方法等。全局閾值法算法簡單,對于目標和背景明顯分離、直方圖分布呈雙峰的圖像效果良好,但對于由于光照不均勻、噪聲干擾較大等原因使直方圖分布不呈雙峰的圖像,二值化效果明顯變差。</p&g

89、t;<p>  為了滿足圖像處理應用系統(tǒng)自動化及實時性要求,圖像二值化的閾值的選擇最好由計算機自動來完成。下面列舉幾個閾值的自動選擇算法:</p><p>  (1) 平均灰度值法:以圖像中所有像素灰度值的平均值為閾值。</p><p>  (2) 大津法:又稱最大類間差法,是基于整幅圖像的統(tǒng)計特性,實現(xiàn)閾值的自動選取。其原理是把圖像直方圖用某一灰度值分割成兩類,分別計算這兩

90、類的像素點數(shù)和灰度平均值,然后計算它們的類間方差。當被分割成的兩類類間方差最大時,此灰度值就作為圖像二值化處理的閾值。大津法的使用范圍比較廣,不論圖像的直方圖有無明顯的雙峰,都能得到較滿意的結(jié)果,在很多領域得到了應用和發(fā)展。但此方法依然存在一些不足,主要表現(xiàn)在:若目標與背景之間灰度差不明顯,可能出現(xiàn)大塊黑色區(qū)域,甚至丟失整幅圖像的信息;僅利用一維灰度直方圖分布,沒有結(jié)合圖像的空間相關信息,處理效果不好;當圖像中有斷裂現(xiàn)象或者背景有一定噪

91、聲時,無法得到預期效果。 </p><p>  (3) 邊緣算子法:采用Laplace算子、Robert算子、Sober算子等對像素點進行灰度級增強或減弱的變換。對于灰度均勻分布的區(qū)域內(nèi)的像素點,這些算子對其進行灰度減弱;對于在邊緣附近的像素點,這些算子對其進行灰度增強。 </p><p><b>  3.4 局部閾值法</b></p><p&

92、gt;  由當前像素灰度值與該像素周圍點局部灰度特征來確定像素的閾值。例如可以將原圖像劃分為一些不相交的小塊,將各塊圖像的灰度均值作為該部塊圖像的閾值,在局部上采用上面的整體閾值法。</p><p>  對于目標和背景比較清楚的圖像,全局閾值化方法可以取得較好結(jié)果。但是如果圖像的背景不均勻,或目標灰度變化率比較大,全局方法便不再適用。局部閾值法是用像素灰度值和此像素鄰域的局部灰度特性來確定該像素的閾值的。當照明不

93、均勻、有突發(fā)噪聲,或者背景灰度變化較大時,局部閾值確定技術(shù)必須根據(jù)像素的坐標位置關系自動確定不同閾值,實施動態(tài)的自適應二值化處理。局部閾值選取一般將圖像劃分為若干子圖像,在每個子圖像區(qū)域上使用整體閾值法,從而可以構(gòu)成整幅圖像的局部閾值法(根據(jù)每個子圖像確定相應的閾值,具體的閾值確定方法同全局閾值的確定類似)。用這種方法分割后的圖像在不同子圖像的邊界處有灰度的不連續(xù)分布,因此必須采用平滑技術(shù)來消除灰度的不連續(xù)性。 </p>

94、;<p>  局部閾值法一般用于識別干擾比較嚴重、品質(zhì)較差的圖像,相對整體閾值方法有更廣泛的應用,但也存在缺點和問題,如實現(xiàn)速度慢、不能保證字符筆畫連通性以及容易出現(xiàn)偽影現(xiàn)象(即在背景域受到噪音干擾得到筆畫結(jié)果)等。比較典型的局部二值化算法有Bernsen方法、多閾值的梯度強度法、基于紋理圖像的方法、最大方差法等。</p><p>  第四章 Otsu方法和Bernsen方法</p>

95、<p>  4.1 Otsu算法分析</p><p>  Otsu 在1979 年提出的最大類間方差法(有時也稱之為大津法),該方法的基本思想是:設閾值將圖像分割成兩組,一組灰度對應目標,另一組灰度對應背景,則這兩組灰度值的類內(nèi)方差最小,兩組的類間方差最大。對圖像Image,記為目標與背景的分割閾值,目標像素數(shù)占圖像比例為,平均灰度為;背景像素數(shù)占圖像比例為,平均灰度為。圖像的總平均灰度為:。從最小灰度

96、值到最大灰度值遍歷,當使得值 最大時即為分割的最佳閾值。對大津法可作如下理解:該式實際上就是類間方差值,閾值分割出的目標和背景兩部分構(gòu)成了整幅圖像,而目標取值,概率為 ,背景取值,概率為,總均值為,根據(jù)方差的定義即得該式。因方差是灰度分布均勻性的一種度量,方差值越大說明構(gòu)成圖像的兩部分差別越大,當部分目標點錯分為背景或部分背景點錯分為目標點都會導致兩部分差別變小,因此使類間方差最大的分割意味著錯分概率最小。記為圖像點處的灰度值,灰度級為

97、,不妨假設取值。記為灰度值為k的頻率,則有:</p><p><b>  (4-1)</b></p><p>  假設用灰度值t為閾值分割出的目標與背景分別為:和,于是目標部分比例:</p><p>  , (4-2)</p><p><b>  目標部分

98、點數(shù):</b></p><p><b>  (4-3)</b></p><p><b>  背景部分比例:</b></p><p><b>  (4-4)</b></p><p><b>  背景部分點數(shù):</b></p><

99、;p><b>  (4-5)</b></p><p><b>  目標均值:</b></p><p><b>  (4-6)</b></p><p><b>  背景均值:</b></p><p><b>  (4-7)</b>

100、</p><p><b>  總均值:</b></p><p><b>  (4-8)</b></p><p>  大津法指出求圖像最佳閾值g的公式為:</p><p><b>  (4-9)</b></p><p>  該式右邊括號內(nèi)實際上就是類間方差

101、值,閾值g分割出的目標和背景兩部分構(gòu)成了整幅圖像,而目標值,概率為,背景取值,概率為,總均值為,根據(jù)方差的定義即得該式。因此方差是灰度分布均勻性的一種度量,方差值越大,說明構(gòu)成圖像的兩部分差別越大,當部分目標錯分為背景或部分背景錯分為目標都會導致兩部分差別變小,因此使類間方差最大的分割意味著錯分概率最小,這便是大津法的真正含義。其實,換一種思想也能很好的理解大津方法。和,可以分別代表目標和背景的中心灰度,則代表整幅圖像的中心灰度,要使目

102、標和背景得到最好的分割,當然希望分割出的目標盡量遠離圖像中心,即或盡量大,背景也盡量遠離中心,即或盡量大,由于希望兩者都大,于是有:</p><p><b>  兩者之加權(quán)和最大:</b></p><p><b>  (4-10)</b></p><p><b>  兩者之積最大:</b></p

103、><p><b>  (4-11)</b></p><p>  注意到有,且,因此有:,可見二者等價。</p><p>  4.2 Otsu方法流程圖</p><p>  Otsu方法流程圖如圖4.1所示。</p><p>  4.3 Bernsen算法分析</p><p> 

104、 局部閾值法把灰度閾值選取為隨像素位置變化而變化的函數(shù),它是一種動態(tài)選擇閾值的自適應方法。</p><p>  設圖像在像素點處的灰度值為,考慮以像素點為中心的窗口,(表示窗口的邊長),則Bernsen算法可以描述如下:</p><p>  計算圖像中各個像素點的閾值</p><p><b>  (4-12)</b></p>&l

105、t;p>  對圖像中各像素點用值逐點進行二值化。</p><p><b>  (4-13)</b></p><p>  用存儲灰度圖像的值,設為,把邊界擴展成 extend矩陣。</p><p>  4.4 Bernsen方法流程圖</p><p>  首先讀取原圖像的大小為。由于中的元素不是每個都是在窗口的中心

106、,所以需要對灰度圖像進行擴展。首先創(chuàng)建一個的矩陣extend,把矩陣中的像素,而第一行和最后一行,第一列和最后一列的填充依據(jù)是以它靠近的行或列為對稱軸進行填充。遍歷從到的像素,并取以當前像素為中心的窗口的最大像素max和最小像素min,依據(jù)公式求出閾值。把灰度圖像矩陣賦值于另一矩陣,以免改變當前得到的灰度圖像矩陣。遍歷該矩陣,對當前灰度值與比較,如果大于賦予1,判為目標像素類,否則賦予0,作為背景像素類。顯示得到的二值圖像。</p

107、><p>  Bernsen方法流程圖如圖4.2所示。</p><p>  第五章 Otsu方法和Bernsen方法實驗比較</p><p>  本設計只是對于bmp格式灰度圖像進行研究。用Otsu方法和Bernsen方法對圖像進行二值化處理,以下為研究對象的幾張原始圖像如圖5.1所示。</p><p>  (a) (b)

108、 (c)</p><p>  (d) (e) (f)</p><p><b>  圖5.1 原圖</b></p><p>  (a) lena原始圖像(128×128); (b)peppers原始圖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論