版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、<p> 學(xué)號: 0902174075</p><p> 郵政編碼識別系統(tǒng)的設(shè)計</p><p> The design of postal code identification system</p><p> 專業(yè)名稱: 電子信息工程 </p><p> 年級班別: 2009級 <
2、/p><p> 姓 名: 馬林 </p><p> 指導(dǎo)教師: 李偉 </p><p><b> 2013年4月</b></p><p><b> 目錄</b></p><p><b> 摘 要
3、2</b></p><p><b> 1 前言4</b></p><p> 1.1 課題研究的背景和意義4</p><p> 1.2 數(shù)字圖像處理技術(shù)5</p><p> 1.3 課題研究的內(nèi)容6</p><p> 2 系統(tǒng)結(jié)構(gòu)概述7</p><
4、p> 2.1軟件平臺概述7</p><p> 2.2功能模塊的劃分7</p><p><b> 3 圖像的采集8</b></p><p> 3.1 分辨率的選擇8</p><p> 3.2 采樣頻率的設(shè)置8</p><p> 3.3 物距的選擇8</p>
5、<p> 4 郵件上郵碼簽圖像的提取9</p><p> 4.1圖像數(shù)據(jù)的抽樣9</p><p> 4.2圖像背景的濾出11</p><p> 4.3郵碼簽的定位11</p><p> 4.4 圖像灰度分布特征的求解與算法12</p><p> 4.5 郵政編碼區(qū)域的提取14<
6、/p><p> 5 數(shù)字識別系統(tǒng)的設(shè)計17</p><p> 5.1系統(tǒng)流程圖17</p><p> 5.2程序?qū)崿F(xiàn)18</p><p> 5.2.1圖像的預(yù)處理18</p><p> 5.2.2用神網(wǎng)絡(luò)進(jìn)行字符識別23</p><p> 6 測試和程序運行28</p&
7、gt;<p> 6.1測試及識別過程28</p><p> 6.2程序運行29</p><p> 6.3注意事項32</p><p><b> 結(jié) 論33</b></p><p><b> 參考文獻(xiàn)34</b></p><p><
8、b> 致 謝35</b></p><p><b> 摘 要</b></p><p> 隨著郵政業(yè)務(wù)技術(shù)的發(fā)展,郵政設(shè)備的推廣使用工作有了很大的進(jìn)展,使我國的郵政業(yè)務(wù)處理水平有了很大的提高,郵政業(yè)務(wù)處理正走向機(jī)械化、自動化和網(wǎng)絡(luò)化。一個高速、高效的郵政處理體系正在形成。</p><p> 本文正是基于如今的形式
9、,設(shè)計了一套便于郵件處理的系統(tǒng),以提高工作效率,減輕人工工作量。這套系統(tǒng)的設(shè)計包括了圖像采集、圖像預(yù)處理、圖像初步提取和郵政編碼識別這四個主要的組成部分,本文把重點研究放在了數(shù)字的識別上。在這個過程中,用到了好多圖像處理中的相關(guān)技術(shù),比如灰度化、二值化、圖像內(nèi)容自動調(diào)整、去離散點、圖像的縮放、細(xì)化、曲線平滑、曲線去枝椏操作等,最后還使用了神經(jīng)網(wǎng)絡(luò)對提取到的數(shù)字信息進(jìn)行分析判斷。本文通過相關(guān)軟件的設(shè)計,達(dá)到了對采集到的圖像進(jìn)行智能識別的目
10、標(biāo)。這使郵件地分揀過程更加高效,促進(jìn)了郵件分揀的自動化程度。</p><p> 關(guān)鍵詞: 抽樣;圖像分割;二值化;模式識別</p><p><b> ABSTRACT</b></p><p> With the development of postal services technology, promoting use of post
11、al equipment has made a lot of progress in its work, the level of postal service in China has been greatly improved, postal services are heading for mechanization, automation and networking.</p><p> A high
12、speed and efficient postal system is taking shape. This article is based on the forms, design a message handling system, in order to enhance efficiency, reduce manual workload. The system design includes a preliminary ex
13、traction of image acquisition, image processing, image and zip code to identify the four main components of this article on focused research on digital identification. In this process, used a lot of image processing tech
14、nology, such as grayscale, binary, image content auto</p><p> The mail sorting process more efficient, facilitating automation of mail sorting.</p><p> Key Words:Sampling; Image Acquisition; B
15、inarization; Pattern Recognition</p><p><b> 1 前言</b></p><p> 1.1 課題研究的背景和意義</p><p> 近年來,隨著郵政業(yè)務(wù),技術(shù)的發(fā)展,郵政設(shè)備的推廣使用工作有了很大的進(jìn)展,使我國的郵政業(yè)務(wù)處理水平有了很大的提高,郵政業(yè)務(wù)處理正走向機(jī)械化、自動化和網(wǎng)絡(luò)化。一個高速、
16、高效的郵政處理體系正在形成。</p><p> 計算機(jī)網(wǎng)絡(luò)、數(shù)據(jù)庫技條形碼技術(shù)、模式識別技術(shù)以及與計算機(jī)相協(xié)調(diào)的打印技術(shù)和設(shè)備的發(fā)展,大大推動了郵政自動化的進(jìn)程。許多技術(shù)都被應(yīng)用到信函分揀的機(jī)械和電子設(shè)備中,極大的提高了信函的分揀速度與效率,降低了出錯的幾率,減輕了許多工作人員的工作壓力。</p><p> 但是,我國郵政設(shè)備整體的自動化程度還很低,與世界先進(jìn)水平也有一定的差距。我國普
17、遍存在的是最原始的人工處理的情況,處理速度很慢。眾多的事實證明,采用高新技術(shù)、提高郵件處理設(shè)備的自動化程度是加快郵件處理傳遞速度、減少郵件處理成本和提高郵政分揀效率的重要手段。因此郵件分揀自動化的技術(shù)就很值得仔細(xì)研究。</p><p> 信件、包裹等的收寄工作是郵政部門的一項重要任務(wù)。當(dāng)前,許多的信件、包裹等的分揀工作主要是有人工完成的,這樣的工作效率較低,而成本卻較高。特別是近幾年,隨著網(wǎng)絡(luò)購物的迅猛發(fā)展,郵
18、購將迎來高峰,那時,工作量將急速增加,包裹的分揀將回更加耗時耗力,目前的分揀處理能力將遠(yuǎn)遠(yuǎn)不能夠滿足市場的要求了。</p><p> 所以,研究出高效率、高自動化程度且實用性強(qiáng)的包裹分揀設(shè)備就成為郵政行業(yè)、快遞行業(yè)迫在眉睫的問題,這對刺激我國消費,推進(jìn)我國郵政、快遞事業(yè)的發(fā)展就具有很重要的意義了。</p><p> 1.2 數(shù)字圖像處理技術(shù)</p><p>&l
19、t;b> 概念</b></p><p> 數(shù)字圖像處理(DigitalImageProcessing)是通過計算機(jī)對圖像進(jìn)行去除噪聲、增強(qiáng)、復(fù)原、分割、提取特征等處理的方法和技術(shù)。數(shù)字圖像處理的產(chǎn)生和迅速發(fā)展主要受三個因素的影響:一是計算機(jī)的發(fā)展;二是數(shù)學(xué)的發(fā)展(特別是離散數(shù)學(xué)理論的創(chuàng)立和完善);三是廣泛的農(nóng)牧業(yè)、林業(yè)、環(huán)境、軍事、工業(yè)和醫(yī)學(xué)等方面的應(yīng)用需求的增長。</p>&
20、lt;p><b> 發(fā)展情況</b></p><p> 20世紀(jì)20年代,圖像處理首次應(yīng)用于改善倫敦和紐約之間海底電纜發(fā)送的圖片質(zhì)量。到20世紀(jì)50年代,數(shù)字計算機(jī)發(fā)展到一定的水平后,數(shù)字圖像處理才真正引起人們的興趣。1964年美國噴氣推進(jìn)實驗室用計算機(jī)對“徘徊者七號”太空船發(fā)回的大批月球照片進(jìn)行處理,收到明顯的效果[1]。20世紀(jì)60年代末,數(shù)字圖像處理具備了比較完整的體系,形成
21、了一門新興的學(xué)科。20世紀(jì)70年代,數(shù)字圖像處理技術(shù)得到迅猛的發(fā)展,理論和方法進(jìn)一步完善,應(yīng)用范圍更加廣泛。在這一時期,圖像處理主要和模式識別及圖像理解系統(tǒng)的研究相聯(lián)系,如文字識別、醫(yī)學(xué)圖像處理、遙感圖像的處理等。20世紀(jì)70年代后期到現(xiàn)在,各個應(yīng)用領(lǐng)域?qū)?shù)字圖像處理提出越來越高的要求,促進(jìn)了這門學(xué)科向更高級的方向發(fā)展。特別是在景物理解和計算機(jī)視覺(即機(jī)器視覺)方面,圖像處理已由二維處理發(fā)展到三維理解或解釋。近年來,隨著計算機(jī)和其它各有
22、關(guān)領(lǐng)域的迅速發(fā)展,例如在圖像表現(xiàn)、科學(xué)計算可視化、多媒體計算技術(shù)等方面[2]的發(fā)展,數(shù)字圖像處理已從一個專門的研究領(lǐng)域變成了科學(xué)研究和人機(jī)界面中的一種普遍應(yīng)用的工具。3)研究內(nèi)容</p><p> 數(shù)字圖像處理的主要研究內(nèi)容[3],根據(jù)其主要的處理流程與處理目標(biāo)大致可以分為圖像信息的描述、圖像信息的處理、圖像信息的分析、圖像處理的編碼以及圖像信息的顯示等幾個方面具體包括以下的研究方向:</p>
23、<p><b> ①圖像數(shù)字化</b></p><p><b> ?、趫D像增強(qiáng)</b></p><p><b> ?、蹐D像幾何變換</b></p><p><b> ?、軋D像恢復(fù)</b></p><p><b> ?、輬D像重建<
24、/b></p><p><b> ?、迗D像隱藏</b></p><p><b> ?、邎D像變換</b></p><p><b> ?、鄨D像編碼</b></p><p><b> ⑨圖像識別與理解</b></p><p>
25、1.3 課題研究的內(nèi)容</p><p> 確定郵件表面圖像數(shù)據(jù)的采集方案。</p><p> 觀察郵件表面圖像的特點,研究圖像的預(yù)處理算法,取出圖像分析的干擾因素,研究郵件表面碼簽的圖像特點,尋找快速的郵碼簽定位算法。</p><p> 分析郵政編碼的圖像特征,研究其在郵碼簽圖像區(qū)域中的定位算法。</p><p> 針對印刷體郵政編碼
26、的特點結(jié)合數(shù)字分割與識別算法研究適用于郵政編碼識別的分割和識別算法,本文運用神經(jīng)網(wǎng)絡(luò)來進(jìn)行數(shù)字識別。</p><p> 編制系統(tǒng)的軟件和算法的分析試驗軟件。</p><p><b> 2 系統(tǒng)結(jié)構(gòu)概述</b></p><p><b> 2.1軟件平臺概述</b></p><p> Micro
27、soft Visual C++,(簡稱Visual C++、MSVC、VC++或VC)微軟公司的C++開發(fā)工具,具有集成開發(fā)環(huán)境,可提供編輯C語言,C++以及C++/CLI等編程語言。VC++整合了便利的除錯工具,特別是整合了微軟視窗程式設(shè)計(Windows API)、三維動畫DirectX API,Microsoft .NET框架。目前最新的版本是Microsoft Visual C++ 2008[4]。</p><
28、;p> Visual C++以擁有“語法高亮”,IntelliSense(自動編譯功能)以及高級除錯功能而著稱。比如,它允許用戶進(jìn)行遠(yuǎn)程調(diào)試,單步執(zhí)行等。還有允許用戶在調(diào)試期間重新編譯被修改的代碼,而不必重新啟動正在調(diào)試的程序。其編譯及建置系統(tǒng)以預(yù)編譯頭文件、最小重建功能及累加連結(jié)著稱。這些特征明顯縮短程式編輯、編譯及連結(jié)的時間花費,在大型軟件計劃上尤其顯著[5]。</p><p> 2.2功能模塊的劃
29、分</p><p><b> 圖像采集</b></p><p> 運用攝像頭對傳輸帶上的郵件進(jìn)行拍照,獲取初步的圖像信息,為后面郵碼簽圖像的提取提供素材。</p><p><b> 郵碼簽圖像提取</b></p><p> 圖像預(yù)處理模塊通過分析由圖像采集模塊提供的圖像原始信息,尋找圖像數(shù)據(jù)
30、中的有用信息,剔除圖像數(shù)據(jù)中的無用信息。然后通過邊沿提取、幾何特征分析,獲得郵簽碼的位置信息、傾斜角度,并對郵簽碼圖像進(jìn)行比例縮放、旋轉(zhuǎn)和郵政編碼定位、提取。</p><p><b> 郵政編碼識別</b></p><p> 基于BP神經(jīng)網(wǎng)絡(luò)設(shè)計程序,通過設(shè)計的軟件對提取出的郵碼簽圖像的數(shù)字進(jìn)行最后的識別。</p><p><b>
31、; 3 圖像的采集</b></p><p> 本系統(tǒng)主要的圖像采集參數(shù)有:攝像頭分辨率、采樣頻率、物距等。</p><p> 3.1 分辨率的選擇</p><p> 為達(dá)到文字識別的效果,每個字符至少有810點陣。而我國郵碼簽上通常使用的最小字體是5號,大小為23mm,所以只要達(dá)到102dpi的分辨率就能滿足要求,但在圖像處理過程中,必然會發(fā)生信
32、息損失,因此要求采用較高分辨率進(jìn)行補(bǔ)償。所以一般的攝像頭只要比以上分辨率稍大就可以。現(xiàn)在市場上一般的攝像頭是130萬像素,所以大多都是符合本系統(tǒng)的。</p><p> 3.2 采樣頻率的設(shè)置</p><p> 對郵件可以進(jìn)行定時拍照,每間隔0.1s拍一次,即采樣頻率為10Hz。</p><p><b> 3.3 物距的選擇</b><
33、/p><p> 由于采樣頻率為10Hz,故可以在傳送速度為1m/s的傳送帶上間距0.1m或者0.1m的整數(shù)倍進(jìn)行物體的擺放,這樣就剛好可以使攝像頭每次剛好拍到郵件表面的郵碼簽。</p><p> 4 郵件上郵碼簽圖像的提取</p><p> 4.1圖像數(shù)據(jù)的抽樣</p><p> 1)由于從圖像采集卡中獲取的一幅圖像的數(shù)據(jù)量相當(dāng)大(典型值
34、為25MB),再加上系統(tǒng)的高實時性要求,所以,通常的預(yù)處理工作比如低通濾波、邊沿增強(qiáng)、灰度均衡等等算法的運算量都是非常巨大的。舉一個簡單的例子:如平滑濾波,它的作法是對于任一像素,將其及其周圍的8個像素(共9個像素)構(gòu)成的灰度矩陣進(jìn)行模板運算。模板運算在圖像處理中經(jīng)常要用到,可以看出,它是一項非常耗時的運算。以模板為例,每個像素完成一次模板操作要用9個乘法,8個加法,1個除法。對于一幅 (寬度高度)的圖像,就是9n2個乘法,8n2個加法
35、和n2個除法,算法復(fù)雜度為n2的函數(shù),這對于25MB的大圖像來說,運算量是非常巨大的,根本不可能實時完成。即使設(shè)法將2維模板運算轉(zhuǎn)換成1維模板運算,雖然可顯著提高運算的速度,然而依然是不適合大圖像的實時處理的。因此,為了解決上述問題,必須對圖像數(shù)據(jù)進(jìn)行抽樣,減少圖像像素點[6]。</p><p> 關(guān)于圖像抽樣的算法較多,比較常用的是采用金字塔法,又叫多解析(Multiresolution)方法.它是使用同一幅
36、圖像的幾種不同解析度的拷貝描述方法。用多解析算法可以提供圖像細(xì)節(jié)的抽象描述。多解析技術(shù)應(yīng)用于灰度和二值圖像分析,便可以得到所謂的圖像金字塔。圖像金字塔是一個圖像系列。頂層陣列的大小為l:底層陣列是大小為2n2n的整幅圖像;中間各層的解析度大小為2k2k,k=l,2,...,n-1。中間層圖像是用一種自底向上的方法建立的。第k層的像素fk(i,j),由第k+l層的四個相鄰像素得到[7]:</p><p><b
37、> (4-1)</b></p><p> 這里,g為一個映射函數(shù)。它可以是取局部均值、局部最大值、局部中值、或者局部形態(tài)變換等作為映射關(guān)系,這種映射關(guān)系也可以理解為對圖像的一種抽樣重組。在計算機(jī)的存儲實現(xiàn)上,用四叉數(shù)的數(shù)據(jù)結(jié)構(gòu)描述金字塔的圖像數(shù)據(jù)結(jié)構(gòu),位于四叉數(shù)最末段的節(jié)點表達(dá)了整幅圖像的實際信息,它的上一級節(jié)點表達(dá),它的4個子節(jié)點的圖像抽樣信息,最頂端的根節(jié)點表達(dá)了整幅圖像的抽樣信息。這樣
38、每一個層次都反映整幅圖像的特征,位置越低的層表達(dá)的信息越詳細(xì),位置越高的層表達(dá)的信息相對粗略。但它的主要缺陷是占用多余的存儲空間來保存樹的關(guān)系結(jié)構(gòu)。</p><p> 另外的一種抽樣方法是柵條抽樣,即沿圖像的某一維方向,等距離等寬度地提取柵條圖像,構(gòu)成抽樣圖像。當(dāng)抽樣方向同線陣CCD的掃描方向一致時,實際上等同于降低采樣頻率,把圖像像沿掃描方向壓縮。</p><p> 考慮到在后續(xù)處理
39、中要避進(jìn)行背景濾除,柵條抽樣有利于獲得背景的統(tǒng)計信息,因此,本系統(tǒng)采用柵條抽樣。</p><p> 圖像采集模塊從圖像采集卡獲取整幅圖像數(shù)據(jù)并存放在系統(tǒng)內(nèi)存中(數(shù)據(jù)結(jié)構(gòu)為二維數(shù)組),預(yù)處理模塊從該二維數(shù)組中提取n條水平條狀數(shù)據(jù)。假定條高度(即數(shù)組的行數(shù))為Ht;,條長度(即數(shù)組的列數(shù))為W1,下面以n=7為例,加以說明,如圖3-1所示 :</p><p><b> 圖4-1
40、柵條抽樣</b></p><p> 4.2圖像背景的濾出</p><p> 如果攝像頭采用兩個高壓鈉燈作為輔助光源,而傳送帶采用的是黑色的橡膠帶,所以由鈉燈發(fā)出的強(qiáng)光經(jīng)傳送帶表面反射,會在攝像頭的焦平面上形成兩個很亮的區(qū)域。采用線陣CCD作為光敏器件時,會在最終獲得的圖像的固定區(qū)域沿傳送帶運動方向會產(chǎn)生兩條很亮的光帶,而且由于傳送帶有凸凹不平的表面,所以這兩條光帶并不均勻。
41、對實際采集圖像進(jìn)行分析發(fā)現(xiàn),當(dāng)傳送帶沒有載運郵件的時候,攝像頭捕捉到的圖像已經(jīng)包含相當(dāng)多的灰度成分,這對以后的處理是不利的。上述圖像實際上是通常所說的“背景”。</p><p> 在有背景的圖像中,光源在傳送帶上的“背景像”已經(jīng)嚴(yán)重地影響到了郵件所成的像。因此,在進(jìn)行圖像變換處理之前,必須設(shè)法消除背景的影響。通常的背景剔除算法是在已知背景圖像的前提下,將實際圖像(包含前景圖像)同背景圖像作“異或”運算[8]。經(jīng)
42、過“異或”運算后,光帶會被明顯削弱,前景圖像就會變得更加清晰。</p><p><b> 4.3郵碼簽的定位</b></p><p> 普通的郵碼簽一般為矩形白紙,包含黑字印刷體漢字(地址信息)和數(shù)字(郵政編碼),粘貼位置一般在郵件的中央,但也存在其他可能。對于這種情況,定位方法一般是首先確定從整幅圖像中找到包含郵件圖像的有效區(qū)域,縮小對象范圍,然后再在這一較小區(qū)
43、域中搜尋包含郵碼簽的區(qū)域。由于郵碼簽特征不夠明顯(相對于第二種情況而言)及位置的隨意性(相對于第一種情況而言),所以給郵碼簽的發(fā)現(xiàn)算法的準(zhǔn)確性帶來了極大的困難,同時又由于目標(biāo)圖像數(shù)據(jù)量巨大,又為如何提高算法的速度帶來了難題。</p><p> 考察實際郵件表面的狀況,發(fā)現(xiàn)在郵件表面,不僅有郵碼簽,同時還有可能有包裝帶、圖形文字污損、破損等實體的像,這些像都會影響郵碼簽的定位。因此算法必須能幣確區(qū)分真正的郵碼簽區(qū)
44、域和偽郵碼簽區(qū)域。為了有效地區(qū)分包含郵碼簽的區(qū)域,必須總結(jié)出能描述郵碼簽特征的相關(guān)判據(jù)。經(jīng)過對大量包狀郵件表面外觀的統(tǒng)計和分析,總結(jié)出以下判據(jù):</p><p> 1)郵碼簽的幾何形狀為矩形,簡稱幾何形狀判據(jù);</p><p> 2)長寬有一定的范圍,簡稱幾何尺寸判據(jù);</p><p> 3)碼簽顏色為白色,上有黑色文字,它的灰度值同郵件表面的灰度有較大差異,
45、簡稱灰度能量判據(jù)。</p><p> 首先先從整幅圖像中找到灰度發(fā)生變化的不連續(xù)區(qū)域,例如郵碼簽、包裝帶、破損、折疊、陰影、透明膠帶等實體的像,然后在這些備選區(qū)域中根據(jù)上述三個判據(jù),確定要求的郵碼簽區(qū)域。同時具備上述特征的區(qū)域,可以認(rèn)為是郵碼簽區(qū)域。任一判據(jù)不滿足,均認(rèn)為不是郵碼簽區(qū)域。例如,郵件表面的包裝帶,一般為自色,它的像為矩形,但是長寬不符合郵碼簽的幾何尺寸判據(jù)條件(幾何形狀過于細(xì)長):郵件表面如果出現(xiàn)
46、大面積的破損,破損處的像的灰度值較低,可通過灰度能量判據(jù)排除,同時它的形狀也可能不規(guī)則,所以,也可用幾何形狀進(jìn)行排除;郵件表面粘貼的透明膠帶,由于膠帶表面反光強(qiáng)烈,因此,它的像灰度值很高,可能超過郵碼簽的灰度范圍,即使恰好在郵碼簽的灰度范圍中,但很可能它的形狀(即長寬尺寸)不符合郵碼簽的條件。通過上述三個判據(jù)的判定,一般可找到正確的郵碼簽區(qū)域。如果結(jié)果中有多個區(qū)域被判定為郵碼簽區(qū)域,即算法的結(jié)果不唯一,可分兩種情況分別對待:系統(tǒng)要求進(jìn)行
47、多目標(biāo)處理和系統(tǒng)要求進(jìn)行單目標(biāo)處理。</p><p> 針對前一種情況,由于多個目標(biāo)具有近似的特征,可為三個判據(jù)設(shè)定加權(quán)因子,計算每一各選區(qū)域的權(quán)值,然后進(jìn)行排序,權(quán)值較大的認(rèn)為是要求區(qū)域。但是加權(quán)因子的值需要根據(jù)大量實測數(shù)據(jù)統(tǒng)計獲取,本文暫不作討論。對于后者,各備選區(qū)域差異較大,一般滿足三判據(jù)的可認(rèn)定為郵碼簽區(qū)域,如果出現(xiàn)多個結(jié)果,為了提高整個系統(tǒng)的識別率,可在后續(xù)的郵政編碼提取過程中判斷這若干個結(jié)果哪一個為
48、真。針對多判據(jù)綜合的方法,必須針對每一判據(jù)制定各自的算法。因此,問題歸結(jié)為矩形區(qū)域的發(fā)現(xiàn)、矩形幾何尺寸的判斷、灰度能量集中區(qū)域的尋找。然后,通過這三種算法的結(jié)果綜合出最終結(jié)果。由于判據(jù)二依賴于判據(jù)一的結(jié)果,所以可將兩者加以合并,得出最終的求解模型,即求解圖像中符合尺寸要求的矩形連通域和求解圖像中灰度能量集中區(qū)域的點集合。</p><p> 4.4 圖像灰度分布特征的求解與算法</p><p&
49、gt; 首先引入一個灰度能量的概念:由于像素點的灰度值是一個0~255之間的整數(shù)值,它代表了該像素點對光源的反射強(qiáng)度。換句話說,就是光線投射在成像焦平面的能量強(qiáng)度,所以某像素點的灰度值可理解為該點的灰度能量,同理,推廣到區(qū)域,可以用某一區(qū)域的灰度均值反映該區(qū)域的次度能量?;叶饶芰糠ǖ幕舅悸肥牵杭俣繕?biāo)區(qū)域的灰度值同非目標(biāo)區(qū)域的灰度值有一個較大的差值,通過計算灰度能量集中區(qū)域,發(fā)現(xiàn)要求目標(biāo)區(qū)域的位置。實際應(yīng)用中,郵碼簽一般為灰度值較高
50、的白色,郵件包裝袋、箱為灰度值較低的棕色、褐色等,所以對郵件表面圖像的灰度進(jìn)行能量統(tǒng)計,在郵碼簽的位置將出現(xiàn)一個峰值。這樣,搜索郵碼簽位置的工作歸結(jié)為求解圖像的灰度能量峰值。進(jìn)行灰度能量的統(tǒng)計所要運用到的計算是求均值,也就是進(jìn)行大量的加法和少量的除法,計算速度較快。但是由于原始圖像的尺寸太大,所以仍有必要進(jìn)行抽樣統(tǒng)計,抽樣統(tǒng)計可以在前述的柵條抽樣的基礎(chǔ)上沿x方向再抽樣,形成如圖4-2所示的白色小正方形抽樣區(qū)域,這樣就可對每一抽樣區(qū)域進(jìn)行
51、灰度能量統(tǒng)計,得出整幅圖像的灰度能量分布。很明顯,落在圖中的傾斜矩形區(qū)域中的小正方形區(qū)域的灰度能量統(tǒng)計值要明顯高于落在黑色背景區(qū)域</p><p> 圖4-2 灰度能量統(tǒng)計法原理</p><p> 計算方法仍然運用表決器進(jìn)行,即根據(jù)幾何特征法得出的若干個備選矩形區(qū)域設(shè)立同樣數(shù)量的表決器,然后遍歷根據(jù)灰度能量法所得出的灰度能量分布值,如果某一坐標(biāo)位置的灰度能量分布值滿足郵碼簽的灰度閾值
52、范圍,同時又落在上述備選區(qū)域中,那么就在該區(qū)域?qū)?yīng)的表決器中投一票(加一)。遍歷結(jié)束后,就可得到反映每一備選區(qū)域是否是郵碼簽區(qū)域的一個表決值,顯然,表決值越大,相對于二表決器的區(qū)域是郵碼簽的可能性就越大。通過設(shè)定一個閡值,可得到郵碼簽區(qū)域判定結(jié)果。</p><p> 算法綜合流程如圖4-4所示。</p><p> 4.5 郵政編碼區(qū)域的提取</p><p>
53、經(jīng)過預(yù)處理模塊的處理,從采集卡獲取的整幅圖像信息已減少為郵碼簽的有效圖像信息,如圖4-3所示。</p><p> 圖4-3 郵碼簽圖像信息</p><p> 由于郵政編碼一定位于郵碼簽的左上角,所以一種方法是直接從郵碼簽信息中提取左上角矩形區(qū)域,如圖4-5中虛線所示。這種方法比較簡單易行,然而,它帶來的弊病是顯而易見的,就是如果郵政編碼的區(qū)域不在理想位置,就會發(fā)生誤提取,進(jìn)而嚴(yán)重影響后
54、續(xù)識別工作。</p><p> 另外一種方法的思路是采用灰度投影加分塊矩陣的方法。這種方法把圖像分割成若干個小的區(qū)域,然后針對每一小區(qū)域進(jìn)行灰度投影。</p><p> 圖4-4 算法流程圖</p><p> 圖4-5 郵政編碼提取示意圖</p><p> 如圖4-6所示的郵碼簽分別沿x、y方向作灰度投影,得到圖4-6-c、圖4-6
55、-b,顯然,在郵政編碼的位置上出現(xiàn)了灰度谷底,通過次度閾值分割,就可比較準(zhǔn)確地獲得郵政編碼的坐標(biāo)位置。如果考慮到郵碼簽表面的大塊污染,例如郵碼簽由可能加蓋有郵戳,因此會產(chǎn)生干擾,這樣就會得出錯誤的結(jié)果。解決的方法是對圖4-2進(jìn)行分塊處理,然后對每一分割出的小塊進(jìn)行灰度投影,然后再將結(jié)果根據(jù)郵政編碼圖像的特征加以組合,就可排除郵戳等的干擾。根據(jù)對多個實驗樣本的實驗優(yōu)選,分塊的尺寸大小為88mm時,效果較好。分塊從圖像的左上角外始,沿水平方
56、向進(jìn)行,遇到邊界換行,不足88mm的邊角區(qū)域舍棄。這樣,若干小塊中就會包含文本區(qū),通過分析這些小塊在整個分塊矩陣中的位置,就得到文本行的區(qū)域范圍[9]。</p><p> 圖4-6 郵政編碼行的灰度投影曲線圖</p><p> 5 數(shù)字識別系統(tǒng)的設(shè)計</p><p> 對于提取出的擁有郵政編碼的區(qū)域進(jìn)行識別實際上就是對圖像中的印刷體數(shù)字智能識別。系統(tǒng)在實現(xiàn)的過
57、程當(dāng)中,先分解成兩個大塊,就是圖像預(yù)處理模塊和數(shù)字識別模塊。其中圖像像預(yù)處理塊在對圖像進(jìn)行了一系列變換后把最后提取到的數(shù)字字符提交給數(shù)字識別模塊,然后進(jìn)行識別并給處結(jié)果。在這里用到了很多先進(jìn)的圖像預(yù)處理技術(shù)及神經(jīng)網(wǎng)絡(luò)技術(shù)。</p><p><b> 5.1系統(tǒng)流程圖</b></p><p> 本系統(tǒng)總的流程結(jié)構(gòu)如圖5-1所示。</p><p&g
58、t; 圖5-1 系統(tǒng)總流程圖</p><p> 其中圖像預(yù)處理的流程如圖5-2 所示。</p><p> 圖5-2 圖像預(yù)處理流程圖</p><p> 神經(jīng)網(wǎng)絡(luò)數(shù)字識別的具體流程如圖5-3 所示。</p><p> 圖5-3 神經(jīng)網(wǎng)絡(luò)數(shù)字識別流程圖</p><p><b> 5.2程序?qū)崿F(xiàn)<
59、/b></p><p> 整個系統(tǒng)的程序?qū)崿F(xiàn)分為圖像預(yù)處理和神經(jīng)網(wǎng)絡(luò)識別兩大模塊。在圖像預(yù)處理的過程當(dāng)中,我們采用了許多圖像處理的技術(shù),最后把每個數(shù)字的特征提取出來。這些技術(shù)包括圖像數(shù)據(jù)讀取、圖像的灰度化、二值化、圖像的調(diào)整、離散噪聲點的去除、字符的切分、圖像的縮放、字符的細(xì)化、字符的平滑、圖像的求梯度等圖像處理技術(shù),最后是數(shù)字字符特征的提取。其結(jié)果再利用神經(jīng)網(wǎng)絡(luò)(這里我們選用BP網(wǎng)絡(luò))進(jìn)行字符識別。&l
60、t;/p><p> 利用神經(jīng)網(wǎng)絡(luò)進(jìn)行字符識別的過程主要包括網(wǎng)絡(luò)的訓(xùn)練、數(shù)據(jù)的讀取、字符的判定、結(jié)果的輸出。</p><p> 5.2.1圖像的預(yù)處理</p><p> 剛剛讀入的圖片如圖5-4所示。</p><p><b> 圖5-4初始圖片</b></p><p> (1)256色位圖灰度
61、化</p><p> 由于256色的位圖的調(diào)色板內(nèi)容比較復(fù)雜,使得圖像處理的許多算法都沒有辦法展開,因此有必要對它進(jìn)行灰度處理。所謂灰度圖像就是圖像的每一個象素的R、G、B分量的值是相等的。彩色圖像的每個象素的R、G、B值是不相同的,所以顯示出紅綠藍(lán)等各種顏色?;叶葓D像沒有這些顏色差異,有的只是亮度上的不同。灰度值大的象素點比較亮(象素值最大為255,為白色),反之比較暗(象素值最小為0,為黑色)。圖像灰度化有
62、各種不同的算法,比較直接的一種就是給象素的rgb 值各自一個加權(quán)系數(shù),然后求和;同時還要對調(diào)色板表項進(jìn)行相應(yīng)的處理。</p><p> 要注意的是,最后得到的結(jié)果一定要歸一到0-255 之內(nèi)。因為這是每個字節(jié)表示圖像數(shù)據(jù)的極限。</p><p> 經(jīng)過灰度處理后的256色位圖如圖5-5所示。</p><p> 圖5-5 經(jīng)過灰度處理的文件</p>
63、<p> ?。?)灰度圖像二值化</p><p> 在進(jìn)行了灰度化處理之后,圖像中的每個象素只有一個值,那就是象素的灰度值。它的大小決定了象素的亮暗程度。為了更加便利的開展下面的圖像處理操作,還需要對已經(jīng)得到的灰度圖像做一個二值化處理。圖像的二值化就是把圖像中的象素根據(jù)一定的標(biāo)準(zhǔn)分化成兩種顏色。在系統(tǒng)中是根據(jù)象素的灰度值處理成黑白兩種顏色。和灰度化相似的,圖像的二值化也有很多成熟的算法。它可以采用自
64、適應(yīng)閥值法,也可以采用給定閥值法。系統(tǒng)中采用的是給定閥值的方法。因為考慮到所要進(jìn)行處理的圖像大多是從印刷出版物上掃描得來的底色大多為白色所以我們將這個閾值固定為220,讀者也可以根據(jù)實際的情況來自己進(jìn)行閾值的設(shè)定。</p><p> 執(zhí)行結(jié)果如圖5-6所示</p><p> 圖5-6 二值化后的圖片</p><p> ?。?)圖像的梯度銳化</p>
65、<p> 由于需要處理的圖像大多有印刷出版物上掃描而來所以在很多的情況下字體模糊,對識別造成了一定的困難,所以有時我們要對圖像進(jìn)行銳化處理使模糊的圖像變得清晰起來,同時可以對噪聲起到一定的去除作用。圖像銳化的方法有很多,有一種是微分法 ,有一種是高通濾波法,我們在這里所采用的梯度銳化的方法就屬于微分法的一種。在這里我們采用Roberts梯度算子對圖像進(jìn)行銳化。</p><p><b>
66、 定義如下 :</b></p><p> 設(shè)原始圖像上的點為。</p><p> 定義在處的梯度矢量為:</p><p><b> (5-1)</b></p><p> 設(shè)一個判定閾值為,變化后的圖像定義為:</p><p><b> ?。?-2)</b>
67、</p><p> 通過公式可以看出梯度銳化可以讓模糊的邊緣變得清楚 同時選擇合適的閾值還可以減弱和消除一些細(xì)小的噪聲。本程序中給出了梯度銳化的完整代碼,也可以根據(jù)實際需求、讀入圖片的質(zhì)量來選擇決定是否使用梯度銳化。事實證明,梯度銳化具備一定的去噪聲能力,但同時會對字符的邊緣有所損傷。所以建議在圖片中字符較為細(xì)小的時候不要使用梯度銳化。</p><p> 經(jīng)過梯度銳化處理后的圖片如圖5
68、-7所示。</p><p> 圖5-7 梯度銳化后的圖像</p><p> 從處理的結(jié)果也可以看出圖像的邊緣變得清晰而且少了很多細(xì)小的雜點,但是梯度銳化有其自身的缺陷。當(dāng)處理的圖像邊緣很細(xì)的時候可能造成邊緣信息的損失(如圖5-8所示),所以務(wù)必注意,要根據(jù)實際情況酌情處理。</p><p> 圖5-8 對邊緣較細(xì)的圖像進(jìn)行梯隊銳化的結(jié)果</p>
69、<p> (4)去除離散的雜點噪聲</p><p> 圖像可能在掃描或者傳輸過程中夾帶了噪聲,去噪聲是圖像處理中常用的手法。通常去噪聲用濾波的方法,比如中值濾波、均值濾波。但是那樣的算法不適合用在處理字符這樣目標(biāo)狹長的圖像中,因為在濾波的過程中很有可能會去掉字符本身的象素。系統(tǒng)采用的是去除雜點的方法來進(jìn)行去噪聲處理的。具體算法如下:掃描整個圖像,當(dāng)發(fā)現(xiàn)一個黑色點的時候,就考察和該黑色點間接或者直接相
70、連接的黑色點的個數(shù)有多少,如果大于一定的值,那就說明該點不是離散點,否則就是離散點,把它去掉。在考察相連的黑色點的時候用的是遞歸的方法。</p><p> 執(zhí)行后的結(jié)果如圖5-9所示。</p><p> 圖 5-9 去除離散雜點噪聲后的圖像</p><p> ?。?)整體傾斜度調(diào)整</p><p> 因為讀進(jìn)來的圖像可能存在傾斜,所以必
71、須對它進(jìn)行調(diào)整,使得字符都處于同一水平位置,那樣即便利字符的分割也可以提高字符識別的準(zhǔn)確率。調(diào)整的算法主要是根據(jù)圖像上左右兩邊的黑色象素的平均高度來的。一般來說,眾多的字符組成的圖像它的左右兩邊的字符象素的高度應(yīng)該是處于水平位置附近的,如果兩邊字符象素的平均位置有比較大的起落,那就說明圖像存在傾斜,需要進(jìn)行調(diào)整。具體來說,首先要分別計算圖像左半邊和右半邊的象素的平均高度,然后求的斜率,根據(jù)斜率重新組織圖像,里面包含了一個從新圖像到舊圖像
72、的象素的映射。如果新圖像中的象素映射到舊圖像中時超出了舊圖像的范圍,則把新圖像中的該象素置白色。</p><p> 經(jīng)過傾斜度調(diào)整后的圖像如圖5-10所示。</p><p> 圖5-10 經(jīng)過傾斜度調(diào)整后的圖像</p><p><b> ?。?)字符分割</b></p><p> 系統(tǒng)在讀進(jìn)來的圖像中一般會含有多個
73、數(shù)字,識別的時候只能根據(jù)每個字符的特征來進(jìn)行判斷,所以還要進(jìn)行字符分割的工作。這一步工作就是把圖像中的字符獨立的分割出來。</p><p><b> 具體的算法如下:</b></p><p> 第一步,先自下向上對圖像進(jìn)行逐行掃描直至遇到第一個黑色的象素點。記錄下來。然后再由上向下對圖像進(jìn)行逐行掃描直至找到第一個黑色象素,這樣就找到圖像大致的高度范圍。</p
74、><p> 第二步,在這個高度范圍之內(nèi)在自左向右逐列進(jìn)行掃描,遇到第一個黑色象素時認(rèn)為是字符分割的起始位置,然后繼續(xù)掃描,直至遇到有一列中沒有黑色象素,則認(rèn)為這個字符分割結(jié)束,然后繼續(xù)掃描,按照上述的方法一直掃描直至圖像的最右端。這樣就得到了每個字符的比較精確寬度范圍。</p><p> 第三步,在已知的每個字符比較精確的寬度范圍內(nèi),按照第一步的方法,分別進(jìn)行自上而下和自下而上的逐行掃描來
75、獲取每個字符精確的高度范圍。</p><p> 進(jìn)行字符分割后并畫上邊框的圖像如圖5-11所示。</p><p> 圖5-11 經(jīng)過字符分割后并畫上邊框的圖像</p><p> ?。?)圖像的歸一化處理</p><p> 因為掃描進(jìn)來的圖像中字符大小存在較大的差異,而相對來說,統(tǒng)一尺寸的字符識別的標(biāo)準(zhǔn)性更強(qiáng),準(zhǔn)確率自然也更高,標(biāo)準(zhǔn)化圖像
76、就是要把原來各不相同的字符統(tǒng)一到同一尺寸,在系統(tǒng)實現(xiàn)中是統(tǒng)一到同一高度,然后根據(jù)高度來調(diào)整字符的寬度。具體算法如下:先得到原來字符的高度,跟系統(tǒng)要求的高度做比較,得出要變換的系數(shù),然后根據(jù)得到的系數(shù)求得變換后應(yīng)有得寬度。再得到寬度高度之后,把新圖像里面得點按照插值得方法映射到原圖像中。</p><p> 圖像標(biāo)準(zhǔn)歸一化的高度和寬度信息可以通過一個對話框由讀者自行輸入,但是為了以后特征提取的時候處理方便,進(jìn)行BP
77、網(wǎng)絡(luò)訓(xùn)練的時候縮短訓(xùn)練的時間,標(biāo)準(zhǔn)化的寬度和高度不要設(shè)置的過大。本系統(tǒng)中去歸一化寬度為20,高度為40。</p><p> 歸一化執(zhí)行效果如圖5-12所示。</p><p> 圖5-12 對圖像進(jìn)行歸一化處理</p><p> ?。?)圖像的緊縮重排</p><p> 經(jīng)過標(biāo)準(zhǔn)歸一化處理后的各個字符在圖像中的位置不定,要它進(jìn)行特征提取時
78、處理起來比較麻煩,所以要把歸一化后的字符進(jìn)行緊縮重排,以形成新的位圖句柄,以方便下一步的特征提取的操作。</p><p> 程序執(zhí)行效果如圖5-13所示。</p><p> 圖 5-13 圖像緊縮重排后的效果</p><p> 至此已經(jīng)基本完成圖像的預(yù)處理。此外,還可以采用些別的方法以更好的達(dá)到預(yù)處理的效果,比如可以對字符進(jìn)行光滑處理等。</p>
79、<p> 5.2.2用神網(wǎng)絡(luò)進(jìn)行字符識別</p><p> ?。?)BP神經(jīng)網(wǎng)絡(luò)簡介</p><p> 圖5-14 神經(jīng)元 </p><p> 神經(jīng)網(wǎng)絡(luò)簡介:人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN),也稱為神經(jīng)網(wǎng)絡(luò)(Neural Networks,NN)。即從生物學(xué)神經(jīng)系統(tǒng)的信號傳遞而抽象發(fā)展而
80、成的一門學(xué)科。在神經(jīng)網(wǎng)絡(luò)中,最基本的單元就是神經(jīng)元,如圖5-14。神經(jīng)元由三部分組成:樹突、細(xì)胞體和軸突。樹突是樹狀的神經(jīng)纖維接受網(wǎng)絡(luò),它將電信號傳遞給細(xì)胞體,細(xì)胞體對這些輸入信號進(jìn)行整合并進(jìn)行閥值處理。軸突是單根長纖維,它把細(xì)胞體的輸出信號導(dǎo)向其他的神經(jīng)元。神經(jīng)元的排列拓?fù)浣Y(jié)構(gòu)和突觸的連接強(qiáng)度確立了神經(jīng)網(wǎng)絡(luò)的功能。形象的說,神經(jīng)網(wǎng)絡(luò)是由大量處理單元(神經(jīng)元 Neurons)廣泛連接而成的網(wǎng)絡(luò),是對人腦的抽象、簡化和模擬,反映人腦的基本
81、特性。它能夠通過學(xué)習(xí)過程從外部環(huán)境中獲取知識,并且它內(nèi)部的很多的神經(jīng)元可以用來存儲這些已經(jīng)學(xué)到的知識[10]。</p><p> 圖5-15 神經(jīng)元抽象成的數(shù)學(xué)模型</p><p> 如圖5-15所示,神經(jīng)元的輸入是信號P,經(jīng)過一個累加器累加后的信號送入一個激活函數(shù)f,從而得到這個神經(jīng)元的輸出a。這個神經(jīng)元的輸出a同時又可以作為下一個或多個神經(jīng)元的輸入,從而將神經(jīng)信號成網(wǎng)絡(luò)分散狀的傳遞
82、出去。一個神經(jīng)元可以接受多個輸入,所以把神經(jīng)元表示成為矢量、矩陣形式更容易去處理分析實際問題。以上是對一個單層神經(jīng)網(wǎng)絡(luò)的描述。一般就實際情況而言,多層網(wǎng)絡(luò)用處要廣的多,如BP網(wǎng)絡(luò)。在多層網(wǎng)絡(luò)中,一般至少有3個層:一個輸入層、一個輸出層、一個或多個隱層。多層網(wǎng)絡(luò)可以解決很多單層網(wǎng)絡(luò)無法解決的問題,比如多層網(wǎng)絡(luò)可以用來進(jìn)行非線性分類,可以用來做精度極高的函數(shù)逼近,只要有足夠多的層和足夠多的神經(jīng)元,這些都可以辦到。一個多層網(wǎng)絡(luò)的輸入和輸出層的
83、神經(jīng)元個數(shù)是由外部描述定義的。例如如果有4個外部變量作為輸入,那網(wǎng)絡(luò)就要有4個輸入。</p><p> 神經(jīng)網(wǎng)絡(luò)有好多種,比如徑向基網(wǎng)絡(luò)、BP網(wǎng)絡(luò),Hopfield 網(wǎng)絡(luò)等。本系統(tǒng)采用的是最為廣泛運用的BP網(wǎng)絡(luò),如圖5-16所示。</p><p> 圖5-16 多層BP網(wǎng)絡(luò)示意圖</p><p> 神經(jīng)網(wǎng)絡(luò)的激勵函數(shù)。激勵函數(shù)將輸出信號壓縮在一個允許的范圍內(nèi),
84、使其成為有限值,通常神經(jīng)元輸出的范圍在【0,1】或者【-1,1】的閉區(qū)間上。常用的基本激勵函數(shù)有閾值函數(shù)、分段線性函數(shù)、Sigmoid 函數(shù)。其中Sigmoid 函數(shù)也稱為s型函數(shù),它是人工神經(jīng)網(wǎng)絡(luò)中用的最多的激勵函數(shù)。S型函數(shù)的定義如下[11]:</p><p><b> ?。?-3)</b></p><p> 神經(jīng)網(wǎng)絡(luò)的反饋調(diào)節(jié)。在誤差信號的反向傳播中,網(wǎng)絡(luò)不斷
85、的修正各個節(jié)點的權(quán)值。</p><p> 設(shè)有含n個節(jié)點的BP網(wǎng)絡(luò),采用s型激勵函數(shù)[12]。為簡單起見,可以假設(shè)網(wǎng)絡(luò)只有一個輸出y,任一節(jié)點的輸出為,并設(shè)有N個樣本(k = 1,2,…,N),對某一輸入,網(wǎng)絡(luò)的輸出為,節(jié)點i的輸出為,節(jié)點j的輸入為[13]:</p><p><b> ?。?-4)</b></p><p> 使用平方型誤差
86、函數(shù): </p><p><b> ?。?-5)</b></p><p> 其中為網(wǎng)絡(luò)之實際輸出,定義如下:</p><p><b> ?。?-6)</b></p><p><b> (5-7)</b></p><p><b&
87、gt; ?。?-8)</b></p><p><b> 其中:</b></p><p><b> (5-9)</b></p><p><b> 于是有:</b></p><p><b> ?。?-10)</b></p>&l
88、t;p><b> 當(dāng)j為輸出節(jié)點時,</b></p><p><b> ?。?-11)</b></p><p> 若j不是輸出節(jié)點時,有:</p><p><b> (5-12)</b></p><p> 本程序中BP網(wǎng)絡(luò)的設(shè)計</p><p&
89、gt; BP網(wǎng)絡(luò)的一個重要的用途就是用于模式識別[14]。我們的任務(wù)是要設(shè)計并訓(xùn)練出一個可行、高效的BP網(wǎng)絡(luò),以實現(xiàn)對0到9共10個數(shù)字和識別。</p><p> 經(jīng)圖像預(yù)處理過程之后,可以將最終提取到的字符的特征送入BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練及識別了。這里,假設(shè)我們設(shè)定的字符標(biāo)準(zhǔn)歸一化的寬度為20,高度為40,那么對于每個字符就有800維的特征。</p><p> 設(shè)計BP網(wǎng)絡(luò)的關(guān)鍵之處在于
90、高效的特征提取方法、大量有代表性的訓(xùn)練樣本、高效穩(wěn)定速收斂的學(xué)習(xí)方法[15]。</p><p> BP網(wǎng)絡(luò)應(yīng)用過程如圖5-17所示。</p><p> 圖5-17 BP網(wǎng)絡(luò)應(yīng)用流程</p><p> 使用BP網(wǎng)絡(luò)來進(jìn)行數(shù)字識別的流程如下:</p><p> 首先,利用大量的訓(xùn)練樣本來訓(xùn)練網(wǎng)絡(luò),以得到以文件形式保存的權(quán)值。訓(xùn)練樣本為精心
91、選擇的可以很好的反應(yīng)樣本可分性特性的已知數(shù)據(jù)。在程序中采用訓(xùn)練樣本圖片的形式。將訓(xùn)練樣本圖片進(jìn)行特征提取后,就可以送入BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練。在這里,作者采用了含有40個字符數(shù)據(jù)的圖像作為訓(xùn)練樣本。這副圖像包含了Arial字體書寫的普通的0到9的10個數(shù)字、斜體的10個數(shù)字、粗體的10個數(shù)字和10個傾斜的數(shù)字,總共40個,如圖5-18所示。</p><p> 圖5-18 40個訓(xùn)練樣本</p><
92、;p> 實驗證明,這40個訓(xùn)練樣本訓(xùn)練出來的BP網(wǎng)絡(luò)對于Arial字體的數(shù)字可以達(dá)到90%以上的識別率,而且網(wǎng)絡(luò)訓(xùn)練時間也是可以接受的(大約1~5秒鐘)。當(dāng)然如果采用400個訓(xùn)練樣本甚至更多的話,那無疑可以進(jìn)一步提高識別率,但訓(xùn)練時間往往會達(dá)到分鐘甚至更高到小時的級別,實際意義不大了。</p><p> 其次,訓(xùn)練完BP網(wǎng)絡(luò)后,就可以用它對為止數(shù)據(jù)進(jìn)行識別了。識別首先要經(jīng)過圖像預(yù)處理、特征提取,最后送入
93、BP網(wǎng)絡(luò)識別,直接得到結(jié)果。</p><p><b> 6 測試和程序運行</b></p><p> 6.1測試及識別過程</p><p> 打開含字符的圖像文件(訓(xùn)練的時候為訓(xùn)練樣本圖片,識別的時候為含有未知數(shù)字的圖片),并將圖像文件中除文件頭部分的其他所有信息讀入內(nèi)存。</p><p> 打開輸入歸一化寬度和
94、高度的對話框,接收用戶輸入。這里推薦用戶使用寬度為20高度為40的歸一化指標(biāo)。此歸一化指標(biāo)只由用戶輸入一次。</p><p> (3)然后進(jìn)行圖像的預(yù)處理。預(yù)處理的步驟依次如下:灰度化-> 二值化-> 銳化->去離散噪聲-> 整體傾斜調(diào)整-> 字符分割-> 尺寸標(biāo)準(zhǔn)歸一化-> 緊縮重排。至此,原先散落在圖像中的亮度不一、大小不一、斜度不一、粗細(xì)不一、同時還含有噪聲的數(shù)字
95、已經(jīng)被提取出來,亮度一致,尺寸標(biāo)準(zhǔn)化,去掉了傾斜,并且在很大程度上也去除了噪聲。</p><p> ?。?)下面就進(jìn)入BP網(wǎng)絡(luò)訓(xùn)練部分。訓(xùn)練之前首先要輸入BP訓(xùn)練的參數(shù),這里主要是訓(xùn)練步長和允許誤差。BP訓(xùn)練的時候,首先要對步驟(3)的結(jié)果來進(jìn)行特征提取,然后將提取的特征送入BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練。如果網(wǎng)絡(luò)設(shè)計得當(dāng),參數(shù)選擇也正確的話,那么BP網(wǎng)絡(luò)將會在有限步內(nèi)收斂。訓(xùn)練完畢的BP網(wǎng)絡(luò)將網(wǎng)絡(luò)的權(quán)值保存到文件中,以便下一
96、步識別的時候可以直接調(diào)用。</p><p> ?。?)現(xiàn)在可以真正進(jìn)入識別部分了。打開一副含有數(shù)字的圖像,然后是預(yù)處理,然后是特征提取,最后將提取后的特征送入BP網(wǎng)絡(luò),通過網(wǎng)絡(luò)的輸出可以判定輸入的字符,以實現(xiàn)數(shù)字字符的識別。識別的結(jié)果顯示在屏幕上,同時也存儲在文件中以保存。</p><p><b> 6.2程序運行</b></p><p>
97、 程序主界面如圖6-1所示。</p><p><b> 圖6-1</b></p><p> 程序主要功能都通過這幾個菜單來實現(xiàn)。常用的菜單也已經(jīng)集成到了工具欄上,像打開、保存、重新加載、訓(xùn)練網(wǎng)絡(luò)、識別功能都已經(jīng)做成了工具欄上的按鈕。</p><p> “文件”菜單主要負(fù)責(zé)文件的打開、保存以及重新加載(取消一切更改,重新打開)?!皥D像預(yù)處理
98、”菜單主要來對圖像進(jìn)行預(yù)處理,含歸一化信息的輸入。“神經(jīng)網(wǎng)絡(luò)識別”菜單主要實現(xiàn)對網(wǎng)絡(luò)的訓(xùn)練以及識別。</p><p> 下面我們來打開一副訓(xùn)練樣本進(jìn)行訓(xùn)練。效果如圖6-2。</p><p><b> 圖6-2</b></p><p> 然后,我們打開一副測試圖片來進(jìn)行識別,如圖6-3所示。</p><p><
99、b> 圖6-3</b></p><p> 進(jìn)行圖像預(yù)處理的結(jié)果,如圖6-4所示。</p><p><b> 圖6-4</b></p><p> 下面就可以點擊工具欄中的“R”按鈕來進(jìn)行識別了。識別結(jié)果如圖6-5所示。</p><p> 圖6-5 對測試圖片的識別結(jié)果</p>&l
100、t;p> 保存到文件中的結(jié)果如圖6-6所示。</p><p><b> 圖6-6</b></p><p> 至此,程序已經(jīng)完整的運行了一次由訓(xùn)練到識別的過程。再下一次進(jìn)行識別的時候,由于本次訓(xùn)練好的網(wǎng)絡(luò)已經(jīng)保存了下來,那么就可以直接識別了,無需再訓(xùn)練。當(dāng)然如果識別的對象發(fā)生了較大變化而難以識別的時候,就需要重新制作訓(xùn)練樣本并進(jìn)行識別了。</p>
101、<p><b> 6.3注意事項</b></p><p> 該程序設(shè)計時考慮了數(shù)字字符的很多變化情況,具備良好的適應(yīng)性,但識別率對于傾斜字符或者不同字體的字符來說就不是很高了,甚至出現(xiàn)無法識別的情況。如下圖所示,字符“3”傾斜后就無法識別出來了。此時可以通過加大訓(xùn)練樣本的數(shù)目來解決。將訓(xùn)練樣本數(shù)目增大到150個,并考慮進(jìn)來各種傾斜角度的以及其他幾種常用字體,那么該BP網(wǎng)絡(luò)將
102、會有更加普遍的適應(yīng)性和更高的識別率。</p><p> 考慮程序設(shè)計的方便,該程序中設(shè)計BP網(wǎng)絡(luò)的目標(biāo)輸出的時候,假定了目標(biāo)輸出為0,1,2,3,4,5,6,7,8,9的循環(huán)。所以在自行設(shè)計訓(xùn)練樣本的時候一定要注意,不要使用“0,2,1,3”這樣的訓(xùn)練樣本,這會導(dǎo)致無法訓(xùn)練成功。應(yīng)該使用“0,1,2,3”這樣的訓(xùn)練樣本。一定要遵循由0到9的順序來設(shè)計訓(xùn)練樣本。對于待識別圖片當(dāng)然沒有這種要求。</p>
103、<p> 在執(zhí)行圖像預(yù)處理時,盡量使用“一次性圖像預(yù)處理”。若要單獨執(zhí)行每一步,請務(wù)必記住:每一步要按順序執(zhí)行,且只能執(zhí)行一次。否則將會有意想不到的后果。比如說,就像梯度銳化,連續(xù)梯度銳化3次,那圖片上的數(shù)字基本上就沒了。這也就無法完成下一步的分割等操作了。</p><p> 識別時不要再改動歸一化信息。否則無法識別。歸一化信息應(yīng)該在訓(xùn)練之前設(shè)定,而且僅僅設(shè)定一次。識別時歸一化信息與訓(xùn)練時候的一
104、致,特征提取才能進(jìn)行,識別才能進(jìn)行。</p><p><b> 結(jié) 論</b></p><p> 對于印刷體的郵政編碼識別是為了適應(yīng)當(dāng)今郵政行業(yè)對郵件的高速分揀的業(yè)務(wù)需求而提出的,本文針對行業(yè)中郵件的特點和分揀要求,研究了自動識別出郵件上郵政編碼的簡單系統(tǒng)。其中,主要涉及的內(nèi)容包括了圖像的采集、背景的剔除、郵碼簽的提取、字符分割、數(shù)字識別,但重點研究的內(nèi)容式
105、對數(shù)字的識別過程。</p><p> 本文的四個組成部分為:</p><p><b> 圖像采集</b></p><p><b> 圖像預(yù)處理</b></p><p> 郵碼簽區(qū)域圖像的提取</p><p><b> 印刷體數(shù)字識別</b>&l
106、t;/p><p> 本文整體的設(shè)計思路是先通過攝像頭進(jìn)行圖像的采集,其實質(zhì)就是拍照。然后把拍到的照片傳輸?shù)诫娔X中,進(jìn)行預(yù)處理。接著便是從預(yù)處理好后的圖像中提取出郵碼簽的區(qū)域,把需要進(jìn)行智能識別的數(shù)字提取出來。最后通過軟件對阿拉伯?dāng)?shù)字進(jìn)行識別。這些環(huán)節(jié)中,本文的研究的重點放在了對數(shù)字的識別上。所以,軟件的相關(guān)設(shè)計就需要大量的理論基礎(chǔ)和實際工作量。但是真正的難點在于怎樣提取出數(shù)字,本文在這方面只是做了理論上的初步認(rèn)識,
107、并沒有進(jìn)行實際的實驗。所以這一部分的研究需要以后進(jìn)行大量的實驗工作進(jìn)行總結(jié)和改進(jìn)。</p><p> 本系統(tǒng)的設(shè)計相對有些簡單,因此還需要在以下方面進(jìn)行研究:</p><p> 首先,采集部分的設(shè)計有些粗糙。運用一般的攝像頭進(jìn)行在傳輸帶上移動的郵件的圖像的采集,可能會導(dǎo)致圖像一定程度的模糊。而且對郵件擺放的間隔和郵件大小都有很大程度上的限制。因此,今后可以在這一部分進(jìn)行深入研究和實驗,
108、使采集到的圖像更加清晰,減小圖像處理過程的難度。</p><p> 第二,對于數(shù)字從郵件上提取出來的方法也還待改進(jìn),這就包括了怎樣更加高效和準(zhǔn)確的提取出手寫體郵政編碼部分的圖像。這里背景的濾出就很重要。本文由于通過“異或”邏輯過于簡單,使得在光帶邊緣存在較為粗糙的光帶紋理無法被完全抑制,因此,為后續(xù)的提取工作帶來了不利影響。</p><p> 第三,可以以此為基礎(chǔ),進(jìn)行漢字的識別工作。
109、</p><p> 可以預(yù)見,隨著本課題的不斷研究創(chuàng)新,先進(jìn)的、智能的識別系統(tǒng)將會在未來為我國郵政事業(yè)的發(fā)展添上濃重的一筆,我國的郵件分揀自動化程度將上一個新的臺階。</p><p><b> 參考文獻(xiàn)</b></p><p> [1]Rafael C G, Richard E W. Digital Image Processing(2
110、th ed) [M ]. New Jersey: Prentice Hall, 2002.</p><p> [2]Richard O D, Peter E H, David G S. Pattern Classifi2cation (2 th ed) [M ]. 李宏東譯. 北京: 機(jī)械工業(yè)出版社, 2003</p><p> [3]王林泉, 汪午龍, 湯笑笑. 手寫漢字識別預(yù)處理算
111、法研究[ J ]. 計算機(jī)工程, 1995. 21 (5) : 56 - 58.</p><p> [4]何 斌, 馬天予. Visual C + +數(shù)字圖像處理[M ].北京: 人民郵電出版社, 2003.</p><p> [5]楊枝靈, 王 開. Visual C + +數(shù)字圖像獲取、處理及實踐應(yīng)用[M ]. 北京:人民郵電出版社, 2003.</p><p&
112、gt; [6]李煒,黃心漢,王敏,等.車牌自動識別系統(tǒng)中車牌分割的研究[J].信號處理,2000,16(3):41—44.</p><p> [7]廖翔云,許錦標(biāo),龔仕偉.車牌識別技術(shù)研究[J].微機(jī)發(fā)展,2003,13(6):31-33.</p><p> [8]郭景云.圖像處理與車牌識別[J].科技資訊,2007,12(1):6.</p><p> [9
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 郵政編碼自動識別系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 郵政編碼查詢系統(tǒng)的研究與設(shè)計-畢業(yè)設(shè)計論文
- 郵政編碼的含義
- [vf畢設(shè)]郵政編碼系統(tǒng)
- 畢業(yè)論文----車牌識別系統(tǒng)的設(shè)計
- 郵政編碼系統(tǒng)說明書.doc
- 無錫市郵政編碼
- 指紋識別系統(tǒng)設(shè)計畢業(yè)論文
- 數(shù)字識別系統(tǒng)的畢業(yè)論文
- 全國主要城郵政編碼
- 畢業(yè)論文-rfid自動識別系統(tǒng)設(shè)計
- 畢業(yè)論文-rfid自動識別系統(tǒng)設(shè)計
- 全國主要城郵政編碼
- 全國主要城郵政編碼
- 畢業(yè)論文外文翻譯-一種在線圖像編碼識別系統(tǒng)的設(shè)計
- 基于svm的刀具狀態(tài)識別系統(tǒng)設(shè)計——畢業(yè)論文
- 畢業(yè)論文--基于matlab的人臉識別系統(tǒng)設(shè)計
- 基于opencv的視頻人臉識別系統(tǒng)-畢業(yè)論文
- 基于SVM的刀具狀態(tài)識別系統(tǒng)設(shè)計畢業(yè)論文.docx
- 基于圖像識別的車型識別系統(tǒng)畢業(yè)論文
評論
0/150
提交評論