郵政編碼識(shí)別系統(tǒng)的設(shè)計(jì)畢業(yè)論文

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-03-01 格式：doc 頁數(shù)：36 大?。?.76MB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

郵政編碼識(shí)別系統(tǒng)的設(shè)計(jì)畢業(yè)論文_第1頁

已閱讀1頁，還剩35頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、　　學(xué)號(hào)： 0902174075　　郵政編碼識(shí)別系統(tǒng)的設(shè)計(jì)　　The design of postal code identification system　　專業(yè)名稱：電子信息工程 　　年級(jí)班別： 2009級(jí) <

2、/p>　　姓名：馬林 　　指導(dǎo)教師：李偉 　　2013年4月　　目錄　　摘要

3、2　　1 前言4　　1.1 課題研究的背景和意義4　　1.2 數(shù)字圖像處理技術(shù)5　　1.3 課題研究的內(nèi)容6　　2 系統(tǒng)結(jié)構(gòu)概述7<

4、p>　　2.1軟件平臺(tái)概述7　　2.2功能模塊的劃分7　　3 圖像的采集8　　3.1 分辨率的選擇8　　3.2 采樣頻率的設(shè)置8　　3.3 物距的選擇8

5、　　4 郵件上郵碼簽圖像的提取9　　4.1圖像數(shù)據(jù)的抽樣9　　4.2圖像背景的濾出11　　4.3郵碼簽的定位11　　4.4 圖像灰度分布特征的求解與算法12　　4.5 郵政編碼區(qū)域的提取14<

6、/p>　　5 數(shù)字識(shí)別系統(tǒng)的設(shè)計(jì)17　　5.1系統(tǒng)流程圖17　　5.2程序?qū)崿F(xiàn)18　　5.2.1圖像的預(yù)處理18　　5.2.2用神網(wǎng)絡(luò)進(jìn)行字符識(shí)別23　　6 測試和程序運(yùn)行28</p&

7、gt;　　6.1測試及識(shí)別過程28　　6.2程序運(yùn)行29　　6.3注意事項(xiàng)32　　結(jié) 論33　　參考文獻(xiàn)34<

8、b>　　致謝35　　摘要　　隨著郵政業(yè)務(wù)技術(shù)的發(fā)展，郵政設(shè)備的推廣使用工作有了很大的進(jìn)展，使我國的郵政業(yè)務(wù)處理水平有了很大的提高，郵政業(yè)務(wù)處理正走向機(jī)械化、自動(dòng)化和網(wǎng)絡(luò)化。一個(gè)高速、高效的郵政處理體系正在形成。　　本文正是基于如今的形式

9、，設(shè)計(jì)了一套便于郵件處理的系統(tǒng)，以提高工作效率，減輕人工工作量。這套系統(tǒng)的設(shè)計(jì)包括了圖像采集、圖像預(yù)處理、圖像初步提取和郵政編碼識(shí)別這四個(gè)主要的組成部分，本文把重點(diǎn)研究放在了數(shù)字的識(shí)別上。在這個(gè)過程中，用到了好多圖像處理中的相關(guān)技術(shù)，比如灰度化、二值化、圖像內(nèi)容自動(dòng)調(diào)整、去離散點(diǎn)、圖像的縮放、細(xì)化、曲線平滑、曲線去枝椏操作等，最后還使用了神經(jīng)網(wǎng)絡(luò)對(duì)提取到的數(shù)字信息進(jìn)行分析判斷。本文通過相關(guān)軟件的設(shè)計(jì)，達(dá)到了對(duì)采集到的圖像進(jìn)行智能識(shí)別的目

10、標(biāo)。這使郵件地分揀過程更加高效，促進(jìn)了郵件分揀的自動(dòng)化程度。　　關(guān)鍵詞：抽樣；圖像分割；二值化；模式識(shí)別　　ABSTRACT　　With the development of postal services technology, promoting use of post

11、al equipment has made a lot of progress in its work, the level of postal service in China has been greatly improved, postal services are heading for mechanization, automation and networking.　　A high

12、speed and efficient postal system is taking shape. This article is based on the forms, design a message handling system, in order to enhance efficiency, reduce manual workload. The system design includes a preliminary ex

13、traction of image acquisition, image processing, image and zip code to identify the four main components of this article on focused research on digital identification. In this process, used a lot of image processing tech

14、nology, such as grayscale, binary, image content auto　　The mail sorting process more efficient, facilitating automation of mail sorting.　　Key Words：Sampling; Image Acquisition; B

15、inarization; Pattern Recognition　　1 前言　　1.1 課題研究的背景和意義　　近年來，隨著郵政業(yè)務(wù)，技術(shù)的發(fā)展，郵政設(shè)備的推廣使用工作有了很大的進(jìn)展，使我國的郵政業(yè)務(wù)處理水平有了很大的提高，郵政業(yè)務(wù)處理正走向機(jī)械化、自動(dòng)化和網(wǎng)絡(luò)化。一個(gè)高速、

16、高效的郵政處理體系正在形成。　　計(jì)算機(jī)網(wǎng)絡(luò)、數(shù)據(jù)庫技條形碼技術(shù)、模式識(shí)別技術(shù)以及與計(jì)算機(jī)相協(xié)調(diào)的打印技術(shù)和設(shè)備的發(fā)展，大大推動(dòng)了郵政自動(dòng)化的進(jìn)程。許多技術(shù)都被應(yīng)用到信函分揀的機(jī)械和電子設(shè)備中，極大的提高了信函的分揀速度與效率，降低了出錯(cuò)的幾率，減輕了許多工作人員的工作壓力。　　但是，我國郵政設(shè)備整體的自動(dòng)化程度還很低，與世界先進(jìn)水平也有一定的差距。我國普

17、遍存在的是最原始的人工處理的情況，處理速度很慢。眾多的事實(shí)證明，采用高新技術(shù)、提高郵件處理設(shè)備的自動(dòng)化程度是加快郵件處理傳遞速度、減少郵件處理成本和提高郵政分揀效率的重要手段。因此郵件分揀自動(dòng)化的技術(shù)就很值得仔細(xì)研究。　　信件、包裹等的收寄工作是郵政部門的一項(xiàng)重要任務(wù)。當(dāng)前，許多的信件、包裹等的分揀工作主要是有人工完成的，這樣的工作效率較低，而成本卻較高。特別是近幾年，隨著網(wǎng)絡(luò)購物的迅猛發(fā)展，郵

18、購將迎來高峰，那時(shí)，工作量將急速增加，包裹的分揀將回更加耗時(shí)耗力，目前的分揀處理能力將遠(yuǎn)遠(yuǎn)不能夠滿足市場的要求了。　　所以，研究出高效率、高自動(dòng)化程度且實(shí)用性強(qiáng)的包裹分揀設(shè)備就成為郵政行業(yè)、快遞行業(yè)迫在眉睫的問題，這對(duì)刺激我國消費(fèi)，推進(jìn)我國郵政、快遞事業(yè)的發(fā)展就具有很重要的意義了。　　1.2 數(shù)字圖像處理技術(shù)&l

19、t;b>　　概念　　數(shù)字圖像處理(DigitalImageProcessing)是通過計(jì)算機(jī)對(duì)圖像進(jìn)行去除噪聲、增強(qiáng)、復(fù)原、分割、提取特征等處理的方法和技術(shù)。數(shù)字圖像處理的產(chǎn)生和迅速發(fā)展主要受三個(gè)因素的影響：一是計(jì)算機(jī)的發(fā)展；二是數(shù)學(xué)的發(fā)展(特別是離散數(shù)學(xué)理論的創(chuàng)立和完善)；三是廣泛的農(nóng)牧業(yè)、林業(yè)、環(huán)境、軍事、工業(yè)和醫(yī)學(xué)等方面的應(yīng)用需求的增長。&

20、lt;p>　　發(fā)展情況　　20世紀(jì)20年代,圖像處理首次應(yīng)用于改善倫敦和紐約之間海底電纜發(fā)送的圖片質(zhì)量。到20世紀(jì)50年代,數(shù)字計(jì)算機(jī)發(fā)展到一定的水平后,數(shù)字圖像處理才真正引起人們的興趣。1964年美國噴氣推進(jìn)實(shí)驗(yàn)室用計(jì)算機(jī)對(duì)“徘徊者七號(hào)”太空船發(fā)回的大批月球照片進(jìn)行處理,收到明顯的效果[1]。20世紀(jì)60年代末,數(shù)字圖像處理具備了比較完整的體系,形成

21、了一門新興的學(xué)科。20世紀(jì)70年代,數(shù)字圖像處理技術(shù)得到迅猛的發(fā)展,理論和方法進(jìn)一步完善,應(yīng)用范圍更加廣泛。在這一時(shí)期,圖像處理主要和模式識(shí)別及圖像理解系統(tǒng)的研究相聯(lián)系,如文字識(shí)別、醫(yī)學(xué)圖像處理、遙感圖像的處理等。20世紀(jì)70年代后期到現(xiàn)在,各個(gè)應(yīng)用領(lǐng)域?qū)?shù)字圖像處理提出越來越高的要求,促進(jìn)了這門學(xué)科向更高級(jí)的方向發(fā)展。特別是在景物理解和計(jì)算機(jī)視覺(即機(jī)器視覺)方面,圖像處理已由二維處理發(fā)展到三維理解或解釋。近年來,隨著計(jì)算機(jī)和其它各有

22、關(guān)領(lǐng)域的迅速發(fā)展,例如在圖像表現(xiàn)、科學(xué)計(jì)算可視化、多媒體計(jì)算技術(shù)等方面[2]的發(fā)展,數(shù)字圖像處理已從一個(gè)專門的研究領(lǐng)域變成了科學(xué)研究和人機(jī)界面中的一種普遍應(yīng)用的工具。3)研究內(nèi)容　　數(shù)字圖像處理的主要研究內(nèi)容[3]，根據(jù)其主要的處理流程與處理目標(biāo)大致可以分為圖像信息的描述、圖像信息的處理、圖像信息的分析、圖像處理的編碼以及圖像信息的顯示等幾個(gè)方面具體包括以下的研究方向：

23、　?、賵D像數(shù)字化　?、趫D像增強(qiáng)　?、蹐D像幾何變換　?、軋D像恢復(fù)　?、輬D像重建<

24、/b>　?、迗D像隱藏　　⑦圖像變換　?、鄨D像編碼　?、釄D像識(shí)別與理解

25、1.3 課題研究的內(nèi)容　　確定郵件表面圖像數(shù)據(jù)的采集方案。　　觀察郵件表面圖像的特點(diǎn)，研究圖像的預(yù)處理算法，取出圖像分析的干擾因素，研究郵件表面碼簽的圖像特點(diǎn)，尋找快速的郵碼簽定位算法。　　分析郵政編碼的圖像特征，研究其在郵碼簽圖像區(qū)域中的定位算法。　　針對(duì)印刷體郵政編碼

26、的特點(diǎn)結(jié)合數(shù)字分割與識(shí)別算法研究適用于郵政編碼識(shí)別的分割和識(shí)別算法，本文運(yùn)用神經(jīng)網(wǎng)絡(luò)來進(jìn)行數(shù)字識(shí)別。　　編制系統(tǒng)的軟件和算法的分析試驗(yàn)軟件。　　2 系統(tǒng)結(jié)構(gòu)概述　　2.1軟件平臺(tái)概述　　Micro

27、soft Visual C++，（簡稱Visual C++、MSVC、VC++或VC）微軟公司的C++開發(fā)工具，具有集成開發(fā)環(huán)境，可提供編輯C語言，C++以及C++/CLI等編程語言。VC++整合了便利的除錯(cuò)工具，特別是整合了微軟視窗程式設(shè)計(jì)（Windows API）、三維動(dòng)畫DirectX API，Microsoft .NET框架。目前最新的版本是Microsoft Visual C++ 2008[4]。<

28、;p>　　Visual C++以擁有“語法高亮”，IntelliSense（自動(dòng)編譯功能）以及高級(jí)除錯(cuò)功能而著稱。比如，它允許用戶進(jìn)行遠(yuǎn)程調(diào)試，單步執(zhí)行等。還有允許用戶在調(diào)試期間重新編譯被修改的代碼，而不必重新啟動(dòng)正在調(diào)試的程序。其編譯及建置系統(tǒng)以預(yù)編譯頭文件、最小重建功能及累加連結(jié)著稱。這些特征明顯縮短程式編輯、編譯及連結(jié)的時(shí)間花費(fèi)，在大型軟件計(jì)劃上尤其顯著[5]。　　2.2功能模塊的劃

29、分　　圖像采集　　運(yùn)用攝像頭對(duì)傳輸帶上的郵件進(jìn)行拍照，獲取初步的圖像信息，為后面郵碼簽圖像的提取提供素材。　　郵碼簽圖像提取　　圖像預(yù)處理模塊通過分析由圖像采集模塊提供的圖像原始信息，尋找圖像數(shù)據(jù)

30、中的有用信息，剔除圖像數(shù)據(jù)中的無用信息。然后通過邊沿提取、幾何特征分析，獲得郵簽碼的位置信息、傾斜角度，并對(duì)郵簽碼圖像進(jìn)行比例縮放、旋轉(zhuǎn)和郵政編碼定位、提取。　　郵政編碼識(shí)別　　基于BP神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)程序，通過設(shè)計(jì)的軟件對(duì)提取出的郵碼簽圖像的數(shù)字進(jìn)行最后的識(shí)別。

31、;　　3 圖像的采集　　本系統(tǒng)主要的圖像采集參數(shù)有：攝像頭分辨率、采樣頻率、物距等。　　3.1 分辨率的選擇　　為達(dá)到文字識(shí)別的效果，每個(gè)字符至少有810點(diǎn)陣。而我國郵碼簽上通常使用的最小字體是5號(hào)，大小為23mm，所以只要達(dá)到102dpi的分辨率就能滿足要求，但在圖像處理過程中，必然會(huì)發(fā)生信

32、息損失，因此要求采用較高分辨率進(jìn)行補(bǔ)償。所以一般的攝像頭只要比以上分辨率稍大就可以?，F(xiàn)在市場上一般的攝像頭是130萬像素，所以大多都是符合本系統(tǒng)的。　　3.2 采樣頻率的設(shè)置　　對(duì)郵件可以進(jìn)行定時(shí)拍照，每間隔0.1s拍一次，即采樣頻率為10Hz。　　3.3 物距的選擇<

33、/p>　　由于采樣頻率為10Hz，故可以在傳送速度為1m/s的傳送帶上間距0.1m或者0.1m的整數(shù)倍進(jìn)行物體的擺放，這樣就剛好可以使攝像頭每次剛好拍到郵件表面的郵碼簽。　　4 郵件上郵碼簽圖像的提取　　4.1圖像數(shù)據(jù)的抽樣　　1）由于從圖像采集卡中獲取的一幅圖像的數(shù)據(jù)量相當(dāng)大(典型值

34、為25MB)，再加上系統(tǒng)的高實(shí)時(shí)性要求，所以，通常的預(yù)處理工作比如低通濾波、邊沿增強(qiáng)、灰度均衡等等算法的運(yùn)算量都是非常巨大的。舉一個(gè)簡單的例子：如平滑濾波，它的作法是對(duì)于任一像素，將其及其周圍的8個(gè)像素(共9個(gè)像素)構(gòu)成的灰度矩陣進(jìn)行模板運(yùn)算。模板運(yùn)算在圖像處理中經(jīng)常要用到，可以看出，它是一項(xiàng)非常耗時(shí)的運(yùn)算。以模板為例，每個(gè)像素完成一次模板操作要用9個(gè)乘法，8個(gè)加法，1個(gè)除法。對(duì)于一幅 (寬度高度)的圖像，就是9n2個(gè)乘法，8n2個(gè)加法

35、和n2個(gè)除法，算法復(fù)雜度為n2的函數(shù)，這對(duì)于25MB的大圖像來說，運(yùn)算量是非常巨大的，根本不可能實(shí)時(shí)完成。即使設(shè)法將2維模板運(yùn)算轉(zhuǎn)換成1維模板運(yùn)算，雖然可顯著提高運(yùn)算的速度，然而依然是不適合大圖像的實(shí)時(shí)處理的。因此，為了解決上述問題，必須對(duì)圖像數(shù)據(jù)進(jìn)行抽樣，減少圖像像素點(diǎn)[6]。　　關(guān)于圖像抽樣的算法較多，比較常用的是采用金字塔法，又叫多解析(Multiresolution)方法.它是使用同一幅

36、圖像的幾種不同解析度的拷貝描述方法。用多解析算法可以提供圖像細(xì)節(jié)的抽象描述。多解析技術(shù)應(yīng)用于灰度和二值圖像分析，便可以得到所謂的圖像金字塔。圖像金字塔是一個(gè)圖像系列。頂層陣列的大小為l：底層陣列是大小為2n2n的整幅圖像；中間各層的解析度大小為2k2k，k=l，2，...，n-1。中間層圖像是用一種自底向上的方法建立的。第k層的像素fk(i,j)，由第k+l層的四個(gè)相鄰像素得到[7]：<b

37、>　　(4-1）　　這里，g為一個(gè)映射函數(shù)。它可以是取局部均值、局部最大值、局部中值、或者局部形態(tài)變換等作為映射關(guān)系，這種映射關(guān)系也可以理解為對(duì)圖像的一種抽樣重組。在計(jì)算機(jī)的存儲(chǔ)實(shí)現(xiàn)上，用四叉數(shù)的數(shù)據(jù)結(jié)構(gòu)描述金字塔的圖像數(shù)據(jù)結(jié)構(gòu)，位于四叉數(shù)最末段的節(jié)點(diǎn)表達(dá)了整幅圖像的實(shí)際信息，它的上一級(jí)節(jié)點(diǎn)表達(dá)，它的4個(gè)子節(jié)點(diǎn)的圖像抽樣信息，最頂端的根節(jié)點(diǎn)表達(dá)了整幅圖像的抽樣信息。這樣

38、每一個(gè)層次都反映整幅圖像的特征，位置越低的層表達(dá)的信息越詳細(xì)，位置越高的層表達(dá)的信息相對(duì)粗略。但它的主要缺陷是占用多余的存儲(chǔ)空間來保存樹的關(guān)系結(jié)構(gòu)。　　另外的一種抽樣方法是柵條抽樣，即沿圖像的某一維方向，等距離等寬度地提取柵條圖像，構(gòu)成抽樣圖像。當(dāng)抽樣方向同線陣CCD的掃描方向一致時(shí)，實(shí)際上等同于降低采樣頻率，把圖像像沿掃描方向壓縮。　　考慮到在后續(xù)處理

39、中要避進(jìn)行背景濾除，柵條抽樣有利于獲得背景的統(tǒng)計(jì)信息，因此，本系統(tǒng)采用柵條抽樣。　　圖像采集模塊從圖像采集卡獲取整幅圖像數(shù)據(jù)并存放在系統(tǒng)內(nèi)存中(數(shù)據(jù)結(jié)構(gòu)為二維數(shù)組)，預(yù)處理模塊從該二維數(shù)組中提取n條水平條狀數(shù)據(jù)。假定條高度(即數(shù)組的行數(shù))為Ht；，條長度（即數(shù)組的列數(shù))為W1,下面以n=7為例，加以說明，如圖3-1所示：　　圖4-1

40、柵條抽樣　　4.2圖像背景的濾出　　如果攝像頭采用兩個(gè)高壓鈉燈作為輔助光源，而傳送帶采用的是黑色的橡膠帶，所以由鈉燈發(fā)出的強(qiáng)光經(jīng)傳送帶表面反射，會(huì)在攝像頭的焦平面上形成兩個(gè)很亮的區(qū)域。采用線陣CCD作為光敏器件時(shí)，會(huì)在最終獲得的圖像的固定區(qū)域沿傳送帶運(yùn)動(dòng)方向會(huì)產(chǎn)生兩條很亮的光帶，而且由于傳送帶有凸凹不平的表面，所以這兩條光帶并不均勻。

41、對(duì)實(shí)際采集圖像進(jìn)行分析發(fā)現(xiàn)，當(dāng)傳送帶沒有載運(yùn)郵件的時(shí)候，攝像頭捕捉到的圖像已經(jīng)包含相當(dāng)多的灰度成分，這對(duì)以后的處理是不利的。上述圖像實(shí)際上是通常所說的“背景”。　　在有背景的圖像中，光源在傳送帶上的“背景像”已經(jīng)嚴(yán)重地影響到了郵件所成的像。因此，在進(jìn)行圖像變換處理之前，必須設(shè)法消除背景的影響。通常的背景剔除算法是在已知背景圖像的前提下，將實(shí)際圖像(包含前景圖像)同背景圖像作“異或”運(yùn)算[8]。經(jīng)

42、過“異或”運(yùn)算后，光帶會(huì)被明顯削弱，前景圖像就會(huì)變得更加清晰。　　4.3郵碼簽的定位　　普通的郵碼簽一般為矩形白紙，包含黑字印刷體漢字(地址信息)和數(shù)字(郵政編碼)，粘貼位置一般在郵件的中央，但也存在其他可能。對(duì)于這種情況，定位方法一般是首先確定從整幅圖像中找到包含郵件圖像的有效區(qū)域，縮小對(duì)象范圍，然后再在這一較小區(qū)

43、域中搜尋包含郵碼簽的區(qū)域。由于郵碼簽特征不夠明顯(相對(duì)于第二種情況而言)及位置的隨意性(相對(duì)于第一種情況而言)，所以給郵碼簽的發(fā)現(xiàn)算法的準(zhǔn)確性帶來了極大的困難，同時(shí)又由于目標(biāo)圖像數(shù)據(jù)量巨大，又為如何提高算法的速度帶來了難題。　　考察實(shí)際郵件表面的狀況，發(fā)現(xiàn)在郵件表面，不僅有郵碼簽，同時(shí)還有可能有包裝帶、圖形文字污損、破損等實(shí)體的像，這些像都會(huì)影響郵碼簽的定位。因此算法必須能幣確區(qū)分真正的郵碼簽區(qū)

44、域和偽郵碼簽區(qū)域。為了有效地區(qū)分包含郵碼簽的區(qū)域，必須總結(jié)出能描述郵碼簽特征的相關(guān)判據(jù)。經(jīng)過對(duì)大量包狀郵件表面外觀的統(tǒng)計(jì)和分析，總結(jié)出以下判據(jù)：　　1）郵碼簽的幾何形狀為矩形，簡稱幾何形狀判據(jù)；　　2）長寬有一定的范圍，簡稱幾何尺寸判據(jù)；　　3）碼簽顏色為白色，上有黑色文字，它的灰度值同郵件表面的灰度有較大差異，

45、簡稱灰度能量判據(jù)。　　首先先從整幅圖像中找到灰度發(fā)生變化的不連續(xù)區(qū)域，例如郵碼簽、包裝帶、破損、折疊、陰影、透明膠帶等實(shí)體的像，然后在這些備選區(qū)域中根據(jù)上述三個(gè)判據(jù)，確定要求的郵碼簽區(qū)域。同時(shí)具備上述特征的區(qū)域，可以認(rèn)為是郵碼簽區(qū)域。任一判據(jù)不滿足，均認(rèn)為不是郵碼簽區(qū)域。例如，郵件表面的包裝帶，一般為自色，它的像為矩形，但是長寬不符合郵碼簽的幾何尺寸判據(jù)條件(幾何形狀過于細(xì)長)：郵件表面如果出現(xiàn)

46、大面積的破損，破損處的像的灰度值較低，可通過灰度能量判據(jù)排除，同時(shí)它的形狀也可能不規(guī)則，所以，也可用幾何形狀進(jìn)行排除；郵件表面粘貼的透明膠帶，由于膠帶表面反光強(qiáng)烈，因此，它的像灰度值很高，可能超過郵碼簽的灰度范圍，即使恰好在郵碼簽的灰度范圍中，但很可能它的形狀(即長寬尺寸)不符合郵碼簽的條件。通過上述三個(gè)判據(jù)的判定，一般可找到正確的郵碼簽區(qū)域。如果結(jié)果中有多個(gè)區(qū)域被判定為郵碼簽區(qū)域，即算法的結(jié)果不唯一，可分兩種情況分別對(duì)待：系統(tǒng)要求進(jìn)行

47、多目標(biāo)處理和系統(tǒng)要求進(jìn)行單目標(biāo)處理。　　針對(duì)前一種情況，由于多個(gè)目標(biāo)具有近似的特征，可為三個(gè)判據(jù)設(shè)定加權(quán)因子，計(jì)算每一各選區(qū)域的權(quán)值，然后進(jìn)行排序，權(quán)值較大的認(rèn)為是要求區(qū)域。但是加權(quán)因子的值需要根據(jù)大量實(shí)測數(shù)據(jù)統(tǒng)計(jì)獲取，本文暫不作討論。對(duì)于后者，各備選區(qū)域差異較大，一般滿足三判據(jù)的可認(rèn)定為郵碼簽區(qū)域，如果出現(xiàn)多個(gè)結(jié)果，為了提高整個(gè)系統(tǒng)的識(shí)別率，可在后續(xù)的郵政編碼提取過程中判斷這若干個(gè)結(jié)果哪一個(gè)為

48、真。針對(duì)多判據(jù)綜合的方法，必須針對(duì)每一判據(jù)制定各自的算法。因此，問題歸結(jié)為矩形區(qū)域的發(fā)現(xiàn)、矩形幾何尺寸的判斷、灰度能量集中區(qū)域的尋找。然后，通過這三種算法的結(jié)果綜合出最終結(jié)果。由于判據(jù)二依賴于判據(jù)一的結(jié)果，所以可將兩者加以合并，得出最終的求解模型，即求解圖像中符合尺寸要求的矩形連通域和求解圖像中灰度能量集中區(qū)域的點(diǎn)集合。　　4.4 圖像灰度分布特征的求解與算法<p&

49、gt;　　首先引入一個(gè)灰度能量的概念：由于像素點(diǎn)的灰度值是一個(gè)0～255之間的整數(shù)值，它代表了該像素點(diǎn)對(duì)光源的反射強(qiáng)度。換句話說，就是光線投射在成像焦平面的能量強(qiáng)度，所以某像素點(diǎn)的灰度值可理解為該點(diǎn)的灰度能量，同理，推廣到區(qū)域，可以用某一區(qū)域的灰度均值反映該區(qū)域的次度能量?；叶饶芰糠ǖ幕舅悸肥牵杭俣繕?biāo)區(qū)域的灰度值同非目標(biāo)區(qū)域的灰度值有一個(gè)較大的差值，通過計(jì)算灰度能量集中區(qū)域，發(fā)現(xiàn)要求目標(biāo)區(qū)域的位置。實(shí)際應(yīng)用中，郵碼簽一般為灰度值較高

50、的白色，郵件包裝袋、箱為灰度值較低的棕色、褐色等，所以對(duì)郵件表面圖像的灰度進(jìn)行能量統(tǒng)計(jì)，在郵碼簽的位置將出現(xiàn)一個(gè)峰值。這樣，搜索郵碼簽位置的工作歸結(jié)為求解圖像的灰度能量峰值。進(jìn)行灰度能量的統(tǒng)計(jì)所要運(yùn)用到的計(jì)算是求均值，也就是進(jìn)行大量的加法和少量的除法，計(jì)算速度較快。但是由于原始圖像的尺寸太大，所以仍有必要進(jìn)行抽樣統(tǒng)計(jì)，抽樣統(tǒng)計(jì)可以在前述的柵條抽樣的基礎(chǔ)上沿x方向再抽樣，形成如圖4-2所示的白色小正方形抽樣區(qū)域，這樣就可對(duì)每一抽樣區(qū)域進(jìn)行

51、灰度能量統(tǒng)計(jì)，得出整幅圖像的灰度能量分布。很明顯，落在圖中的傾斜矩形區(qū)域中的小正方形區(qū)域的灰度能量統(tǒng)計(jì)值要明顯高于落在黑色背景區(qū)域　　圖4-2 灰度能量統(tǒng)計(jì)法原理　　計(jì)算方法仍然運(yùn)用表決器進(jìn)行，即根據(jù)幾何特征法得出的若干個(gè)備選矩形區(qū)域設(shè)立同樣數(shù)量的表決器，然后遍歷根據(jù)灰度能量法所得出的灰度能量分布值，如果某一坐標(biāo)位置的灰度能量分布值滿足郵碼簽的灰度閾值

52、范圍，同時(shí)又落在上述備選區(qū)域中，那么就在該區(qū)域?qū)?yīng)的表決器中投一票(加一)。遍歷結(jié)束后，就可得到反映每一備選區(qū)域是否是郵碼簽區(qū)域的一個(gè)表決值，顯然，表決值越大，相對(duì)于二表決器的區(qū)域是郵碼簽的可能性就越大。通過設(shè)定一個(gè)閡值，可得到郵碼簽區(qū)域判定結(jié)果。　　算法綜合流程如圖4-4所示。　　4.5 郵政編碼區(qū)域的提取

53、經(jīng)過預(yù)處理模塊的處理，從采集卡獲取的整幅圖像信息已減少為郵碼簽的有效圖像信息，如圖4-3所示。　　圖4-3 郵碼簽圖像信息　　由于郵政編碼一定位于郵碼簽的左上角，所以一種方法是直接從郵碼簽信息中提取左上角矩形區(qū)域，如圖4-5中虛線所示。這種方法比較簡單易行，然而，它帶來的弊病是顯而易見的，就是如果郵政編碼的區(qū)域不在理想位置，就會(huì)發(fā)生誤提取，進(jìn)而嚴(yán)重影響后

54、續(xù)識(shí)別工作。　　另外一種方法的思路是采用灰度投影加分塊矩陣的方法。這種方法把圖像分割成若干個(gè)小的區(qū)域，然后針對(duì)每一小區(qū)域進(jìn)行灰度投影。　　圖4-4 算法流程圖　　圖4-5 郵政編碼提取示意圖　　如圖4-6所示的郵碼簽分別沿x、y方向作灰度投影，得到圖4-6-c、圖4-6

55、-b，顯然，在郵政編碼的位置上出現(xiàn)了灰度谷底，通過次度閾值分割，就可比較準(zhǔn)確地獲得郵政編碼的坐標(biāo)位置。如果考慮到郵碼簽表面的大塊污染，例如郵碼簽由可能加蓋有郵戳，因此會(huì)產(chǎn)生干擾，這樣就會(huì)得出錯(cuò)誤的結(jié)果。解決的方法是對(duì)圖4-2進(jìn)行分塊處理，然后對(duì)每一分割出的小塊進(jìn)行灰度投影，然后再將結(jié)果根據(jù)郵政編碼圖像的特征加以組合，就可排除郵戳等的干擾。根據(jù)對(duì)多個(gè)實(shí)驗(yàn)樣本的實(shí)驗(yàn)優(yōu)選，分塊的尺寸大小為88mm時(shí)，效果較好。分塊從圖像的左上角外始，沿水平方

56、向進(jìn)行，遇到邊界換行，不足88mm的邊角區(qū)域舍棄。這樣，若干小塊中就會(huì)包含文本區(qū)，通過分析這些小塊在整個(gè)分塊矩陣中的位置，就得到文本行的區(qū)域范圍[9]。　　圖4-6 郵政編碼行的灰度投影曲線圖　　5 數(shù)字識(shí)別系統(tǒng)的設(shè)計(jì)　　對(duì)于提取出的擁有郵政編碼的區(qū)域進(jìn)行識(shí)別實(shí)際上就是對(duì)圖像中的印刷體數(shù)字智能識(shí)別。系統(tǒng)在實(shí)現(xiàn)的過

57、程當(dāng)中，先分解成兩個(gè)大塊，就是圖像預(yù)處理模塊和數(shù)字識(shí)別模塊。其中圖像像預(yù)處理塊在對(duì)圖像進(jìn)行了一系列變換后把最后提取到的數(shù)字字符提交給數(shù)字識(shí)別模塊，然后進(jìn)行識(shí)別并給處結(jié)果。在這里用到了很多先進(jìn)的圖像預(yù)處理技術(shù)及神經(jīng)網(wǎng)絡(luò)技術(shù)。　　5.1系統(tǒng)流程圖　　本系統(tǒng)總的流程結(jié)構(gòu)如圖5-1所示。<p&g

58、t;　　圖5-1 系統(tǒng)總流程圖　　其中圖像預(yù)處理的流程如圖5-2 所示。　　圖5-2 圖像預(yù)處理流程圖　　神經(jīng)網(wǎng)絡(luò)數(shù)字識(shí)別的具體流程如圖5-3 所示。　　圖5-3 神經(jīng)網(wǎng)絡(luò)數(shù)字識(shí)別流程圖　　5.2程序?qū)崿F(xiàn)<

59、/b>　　整個(gè)系統(tǒng)的程序?qū)崿F(xiàn)分為圖像預(yù)處理和神經(jīng)網(wǎng)絡(luò)識(shí)別兩大模塊。在圖像預(yù)處理的過程當(dāng)中，我們采用了許多圖像處理的技術(shù)，最后把每個(gè)數(shù)字的特征提取出來。這些技術(shù)包括圖像數(shù)據(jù)讀取、圖像的灰度化、二值化、圖像的調(diào)整、離散噪聲點(diǎn)的去除、字符的切分、圖像的縮放、字符的細(xì)化、字符的平滑、圖像的求梯度等圖像處理技術(shù)，最后是數(shù)字字符特征的提取。其結(jié)果再利用神經(jīng)網(wǎng)絡(luò)（這里我們選用BP網(wǎng)絡(luò)）進(jìn)行字符識(shí)別。&l

60、t;/p>　　利用神經(jīng)網(wǎng)絡(luò)進(jìn)行字符識(shí)別的過程主要包括網(wǎng)絡(luò)的訓(xùn)練、數(shù)據(jù)的讀取、字符的判定、結(jié)果的輸出。　　5.2.1圖像的預(yù)處理　　剛剛讀入的圖片如圖5-4所示。　　圖5-4初始圖片　?。?）256色位圖灰度

61、化　　由于256色的位圖的調(diào)色板內(nèi)容比較復(fù)雜，使得圖像處理的許多算法都沒有辦法展開，因此有必要對(duì)它進(jìn)行灰度處理。所謂灰度圖像就是圖像的每一個(gè)象素的R、G、B分量的值是相等的。彩色圖像的每個(gè)象素的R、G、B值是不相同的，所以顯示出紅綠藍(lán)等各種顏色?；叶葓D像沒有這些顏色差異，有的只是亮度上的不同。灰度值大的象素點(diǎn)比較亮（象素值最大為255，為白色），反之比較暗（象素值最小為0，為黑色）。圖像灰度化有

62、各種不同的算法，比較直接的一種就是給象素的rgb 值各自一個(gè)加權(quán)系數(shù)，然后求和；同時(shí)還要對(duì)調(diào)色板表項(xiàng)進(jìn)行相應(yīng)的處理。　　要注意的是，最后得到的結(jié)果一定要?dú)w一到0－255 之內(nèi)。因?yàn)檫@是每個(gè)字節(jié)表示圖像數(shù)據(jù)的極限。　　經(jīng)過灰度處理后的256色位圖如圖5-5所示。　　圖5-5 經(jīng)過灰度處理的文件

63、　?。?）灰度圖像二值化　　在進(jìn)行了灰度化處理之后，圖像中的每個(gè)象素只有一個(gè)值，那就是象素的灰度值。它的大小決定了象素的亮暗程度。為了更加便利的開展下面的圖像處理操作，還需要對(duì)已經(jīng)得到的灰度圖像做一個(gè)二值化處理。圖像的二值化就是把圖像中的象素根據(jù)一定的標(biāo)準(zhǔn)分化成兩種顏色。在系統(tǒng)中是根據(jù)象素的灰度值處理成黑白兩種顏色。和灰度化相似的，圖像的二值化也有很多成熟的算法。它可以采用自

64、適應(yīng)閥值法，也可以采用給定閥值法。系統(tǒng)中采用的是給定閥值的方法。因?yàn)榭紤]到所要進(jìn)行處理的圖像大多是從印刷出版物上掃描得來的底色大多為白色所以我們將這個(gè)閾值固定為220，讀者也可以根據(jù)實(shí)際的情況來自己進(jìn)行閾值的設(shè)定。　　執(zhí)行結(jié)果如圖5-6所示　　圖5-6 二值化后的圖片　?。?）圖像的梯度銳化

65、　　由于需要處理的圖像大多有印刷出版物上掃描而來所以在很多的情況下字體模糊，對(duì)識(shí)別造成了一定的困難，所以有時(shí)我們要對(duì)圖像進(jìn)行銳化處理使模糊的圖像變得清晰起來，同時(shí)可以對(duì)噪聲起到一定的去除作用。圖像銳化的方法有很多，有一種是微分法，有一種是高通濾波法，我們?cè)谶@里所采用的梯度銳化的方法就屬于微分法的一種。在這里我們采用Roberts梯度算子對(duì)圖像進(jìn)行銳化。

66、　定義如下：　　設(shè)原始圖像上的點(diǎn)為。　　定義在處的梯度矢量為：　?。?-1）　　設(shè)一個(gè)判定閾值為，變化后的圖像定義為：　?。?-2）

67、　　通過公式可以看出梯度銳化可以讓模糊的邊緣變得清楚同時(shí)選擇合適的閾值還可以減弱和消除一些細(xì)小的噪聲。本程序中給出了梯度銳化的完整代碼，也可以根據(jù)實(shí)際需求、讀入圖片的質(zhì)量來選擇決定是否使用梯度銳化。事實(shí)證明，梯度銳化具備一定的去噪聲能力，但同時(shí)會(huì)對(duì)字符的邊緣有所損傷。所以建議在圖片中字符較為細(xì)小的時(shí)候不要使用梯度銳化。　　經(jīng)過梯度銳化處理后的圖片如圖5

68、-7所示。　　圖5-7 梯度銳化后的圖像　　從處理的結(jié)果也可以看出圖像的邊緣變得清晰而且少了很多細(xì)小的雜點(diǎn)，但是梯度銳化有其自身的缺陷。當(dāng)處理的圖像邊緣很細(xì)的時(shí)候可能造成邊緣信息的損失（如圖5-8所示），所以務(wù)必注意，要根據(jù)實(shí)際情況酌情處理。　　圖5-8 對(duì)邊緣較細(xì)的圖像進(jìn)行梯隊(duì)銳化的結(jié)果

69、　?。?）去除離散的雜點(diǎn)噪聲　　圖像可能在掃描或者傳輸過程中夾帶了噪聲，去噪聲是圖像處理中常用的手法。通常去噪聲用濾波的方法，比如中值濾波、均值濾波。但是那樣的算法不適合用在處理字符這樣目標(biāo)狹長的圖像中，因?yàn)樵跒V波的過程中很有可能會(huì)去掉字符本身的象素。系統(tǒng)采用的是去除雜點(diǎn)的方法來進(jìn)行去噪聲處理的。具體算法如下：掃描整個(gè)圖像，當(dāng)發(fā)現(xiàn)一個(gè)黑色點(diǎn)的時(shí)候，就考察和該黑色點(diǎn)間接或者直接相

70、連接的黑色點(diǎn)的個(gè)數(shù)有多少，如果大于一定的值，那就說明該點(diǎn)不是離散點(diǎn)，否則就是離散點(diǎn)，把它去掉。在考察相連的黑色點(diǎn)的時(shí)候用的是遞歸的方法。　　執(zhí)行后的結(jié)果如圖5-9所示。　　圖 5-9 去除離散雜點(diǎn)噪聲后的圖像　?。?）整體傾斜度調(diào)整　　因?yàn)樽x進(jìn)來的圖像可能存在傾斜，所以必

71、須對(duì)它進(jìn)行調(diào)整，使得字符都處于同一水平位置，那樣即便利字符的分割也可以提高字符識(shí)別的準(zhǔn)確率。調(diào)整的算法主要是根據(jù)圖像上左右兩邊的黑色象素的平均高度來的。一般來說，眾多的字符組成的圖像它的左右兩邊的字符象素的高度應(yīng)該是處于水平位置附近的，如果兩邊字符象素的平均位置有比較大的起落，那就說明圖像存在傾斜，需要進(jìn)行調(diào)整。具體來說，首先要分別計(jì)算圖像左半邊和右半邊的象素的平均高度，然后求的斜率，根據(jù)斜率重新組織圖像，里面包含了一個(gè)從新圖像到舊圖像

72、的象素的映射。如果新圖像中的象素映射到舊圖像中時(shí)超出了舊圖像的范圍，則把新圖像中的該象素置白色。　　經(jīng)過傾斜度調(diào)整后的圖像如圖5-10所示。　　圖5-10 經(jīng)過傾斜度調(diào)整后的圖像　?。?）字符分割　　系統(tǒng)在讀進(jìn)來的圖像中一般會(huì)含有多個(gè)

73、數(shù)字，識(shí)別的時(shí)候只能根據(jù)每個(gè)字符的特征來進(jìn)行判斷，所以還要進(jìn)行字符分割的工作。這一步工作就是把圖像中的字符獨(dú)立的分割出來。　　具體的算法如下：　　第一步，先自下向上對(duì)圖像進(jìn)行逐行掃描直至遇到第一個(gè)黑色的象素點(diǎn)。記錄下來。然后再由上向下對(duì)圖像進(jìn)行逐行掃描直至找到第一個(gè)黑色象素，這樣就找到圖像大致的高度范圍。</p

74、>　　第二步，在這個(gè)高度范圍之內(nèi)在自左向右逐列進(jìn)行掃描，遇到第一個(gè)黑色象素時(shí)認(rèn)為是字符分割的起始位置，然后繼續(xù)掃描，直至遇到有一列中沒有黑色象素，則認(rèn)為這個(gè)字符分割結(jié)束，然后繼續(xù)掃描，按照上述的方法一直掃描直至圖像的最右端。這樣就得到了每個(gè)字符的比較精確寬度范圍。　　第三步，在已知的每個(gè)字符比較精確的寬度范圍內(nèi)，按照第一步的方法，分別進(jìn)行自上而下和自下而上的逐行掃描來

75、獲取每個(gè)字符精確的高度范圍。　　進(jìn)行字符分割后并畫上邊框的圖像如圖5-11所示。　　圖5-11 經(jīng)過字符分割后并畫上邊框的圖像　?。?）圖像的歸一化處理　　因?yàn)閽呙柽M(jìn)來的圖像中字符大小存在較大的差異，而相對(duì)來說，統(tǒng)一尺寸的字符識(shí)別的標(biāo)準(zhǔn)性更強(qiáng)，準(zhǔn)確率自然也更高，標(biāo)準(zhǔn)化圖像

76、就是要把原來各不相同的字符統(tǒng)一到同一尺寸，在系統(tǒng)實(shí)現(xiàn)中是統(tǒng)一到同一高度，然后根據(jù)高度來調(diào)整字符的寬度。具體算法如下：先得到原來字符的高度，跟系統(tǒng)要求的高度做比較，得出要變換的系數(shù)，然后根據(jù)得到的系數(shù)求得變換后應(yīng)有得寬度。再得到寬度高度之后，把新圖像里面得點(diǎn)按照插值得方法映射到原圖像中。　　圖像標(biāo)準(zhǔn)歸一化的高度和寬度信息可以通過一個(gè)對(duì)話框由讀者自行輸入，但是為了以后特征提取的時(shí)候處理方便，進(jìn)行BP

77、網(wǎng)絡(luò)訓(xùn)練的時(shí)候縮短訓(xùn)練的時(shí)間，標(biāo)準(zhǔn)化的寬度和高度不要設(shè)置的過大。本系統(tǒng)中去歸一化寬度為20，高度為40。　　歸一化執(zhí)行效果如圖5-12所示。　　圖5-12 對(duì)圖像進(jìn)行歸一化處理　?。?）圖像的緊縮重排　　經(jīng)過標(biāo)準(zhǔn)歸一化處理后的各個(gè)字符在圖像中的位置不定，要它進(jìn)行特征提取時(shí)

78、處理起來比較麻煩，所以要把歸一化后的字符進(jìn)行緊縮重排，以形成新的位圖句柄，以方便下一步的特征提取的操作。　　程序執(zhí)行效果如圖5-13所示。　　圖 5-13 圖像緊縮重排后的效果　　至此已經(jīng)基本完成圖像的預(yù)處理。此外，還可以采用些別的方法以更好的達(dá)到預(yù)處理的效果，比如可以對(duì)字符進(jìn)行光滑處理等。

79、　　5.2.2用神網(wǎng)絡(luò)進(jìn)行字符識(shí)別　　（1）BP神經(jīng)網(wǎng)絡(luò)簡介　　圖5-14 神經(jīng)元 　　神經(jīng)網(wǎng)絡(luò)簡介：人工神經(jīng)網(wǎng)絡(luò)（Artificial Neural Network,ANN），也稱為神經(jīng)網(wǎng)絡(luò)（Neural Networks,NN）。即從生物學(xué)神經(jīng)系統(tǒng)的信號(hào)傳遞而抽象發(fā)展而

80、成的一門學(xué)科。在神經(jīng)網(wǎng)絡(luò)中，最基本的單元就是神經(jīng)元，如圖5-14。神經(jīng)元由三部分組成：樹突、細(xì)胞體和軸突。樹突是樹狀的神經(jīng)纖維接受網(wǎng)絡(luò)，它將電信號(hào)傳遞給細(xì)胞體，細(xì)胞體對(duì)這些輸入信號(hào)進(jìn)行整合并進(jìn)行閥值處理。軸突是單根長纖維，它把細(xì)胞體的輸出信號(hào)導(dǎo)向其他的神經(jīng)元。神經(jīng)元的排列拓?fù)浣Y(jié)構(gòu)和突觸的連接強(qiáng)度確立了神經(jīng)網(wǎng)絡(luò)的功能。形象的說，神經(jīng)網(wǎng)絡(luò)是由大量處理單元（神經(jīng)元 Neurons）廣泛連接而成的網(wǎng)絡(luò)，是對(duì)人腦的抽象、簡化和模擬，反映人腦的基本

81、特性。它能夠通過學(xué)習(xí)過程從外部環(huán)境中獲取知識(shí)，并且它內(nèi)部的很多的神經(jīng)元可以用來存儲(chǔ)這些已經(jīng)學(xué)到的知識(shí)[10]。　　圖5-15 神經(jīng)元抽象成的數(shù)學(xué)模型　　如圖5-15所示，神經(jīng)元的輸入是信號(hào)P，經(jīng)過一個(gè)累加器累加后的信號(hào)送入一個(gè)激活函數(shù)f，從而得到這個(gè)神經(jīng)元的輸出a。這個(gè)神經(jīng)元的輸出a同時(shí)又可以作為下一個(gè)或多個(gè)神經(jīng)元的輸入，從而將神經(jīng)信號(hào)成網(wǎng)絡(luò)分散狀的傳遞

82、出去。一個(gè)神經(jīng)元可以接受多個(gè)輸入，所以把神經(jīng)元表示成為矢量、矩陣形式更容易去處理分析實(shí)際問題。以上是對(duì)一個(gè)單層神經(jīng)網(wǎng)絡(luò)的描述。一般就實(shí)際情況而言，多層網(wǎng)絡(luò)用處要廣的多，如BP網(wǎng)絡(luò)。在多層網(wǎng)絡(luò)中，一般至少有3個(gè)層：一個(gè)輸入層、一個(gè)輸出層、一個(gè)或多個(gè)隱層。多層網(wǎng)絡(luò)可以解決很多單層網(wǎng)絡(luò)無法解決的問題，比如多層網(wǎng)絡(luò)可以用來進(jìn)行非線性分類，可以用來做精度極高的函數(shù)逼近，只要有足夠多的層和足夠多的神經(jīng)元，這些都可以辦到。一個(gè)多層網(wǎng)絡(luò)的輸入和輸出層的

83、神經(jīng)元個(gè)數(shù)是由外部描述定義的。例如如果有4個(gè)外部變量作為輸入，那網(wǎng)絡(luò)就要有4個(gè)輸入。　　神經(jīng)網(wǎng)絡(luò)有好多種，比如徑向基網(wǎng)絡(luò)、BP網(wǎng)絡(luò)，Hopfield 網(wǎng)絡(luò)等。本系統(tǒng)采用的是最為廣泛運(yùn)用的BP網(wǎng)絡(luò)，如圖5-16所示。　　圖5-16 多層BP網(wǎng)絡(luò)示意圖　　神經(jīng)網(wǎng)絡(luò)的激勵(lì)函數(shù)。激勵(lì)函數(shù)將輸出信號(hào)壓縮在一個(gè)允許的范圍內(nèi)，

84、使其成為有限值，通常神經(jīng)元輸出的范圍在【0，1】或者【－1，1】的閉區(qū)間上。常用的基本激勵(lì)函數(shù)有閾值函數(shù)、分段線性函數(shù)、Sigmoid 函數(shù)。其中Sigmoid 函數(shù)也稱為s型函數(shù)，它是人工神經(jīng)網(wǎng)絡(luò)中用的最多的激勵(lì)函數(shù)。S型函數(shù)的定義如下[11]：　　（5-3）　　神經(jīng)網(wǎng)絡(luò)的反饋調(diào)節(jié)。在誤差信號(hào)的反向傳播中，網(wǎng)絡(luò)不斷

85、的修正各個(gè)節(jié)點(diǎn)的權(quán)值。　　設(shè)有含n個(gè)節(jié)點(diǎn)的BP網(wǎng)絡(luò)，采用s型激勵(lì)函數(shù)[12]。為簡單起見，可以假設(shè)網(wǎng)絡(luò)只有一個(gè)輸出y，任一節(jié)點(diǎn)的輸出為，并設(shè)有N個(gè)樣本（k = 1,2,…,N），對(duì)某一輸入，網(wǎng)絡(luò)的輸出為，節(jié)點(diǎn)i的輸出為，節(jié)點(diǎn)j的輸入為[13]：　?。?-4）　　使用平方型誤差

86、函數(shù)： 　?。?-5）　　其中為網(wǎng)絡(luò)之實(shí)際輸出，定義如下：　?。?-6）　?。?-7）<b&

87、gt;　?。?-8）　　其中：　　（5-9）　　于是有：　?。?-10）&l

88、t;p>　　當(dāng)j為輸出節(jié)點(diǎn)時(shí)，　?。?-11）　　若j不是輸出節(jié)點(diǎn)時(shí)，有：　?。?-12）　　本程序中BP網(wǎng)絡(luò)的設(shè)計(jì)<p&

89、gt;　　BP網(wǎng)絡(luò)的一個(gè)重要的用途就是用于模式識(shí)別[14]。我們的任務(wù)是要設(shè)計(jì)并訓(xùn)練出一個(gè)可行、高效的BP網(wǎng)絡(luò)，以實(shí)現(xiàn)對(duì)0到9共10個(gè)數(shù)字和識(shí)別。　　經(jīng)圖像預(yù)處理過程之后，可以將最終提取到的字符的特征送入BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練及識(shí)別了。這里，假設(shè)我們?cè)O(shè)定的字符標(biāo)準(zhǔn)歸一化的寬度為20，高度為40，那么對(duì)于每個(gè)字符就有800維的特征。　　設(shè)計(jì)BP網(wǎng)絡(luò)的關(guān)鍵之處在于

90、高效的特征提取方法、大量有代表性的訓(xùn)練樣本、高效穩(wěn)定速收斂的學(xué)習(xí)方法[15]。　　BP網(wǎng)絡(luò)應(yīng)用過程如圖5-17所示。　　圖5-17 BP網(wǎng)絡(luò)應(yīng)用流程　　使用BP網(wǎng)絡(luò)來進(jìn)行數(shù)字識(shí)別的流程如下：　　首先，利用大量的訓(xùn)練樣本來訓(xùn)練網(wǎng)絡(luò)，以得到以文件形式保存的權(quán)值。訓(xùn)練樣本為精心

91、選擇的可以很好的反應(yīng)樣本可分性特性的已知數(shù)據(jù)。在程序中采用訓(xùn)練樣本圖片的形式。將訓(xùn)練樣本圖片進(jìn)行特征提取后，就可以送入BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練。在這里，作者采用了含有40個(gè)字符數(shù)據(jù)的圖像作為訓(xùn)練樣本。這副圖像包含了Arial字體書寫的普通的0到9的10個(gè)數(shù)字、斜體的10個(gè)數(shù)字、粗體的10個(gè)數(shù)字和10個(gè)傾斜的數(shù)字，總共40個(gè)，如圖5-18所示。　　圖5-18 40個(gè)訓(xùn)練樣本<

92、;p>　　實(shí)驗(yàn)證明，這40個(gè)訓(xùn)練樣本訓(xùn)練出來的BP網(wǎng)絡(luò)對(duì)于Arial字體的數(shù)字可以達(dá)到90%以上的識(shí)別率，而且網(wǎng)絡(luò)訓(xùn)練時(shí)間也是可以接受的（大約1～5秒鐘）。當(dāng)然如果采用400個(gè)訓(xùn)練樣本甚至更多的話，那無疑可以進(jìn)一步提高識(shí)別率，但訓(xùn)練時(shí)間往往會(huì)達(dá)到分鐘甚至更高到小時(shí)的級(jí)別，實(shí)際意義不大了。　　其次，訓(xùn)練完BP網(wǎng)絡(luò)后，就可以用它對(duì)為止數(shù)據(jù)進(jìn)行識(shí)別了。識(shí)別首先要經(jīng)過圖像預(yù)處理、特征提取，最后送入

93、BP網(wǎng)絡(luò)識(shí)別，直接得到結(jié)果。　　6 測試和程序運(yùn)行　　6.1測試及識(shí)別過程　　打開含字符的圖像文件（訓(xùn)練的時(shí)候?yàn)橛?xùn)練樣本圖片，識(shí)別的時(shí)候?yàn)楹形粗獢?shù)字的圖片），并將圖像文件中除文件頭部分的其他所有信息讀入內(nèi)存。　　打開輸入歸一化寬度和

94、高度的對(duì)話框，接收用戶輸入。這里推薦用戶使用寬度為20高度為40的歸一化指標(biāo)。此歸一化指標(biāo)只由用戶輸入一次。　?。?）然后進(jìn)行圖像的預(yù)處理。預(yù)處理的步驟依次如下：灰度化－> 二值化－> 銳化－>去離散噪聲－> 整體傾斜調(diào)整－> 字符分割－> 尺寸標(biāo)準(zhǔn)歸一化－> 緊縮重排。至此，原先散落在圖像中的亮度不一、大小不一、斜度不一、粗細(xì)不一、同時(shí)還含有噪聲的數(shù)字

95、已經(jīng)被提取出來，亮度一致，尺寸標(biāo)準(zhǔn)化，去掉了傾斜，并且在很大程度上也去除了噪聲。　?。?）下面就進(jìn)入BP網(wǎng)絡(luò)訓(xùn)練部分。訓(xùn)練之前首先要輸入BP訓(xùn)練的參數(shù)，這里主要是訓(xùn)練步長和允許誤差。BP訓(xùn)練的時(shí)候，首先要對(duì)步驟（3）的結(jié)果來進(jìn)行特征提取，然后將提取的特征送入BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練。如果網(wǎng)絡(luò)設(shè)計(jì)得當(dāng)，參數(shù)選擇也正確的話，那么BP網(wǎng)絡(luò)將會(huì)在有限步內(nèi)收斂。訓(xùn)練完畢的BP網(wǎng)絡(luò)將網(wǎng)絡(luò)的權(quán)值保存到文件中，以便下一

96、步識(shí)別的時(shí)候可以直接調(diào)用。　?。?）現(xiàn)在可以真正進(jìn)入識(shí)別部分了。打開一副含有數(shù)字的圖像，然后是預(yù)處理，然后是特征提取，最后將提取后的特征送入BP網(wǎng)絡(luò)，通過網(wǎng)絡(luò)的輸出可以判定輸入的字符，以實(shí)現(xiàn)數(shù)字字符的識(shí)別。識(shí)別的結(jié)果顯示在屏幕上，同時(shí)也存儲(chǔ)在文件中以保存。　　6.2程序運(yùn)行

97、　程序主界面如圖6-1所示。　　圖6-1　　程序主要功能都通過這幾個(gè)菜單來實(shí)現(xiàn)。常用的菜單也已經(jīng)集成到了工具欄上，像打開、保存、重新加載、訓(xùn)練網(wǎng)絡(luò)、識(shí)別功能都已經(jīng)做成了工具欄上的按鈕。　　“文件”菜單主要負(fù)責(zé)文件的打開、保存以及重新加載（取消一切更改，重新打開）?！皥D像預(yù)處理

98、”菜單主要來對(duì)圖像進(jìn)行預(yù)處理，含歸一化信息的輸入?！吧窠?jīng)網(wǎng)絡(luò)識(shí)別”菜單主要實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)的訓(xùn)練以及識(shí)別。　　下面我們來打開一副訓(xùn)練樣本進(jìn)行訓(xùn)練。效果如圖6-2。　　圖6-2　　然后，我們打開一副測試圖片來進(jìn)行識(shí)別，如圖6-3所示。<

99、b>　　圖6-3　　進(jìn)行圖像預(yù)處理的結(jié)果，如圖6-4所示。　　圖6-4　　下面就可以點(diǎn)擊工具欄中的“R”按鈕來進(jìn)行識(shí)別了。識(shí)別結(jié)果如圖6-5所示。　　圖6-5 對(duì)測試圖片的識(shí)別結(jié)果&l

100、t;p>　　保存到文件中的結(jié)果如圖6-6所示。　　圖6-6　　至此，程序已經(jīng)完整的運(yùn)行了一次由訓(xùn)練到識(shí)別的過程。再下一次進(jìn)行識(shí)別的時(shí)候，由于本次訓(xùn)練好的網(wǎng)絡(luò)已經(jīng)保存了下來，那么就可以直接識(shí)別了，無需再訓(xùn)練。當(dāng)然如果識(shí)別的對(duì)象發(fā)生了較大變化而難以識(shí)別的時(shí)候，就需要重新制作訓(xùn)練樣本并進(jìn)行識(shí)別了。

101、　　6.3注意事項(xiàng)　　該程序設(shè)計(jì)時(shí)考慮了數(shù)字字符的很多變化情況，具備良好的適應(yīng)性，但識(shí)別率對(duì)于傾斜字符或者不同字體的字符來說就不是很高了，甚至出現(xiàn)無法識(shí)別的情況。如下圖所示，字符“3”傾斜后就無法識(shí)別出來了。此時(shí)可以通過加大訓(xùn)練樣本的數(shù)目來解決。將訓(xùn)練樣本數(shù)目增大到150個(gè)，并考慮進(jìn)來各種傾斜角度的以及其他幾種常用字體，那么該BP網(wǎng)絡(luò)將

102、會(huì)有更加普遍的適應(yīng)性和更高的識(shí)別率。　　考慮程序設(shè)計(jì)的方便，該程序中設(shè)計(jì)BP網(wǎng)絡(luò)的目標(biāo)輸出的時(shí)候，假定了目標(biāo)輸出為0，1，2，3，4，5，6，7，8，9的循環(huán)。所以在自行設(shè)計(jì)訓(xùn)練樣本的時(shí)候一定要注意，不要使用“0，2，1，3”這樣的訓(xùn)練樣本，這會(huì)導(dǎo)致無法訓(xùn)練成功。應(yīng)該使用“0，1，2，3”這樣的訓(xùn)練樣本。一定要遵循由0到9的順序來設(shè)計(jì)訓(xùn)練樣本。對(duì)于待識(shí)別圖片當(dāng)然沒有這種要求。

103、　　在執(zhí)行圖像預(yù)處理時(shí)，盡量使用“一次性圖像預(yù)處理”。若要單獨(dú)執(zhí)行每一步，請(qǐng)務(wù)必記?。好恳徊揭错樞驁?zhí)行，且只能執(zhí)行一次。否則將會(huì)有意想不到的后果。比如說，就像梯度銳化，連續(xù)梯度銳化3次，那圖片上的數(shù)字基本上就沒了。這也就無法完成下一步的分割等操作了。　　識(shí)別時(shí)不要再改動(dòng)歸一化信息。否則無法識(shí)別。歸一化信息應(yīng)該在訓(xùn)練之前設(shè)定，而且僅僅設(shè)定一次。識(shí)別時(shí)歸一化信息與訓(xùn)練時(shí)候的一

104、致，特征提取才能進(jìn)行，識(shí)別才能進(jìn)行。　　結(jié) 論　　對(duì)于印刷體的郵政編碼識(shí)別是為了適應(yīng)當(dāng)今郵政行業(yè)對(duì)郵件的高速分揀的業(yè)務(wù)需求而提出的，本文針對(duì)行業(yè)中郵件的特點(diǎn)和分揀要求，研究了自動(dòng)識(shí)別出郵件上郵政編碼的簡單系統(tǒng)。其中，主要涉及的內(nèi)容包括了圖像的采集、背景的剔除、郵碼簽的提取、字符分割、數(shù)字識(shí)別，但重點(diǎn)研究的內(nèi)容式

105、對(duì)數(shù)字的識(shí)別過程。　　本文的四個(gè)組成部分為：　　圖像采集　　圖像預(yù)處理　　郵碼簽區(qū)域圖像的提取　　印刷體數(shù)字識(shí)別&l

106、t;/p>　　本文整體的設(shè)計(jì)思路是先通過攝像頭進(jìn)行圖像的采集，其實(shí)質(zhì)就是拍照。然后把拍到的照片傳輸?shù)诫娔X中，進(jìn)行預(yù)處理。接著便是從預(yù)處理好后的圖像中提取出郵碼簽的區(qū)域，把需要進(jìn)行智能識(shí)別的數(shù)字提取出來。最后通過軟件對(duì)阿拉伯?dāng)?shù)字進(jìn)行識(shí)別。這些環(huán)節(jié)中，本文的研究的重點(diǎn)放在了對(duì)數(shù)字的識(shí)別上。所以，軟件的相關(guān)設(shè)計(jì)就需要大量的理論基礎(chǔ)和實(shí)際工作量。但是真正的難點(diǎn)在于怎樣提取出數(shù)字，本文在這方面只是做了理論上的初步認(rèn)識(shí)，

107、并沒有進(jìn)行實(shí)際的實(shí)驗(yàn)。所以這一部分的研究需要以后進(jìn)行大量的實(shí)驗(yàn)工作進(jìn)行總結(jié)和改進(jìn)。　　本系統(tǒng)的設(shè)計(jì)相對(duì)有些簡單，因此還需要在以下方面進(jìn)行研究：　　首先，采集部分的設(shè)計(jì)有些粗糙。運(yùn)用一般的攝像頭進(jìn)行在傳輸帶上移動(dòng)的郵件的圖像的采集，可能會(huì)導(dǎo)致圖像一定程度的模糊。而且對(duì)郵件擺放的間隔和郵件大小都有很大程度上的限制。因此，今后可以在這一部分進(jìn)行深入研究和實(shí)驗(yàn)，

108、使采集到的圖像更加清晰，減小圖像處理過程的難度。　　第二，對(duì)于數(shù)字從郵件上提取出來的方法也還待改進(jìn)，這就包括了怎樣更加高效和準(zhǔn)確的提取出手寫體郵政編碼部分的圖像。這里背景的濾出就很重要。本文由于通過“異或”邏輯過于簡單，使得在光帶邊緣存在較為粗糙的光帶紋理無法被完全抑制，因此，為后續(xù)的提取工作帶來了不利影響。　　第三，可以以此為基礎(chǔ)，進(jìn)行漢字的識(shí)別工作。

109、　　可以預(yù)見，隨著本課題的不斷研究創(chuàng)新，先進(jìn)的、智能的識(shí)別系統(tǒng)將會(huì)在未來為我國郵政事業(yè)的發(fā)展添上濃重的一筆，我國的郵件分揀自動(dòng)化程度將上一個(gè)新的臺(tái)階。　　參考文獻(xiàn)　　[1]Rafael C G, Richard E W. Digital Image Processing(2

110、th ed) [M ]. New Jersey: Prentice Hall, 2002.　　[2]Richard O D, Peter E H, David G S. Pattern Classifi2cation (2 th ed) [M ]. 李宏東譯. 北京: 機(jī)械工業(yè)出版社, 2003　　[3]王林泉, 汪午龍, 湯笑笑. 手寫漢字識(shí)別預(yù)處理算

111、法研究[ J ]. 計(jì)算機(jī)工程, 1995. 21 (5) : 56 - 58.　　[4]何　斌, 馬天予. Visual C + +數(shù)字圖像處理[M ].北京: 人民郵電出版社, 2003.　　[5]楊枝靈, 王　開. Visual C + +數(shù)字圖像獲取、處理及實(shí)踐應(yīng)用[M ]. 北京:人民郵電出版社, 2003.<p&

112、gt;　　[6]李煒，黃心漢，王敏，等．車牌自動(dòng)識(shí)別系統(tǒng)中車牌分割的研究[J]．信號(hào)處理，2000，16(3)：41—44．　　[7]廖翔云，許錦標(biāo)，龔仕偉．車牌識(shí)別技術(shù)研究[J]．微機(jī)發(fā)展，2003，13(6)：31-33．　　[8]郭景云．圖像處理與車牌識(shí)別[J]．科技資訊，2007，12(1)：6．　　[9

眾賞文庫> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

郵政編碼識(shí)別系統(tǒng)的設(shè)計(jì)畢業(yè)論文

文檔簡介

溫馨提示

最新文檔

評(píng)論

郵政編碼識(shí)別系統(tǒng)的設(shè)計(jì)畢業(yè)論文

文檔簡介

溫馨提示

最新文檔

評(píng)論

免費(fèi)下載