版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、<p> 一、原始依據(jù)(包括設(shè)計(jì)或論文的工作基礎(chǔ)、研究條件、應(yīng)用環(huán)境、工作目的等。)</p><p> 工作基礎(chǔ):了解C++的基本概念和語法,熟練使用Visual C++軟件。</p><p> 研究條件:依據(jù)BP神經(jīng)網(wǎng)絡(luò)的基本原理完成算法實(shí)現(xiàn)。</p><p> 應(yīng)用環(huán)境:基于BP神經(jīng)網(wǎng)絡(luò)的圖像文件中的車牌號(hào)碼識(shí)別。</p><
2、;p> 工作目的:熟練掌握Visual C++應(yīng)用程序的開發(fā)。</p><p> 了解人工智能的基本概念以及神經(jīng)網(wǎng)絡(luò)的基本原理。</p><p> 熟練掌握Visual C++中的圖片處理的基本方法。</p><p><b> 二、參考文獻(xiàn)</b></p><p> [1]人工智能原理及其應(yīng)用,王萬森,電
3、子工業(yè)出版社,2007.</p><p> [2]VC++深入詳解,孫鑫,電子工業(yè)出版社,2006.</p><p> [3]人工神經(jīng)網(wǎng)絡(luò)原理, 馬銳,機(jī)械工業(yè)出版社,2010.</p><p> [4]Visual C++數(shù)字圖像處理典型案例詳解,沈晶,機(jī)械工業(yè)出版社,2012.</p><p> [5]Application of
4、 Image Processing to the Characterization of Nanostructures,Manuel F. M. Costa,Reviews on Advanced Materials Science,2004.</p><p> 三、設(shè)計(jì)(研究)內(nèi)容和要求(包括設(shè)計(jì)或研究內(nèi)容、主要指標(biāo)與技術(shù)參數(shù),并根據(jù)課題性質(zhì)對(duì)學(xué)生提出具體要求。)</p><p>
5、1、掌握C++的基本概念和語法。</p><p> 2、了解神經(jīng)網(wǎng)絡(luò)的基本原理。</p><p> 3、完成Visual C++中對(duì)于圖像的預(yù)處理。</p><p> 4、完成基于樣本的神經(jīng)網(wǎng)絡(luò)的訓(xùn)練以及圖像中車牌信息的識(shí)別,并對(duì)其性能進(jìn)行統(tǒng)計(jì)和總結(jié)。</p><p><b> 指導(dǎo)教師(簽字)</b></
6、p><p><b> 年 月 日</b></p><p> 審題小組組長(簽字)</p><p><b> 年 月 日</b></p><p> 天津大學(xué)仁愛學(xué)院本科生畢業(yè)設(shè)計(jì)(論文)開題報(bào)告</p><p><b> 摘 要</b
7、></p><p> 基于BP網(wǎng)絡(luò)的車牌識(shí)別是一門對(duì)車牌字符識(shí)別的技術(shù),它的產(chǎn)生是為了完善智能交通系統(tǒng),使得交通系統(tǒng)更具有信息時(shí)代的意義。</p><p> 本文利用BP神經(jīng)網(wǎng)絡(luò)與圖像處理技術(shù)相結(jié)合的方法,將BP神經(jīng)網(wǎng)絡(luò)應(yīng)用到車牌字符識(shí)別中。針對(duì)車牌圖像的處理的過程包括:車牌圖像去噪、車牌圖像灰度化、車牌圖像二值化、車牌字符圖像分割、車牌字符圖像歸一化、車牌字符圖像特征值提取。前
8、面五個(gè)過程是為了保證字符信息能更好的體現(xiàn)出來,有利于將特征值提取。BP神經(jīng)網(wǎng)絡(luò)通過對(duì)組件的車牌字符庫的學(xué)習(xí)后才會(huì)具有識(shí)別功能,然后將車牌字符圖像提取到的特征值送入到BP神經(jīng)網(wǎng)絡(luò)中就能識(shí)別出來。</p><p> 通過實(shí)驗(yàn)證明了通過上述的過程是能夠?qū)④嚺谱址R(shí)別出來,在這個(gè)識(shí)別過程中對(duì)于BP網(wǎng)絡(luò)訓(xùn)練的收斂性是十分重要的,證明了該方法的有效性。</p><p> 關(guān)鍵字:字符識(shí)別;BP神經(jīng)
9、網(wǎng)絡(luò);特征值提??;車牌識(shí)別</p><p><b> ABSTRACT</b></p><p> BP network based license plate character recognition is one pair of license plate character recognition technology, which is produced
10、in order to improve intelligent transportation system, making the transport system more meaningful information age.</p><p> In this paper, BP neural network and image processing technology, a combination of
11、 methods will be applied to the license plate BP neural network character recognition. For the license plate image processing process includes: license plate image denoising, gray plate image, license plate image binariz
12、ation, license plate character segmentation, license plate character image normallization, license plate character image feature extraction. During the previous five character information in order t</p><p>
13、 The experimental results show the process by the above license plate character can be identified, in this process of identifying convergence BP network training is very important and effectively identifythe plate proved
14、 that the method is effective.</p><p> Key words: character recognition; BP neural network; feature extraction; license plates recognition</p><p><b> 目 錄</b></p><p>
15、<b> 第一章 緒論1</b></p><p> 1.1 課題研究背景1</p><p> 1.2 研究現(xiàn)狀2</p><p> 1.3 本文研究內(nèi)容3</p><p> 第二章 字符識(shí)別方法4</p><p> 2.1 圖像預(yù)處理4</p><p
16、> 2.2 車牌定位6</p><p> 2.3 字符分割9</p><p> 第三章 BP神經(jīng)網(wǎng)絡(luò)13</p><p> 3.1 人工神經(jīng)網(wǎng)絡(luò)13</p><p> 3.2 BP網(wǎng)絡(luò)16</p><p> 第四章 基于BP網(wǎng)絡(luò)的車牌識(shí)別系統(tǒng)22</p><p>
17、; 4.1 字符特征提取22</p><p> 4.2 系統(tǒng)識(shí)別模塊22</p><p> 4.3 程序運(yùn)行23</p><p> 第五章 總結(jié)與展望27</p><p><b> 5.1 總結(jié)27</b></p><p><b> 5.2 展望27</b
18、></p><p><b> 參考文獻(xiàn)28</b></p><p><b> 外文資料</b></p><p><b> 中文譯文</b></p><p><b> 致謝</b></p><p><b>
19、 第一章 緒論</b></p><p> 1.1 課題研究背景</p><p> 近幾年來,隨著車輛在普通民眾生活中的普及,城市交通的壓力越來越成為影響人們方便出行的一大障礙,同時(shí)越來越重的城市交通壓力也使得原有的交通管理系統(tǒng)不再滿足需求,于是人們利用各類先進(jìn)的科學(xué)技術(shù)相繼研制出各類交通道路、車輛的管理系統(tǒng),逐步發(fā)展到如今較為全面的,包括交通管理多個(gè)方面的智能交通系統(tǒng)(I
20、ntelligent Transportation System,ITS)。而在整個(gè)智能交通系統(tǒng)中,車牌識(shí)別(License Plates Recognition,LPR)更是其中的一項(xiàng)關(guān)鍵所在。</p><p> 車牌識(shí)別技術(shù)是融合了圖像處理、計(jì)算機(jī)視覺、模式識(shí)別技術(shù)和人工智能等多學(xué)科知識(shí)在內(nèi)的交通領(lǐng)域的重要研究課題之一,是實(shí)現(xiàn)交通管理能夠智能化的重要環(huán)節(jié)和重要手段,其任務(wù)是分析、處理汽車圖像,主動(dòng)識(shí)別汽車牌
21、號(hào),并進(jìn)行相關(guān)智能化數(shù)據(jù)庫管理。車牌識(shí)別系統(tǒng)可以廣泛應(yīng)用于電子收費(fèi)、出入控制、公路流量監(jiān)控、失竊車輛查詢和停車場車輛管理等需要車牌認(rèn)證的場合,尤其在高速公路收費(fèi)系統(tǒng)中,實(shí)現(xiàn)不停車收費(fèi)提高公路系統(tǒng)的運(yùn)行效率,車牌識(shí)別系統(tǒng)更具有不可替代的作用。因而從事車牌識(shí)別系統(tǒng)的研究具有極其重要的顯示意義和巨大的經(jīng)濟(jì)價(jià)值。</p><p> 在現(xiàn)代,神經(jīng)網(wǎng)絡(luò)算法得到廣泛應(yīng)用,這種算法是根據(jù)生物神經(jīng)網(wǎng)絡(luò)而建立起來的模型,能較好的實(shí)
22、現(xiàn)人類存儲(chǔ)知識(shí)和處理信息的技能,使得系統(tǒng)可以模擬人類思維。神經(jīng)網(wǎng)絡(luò)中BP網(wǎng)絡(luò)是其中應(yīng)用比較廣泛且技術(shù)較為成熟的網(wǎng)絡(luò),BP網(wǎng)絡(luò)在如今已經(jīng)被廣泛地應(yīng)用到各個(gè)行業(yè)領(lǐng)域,它優(yōu)越性主要體現(xiàn)在四個(gè)方面:函數(shù)逼近、模式識(shí)別、分類、數(shù)據(jù)壓縮。由于在各個(gè)行業(yè)領(lǐng)域它已經(jīng)得到了應(yīng)用,所以BP網(wǎng)絡(luò)也相對(duì)成熟,而且BP網(wǎng)絡(luò)的變化形式也多種多樣,采用BP網(wǎng)絡(luò)作為車牌字符識(shí)別技術(shù)是一個(gè)相對(duì)合理的選擇。</p><p> 如今,隨著計(jì)算機(jī)技術(shù)
23、、通信技術(shù)和計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的發(fā)展,自動(dòng)化的信息處理能力和水平不斷提高,人們正在逐步進(jìn)入信息時(shí)代。在此情況下,作為信息來源的自動(dòng)檢測、圖像識(shí)別技術(shù)越來越受到人們的重視。汽車作為現(xiàn)代社會(huì)的主要交通工具之一,在人們的生產(chǎn)、生活的各個(gè)領(lǐng)域得到大量使用,對(duì)它的信息自動(dòng)采集和智能化管理在公路收費(fèi)站、停車場、十字路口等交通關(guān)卡處有十分重要的意義。而且汽車牌照自動(dòng)識(shí)別系統(tǒng)本身是一個(gè)全數(shù)字化的智能系統(tǒng),在它上面只要做一定的擴(kuò)充就可以衍生出一些其他功能,能
24、使收費(fèi)的管理更嚴(yán)密、更科學(xué)。</p><p><b> 1.2 研究現(xiàn)狀</b></p><p> 目前,國內(nèi)外關(guān)于車牌識(shí)別的研究已存在很多,并且有一部分已經(jīng)投入使用,并且在實(shí)際使用的過程中展現(xiàn)了這些產(chǎn)品的優(yōu)勢。</p><p> 國外在這方面的研究工作開展較早。早在上世紀(jì)70年代,英國就在實(shí)驗(yàn)室中完成了“實(shí)時(shí)車牌檢測系統(tǒng)”的廣域檢測和開
25、發(fā)。上世紀(jì)90年代初,美國、意大利、德國、以色列、新加坡等國家,都已經(jīng)有比較成熟的產(chǎn)品投入了應(yīng)用,如以色列的Hi-Tech公司的See/Car System系列產(chǎn)品,美國的(AUTOSCOF)[2003系統(tǒng)],香港Asia Vision Technology公司的VECON產(chǎn)品,德國西門子公司的ARTEM7S系統(tǒng),新加坡Optasia公司的VLPRS產(chǎn)品等。直至今日,國外對(duì)車牌檢測的研究已經(jīng)取得了一些令人矚目的成就,如:Yuntao C
26、ui提出了一種車牌識(shí)別系統(tǒng),在車牌定位以后,利用馬爾科夫場對(duì)車牌特征進(jìn)行提取和二值化,對(duì)樣本的識(shí)別達(dá)到了較高的識(shí)別率。Eun Ryung等利用圖像中的顏色分量,對(duì)車輛進(jìn)行定位識(shí)別,其中提到了三種方法:①以Hough變換為基礎(chǔ)的邊緣檢測定位識(shí)別;②以灰度值變換為基礎(chǔ)的識(shí)別算法;③以HLS彩色模式為基礎(chǔ)的車牌識(shí)別系統(tǒng),識(shí)別率分別為81.25%、85%、91.2%。</p><p> 而在國內(nèi),有大量的學(xué)者在從事這方
27、面的研究,提出了很多新穎快速的算法。由于國內(nèi)車牌和國外車牌差異性的存在,尤其是國內(nèi)車牌漢字的存在,以及其他一系列的問題,所以國外關(guān)于識(shí)別率的報(bào)道只具有參考價(jià)值,其在中國的應(yīng)用效果可能沒有在國外的應(yīng)用效果好。我國較成熟的產(chǎn)品有中科院自動(dòng)化研究所漢王公司的“漢王眼”,深圳市科安信實(shí)業(yè)有限公司以及中國信息產(chǎn)業(yè)部下屬的中智交通電子有限公司等。香港的亞洲視覺科技有限公司研發(fā)的慧光車牌號(hào)碼自動(dòng)識(shí)別系統(tǒng),能夠自動(dòng)偵測、識(shí)別并驗(yàn)證正在行駛或停泊中的車輛
28、的牌照號(hào)碼,并能辨認(rèn)含有中、英及韓文的車牌。此外,各高校部門實(shí)驗(yàn)室也相繼投入科研力量,如清華大學(xué)人工智能國家重點(diǎn)實(shí)驗(yàn)室、上海交通大學(xué)計(jì)算機(jī)科學(xué)和工程系、浙江大學(xué)自動(dòng)化系等,在車牌識(shí)別方面均有研究,并都取得了不錯(cuò)的成績。中科院自動(dòng)化研究所的劉智勇等人發(fā)表文章,提出在具有3180個(gè)樣本的樣本集中,車牌定位的準(zhǔn)確率為99.4%,切分的準(zhǔn)確率為94.5%;北京航空航天大學(xué)的胡愛明等利用末班匹配技術(shù),開發(fā)了一種可應(yīng)用于收費(fèi)站的車牌識(shí)別系統(tǒng),該系統(tǒng)
29、的識(shí)別準(zhǔn)確率能夠達(dá)到97%以上。</p><p> 關(guān)于車牌識(shí)別的研究,國內(nèi)外學(xué)者已經(jīng)做了大量的工作,但仍然存在一些問題,比如車牌圖像的傾斜、車牌自身的磨損、光線的干擾都會(huì)影響到定位的精度。車牌字符識(shí)別是在車牌準(zhǔn)確定位的基礎(chǔ)上,對(duì)車牌使得漢字、字母、數(shù)字進(jìn)行有效確認(rèn)的過程。目前已有的方法很多,但其效果與實(shí)際的要求相差很遠(yuǎn),難以適應(yīng)現(xiàn)代化交通系統(tǒng)高速度、快節(jié)奏的要求。因而對(duì)字符識(shí)別的進(jìn)一步研究也同樣具有緊迫性和必
30、要性。</p><p> 1.3 本文研究內(nèi)容</p><p> 本文主要是針對(duì)定位后的車牌字符圖像進(jìn)行預(yù)處理再進(jìn)行分割并且識(shí)別,在這個(gè)過程中主要是要實(shí)現(xiàn)利用BP網(wǎng)絡(luò)進(jìn)行車牌字符識(shí)別。對(duì)于車牌圖像首先要進(jìn)行預(yù)處理,預(yù)處理的部分就包括車牌圖像去噪,車牌圖像灰度化和車牌圖像二值化。預(yù)處理完之后就要對(duì)圖像進(jìn)行分割處理,再把車牌中的每個(gè)字符給提供出來形成單個(gè)字符的圖像。提取出單個(gè)的車牌字符圖像
31、后就要對(duì)車牌字符進(jìn)行特征中提取,把這些特征值送入到BP網(wǎng)絡(luò)進(jìn)行識(shí)別。BP網(wǎng)絡(luò)是一個(gè)需要預(yù)先學(xué)習(xí)的網(wǎng)絡(luò),所以需要建立字符庫。這個(gè)庫就是要把車牌字符一般性特征給體現(xiàn)出來,把字符庫的特征值送人到BP網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)得到一個(gè)具有識(shí)別功能的BP網(wǎng)絡(luò)。</p><p> 基于上述的思想實(shí)現(xiàn)車牌字符識(shí)別的程序流程圖如圖1-1所示。</p><p> 圖1.1 BP網(wǎng)絡(luò)車牌字符識(shí)別流程圖</p&g
32、t;<p> 第二章 字符識(shí)別方法</p><p><b> 2.1 圖像預(yù)處理</b></p><p> 圖像預(yù)處理就是對(duì)將要利用的圖片進(jìn)行處理使得圖像有更好的利用效果,可以很好的從處理過的圖片中得到想需要的信息。這個(gè)過程中有車牌圖像去噪、車牌圖像灰度化、車牌圖像二值化等。</p><p> 2.1.1 車牌規(guī)律<
33、;/p><p> 要對(duì)車牌圖像處理就需要現(xiàn)歸納統(tǒng)計(jì)我國的車牌特點(diǎn)和規(guī)律。</p><p> 我國的車牌不僅種類多,而且不夠規(guī)范,分為很多種類型,并且車牌上還有漢字。按顏色分類,有藍(lán)底白字、黃底黑字、白底黑字和黑底白字之分,有些部隊(duì)用車車牌字符還分為了兩行。由于車牌的種類多排版不一樣,所以本文主要是針對(duì)藍(lán)底白字的小型民用車進(jìn)行識(shí)別。</p><p> 我國的小型民用
34、車車牌一共是七位(除去分隔符),前面兩位是地區(qū)信息,后面五位是號(hào)碼,并采用藍(lán)底白字的車牌,輪廓尺寸為440mm×140mm,寬和高近似比例為3:1。號(hào)牌詳細(xì)式樣如圖2-1所示。</p><p> 圖2-1 我國小型民用車車牌規(guī)格</p><p><b> 灰度轉(zhuǎn)化</b></p><p> 灰度圖(GrayScale)是指只包
35、含亮度信息,例如平時(shí)看到的亮度由暗到明連續(xù)變化的黑白照片。要表示灰度圖,就需要把亮度值量化,通常分成0~255共256個(gè)級(jí)別,0最暗(全黑),255最亮(全白)。由于256級(jí)灰度比較較簡單,若是彩色圖像,其顏色種類較多,不利于圖像處理,因此一般都是將彩色圖像轉(zhuǎn)化為灰度圖進(jìn)行處理。攝像機(jī)抓拍到的車輛圖像均為24位真彩色圖像,灰度圖像的每一個(gè)像素R,G,B分量的值是相等的,所以可以根據(jù)下述灰度值和RGE顏色對(duì)應(yīng)關(guān)系轉(zhuǎn)換成灰度圖:</p
36、><p> 灰度值=0.299R+0.587G+0.114B</p><p> 如圖2-2和圖2-3分別所示為24位真彩色車輛圖像以及它的灰度圖。</p><p> 圖2-2 24位真彩色車輛圖像 圖2-3 灰度圖</p><p><b> 邊緣檢測</b></p>
37、<p> 邊緣是指圖像灰度發(fā)生空間突變或者在梯度方向上發(fā)生突變的像素的集合,也可定義為圖像局部特征的不連續(xù)性,例如灰度的突變,顏色的突變,紋理結(jié)構(gòu)的突變等等。邊緣通常意味著一個(gè)區(qū)域的終結(jié)和另一個(gè)區(qū)域的開始。邊緣的檢測常借助空域微分算子進(jìn)行,通過微分模板與圖像卷積完成。用攝像機(jī)采集到的機(jī)動(dòng)車圖像由于受到噪聲干擾以及車輛本身的影響,使得獲得的圖像質(zhì)量不理想。因此,再進(jìn)行汽車牌照的定位及字符識(shí)別之前需要先對(duì)車輛圖像進(jìn)行邊緣檢測
38、處理提高圖像的質(zhì)量,使其易于后面的分割與識(shí)別。通過良好的邊緣檢測可以大幅度的降低噪聲、分離出復(fù)雜環(huán)境中的車輛圖像,保留完好的車牌字符信息,方便后面的車牌精確定位與字符識(shí)別。</p><p> 由于車牌識(shí)別系統(tǒng)攝像頭安裝位置固定以及機(jī)動(dòng)車車牌的固有屬性,可以發(fā)現(xiàn)機(jī)動(dòng)車車牌圖像都處在水平的矩形區(qū)域,在圖像中位置較為固定,車牌中字符都是按水平方向排列,所以經(jīng)過適當(dāng)?shù)膱D形變換便可以清晰地呈現(xiàn)出車牌的邊緣。對(duì)車牌圖像進(jìn)行
39、邊緣檢測,有若干種方法可以使用,其中大多數(shù)是基于導(dǎo)數(shù)掩模求卷積的方法。</p><p> 本文采用經(jīng)典的Sobel算子來對(duì)圖像進(jìn)行邊緣檢測,如圖2-4和圖2-5所示。</p><p> 圖2-4 輪廓圖 圖2-5 Sobel邊緣檢測后的圖像</p><p><b> 2.2 車牌定位</b></p
40、><p> 攝像頭拍攝的圖片不僅僅只有車牌部分的圖片,而且還有車身等區(qū)域的圖片,但只有車牌部分是有用區(qū)域,其他部分都是無用區(qū)域。所以我們要對(duì)照片進(jìn)行車牌定位,然后把車牌部分分割出來。車牌定位和分割是從經(jīng)過圖像預(yù)處理后的灰度圖像中確定牌照位置,并將車牌部分從整個(gè)圖像中分割出來,從而進(jìn)行字符識(shí)別。車牌定位和分割的精確度直接關(guān)系到最后的字符識(shí)別質(zhì)量的好壞。</p><p> 2.2.1 牌照區(qū)域
41、剪切</p><p> 到如今人類已經(jīng)在車牌定位方面進(jìn)行了很多的研究,總結(jié)起來主要有以下幾種:</p><p> ?。?)基于數(shù)學(xué)形態(tài)學(xué)的車牌定位方法。這種方法基本上是利用數(shù)學(xué)形態(tài)學(xué)進(jìn)行圖像處理,尋找到一個(gè)合適結(jié)構(gòu)元素來探測一幅圖像,確定這個(gè)元素是否能夠合適的放置在這幅圖像內(nèi)部,并檢驗(yàn)這種填方元素的方法是否合理有效。數(shù)學(xué)形態(tài)學(xué)的基本運(yùn)算包括服飾、膨脹、開啟和關(guān)閉。</p>
42、<p> ?。?)基于車牌顏色的定位方法。這種方法是利用車牌上的特征進(jìn)行定位,包括形狀、顏色和紋理特征,不如車牌的底色和字符的顏色有明顯的反差來進(jìn)行識(shí)別定位。</p><p> ?。?)基于水平灰度變化的方法。這種方法需要將彩色圖像轉(zhuǎn)換為灰度圖像,根據(jù)車牌灰度圖像的邊緣特征的水平方向的特征進(jìn)行定位。</p><p> (4)基于邊緣檢測的車牌定位方法。在車牌的邊緣部分蘊(yùn)含了豐富
43、的信息特征,邊緣檢測就是充分利用這些特征來達(dá)到定位的目的??梢赃M(jìn)行邊緣檢測的算法有多種,如Roberts邊緣算子、Sobel算子和拉普拉斯邊緣檢測都可以完成邊緣檢測。</p><p> 這些方法各有優(yōu)缺點(diǎn),要實(shí)現(xiàn)快速準(zhǔn)確地定位車牌,應(yīng)該綜合利用車牌的各種特征,僅靠單一特征難以達(dá)到目的。車牌圖像經(jīng)過灰度化和邊緣檢測的處理后,邊緣得到了加強(qiáng),牌照區(qū)域已經(jīng)非常明顯。本文采用的是水平灰度變化和Sobel算子來進(jìn)行圖像處
44、理。</p><p> 在本系統(tǒng)中,用水泡方向的差分算子對(duì)汽車圖像求梯度。</p><p> 對(duì)二維圖像而言水平梯度為:</p><p> 對(duì)圖2-3求水平梯度,取閾值為81的效果如圖2-6所示。</p><p> 圖2-6 車輛圖像水平梯度圖</p><p> 通過選定一個(gè)閾值,對(duì)梯度圖上大于此值的點(diǎn)記為
45、邊緣點(diǎn),把一段連續(xù)的邊緣點(diǎn)取其第一點(diǎn),定義這一點(diǎn)為跳變點(diǎn)。對(duì)水平方向邊緣點(diǎn)的掃描,可以得出此行上跳變點(diǎn)的分布,對(duì)整幅圖進(jìn)行掃描就得到全部的跳變點(diǎn)的分布。通過求牌照區(qū)域的算法可以看出,會(huì)找到牌照大致可能在哪行,所以通過定牌照左右邊界算法得到分割后的車牌。如圖2-7所示。</p><p> 圖2-7 分割后的車牌</p><p> 2.2.2 牌照幾何位置的調(diào)整</p>&
46、lt;p> 當(dāng)攝像機(jī)在一定高度而水平方向不與汽車正對(duì)是拍照會(huì)左右方向的傾斜。當(dāng)從左向右照時(shí),會(huì)右傾且右面比左面更傾斜,如圖2-8所示。當(dāng)從右向左照時(shí),會(huì)左傾且左面比右面更傾斜,如圖2-9所示。任何一種傾斜都會(huì)影響牌照字符的切分,所以有必要對(duì)其進(jìn)行矯正。</p><p> 圖2-8 向右邊傾斜的牌照 圖2-9 向左邊傾斜的牌照</p><p&
47、gt; 矯正的方法是采用Hough變換,其原理如下:</p><p> 極坐標(biāo)中直線的方程為:</p><p> 式中s是直線離原點(diǎn)的法線距離,是該法線對(duì)x軸的角度,如圖2-10所示。</p><p> 圖2-10 Hough變換原理圖</p><p> 左右傾斜算法如下:首先對(duì)牌照區(qū)域進(jìn)行擴(kuò)展,使其包含左右邊框,然后對(duì)此區(qū)域作水
48、平Sobel變換,對(duì)Sobel變換圖求出其水平方向的跳變圖,然后對(duì)其進(jìn)行Hough變換。</p><p><b> 2.2.3 二值化</b></p><p> 由于得到的圖像為灰度圖像,而在車牌識(shí)別系統(tǒng)中,要求處理的速度高、成本低、信息量大,采用二值圖像進(jìn)行處理,能大大地提高處理效率。所以為了便于對(duì)圖像的處理,首先需要將圖像進(jìn)行二值化操作。</p>
49、<p> 二值化是指把整幅圖像畫面轉(zhuǎn)換為僅黑、白二值的圖像。在數(shù)字圖像處理中,二值圖像占有非常重要的地位。在實(shí)際的車牌處理系統(tǒng)中,進(jìn)行圖像二值變換的關(guān)鍵是要確定合適的閾值,使得字符與背景能夠分割開來,二值變換的結(jié)果圖像必須要具備良好的保形性,不丟掉有用的形狀信息,不會(huì)產(chǎn)生額外的空缺等等。 二值化后的牌照圖片如圖2-11所示。</p><p> 圖2-11 牌照二值化圖</p>&l
50、t;p><b> 2.3 字符分割</b></p><p> 字符分割是將車牌圖像的七個(gè)字符分割成一個(gè)個(gè)獨(dú)立的字符圖像,以供下一步神經(jīng)網(wǎng)絡(luò)識(shí)別用。字符分割是識(shí)別的基礎(chǔ),分割的好壞直接影響到識(shí)別的效果。</p><p> 2.3.1 圖像去噪</p><p> 車牌圖像去噪目的是為了改善車牌圖像的質(zhì)量,減少圖片上的噪聲干擾。在獲取到
51、的車牌二值化圖像中要先消除噪聲干擾。經(jīng)常影響圖片質(zhì)量的噪聲源可分為三類,一是在感光片上的圖像會(huì)受到感光顆粒噪聲的影響;二是圖像從光學(xué)到電子形式的轉(zhuǎn)換是一個(gè)統(tǒng)計(jì)過程,這是因?yàn)槊總€(gè)圖像像素接收到的光子數(shù)目是有限的;三是處理信號(hào)的電子放大器會(huì)引入熱噪聲。這三種噪聲都有相應(yīng)的數(shù)學(xué)模型,主要是要對(duì)噪聲進(jìn)行濾波,濾波的方法有許多種,例如中指濾波、變換域?yàn)V波、小波去噪等。去噪后的圖像如圖2-12所示。</p><p> 圖2
52、-12 去噪后的牌照</p><p> 2.3.2 牌照字符分割</p><p> 字符分割算法是以垂直投影、字符間距尺寸測定、字符的長寬比、輪廓分析技術(shù)的組合為基礎(chǔ)的。由于二值化的原因,可能會(huì)產(chǎn)生粘連、斷裂的字符。此時(shí)要根據(jù)牌照的大致寬度,結(jié)合各字符的輪廓,利用分割、合并的方法正確地分割字符。采用一個(gè)目標(biāo)函數(shù)搜索合并字符內(nèi)的各個(gè)斷裂點(diǎn)是一種有效的方法。該目標(biāo)函數(shù)是垂直投影函數(shù)與二次
53、差分的比率,即:</p><p> 分割目標(biāo)函數(shù)的最高值看作是可能出現(xiàn)的斷裂點(diǎn)。本文中字符分割的算法如下,如圖2-13和圖2-14所示。</p><p> 圖2-13 牌照二值化圖 圖2-14 圖2-13的點(diǎn)陣水平投影圖</p><p> 從投影圖2-14可以看出字符與字符的分界處往往是投影比較少的地方,并且字符與字符的分界處投影往
54、往接近零或者為零,所以取初始閾值t=1對(duì)投影圖進(jìn)行掃描,過程如下:</p><p> ?、?“while(project[i]<t) i++;”,記下位置a;</p><p> ② “while(project[i]>=t) i++;”,記下位置b;</p><p> ?、?得到一個(gè)分割區(qū),區(qū)數(shù)加1,重復(fù)步驟①;</p><p&
55、gt; ④ 如果區(qū)數(shù)小于7,則(自定);</p><p><b> ?、?重復(fù)①。</b></p><p> 分割效果如圖2-15和圖2-16所示。</p><p> 圖2-15 牌照二值化圖 圖2-16 t=1時(shí)圖2-15的點(diǎn)陣水平投影圖的分割圖</p><p> 從圖2-16可以看出經(jīng)過一次
56、分割已經(jīng)把那些明顯分開的區(qū)域分割開了,但是有些區(qū)域過大,并且只有6個(gè)區(qū)域(兩條豎線間的區(qū)域)。所以讓t=t+2,結(jié)果如圖2-17和圖2-18所示。</p><p> 圖2-17 牌照二值化圖 圖2-18 t=3時(shí)圖2-17的點(diǎn)陣水平投影圖的分割圖</p><p> 從圖2-18中可以看出那些過寬的區(qū)域中又分開了一塊,但是有一塊區(qū)域還是過大,但是區(qū)域數(shù)已經(jīng)達(dá)到要求。分割
57、出的牌照字符圖像如圖2-19所示。</p><p> 圖2-19 分割出的字符圖像</p><p> 2.3.3 字幅圖像歸一化</p><p> 字符分割處理后得到的單個(gè)數(shù)字、字母和漢字圖像,還必須進(jìn)行歸一化處理,以消除因牌照傾斜帶來的字符在位置和大小上的變化。歸一化處理主要包括位置歸一化和大小歸一化,甚至筆劃(粗細(xì))歸一化。對(duì)于漢字識(shí)別,漢字點(diǎn)陣的歸一化
58、是十分重要的,因?yàn)闈h字識(shí)別主要基于漢字的圖形結(jié)構(gòu),如果不能將漢字點(diǎn)陣在位置和大小上歸一化處理一致起來,漢字點(diǎn)陣的相似性比較久無法正確進(jìn)行。歸一化后的牌照圖像如圖2-20所示。</p><p> 圖2-20 歸一化處理后的牌照圖像</p><p> 2.3.4 細(xì)化處理</p><p> 對(duì)圖像的細(xì)化過程是求圖像的骨架過程。骨架是二維二值目標(biāo)的重要描述,它指圖
59、像中央的骨骼部分,是描述圖像幾何及拓?fù)湫再|(zhì)的重要特征之一。細(xì)化算法有很多,按照迭代方分為兩類,一類是非迭代過程,一類是迭代過程。非迭代算法有基于距離變換的方法等,迭代方法是通過重復(fù)刪除像素邊緣,直到得到單獨(dú)像素寬度的圖像為止?,F(xiàn)在用的比較多的細(xì)化算法有Hilditch、Pavlidis、Rosenfeld細(xì)化算法和索引表細(xì)化算法等。車牌圖像進(jìn)行預(yù)處理后,細(xì)化處理是關(guān)系到后面能否正確提取字符特征值的關(guān)鍵,本文使用Rosenfeld骨架細(xì)化
60、的方法,細(xì)化處理后可以得到圖像中字符的基本骨架,不會(huì)破壞原來的連通性。細(xì)化后的效果圖像如圖2-21所示。</p><p> 圖2-21 細(xì)化處理后的牌照</p><p> 第三章 BP神經(jīng)網(wǎng)絡(luò)</p><p> 3.1 人工神經(jīng)網(wǎng)絡(luò)</p><p> 人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)也稱
61、為神經(jīng)網(wǎng)絡(luò)(Neural Networks,NN),即從生物學(xué)神經(jīng)系統(tǒng)的信號(hào)傳遞而抽象發(fā)展成的一門學(xué)科。在神經(jīng)網(wǎng)絡(luò)中,最基本的單元就是神經(jīng)元。</p><p> 3.1.1 人工神經(jīng)元</p><p> 神經(jīng)元由三部分組成:樹突、細(xì)胞體、軸突。樹突是樹狀的神經(jīng)纖維接受網(wǎng)絡(luò),它將電信號(hào)傳遞給細(xì)胞體,細(xì)胞體對(duì)這些輸入信號(hào)進(jìn)行整合并進(jìn)行閾值處理。軸突是單根長纖維,它把細(xì)胞體的輸入信號(hào)導(dǎo)向其他
62、的神經(jīng)元。神經(jīng)元的排列拓?fù)浣Y(jié)構(gòu)和突觸的連接強(qiáng)度確立了神經(jīng)網(wǎng)絡(luò)的功能。形象的說,神經(jīng)網(wǎng)絡(luò)是由大量處理單元(神經(jīng)元)廣泛連接而成的網(wǎng)絡(luò),是對(duì)人腦的抽象、簡化和模擬,反映人腦的基本特性。它能夠通過學(xué)習(xí)過程從外部環(huán)境中獲取知識(shí),并且它內(nèi)部的很多神經(jīng)元可以用來存儲(chǔ)這些已經(jīng)學(xué)到的知識(shí)。人工神經(jīng)元模型是生物神經(jīng)元的模型與抽象。圖3-1為一種典型的人工神經(jīng)元模型。</p><p> 圖3-1 人工神經(jīng)元模型</p>
63、;<p> 人工神經(jīng)元相當(dāng)于一個(gè)多輸入單輸出的非線性閾值器件。這里的表示的為它的n個(gè)輸入;表示與它相連的n個(gè)突觸的連接強(qiáng)度,其值成為權(quán)值;稱為激活值,表示這個(gè)人工神經(jīng)元的輸入總和,對(duì)應(yīng)于生物神經(jīng)細(xì)胞的膜電位;表示這個(gè)人工神經(jīng)元的輸出;表示這個(gè)人工神經(jīng)元的閾值。如果輸入信號(hào)的加權(quán)和超過,則人工神經(jīng)元被激活。這樣,人工神經(jīng)元的輸出可描述為</p><p><b> ?。?-1)</b&
64、gt;</p><p> 式中,是表示神經(jīng)元輸入-輸出關(guān)系的函數(shù),稱為激活函數(shù)或輸出函數(shù)。設(shè)是權(quán)與輸入的矢量積(標(biāo)量),相當(dāng)于生物神經(jīng)元由外加刺激引起的膜內(nèi)電位的變化。這樣激活函數(shù)可以寫成。這里為了表達(dá)簡單沒有寫出閾值θ。通常我們假設(shè)神經(jīng)元有n-1個(gè)突觸連接,實(shí)際輸入變量為。那么可設(shè),,這樣就加入了閾值這個(gè)量。</p><p> 閾值一般不是一個(gè)常數(shù),它是隨著神經(jīng)元的興奮程度而變化的。
65、因細(xì)胞在每次放電之后都需要一定的時(shí)間恢復(fù),也就是說神經(jīng)元的興奮存在不應(yīng)期,即相鄰二次興奮之間需要的時(shí)間間隔(大約為0.5-2.0ms),在此期間閾值會(huì)升高,即絕對(duì)不應(yīng)期內(nèi)的閾值上升為無窮大。</p><p> 激活函數(shù)有許多類型,其中比較常用的可以歸結(jié)為三種形式:閾值型、S型和線性型。本文采用S型激活函數(shù)。</p><p> 單極型S型(Sigmoid響應(yīng)特性)激活函數(shù)的輸出特性比較軟
66、,其輸出狀態(tài)的取值范圍為[0,1],它的硬度可由一系數(shù)λ來調(diào)節(jié)。特的輸入輸出關(guān)系由下圖表示,式(3-2)是它的表達(dá)式。</p><p> 圖3-2 單極型的S型激活函數(shù)</p><p><b> ?。?-2)</b></p><p> 綜上所述,神經(jīng)元具有以下特點(diǎn):</p><p> 神經(jīng)元是一多輸入、單輸出的元
67、件</p><p> 它具有非線性的輸入、輸出特征</p><p> 它具有可塑性,起訴性變化的部分主要是權(quán)值的變化,這相當(dāng)于生物神經(jīng)元的凸出部分的變化。</p><p> 神經(jīng)元的輸出響應(yīng)是各個(gè)輸入值的綜合作用的結(jié)果。</p><p> 輸入分為興奮型(正值)和抑制型(負(fù)值)兩種。</p><p> 3.1
68、.2 神經(jīng)元網(wǎng)絡(luò)的學(xué)習(xí)規(guī)則</p><p> 神經(jīng)元網(wǎng)絡(luò)的最大特點(diǎn)就是它有學(xué)習(xí)的能力,在學(xué)習(xí)過程中,主要是網(wǎng)絡(luò)的連接權(quán)的值產(chǎn)生了相應(yīng)的變化,學(xué)習(xí)到的內(nèi)容也是記憶在連接權(quán)之中。下面介紹連接權(quán)適量W(或者分量)是怎樣在學(xué)習(xí)過程中被校正的。</p><p> 令為第i個(gè)神經(jīng)元的第j個(gè)輸入連接權(quán),這個(gè)輸入可以是外來的輸入信號(hào),也可以來自其他神經(jīng)元的輸出。</p><p>
69、; 這里,主要討論單個(gè)神經(jīng)元或單層網(wǎng)絡(luò)的有監(jiān)督學(xué)習(xí)以及簡單的無監(jiān)督學(xué)習(xí)。對(duì)于不同的學(xué)習(xí)規(guī)則,神經(jīng)元的激活函數(shù)是不同的。閾值也可以包括在連接權(quán)矩陣?yán)铩?lt;/p><p> 學(xué)習(xí)信號(hào)是和的函數(shù),有時(shí)也包括教師信號(hào),所以有</p><p><b> ?。?-3)</b></p><p> 權(quán)矢量Wi的變化是由學(xué)習(xí)步驟按時(shí)間t,t+1……一步一步進(jìn)
70、行計(jì)算的。在時(shí)刻t連接權(quán)的變化量為,其中c是一個(gè)正數(shù),成為學(xué)習(xí)常數(shù),決定學(xué)習(xí)的速率。從t時(shí)刻到下一個(gè)時(shí)刻t+1,連接權(quán)可按下式計(jì)算:</p><p><b> ?。?-4)</b></p><p><b> 離散學(xué)習(xí)步驟可寫成</b></p><p><b> ?。?-5)</b></p>
71、;<p> 其中c是一個(gè)正常數(shù),成為學(xué)習(xí)常數(shù),決定學(xué)習(xí)的速率。</p><p> 3.1.3 多層人工神經(jīng)網(wǎng)絡(luò)</p><p> 由于感知器是單層網(wǎng)絡(luò)智能解決現(xiàn)行可分問題,要增強(qiáng)分類能力的唯一途徑就是采用多層網(wǎng)絡(luò),即在輸入和輸出層之間加上隱含構(gòu)成多層前饋網(wǎng)絡(luò)即為BP網(wǎng)絡(luò)模型,如圖3-3所示。這是一種三層BP網(wǎng)絡(luò),一般來講,BP網(wǎng)絡(luò)是一種具有三層或三層以上的多層神經(jīng)元網(wǎng)絡(luò)
72、,它的左、右各層之間各個(gè)神經(jīng)元實(shí)現(xiàn)全連接,即左層的每一個(gè)神經(jīng)元與右層的每個(gè)神經(jīng)元都有連接,而同層內(nèi)的各神經(jīng)元之間無連接。</p><p> 圖3-3 多層神經(jīng)網(wǎng)絡(luò)</p><p><b> 3.2 BP網(wǎng)絡(luò)</b></p><p> BP(Back Propagation)網(wǎng)絡(luò)是1986年由Rumelhart和McClelland為首的
73、科學(xué)家小組提出, 是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò),是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)模型之一。</p><p> BP網(wǎng)絡(luò)是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò)。BP網(wǎng)絡(luò)能學(xué)習(xí)和存貯大量的輸入-輸出模式映射關(guān)系,而無需事前解釋描述這種映射關(guān)系的數(shù)學(xué)方程。它的學(xué)習(xí)規(guī)則是使用最速下降法,通過反向傳播來不斷調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,使網(wǎng)絡(luò)的誤差平方和最小。BP網(wǎng)絡(luò)其神經(jīng)元的傳遞函數(shù)是S型函數(shù),輸入量為0到1之間的連續(xù)
74、量,它可以實(shí)現(xiàn)從輸入到輸出的任意非線性映射。目前,在人工神經(jīng)網(wǎng)絡(luò)的實(shí)際應(yīng)用中,絕大部分的神經(jīng)網(wǎng)絡(luò)的模型都采用BP網(wǎng)絡(luò)及其變化形式。它也是前向網(wǎng)絡(luò)的核心部分,體現(xiàn)了人工網(wǎng)絡(luò)的精華。</p><p> BP網(wǎng)絡(luò)的實(shí)現(xiàn)分為兩個(gè)階段:學(xué)習(xí)階段和識(shí)別階段。在BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)階段,輸入層各神經(jīng)元負(fù)責(zé)接收來自外界的輸入信息,并傳遞給中間層各神經(jīng)元;中間層是內(nèi)部信息處理層,負(fù)責(zé)信息變換,根據(jù)信息變化能力的需求,中間層可以設(shè)計(jì)
75、為單隱層或者多隱層結(jié)構(gòu);最后一個(gè)隱層傳遞到輸出層各神經(jīng)元的信息,經(jīng)過進(jìn)一步的處理后,完成一次學(xué)習(xí)的正向傳播處理工程,由輸出層向外界輸出信息處理結(jié)果。當(dāng)實(shí)際輸出與期望輸出不符時(shí),進(jìn)入誤差的反向傳播階段。誤差通過輸出層,按誤差梯度下降的方式修正各層權(quán)值,向隱層、輸入層逐層反傳。周而復(fù)始的信息正向傳播和誤差反向傳播過程,是各層權(quán)值不斷調(diào)整的過程,也是神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練的過程,此過程一直進(jìn)行到網(wǎng)絡(luò)輸出的誤差減少到可以接受的程度,或者預(yù)先設(shè)定的學(xué)習(xí)
76、次數(shù)為止。</p><p> 3.2.1 誤差逆?zhèn)鞑バU椒?lt;/p><p> 誤差逆?zhèn)鞑バU椒ㄊ抢脤?shí)際輸出與期望輸出之差對(duì)網(wǎng)絡(luò)的各層連接權(quán)由后向前逐層進(jìn)行校正的一種計(jì)算方法。下面介紹一個(gè)三層網(wǎng)絡(luò)模型的誤差逆?zhèn)鞑W(xué)習(xí)規(guī)則的原理。</p><p> 這個(gè)網(wǎng)絡(luò)的輸入層有n個(gè)神經(jīng)元,輸出層有q個(gè)神經(jīng)元,中間層有P個(gè)神經(jīng)元。由于中間層與輸入、輸出端沒有直接的聯(lián)系,
77、所以也常把中間層成為隱含層。首先把網(wǎng)絡(luò)的變量設(shè)置如下:</p><p> 輸入層至中間層的連接權(quán)</p><p> 中間層至輸出層的連接權(quán)</p><p><b> 中間層各單元的閾值</b></p><p><b> 輸出層各單元的閾值</b></p><p>&l
78、t;b> 其中;;;</b></p><p> 激活函數(shù)采用S型函數(shù) (3-6)</p><p> 這里之所以算S型函數(shù)作為BP網(wǎng)絡(luò)神經(jīng)元的激活函數(shù),是因?yàn)樗沁B續(xù)可微分的,而且更接近生物神經(jīng)元的信號(hào)輸出形式。</p><p> 激活函數(shù)的導(dǎo)數(shù)為
79、 (3-7)</p><p> 這里的學(xué)習(xí)規(guī)則實(shí)際上是一種Delta學(xué)習(xí)規(guī)則, 按梯度下降原則,應(yīng)使的調(diào)整量與的負(fù)值成正比例變化,所以中間層至輸出層連接權(quán)的調(diào)整量應(yīng)為</p><p><b> ?。?-8)</b></p><p> 通過推到,可得 (3-9)</p><p&g
80、t; 為了進(jìn)一步簡化,設(shè)為對(duì)輸出層輸入的負(fù)偏導(dǎo),則</p><p><b> ?。?-10)</b></p><p> 所以 (3-11)</p><p> , , , 。 </p><p> 同理,輸入層至中間層連接權(quán)
81、的調(diào)整仍按梯度下降法的原則進(jìn)行。與類似,連接權(quán)的調(diào)節(jié)量為:</p><p><b> ?。?-12)</b></p><p><b> 其中, </b></p><p> 同樣也可求出閾值的調(diào)整量,利用對(duì)于連接權(quán)的調(diào)整公式,取輸出層的輸入帶入上式,則輸出層閾值的調(diào)整量為:</p><p>&
82、lt;b> ?。?-13)</b></p><p> 同理根據(jù),取中間層的輸入,則中間層的閾值的調(diào)整量為:</p><p><b> ?。?-14)</b></p><p> 以上的推到僅是針對(duì)某一組學(xué)習(xí)模式進(jìn)行的,其誤差也是某一組的誤差。對(duì)于全部的輸入模式,我們有網(wǎng)絡(luò)的全局誤差</p><p>&
83、lt;b> ?。?-15)</b></p><p> 從以上推倒可以看出,各個(gè)連接權(quán)的調(diào)整量是分別于各個(gè)學(xué)習(xí)模式對(duì)的誤差函數(shù)成正比例變化的,這種方法稱為標(biāo)準(zhǔn)誤差逆?zhèn)鞑ニ惴ā?lt;/p><p> BP網(wǎng)絡(luò)的學(xué)習(xí)規(guī)則實(shí)現(xiàn)的是學(xué)習(xí)模式集合上平方和誤差(或)的梯度下降,而不是特定某個(gè)分量的絕對(duì)誤差的梯度下降。因此,每次校正完后,網(wǎng)絡(luò)輸出端的誤差對(duì)于某些神經(jīng)元來說也有可能增加,但
84、在進(jìn)行多次反復(fù)計(jì)算后,其誤差還是應(yīng)該變小的。</p><p> 3.2.2 BP網(wǎng)絡(luò)學(xué)習(xí)算法</p><p> BP神經(jīng)網(wǎng)絡(luò)采用BP算法進(jìn)行學(xué)習(xí),其學(xué)習(xí)過程分為四個(gè)階段:</p><p> ?。?)輸入模式是由輸入層經(jīng)過隱含層向輸出層逐層傳遞的“模式順傳播”過程。</p><p> ?。?)網(wǎng)絡(luò)的期望輸入與實(shí)際輸出之差,即誤差信號(hào),是由輸
85、出層經(jīng)隱含層向輸入層逐層修正連接權(quán)值的“誤差逆?zhèn)鞑ァ边^程。</p><p> ?。?)由“模式順傳播”過程和“誤差逆?zhèn)鞑ァ边^程反復(fù)交替進(jìn)行的網(wǎng)絡(luò)“記憶訓(xùn)練”過程。</p><p> ?。?)網(wǎng)絡(luò)趨向收斂,即網(wǎng)絡(luò)的全局誤差趨向極小值的“學(xué)習(xí)收斂”過程。</p><p> 下面以三層BP網(wǎng)絡(luò)介紹其算法。</p><p> 設(shè)注入模式向量為(k
86、=1,2,…,m),其中m為學(xué)習(xí)模式對(duì)個(gè)數(shù),n為輸入層單元個(gè)數(shù);對(duì)應(yīng)輸入模式的期望輸出向量為,q為輸出層單元個(gè)數(shù);中間隱含層的凈輸入向量為,輸出向量為,p為隱含層單元個(gè)數(shù);輸出層凈輸入向量為,實(shí)際輸出向量為;輸入層至隱含層的連接權(quán)值為(i=1,2,…,n,j=1,2,…,p),隱含層至輸出層的連接權(quán)值為(j=1,2,…,p,t=1,2,…,q);隱含層各個(gè)單元的閾值為(j=1,2,…,p),輸出層各個(gè)單元的閾值為(t=1,2,…,q)。
87、</p><p><b> BP算法描述如下:</b></p><p> ?。?)初始化。給各連接權(quán)值W、V及閾值、賦予之間的隨機(jī)值。 </p><p> ?。?)隨機(jī)選取一個(gè)學(xué)習(xí)模式對(duì)量對(duì)()提供給網(wǎng)絡(luò)。</p><p> ?。?)計(jì)算輸入層的輸出。輸入層的各個(gè)處理單元對(duì)輸入模式不進(jìn)行處理,只是簡單地將接收到的輸入
88、模式作為相應(yīng)的輸出模式傳遞給隱含層,即輸入層的輸出向量與輸入模式向量相同。</p><p> ?。?)按照式(3-16)和式(3-17)計(jì)算中間隱含層各個(gè)神經(jīng)元的凈輸入和輸出</p><p><b> ?。?-16)</b></p><p><b> (3-17)</b></p><p> ?。?
89、)按照式(3-18)和式(3-19)計(jì)算輸出層各個(gè)神經(jīng)元的凈輸入和實(shí)際輸出 t=1,2,…,q (3-18)</p><p> t=1,2,…,q (3-19)</p><p> ?。?)根據(jù)給定的期望輸出,按照式(3-20)計(jì)算輸出層各個(gè)神經(jīng)元的校正誤差</p><p> t=1,2,…
90、,q (3-20)</p><p> (7) 按照式(3-21)計(jì)算隱含層各個(gè)神經(jīng)元的校正誤差</p><p> j=1,2,…,p (3-21)</p><p> ?。?)按照式(3-22)和式(3-23)修正隱含層至輸出層的連接權(quán)值V和輸出層神經(jīng)元的閾值,其中為學(xué)習(xí)速率,0<<1
91、 </p><p> ,t=1,2,…,q (3-22)</p><p> t=1,2,…,q (3-23)</p><p> ?。?)按照式(3-24)和式(3-25)修正隱含層至輸出層的連接權(quán)值W和輸出層神經(jīng)元的閾值,其中為學(xué)習(xí)速率,0<<1</p><
92、;p> , j=1,2,…,p (3-24)</p><p> j=1,2,…,p (3-25)</p><p> ?。?0)隨機(jī)選取下一個(gè)學(xué)習(xí)模式對(duì)提供給網(wǎng)絡(luò),返回(3),直至全部m個(gè)學(xué)習(xí)模式對(duì)訓(xùn)練完畢。</p><p> (11)判斷網(wǎng)絡(luò)全局誤差E是否滿足精度要求,及。若滿足,則轉(zhuǎn)至(13),否則繼續(xù)
93、。</p><p> ?。?2)更新網(wǎng)絡(luò)學(xué)習(xí)次數(shù),若學(xué)習(xí)次數(shù)小于規(guī)定的次數(shù),返回(2)。</p><p><b> ?。?3)結(jié)束。</b></p><p> 在以上學(xué)習(xí)步驟中(3)-(5)為輸入學(xué)習(xí)模式的“順傳播過程”,(6)-(9)為網(wǎng)絡(luò)誤差的“逆?zhèn)鞑ミ^程”,(10)完成“學(xué)習(xí)訓(xùn)練”(11)~(12)為收斂過程。BP網(wǎng)絡(luò)學(xué)習(xí)算法具體流程如
94、圖3-4所示。</p><p> 圖3-4 BP網(wǎng)絡(luò)學(xué)習(xí)算法流程圖</p><p> 第四章 基于BP網(wǎng)絡(luò)的車牌識(shí)別系統(tǒng)</p><p> 4.1 字符特征提取</p><p> 字符特征提取就是在字符圖像中需要提取出字符的特征來表示這個(gè)字符,所以需要設(shè)計(jì)出一組能代表字符特征的數(shù)據(jù)。對(duì)于輸入矢量的選取是否全面刻畫字符特征直接影響
95、識(shí)別的結(jié)果,所以字符特征的選取是一個(gè)權(quán)衡各方面特征的結(jié)果。那么,矢量選取的方法有:</p><p><b> 基元數(shù)</b></p><p> 水平基元數(shù)是掃描字符的每行看其有幾個(gè)線段。</p><p> 豎直基元數(shù)是掃描字符的每列看其有幾個(gè)線段。</p><p><b> 水平寬度</b>
96、</p><p> 水平平均寬度是掃描每行看其起始字符點(diǎn)和結(jié)束字符點(diǎn)的距離。</p><p> 垂直平均寬度是掃描每列看其起始字符點(diǎn)和結(jié)束字符點(diǎn)的距離。</p><p><b> 區(qū)域分布</b></p><p> 把32×16的字符區(qū)域分成32小區(qū)域,統(tǒng)計(jì)每個(gè)區(qū)域中字符點(diǎn)的數(shù)目。</p>
97、<p><b> 投影</b></p><p> 行投影,對(duì)每行記錄其字符點(diǎn)數(shù)目。</p><p> 列投影,對(duì)每列記錄其字符點(diǎn)數(shù)目。</p><p> 把這些特征綜合起來就形成了字符的矢量特征。</p><p> 4.2 系統(tǒng)識(shí)別模塊 </p><p> 本系統(tǒng)識(shí)別模塊如
98、圖4-1所示。</p><p> 圖4-1 本系統(tǒng)識(shí)別框圖</p><p> 字符識(shí)別是基于3層BP神經(jīng)網(wǎng)絡(luò)的,字符向量的特征提取是關(guān)鍵。提取單一的特征送入神經(jīng)網(wǎng)絡(luò)的識(shí)別效果并不十分理想,這里通過提取二值化字符的各方面特征,如投影距離、投影直方圖、矩、區(qū)域密度、輪廓線特征系數(shù),送入神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別。</p><p> 為了加快神經(jīng)網(wǎng)絡(luò)的識(shí)別速度以及滿足神經(jīng)網(wǎng)
99、絡(luò)輸入向量個(gè)數(shù)的要求,需要用BLT(Binarization Linear Transform)減少輸入向量,達(dá)到個(gè)數(shù)匹配以及加快識(shí)別速度的要求。對(duì)一些形狀類似的字符,如Q、O與D、B與8、T與7等,神經(jīng)網(wǎng)絡(luò)不能很正確地分辨,所以還要進(jìn)行后續(xù)的拓?fù)浞治?,以確保字符的正確識(shí)別。</p><p><b> 4.3 程序運(yùn)行</b></p><p> 程序的主界面如圖4
100、-2所示。</p><p> 圖4-2 程序主界面</p><p> 程序的主要功能都通過這幾個(gè)菜單來實(shí)現(xiàn)。常用的菜單也已經(jīng)集成到了工具欄上,如新建、打開、保存、打印、重新打開圖像、一次執(zhí)行等。打開一個(gè)灰度化處理后的圖片,如圖4-3所示,點(diǎn)擊車牌提取及預(yù)處理依次進(jìn)行車牌定位、車牌二值化、車牌歸一化、車牌字符細(xì)化等步驟,得到如圖4-4所示的車牌圖像,即為處理過后的車牌圖像。</p
101、><p> 圖4-3 打開一張車輛圖片</p><p> 圖4-4 處理過后的車牌圖像</p><p> 點(diǎn)擊車牌識(shí)別,得到如圖4-5所示的車牌識(shí)別結(jié)果。</p><p> 圖4-5 車牌識(shí)別結(jié)果</p><p> 更換一張車輛圖片,按照上述步驟執(zhí)行,依次得到的結(jié)果如圖4-6~圖4-8所示。</p&g
102、t;<p> 圖4-6 更換車牌圖像</p><p> 圖4-7 圖像處理后的效果圖</p><p> 圖4-8 第二幅車牌識(shí)別結(jié)果</p><p> 根據(jù)圖4-5和圖4-8對(duì)比判斷,第二次車牌識(shí)別出現(xiàn)錯(cuò)誤。車牌魯A·T2205被系統(tǒng)誤識(shí)別為魯I·T5505,由于獲得的車牌處理后較為傾斜,因此在識(shí)別過程中出現(xiàn)了偏差,造
103、成識(shí)別不準(zhǔn)確。因此在獲得車牌圖像后對(duì)車牌傾斜矯正的處理方面,是今后需要改進(jìn)的地方。</p><p> 第五章 總結(jié)與展望</p><p><b> 5.1 總結(jié)</b></p><p> 本文利用C++對(duì)車牌圖像進(jìn)行數(shù)字化處理,最后利用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行字符識(shí)別,再根據(jù)前人研究的基礎(chǔ)上,對(duì)該設(shè)計(jì)的流程和出現(xiàn)的問題進(jìn)行研究和處理,主要對(duì)圖像
104、預(yù)處理,車牌圖像的定位,車牌圖像的字符分割,車牌字符識(shí)別四個(gè)方面做了系統(tǒng)的研究。</p><p> 主要完成的內(nèi)容包括:</p><p> 1、利用Visual C++語言編寫程序,實(shí)現(xiàn)了車牌圖像預(yù)處理、特征提取、字符識(shí)別等功能。</p><p> 2、查閱大量資料,了解了BP神經(jīng)網(wǎng)絡(luò)的算法,體會(huì)到了神經(jīng)網(wǎng)絡(luò)的優(yōu)勢和在未來發(fā)揮的作用。</p>&
105、lt;p> 3、通過測試表明,本課題能實(shí)現(xiàn)對(duì)待車牌圖像的識(shí)別功能,可以提供智能化的識(shí)別系統(tǒng),提高了識(shí)別速度和準(zhǔn)確性。</p><p><b> 5.2 展望</b></p><p> 該課題車牌識(shí)別系統(tǒng)是一個(gè)實(shí)用性和強(qiáng)的智能識(shí)別系統(tǒng),但由于實(shí)際的環(huán)境和學(xué)術(shù)知識(shí)的局限,讓整個(gè)系統(tǒng)還有很多有待改善的地方。例如本設(shè)計(jì)對(duì)于車牌的傾斜條件下識(shí)別準(zhǔn)確度下降的問題,需要
106、后續(xù)的研究工作,進(jìn)一步優(yōu)化系統(tǒng)。此外,對(duì)于外界環(huán)境的變化,如光照和夜間等情況,若能克服,將對(duì)交通狀況智能化具有重大意義。</p><p><b> 參考文獻(xiàn)</b></p><p> [1]史忠職. 神經(jīng)網(wǎng)絡(luò)[M]. 高等教育出版社,2009.5.</p><p> [2]孫鑫.VC++深入詳解[M]. 電子工業(yè)出版社,2006.<
107、/p><p> [3]王萬森. 人工智能原理及其應(yīng)用[M]. 電子工業(yè)出版社,2007.</p><p> [4]董志鵬,侯艷書. Visual C++編程從基礎(chǔ)到應(yīng)用[M]. 清華大學(xué)出版社,2014.3</p><p> [5]沈晶. Visual C++數(shù)字圖像處理典型案例詳解[M]. 機(jī)械工業(yè)出版社,2012.</p><p>
108、 [6]馬銳. 人工神經(jīng)網(wǎng)絡(luò)原理[M]. 第一版. 機(jī)械工業(yè)出版社, 2010年9月.</p><p> [7]張世輝,孔令富.漢字識(shí)別及現(xiàn)狀分析[J]. 燕山大學(xué)學(xué)報(bào),2003,04(3)80-85.</p><p> [8]趙輝 葉子青. Visual C++系統(tǒng)開發(fā)實(shí)例精粹[M]. 人民郵電出版社.</p><p> [9]王旭 王宏 王文輝. 人工神經(jīng)
109、元網(wǎng)絡(luò)原理與應(yīng)用[M]. 第二版. 東北大學(xué)出版社, 2007年.</p><p> [10]曾志軍,孫國強(qiáng). 基于改進(jìn)的BP 網(wǎng)絡(luò)數(shù)字字符識(shí)別[J].上海理工大學(xué)學(xué)報(bào),2008, 32(1)51-53.</p><p> [11]沈晶. Visual C++數(shù)字圖像處理典型案例詳解[M],機(jī)械工業(yè)出版社,2012. </p><p> [12]歐陽俊,劉平.
110、基于BP神經(jīng)網(wǎng)絡(luò)的車牌字符識(shí)別算法研究[J].光學(xué)與光電技術(shù),2012,10(5)67-71.</p><p> [13]張玲,張鳴明,何偉.基于BP神經(jīng)網(wǎng)絡(luò)算法的車牌字符識(shí)別系統(tǒng)設(shè)計(jì)[J].視頻應(yīng)用與工程,2008,32(S1)140-142.</p><p> [14]Application of Image Processing to the Characterization o
111、f Nanostructures,Manuel F. M. Costa,Reviews on Advanced Materials Science.</p><p> [15]Bartlett P L. Ada Boost is Consistent [M]. Department of statics and computer science of California.</p><p&g
112、t;<b> 外文資料</b></p><p> License Plate Recognition Based On Prior Knowledge</p><p> Abstract - In this paper, a new algorithm based on improved BP (back propagation) neural network
113、for Chinese vehicle license plate recognition (LPR) is described. The proposed approach provides a solution for the vehicle license plates (VLP) which were degraded severely. What it remarkably differs from the tradition
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 畢業(yè)設(shè)計(jì)論文 基于bp網(wǎng)絡(luò)的車牌識(shí)別系統(tǒng)的設(shè)計(jì)
- 車牌識(shí)別系統(tǒng)畢業(yè)設(shè)計(jì)
- 基于matlab的車牌識(shí)別系統(tǒng)的設(shè)計(jì)畢業(yè)設(shè)計(jì)
- 車牌識(shí)別系統(tǒng)畢業(yè)設(shè)計(jì)
- 車牌識(shí)別系統(tǒng)畢業(yè)設(shè)計(jì)
- 畢業(yè)設(shè)計(jì)-- 基于matlab的車牌識(shí)別系統(tǒng)的設(shè)計(jì)
- 【畢業(yè)設(shè)計(jì)】基于matlab車牌識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
- 車牌識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)畢業(yè)設(shè)計(jì)論文
- 車牌識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)畢業(yè)設(shè)計(jì)論文
- 車牌識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)畢業(yè)設(shè)計(jì)論文
- 畢業(yè)設(shè)計(jì)-- 基于matlab的汽車車牌的號(hào)碼識(shí)別系統(tǒng)設(shè)計(jì)
- 畢業(yè)設(shè)計(jì)基于matlab的汽車車牌的號(hào)碼識(shí)別系統(tǒng)設(shè)計(jì)
- 基于BP神經(jīng)網(wǎng)絡(luò)的車牌識(shí)別系統(tǒng)研究.pdf
- 車牌識(shí)別系統(tǒng)的設(shè)計(jì)
- 畢業(yè)論文----車牌識(shí)別系統(tǒng)的設(shè)計(jì)
- 車牌識(shí)別系統(tǒng)圖像預(yù)處理畢業(yè)設(shè)計(jì)論文
- 基于matlab的車牌識(shí)別系統(tǒng)設(shè)計(jì)論文
- 車牌識(shí)別課程設(shè)計(jì)--車牌識(shí)別系統(tǒng)設(shè)計(jì)
- 基于車牌識(shí)別系統(tǒng)的車牌定位方法的設(shè)計(jì)與實(shí)現(xiàn)
- 基于視頻流的車牌識(shí)別系統(tǒng)設(shè)計(jì).pdf
評(píng)論
0/150
提交評(píng)論