2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩41頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、<p>  畢 業(yè) 設(shè) 計(論 文)</p><p>  題目基于分塊離散余弦變換和</p><p>  主成分分析法的人臉識別</p><p><b>  摘 要</b></p><p>  隨著計算機和網(wǎng)絡(luò)技術(shù)的快速發(fā)展,信息安全呈現(xiàn)出前所未有的重要性。人臉識別因其廣闊的發(fā)展前景和重要的理論研究價值,受到

2、國內(nèi)外眾多研究機構(gòu)的廣泛重視。其中分塊DCT變換是最近幾年以來比較常見的圖像處理工具,在人臉識別領(lǐng)域得到廣泛的發(fā)展。</p><p>  本文在研究了分塊散余弦變換(DCT)的特點的基礎(chǔ)上研究了基于分塊DCT變換和PCA的人臉識別算法,充分利用了分塊DCT變換快速高效的特點以及PCA方法降維減少運算時間的優(yōu)勢,大大縮短識別時間。首先利用分塊DCT對人臉圖像進行預(yù)處理,將DCT預(yù)處理后的低頻信息作為特征。最后通過使

3、用K-L變換取特征值、特征向量以及PCA降維的方式來形成特征臉,識別部分采用歐氏距離最近鄰法進行了人臉識別。在ORL及YALE人臉庫上實驗結(jié)果表明,本方法不僅能提高人臉識別的識別率,并且利用了分塊DCT快速高效的特點,能夠顯著縮短識別時間。</p><p>  關(guān)鍵詞:離散余弦變換(DCT);主成分分析法(PCA);K-L變換;人臉識別;預(yù)處理 </p><p><b>  AB

4、STRACT</b></p><p>  With the rapid development of computer and network technology, information security shows unprecedented importance. Face recognition because of its wide development prospect and imp

5、ortant theoretical research value, extensive attention by many research institutions at home and abroad. The block DCT transform is more common in recent years since the image processing tools, has been widely developmen

6、t in the field of face recognition.</p><p>  Based on the study of the basic block discrete cosine transform (DCT) on the characteristics of the study on DCT and PCA face recognition algorithm based on full

7、use of the block of DCT fast and efficient features and PCA dimension reduction methods to reduce the computation advantage of time, greatly reducing recognition time. Firstly, block DCT face image preprocessing, the low

8、-frequency DCT preprocessed information as a feature. Finally, by using the KL transform taken eigenvalues??, eigenvec</p><p>  Keywords: discrete cosine transforms (DCT); principal component analysis (PCA);

9、 KL transform; recognition; preprocess</p><p><b>  目 錄</b></p><p><b>  前 言1</b></p><p>  第1章 人臉識別相關(guān)理論2</p><p>  1.1 人臉識別研究的背景及意義2</p>

10、<p>  1.2 人臉識別的現(xiàn)狀及難點2</p><p>  1.2.1 人臉識別的現(xiàn)狀2</p><p>  1.2.2 人臉識別的難點及現(xiàn)況3</p><p>  1.2.3 人臉識別的應(yīng)用前景4</p><p>  1.2.4 現(xiàn)有人臉圖像集簡介5</p><p>  1.3

11、 人臉識別技術(shù)相關(guān)6</p><p>  1.3.1 人臉識別的技術(shù)特點6</p><p>  1.3.2人臉識別研究的技術(shù)過程7</p><p><b>  1.4 小結(jié)8</b></p><p>  第2章 離散余弦變換的基本理論研究9</p><p>  2.1 DCT的初

12、期發(fā)展9</p><p>  2.1.1 快速算法9</p><p>  2.1.2 塊效應(yīng)消除9</p><p>  2.2 第二代DCT編碼的進展10</p><p>  2.3 二維離散余弦變換原理11</p><p>  2.4 分塊DCT的實現(xiàn)過程11</p><p&

13、gt;  2.5 小結(jié)12</p><p>  第3章 K-L變換和PCA的基本理論研究13</p><p>  3.1 簡介13</p><p>  3.2 K-L變換和PCA分析13</p><p>  3.3 K-L變換原理14</p><p>  3.4 主成分分析法(PCA)16<

14、/p><p>  3.4.1 PCA原理16</p><p>  3.4.2 PCA的優(yōu)點18</p><p>  3.5 K-L變換和PCA的實現(xiàn)過程19</p><p>  3.6 小結(jié)19</p><p>  第4章 實驗與仿真20</p><p>  4.1 分塊DCT

15、實驗研究20</p><p>  4.1.1 子塊大小的選擇20</p><p>  4.1.2 子塊DCT變換系數(shù)的選擇21</p><p>  4.2 PCA實驗研究21</p><p>  4.2.1 根據(jù)指定值選擇22</p><p>  4.2.2 根據(jù)能量比選擇22</p>

16、<p>  4.2.3 維數(shù)的選定23</p><p>  4.3 人臉庫實驗及仿真23</p><p>  4.3.1 算法實現(xiàn)過程23</p><p>  4.3.2 ORL人臉庫實驗仿真24</p><p>  4.3.3 YALE人臉庫實驗仿真25</p><p>  4.3.

17、4 實驗結(jié)果分析26</p><p>  4.4 小結(jié)26</p><p>  第5章 總結(jié)27</p><p><b>  致謝28</b></p><p><b>  參考文獻(xiàn)29</b></p><p><b>  附錄30</b>

18、;</p><p>  4.1 原始圖像識別程序30</p><p>  4.2 原始圖像分塊DCT處理識別程序31</p><p>  4.3 圖像分塊DCT及PCA處理識別程序33</p><p><b>  前 言</b></p><p>  隨著IT技術(shù)及網(wǎng)絡(luò)技術(shù)的高速發(fā)展,信

19、息化、數(shù)字化日益融入人們的日常生活,個人信息的安全和保障越來越受到人們的重視,身份識別與認(rèn)證技術(shù)也隨之得到了飛速發(fā)展。作為圖像分析和處理技術(shù)在生物特征識別領(lǐng)域最成功的應(yīng)用之一,人臉識別具有隱蔽性高、方便快捷、數(shù)據(jù)易采集等諸多優(yōu)點,成為近年來的研究熱點之一,受到了眾多研究者的關(guān)注。</p><p>  人臉識別技術(shù)是一種生物特征識別技術(shù)[1],依據(jù)各人的面部特征來自動進行身份鑒別。由于人臉識別技術(shù)在所有生物特征識別

20、技術(shù)領(lǐng)域中具有眾多的優(yōu)勢,尤其是直觀、非侵犯方面非常突出,決定了其廣泛的應(yīng)用前景:可以用來對敏感人物,諸如罪犯、恐怖分子等,進行識別,協(xié)助公安部門布控、海關(guān)身份驗證[2]。但人臉識別尚存在很多問題,其中一個關(guān)鍵性問題就是特征選擇,其基本任務(wù)是從許多特征中找出最有效的特征。但因為人臉圖像數(shù)據(jù)量十分龐大,直接用于識別效率不高,所以必須要對原始圖像進行有效降維。離散余弦變換(Discrete Cosine Transform,DCT)正是基于

21、壓縮的較為有效的降維方法。DCT既能有效地降低特征維數(shù),又可將光照、表情和姿態(tài)不敏感等類別信息進行保留。但是,由于DCT基于統(tǒng)計表征,所以其所包含的類別信息并不豐富,因此對DCT系數(shù)的特征進行深入分析將會有助于提取識別性能更好的人臉特征。</p><p>  本文主要研究如何將分塊DCT變換與PCA方法結(jié)合形成有效的人臉識別算法,直接研究關(guān)于使用分塊離散余弦變換(DCT)和主成分分析法(PCA)進行人臉識別的方法

22、,并著重分析了多種DCT變換參數(shù)以及PCA維數(shù)的選取方式和實際效果。利用分塊DCT對人臉圖像進行預(yù)處理,將DCT預(yù)處理后的低頻信息作為特征,然后通過使用K-L變換取特征值、特征向量以及PCA降維的方式來形成特征臉,最終采用歐氏距離最近鄰法完成模板圖像與測試圖像的匹配。實驗表明采用分塊DCT變換和PCA算法來選取特征臉進行識別的方法是一種可行的快速算法。</p><p>  第1章 人臉識別相關(guān)理論</p&

23、gt;<p>  1.1 人臉識別研究的背景及意義</p><p>  隨著計算機和網(wǎng)絡(luò)技術(shù)的快速發(fā)展,信息化、數(shù)字化日益融入人們的日常生活,身份識別與認(rèn)證作為保證信息安全的必要前提越來越受到人們的重視。在國家安全、公安系統(tǒng)、司法系統(tǒng)、電子商務(wù)、電子政務(wù)、安保監(jiān)控等領(lǐng)域都需要準(zhǔn)確的身份識別與認(rèn)證。</p><p>  身份是人們?nèi)粘I畹闹匾M成部分,對身份進行識別與認(rèn)證是

24、人們基本社會生活之一。目前廣泛采用的身份識別方法主要有標(biāo)識號碼、磁卡、IC卡等技術(shù),這些傳統(tǒng)方法雖然在日常生活中應(yīng)用廣泛,但從本質(zhì)上來講這些驗證手段都依賴于后天賦予的信息,存在著易丟失、易偽造、安全性差等不足。隨著科學(xué)技術(shù)的不斷發(fā)展和信息安全要求的不斷提高,對個人進行方便、快捷、可靠性高的身份認(rèn)證變得日益迫切。其中利用人臉特征進行身份驗證又是最自然直接的手段,相比其它人體生物特征它具有直接、友好、方便的特點,易于為用戶所接受[3]。&l

25、t;/p><p>  人臉識別是指對于輸入的圖像或視頻,首先進行人臉檢測,找出圖像中存在的人臉,然后進一步識別每個人臉的位置、大小等信息,并依據(jù)這些信息,提取每個人臉中所蘊含的身份特征,并將其與已知入臉庫中的人臉進行對比,從而識別每個人臉的身份。人臉識別技術(shù)除了擁有巨大的市場應(yīng)用前景外,其在理論研究上也具有重要價值。作為典型的圖像模式分析、理解與分類計算問題,人臉識別技術(shù)為模式識別、計算機視覺、神經(jīng)計算、人工智能、圖

26、像處理與分析、人機交互、計算機圖形學(xué)、人類生理學(xué)和心理學(xué)等諸多學(xué)科提供了良好的實驗平臺,有利于這些學(xué)科融合,解釋新現(xiàn)象、嘗試新方法、驗證新理論。相信隨著人臉識別技術(shù)的進一步發(fā)展,將極大地促進這些學(xué)科的發(fā)展。</p><p>  1.2 人臉識別的現(xiàn)狀及難點</p><p>  1.2.1 人臉識別的現(xiàn)狀</p><p>  人臉識別因其廣闊的發(fā)展前景和重要的理論

27、研究價值,受到國內(nèi)外眾多研究機構(gòu)的廣泛重視。國外一些著名的研究機構(gòu)如美國麻省理工學(xué)院人工智能和媒體實驗室(MIT)、卡內(nèi)基美隆大學(xué)機器人研究所(CUM)均走在人臉識別領(lǐng)域研究的前列,引導(dǎo)著國際人臉識別領(lǐng)域的技術(shù)潮流。中國雖然對人臉識別領(lǐng)域的研究起步較晚,但也取得了不錯的成果。目前全國各大高校及一些著名科研院所均開展了對人臉識別的研究。</p><p>  在國內(nèi)人臉識別研究始于20世紀(jì)80年代,雖然起步相比國外晚

28、,但發(fā)展很快。同時,國家對人臉識別方面的研究高度重視,863計劃、國家科技支撐計劃、自然科學(xué)基金等都撥出??钯Y助人臉識別技術(shù)的相關(guān)研究。國家“十一五”科技發(fā)展規(guī)劃也將人臉識別技術(shù)的研究與發(fā)展列入其中,明確的指出:“要在生物特征識別技術(shù)領(lǐng)域縮小與世界先進水平的差距,開展生物特征識別技術(shù)研究,開發(fā)高安全性、低誤報率的出入識別新產(chǎn)品。在這種環(huán)境下,國內(nèi)一些科研院所和院校在人臉識別技術(shù)方面積極研究,取得重大發(fā)展。</p><

29、p>  2002年,由中科院計算機所等單位承擔(dān)的國家863計劃之一的面像檢測與識別技術(shù)順利通過專家鑒定,該系統(tǒng)只需1/10秒或1/20秒就可自動檢測到人臉。中科院自動化所的中科奧森近紅外入臉識別系統(tǒng)設(shè)計的基于近紅外圖像的人臉識別核心技術(shù),在不同光線條件下,能夠拍攝到不受光照變化影響的近紅外人臉圖像,解決了困擾人臉識別領(lǐng)域的光照影響問題,識別率達(dá)到99.2%。在由清華大學(xué)蘇光大教授主持的二代身份證識別系統(tǒng),通過二代身份證內(nèi)只有1-2

30、K大小的圖像作為入臉的數(shù)據(jù)庫,獲得了較好的識別率和識別速度,并且在距離攝像頭2米左右便可檢測出人臉并進行識別,為我國人臉識別技術(shù)的研究奠定了堅實的基礎(chǔ)。</p><p>  在人臉識別技術(shù)商業(yè)化應(yīng)用方面,國外的一些較為成熟的商用軟件有NevenVision公司的PersonSpotter、eTure公司的TrueFace、VisionSphere公司的Unmask和C.VIS公司的FaceSnap等。雖然國內(nèi)企業(yè)

31、進入人臉識別領(lǐng)域的時間較晚,但也發(fā)展迅速,目前已有諸多產(chǎn)品投入市場,在公共安全領(lǐng)域發(fā)揮著重要作用,其中具有代表性的產(chǎn)品有中科院計算所的GodEye、奧森科技的奧森人臉識別系統(tǒng)等。</p><p>  1.2.2 人臉識別的難點及現(xiàn)況</p><p>  權(quán)威評測機構(gòu)在2006年發(fā)布的FRVT2006(Face Recognition Vendor Test 2006)測試結(jié)果表明,理想條

32、件下的人臉識別技術(shù)已相當(dāng)成熟,千人左右的系統(tǒng)識別率己達(dá)到90%;但當(dāng)外界條件不可控(如光照發(fā)生變化)時,系統(tǒng)性能下降極快,因此人臉識別技術(shù)仍有許多問題亟待解決,尤其針對非理想條件下(如光照、姿態(tài)、表情變化、用戶不配合等)的識別技術(shù)。</p><p>  人臉識別的主要難點,包括光照、姿態(tài)、表情變化問題,遮擋、采集設(shè)備、樣本缺乏所引起的問題,識別算法的泛化能力及自適應(yīng)學(xué)習(xí)問題等,并指出這些問題往往是組合出現(xiàn)的。因為

33、人臉識別技術(shù)主要依賴從樣本圖像中提取的有效人臉特征,即那些對不同個體差異較大但對相同個體保持穩(wěn)定的特征量度,但由于人臉本身表示極其復(fù)雜且人臉圖像維數(shù)一般較高,故如何有效地進行特征選擇與提取是解決人臉識別問題的關(guān)鍵之一。</p><p>  目前一種常見的方法是利用小波變換(Wavelet Transform)的時頻局域特性將光照、表情等變化區(qū)分在不同頻段,從中提取出魯棒性較強的低頻系數(shù)作為人臉特征進行識別。小波變

34、換成功應(yīng)用到人臉識別領(lǐng)域的重要原因是由于其能有效地表達(dá)圖像中的點奇異性,而在人臉圖像中,更多的是面部輪廓及五官的曲線信息,人臉圖像的曲線奇異性影響了很多小波系數(shù),導(dǎo)致其不能成為曲線的稀疏表達(dá),影響了人臉識別的精度。由Candes和Donoho等人提出的曲波變換(Curvelet Transform)在尺度和位移參量的基礎(chǔ)上增加了一個方向參量,使之具有更好的方向辨識能力和曲線稀疏表達(dá)能力,為解決人臉特征選擇與提取提供了新思路。</p

35、><p>  1.2.3 人臉識別的應(yīng)用前景</p><p>  生物識別技術(shù)已廣泛用于政府、軍隊、銀行、社會福利保障、電子商務(wù)、安全防務(wù)等領(lǐng)域。同時當(dāng)前社會上社會治安案件頻繁出現(xiàn)并不斷發(fā)生,鑒于此種原因,防盜門開始走進千家萬戶,給家庭帶來安寧;然而,隨著社會的發(fā)展,技術(shù)的進步,生活節(jié)奏的加速,消費水平的提高,人們對于家居的期望也越來越高,對便捷的要求也越來越迫切,基于傳統(tǒng)的純粹機械設(shè)計的防

36、盜門,除了堅固耐用外,很難快速滿足這些新興的需求:便捷,開門記錄等功能。人臉識別技術(shù)已經(jīng)得到廣泛的認(rèn)同,但其應(yīng)用門檻仍然很高:技術(shù)門檻高(開發(fā)周期長),經(jīng)濟門檻高(價格高)。</p><p>  人臉識別產(chǎn)品已廣泛應(yīng)用于金融、司法、軍隊、公安、邊檢、政府、航天、電力、工廠、教育、醫(yī)療及眾多企事業(yè)單位等領(lǐng)域。隨著技術(shù)的進一步成熟和社會認(rèn)同度的提高,人臉識別技術(shù)將應(yīng)用在更多的領(lǐng)域。</p><p&

37、gt;  1、企業(yè)、住宅安全和管理。如人臉識別門禁考勤系統(tǒng),人臉識別防盜門等。</p><p>  2、電子護照及身份證。中國的電子護照計劃公安部一所正在加緊規(guī)劃和實施。</p><p>  3、公安、司法和刑偵。如利用人臉識別系統(tǒng)和網(wǎng)絡(luò),在全國范圍內(nèi)搜捕逃犯。</p><p><b>  4、自助服務(wù)。</b></p><

38、p>  5、信息安全。如計算機登錄、電子政務(wù)和電子商務(wù)。在電子商務(wù)中交易全部在網(wǎng)上完成,電子政務(wù)中的很多審批流程也都搬到了網(wǎng)上。而當(dāng)前,交易或者審批的授權(quán)都是靠密碼來實現(xiàn),如果密碼被盜,就無法保證安全。但是使用生物特征,就可以做到當(dāng)事人在網(wǎng)上的數(shù)字身份和真實身份統(tǒng)一,從而大大增加電子商務(wù)和電子政務(wù)系統(tǒng)的可靠性。</p><p>  1.2.4 現(xiàn)有人臉圖像集簡介</p><p> 

39、 由于人臉檢測問題最初來自人臉識別問題,長期以來,研究人員雖然提出了大量的人臉檢測方法,但在說明各自檢測方法的性能時,往往使用不同的人臉測試集,因此,這就使得各種人臉檢測方法的優(yōu)劣評價缺乏一個統(tǒng)一的平臺。針對此種情況就出現(xiàn)了一些標(biāo)準(zhǔn)人臉圖像集,但是對于怎樣才是一個“成功的人臉測試方法”,仍舊缺乏一個統(tǒng)一標(biāo)準(zhǔn);另一方面,對于不同的訓(xùn)練集,尤其是一些基于統(tǒng)計信息的人臉檢測方法,對測試結(jié)果的影響也是巨大的。</p><p&

40、gt;  下面簡單介紹一下國內(nèi)外已有的部分人臉圖像集[4]:</p><p>  (1)MIT圖像集(美國,麻省理工學(xué)院):包括16人,每個人有不同光照、不同尺寸、不同角度的27張照片。</p><p>  (2)FERET圖像集(美國軍方):此圖像集包含大量的人臉圖像,并且每幅圖中均只有一個人臉。該集中,同一個人的照片有不同表情,光照,姿態(tài)和年齡的變化。</p><p

41、>  (3)UMIST圖像集(英國,曼切斯特大學(xué)):20個人共564幅圖像,每個人具有不同角度、不同姿態(tài)的多幅圖像。</p><p>  (4)Yale圖像集(美國,耶魯大學(xué)):15人,每人11張照片,共165張。主要包括光照條件的變化,表情的變化。</p><p>  (5)ORL圖像集(英國,劍橋大學(xué)):40人,每人10張照片,包括表情變化,微小姿態(tài)變化,20%以內(nèi)的尺度變化。&

42、lt;/p><p>  (6)CMU PIE圖像集(美國,卡耐基梅隆大學(xué)):所謂PIE就是姿態(tài)(pose),光照(I1lumination)和表情(Expression)的縮寫。CMU PIE人臉庫建立于2000年11月,它包括來自68個人的40000張照片,其中包括了每個人的13種姿態(tài)條件,43種光照條件和4種表情下的照片,現(xiàn)有的多姿態(tài)人臉識別的文獻(xiàn)基本上都是在CMU PIE人臉庫上測試的。</p>

43、<p>  最近幾年來,隨著人臉檢測研究的不斷深入,研究者們編輯了多個人臉檢測測試圖像集。Sung和Poggio提出了兩個人臉檢測測試集,第一個集中包含了71個人的301個正視或近似正視人臉圖像,這些圖像各自的光照條件均不相同。第二個集中包括23幅圖像共149個人臉,每幅具有復(fù)雜背景。而用的最廣泛的測試集是由Rowley等人提出來的CMU測試圖像集,包括130幅圖像共507個人臉,除此之外還有C-MU側(cè)面人臉圖像集,共280幅

44、圖像。雖然它們具有一定規(guī)模和涵蓋面,但仍不能滿足評價的要求,因此還有待于建立規(guī)模更大、覆蓋面更廣的測試集和針對不同具體應(yīng)用背景的測試集。</p><p>  1.3 人臉識別技術(shù)相關(guān)</p><p>  1.3.1 人臉識別的技術(shù)特點</p><p>  傳統(tǒng)的人臉識別技術(shù)主要是基于可見光圖像的人臉識別,這也是人們熟悉的識別方式,已有30多年的研發(fā)歷史。但這種方

45、式有著難以克服的缺陷,尤其在環(huán)境光照發(fā)生變化時,識別效果會急劇下降,無法滿足實際系統(tǒng)的需要。解決光照問題的方案有三維圖像人臉識別,和熱成像人臉識別。但這兩種技術(shù)還遠(yuǎn)不成熟,識別效果不盡人意。</p><p>  迅速發(fā)展起來的一種解決方案是基于主動近紅外圖像的多光源人臉識別技術(shù)。它可以克服光線變化的影響,已經(jīng)取得了卓越的識別性能,在精度、穩(wěn)定性和速度方面的整體系統(tǒng)性能超過三維圖像人臉識別。這項技術(shù)在近兩三年發(fā)展迅

46、速,使人臉識別技術(shù)逐漸走向?qū)嵱没?lt;/p><p>  人臉與人體的其它生物特征(指紋、虹膜等)一樣與生俱來,它的唯一性和不易被復(fù)制的良好特性為身份鑒別提供了必要的前提,與其它類型的生物識別比較人臉識別具有如下特點:</p><p>  非強制性:用戶不需要專門配合人臉采集設(shè)備,幾乎可以在無意識的狀態(tài)下就可獲取人臉圖像,這樣的取樣方式?jīng)]有“強制性”;</p><p>

47、;  非接觸性:用戶不需要和設(shè)備直接接觸就能獲取人臉圖像;</p><p>  并發(fā)性:在實際應(yīng)用場景下可以進行多個人臉的分揀、判斷及識別;除此之外,還符合視覺特性:“以貌識人”的特性,以及操作簡單、結(jié)果直觀、隱蔽性好等特點。</p><p>  1.3.2人臉識別研究的技術(shù)過程</p><p>  人臉識別系統(tǒng)主要包括四個組成部分,分別為:人臉圖像采集及檢測、人臉

48、圖像預(yù)處理、人臉圖像特征提取以及匹配與識別。</p><p> ?。?)人臉圖像采集及檢測</p><p>  人臉圖像采集:不同的人臉圖像都能通過攝像鏡頭采集下來,比如靜態(tài)圖像、動態(tài)圖像、不同的位置、不同表情等方面都可以得到很好的采集。當(dāng)用戶在采集設(shè)備的拍攝范圍內(nèi)時,采集設(shè)備會自動搜索并拍攝用戶的人臉圖像。</p><p>  人臉檢測:人臉檢測在實際中主要用于人

49、臉識別的預(yù)處理,即在圖像中準(zhǔn)確標(biāo)定出人臉的位置和大小。人臉圖像中包含的模式特征十分豐富,如直方圖特征、顏色特征、模板特征、結(jié)構(gòu)特征及Haar特征等。人臉檢測就是把這其中有用的信息挑出來,并利用這些特征實現(xiàn)人臉檢測。</p><p>  主流的人臉檢測方法基于以上特征采用Adaboost學(xué)習(xí)算法,Adaboost算法是一種用來分類的方法,它把一些比較弱的分類方法合在一起,組合出新的很強的分類方法。</p>

50、;<p>  人臉檢測過程中使用Adaboost算法挑選出一些最能代表人臉的矩形特征(弱分類器),按照加權(quán)投票的方式將弱分類器構(gòu)造為一個強分類器,再將訓(xùn)練得到的若干強分類器串聯(lián)組成一個級聯(lián)結(jié)構(gòu)的層疊分類器,有效地提高分類器的檢測速度。</p><p> ?。?)人臉圖像預(yù)處理</p><p>  人臉圖像預(yù)處理:對于人臉的圖像預(yù)處理是基于人臉檢測結(jié)果,對圖像進行處理并最終服務(wù)

51、于特征提取的過程。系統(tǒng)獲取的原始圖像由于受到各種條件的限制和隨機干擾,往往不能直接使用,必須在圖像處理的早期階段對它進行灰度校正、噪聲過濾等圖像預(yù)處理。對于人臉圖像而言,其預(yù)處理過程主要包括人臉圖像的光線補償、灰度變換、直方圖均衡化、歸一化、幾何校正、濾波以及銳化等。</p><p>  (3)人臉圖像特征提取</p><p>  人臉圖像特征提?。喝四樧R別系統(tǒng)可使用的特征通常分為視覺特征

52、、像素統(tǒng)計特征、人臉圖像變換系數(shù)特征、人臉圖像代數(shù)特征等。人臉特征提取就是針對人臉的某些特征進行的。人臉特征提取,也稱人臉表征,它是對人臉進行特征建模的過程。人臉特征提取的方法歸納起來分為兩大類:一種是基于知識的表征方法;另外一種是基于代數(shù)特征或統(tǒng)計學(xué)習(xí)的表征方法。</p><p>  基于知識的表征方法主要是根據(jù)人臉器官的形狀描述以及他們之間的距離特性來獲得有助于人臉分類的特征數(shù)據(jù),其特征分量通常包括特征點間的

53、歐氏距離、曲率和角度等。人臉由眼睛、鼻子、嘴、下巴等局部構(gòu)成,對這些局部和它們之間結(jié)構(gòu)關(guān)系的幾何描述,可作為識別人臉的重要特征,這些特征被稱為幾何特征?;谥R的人臉表征主要包括基于幾何特征的方法和模板匹配法。</p><p> ?。?)人臉圖像匹配與識別</p><p>  人臉圖像匹配與識別:提取的人臉圖像的特征數(shù)據(jù)與數(shù)據(jù)庫中存儲的特征模板進行搜索匹配,通過設(shè)定一個閾值,當(dāng)相似度超過這

54、一閾值,則把匹配得到的結(jié)果輸出。人臉識別就是將待識別的人臉特征與已得到的人臉特征模板進行比較,根據(jù)相似程度對人臉的身份信息進行判斷。這一過程又分為兩類:一類是確認(rèn),是一對一進行圖像比較的過程,另一類是辨認(rèn),是一對多進行圖像匹配對比的過程。</p><p><b>  1.4 小結(jié)</b></p><p>  本章主要探討了人臉識別技術(shù)的相關(guān)理論,闡述了人臉識別技術(shù)的

55、研究意義及現(xiàn)狀,分析了人臉識別的一般技術(shù)過程,對人臉識別性能評價標(biāo)準(zhǔn)做了簡要描述,令讀者對人臉識別技術(shù)具有了一定初步了解,同時為后文算法的引入作了鋪墊。</p><p>  第2章 離散余弦變換的基本理論研究</p><p>  2.1 DCT的初期發(fā)展</p><p>  2.1.1 快速算法</p><p>  第一代DCT及其應(yīng)用

56、主要表現(xiàn)在快速算法進步和減小塊虛像上是面向波形或過程的[5],如一個8×8圖像子塊直接DCT需要8192次乘和3584次加操作,在MPEG-1解碼時,計算IDCT的時間占總時間的38.7%。利用2D或3D DCT/IDCT的正交可分解性,20世紀(jì)90年代末DCT快速算法已近極限,1D DCT的快速算法譬如Loeffler等人提出的,其乘法器和加法器的數(shù)目減少到理論下線。目前集成電路的發(fā)展,一次乘與一次加的耗時幾乎相等,運用DC

57、T的正交性、對稱性,包括一些碟形算法等,進行一個8×8圖像塊的DCT需要時間降為原來的(1/5~1/3) [6]。DCT以它的“提取特征成分的能力和運算速度之間的最佳平衡”顯示出它的應(yīng)用優(yōu)越性。在傳統(tǒng)的2D DCT圖像壓縮編碼中,依據(jù)信號的自然屬性和視覺特性(HVS)將DCT后的系數(shù)按Zigzag掃描,取前若干較大的低頻系數(shù)作為特征分量,用零代替后面高頻系數(shù)的截短DCT編碼,也能重建滿意的圖像。正是DCT的簡捷高效性,才能在眾

58、多變換編碼中脫穎而出 實際中傳輸甚低碼率如在H.263中,利用圖像(塊)間平緩區(qū)域占多數(shù),通過快速運動補償(減小時間冗余</p><p><b>  (2.1)</b></p><p>  其中Q為量化參數(shù),即判斷該塊為全零DCT系數(shù),因而可以避免計算該DCT塊的所有頻率系數(shù) 提高實時應(yīng)用能力。</p><p>  2.1.

59、2 塊效應(yīng)消除</p><p>  傳統(tǒng)的塊DCT、量化和編碼的方法需改進,是因為它易產(chǎn)生塊虛像 這是由于對低頻系數(shù)的量化導(dǎo)致相鄰塊之間的強度不連續(xù),尤其是在低比特率時。消除塊虛像采用后處理的技術(shù)較多20世紀(jì)90年代后期出現(xiàn)了速度更快的直接在DCT域中進行塊虛像(盲)檢測和消除技術(shù),特點是當(dāng)一個DCT系數(shù)由Laplacian概率函數(shù)模型化時,減小塊虛像可通過對直流(DC)和交流(AC)系數(shù)進行修正或重

60、新計算來實現(xiàn),其中DC系數(shù)尤為重要。實驗證明,量化后的各塊之間斜率均方誤差(MSDS)較量化前大,因此綜合使水平、垂直和對角方向上的MSDS為最小,可有效地減小或去除塊虛像,也可對每個DCT塊所形成的大小為原圖像1/64的DC圖像中,采用Sobel梯度算子把原圖像所有邊緣塊劃分成3 類,采用不同的處理方法。這樣在盡可能多保留原圖像完整性的同時減小了塊虛像[7]。且通過Sobel算子或塊方差的大小檢測圖像塊是否為邊緣和紋理塊,進

61、而采用DPCM或奇異值分解(SVD)編碼,對于DPCM獲得的冗余用Rice編碼較為簡單,而SVD以稍高的編解碼復(fù)雜性換取恢復(fù)的圖像質(zhì)量高。如在“DCT系數(shù)域中進行塊虛像檢測以及結(jié)合后處理技術(shù)”以徹底消除</p><p>  2.2 第二代DCT編碼的進展</p><p>  第二代DCT編碼體現(xiàn)出以下幾個特征:從內(nèi)容上強調(diào)人眼視覺特性(HVS)的充分利用,力圖用物體的紋理和形狀結(jié)構(gòu)或輪廓

62、等特征信息來描述對象;其次DCT系數(shù)應(yīng)不僅為壓縮與恢復(fù)原圖像所專用,還可實現(xiàn)其他功能即DCT本身發(fā)生實質(zhì)性躍變。1995年基于分塊DCT數(shù)字水印技術(shù)以及形狀自適應(yīng)SA-DCT的發(fā)表標(biāo)志著DC進入了新時代,此時MPEG-2也剛剛成為國際編碼標(biāo)準(zhǔn),而兼容MPEG-1標(biāo)準(zhǔn)的MPEG-2就是以DCT結(jié)合運動補償為圖像壓縮編碼的,是目前圖像編碼的主要應(yīng)用標(biāo)準(zhǔn)之一。</p><p>  進入第二代DCT以后,面對SPIHT成

63、功應(yīng)用,針對區(qū)域的DCT及其運動補償、DCT與其他變換編碼的結(jié)合,塊虛像消除以及利用DCT域進行信息隱藏等等的研究相當(dāng)活躍,一些更高的壓縮標(biāo)準(zhǔn) MPEG-4、H.263(+/++)等相繼推出。近年來,為進一步減少圖像失真同時便于計算機處理,出現(xiàn)整型小波變換、整型DCT 等。至于整型DCT首先通過計算DCT浮點變換的整數(shù)可逆矩陣分解,從而得到可以整數(shù)實現(xiàn)的可逆矩陣變換,然后再利用得到的分解矩陣依次對圖像樣本進行變換,最

64、后將變換得到的系數(shù)用多種高效編碼方法進行編碼。1999年后發(fā)展起來的二進制DCT利用提升結(jié)構(gòu)消去了乘法,只用移位和加法來實現(xiàn),既能實現(xiàn)靈活的正交變換又能達(dá)到無損壓縮,采用僅有移位和加法操作的提升步長的雙正交DCT其編碼速度與DCT相比有很大提高,雙正交DCT已經(jīng)實踐于H.263視頻壓縮編碼中,最新的H.264標(biāo)準(zhǔn)使用的基于 4×4 數(shù)據(jù)塊的變換,就是類似于DCT 的整數(shù)變換[8],因此不存在逆變換

65、因取舍而產(chǎn)生的誤差。基于(近)無損的區(qū)域 DCT 編碼將是最有潛力的編碼形式,是第三代DCT編碼的基本要求。</p><p>  2.3 二維離散余弦變換原理</p><p>  對于一幅M×N的灰度圖像,X(x,y)表示灰度圖像中坐標(biāo)(x,y)處的灰度值,其離散余弦變換定義[9]為</p><p><b>  (2.2)&

66、lt;/b></p><p>  其中:u=0,1,2,···,M-1;v=0,1,2,···,N-1,被稱為頻域變換因子;Y(u,v)為變換結(jié)果,也稱為DCT系數(shù)。</p><p>  分析離散余弦變換的定義可知:當(dāng)頻域變換因子較大時,DCT系數(shù)Y(u,v)的值較小。DCT系數(shù)較大的數(shù)值主要分布在系數(shù)矩陣的左上角區(qū)域,而能

67、量信息主要集中在左上角區(qū)域。即左上角區(qū)域的少量系數(shù)是能量的集中體現(xiàn)。本文利用了這一特點,提取DCT之后左上角區(qū)域的少量系數(shù)作為特征進行識別。</p><p>  離散余弦變換的逆變換定義[9]為:</p><p><b>  (2.3)</b></p><p>  其中:x=0,1,2,···,M-1:y=0,1,

68、2,···,N-1。</p><p>  2.4 分塊DCT的實現(xiàn)過程</p><p>  本過程以O(shè)RL人臉庫中的部分圖像為例。首先,輸入ORL人臉庫中的一幅人臉圖像,首先將此112×92的人臉圖像縮放為112×96的圖像,利用排列矩陣的方式分割為一系列共168個互不覆蓋的8×8子塊。然后,對每個8×8的子塊做DCT

69、,得到64個變換系數(shù),利用亮度量化矩陣量化所得到的變換系數(shù)矩陣。最后提取每個量化系數(shù)矩陣的第一個系數(shù)(DCT之后的直流系數(shù)),組成一個168×1的向量作為識別特征矩陣。圖1為利用分塊DCT及其逆變換實現(xiàn)圖像重建的過程。圖1(a)為ORL人臉庫中的第一個人的第一幅原始人臉圖像。圖1(b)為將圖1(a)經(jīng)過分塊DCT和量化之后,直接進行DCT重建之后的圖像。比較圖1(a)與圖1(b)可以看出兩幅圖像存在差異,但是差異細(xì)微。圖1(c

70、)為圖1(a)經(jīng)過分塊DCT和量化之后,利用保留的低頻信息重建后的人臉圖像。由圖可以看出,低頻信息體現(xiàn)了人臉圖像的輪廓信息,可以作為一種識別特征。</p><p> ?。╝)原始圖像 (b)重構(gòu)圖片 (c)低頻信息圖片</p><p>  圖2.1 分塊DCT實現(xiàn)</p><p><b>  2.5 小結(jié)</b>

71、;</p><p>  本章主要探討了離散余弦變換的相關(guān)理論,闡述了離散余弦變換的發(fā)展進程,介紹了二維離散余弦變換的基本原理,簡要描述了分塊離散余弦變換的實現(xiàn)過程,令讀者對離散余弦變換有了一定初步了解,同時為實驗部分分塊DCT部分的過程進行了簡單介紹。</p><p>  第3章 K-L變換和PCA的基本理論研究</p><p><b>  3.1 簡介

72、</b></p><p>  主成分分析(Principal Components Analysis。即PCA),是圖像壓縮中的一種最優(yōu)正交變換。它從圖像整體代數(shù)特征出發(fā),基于圖像的總體信息進行分類識別。Simvich和Kirby首先將K-L變換用于人臉圖像的最優(yōu)表示。Turk和Pentland進一步提出了“特征臉”(Eigcnface)這個概念。下文首先介紹了K-L變換及PCA算法的原理和實現(xiàn)過程。

73、將PCA方法用于人臉識別,其實是假設(shè)所有的人臉都處于一個低維線形空間,而且不同的人臉在這個空間中具有可分性。其具體做法是由高維圖像空間經(jīng)KL變換后得到一組新的正交基,對這些正交基作一定的取舍,保留其中的一部分生成低維的人臉空間。通過K-L變換得到高維人臉空間的投影矩陣,人臉圖像都可以由這些矩陣的線性組合來表示,正是因為這些矩陣呈現(xiàn)人臉的形狀,所以將這種人臉識別稱為特征臉(Eigenface)方法[10]。</p><

74、p>  3.2 K-L變換和PCA分析</p><p>  對給定的信號x(n),如果它的各個分量之間完全不相關(guān),那么表示該數(shù)據(jù)中沒有冗余;若x(n)中有相關(guān)成分,通過去除其相關(guān)性則可達(dá)到數(shù)據(jù)壓縮的目的。主成分分析方法(PCA)基本思想是提取出空間原始數(shù)據(jù)中的主要特征(主元),減少數(shù)據(jù)冗余,使得數(shù)據(jù)在一個低維的特征空間被處理,同時保持原始數(shù)據(jù)的絕大部分的有用信息,從而解決數(shù)據(jù)空間維數(shù)過高的瓶頸問題。<

75、;/p><p>  一個寬平穩(wěn)的實隨機向量,其協(xié)方差矩陣定義為:</p><p><b>  (3.1)</b></p><p>  式中E{·}代表求均值運算,μ=E{x}是信號x的均值向量,的元素</p><p><b>  (3.2)</b></p><p>  

76、即協(xié)方差陣是實對稱的。顯然,矩陣體現(xiàn)了信號向量x的各分量之間的相關(guān)性。若x的各分量互不相關(guān),那么中除對角線以外的元素皆為零。</p><p>  KL變換的思路是尋求正交矩陣A,使得A對x的變換y的協(xié)方差陣為對角矩陣,其步驟如下:</p><p>  先由的N階多項式,求矩陣的特征值,以及N個特征向量。然后將歸一化,即令,i=0,1,2…,N-1。由歸一化的向量成就構(gòu)成歸一化正交矩陣A,即

77、</p><p><b>  (3.3)</b></p><p>  最后由y-Ax實現(xiàn)對信號x的KL變換。顯然,矩陣A各向量之間相互獨立,體現(xiàn)了去相關(guān)性,在圖像編碼中去除了冗余。</p><p>  3.3 K-L變換原理</p><p>  假設(shè)X為n維的隨機變量,X可以用n個基向量的加權(quán)和來表示:</p&g

78、t;<p><b>  (3.4)</b></p><p>  式中:為加權(quán)系數(shù),為基向量,此式也可以用矩陣的形式表示:</p><p><b>  (3.5)</b></p><p>  其中,。我們?nèi)』蛄繛檎幌蛄?,由正交向量?gòu)成,所以是正交矩陣,即將公式(4.2.1.1)兩邊左乘,并考慮到為正交矩陣,

79、得即: 。</p><p>  我們希望向量的各個向量間互不相關(guān)。那么如何保證的各個分量互不相關(guān)呢?這取決于選取什么樣的正交向量集。設(shè)隨即向量的總體自相關(guān)矩陣為:</p><p><b>  (3.6)</b></p><p>  將公式(4.2.1.1)代入上式(4.2.1.3),得</p><p><b>

80、  (3.7)</b></p><p>  我們要求向量的各個分量間互不相關(guān),即滿足下列關(guān)系:</p><p><b>  (3.8)</b></p><p><b>  寫成矩陣的形式為:</b></p><p><b>  (3.9)</b></p>

81、<p><b>  則:</b></p><p><b>  (3.10)</b></p><p>  將上式兩邊右乘上,得:</p><p><b>  (3.11)</b></p><p>  因為是正交矩陣,所以得:</p><p>

82、<b>  (3.12)</b></p><p><b>  (3.13)</b></p><p>  可以看出,是x的自相關(guān)矩陣的特征值,是對應(yīng)特征向量。因為是實對稱矩陣,其不同本征值對應(yīng)的特征向量應(yīng)正交。</p><p>  綜上所述,K-L展開式的系數(shù)可用下列步驟求出:</p><p>  步

83、驟一:求隨即向量x的自相關(guān)矩陣,由于沒有類別信息的樣本集的均值向量,常常沒有意義,所以也可以把數(shù)據(jù)的協(xié)方差矩陣作為K-L坐標(biāo)系的產(chǎn)生矩陣,這里召是總體均值向量。</p><p>  步驟二:求出自相關(guān)矩陣或協(xié)方差矩陣的特征值和特征向量。其中i=1,2,…,n。同時本征向量組成的矩陣為,其中j=1,2,…,n。</p><p>  步驟三:展開式系數(shù)即為。</p><p&

84、gt;  K-L變換的實質(zhì)是建立了一個新的坐標(biāo)系,將一個物體主軸沿特征矢量對齊的旋轉(zhuǎn)變換,這個變換解除了原有數(shù)據(jù)向量的各個分量之間相關(guān)性,從而有可能去掉那些帶有較少信息的坐標(biāo)系以達(dá)到降低特征空間維數(shù)的目的。</p><p>  3.4 主成分分析法(PCA)</p><p>  3.4.1 PCA原理</p><p>  主成分分析法(PCA)在人臉識別領(lǐng)域成功

85、應(yīng)用的一個重要理論基礎(chǔ)是較好的解決了K.L變換后協(xié)方差矩陣的特征向量的求解問題。人臉識別是一個典型的高維小樣本問題,即人臉圖像向量的維數(shù)一般較高,比如,實驗用的ORL人臉庫的圖像大小為112×92的人臉圖像,其對應(yīng)的圖像向量特征空間高達(dá)10304維,在如此高維的圖像空間內(nèi),按照通常的算法,計算樣本的協(xié)方差矩陣的特征向量是異常耗時的。同時,在人臉識別問題中,由于客觀條件的限制,訓(xùn)練樣本的數(shù)目一般較小,通常,訓(xùn)練樣本的總數(shù)遠(yuǎn)遠(yuǎn)小于

86、人臉圖像向量的維數(shù)。針對高維小樣本的情況,求解特征向量所采取算法的基本思想是,將高維的問題轉(zhuǎn)化為低維的問題加以解決。</p><p>  主成分分析法(PCA)是模式識別判別分析中最常用的一種線性映射方法,該方法是根據(jù)樣本點在多維模式空間的位置分布,以樣本點在空間中變化最大方向,即方差最大的方向,作為判別矢量來實現(xiàn)數(shù)據(jù)的特征提取與數(shù)據(jù)壓縮。主成分分析法的原理如下:</p><p>  已知

87、n維空間的隨機向量用表示,利用公式將進行零均值處理,,則。如果對x用一組完備正交基,j=1,2,… ,n展開,可得</p><p><b>  (3.14)</b></p><p>  假設(shè)只用前k項進行重構(gòu),則</p><p><b>  (3.15)</b></p><p><b> 

88、 其均方誤差為:</b></p><p><b>  (3.16)</b></p><p><b>  因為</b></p><p><b>  (3.17)</b></p><p><b>  且</b></p><p&g

89、t;<b>  (3.18)</b></p><p><b>  所以 </b></p><p><b>  (3.19)</b></p><p>  其中是和的總體協(xié)方差矩陣。為了使重構(gòu)的均方誤差最小,并滿足正交條件的約束,采用拉格朗日乘子法,將函數(shù)</p><p><

90、b>  (3.20)</b></p><p><b>  對求導(dǎo),得</b></p><p><b>  (3.21)</b></p><p>  令k=1,此時為總體協(xié)方差矩陣C的本征向量,分別是它們對應(yīng)的特征值,這些特征向量經(jīng)過正交化處理所形成的空間稱為特征空間。將特征向量按照它們的特征值進行降序排列

91、,則得到結(jié)論:</p><p>  對于任一隨機變量x,如果采用總體協(xié)方差矩陣C的前k個最大非0特征值所對應(yīng)的特征向量作為坐標(biāo)軸展開,可在相等截斷長度下獲得所有正交展開中最小的截斷均方誤差</p><p><b>  (3.22)</b></p><p>  下面我們將主成分分析法用于人臉識別[11]。</p><p>

92、  假設(shè)訓(xùn)練人臉圖像的個數(shù)為M,將每一副圖像按列串相接的方式排成長度為N的向量,其均值向量(即平均臉)為</p><p><b>  (3.23)</b></p><p>  則每個圖像相對于均值圖像的差為。</p><p>  令矩陣,則散布矩陣∑可以表示為:</p><p><b>  (3.24)<

93、/b></p><p>  求出∑的特征值和特征矢量,由于看起來像一張人臉,因此常稱作特征臉向量,用特征向量構(gòu)成的圖像稱為特征臉圖像。由于∑是N×N大小的矩陣,而且N的值較大,一般遠(yuǎn)大于訓(xùn)練樣本的個數(shù)M,因此為了降低計算量,通常不直接求∑的特征向量,而是先計算大小為M×M的矩陣的特征向量,根據(jù)代數(shù)理論,有</p><p><b>  (3.25)<

94、/b></p><p>  對于這些相互正交的特征向量,根據(jù)其對應(yīng)的特征值的大小按照從大到小的順序進行排列,取前面J(J<M)個特征向量作為基向量(即主成分)建立本征臉空間S,用公式計算出所有訓(xùn)練圖像在特征臉空間s的投影系數(shù)</p><p><b>  (3.26)</b></p><p><b>  (3.27)<

95、/b></p><p>  這里“<·>”表示內(nèi)積。對于任一待識別的圖像,用同樣的方法求出其投影系數(shù),則滿足下列條件的第J個訓(xùn)練圖像即為識別結(jié)果。</p><p><b>  (3.28)</b></p><p>  3.4.2 PCA的優(yōu)點</p><p>  (1)最小均方誤差??梢宰C明

96、,PCA是在均方誤差最小意義下的最優(yōu)正交分解方法,因此用PCA進行信號壓縮能夠得到最大的信噪比。</p><p>  (2)降維。 由于基函數(shù)的個數(shù)往往遠(yuǎn)小于信號的維數(shù),因此PCA變換能夠大大降低數(shù)據(jù)的表示維數(shù)。這對模式識別中的特征提取非常有利。</p><p>  (3)消除冗余。 在基函數(shù)上的投影系數(shù)彼此之間是不相關(guān)的。</p><p>  (4)分解函數(shù)/合成

97、函數(shù)相同。分解函數(shù)(Analysis Function))作用于輸入信號,得到信號的編碼;合成函數(shù)(Synthesis Function)作用于信號的編碼,得到原始信號。如果圖像的分解和合成采用線性模型,則分解函數(shù)和合成函數(shù)是和輸入信號具有相同維數(shù)的向量,它們可以表示為:</p><p><b>  (3.29)</b></p><p>  主成分分析(PCA)法同樣

98、有其自身的缺點。PCA法將K-L變換后特征值從大到小進行排列,挑選相對大的特征值所對應(yīng)的特征向量,構(gòu)成一個K-L變換特征空間的子空間,來進行特征提取。又因為K-L特征空間中,較大特征值所對應(yīng)的特征向量體現(xiàn)原圖像的總體趨勢、低頻分量;較小特征值所對應(yīng)特征向量體現(xiàn)原圖像的細(xì)節(jié)變化、高頻分量,所以PCA法提取圖像總體特征,在人臉圖像上的表現(xiàn)就是人臉的外形輪廓和灰度變化,以此作為人臉特征,卻丟失了一些原有的重要信息。PCA法在人臉特征提取中可以

99、取得較好的效果,但它是基于K一變換的一種特定的選擇,無法根據(jù)圖像的不同而進行優(yōu)化選取,無法完全避免K-L變換的局限.</p><p>  3.5 K-L變換和PCA的實現(xiàn)過程</p><p>  本過程首先從訓(xùn)練圖片集中讀取多個人臉圖像到訓(xùn)練樣本集中,然后分別計算這些圖像的平均值,再求出圖像的協(xié)方差矩陣C=E[(x-μ)(x-μ)T],利用K-L變換理論計算特征值和特征向量:[V,D]

100、= eig(C),求得特征值和特征向量矩陣V和D,隨后令特征值從大到小排序,根據(jù)PCA方法,選擇總能量集中的前N個最大的特征值對應(yīng)的U,作為變換矩陣W,最后把訓(xùn)練樣本集做變換y=WTX,保留系數(shù)y。以上便是圖像訓(xùn)練圖片集進行K-L變換和PCA的實現(xiàn)過程。</p><p><b>  3.6 小結(jié)</b></p><p>  本章主要探討了K-L變換和PCA的相關(guān)理論

101、,對K-L變換和PCA進行了分析,分別介紹了K-L變換和PCA的基本理論,簡要描述了K-L變換和PCA方法在本實驗中的實現(xiàn)過程,令讀者對K-L變換和PCA有了一定初步了解,同時為實驗中的K-L變換和PCA部分的過程進行了簡單介紹。</p><p>  第4章 實驗與仿真</p><p>  我們使用MATLAB軟件實現(xiàn)了人臉識別并統(tǒng)計其識別率。本實驗采用分塊離散余弦變換和PCA(主成分分

102、析)方法,利用K-L變換和奇異值分解原理實現(xiàn)。并分別采用最近鄰法得出它們的成功率。</p><p>  本論文實驗采用的是是英國劍橋大學(xué)Oliveut研究所制作的ORL(Oliveut ReesarhcLbaoratoyr)人臉數(shù)據(jù)庫。該數(shù)據(jù)庫包括40個不同人,每人10幅圖像,共400幅。每幅原始圖像256個灰度級,分辨率112×92。ORL人臉圖像是在不同時間、不同視角、各種表情(閉眼/睜眼、微笑/吃

103、驚/生氣/憤怒/高興)和不同臉部細(xì)節(jié)(戴眼鏡/沒戴眼鏡、有胡子/沒胡子、不同發(fā)型)的條下拍攝的。</p><p>  4.1 分塊DCT實驗研究</p><p>  4.1.1 子塊大小的選擇</p><p>  首先分別取每個人臉的前1,2,3,4,5,6,7,8,9張圖片作為訓(xùn)練樣本集,剩余圖片作為測試集,這樣訓(xùn)練集分別為40、80、0120、160、200

104、、240、280、320、360,測試集分別為360、320、280、240、200、160、120、80、40。改變分塊DCT變換的子塊大小分為4×4,8×8,16×16,得出識別正確率結(jié)果如如表4-1所示。</p><p>  表4-1識別率隨子塊大小及測試個數(shù)的變化表</p><p>  從表4-1的實驗數(shù)據(jù)中可以發(fā)現(xiàn),隨著子塊大小的減小,識別率也相應(yīng)得

105、到提高。當(dāng)測試樣本數(shù)較少時,識別率的增高很明顯。實驗結(jié)果表明,隨著子塊大小的減小,識別率也會隨之得到提高,4×4與8×8同16×16子塊相比,識別率得到明顯提升,所以子塊大小將從4×4與8×8中選?。坏?×4與8×8相比識別率的提升并不明顯,與此同時,子塊大小為4×4時,識別時間與子塊大小為8×8時相比明顯增長。因此,我們最終選擇了子塊大小為8&#

106、215;8作為實驗中分塊DCT部分的子塊大小。</p><p>  4.1.2 子塊DCT變換系數(shù)的選擇</p><p>  首先依次提取圖像樣本集中每張人臉圖像,并對圖像利用排列矩陣的方式分別進行4×4、8×8、16×16分塊,對每個子塊做DCT后,得到N個變換系數(shù),然后直接取變換系數(shù)矩陣的第一個系數(shù)平方與系數(shù)矩陣所有系數(shù)的平方和相除,得到每個子塊DCT變

107、換后的變換系數(shù)中第一個系數(shù)所占能量比,分別與0.95、0.9、0.85、0.8做比較,大于時的個數(shù)與總個數(shù)相除,求出能量比大于95%、90%、85%、80%的子塊所占比例,得出結(jié)果如如表4-2所示。</p><p>  表4-2子塊比例隨子塊大小及能量比的變化表</p><p>  從表4-2的實驗數(shù)據(jù)中可以發(fā)現(xiàn),當(dāng)子塊大小確定時,第一個系數(shù)能量占比大于85%的子塊比例能達(dá)到84%以上,大

108、于80%的子塊比例均能達(dá)到91%以上;同時可以看出子塊越小時,變換系數(shù)矩陣的能量越集中在第一個系數(shù)的位置。實驗結(jié)果表明,不論子塊大小如何,子塊進行DCT變換后,能量均會集中在少數(shù)低頻系數(shù),即第一個系數(shù)中,因此,我們實驗時將提取每個子塊的第一個系數(shù)作為子塊特征。</p><p>  4.2 PCA實驗研究</p><p>  本小節(jié)主要研究方向為PCA方法中維數(shù)的選擇。我們使用MATLAB

109、軟件實現(xiàn)基于PCA方法的人臉識別,實驗并記錄改變維數(shù)的選取方式以及選值對識別率的影響,著重分為兩個部分:第一,維數(shù)取為指定值時,第二,取能量和比達(dá)到指定值時。</p><p>  4.2.1 根據(jù)指定值選擇</p><p>  首先分別取每個人臉的前1,2,3,4,5,6,7,8,9張圖片作為訓(xùn)練樣本集,剩余圖片作為測試集,這樣訓(xùn)練集分別為40、80、120、160、200、240、28

110、0、320、360,測試集分別為360、320、280、240、200、160、120、80、40。改變程序中的PCA部分,分別指定維數(shù)為5、10、15、20、25、30、35,得出分別的識別率結(jié)果如表4-3所示。</p><p>  表4-3識別率隨維數(shù)及樣本數(shù)的變化表</p><p>  從表4-3的實驗數(shù)據(jù)中可以發(fā)現(xiàn),隨著維數(shù)的增加,識別率也會相應(yīng)的得到提升,增高十分明顯;當(dāng)維數(shù)較大

111、時,隨著樣本數(shù)的增多,識別率提升會更加明顯。隨之而來的問題是當(dāng)維數(shù)增大時,程序運行時間,即人臉圖像識別時間大大增加;同時當(dāng)維數(shù)變化時,識別率的變化很不穩(wěn)定。</p><p>  4.2.2 根據(jù)能量比選擇</p><p>  首先分別取每個人臉的前1,2,3,4,5,6,7,8,9張圖片作為訓(xùn)練樣本集,剩余圖片作為測試集,這樣訓(xùn)練集分別為40、80、120、160、200、240、280

112、、320、360,測試集分別為360、320、280、240、200、160、120、80、40。改變程序中的PCA部分,通過程度確定達(dá)到指定能量比時的維數(shù),分別取能量比為80%、85%、90%、95%、99%,得出分別的識別率結(jié)果如表4-4所示。從表4-4的實驗數(shù)據(jù)中可以發(fā)現(xiàn),隨著能量比的提高,識別率也會相應(yīng)的得到提升;并且當(dāng)能量比要求高時,隨著樣本數(shù)的增多,識別率提升會更加明顯。當(dāng)能量比達(dá)到99%時,識別效果為最好。</p&g

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論