基于非負(fù)矩陣分解和稀疏表示的人臉識(shí)別算法研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩97頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、作為生物特征識(shí)別的一個(gè)重要的分支,人臉識(shí)別逐漸成為了計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)熱門(mén)研究課題,得到了越來(lái)越廣泛的關(guān)注。眾多的人臉識(shí)別方法被研究人員相繼提出,其中,基于表觀(Appearance-based)的人臉識(shí)別方法由于其簡(jiǎn)單、實(shí)用性強(qiáng)和有效性高等優(yōu)點(diǎn),成為了人臉識(shí)別的研究熱點(diǎn)之一。該類(lèi)算法通常包括兩個(gè)重要的過(guò)程,即特征提取和分類(lèi)。本文圍繞非負(fù)矩陣分解(Non-negative Matrix Factorization,NMF)這種新的特征

2、提取方法,和基于稀疏表示的分類(lèi)器(Sparse Representation based Classification, SRC)這種新的分類(lèi)器展開(kāi)的。
  NMF是一種新的特征提取方法。由于具有非負(fù)約束,NMF能夠提取到訓(xùn)練樣本的局部成份。并且,研究發(fā)現(xiàn),人腦是通過(guò)事物的局部來(lái)感知外界事物的,因此,NMF和人腦感知事物是有聯(lián)系的。所以,基于NMF的人臉識(shí)別方法具有很強(qiáng)的實(shí)用價(jià)值。
  近年來(lái),由于其識(shí)別率高、魯棒性強(qiáng)等優(yōu)點(diǎn)

3、,基于稀疏表示的人臉識(shí)別方法受到越來(lái)越多科研人員的關(guān)注。和傳統(tǒng)的子空間學(xué)習(xí)算法不同,稀疏表示并不關(guān)心采用何種特征進(jìn)行降維,卻強(qiáng)調(diào)稀疏性和分類(lèi)器的設(shè)計(jì)。稀疏表示的研究表明,如果分類(lèi)器設(shè)計(jì)的適當(dāng)?shù)脑?,選擇何種特征降維已經(jīng)不重要了。因此,基于稀疏表示的人臉識(shí)別方法將人臉識(shí)別的研究重心引入到分類(lèi)器設(shè)計(jì)上。圍繞NMF和稀疏表示,本文的創(chuàng)新性成果和主要工作如下:
  (1)提出了基于光滑性和主成分的NMF(Smoothness and Pri

4、ncipal Components Based NMF, SPNMF)算法。通過(guò)對(duì)NMF的研究,發(fā)現(xiàn)NMF收斂慢的原因是基圖像含有很多噪聲。此外,NMF的系數(shù)矩陣相關(guān)性較大,不利于識(shí)別不同圖像。鑒于現(xiàn)有NMF算法的缺點(diǎn),本文提出了SPNMF算法。首先,將一個(gè)常數(shù)矩陣添加到基矩陣上,來(lái)增強(qiáng)基矩陣的光滑性,同時(shí),平滑噪聲點(diǎn),最終減少NMF的迭代次數(shù);其次,為了提高系數(shù)矩陣不同列之間的區(qū)分度,將系數(shù)矩陣不同列之間的方差增加到NMF的損失函數(shù)上

5、,作為懲罰項(xiàng)。最后,在PIE、AR和FERET三個(gè)公用的人臉庫(kù)上進(jìn)行了大量的實(shí)驗(yàn),結(jié)果表明,本文提出的SPNMF算法不但識(shí)別率高于NMF,而且速度比NMF快2至4倍,因此,SPNMF具有較強(qiáng)的實(shí)用價(jià)值。
  (2)提出了二維非負(fù)主成分分析(Two-Dimensional Non-negative Principal Component Analysis,2DNPCA)算法。本文通過(guò)對(duì)二維主成分分析(Two-Dimensional

6、Principal Component Analysis,2DPCA)的研究,發(fā)現(xiàn)2DPCA是基于整幅圖像的算法,通過(guò)最大化特征協(xié)方差矩陣的跡來(lái)保護(hù)總體方差。但是,2DPCA不能提取對(duì)人臉識(shí)別非常重要的局部成份。受到基于局部特征的NMF算法的啟迪,本文將非負(fù)約束融入到2DPCA中,提出了2DNPCA算法。2DNPCA是一種基于圖像矩陣的方法,能夠保持人臉圖像的局部結(jié)構(gòu);并且2DNPCA具有非負(fù)限制,能夠提取人臉圖像的局部成份。因此,2D

7、NPCA同時(shí)具備2DPCA和NMF的優(yōu)點(diǎn)。此外,2DNPCA打破了最小化損失函數(shù)的框架,迭代過(guò)程中只需提取基矩陣而不用同時(shí)提取系數(shù)矩陣,使得2DNPCA的速度顯著快于傳統(tǒng)的基于NMF的算法。在Yale、FERET、AR和Extended Yale B四個(gè)標(biāo)準(zhǔn)人臉庫(kù)上的實(shí)驗(yàn)結(jié)果表明,2DNPCA是一種非常有效且優(yōu)于2DPCA、2DLDA、2DLPP和NMF的人臉識(shí)別方法。
  (3)提出了基于梯度的稀疏表示分類(lèi)器(Gradient-

8、based Sparse Representation Classification, GSRC)。近來(lái),盡管基于l1范數(shù)和l2范數(shù)的稀疏表示對(duì)于正面人臉圖像識(shí)別已經(jīng)取得了很有前景的識(shí)別效果,但是,它們都需要完備的訓(xùn)練字典,這個(gè)條件現(xiàn)實(shí)中很難滿足。本文主要關(guān)注如何設(shè)計(jì)稀疏表示算法來(lái)解決不完備訓(xùn)練字典問(wèn)題。由于圖像梯度能夠明確地考慮相鄰像素點(diǎn)之間的相互關(guān)系,而且和圖像像素相比,圖像梯度對(duì)光照變化更不敏感,所以本文將圖像梯度融入到稀疏表示框

9、架,提出了 GSRC算法。通過(guò)將圖像像素值和圖像梯度相結(jié)合,和基于稀疏表示的分類(lèi)器(SRC)相比,本文提出的GSRC算法具有更小的模型誤差,對(duì)每個(gè)類(lèi)別要求更少的訓(xùn)練樣本。此外,GSRC可以很容易地與傳統(tǒng)的特征提取算法結(jié)合,并且可以通過(guò)正則化最小二乘法求解,使得GSRC速度顯著快于SRC。采用Yale、AR、Extended Yale B和CMU PIE四個(gè)公用的人臉庫(kù)進(jìn)行實(shí)驗(yàn),結(jié)果表明GSRC對(duì)于不完備訓(xùn)練字典問(wèn)題和圖像遮擋問(wèn)題都是十分

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論