Multiview face detection using six segmented rectangular filters and skin tone information.pdf_第1頁
已閱讀1頁,還剩73頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、人臉檢測廣泛應用于視覺目標檢測,是入臉分析、定位以及人臉識別的主要組成成分之一,在眾多的應用中(例如安全、新通信接口、生物鑒定和其他方面中)占有主導地位。 給出一幅圖像,人臉檢測用于尋求圖像中是否存在人臉,如果存在人臉,返回人臉的位置及其內(nèi)容。 自動人臉檢測是一個相對較復雜的問題,需要檢測一幅圖像或者視頻序列中的一個或者很多人臉,實際上困難在于人臉是非剛體目標,對于兩個不同的入,人臉外貌有可能會變化,甚至同一個人的兩幅照

2、片都有可能不同,取決于光照條件、目標情緒狀態(tài)以及姿勢,這就是最近幾十年為什么會有如此多的方法用來研究人臉檢測。對主要的方法我們做了整體概括,最終致力于研究探測器,它在取得高檢測率的同時,處理圖像的速度也是非常之快。每一種方法都是在特定背景下發(fā)展應用起來的,可以把所有的方法主要歸納成兩種:基于圖像的方法和基于特征的方法。第一種方法利用分類器掃描整幅圖像,此分類器利用給定的樣本集靜態(tài)訓練;另外一種方法主要檢測人臉特征比如眼睛、鼻子等。

3、 論文中,主要研究了介于兩種方法(即基于圖像的方法和基于特征的方法)的中間系統(tǒng),認為此中間系統(tǒng)是基于圖像的方法是由于它利用學習算法將給定的正負樣本來訓練分類器,這些樣本是精心挑選好的。而認為此系統(tǒng)基于特征的原因是由于中間系統(tǒng)的學習算法所選擇的特征與人臉特定特征是直接相關的(眼睛位置,鼻梁對照)。 每個輸入圖像通過四個階段的檢測,每個檢測階段都會形成假設,并在進一步的檢測中尋找證據(jù)使得假設成立。 假設就相當于人臉候選區(qū)域

4、,證據(jù)本質(zhì)上就是特定的圖像特征,如果此假設不成立就退出檢測,成立則進入下一個檢測階段形成新的假設,以此類推,直到最終確定入臉目標。這樣功能模塊遵循著由粗到細的政策。第一階段形成的假設可以認為是最粗略的估計,接下來的幾個階段是先前階段的細化。 人臉檢測的四個階段分別是:(1)膚色區(qū)域提取,(2)清除膚色區(qū)域,(3)候選目標區(qū)域的選擇,(4)人臉確認。 由于膚色顏色的外表取決于光線條件,這就是為什么在準備階段的第一步,是歸一

5、化圖像中的顏色表面。程序由高于luma5%的相關像素組成(非gamma-corrected亮度),如果那些像素的數(shù)量非常大(大于100個),就作為基準白色。為了使這些基準白色像素值減低至灰度值255,需要調(diào)整一幅彩色圖像的紅、綠、藍三種組成成分。如果檢測到的基準白色的像素數(shù)量沒有足夠大,彩色組成成分就不會改變。 人類膚色擁有自己獨特的色彩分布,這和大部分的非人臉目標都是不同的。這就是為什么人類膚色可以用來過濾輸入圖像以獲得人臉候

6、選目標區(qū)域。為了實現(xiàn)過濾過程,需要轉(zhuǎn)換圖像的彩色空間。這個階段的目的是為了減少搜索區(qū)域,搜索的判斷是基于這樣一個事實:人臉通常存在于膚色區(qū)域。像素水平的分割利用YCbCr彩色空間坐標系統(tǒng)完成膚色區(qū)域提取。在YCbCr彩色空間中,Y分量代表了亮度信息,Cb和Cr分量包含著色度信息。因此可以容易地確定亮度信息。既然原始圖像在RGB彩色空間,為了獲得YCbCr空間信息必須做一定的轉(zhuǎn)換。在下一階段的進一步分析之前,轉(zhuǎn)換后得到的二進制圖像受支配于

7、簡單的間隙填充和去除孤立像素點的過程。 為了確認人臉的存在,我們必須掃面整幅圖像以確定膚色區(qū)域并去除不必要的像素。為了減小檢測區(qū)域,我們需要確定可能存在的人臉區(qū)域,為此僅僅根據(jù)色度分量把像素分成膚色和非膚色兩類。注意到假設我們用灰度圖像替代彩色圖像,這個預處理階段并不在考慮范圍之內(nèi),所以直接跳到分類階段。 Boosting技術通過對訓練樣本的二次加權改善基礎分類器的性能。另一方面,用于boosting的普通分類器是2X

8、3的Harr-like新特征集,可以獲得高檢測率以及快速計算速率。利用這些新的特征集,訓練時間明顯大大縮短:比之前用的特征集快了整整5倍。 Adaboost選擇小數(shù)量的關鍵性的特征,并結合到強分類器中?;仡櫳险?,算法是自適應的,由于它能處理特別弱假設的出錯率。論文的目的是增慢檢測性能的同時減少計算時間,通過組成一個級聯(lián)結構的分類器就可以達到這個目的。工作原理就是快速剔除大量的負窗口,同時保持幾乎所有的正樣本,利用更多的完全分類

9、器分類相應多的子窗口。為了達到這個目的,級聯(lián)結構的第一階段只要包含較少的特征,這樣可以獲得高檢測率(100%),但是誤檢率卻高達(40%)。這種人臉檢測方法顯而易見是不可以接受的,但是成功利用這些越來越有區(qū)分行的檢測階段就可能達到快速檢測的目標。 把這個級聯(lián)結構和退化決策圖表作比較,如果在某一階段中,檢測到子窗口有人臉,并且會在下個階段中繼續(xù)研究探討。以此進行,直到在某一階段子窗口檢測為非人臉目標,或者所有階段都分類成人臉目標。

10、最后這種情況候選區(qū)域才會被考慮成正樣本。 論文結合膚色檢測方法和學習算法檢測不同位置處的人臉,因此,輸入應該是任意圖像,而輸出應該是同一幅圖像,并且在任何人臉存在區(qū)域有一個矩形框區(qū)域。本中間系統(tǒng)直接檢測圖像以尋找任何有可能存在的正樣本(即人臉),同時對圖像的子窗口也采取相同的方式,如果圖像部分中的矩形不是人臉,此次檢測就會認為是負檢測(即認定假設不成立,是非人臉)。 測試集中的圖像尺寸是任意的,而正負訓練樣本集的圖像尺寸

11、必須是一致的。在不同光照條件下取得包含人臉的圖像組成了正訓練樣本集,訓練樣本集實際上通過人為掃描正樣本產(chǎn)生,并把圖像縮放成一個標準尺寸,訓練集中的負訓練樣本集由包含非人臉目標的圖像組成,這些圖像都是隨意取得的。 除了檢測準確率多少這個目標和任務外,第二個主要的目標是實時性能,響應時間取決于所要測試圖像的尺寸,因此這樣大小尺寸圖像的實時時間就有可能是不相同的,較大圖像尺寸的響應時間要比較小圖像尺寸的響應時間長些從檢測項目速度、訓練

12、項目速度以及寫項目的所付出的努力幾個方面來講,論文的主要目的是:學習怎么樣檢測某些類型圖像中的人臉,此中間系統(tǒng)的成功之處在于,它是其他系統(tǒng)的基礎例如人臉識別和面部表情識別。 論文的貢獻可以總結為以下幾個方面: 1、論文中人臉檢測方法結合基于圖像的方法和基于特征的方法,充分利用了這兩種方法的優(yōu)點,減少了兩種方法所具備的不足(結合其優(yōu)勢,摒棄 其劣勢)。 2、描述了訓練中所用到的特征集類型。這些特征(眼睛,鼻

13、子等等)大大減低了訓練時間,比用傳統(tǒng)特的征集快了5倍。 3、建立了一個快速而且可靠的人臉檢測方法,基于學習人臉,遮擋人臉(即有外物遮擋,比如眼鏡,帽子之類的東西)和有一定角度的人臉(即人臉傾斜了一定角度)。 此系統(tǒng)并沒有特殊的硬件,只有計算機和相機。在光照條件變化范圍內(nèi),實驗結果證明檢測側面和旋轉(zhuǎn)人臉的有效性,檢測率高達96%,誤檢率僅為6%。 這里并不存在“魔幻”的答案能簡單解釋,應用論研究的技術實時檢測人臉所

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論