基于局部特征與視覺顯著性的圖像目標識別研究.pdf_第1頁
已閱讀1頁,還剩137頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、人類視覺系統(tǒng)對獲取的視覺信息具有強大的分析和鑒別能力,其中之一就是對外界事物的認知能力,這種我們人類具有的基本認知能力在計算機視覺領域就被稱之為圖像目標識別。人類視覺面臨的是環(huán)境中千變萬化的各類目標,這就意味著計算機視覺領域的圖像目標識別面臨的將是一個大規(guī)模甚至超大規(guī)模的圖像數(shù)據(jù)庫,而且這個數(shù)據(jù)庫會隨著時間的推移不斷增長,大規(guī)模的圖像數(shù)據(jù)庫同時也意味著數(shù)據(jù)的復雜性,如圖像目標類別數(shù)目變化、圖像背景復雜而混亂等。正因為這“大規(guī)模”和“復雜

2、性”給圖像目標識別任務造成了極大的困難。目前,這些困難主要表現(xiàn)在:“語義鴻溝”、局部特征的辨別力、感興趣目標分割以及運行效率等。
  本文以Marr計算視覺理論為基本理論基礎,采用自下而上處理(即數(shù)據(jù)驅動)的技術路線,在詞袋(Bag-of-words)模型的理論框架上,以局部特征和視覺顯著性為切入點,重點研究圖像目標分類識別中的關鍵技術來解決上述困難,研究包括:圖像預處理,局部特征描述,顯著性區(qū)域檢測,圖像特征編碼。本文力求在研究

3、思路和方法上有所突破和創(chuàng)新,具體研究內容可以概括為以下五個方面:
 ?、僭O計了一個新的脈沖噪聲檢測器,并結合梯度信息,提出了一種混合噪聲去噪算法。首先,通過引入一幅參考圖像,設計了一個更加準確的脈沖檢測器,稱作DARD(Directional Absolute Relative Differences)統(tǒng)計。去噪算法由兩部分組成:生成參考圖像與圖像去噪。初始參考圖像由中值濾波器去噪后得到,然后通過本文的去噪算法迭代1-2次得到參考

4、圖像。在去噪算法中,首先將梯度信息引入高斯濾波器框架得到一個新的高斯濾波器用來去除高斯噪聲,然后引入DARD統(tǒng)計用來去除脈沖噪聲,最后將其合并形成一個新的三邊濾波器用來去除混合噪聲。實驗結果表明本文的脈沖噪聲檢測器具有較高的檢測率,尤其對于椒鹽噪聲。而且,本文提出的去噪算法無論是定量評測還是圖像的視覺質量都取得了較好的結果。
 ?、卺槍δ壳暗奶卣髅枋鲎訉庹兆兓粔螋敯?提出了一種具有光照不變性的局部特征描述算子。其基本原理是:在

5、發(fā)生光照變化時,盡管圖像的像素值會發(fā)生變化,但其紋理結構即各像素的像素類型保持不變。具體而言,本文首先在預處理階段進行直方圖均衡化以及灰度值歸一化,然后綜合考慮像素灰度值的全局分布信息以及局部像素灰度值差異信息。其中,通過引入模糊推理規(guī)則,用來描述局部像素灰度值差異信息,即各像素的類型,主要包括4個方向的邊緣像素,背景像素,以及孤立點(噪聲)像素。為了提高算子的魯棒性,本文還提出了一種基于梯度權值的圖像特征子區(qū)域加權方法。在Oxford

6、數(shù)據(jù)庫中進行了實驗測試,實驗結果表明本文的局部特征描述算子不僅在光照變化特別是復雜光照變化下優(yōu)于現(xiàn)有的描述算子,而且在其他如圖像旋轉、尺度縮放、圖像模糊、圖像壓縮等變換下也表現(xiàn)較好。
 ?、墼诰€性運行時間內得到全分辨率或像素級的顯著性圖,并且具有較低誤檢率,即更少地將背景區(qū)域誤標記為顯著性區(qū)域,在顯著性區(qū)域檢測領域中仍然非常具有挑戰(zhàn)性。為此,本文提出了一種簡單高效的顯著性區(qū)域檢測算法。具體而言,首先為每幅圖像估計多幅魯棒的背景圖,

7、具體是通過選取各像素的最佳鄰域進行估計得到的。一旦獲取了這些背景圖,顯著性圖就可以簡單地通過測量輸入圖像和背景圖像之間的差異得到,這類似于視頻處理當中的背景差分方法。為了進一步提升性能,本文還引入了高層先驗知識:空間分布信息,即顯著性區(qū)域大都位于圖像中間而很少位于圖像邊界。在MSRA-1000數(shù)據(jù)庫進行了實驗驗證,實驗結果表明,無論是精確度還是運行效率,本文方法都優(yōu)于現(xiàn)有的方法。由于本文方法的簡單高效,因而同樣可以適用于大規(guī)模數(shù)據(jù)庫的圖

8、像分割、視頻處理中的顯著性目標提取等應用。
  ④在圖像目標識別中,最近提出的顯著性編碼方法無論是識別性能還是運行效率都取得了較好的結果,然而,它對噪聲特征比較敏感,即魯棒性不高。為此,本文結合全局顯著性和局部差異性提出了一種新的特征方法,其中,全局顯著性用來提高其穩(wěn)定性和魯棒性,局部差異性則用來描述視覺詞典的隱藏結構信息。通過在Caltech-101等多個公共數(shù)據(jù)庫中進行實驗驗證表明本文方法在別精度和運行效率都優(yōu)于現(xiàn)有方法,而且

9、對噪聲特征更加魯棒。另外,將我們的全局顯著性和現(xiàn)有的顯著性編碼方法相結合還可以提升他們的性能。最后,本文將顯著性檢測融入詞袋模型框架中,提出了顯著性視覺詞典。通過顯著性圖來衡量不同圖像區(qū)域的局部特征的辨別力,然后只選取顯著性較高的局部特征進行聚類形成視覺詞典。通過在VOC2007數(shù)據(jù)庫中進行實驗驗證,實驗結果表明,當圖像中目標物體明確時,顯著性視覺詞典可以顯著提升目標識別性能;反之,顯著性視覺詞典可能會失效,因此,還需在后續(xù)工作中進一步

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論