基于視覺顯著性的圖像檢索算法研究.pdf_第1頁
已閱讀1頁,還剩110頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、本研究針對圖像檢索算法中圖像特征的語義位置信息獲取問題,從人眼的視覺注意力特點出發(fā),結(jié)合圖像的視覺顯著性和圖像局部特征相關(guān)性,提出了一種基于加權(quán)空間金字塔模型的圖像檢索方法。其核心思想是利用圖像的視覺顯著性理論來為圖像特征賦予相應(yīng)的語義和位置信息,即將圖像的視覺顯著性圖和空間金字塔子區(qū)域相結(jié)合來幫助空間金字塔模型深入理解圖像中的內(nèi)容。為了自適應(yīng)獲得空間金字塔子區(qū)域的視覺權(quán)值,我們還提出了利用圖像的視覺顯著性值的內(nèi)在特點對每個尺度下空間金

2、字塔的特征向量進行重新組織和梳理,以達到根據(jù)人眼視覺特性對圖像進行分析和理解的目的。針對傳統(tǒng)詞袋模型中由于視覺單詞以及構(gòu)建的視覺詞匯表空間位置信息缺乏而影響算法準確性這一問題,本文提出了一種使用空間詞袋模型的圖像檢索算法。本文將視覺顯著性理論和傳統(tǒng)詞袋模型相結(jié)合,重點改造視覺單詞的統(tǒng)計方法并采用分級策略來重新構(gòu)造視覺詞匯表。在視覺顯著性的協(xié)同下,新構(gòu)造的視覺詞匯表對視覺單詞區(qū)別對待,并可反映出圖像中目標對象上的局部特征,減少非目標對象對

3、于檢索的干擾。大量的仿真實驗表明,新構(gòu)建的視覺詞匯表確實可以有效的提高檢索算法的各方面性能。
  本文針對圖像檢索算法在整幅圖像上提取單一特征并不能很好的客觀描述圖像全貌這一問題,本文提出了一種基于目標對象的多特征詞袋模型檢索算法。其核心思想是在視覺顯著性理論的幫助下將圖像的背景和目標對象分離,并在詞袋模型的基礎(chǔ)上進一步融合圖像的形狀和顏色特征來全面的描述圖像。仿真實驗表明,本文所提出的算法可以提高特征描述圖像的能力,并重點關(guān)注目

4、標對象上的圖像特征,有力地提升了圖像檢索算法分析和理解圖像的能力。隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展和以智能手機為代表的智能移動設(shè)備的迅速普及,每天在這些設(shè)備上會產(chǎn)生大量的多媒體數(shù)據(jù),圖像數(shù)據(jù)占據(jù)了其中很大一部分,這就需要人們對這些大量的圖像數(shù)據(jù)進行高效的存儲以及管理。隨著數(shù)據(jù)數(shù)量的不斷膨脹,傳統(tǒng)的圖像數(shù)據(jù)庫技術(shù)已經(jīng)不能滿足當前的需要,如何有效的存儲以及管理海量圖像數(shù)據(jù)已經(jīng)成為學(xué)術(shù)界關(guān)注的熱點內(nèi)容之一,其中基于內(nèi)容的圖像檢索技術(shù)(CBIR)逐漸成

5、為人們關(guān)注的焦點,并已經(jīng)成為新一代圖像數(shù)據(jù)庫所使用的主流技術(shù)。傳統(tǒng)的基于內(nèi)容圖像檢索技術(shù)大多使用圖像的底層特征(如顏色、形狀和紋理)來進行圖像間的相似度計算,比較少的考慮到人眼的視覺注意力特點。所謂的人眼視覺注意力,是指人們在觀察周圍場景或者圖像的時候,會自動有選擇性的關(guān)注某些特定的目標對象,作為感興趣或者重要的目標來分析處理,人眼的這種視覺注意力機制恰好和基于內(nèi)容圖像檢索的目標相吻合,因此將人眼的視覺注意力機制融合到基于內(nèi)容圖像檢索算

6、法中對于提高檢索的準確率具有重要的意義。
  本研究主要內(nèi)容包括:⑴以人眼視覺注意力機制為基礎(chǔ),結(jié)合圖像的視覺顯著性,提出了一種基于視覺加權(quán)空間金字塔模型的圖像檢索算法。該算法首先對圖像進行多尺度下空間金字塔劃分處理,并得到每個尺度下各分塊的特征向量;然后結(jié)合反映人眼視覺特性的視覺顯著性值,計算出各個尺度下空間金字塔的視覺權(quán)值;最后利用視覺權(quán)值對多尺度下空間金字塔的聯(lián)合特征向量進行加權(quán)處理,并根據(jù)處理后得到的特征向量進行檢索。⑵針

7、對傳統(tǒng)詞袋模型中由于視覺單詞以及構(gòu)建的視覺詞匯表缺乏空間位置信息而影響算法準確性這一問題,提出使用視覺顯著性值和視覺單詞相結(jié)合,構(gòu)造一個全新的可以反映出視覺單詞空間位置信息的視覺詞匯表,新構(gòu)建的視覺詞匯表考慮了視覺單詞所在的空間位置,可以重點反映出圖像中目標對象上的局部特征,盡量減少背景信息對于檢索的影響。大量的仿真實驗表明,新建的視覺詞匯表確實可以有效的提高檢索算法的準確性。⑶使用基于內(nèi)容的方法進行圖像檢索的前提是全面、深入的對圖像的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論