

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、隨著圖像采集設備的普及和移動互聯(lián)網(wǎng)的飛速發(fā)展,圖像數(shù)量呈現(xiàn)爆炸式增長,如何快速準確的在海量的圖像數(shù)據(jù)中進行目標檢索,是近年來計算機視覺領域的一個研究熱點,具有十分重要的學術意義和應用價值。而隨著用戶對于檢索要求的不斷提高,目標精細檢索系統(tǒng)也開始進入人們的視野。通常來說,目標精細檢索系統(tǒng)可以從兩方面進行定義:(1)能夠生成更加精細的圖像標注信息。更精細的標注包括物體區(qū)域的像素級標注(分割信息),以及物體部位的標注信息。這些精細的標注信息允
2、許檢索系統(tǒng)返回更加精細的檢索結果;(2)能夠理解用戶更加精細的檢索意圖描述。例如用戶以手繪草圖作為檢索輸入,該草圖描述著檢索目標的形狀細節(jié)、姿態(tài)、角度等信息。對精細檢索意圖的理解允許檢索系統(tǒng)返回和用戶輸入高度匹配的目標??偟膩碚f,相比于傳統(tǒng)的目標檢索系統(tǒng),目標精細檢索系統(tǒng)能夠返回更加符合用戶需求的檢索結果,避免用戶對檢索結果進行二次處理和篩選,滿足用戶精細化的檢索需求,大大提高目標檢索的效率,具有非常重要的意義。本文的工作以目標精細檢索
3、為目標,從以上兩個方面入手進行研究,取得了以下成果:
(1)針對目標標注中的目標多樣性和像素級標注問題,本文提出了一種基于超像素(superpixel)和改進與或圖(AND/OR Graph)模型的目標標注方法。目標物體在外觀、姿態(tài)上的多樣性,會顯著降低目標標注的性能,增加像素級標注的難度。針對這個問題,本文將目標物體定義為一系列部位的組合,提出一種改進的與或圖模型來組織部位之間的關系,以提高對于外觀和姿態(tài)變化的魯棒性,并利用
4、基于圖模型的快速推理算法實現(xiàn)對物體部位的最優(yōu)選擇。在生成候選部位集合的過程中,考慮到像素級標注的要求,本文以超像素區(qū)域的輪廓形狀作為特征,基于模板庫來實現(xiàn)候選物體部位集合的生成。超像素和改進與或圖模型的結合,使得本文的方法對于目標多樣性具有較好的魯棒性,并且能夠實現(xiàn)目標的像素級標注。在多個公共數(shù)據(jù)庫上的實驗結果證明了本文的方法能夠有效的應對目標多樣性問題,實現(xiàn)目標區(qū)域的精細(像素級)標注。
(2)針對目標部位標注中的魯棒性問題
5、,本文提出了一種基于輪廓預測及增強的目標部位標注方法。相較于目標整體,目標部位具有形變較小的優(yōu)點,但同時也具有有效特征少,易受噪聲干擾的問題?;谶@些特點,本文通過增強物體部位的輪廓邊緣來提高目標部位標注對于噪聲干擾的魯棒性。本文利用學習算法從正樣本集中自動的學習一組典型的輪廓邊緣模式(edgepatterns)?;趯W習得到的輪廓模式,本文提出一種“輪廓預測-增強”策略對輸入圖像進行過濾,預測圖像中可能存在的物體部位輪廓邊緣,根據(jù)預測
6、結果在增強物體部位輪廓邊緣的同時抑制噪聲邊緣,以達到提高部位標注魯棒性的目的。INRIA和TUD數(shù)據(jù)庫上的實驗結果表明了本文的方法的確有效的提高了目標部位標注的魯棒性。
(3)針對手繪草圖檢索中的噪聲問題,本文提出了一種輪廓邊緣選擇算法。由于自然圖像中存在的大量噪聲,手繪草圖和自然圖像之間存在巨大的視覺差異。如何有效的降低噪聲邊緣的影響,是提高檢索系統(tǒng)性能的一個關鍵點。本文將手繪目標圖像和邊緣圖像(自然圖像經(jīng)邊緣檢測生成)視為
7、一系列線段的組合,提出了一個HLR(histogram of line relationship)描述子通過描述線段之間的關系來描述物體形狀。因為邊緣圖像中包含大量的噪聲邊緣,如物體細節(jié)邊緣和背景邊緣,基于HLR描述子,本文對邊緣進行選擇,保留物體輪廓邊緣,忽略噪聲邊緣。該算法為每一個HLR描述子生成大量假設,每種假設對應一種邊緣選擇的結果,最終將邊緣選擇問題轉化為一個尋找最佳假設組合的最優(yōu)化問題。相應的,本文提出一個快速算法來求解這個
8、最優(yōu)化問題。實驗表明,HLR描述子和邊緣選擇算法都有效的提高了檢索性能,增強了檢索系統(tǒng)對于噪聲的魯棒性。
(4)針對手繪草圖中的邊緣不穩(wěn)定問題,本文提出了一種最優(yōu)局部匹配算法。自然圖像經(jīng)過邊緣提取不僅會生成噪聲邊緣,也會造成輪廓邊緣丟失,即邊緣不穩(wěn)定問題。這個問題增加了手繪目標圖像和自然圖像之間的匹配困難。噪聲邊緣的存在使得邊緣圖像(自然圖像經(jīng)邊緣檢測生成)成為手繪草圖的一個超集,而輪廓邊緣丟失使得邊緣圖像成為手繪草圖的一個子
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 圖像檢索關鍵技術研究.pdf
- 圖像檢索關鍵技術研究(1)
- 圖像檢索若干關鍵技術研究.pdf
- 網(wǎng)絡圖像檢索關鍵技術研究.pdf
- 基于內容圖像檢索關鍵技術研究.pdf
- 醫(yī)學圖像語義檢索關鍵技術研究.pdf
- 圖像目標識別中若干關鍵技術研究.pdf
- 基于內容的圖像檢索關鍵技術研究.pdf
- 基于RSOM積的大規(guī)模圖像目標檢索關鍵技術研究.pdf
- 圖像數(shù)據(jù)庫檢索中的關鍵技術研究.pdf
- 外觀專利檢索中圖像預處理關鍵技術研究.pdf
- 視頻圖像序列中目標跟蹤關鍵技術研究.pdf
- 醫(yī)學圖像處理中的分割與檢索關鍵技術研究.pdf
- 紅外圖像目標識別中的關鍵技術研究.pdf
- 海量遙感圖像內容檢索關鍵技術研究.pdf
- 基于區(qū)域的圖像檢索關鍵技術研究(1)
- 基于人臉對象的圖像檢索關鍵技術研究.pdf
- 圖像檢索中縮小語義差距的幾個關鍵技術研究.pdf
- 基于內容圖像數(shù)據(jù)庫檢索中的關鍵技術研究.pdf
- 基于情感語義的圖像檢索關鍵技術研究.pdf
評論
0/150
提交評論