圖像檢索中的相關(guān)反饋與自動標(biāo)注研究.pdf_第1頁
已閱讀1頁,還剩74頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、當(dāng)前成像技術(shù)的快速發(fā)展,使數(shù)碼相機(jī)、可拍照手機(jī)等設(shè)備日益普及,圖像數(shù)量飛速增長。同時(shí),互聯(lián)網(wǎng)的誕生與發(fā)展極大地促進(jìn)了人們之間的信息交流,也使圖像傳播變得更加方便快捷。事實(shí)上,網(wǎng)絡(luò)的發(fā)展也一定程度上促使用戶上傳更多的網(wǎng)絡(luò)圖像,包括新聞、娛樂等圖像。越來越豐富的圖像資源使用戶難以在浩如煙海的圖像數(shù)據(jù)中找到其真正需要的信息,從而,各類圖像檢索技術(shù)得到了廣泛的關(guān)注。 基于視覺內(nèi)容的圖像檢索在許多領(lǐng)域具有非常重要的作用,如指紋檢索、醫(yī)學(xué)圖

2、像檢索、生物信息檢索等等。這類檢索的一個(gè)關(guān)鍵問題是如何利用用戶反饋信息改進(jìn)檢索的結(jié)果。由于圖像具有巨大的數(shù)據(jù)量,一般表示為高維空間中的矢量,其索引和檢索變得十分困難。所以這類檢索的另一重要問題就是如何實(shí)現(xiàn)快速有效的相似性比較。當(dāng)需要處理的圖像數(shù)目達(dá)到上百萬甚至上億張時(shí),快速搜索近似圖像將成為非常具有挑戰(zhàn)性的任務(wù)。 然而,現(xiàn)有的商業(yè)化的圖像檢索系統(tǒng)主要依賴于圖像對應(yīng)的標(biāo)注信息,隨著圖像數(shù)量的快速增加,手工進(jìn)行圖像標(biāo)注方法由于消耗太

3、高,已經(jīng)不能滿足人們的需要。所以,自動圖像標(biāo)注方法近些年來已成為了研究熱點(diǎn)。目前研究中遇到的問題主要是“語義鴻溝”問題以及巨大的圖像數(shù)量帶來的效率問題等。 本文主要針對圖像檢索中的自動圖像標(biāo)注以及相關(guān)反饋等方面進(jìn)行研究,主要研究內(nèi)容和創(chuàng)新之處為: 1.對基于內(nèi)容的圖像檢索中的相關(guān)反饋技術(shù)進(jìn)行了介紹,重點(diǎn)討論了基于概念點(diǎn)移動、基于機(jī)器學(xué)習(xí)、基于概率模型三類方法。針對基于概念點(diǎn)移動類方法,改進(jìn)了原有的一種區(qū)域權(quán)重學(xué)習(xí)算法。區(qū)

4、域權(quán)重在基于區(qū)域圖像檢索系統(tǒng)中很關(guān)鍵。本文通過分析樣本空間的分散度,提出了一種新的區(qū)域權(quán)重學(xué)習(xí)算法,改進(jìn)了基于區(qū)域圖像檢索的相關(guān)反饋技術(shù)。該算法在利用正例樣本的同時(shí),有效地利用負(fù)例樣本去除部分不相關(guān)圖像,提高了檢索性能。實(shí)驗(yàn)結(jié)果表明該算法可以更好的克服不精確分割問題,魯棒性更好。 2.針對基于機(jī)器學(xué)習(xí)的反饋技術(shù),將基于多示例學(xué)習(xí)(Multi-InstanceLearning MIL)的相關(guān)反饋(Relevance Feedbac

5、k RF)技術(shù)應(yīng)用到圖像檢索系統(tǒng)中去,通過不斷的學(xué)習(xí)用戶的查詢概念,逐步地提高檢索精度。使用有重疊分割方法分割大圖像得到子圖像區(qū)域,將由紋理特征描述的子圖像區(qū)域作為包中示例,并將大圖像作為多示例包。反饋階段,用戶對返回的大圖進(jìn)行是否相關(guān)的標(biāo)注,生成正負(fù)包,使用改進(jìn)的多樣密度算法(Diverse Density DD)學(xué)習(xí)用戶的查詢概念。試驗(yàn)結(jié)果表明改進(jìn)的多樣密度算法可以有效地避免局部最小值,同時(shí)還可以降低計(jì)算復(fù)雜度。 3.傳統(tǒng)的

6、自動圖像標(biāo)注統(tǒng)計(jì)模型孤立地預(yù)測每個(gè)語義概念的概率,而沒有考慮到各個(gè)語義概念之間的聯(lián)系性。本文提出了一種新的概率方法,該方法將語義概念和視覺特征之間的聯(lián)系以及語義概念之間的聯(lián)系很好地結(jié)合起來。使用條件概率度量語義概念之間的兩種聯(lián)系,運(yùn)用CMRM模型計(jì)算語義概念和視覺特征之間的聯(lián)系。在標(biāo)準(zhǔn)Corel圖像庫上的測試說明了該方法的有效性。 4.本文認(rèn)為同一幅圖像標(biāo)注中的不同的語義概念存在不同的語義顯著性。然而現(xiàn)有大部分自動標(biāo)注方法及評價(jià)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論