2023年全國(guó)碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩107頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、隨著近年來數(shù)碼相機(jī)及智能手機(jī)的大規(guī)模普及,以及存儲(chǔ)設(shè)備容量的持續(xù)增加,多媒體內(nèi)容特別是視覺數(shù)據(jù)呈現(xiàn)出爆發(fā)式的增長(zhǎng)態(tài)勢(shì)。因而,對(duì)于海量的視覺內(nèi)容,如何進(jìn)行迅速有效的檢索一直是國(guó)內(nèi)外學(xué)術(shù)與工業(yè)界的研究熱點(diǎn)。早期的圖像檢索系統(tǒng)通常使用基于文本的查詢方式,通過將用戶提供的查詢文本與互聯(lián)網(wǎng)網(wǎng)頁內(nèi)容進(jìn)行匹配,從而檢索到與查詢文本相關(guān)聯(lián)的圖像。隨著計(jì)算機(jī)視覺技術(shù)的發(fā)展,基于內(nèi)容的圖像檢索(Content-Based Image Retrieval,C

2、BIR)在解析用戶查詢意圖、增強(qiáng)用戶體驗(yàn)等方面起到了與文本查詢相互補(bǔ)的作用,同時(shí)也在商品搜索、地標(biāo)檢索、商標(biāo)查重等商用場(chǎng)景中起到了突出的作用。
  深度學(xué)習(xí)技術(shù)在最近幾年內(nèi)呈現(xiàn)出了非常引人注目的研究進(jìn)展。在圖像內(nèi)容表征方面,基于深度學(xué)習(xí)的圖像表征(簡(jiǎn)稱為深度表征)更是在眾多的計(jì)算機(jī)視覺任務(wù)中表現(xiàn)出了優(yōu)異的性能。而在深度學(xué)習(xí)的多種模型中,深度卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)則尤其擅長(zhǎng)于

3、對(duì)圖像的內(nèi)容進(jìn)行抽象與描述,在圖像檢索領(lǐng)域獲得了廣泛的關(guān)注與深入的研究。不同于傳統(tǒng)的圖像表征方式,深度表征側(cè)重于對(duì)圖像進(jìn)行語義層面的全局表達(dá),通過一個(gè)端到端的模型提取圖像中的重要信息,并使用緊湊的特征描述對(duì)圖像內(nèi)容進(jìn)行有效的描述。盡管現(xiàn)有的基于深度表征的圖像檢索方法已經(jīng)取得了令人矚目的檢索性能,但仍有一系列問題難以克服:(1)不同于傳統(tǒng)的基于局部視覺特征的表征方法,深度表征在語義層面對(duì)圖像進(jìn)行整體的刻畫,因而呈現(xiàn)出對(duì)局部細(xì)節(jié)表征不夠突出

4、,且對(duì)圖像空間位置、幾何形變比較敏感的特點(diǎn);(2)基于局部表征的方法可以利用局部特征之間的空間關(guān)系對(duì)圖像匹配進(jìn)行幾何校驗(yàn),以實(shí)現(xiàn)更加精確的匹配,而深度表征則難以利用這一性質(zhì)對(duì)檢索性能進(jìn)行增強(qiáng);(3)現(xiàn)有的方法多使用具有人工標(biāo)注的公共基準(zhǔn)數(shù)據(jù)集對(duì)檢索算法的性能進(jìn)行驗(yàn)證,無法實(shí)現(xiàn)對(duì)任意查詢實(shí)時(shí)響應(yīng)的檢索質(zhì)量評(píng)估,不便于搜索引擎根據(jù)需要對(duì)檢索結(jié)果進(jìn)行修正。
  針對(duì)以上問題,本論文的研究?jī)?nèi)容圍繞著基于深度表征的圖像檢索技術(shù)進(jìn)行展開,包括

5、如何構(gòu)造良好的表征方式,如何對(duì)檢索結(jié)果進(jìn)行性能增強(qiáng),以及如何對(duì)檢索結(jié)果進(jìn)行有效的實(shí)時(shí)評(píng)估。論文的創(chuàng)新點(diǎn)包括以下幾點(diǎn):
  (1)論文提出一種基于通用目標(biāo)檢測(cè)技術(shù)的深度表征方式,可充分結(jié)合深度學(xué)習(xí)的語義表征能力與圖像顯著區(qū)域的判別能力。首先,本文使用通用物體檢測(cè)子在圖像中檢測(cè)出少量最有可能包含物體的區(qū)域,然后在這些區(qū)域中提取深度表征。同時(shí)為了對(duì)區(qū)域中的局部屬性進(jìn)行描述,本文在其中提取局部不變特征,并與深度表征進(jìn)行融合,可實(shí)現(xiàn)更加豐富

6、的圖像表征。
  (2)論文提出在深度表征層面進(jìn)行數(shù)據(jù)庫增強(qiáng)與查詢結(jié)果重排序,分別在線下索引階段與線上查詢階段,以極小的計(jì)算與存儲(chǔ)開銷對(duì)檢索性能進(jìn)行增強(qiáng)。在索引階段,本文利用數(shù)據(jù)庫圖像之間的相互關(guān)系,通過鄰域信息實(shí)現(xiàn)無監(jiān)督的特征更新,使得獲得的特征具有更好的檢索性能。在查詢階段,本文提出對(duì)初始檢索結(jié)果進(jìn)行殘差表達(dá),充分利用查詢特征的鄰域信息,對(duì)檢索結(jié)果進(jìn)行重排序。
  (3)論文提出一種基于檢索結(jié)果相關(guān)性的方法對(duì)檢索質(zhì)量進(jìn)行

7、自動(dòng)評(píng)估,并實(shí)現(xiàn)線上多檢索結(jié)果選優(yōu)等應(yīng)用。對(duì)每個(gè)檢索結(jié)果,本文通過其深度表征之間的相關(guān)性構(gòu)造一特征矩陣,并使用卷積神經(jīng)網(wǎng)絡(luò)對(duì)檢索質(zhì)量進(jìn)行回歸學(xué)習(xí)。由多種表征方式獲得的相關(guān)性矩陣可以拼接在一起,實(shí)現(xiàn)基于多特征融合的質(zhì)量評(píng)估方法。
  本文從深度表征出發(fā),分別在特征構(gòu)造、線下索引、線上重排、質(zhì)量評(píng)估等各方面對(duì)圖像檢索技術(shù)進(jìn)行充分而全面的研究。論文分別從方法層面、實(shí)驗(yàn)層面與應(yīng)用層面對(duì)所提出的方法進(jìn)行闡述與驗(yàn)證,充分證明方法的可靠性與實(shí)用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論