基于上下文的圖像標(biāo)注研究.pdf_第1頁
已閱讀1頁,還剩132頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、計(jì)算視覺中一個(gè)基本的任務(wù)是通過統(tǒng)計(jì)建模來預(yù)測靜態(tài)圖像中的未知特性。如果圖像中的這些未知特性能夠被描述成一系列離散的隨機(jī)變量,那么對應(yīng)的視覺問題就可以歸結(jié)為圖像標(biāo)注或者圖像理解。由于自然圖像中的物體存在大量的類內(nèi)和類間差異,導(dǎo)致計(jì)算機(jī)視覺中的圖像理解和標(biāo)注成為一個(gè)非常具有挑戰(zhàn)性的任務(wù)。最主要的挑戰(zhàn)和困難集中在以下三個(gè)方面:1)自然圖像中存在的各種復(fù)雜視覺模式,如何對其進(jìn)行建模是首先需要研究的問題;2)對不同類別的物體如何學(xué)習(xí)得到最有判別力

2、的特征以及對模型參數(shù)進(jìn)行估計(jì)是第二個(gè)需要研究的問題;3)在給定的學(xué)習(xí)模型下,如何通過優(yōu)化算法計(jì)算得到最優(yōu)解。本論文基于統(tǒng)計(jì)學(xué)的理論,對場景標(biāo)注與理解進(jìn)行建模、學(xué)習(xí)和推理,重點(diǎn)研究了計(jì)算機(jī)視覺中的以下問題:1)如何有效地對圖像中有明顯紋理特性和結(jié)構(gòu)特性的物體進(jìn)行建模?2)什么樣的上下文信息能夠有效的表達(dá)圖像中各類物體之間的相互關(guān)系?3)如何從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)得到圖像的模型以及對圖像上下文信息的表達(dá)?4)如何設(shè)計(jì)一種快速的推理算法得到最終的圖

3、像標(biāo)注結(jié)果,并同時(shí)保證得到的結(jié)果是解空間中的全局最優(yōu)解?5)圖像標(biāo)注與物體識(shí)別之間存在怎樣的關(guān)系?
  本文的工作緊緊圍繞場景標(biāo)注與理解這一核心命題展開。為回答以上提出的問題,從以下四個(gè)方面展開研究:
  (1)一般而言,圖像中的底層信息(如紋理和顏色)也可以用來識(shí)別物體類別(如水、天空和樹木等)。作為中層視覺的主要特性,形狀信息對于自然場景中包含的結(jié)構(gòu)類物體(如馬、牛和車等)而言是一種非常魯棒的表達(dá)方式?;谛螤钅0鍖D像

4、對應(yīng)的區(qū)域進(jìn)行語義分割不僅能夠約束對應(yīng)的像素具有一致的語義標(biāo)簽,還能提高對抗噪聲的魯棒性。除此之外,圖像中的上下文信息可進(jìn)一步提高標(biāo)注系統(tǒng)的性能。這類信息往往約束高層語義之間的共生關(guān)系和約束關(guān)系。因此,本文設(shè)計(jì)了一種有效,靈活和魯棒的概率標(biāo)注模型――動(dòng)態(tài)混合馬爾科夫隨機(jī)場模型,結(jié)合不同層次上的圖像特征。這些特征彼此約束,互為補(bǔ)充,以達(dá)到對輸入圖像產(chǎn)生一致性標(biāo)注輸出的結(jié)果。
  (2)眾所周知,圖像中不同類別的物體往往具有不一致的特

5、征屬性。即使是使用不同圖像特征來建模物體,這些特征在物體的識(shí)別過程中往往具有不同的重要程度,即判別力的高低。本文提出一種自動(dòng)的學(xué)習(xí)算法能夠區(qū)分不同特征的重要性,并且在建立物體模型的過程中優(yōu)先選取判別力高的特征。與此同時(shí),通過更新模型中特征的權(quán)重系數(shù)使得當(dāng)前模型與真實(shí)模型具有相同的邊緣分布。隨著一系列特征的引入與相應(yīng)特征系數(shù)的更新,使得學(xué)習(xí)得到的模型逼近每類物體的真實(shí)分布。
  (3)學(xué)習(xí)場景標(biāo)注模型一般通過離線學(xué)習(xí)的方式,而用學(xué)習(xí)

6、得到的模型來推理得到場景標(biāo)注的結(jié)果一般使用在線推理的方式。這需要設(shè)計(jì)高效的推理算法,既能夠滿足大尺度數(shù)據(jù)集標(biāo)注的需要,也能滿足實(shí)際標(biāo)注系統(tǒng)的應(yīng)用需求。本文在動(dòng)態(tài)混合馬爾科夫隨機(jī)場模型的基礎(chǔ)上,設(shè)計(jì)了一種高效的推理算法――組合采樣算法。除此之外,本文還證明了在保證獲得很好的標(biāo)注性能的前提下,組合采樣算法能夠收斂到全局最優(yōu)解,即對應(yīng)后驗(yàn)概率最大的標(biāo)注結(jié)果。
  (4)上下文特征不僅僅用于約束圖像標(biāo)記之間的共生關(guān)系和約束關(guān)系,還具有多尺

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論