圖像理解的關(guān)鍵問題和方法研究.pdf_第1頁
已閱讀1頁,還剩113頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、圖像理解是當(dāng)前計(jì)算機(jī)研究領(lǐng)域的熱點(diǎn)和難點(diǎn),其根本任務(wù)就是讓計(jì)算機(jī)正確解釋所感知的圖像場(chǎng)景以及場(chǎng)景中的內(nèi)容,圖像理解與計(jì)算機(jī)視覺、與人工智能有著密切的聯(lián)系,具有重要的理論研究意義和廣闊的應(yīng)用前景. 圖像理解具有鮮明的層次性,作為圖像理解的低層數(shù)據(jù)的是視覺信息,理論出發(fā)點(diǎn)是計(jì)算機(jī)視覺,作為圖像理解的高層數(shù)據(jù)是知識(shí)信息,理論依據(jù)出發(fā)點(diǎn)是人工智能.圖像理解中視覺數(shù)據(jù)和人類知識(shí)兩種類型的信息流貫穿圖像理解的整個(gè)過程,但是目前對(duì)這兩種類型的

2、數(shù)據(jù)和信息流的研究基本上是割裂的,忽略了知識(shí)和數(shù)據(jù)之間的融合,忽略了低層處理和高層分析的聯(lián)系. 本文從數(shù)據(jù)驅(qū)動(dòng)知識(shí)、知識(shí)指導(dǎo)數(shù)據(jù)這一圖像理解的核心問題出發(fā),從視覺信息分析處理與知識(shí)信息分析處理的結(jié)合部入手,著重研究圖像理解信息流中數(shù)據(jù)和知識(shí)的表示、存儲(chǔ)、分析和轉(zhuǎn)換,研究合適的視覺信息處理載體和知識(shí)信息處理方法,實(shí)現(xiàn)廣義目標(biāo)檢測(cè)識(shí)別、區(qū)域語義理解以及場(chǎng)景分析等圖像理解的主要任務(wù),形成新穎的圖像理解方法;同時(shí),研究圖像理解的結(jié)構(gòu)特性

3、,構(gòu)建新型的目標(biāo)空問關(guān)系模型和整體場(chǎng)景的分析模型,建立模型之間的約束反饋機(jī)制,體現(xiàn)理解的反饋和漸進(jìn)性,指導(dǎo)先驗(yàn)信息的獲取,并作用于低層的視覺數(shù)據(jù)處理分析,提高理解的速度和準(zhǔn)確性,初步形成新型、完整、有效、快速的圖像理解原型. 本文的主要工作如下: 1、研究了圖像理解中數(shù)據(jù)和信息表示的融合,概述了圖像理解中常見的信息表示方法,側(cè)重描述新的"知識(shí)"和"數(shù)據(jù)"兩種信息的融合和轉(zhuǎn)換手段,體現(xiàn)圖像理解中實(shí)體的認(rèn)知關(guān)系:研究了圖像理

4、解中視覺信息的提取問題,總結(jié)了圖像理解視覺特征的提取策略,建立了視覺像素的統(tǒng)計(jì)概率模型,在模型基礎(chǔ)上提出了一種新的目標(biāo)定位方法,對(duì)背景具有一定的抗背景干擾能力,并形成了對(duì)特征提取方法的有益補(bǔ)充. 2、研究了圖像理解中視覺信息的存儲(chǔ)與分析,針對(duì)圖像理解中的圖結(jié)構(gòu)模型載體分析問題,總結(jié)了圖模型中經(jīng)典的參數(shù)估計(jì)和概率推理方法以及在視覺分析中的應(yīng)用,提出了一種基于目標(biāo)空間關(guān)系的無向圖結(jié)構(gòu)模型,討論了新模型中的參數(shù)學(xué)習(xí)問題,推導(dǎo)出迭代公式

5、,進(jìn)行場(chǎng)景目標(biāo)分析,形成對(duì)圖像理解認(rèn)知載體的豐富和完善. 3、研究了圖像理解中視覺信息的概念認(rèn)知?jiǎng)澐?針對(duì)廣義目標(biāo)檢測(cè)識(shí)別方法問題,提出了基于共享特征的層次Boosting目標(biāo)檢測(cè)識(shí)別方法,可同時(shí)進(jìn)行多類目標(biāo)檢測(cè)和識(shí)別,在檢測(cè)率近似保持不變的情況下,提高了目標(biāo)的識(shí)別率,縮短了分類的搜索時(shí)間,體現(xiàn)了圖像理解的漸進(jìn)性,形成了視覺信息向知識(shí)信息的轉(zhuǎn)換. 4、研究了圖像理解中的知識(shí)處理和分析,針對(duì)圖像理解中的區(qū)域分析和語義標(biāo)記問

6、題,提出了基于粗糙集合的區(qū)域分割方法和知識(shí)庫約簡方法,對(duì)場(chǎng)景中視覺屬性較為一致的區(qū)域具有較好的分割效果,同時(shí)在保持概念分類能力不變的情況下形成了知識(shí)的有效約簡,一定程度上避免的噪聲數(shù)據(jù)的干擾,提高了語義標(biāo)記和區(qū)域分析的合理性,實(shí)現(xiàn)了數(shù)據(jù)和知識(shí)的融合. 5、初步研究了場(chǎng)景分類的基本方法,提出的高斯概率統(tǒng)計(jì)模型對(duì)場(chǎng)景分類具有一定的有效性,同時(shí),驗(yàn)證了場(chǎng)景分類信息對(duì)目標(biāo)分析的指導(dǎo)和約束作用,提高了目標(biāo)分析的準(zhǔn)確度,體現(xiàn)了圖像理解中反饋

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論