仿生視覺模型關鍵技術研究及應用.pdf_第1頁
已閱讀1頁,還剩177頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、認清“何處有何物”是人類視覺要解決的核心問題。生理學研究發(fā)現(xiàn),人類視覺系統(tǒng)中存在著兩條不同的視覺通路分別處理“何處”和“何物”的問題。本文正是以兩條視覺通路為依據(jù),結(jié)合腦科學和認知科學的研究成果,利用生物學提供的細節(jié)作為約束與指引,把視覺當作一個認知計算問題,圍繞生物視覺仿真建模及應用過程中的若干技術問題和難點展開研究,以機器學習的方法模仿生物視覺的運行方式,構建人類認知的視覺模型,解決面臨的實際問題。本文的主要工作和創(chuàng)新點如下:

2、>  第一,本文提出了一個生物啟發(fā)的、增量式的室外場景分類模型。本文利用初級視覺特征來表征場景內(nèi)容,結(jié)合自主心智發(fā)育理論,采用增量式分層判別回歸樹模擬人類視覺記憶的產(chǎn)生和再憶過程。與傳統(tǒng)的仿生室外場景分類方法相比,本文所提出的模型可以通過與環(huán)境的實時交互自動學習周邊場景的信息,產(chǎn)生知識和記憶,并以動態(tài)的方式更新記憶模塊,它具有增量式在線學習能力,拓展性強。公用數(shù)據(jù)集上的實驗結(jié)果表明,在不同數(shù)目訓練樣本的情況下,本文方法對于公用數(shù)據(jù)集中場

3、景的分類準確率都接近100%,它不僅可以提高機器視覺系統(tǒng)判別場景的正確率,而且顯著減少了訓練代價。
  第二,本文提出了基于原型物體和記憶機制的視覺顯著度計算方法。在研究是什么因素影響視覺顯著度的問題上,結(jié)合生物學對大腦記憶機制研究的新發(fā)現(xiàn),拓展了計算機視覺中“原型物體”的概念,將人、人臉、文本等具有語義信息的視覺特征與顯著性點、區(qū)域和泛物體特征融合在一起,構成原型物體,并以此作為影響顯著度的因素代表進行建模。實驗結(jié)果表明,充分地

4、利用原型物體特征,可以提高顯著度計算的準確性和有效性。
  第三,本文提出了兩種“原型物體特征一顯著度”映射函數(shù)的構造方法,實現(xiàn)了兩種融合策略,以解決視覺顯著度計算中原型物體特征在頂層指導作用下的融合問題。一個基于偏向競爭理論,用高斯過程擬合視覺記憶對原型物體特征的影響作用;另一個基于特征整合理論,用支持向量機模擬原型物體特征在頂層知識結(jié)構作用下的整合過程。由此提出了基于原型物體和高斯過程的視覺顯著度計算模型(POGP)以及基于原

5、型物體和支持向量機的視覺顯著度計算模型(POSVM),兩個視覺模型適用情況不同,但各自都具有一定的理論和現(xiàn)實意義。公用數(shù)據(jù)集上的仿真實驗結(jié)果表明,本文提出的視覺顯著度計算模型在定性和定量對比上都優(yōu)于其它先進模型,更符合人類的注視情況。
  第四,本文研究視覺預注意階段的建模問題,提出了基于流形學習的原型物體檢測方法。該方法模擬的是視覺信息在大腦中類似流形的處理方式,將進入人眼的視覺信息看作是一個抽象的低維度光滑流形,由于局部流形的

6、致密程度發(fā)生變化會破壞流形的平滑特性,而這種變化正是由與眾不同的部分樣本所決定的,因而,那些破壞流形平滑特性的點在圖像中就是顯著的,破壞性越強的像素點往往顯著值就越高。從這個角度出發(fā),本文以自底向上的方式檢測視覺顯著區(qū)域,并通過實驗驗證了該方法的有效性。
  第五,本文將仿生視覺模型應用到智能電網(wǎng)直升機巡檢的研發(fā)工作中。一方面,設計了一種基于設備顯著性的壓縮傳感成像方法以解決直升機巡檢中成像設備造價高的問題。另一方面,提出了一種基

7、于柵格理論的絕緣子檢測方法來模擬人類視覺系統(tǒng)的紋理檢測模式,以對圖像中的絕緣子進行定位。這些仿生視覺的探索和嘗試為電力系統(tǒng)的智能巡檢工作提供了一些新思路和新方法。
  綜上所述,本文針對人類視覺中的場景感知分類問題和視覺顯著度計算問題進行了研究,同時對基于仿生視覺的模型在電力設備智能巡檢中的應用做出了初步探索。本文通過仿真實驗證實了仿生視覺在解決視覺認知計算問題中的可行性和有效性。此外,本文的研究工作為仿生視覺領域開展更為廣泛深入

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論