版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、視覺視覺研究的準(zhǔn)備:基本原理與方法,視覺建模組狄曉斐2010.09.08,提綱,作者介紹 視覺是什么—導(dǎo)言 視覺研究的背景 信息處理系統(tǒng) 視覺的表象框架 總結(jié),提綱,作者介紹 視覺是什么—導(dǎo)言 視覺研究的背景 信息處理系統(tǒng) 視覺的表象框架 總結(jié),David Marr,英國神經(jīng)科學(xué)家、心理學(xué)家 教育背景Trinity College, Cambridge mathematics BATrinity C
2、ollege, Cambridge physiology PH.D. 把心理學(xué)、神經(jīng)生理學(xué)、人工智能融入到視覺處理模型 開創(chuàng)了計算神經(jīng)這門學(xué)科 1945-1980,提綱,作者介紹 視覺是什么—導(dǎo)言 視覺研究的背景 信息處理系統(tǒng) 視覺的表象框架 總結(jié),視覺是什么?,普通人(包括亞里士多德) 視覺是一處理過程:通過觀看,認(rèn)知有什么東西在什么地方 Marr 等人 視覺,Marr 方法論的要旨在于認(rèn)為視覺是一種復(fù)雜的
3、信息處理任務(wù),其目的是要把握對我們有用的外部世界的各種情況,并把他們表達(dá)出來。-------- T. Poggio,,信息處理,表象,信息處理的觀點(diǎn),應(yīng)信息處理任務(wù)和信息處理機(jī)器的需求而生 與我們周圍很多現(xiàn)象相關(guān)(進(jìn)化,思想等)特點(diǎn):完整的理解需要多個層次的解釋,,視覺,普通人的直接經(jīng)驗,腦科學(xué)家、生理學(xué)家和解剖學(xué)家細(xì)胞級的認(rèn)識,計算機(jī)工作者的程序?qū)崿F(xiàn),計算和計算機(jī)—不同層次,計算 具體的信息處理任務(wù) 計算機(jī)能在程序控制下進(jìn)
4、行運(yùn)算的機(jī)器 正在執(zhí)行某一特殊信息處理任務(wù)的機(jī)器 人腦 不僅僅是一臺計算機(jī),而且是一臺習(xí)慣于執(zhí)行某些相當(dāng)特殊的計算的計算機(jī),哲學(xué)依據(jù)--意識的表象理論,假設(shè)意識可以利用內(nèi)部表象系統(tǒng) 心理狀態(tài) 判斷內(nèi)部表象當(dāng)前正在說明的是哪些內(nèi)容 心理過程 如何得到這樣的內(nèi)部表象 這些內(nèi)部表象怎樣相互作用,視知覺研究的有用框架,本理論的出發(fā)點(diǎn),本書的內(nèi)容安排,第一部分導(dǎo)言(闡明思想方法)、研究方法、表象框架以及如何得到這個框架 第二部
5、分研究方法和理論框架在視覺中的體現(xiàn) 第三部分 自問自答,闡明研究方法背后的思想方法,提綱,作者介紹 視覺是什么—導(dǎo)言 視覺研究的背景 信息處理系統(tǒng) 視覺的表象框架 總結(jié),視覺研究的背景,早期階段 牛頓(1704) :顏色視覺 亥姆霍茲(1910):生理光學(xué) Wertheimer(1923):在像電影那樣依次呈現(xiàn)的圖像中發(fā)生的不是單個點(diǎn)的運(yùn)動,而是整體的(即“場”的)視運(yùn)動 心理學(xué)格式塔學(xué)派:描述整體的性質(zhì)(共同
6、性、差異性),闡明這些整體發(fā)生的“法則”,知覺心理學(xué)研究者,研究知覺的各種性質(zhì)和實現(xiàn)情況 顏色視覺的三原色理論 運(yùn)動知覺 ? 知覺的獨(dú)立模塊 Miles(1931) &Wallach and O’Connell(1953) B.Julesz 雙眼隨機(jī)點(diǎn)立體圖,心理物理學(xué)Campbell & Robson(1968) :在我們的知覺器官的前級,存在著若干個獨(dú)立的空間頻率調(diào)諧通道,即對圖像中以一個特定尺度或空間間隔
7、出現(xiàn)的光強(qiáng)度變化敏感的通道。 表象的提出及解釋 Shepard and Metzler(1971) : 意識的移動實驗,電生理學(xué)方法(還原論方法) 盛極一時 放大技術(shù)使記錄單個神經(jīng)元的活動成為可能 細(xì)胞“感受野”的概念Barlow :對單個神經(jīng)細(xì)胞的活動以及它對其他神經(jīng)細(xì)胞影響的反應(yīng)的描述是理解神經(jīng)系統(tǒng)功能的足夠完整的描述 終歸失敗 結(jié)構(gòu)的理解不能啟迪了解運(yùn)動系統(tǒng),不能指導(dǎo)寫程序 已有的研究重點(diǎn)在描述細(xì)胞行為而不解
8、釋為什么有這樣的行為,視區(qū)在做什么工作?哪些問題需要解釋?應(yīng)該在哪個層面上解釋? Barlow, Hubel and Wiesel: 特征檢測器 當(dāng)時視覺工作者們:從圖像中提取邊緣和線條非常棘手 經(jīng)驗方法:邊緣提取算子 分析受限場景(比如:積木世界) Land, McCann and Horn顏色視覺的銳化處理理論和 Horn 從明暗恢復(fù)形狀Marr and Poggio 存在一個層次獨(dú)立的對知覺過程中所完成的信息處理
9、任務(wù)進(jìn)行分析和理解,,提綱,作者介紹 視覺是什么—導(dǎo)言 視覺研究的背景 信息處理系統(tǒng) 視覺的表象框架 總結(jié),信息處理系統(tǒng)----表象和描述,表象 一種能把某些實體或某幾類信息表達(dá)清楚地形式系統(tǒng),以及說明該系統(tǒng)如何行使其職能的規(guī)則 描述 使用某一種表象描述一個給定實體的結(jié)果 表象的特點(diǎn) 使某些信息明確而另一些隱藏 舉例 阿拉伯?dāng)?shù)制、二進(jìn)制,信息處理系統(tǒng)---- 處理,從超級市場收銀機(jī)入手 這個裝置做什么?
10、 加法(加法的性質(zhì)) 為什么會這樣做? 約束條件 怎么做? 加法規(guī)則 物理實現(xiàn) 晶體管等器件,信息處理系統(tǒng)---- 三個層次,,三個層次間存在著一定的邏輯的因果關(guān)系,,這種關(guān)系很松散某些現(xiàn)象可以只在其中一個或兩個層次上進(jìn)行解釋,聯(lián)系與區(qū)別,信息處理系統(tǒng)----計算理論的重要性,構(gòu)成視覺基礎(chǔ)的計算的本質(zhì) 研究神經(jīng)元與理解視
11、覺 = 研究羽毛與理解飛行 執(zhí)行某個任務(wù)的程序與任務(wù)的理論的混淆 特殊機(jī)制解決特殊問題的解釋的發(fā)展 做什么與怎么做的理論差別的模糊 阻礙了人工智能和語言學(xué)的交流(Chomsky 轉(zhuǎn)移語法學(xué)的定位),信息處理系統(tǒng)----J.J.Gibson的方法,觀點(diǎn)腦是從我們置身于其中的流動著的能量的陣列中尋找并提取與環(huán)境有關(guān)的信息,神經(jīng)系統(tǒng)以某種方式與這些不變量諧振 優(yōu)點(diǎn)知覺問題:從感覺信息恢復(fù)外部世界有效性質(zhì)的問題缺點(diǎn)未能認(rèn)識到
12、像圖像表面這種物理不變因子的檢測是信息處理問題低估了這種檢測的困難,信息處理系統(tǒng)----哲學(xué)上探討知覺問題的傳統(tǒng),!?。?對知覺過程中的信息處理的復(fù)雜性沒有足夠的重視,Austin 《感覺和情感》 外部世界存在一個真實的形狀,通過視覺告訴人們這個真實形狀是不可能的,不存在這樣的規(guī)律和具體方法。,我們有辦法以任意一種精度描述這些形狀,也存在這樣的規(guī)律和方法!這正是視覺要解決的問題。,提綱,作者介紹
13、 視覺是什么—導(dǎo)言 視覺研究的背景 信息處理系統(tǒng) 視覺的表象框架 總結(jié),視覺的表象框架,視覺:一個處理過程,能從外部世界的圖像中得到一個既對觀察著有用又不受無關(guān)信息干擾的描述從一個表象獲得另一表象的一個映射視覺目的 決定了一個表象是否有效人類視覺的精華 物體的形狀表象和物體的用法、用途表象完全不同 即使人們不能理解物體用途,單靠視覺就能傳遞物體形狀的內(nèi)部描述人類視覺關(guān)注的是形狀、空間及空間位型,視覺的表象框架,圖
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論