版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、人自出生以來(lái),即靠視覺(jué)來(lái)觀察周圍環(huán)境并獲取知識(shí),人類有90%的信息來(lái)自視覺(jué),視覺(jué)的損傷給人類的生活帶來(lái)極大的不幸。隨著全球人口的老齡化,盲人和視力低下的人數(shù)不斷攀升。因此研究人員一直在不斷探索用其他的感覺(jué)器官來(lái)獲得視覺(jué)信息的方法。通過(guò)其他感覺(jué)器官獲得視覺(jué)信息的關(guān)鍵是將視覺(jué)信息變成其他感覺(jué)器官能夠感知的信號(hào),完成這一功能的裝置即為導(dǎo)盲系統(tǒng)。
隨著計(jì)算機(jī)視覺(jué)技術(shù)的進(jìn)步和數(shù)字圖像處理算法的完善,視頻輸入聽覺(jué)顯示(Video Inpu
2、t and Auditory Display,VIAD)的導(dǎo)盲系統(tǒng)以其輸入信息豐富、無(wú)創(chuàng)傷等優(yōu)點(diǎn),得到了研究人員的廣泛關(guān)注。而現(xiàn)有的VIAD導(dǎo)盲系統(tǒng)的核心算法主要存在下面兩方面的問(wèn)題:第一,多數(shù)以障礙物的檢測(cè)為核心,忽視了圖像中非障礙物的信息,也忽略了盲人對(duì)“聽”到的信息的推理能力;第二,多數(shù)算法以圖像的初級(jí)特征為映射對(duì)象,這種初級(jí)特征映射的方式使合成的聲音很復(fù)雜,盲人很難學(xué)習(xí)和掌握。
針對(duì)上述問(wèn)題,本文以視頻序列中的靜態(tài)圖像
3、特征為映射對(duì)象,研究對(duì)于VIAD導(dǎo)盲系統(tǒng)更加有效的圖像處理方法和聽覺(jué)顯示方式,降低盲人學(xué)習(xí)和使用導(dǎo)盲系統(tǒng)的難度,為盲人提供更加豐富的圖像信息。本文主要完成了下列工作:
(1)針對(duì)圖像分割中目標(biāo)類和背景類數(shù)目的不平衡性,提出了具有動(dòng)態(tài)懲罰因子的支持向量機(jī)(Support Vector Machine with Dynamic Penalty Factors,DC-SVM)模型。將懲罰因子的選擇與每一類的訓(xùn)練樣本占總訓(xùn)練樣本的比率
4、直接相關(guān)。該模型能夠有效提高數(shù)目較少的類的分類正確率。應(yīng)用DC-SVM模型進(jìn)行圖像分割,去除圖像中的背景信息,將圖像中的目標(biāo)映射為復(fù)合頻率的聲音信號(hào)。盲人經(jīng)過(guò)學(xué)習(xí)和訓(xùn)練之后,能夠通過(guò)聽這種聲音感知來(lái)自外界環(huán)境的主要信息。
(2)針對(duì)各向異性擴(kuò)散沖擊濾波器(Anisotropic Diffusion with Shock Filter,ADSF)模型在圖像增強(qiáng)過(guò)程中產(chǎn)生的圖像細(xì)節(jié)模糊的問(wèn)題,提出了一種梯度控制的各向異性擴(kuò)散沖擊濾
5、波器(Gradient Controlled Anisotropic Diffusion with ShockFilter, GCADSF)模型。該模型通過(guò)一個(gè)隨梯度的模單調(diào)遞減的指數(shù)函數(shù)控制擴(kuò)散項(xiàng)沿垂直于圖像梯度方向的擴(kuò)散程度,在增強(qiáng)邊緣、濾除噪聲的同時(shí)很好的保護(hù)了圖像細(xì)節(jié)信息。為了滿足多尺度樂(lè)音顯示算法對(duì)圖像的要求,將提升小波變換與GCADSF算法相結(jié)合,實(shí)現(xiàn)了圖像的降維增強(qiáng)。降維增強(qiáng)后的圖像通過(guò)多尺度樂(lè)音顯示算法映射為電子音符。這
6、種導(dǎo)盲算法聽感良好,長(zhǎng)時(shí)間使用不會(huì)造成疲勞。
(3)根據(jù)初級(jí)視覺(jué)皮層的感受野特性,提出了一種基于邊緣基函數(shù)重構(gòu)的圖像邊緣檢測(cè)方法。將圖像分解為ICA基函數(shù)的線性組合,用典型的邊緣圖像進(jìn)行訓(xùn)練,獲得ICA邊緣基函數(shù),利用邊緣基函數(shù)重構(gòu)獲得邊緣圖像。由于ICA基函數(shù)很好的模擬了初級(jí)視覺(jué)皮層的感受野特性,因此這種方法檢測(cè)的邊緣更加符合人眼的視覺(jué)特性。將小波變換和Canny算法相結(jié)合,提出了一種基于小波變換和Canny算法的邊緣檢測(cè)方
7、法。對(duì)圖像小波變換的低頻成分應(yīng)用Canny算法檢測(cè)圖像邊緣,在降低圖像維度的同時(shí),有效的抑制了圖像中噪聲的影響。二值化的邊緣圖像通過(guò)MIDI樂(lè)音顯示算法映射為不同音色和音調(diào)的MIDI樂(lè)音。這種導(dǎo)盲算法在幫助盲人識(shí)別圖像中的幾何圖形時(shí)取得了較高的識(shí)別率。
(4)將Itti視覺(jué)注意模型引入到導(dǎo)盲算法的研究中,認(rèn)為引起人的視覺(jué)注意的區(qū)域(Region of Interest,ROI)包含圖像的重要信息。提取這些ROI區(qū)域的顏色、位置
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 機(jī)載顯示系統(tǒng)關(guān)鍵技術(shù)研究.pdf
- 基于HRTF的虛擬聽覺(jué)系統(tǒng)的關(guān)鍵技術(shù)研究.pdf
- 視頻監(jiān)控系統(tǒng)的關(guān)鍵技術(shù)研究.pdf
- 全景視頻系統(tǒng)若干關(guān)鍵技術(shù)研究.pdf
- CSCW視頻子系統(tǒng)關(guān)鍵技術(shù)研究.pdf
- 面向安防監(jiān)控視頻感知噪聲盲檢測(cè)的關(guān)鍵技術(shù)研究.pdf
- 彩色立體顯示關(guān)鍵技術(shù)研究.pdf
- 多輸入多輸出系統(tǒng)的關(guān)鍵技術(shù)研究.pdf
- PCMA信號(hào)盲解調(diào)關(guān)鍵技術(shù)研究.pdf
- 視頻監(jiān)控系統(tǒng)中的關(guān)鍵技術(shù)研究
- 視頻點(diǎn)播系統(tǒng)關(guān)鍵技術(shù)研究.pdf
- 無(wú)線視頻監(jiān)控系統(tǒng)關(guān)鍵技術(shù)研究.pdf
- 鐵路視頻監(jiān)控系統(tǒng)關(guān)鍵技術(shù)研究.pdf
- 實(shí)時(shí)視頻拼接系統(tǒng)關(guān)鍵技術(shù)研究.pdf
- 虛擬聽覺(jué)空間實(shí)現(xiàn)中的關(guān)鍵技術(shù)研究.pdf
- 視頻監(jiān)控系統(tǒng)中的關(guān)鍵技術(shù)研究.pdf
- 藍(lán)牙視頻傳輸系統(tǒng)關(guān)鍵技術(shù)研究.pdf
- 基于BACnet 的視頻監(jiān)控系統(tǒng)關(guān)鍵技術(shù)研究.pdf
- 全景視頻增強(qiáng)現(xiàn)實(shí)系統(tǒng)關(guān)鍵技術(shù)研究.pdf
- 視頻摘要關(guān)鍵技術(shù)研究.pdf
評(píng)論
0/150
提交評(píng)論