版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、機(jī)器視覺(computerVision)是研究如何使計(jì)算機(jī)對圖像數(shù)據(jù)產(chǎn)生智能化感知的一門科學(xué)。物體識別在機(jī)器視覺領(lǐng)域?qū)儆谝豁?xiàng)基礎(chǔ)研究,對圖像理解目標(biāo)的實(shí)現(xiàn)起著至關(guān)重要的作用。有效的物體識別算法是包括圖像檢索、視頻監(jiān)控、醫(yī)學(xué)圖像處理、工業(yè)機(jī)器人在內(nèi)等眾多應(yīng)用領(lǐng)域的前提與基礎(chǔ)。物體識別技術(shù)推動著工業(yè)、醫(yī)學(xué)、交通、國防等領(lǐng)域朝著自動化、智能化方向快速前進(jìn),并有可能從根本上改變它們的發(fā)展模式;隨著相關(guān)科學(xué)技術(shù)在應(yīng)用層面的普及,它甚至走進(jìn)了人們的
2、衣食住行當(dāng)中。然而,物體識別技術(shù)仍然處在一個(gè)快速發(fā)展的初級階段,或許對于某些特定的應(yīng)用可能有一些專門的解決方案,但是一個(gè)通用的魯棒的理論和算法框架尚未出現(xiàn)。本文討論了筆者在這個(gè)課題上的一些研究工作。
首先,第3章提出一個(gè)簡明的基于形狀點(diǎn)特征的物體識別算法。在該算法框架中,對傳統(tǒng)的形狀上下文描述子做了兩方面的改進(jìn),并且基于改進(jìn)的形狀特征在圖像中尋找局部匹配。通過一種通用的霍夫變換投票過程,將匹配結(jié)果組織起來產(chǎn)生物體檢測的假設(shè)
3、。特征改進(jìn)的主要目的是為了避免背景對物體形狀特征所產(chǎn)生的干擾,以及使特征對物體形變有更好的容忍度。這種利用先驗(yàn)?zāi)P驮趫D像中尋找可能物體假設(shè)的過程是一種自頂向下的識別過程,它一般會有較高的識別率,但是精度不夠理想。為了有效提高識別的精度,在第一步識別的基礎(chǔ)上使用分類器方法對識別假設(shè)進(jìn)一步辨別真?zhèn)?并結(jié)合自底向上的圖像分割信息獲取物體在圖像中的前景區(qū)域。
背景雜物一直是影響物體識別性能的重要因素?;谥行狞c(diǎn)和鄰域的圖像特征由于
4、背景雜物的存在,往往導(dǎo)致有用信息被嚴(yán)重破壞。大部分的識別方法會采用學(xué)習(xí)的策略,通過海量的訓(xùn)練數(shù)據(jù)來教會計(jì)算機(jī)記住特征中的哪些維度是重要的,哪些維度又應(yīng)該是忽略的。第4章中提出了一種新的方法,可以有效克服背景信號的干擾,并且對某一類物體只使用單一的訓(xùn)練樣本。使用自底向上的輪廓線作為基本的圖像元素,并采用很大的領(lǐng)域范圍來提取形狀特征是本方法的一個(gè)特色。選擇很大的領(lǐng)域范圍事實(shí)上加重了背景雜物對有用信號的干擾,對一些形狀狹長的物體來說尤為嚴(yán)重。
5、為了解決背景干擾物問題,本文中的方法模仿人類視覺中的選擇機(jī)制對輪廓線進(jìn)行組合選擇,利用選擇出來的輪廓線生成形狀特征并與模型進(jìn)行匹配。從實(shí)驗(yàn)結(jié)果可以看到,通過該方法選擇出來的特征可以很好地從特征維度中去掉背景信號,達(dá)到最終的識別目的。在選擇匹配的過程中保證了輪廓線底層語義的完整性。
物體識別的層次不僅僅是判斷圖像中是否存在某類物體,或者物體在圖像中所處的位置等等,還包括對物體更高層次的理解,姿態(tài)分析便是其中之一。第5章提出了
6、一種同樣是基于選擇的姿態(tài)分析算法。不僅對圖像中的輪廓線進(jìn)行選擇,對模型姿態(tài)參數(shù)也進(jìn)行選擇。通過匹配從圖像中選擇出來的輪廓線與從模型中選擇出來的姿態(tài)來判斷其合理性。實(shí)驗(yàn)中,該算法被應(yīng)用在一組棒球運(yùn)動員的圖像數(shù)據(jù)庫上,并取得了很好的效果,可以得到較為精準(zhǔn)的姿態(tài)判斷。
第6章討論的內(nèi)容是物體識別的一個(gè)子課題:輪廓線聚類。不同于利用輪廓線選擇進(jìn)行自頂向下的物體識別(本質(zhì)上是利用模型把前景輪廓線聚為一類),這里的輪廓線聚類仍然是一個(gè)
7、自底向上的過程。文中的方法期望把輪廓線進(jìn)行某種聚類以得到更高一層的圖像信號表示。方法選取了另外一張相關(guān)的圖片(深度相關(guān)、運(yùn)動相關(guān)、相似圖片)來幫助完成這個(gè)目標(biāo)。
在交通領(lǐng)域中,街道場景一直是視覺算法應(yīng)用的重要場合。第7章利用一種混合的識別方法對街道場景中的物體進(jìn)行了識別。這些物體包括交通燈、路標(biāo)、路燈、消防栓、樹木以及汽車。由于這幾類物體內(nèi)在的屬性并不一樣(有的物體是剛性物體,有的是由紋理組成,有的則是半剛性或者容易變形)
8、,本文因地制宜地采用了不同的方法來檢測不同的物體類別。文中列出了對這幾類物體的檢測結(jié)果。
形狀特征的提取主要基于邊界信息。為了能夠得到清楚的邊界信息,從而增強(qiáng)形狀特征的描述能力,第8章提出了一種能夠自適應(yīng)調(diào)節(jié)參數(shù)的圖像擴(kuò)散算法。該算法的目標(biāo)是在保持圖像結(jié)構(gòu)的前提下去除圖像的噪聲,特別是一些隨機(jī)噪聲與紋理噪聲。本文設(shè)計(jì)了一種新的核函數(shù)來增強(qiáng)圖像結(jié)構(gòu)的保持性能,并且在實(shí)現(xiàn)中利用自底向上的圖像分割信息自適應(yīng)地調(diào)節(jié)核函數(shù)的參數(shù)。從
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 物體旋轉(zhuǎn)運(yùn)動視覺識別方法的研究.pdf
- 基于機(jī)器視覺的車型識別方法研究與實(shí)踐.pdf
- 基于機(jī)器視覺的害蟲識別方法研究.pdf
- 基于機(jī)器視覺的樹上柑桔識別方法研究.pdf
- 基于機(jī)器視覺的麥田雜草識別方法研究.pdf
- 基于機(jī)器視覺的圖像處理與特征識別方法的研究.pdf
- 基于機(jī)器視覺的軌道缺陷識別方法研究.pdf
- 黑變熟對蝦的機(jī)器視覺識別方法研究.pdf
- 基于機(jī)器視覺的電容屏缺陷識別方法研究.pdf
- 基于機(jī)器視覺的黑瓜子翹板識別方法研究.pdf
- 基于機(jī)器視覺的TFDS典型故障識別方法研究.pdf
- 基于機(jī)器視覺的場景目標(biāo)識別方法研究.pdf
- 基于機(jī)器視覺的柑橘水果外形識別方法研究.pdf
- 基于機(jī)器視覺的帶鋼表面缺陷檢測與識別方法研究.pdf
- 基于機(jī)器視覺和RFID的物品識別方法研究.pdf
- 基于機(jī)器視覺的全景圖像恢復(fù)與景物識別方法研究.pdf
- 基于機(jī)器視覺的農(nóng)田害蟲自動識別方法研究.pdf
- 基于車載機(jī)器視覺的安全帶識別方法研究.pdf
- 人民幣紙幣面額的機(jī)器視覺識別方法研究.pdf
- 基于機(jī)器視覺的煙葉梗莖檢測與煙葉類型識別方法研究.pdf
評論
0/150
提交評論