

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、計算機視覺是人工智能領(lǐng)域的核心問題之一,它的目標(biāo)是讓計算機擁有人的視覺能力,也就是讓機算計像人一樣理解現(xiàn)實世界中的圖像。計算機視覺在醫(yī)學(xué)、工業(yè)、軍事、航天等領(lǐng)域擁有廣泛的應(yīng)用。但是,根據(jù)人的視覺占用至少60%的人腦資源這個事實,計算機視覺在學(xué)術(shù)界被認(rèn)為是“人工智能完全”問題,或者至少是“人工智能困難”問題。在眾多計算機視覺的問題中,廣義的物體識別,即在任意環(huán)境下識別任意物體,又是最核心的問題之一??偟膩碚f,物體識別是讓計算機自動地把圖像
2、中的物體分類。這是個非常具有挑戰(zhàn)性的問題,它也是很多應(yīng)用問題的最緊要瓶頸所在,比如圖片搜索問題。雖然世界上諸如麻省理工、斯坦福、耶魯、劍橋、普林斯頓等眾多非常有實力的研究機構(gòu)已經(jīng)研究這個問題多年,廣義的物體識別問題還遠(yuǎn)遠(yuǎn)沒有得到很好的解決。但是,從機器學(xué)習(xí)的角度來說,物體識別的問題至少在一定程度上是可行的。準(zhǔn)確的說,只要能合適地抽取圖像特征、合適地描述物體和找到合適的分類模型,實現(xiàn)一個能滿足實際應(yīng)用的物體識別系統(tǒng)是可行的。
3、 在這篇論文里,我們將介紹一個基于機器學(xué)習(xí)的物體識別系統(tǒng)原型。這個原型系統(tǒng)包括三個部分:物體分割子系統(tǒng)、物體描述子系統(tǒng)和一個分類器。在這三個要點上,我們創(chuàng)造性地提出了自己的方法:一個基于混合圖模型(HGM)的物體分割算法、一個基于拉多表示的物體描述算法(RRFD)和一個稱為神經(jīng)編碼分類器(NCC)的分類算法。隨后,我們對這個基本原型系統(tǒng)做一些改進(jìn)工作:包括基于低秩描述(LRR)的圖像聚類算法、基于局部線性轉(zhuǎn)換(LLT)的多標(biāo)簽分類算法和
4、基于反饋嵌入(FE)的大規(guī)模相似圖像查找技術(shù)。具體來說,本文的創(chuàng)新點有:
我們提出了用于一般半指導(dǎo)分類的HGM(Hybrid Graph Model,混合圖模型),并建立了一個有效的物體自動分割方法。根據(jù)我們所知,我們是第一個將混合圖引入機器學(xué)習(xí)的人。不同于傳統(tǒng)的物體分割方法,我們的基于HGM的方法是自動的,即不需要手動分割好的訓(xùn)練數(shù)據(jù)。這使得我們的物體識別系統(tǒng)更加實用。
我們提出了基于Radon變換的物體描
5、述算法,稱為RRFD(Radon Repre-sentation Based Feature Description,基于拉多表示的特征描述)。在物體已經(jīng)從圖像中分割出來后,RRFD可以把物體的形狀、顏色、紋理等信息綜合地集成到一個維度比較低的特征向量中去,并由此而實現(xiàn)精確的物體識別。除此之外,RRFD也可以作為一個一般的特征描述算法,它可以描述任意一個圖像區(qū)域。
物體識別中的最后一個步驟是對特征向量進(jìn)行分類。我們提出了基
6、于神經(jīng)編碼的分類器,稱為NCC(Neural Coding Classifier,神經(jīng)編碼分類器)。和傳統(tǒng)的諸如SVM的分類算法相比,NCC不僅能夠很好地處理測試數(shù)據(jù)與訓(xùn)練數(shù)據(jù)同分布的情況,也能更好地處理測試數(shù)據(jù)與訓(xùn)練數(shù)據(jù)概率分布不同的情況。實驗結(jié)果表明,在測試數(shù)據(jù)和訓(xùn)練數(shù)據(jù)概率分布相同的情況下,NCC的分類精度度略微超過SVM;在測試數(shù)據(jù)和訓(xùn)練數(shù)據(jù)概率分布不同的情況下,NCC可以顯著地超過SVM。
當(dāng)一張圖像中可能含有多
7、個類的物體時,物體識別中對應(yīng)的分類問題就是一個MLC(Multi-Label Classification,多標(biāo)簽分類)問題。多標(biāo)簽分類問題可以用MOR(Multi Output Regression,多輸出回歸)模型來處理。我們提出了用于定義回歸分析中損失函數(shù)的LLT(Locally Linear Transformation,局部線性轉(zhuǎn)換)機制,并在SVR(Support Vector Regression,支持向量回歸)框架下提出
8、了一種結(jié)合LLT和SVR的多輸出回歸算法,即所謂的LLT-SVR。LLT-SVR即提供了一種很好的多輸出回歸分析工具,又為我們的物體識別系統(tǒng)提供了一種有效的多標(biāo)簽分類器。
為了提高物體識別系統(tǒng)的實用性,我們需要一種有效的圖像聚類機制。我們首次提出了用于處理矩陣數(shù)據(jù)信號的LRR(Low-Rank Representation,低秩表示)。LRR是一種新的壓縮傳感(CompressedSensor)技術(shù),和傳統(tǒng)的SR(Spar
9、se Representation,稀疏表示)相比,LRR能更好的描述數(shù)據(jù)的整體結(jié)構(gòu),從而在諸如圖像聚類之類的數(shù)據(jù)聚類問題中,LRR有明顯的優(yōu)勢?;贚RR,我們提出了一種有效的圖像聚類算法。除圖像聚類外,LRR子空間分割算法也是一種基本的數(shù)據(jù)聚類法。更重要的是,LRR首次提出了“低秩”(LowRank)準(zhǔn)則。LRR不但在機器學(xué)習(xí)領(lǐng)域產(chǎn)生巨大的理論影響,而且在計算機視覺和圖像處理領(lǐng)域有著廣泛的應(yīng)用。
為了提高物體識別系統(tǒng)的
10、運行速度,我們需要一種高速的相似圖像查找技術(shù)。我們提出了稱為FE(Feedback Embedding,反饋嵌入)的數(shù)據(jù)降維算法?;贔E,我們可以設(shè)計出一種有效的語義哈希算法,進(jìn)而實現(xiàn)在大規(guī)模物體識別系統(tǒng)中的快速相似圖像查找。
除研究物體識別和一些相關(guān)的機器學(xué)習(xí)問題(比如分類、聚類和降維等)外,本文也對一些根本的科學(xué)問題進(jìn)行了討論。比如我們探究大腦是如何處理視覺信號的,并提出了一個新穎的神經(jīng)編碼假設(shè),即大腦是基于信號重構(gòu)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于半監(jiān)督學(xué)習(xí)的物體識別.pdf
- 基于機器視覺的物體識別定位系統(tǒng)的研究.pdf
- 基于智能交互的物體識別增量學(xué)習(xí)研究.pdf
- 基于機器視覺特定物體識別的研究.pdf
- 基于機器視覺的密集復(fù)雜物體識別與定位.pdf
- 基于機器學(xué)習(xí)的乳腺腫瘤識別.pdf
- 基于機器學(xué)習(xí)的模糊車牌的識別.pdf
- 基于機器學(xué)習(xí)的交通標(biāo)志識別.pdf
- 基于機器學(xué)習(xí)的氣體識別系統(tǒng).pdf
- 基于機器學(xué)習(xí)算法的隱喻識別研究.pdf
- 基于機器學(xué)習(xí)的車牌識別算法研究.pdf
- 基于Shape Context的物體識別.pdf
- 基于視觸融合的機器人物體識別系統(tǒng)的研究.pdf
- 基于半指導(dǎo)機器學(xué)習(xí)的中文姓名識別.pdf
- 基于機器學(xué)習(xí)算法的非編碼RNA識別.pdf
- 基于RGB-D物體識別的深度學(xué)習(xí)算法研究.pdf
- 基于機器學(xué)習(xí)的水稻病害識別算法的研究.pdf
- 基于機器學(xué)習(xí)的道路區(qū)域識別方法研究.pdf
- 29201.基于遷移學(xué)習(xí)的多類物體識別與檢測
- 基于紋理與勾描的物體識別.pdf
評論
0/150
提交評論