版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、作為圖像視頻語義分析方向的一個新興的研究課題,人體動作識別的研究融合了圖像視頻處理、計算機視覺、模式識別、統(tǒng)計學(xué)習(xí)、人工智能和認(rèn)知科學(xué)等多學(xué)科的知識。它通過分析圖像或視頻等底層數(shù)據(jù),從中提取與人體動作相關(guān)的信息,建立底層數(shù)據(jù)和高層語義之間的關(guān)系。因其在智能視頻監(jiān)控、人機交互以及虛擬現(xiàn)實等領(lǐng)域的廣闊應(yīng)用前景和深遠研究意義,近年來人體動作識別問題得到了廣泛的關(guān)注,研究者們提出了大量的研究方法并取得了豐碩的研究成果。
本文主要研
2、究如何從視頻或三維動作捕捉數(shù)據(jù)自動識別出人體動作類別,通過對已有研究工作的分析,總結(jié)出入體動作識別算法中的兩個關(guān)鍵性因素:
1.高效的人體動作特征提取方法,2.高效的動作分類算法。本文分別從特征學(xué)習(xí)和分類器設(shè)計這兩個方面提出新的思路和解決方法,它的主要貢獻如下。
本文提出了一個基于語義上下文分析的近語義視覺詞典學(xué)習(xí)框架,稱為contextual spectral embedding(CSE)框架,以及相應(yīng)的基
3、于近語義視覺詞典的高層語義識別算法。它們主要解決視覺單詞聚類映射方法引起的視覺單詞語義模糊以及信息冗余等問題。首先,采用一種無參數(shù)的視覺單詞語義相似度計算方法對視覺單詞的語義上下文進行分析。其次,建立以視覺單詞為結(jié)點,語義相似度為邊權(quán)值的有權(quán)無向圖,結(jié)合譜聚類算法對視覺單詞進行聚類。語義相似的視覺單詞被映射到同一個近語義視覺單詞中,因而生成的近語義視覺詞典在一定程度上避免了底層視覺特征與高層語義之間的“語義鴻溝”問題。該方法可以擴展到很
4、多涉及視覺詞典的高層語義識別問題中,如人體動作識別和視頻概念檢索。通過多個視頻數(shù)據(jù)庫上的人體動作識別實驗和視頻概念搜索實驗可以得到結(jié)論,近語義視覺詞典可以有效地提高這類高層語義識別的有效性和魯棒性。
本文研究了基于遷移學(xué)習(xí)的跨視角人體動作識別算法,該算法以視頻的視覺單詞表示為基礎(chǔ),通過異源異構(gòu)視覺詞典的協(xié)同語義學(xué)習(xí),克服“視角障礙”問題使得不同視角下的類別標(biāo)識信息能夠遷移。為此提出了一個基于多源約束近鄰傳播方法的跨視角視覺
5、詞典學(xué)習(xí)框架,稱為Bilingual visual wordlearning with multi-source constraint propagation(BiVWL+MSCP)框架。首先,它從視覺單詞的時空分布中估計異源異構(gòu)視覺單詞之間的初始語義相似度,并結(jié)合多源約束近鄰傳播方法得到魯棒穩(wěn)定的估計值。最后,建立以異源異構(gòu)視覺單詞為結(jié)點,語義相似度為權(quán)值的二分圖模型,采用二分圖協(xié)同聚類方法對視覺單詞進行聚類。語義相似但來自不同視角的
6、視覺單詞被映射到同一個跨視角視覺單詞中,因此跨視角視覺詞典作為橋梁使得類別標(biāo)識信息在不同視角之間遷移。通過在多視角動作視頻數(shù)據(jù)庫上的實驗得到結(jié)論,跨視角視覺詞典可以有效地解決人體動作識別中的視角變化問題,達到跨視角人體動作識別的目的。
本章提出了一種基于三維關(guān)節(jié)點空間時序信息的人體動作分類算法。該算法以人體三維骨架模型表示為基礎(chǔ),為解決維度災(zāi)難問題將一維隱馬爾可夫模型擴展成空間時序隱馬爾科夫模型(spatial-tempo
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于視頻的人體動作識別方法研究.pdf
- 基于Kinect骨骼數(shù)據(jù)的人體動作識別方法研究.pdf
- 三維人體運動分析與動作識別方法.pdf
- 視頻數(shù)據(jù)中人體動作識別方法研究.pdf
- 基于關(guān)節(jié)模型的人體動作識別方法研究.pdf
- 基于深度學(xué)習(xí)的人體動作識別方法研究.pdf
- 基于動作捕捉數(shù)據(jù)的人體運動合成研究.pdf
- 基于視頻序列的人體動作識別.pdf
- 基于立體視覺的人體動作識別方法研究.pdf
- 基于流形學(xué)習(xí)的人體動作識別方法研究.pdf
- 視頻中的人體動作識別研究.pdf
- 基于分層時空特征模型的人體動作識別方法研究.pdf
- 基于高魯棒性特征的人體動作識別方法研究.pdf
- 基于深度數(shù)據(jù)的人體動作識別.pdf
- 視頻中的人體動作行為識別研究.pdf
- 基于時空興趣點和詞袋模型的人體動作識別方法研究.pdf
- 基于視頻的人體動作分析與識別的研究.pdf
- 基于加速度傳感器的人體動作識別方法研究.pdf
- 基于動作捕捉傳感器的人體日常行為識別研究.pdf
- 基于概率特征的在線人體動作識別方法研究.pdf
評論
0/150
提交評論