版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、多媒體計(jì)算技術(shù)是實(shí)現(xiàn)具有類人多模態(tài)感知能力的機(jī)器人等高級人工智能終極目標(biāo)的基石,其具有非常重要的學(xué)術(shù)意義和實(shí)際應(yīng)用價(jià)值。解決多媒體計(jì)算問題的關(guān)鍵是對不同模態(tài)的數(shù)據(jù)構(gòu)建強(qiáng)大的特征表示模型,即多媒體特征表示。傳統(tǒng)的基于人工設(shè)計(jì)的特征表示模型對數(shù)據(jù)的中層結(jié)構(gòu)和高層語義信息的表示能力有限,無法突破“語義鴻溝”。近年來興起的深度學(xué)習(xí)模型借鑒了人類神經(jīng)系統(tǒng)的一些特性,利用了機(jī)器學(xué)習(xí)技術(shù),具有強(qiáng)大的非線性擬合能力,是最有希望解決多媒體數(shù)據(jù)特征表示問題
2、的研究方向。然而目前絕大多數(shù)深度特征表示模型過于依賴大數(shù)據(jù)本身進(jìn)行完全數(shù)據(jù)驅(qū)動(dòng)的模型自動(dòng)學(xué)習(xí),忽略了人類通過數(shù)萬年演化及生存經(jīng)驗(yàn)所獲得的對客觀事物的規(guī)律進(jìn)行總結(jié)的知識,很少有研究涉及到如何把人類的知識作為一種語義先驗(yàn)對深度特征表示模型的學(xué)習(xí)訓(xùn)練過程進(jìn)行指導(dǎo)。
本文主要探討了多媒體計(jì)算任務(wù)中基于語義先驗(yàn)約束的圖像、文本、視頻等模態(tài)數(shù)據(jù)的深度特征表示研究,充分借鑒了人工智能領(lǐng)域前沿的一些研究成果,對通過語義先驗(yàn)約束提升多媒體特征表
3、示的有效性開展了深入的研究。由于多媒體特征表示有效性的評估依賴于其具體應(yīng)用的多媒體計(jì)算相關(guān)任務(wù),本文的理論研究與應(yīng)用研究緊密結(jié)合,理論研究服務(wù)于實(shí)際的應(yīng)用場景(視覺關(guān)鍵點(diǎn)坐標(biāo)定位、視頻文字描述自動(dòng)生成、多模態(tài)知識分析等)需要,應(yīng)用研究引導(dǎo)著理論算法的研究方向。本文的主要成果和貢獻(xiàn)包含以下幾個(gè)方面:
1、本文提出了一種基于幾何信息先驗(yàn)的圖像深度特征表示學(xué)習(xí)方法。該方法首先通過損失函數(shù)的形式對圖像中具有的人類易感知的幾何學(xué)信息進(jìn)行
4、建模,隨后通過該損失函數(shù)具體約束指導(dǎo)圖像特征表示模型的訓(xùn)練過程,所得到的特征表示可以被用來完成臉部關(guān)鍵點(diǎn)檢測或非剛性物體的運(yùn)動(dòng)結(jié)構(gòu)恢復(fù)等任務(wù),在不增加現(xiàn)有模型復(fù)雜度的前提下顯著提升性能。
2、本文提出了一種基于屬性先驗(yàn)的視頻深度特征表示學(xué)習(xí)方法。該方法首先提出了一種有效的視頻屬性詞典構(gòu)建方法,隨后提出了一種高效的視頻中層特征表示方法可以將一段視頻序列用單幅圖像進(jìn)行表示?;谏鲜霾襟E,本文成功的把復(fù)雜的視頻屬性表示學(xué)習(xí)問題轉(zhuǎn)換為
5、相對容易解決的圖像多標(biāo)簽分類問題。最后本文通過改進(jìn)序列-序列學(xué)習(xí)的編碼網(wǎng)絡(luò)結(jié)構(gòu)將具有屬性先驗(yàn)的視頻深度特征表示引入到視頻文字描述自動(dòng)生成框架中,顯著的提升了所生成文字語句的語義性。
3、本文提出了一種基于跨模態(tài)知識關(guān)聯(lián)先驗(yàn)的多模態(tài)深度特征表示學(xué)習(xí)方法。該方法可以直接從網(wǎng)絡(luò)數(shù)據(jù)中學(xué)習(xí)到多模態(tài)數(shù)據(jù)的深度知識表示。本文首先提出了一個(gè)完整的解決方案可以自動(dòng)的從網(wǎng)絡(luò)異質(zhì)非結(jié)構(gòu)化多模態(tài)數(shù)據(jù)中挖掘大規(guī)模結(jié)構(gòu)化多模態(tài)關(guān)系數(shù)據(jù)集。然后基于跨模態(tài)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于特征、先驗(yàn)和約束的主題建模算法.pdf
- Web腳本語義與圖像特征融合的多媒體檢索機(jī)制研究.pdf
- 可視的多媒體數(shù)據(jù)語義標(biāo)注.pdf
- 基于先驗(yàn)形狀約束的圖像分割研究.pdf
- 基于成對約束和稀疏表示的特征選擇算法研究.pdf
- 語義特征造型系統(tǒng)約束求解的研究.pdf
- 基于先驗(yàn)信息編碼的約束學(xué)習(xí)算法研究.pdf
- 語義特征造型及約束求解的研究.pdf
- 基于先驗(yàn)約束的圖像盲復(fù)原方法研究.pdf
- 基于內(nèi)容多媒體應(yīng)用的語義視頻對象提取及評價(jià).pdf
- 多媒體技術(shù)教程-ch6 多媒體的時(shí)間表示與同步
- 基于特征子空間的多媒體檢索方法研究.pdf
- 基于多種QoS約束的無線多媒體傳感器網(wǎng)絡(luò)的研究.pdf
- 基于框架的情感語義表示方法研究.pdf
- 基于先驗(yàn)信息約束的水平集圖像分割方法研究.pdf
- 基于多媒體的自動(dòng)售貨機(jī)信息表示策略與實(shí)施.pdf
- 基于特征的多媒體信息檢索技術(shù)的研究與開發(fā).pdf
- 基于框架的情感語義表示方法研究
- 多媒體語義信息提取和查詢工具的研究.pdf
- 基于SimpleScalar的多媒體應(yīng)用程序特征分析研究.pdf
評論
0/150
提交評論