版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、隨著互聯(lián)網(wǎng)技術和智能硬件設備的高速發(fā)展,豐富的多媒體數(shù)據(jù)出現(xiàn)在網(wǎng)絡上。視頻和文本作為兩類重要的媒體信息載體,是多媒體信息處理領域中的重要研究對象。嵌入學習在多媒體數(shù)據(jù)存儲、檢索和分類等領域已被廣泛應用,其旨在發(fā)掘并利用數(shù)據(jù)的本質特性生成其對應的低維向量表示。論文以近重復視頻檢索和跨域情感分類為研究課題,提出一些新穎的基于嵌入學習的視頻和文本表示方法,挖掘數(shù)據(jù)的內容信息并生成準確的數(shù)據(jù)簽名。
近重復視頻檢索主要研究如何搜索與查詢
2、視頻相同或相近的視頻,其核心任務是視頻信息的準確提取與表示。它是多媒體信息處理領域中一個重要的研究課題,其相關應用包括視頻搜索、視頻推薦和版權保護等。隨著網(wǎng)絡視頻數(shù)量的增加,除了傳統(tǒng)的準確性指標外,許多近重復視頻檢索系統(tǒng)越來越關注系統(tǒng)的高效性和可擴展性??缬蚯楦蟹诸惖娜蝿帐峭ㄟ^依靠源域中的監(jiān)督數(shù)據(jù)來獲得能夠適用于目標域的情感分類器,其主要研究如何減小不同領域間單詞分布的差異和如何生成準確描述文本數(shù)據(jù)的簽名。
為了解決上述問題,
3、同時考慮視頻和文本數(shù)據(jù)的特性,論文提出了基于嵌入學習的數(shù)據(jù)表示方法,包括三種用于近重復視頻檢索的哈希方法和一種用于跨域情感分類的嵌入方法。本論文的主要工作總結如下:
1.基于高斯分布的隨機多視角哈希方法
為了提高大規(guī)模近重復視頻檢索的準確率和速度,論文采用基于高斯分布的隨機多視角哈希方法將多種視頻關鍵幀的底層特征進行融合,并結合關鍵幀間的結構信息和可利用的監(jiān)督信息,生成視頻的最終哈希碼序列表示。該方法通過最大化廣義的
4、檢索準確率和召回率來學習可靠的映射函數(shù)。并且,方法采用復合的Kullback-Leibler(KL)散度測度來近似估計此檢索分數(shù),其隨機地匹配了原始特征空間和準哈希碼空間的近鄰結構。實驗結果表明,與其他近重復視頻檢索方法相比,本文的方法獲得了更好的檢索性能和更高的檢索效率。
2.基于t分布的隨機多視角哈希方法及其深度哈希擴展
為了提升非監(jiān)督學習的魯棒性,論文提出基于t分布的隨機多視角哈希方法。該方法采用基于高斯估計獲
5、得的連續(xù)相似度和基于互惠鄰居獲得的離散相似度來融合多種視頻特征,并通過最小化原始特征空間和準哈希碼空間的概率相似度結構的KL散度來學習哈希函數(shù)。為了減小遠距離映射對象對尺度變化的敏感性,方法采用學生t分布來估計關鍵幀的準哈希碼向量間的相似度,以便將原始空間中的非監(jiān)督近鄰結構更準確地保存到準哈希碼空間中。此外,為了思考非監(jiān)督深度學習的問題和促進大規(guī)模檢索的發(fā)展,論文將該方法擴展到非監(jiān)督的深度學習上。通過應用相同的優(yōu)化目標方程和構建基于一個
6、深度神經(jīng)網(wǎng)絡的哈希映射函數(shù),開發(fā)一種用于訓練深度哈希網(wǎng)絡的魯棒非監(jiān)督的訓練策略。
3.基于嵌入的跨域情感分類方法
為了實現(xiàn)跨域情感分類任務,論文提出一種基于嵌入的文本映射方法。該方法采用若干個軸點(pivot)連接源域和目標域,通過構建三個概率相似度匹配模型來學習文本數(shù)據(jù)的映射函數(shù),并最終生成兩個領域中單詞和文檔數(shù)據(jù)的嵌入向量表示。軸點被用來減小源域和目標域中單詞分布的差異,而三個概率相似度匹配模型則被用來保存文本數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于關鍵幀的近重復視頻檢索.pdf
- 基于多特征的近重復圖像判斷和檢索.pdf
- 基于運動信息的視頻分類和檢索.pdf
- 基于內容的大規(guī)模近似重復視頻檢索研究.pdf
- 基于跨領域分類學習的產品評論情感分析.pdf
- 跨域的圖片情感分析.pdf
- DCT域上基于主顏色的圖像和視頻檢索.pdf
- 近重復視頻檢測算法研究.pdf
- 基于h.264壓縮域的視頻檢索研究
- 基于深度學習的重復視頻檢測.pdf
- 基于特征極性的跨領域情感分類方法研究.pdf
- 基于壓縮域特征的視頻檢索技術研究.pdf
- 面向跨域分類的圖像視覺屬性學習方法研究.pdf
- 基于特征關聯(lián)的跨領域情感分類方法研究.pdf
- 基于內容的視頻檢索與分類方法研究.pdf
- 基于語言模型和機器學習的文本情感分類研究.pdf
- 基于深度學習的文本情感分類研究.pdf
- 基于主動學習的情感分類方法研究.pdf
- 基于特征極性傳遞的跨領域情感分類方法研究.pdf
- 基于多核學習和圖正則化的跨模態(tài)哈希檢索研究.pdf
評論
0/150
提交評論