基于非參數(shù)多線索融合的單目視頻深度圖估計(jì)研究.pdf_第1頁
已閱讀1頁,還剩78頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、隨著三維視頻需求的快速增長,二維視頻的三維轉(zhuǎn)化問題成為計(jì)算機(jī)視覺和多媒體分析新的研究熱點(diǎn)之一。針對大部分已有的視頻轉(zhuǎn)換算法需要恢復(fù)相機(jī)參數(shù)的問題,本文設(shè)計(jì)了一種基于多線索非參數(shù)化融合的單目視頻深度圖提取方法。在非參數(shù)學(xué)習(xí)的基礎(chǔ)上,聯(lián)合圖像輪廓線索、幾何透視線索及幀間空時(shí)相關(guān)性,估計(jì)相對準(zhǔn)確的視頻深度圖序列。
  本文的主要研究工作和創(chuàng)新如下:
  1.針對目前的深度圖估計(jì)大多使用單一深度線索且容易出現(xiàn)深度估計(jì)偏差的問題,提出

2、一種基于前景背景融合的單目圖像深度圖估計(jì)方法。其中前景深度層主要反映場景顯著性區(qū)域內(nèi)的深度,其估計(jì)方法是建立在具有相似語義或光學(xué)度量的場景具有相似深度的假設(shè)上;背景深度層反映場景整體的深度分布趨勢,通過分析場景的幾何透視線索獲得。
  2.針對基于非參數(shù)化學(xué)習(xí)估計(jì)的初始前景深度圖存在邊界模糊、場景結(jié)構(gòu)相對雜亂的問題,提出一種基于圖像分段誘導(dǎo)的初始深度優(yōu)化方法。首先,基于圖模型對原始圖像進(jìn)行過分割,利用其分割結(jié)果劃分圖像場景中的不同

3、物體;接著,在初始前景深度圖中相應(yīng)的各分割區(qū)域內(nèi),采用均值賦值法優(yōu)化深度值。該方法能將場景中物體邊界及其位置信息有效地嵌入至相應(yīng)深度圖以改善其精度。
  3.和傳統(tǒng)的基于幾何線索的深度圖估計(jì)不同,本文采用線性透視原理提取背景深度圖。借助語義自動(dòng)成組AGS(Automatic Grouping of Semantics)方法估計(jì)單目圖像中相應(yīng)的消失點(diǎn),據(jù)此線性地分配背景深度層中的深度信息。背景深度層的幾何線性透視類型有如下五類:上-

4、下透視、左-右透視、右-左透視、左上-右下透視和左下-右上透視。該方法提取的背景深度層能整體反映給定的視覺場景中全局的深度分布趨勢。
  4.不同于簡單深度圖視頻估計(jì)直接將各幀深度圖拼接成視頻深度圖序列,本文采取聯(lián)合幀間空時(shí)關(guān)系的單目視頻序列深度圖估計(jì)。在單幅圖像深度圖估計(jì)基礎(chǔ)上,引入時(shí)間相關(guān)性和運(yùn)動(dòng)約束項(xiàng),共同構(gòu)成視頻深度學(xué)習(xí)的非參數(shù)模型。該方法能有效提升視頻深度圖估計(jì)中幀間深度連續(xù)性,抑制單目視頻序列中運(yùn)動(dòng)物體的深度偏差。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論