視頻對象自動分割技術及其細胞神經網(wǎng)絡實現(xiàn)方法的研究.pdf_第1頁
已閱讀1頁,還剩113頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、傳統(tǒng)的視頻壓縮編碼標準MPEG1/2和H.26x都采用基于幀的技術,不要求對場景進行分割。它們能獲得較高的壓縮比,并在許多領域得到了廣泛的應用。隨著多媒體信息的日益豐富,人們不再滿足于對視頻信息的簡單瀏覽,而要求提供基于對象的操縱、交互等功能。 為此,MPEG組織提出了第二代視頻壓縮標準MPEG-4,MPEG-4最顯著的特征之一就是基于對象的編碼方式。要實現(xiàn)基于對象的視頻編碼,首先要進行視頻對象分割。視頻對象分割是指在時空域上將

2、視頻分割為一些視頻語義對象的集合,也就是將每一個視頻幀分割為一些不同語義對象區(qū)域。事實上,視頻對象分割技術不僅僅可以為MPEG-4服務,在許多計算機視覺領域都能發(fā)揮視頻對象分割技術的作用。視頻對象分割技術有很廣闊的應用前景,其中的一些典型例子包括視頻編碼、視頻制作和編輯、視頻檢索、視頻監(jiān)控等。 視頻對象分割是計算機視覺領域中的一個難點,這主要是由于現(xiàn)實世界中場景的復雜性和多樣性,很難建立一個統(tǒng)一的先驗模型,這就決定了很難找到一種

3、單一的方法來完成這項任務。研究通用視頻對象分割方法的困難還來自于對“語義對象”的定義:視頻對象的分割不僅僅是低層次的視覺分割,還涉及到高層次的語義定義和特征提取。所以,盡管視頻對象分割算法的研究得到了廣泛的重視,并且已經提出了眾多的算法,但是,視頻對象分割算法與MPEG-4標準的要求相比還遠未成熟。概括起來,目前的視頻對象算法主要存在以下一些問題:首先,目前還不存在一種適合于所有序列的通用算法;其次,由于分割過程中計算量大,尚難滿足實時

4、性要求。 本論文重點研究MPEG-4框架下從視頻序列中分割出視頻對象的方法和技術,針對目前的視頻分割算法大多數(shù)難以滿足實時性要求的缺點,引入細胞神經網(wǎng)絡來解決。 論文主要工作包括以下幾個方面: 1)提出了一種基于邊緣投影的頭肩序列人臉提取算法。通過對頭肩序列進行分析,可知面部的運動細節(jié)比較豐富,也比較集中。因此可以通過對幀間差分圖像做水平和垂直投影,確定人臉的大致坐標,搜尋范圍變?yōu)橐粋€矩形小區(qū)域。之后對這小塊區(qū)域

5、使用游程編碼進行區(qū)域劃分,結合前面得到的幀差運動信息,提取出人臉區(qū)域。這種算法綜合利用了空間灰度信息和運動信息,因而能夠比較準確地分割出人臉。 2)提出了兩種頭肩序列中視頻對象的分割算法。其中一種是時空結合的視頻對象分割方法,首先使用幀間差分得到運動信息,然后使用灰度連通區(qū)域標記法對圖像進行空間劃分,最后結合兩種信息得到最終的對象。另外一種是基于最大梯度淹沒區(qū)域聚類的快速分割算法。由于頭肩序列中通常都有大片相同顏色的背景區(qū)域,這

6、樣在經過梯度淹沒后,就會在背景區(qū)域出現(xiàn)大片的集水盆,而最大集水盆對應的邊緣就會近似頭肩序列的對象邊緣,然后對邊緣附近像素從灰度、歐拉距離等特征出發(fā)進行多尺度聚類分析,達到精確分割的目的。 3)提出了一種適合于運動和靜止背景的基于光流和改進的分水嶺的視頻對象分割方法。這種方法也是一種時空聯(lián)合的方法,首先對待處理圖像進行形態(tài)學重建濾波預處理,然后使用多尺度形態(tài)學算法求取梯度,對梯度淹沒形成集水盆后使用改進的分水嶺算法進行區(qū)域劃分;利

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論