版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、隨著近幾十年來信息技術(shù)的發(fā)展,社會的信息化程度在不斷地提高,人們對視頻信息的需求也越來越迫切。數(shù)字視頻的應用領域和使用范圍越來越廣泛,視頻編碼技術(shù)受到了前所未有的重視。MPEG-1/2標準的制定使數(shù)字視頻走進了千家萬戶,但是隨著計算機技術(shù)、網(wǎng)絡技術(shù)、數(shù)字技術(shù)、無線技術(shù)和視頻編碼技術(shù)的不斷發(fā)展,人們已經(jīng)不再滿足于被動地接受多媒體信息,而期望更多的交互性。針對視頻編碼技術(shù)的發(fā)展,MPEG組織制定了MPEG-4國際標準,提供對任意形狀視頻對象
2、的編碼功能。MPEG-4基于對象的視頻編碼是實現(xiàn)基于內(nèi)容交互功能的關(guān)鍵。為了實現(xiàn)MPEG-4基于對象的視頻編碼的實際應用,編碼效率和實時編碼技術(shù)是很關(guān)鍵的研究領域。 在表達視頻對象時,處在對象外的透明部分是沒有定義的,當進行視頻對象編碼時必須對其進行填充,以提高壓縮編碼的效率。在第二章中,首先簡要介紹了MPEG-4基于對象的視頻編碼的基本概念,然后在討論了現(xiàn)有的基于宏塊的重復填充算法和線性外插填充算法的基礎上,提出了一種擴展平均
3、填充算法,用于填充重建的視頻對象平面(VideoObjectPlane,VOP)以外的透明部分。與現(xiàn)有的填充算法相比,擴展平均填充算法更加充分地利用了VOP邊界象素信息,提高了填充值的精度;該算法并不區(qū)分水平或者垂直方向的填充,更符合對象運動方向的隨機性;該算法用VOP內(nèi)象素的均值來填充遠離VOP邊界的透明區(qū)域,使不透明區(qū)域到透明區(qū)域的過渡更加平滑。仿真結(jié)果表明,擴展平均填充算法在編碼效率(峰值信噪比和編碼比特的壓縮率)方面優(yōu)于現(xiàn)有的填
4、充算法:與基于宏塊的重復填充算法和線性外插填充算法相比,該算法的PSNR分別提高了0.1~0.2db和0.15~0.35db,編碼比特壓縮率分別提高了2~5﹪和2~6﹪。 形狀編碼是MPEG-4基于對象的視頻編碼的關(guān)鍵。在MPEG-4中,形狀編碼的核心算法是基于上下文的算術(shù)編碼(CAE)。當進行幀間形狀編碼時,為了提高CAE的編碼效率,必須對編碼的形狀信息進行形狀運動估計。為了實現(xiàn)實時的形狀編碼,必須對形狀運動估計算法進行優(yōu)化。
5、第三章首先簡要介紹了MPEG-4中形狀編碼的基本概念,然后在討論了MPEG-4驗證模型中形狀運動估計算法、基于內(nèi)在特性的形狀快速運動估計算法、基于邊界象素的形狀快速運動估計算法的基礎上,本文提出了一種基于對象邊緣的形狀快速運動估計算法。與現(xiàn)有的三種形狀運動估計算法相比,基于對象邊緣的形狀快速運動估計算法更加充分地利用了鄰近形狀塊之間形狀運動向量的相關(guān)性,提高了形狀運動向量預測值的精度;該算法還充分利用了形狀運動估計時的邊界特性——這也是
6、該算法的核心思想,把搜索區(qū)域設定在VOP的邊界附近,大大提高了形狀運動估計的速度,而邊界形狀塊的匹配精度并不會有明顯的下降。仿真結(jié)果表明,基于對象邊緣的形狀快速運動估計算法的形狀運動估計速度大大超過現(xiàn)有算法的形狀運動估計速度,其平均搜索點數(shù)只有MPEG-4驗證模型中算法搜索點數(shù)的0.82﹪,而形狀的編碼效率并沒有降低。 為了實現(xiàn)視頻對象的實時紋理編碼,必須對紋理運動估計算法進行優(yōu)化。第四章首先簡要介紹了MPEG-4中視頻對象邊界
7、紋理的多邊形匹配方法,然后在討論了新三步搜索算法、四步搜索算法、基于塊的梯度降低搜索算法、鉆石搜索算法的基礎上,本文提出了一種基于對象的紋理快速運動估計算法。與現(xiàn)有的四種紋理快速運動估計算法相比,基于對象的紋理快速運動估計算法充分利用了視頻對象的形狀信息與對象邊緣宏塊的匹配特性——這也是該算法的核心思想,從而大大提高了邊界紋理宏塊的運動估計速度;該算法還充分利用了對象內(nèi)部宏塊運動的相關(guān)性,不僅避免了運動估計時匹配誤差陷入局部最小點,而且
8、提高了運動估計的速度;另外,該算法還充分利用了紋理宏塊的編碼特性,通過兩個中斷運動估計過程的判決方法來進一步提高運動估計的速度。仿真結(jié)果表明,基于對象的紋理快速運動估計算法的運動估計速度比其它算法的運動估計速度快,其平均的搜索點數(shù)只有全局搜索算法(FS)搜索點數(shù)的0.57﹪,而匹配誤差保持相近。另外,該算法與其它紋理快速運動估計算法在技術(shù)上是互補的,因此最佳的運行方式是聯(lián)合其它的紋理快速運動估計算法,以進一步提高運動估計的速度——能夠和
9、其它快速運動估計算法聯(lián)合運行是該算法的一個優(yōu)點。 為了能在PC上實時運行MPEG-4的CoreProfile@Level2視頻編解碼器,必須對其進行優(yōu)化。第五章首先介紹了MPEG-4基于對象的形狀編碼、運動估計與補償、紋理編碼以及相應的解碼方法,然后對基于PC的軟件視頻編解碼器進行了全面的優(yōu)化,本文提出了對MPEG-4基于對象的視頻編解碼器的優(yōu)化算法,大大提高了編解碼的速度,并降低了內(nèi)存需求。仿真結(jié)果表明,經(jīng)過優(yōu)化的視頻編解碼器
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于對象的視頻感知編碼技術(shù)研究.pdf
- 基于CNN的面向?qū)ο蟮囊曨l編碼技術(shù)研究與分析.pdf
- 基于WMSNs的視頻編碼技術(shù)研究.pdf
- 基于對象的小波域視頻可分級編碼關(guān)鍵技術(shù)研究.pdf
- 基于對象的視頻分割技術(shù)研究.pdf
- 視頻分割與基于對象的編碼研究.pdf
- 基于紋理特征的視頻編碼技術(shù)研究.pdf
- 基于對象的可分級視頻編碼.pdf
- 基于視頻對象的壓縮編碼研究.pdf
- 面向基于對象編碼的視頻分割研究.pdf
- 基于視覺特性的視頻編碼技術(shù)研究.pdf
- 基于不對稱樹結(jié)構(gòu)的3D-SPIHT視頻對象編碼技術(shù)研究.pdf
- 基于對象的壓縮編碼及視頻分級編碼研究.pdf
- 基于多小波的視頻編碼技術(shù)研究.pdf
- 基于視覺優(yōu)化的視頻編碼相關(guān)技術(shù)研究.pdf
- 基于網(wǎng)絡視頻監(jiān)控系統(tǒng)的編碼技術(shù)研究.pdf
- 基于視覺特性的高效視頻編碼技術(shù)研究.pdf
- 基于ROI的可伸縮視頻編碼技術(shù)研究.pdf
- 基于網(wǎng)絡編碼的視頻傳輸技術(shù)研究.pdf
- 感知視頻編碼技術(shù)研究.pdf
評論
0/150
提交評論