版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、1,你做的是幀內預測,幀間預測。對于預測的話并不一定就說非得是某個塊,任何一個你做的是幀內預測,幀間預測。對于預測的話并不一定就說非得是某個塊,任何一個塊都行,最多可能是預測的準些,和被編碼的塊更相似,殘差小些,壓縮率高些。預塊都行,最多可能是預測的準些,和被編碼的塊更相似,殘差小些,壓縮率高些。預測的不準的話可以是任何一值,只是殘差會大些,壓縮率低些罷了,不影響圖象的質測的不準的話可以是任何一值,只是殘差會大些,壓縮率低些罷了,不影響
2、圖象的質量,或者說圖象仍然能夠看,質量會低一些,但仍然可以看。量,或者說圖象仍然能夠看,質量會低一些,但仍然可以看。要傳輸要傳輸P,預測成(參考)任何,預測成(參考)任何P1,p2,,,,都行,反正發(fā)送的是殘差,最后都能,,,,都行,反正發(fā)送的是殘差,最后都能重構出原來的圖象,只是碼流大小不同。重構出原來的圖象,只是碼流大小不同。幀內的預測是要計算(幀內預測就是實際意義的預測,預測得到的幀內的預測是要計算(幀內預測就是實際意義的預測,預
3、測得到的新塊新塊原先原先不存在,輸入不存在,輸入為相鄰的塊通過一個算法為相鄰的塊通過一個算法f計算出來的計算出來的)。幀間的預測只是搜索從參考幀得到搜索塊()。幀間的預測只是搜索從參考幀得到搜索塊(原先是存在的,只是去找到它先是存在的,只是去找到它),然后把這些塊構造成一個預測的宏塊(幀間預測實際是搜),然后把這些塊構造成一個預測的宏塊(幀間預測實際是搜索得到搜索塊,再組合成一個宏塊)。索得到搜索塊,再組合成一個宏塊)。幀內預測模式:幀
4、內預測主要是通過利用空間相關性,只有8x8塊。各個8x8塊的模式mode主要是預測模式。相當于利用已經編碼的8x8塊有很多個pred=f1,f2,f3,f4。。。函數(shù)(自變量就是已經編碼的塊coded_8x8_block),哪一個函數(shù)得到的預測塊pred跟當前編碼的cur_8x8塊最相似,就是那個塊模式,比如f1。幀間預測模式:幀間預測主要是利用時間相關性,模式主要是塊模式16x16。16x8,8x16,8x8,參考那一幀。塊模式主要是
5、模擬物體的形狀。2,GOP是一組圖象序列。一個是一組圖象序列。一個GOP有一個有一個I。GOPstructure:參數(shù)可以自己設定的。15LengthofoneGOPmustbeamultipleof(Bframenumber1)2Numberofreferenceframes(12)2NumberofBframes(012)那么格式是IBBPBBPBBPBBPBBIBBPBBPBBPBBPBBIBBPBBPBBPBBPBB編碼的順序為
6、IPBBPBBPBBPBBIBB,碼流也是以這個順序的,解碼也要以這個順序。判斷那一個幀為I幀,那一個為B幀,那一個為P幀,是根據(jù)幀的順序號NO,和上面的GOPstructure完全確定的。如果是B幀就先不編碼,把整個B幀放到緩沖里面存器來,所以要存兩個B幀。B幀參考前后兩幀可能是前面的I后面的P(GOP開頭),可能是前面的P后面的P,(GOP中間)可能是前面的P后面的I(在GOP尾部)第一個GOP序列的第一個P幀只參考前面的一個I。之
7、后的GOP的第一個P幀可以只參考本GOP的I,只參考一個?;蛘呖梢詤⒖忌蟼€GOP尾部的P和本GOP的I,共兩個參考幀。這個看標準怎么說明。每個GOP的第二個P參考前面的I和第一個P。,后面的P參考前面的兩個P(200-1,300-2,300-3,200-5,200-6,200-3),參考v1,額外發(fā)送1(代表參考v1)(1,0,0,0,0,0)參考v3,額外發(fā)送3(代表參考v3)(0,0,0,1,0,1)參考v3,額外發(fā)送3(代表參考v
8、3)所以傳送的數(shù)據(jù)少了很多。但是傳送v3仍然需要很多bit,這是難免的情況。另外,這樣除了發(fā)送殘差,還要額外的發(fā)送參考那一個(也就是運動矢量MV),上面的序列要額外的發(fā)送的運動矢量MV為0,1,1,3,3,這個MV序列仍然可以上面的預測方法來減少要發(fā)送數(shù)據(jù)值,這個方法就是MVP,假設簡單的MVP函數(shù)就是直接使用上一個矢量的MV的話,要發(fā)送的MVD為0,1,0,2,0。所以數(shù)值又減少了很多,代表發(fā)送的bit流更少了。對于一般的情況,就利用
9、搜索算法不斷的計算不斷的計算得到一個最小的殘差(這個過程很費時間,以sad象素殘差代價+MVD矢量殘差代價,兩個代價作為選擇的依據(jù),因為MVD也要傳送的,雖然sad_1小于sad_2,但是如果(sad_1+MVD_1)(sad_2+MVD_2),可能可能第一種情況發(fā)送的bit會更多,說可能是因為只是初步估計。其實最精確的表示發(fā)送的bit數(shù)是采用RDO決策,把sad殘差和MVD最終需要的bit數(shù)全部計算出來選擇,bit最少的,那樣計算量很
10、大。)。另一個問題是怎么發(fā)送殘差呢???也即怎么表示下面的殘差雖然數(shù)值很小,但是分布很雜,很不規(guī)則,不好直接表示這個殘差信息??梢杂肈CT變換把能量集中起來。(1,0,0,0,0,0)DCT作用(1,0,0,0,0,0)(0,0,0,1,0,1)DCT作用(1,1,0,0,0,0)注意:這并不是精確的DCT變換,只是為了說明DCT集中能量的作用。Dct另一個作用也是減少圖象的空間相關性,圖象往往有空間相關(高頻分量少,低頻分量多),變換
11、到頻域后。值也變少了。(1,1,1,1,1,1)變成(4,2,0,0,0,0)比如低頻值往往在左上角。高頻值往往在后面??梢酝ㄟ^DCT變換來把分散的值(能量)集中到一起。比如在二維的88的DCT變換就可以把能量集中到左上角,數(shù)據(jù)從左上角往右下角逐漸變?。ㄋp)。然后zigzag掃描把88的64個DCT系數(shù)得到從大到小(可能不是精確的絕對從大到小,但是也差不多)順序排列的一串數(shù)(64個),64個由大到小的數(shù)后面的很多值就是0了。然后采用r
12、un-level(run表示個數(shù),level表示值)編碼表示這些數(shù)。比如zigzag掃描的64個DCT系數(shù)4,4,3,3,3,3,3,3,2,2,2,2,2,1,1,1,1,1,1,1,1,1,1,1,0,0,0,。。。。。也即為2個4,6個3,5個2,11個1,36個0就可以表示為(2,4)(6,3)(5,2)(11,1)(36,0)這樣一來以前的很大的64個原始象素值,變成很小的幾個數(shù)而已(2,4)(6,3)(5,2)(11,1)(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- hdmi編解碼傳輸
- 視頻編解碼器編解碼質量客觀評價方法研究.pdf
- amr編解碼格式介紹
- ffmpeg編解碼詳細過程
- 編解碼器接口
- 編解碼技術畢業(yè)設計
- 11漢明碼編解碼實驗
- 圖像編解碼技術及應用
- 音視頻編解碼說明
- 11漢明碼編解碼實驗
- ADPCM編解碼系統(tǒng)設計.pdf
- RS編解碼的FPGA實現(xiàn).pdf
- 視音頻編解碼技術及應用
- 紋理自適應視頻編解碼.pdf
- Turbo碼的編解碼研究.pdf
- tdcdma系統(tǒng)中的信源編解碼
- AVS視頻編解碼標準中預測編解碼技術的研究及其硬件設計與實現(xiàn).pdf
- TETRA語音編解碼算法研究.pdf
- DTMF編解碼芯片的設計.pdf
- 5b6b編解碼
評論
0/150
提交評論