使用差分脈沖編碼調(diào)制(differentialpulsecodemodulation,dpcm)對_第1頁
已閱讀1頁,還剩39頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、2024年3月3日12時9分,1,第7章 圖象編碼與壓縮,主要內(nèi)容:1.圖象編碼的必要性?2.圖象編碼的分類?3.圖象編碼中的保真度準(zhǔn)則?4.編碼的性能參數(shù)?5.統(tǒng)計編碼6.預(yù)測編碼7.變換編碼8.圖象編碼的國際標(biāo)準(zhǔn),,2024年3月3日12時9分,2,1.圖象編碼的必要性,圖象編碼與壓縮,圖象編碼與壓縮,本質(zhì)上來說,就是對圖象源數(shù)據(jù)按一定的規(guī)則進(jìn)行變換和組合,從而達(dá)到以盡可能少的代碼來表示盡可能多的數(shù)

2、據(jù)信息。壓縮通過編碼來實現(xiàn),或者說編碼帶來壓縮的效果,所以,一般把此項處理稱之為壓縮編碼。,編碼的必要性,一幅模擬圖象必須經(jīng)過脈碼調(diào)制(PCM—Pulse Code Modulation)才能變成數(shù)字圖象。(PCM有時也指對信號進(jìn)行采樣、量化并以適當(dāng)碼字將其編碼的各個過程的總稱),2024年3月3日12時9分,3,模擬圖象,,空間采樣,PCM的過程:,,,,,中間體,幅值量化,中間體,,,數(shù)字圖象,編碼,例1設(shè)一幅活動圖象的空間分辨率

3、為N,灰度分辨率為b, 時間分辨率為fB, 則在實時傳輸過程中,該圖象在傳輸通道里的傳輸率至少應(yīng)該為ρ=NbfB,若N=512?512, b=8, fB=25, 則ρ=52.4Mbps,2024年3月3日12時9分,4,例2地球資源衛(wèi)星(LANDSAT)一幀圖象(4幅)的數(shù)據(jù)量為 2340 ? 2340 ? 7 ? 4 = 153,316,800 ?153Mb衛(wèi)星每天要獲取很多幅圖象,這些數(shù)據(jù)都先暫時存儲在衛(wèi)星體內(nèi)的

4、磁性存儲器中,當(dāng)衛(wèi)星飛過地面接收站的有效接收區(qū)域時,迅速將這些數(shù)據(jù)全部送到地面。,2024年3月3日12時9分,5,圖象編碼的目的:節(jié)省存儲空間;減少傳輸時間;利于處理,降低處理成本。,圖象數(shù)據(jù)經(jīng)過編碼壓縮、傳輸、解碼以及重建圖象數(shù)據(jù)的流程如下圖所示:,原始圖象數(shù)據(jù),編碼器,被壓縮的圖象數(shù)據(jù)流,,,重建圖象數(shù)據(jù),解碼器,被壓縮的圖象數(shù)據(jù)流,,,,,,信道,信源編(解)碼,信道編(解)碼,,,,2024年3月3日12時9分,6,,2.圖象

5、編碼壓縮分類,a)從應(yīng)用角度分類,靜止圖象編碼,活動圖象編碼,二值圖象編碼,b)從信息保持程度角度分類,有損壓縮(保真度編碼,特征抽取編碼)無損壓縮(信息保持壓縮,熵保持壓縮),c)從具體的編碼技術(shù)角度分類,空域法,變換域法,預(yù)測編碼,變換編碼,統(tǒng)計編碼,等,2024年3月3日12時9分,7,3.圖象編碼中的保真度準(zhǔn)則,圖象品質(zhì)的核心問題是逼真度問題。經(jīng)過處理的圖象(包括經(jīng)過壓縮編碼后的圖象)與一個標(biāo)準(zhǔn)圖象之間的偏差可以作為圖象逼真度

6、(保真度)的度量。這一偏差,包括亮度,色度,分辨率以及某些心理物理學(xué)參數(shù)。,a)客觀保真度準(zhǔn)則,設(shè)f(x,y)是輸入圖象,f’(x,y)是輸出圖象, 定義偏差e(x,y)=f(x,y)-f’(x,y),則以下的參數(shù)可作為保真度準(zhǔn)則:,2024年3月3日12時9分,8,b)主觀保真度準(zhǔn)則,挑選一定數(shù)量的觀察者,2024年3月3日12時9分,9,4.編碼的性能參數(shù),圖象信息熵與平均碼字長度,令,是圖象象素灰度級集合,其對應(yīng)的頻率為,定義,(

7、單位:比特/象素),令,是對應(yīng)象素灰度級的編碼長度,定義,(單位:比特/象素),問題:如何度量編碼方法的優(yōu)劣?,2024年3月3日12時9分,10,稱H(d)為該圖象的平均信息熵,R(d)為平均編碼長度。,編碼效率,冗余度,冗余大致分為三類1)編碼冗余 符號序列?碼字?(碼字長度),2024年3月3日12時9分,11,2)象素間相關(guān)性冗余 幀間象素信息冗余,幀內(nèi)象素信息冗余3)視覺冗余 人眼對所有視

8、覺信息并不是都具有相同的敏感度; 人眼的空間分辨率,時間分辨率。,消除冗余能達(dá)到數(shù)據(jù)壓縮的效果。,Kunt的觀點:1948-1988年40年研究的以去除冗余為基礎(chǔ)的編碼方法為第一代編碼方法。(PCM, DPCM, 經(jīng)典變換編碼,統(tǒng)計編碼等),2024年3月3日12時9分,12,80年代以后發(fā)展的許多新方法,是第二代編碼方法?;谏窠?jīng)網(wǎng)絡(luò)理論,小波變換理論,分形理論等開發(fā)的編碼技術(shù),大多屬于這一類。,從實用方案角度來分,可分

9、為三大類:預(yù)測編碼,統(tǒng)計編碼,變換編碼。,5.統(tǒng)計編碼,根據(jù)圖象像素灰度值出現(xiàn)的概率的分布特性而進(jìn)行的壓縮編碼叫統(tǒng)計編碼。,2024年3月3日12時9分,13,熵與平均碼字長度,1)H(d) < R(d)時,一定可以設(shè)計出某種平均碼字 長更短的無失真編碼方法。2)平均碼字長小于H(d)的無失真編碼方法不存在,熵編碼,使編碼后的圖象的平均碼字長度盡可能接近圖象的熵H。基本思路是:概率大的灰度級用短碼字,概率小的,用長碼

10、字。,2024年3月3日12時9分,14,編碼技術(shù)中的幾個常用的概念,碼,碼字(字符集)變長碼 等長碼單一性代碼任意一個有限長度的碼字序列,只有一個有意義的分割。 [00,10,001,101]? [0,01,1,11] ?非續(xù)長代碼 前綴碼;任意一個碼字都不是另一個的續(xù)長。 [0,10,11] ? [0,01,11] ?,2024年3月3日12時9分,15,即時碼最佳編

11、碼 平均碼長最接近于熵的無損編碼。,2024年3月3日12時9分,16,Huffman編碼,基本哈夫曼編碼系統(tǒng)框圖,2024年3月3日12時9分,17,算法1)將灰度等級按概率大小進(jìn)行排序(降序), 每個灰度等級作為一個葉子結(jié)點,形成一棵樹;2)將兩個根節(jié)點概率最小的樹,合并(規(guī)則:這 兩個結(jié)點構(gòu)造一個雙親結(jié)點,雙親結(jié)點的概率 大小是兩者之和);重復(fù)1) 2), 直到只有一個樹為止;3)設(shè)所有

12、左后代為0,右后代為1,2024年3月3日12時9分,18,特點優(yōu)點:即時碼;最優(yōu)碼缺點:當(dāng)需要對大量符號進(jìn)行編碼時,構(gòu)造最優(yōu)哈 夫曼碼的計算量會很大。,2024年3月3日12時9分,19,,,,,,,,,例3,x8:0.04,x7:0.05,0.9,x6:0.06,x5:0.07,0.13,x4:0.10,x3:0.10,0.19,0.23,x2:0.18,0.37,0.60,x1:0.40,,,,,,,,

13、,,,,,,,,,,,,,,0.10,,黃色連線表示0,紅色連線表示1,x1:0x2:100x3:110x4:1011x5:1111x6:1110x7:10101x8:10100,2024年3月3日12時9分,20,,平均碼長:,信息熵:,編碼效率:,2024年3月3日12時9分,21,Shannon-Fano編碼,算法1)將消息非遞增排序2)按概率之和相近或相等原則將消息集一分為二3)將以上分割準(zhǔn)則遞歸地應(yīng)用到消息

14、子集,直止 最終 子集只有一個消息為止4)在分割過程中,分別給所分得的兩個子集賦予0和1,2024年3月3日12時9分,22,例4,x1:00x2:01x3:100x4:101x5:1100x6:1101x7:1110x8:1111,2024年3月3日12時9分,23,,平均碼長:,信息熵:,編碼效率:,2024年3月3日12時9分,24,6.預(yù)測編碼,預(yù)測編碼(Predictive Coding),就是根據(jù)

15、“過去”的時刻的像素值,運(yùn)用一種模型,預(yù)測當(dāng)前的像素值,預(yù)測編碼通常不直接對信號編碼,而是對預(yù)測誤差進(jìn)行編碼。當(dāng)預(yù)測比較準(zhǔn)確,誤差較小時,即可達(dá)到編碼壓縮的目的。,原理:對圖象的一個像素的離散幅度的真實值,利用其相鄰象素的相關(guān)性,預(yù)測它的下一個象素的可能值,再求兩者差,對這種具有預(yù)測性質(zhì)的差值,量化,編碼,就可以達(dá)到壓縮的目的。,2024年3月3日12時9分,25,輸入圖象,,,,,預(yù)測器,,,,?n,量化器,,編碼器,,?‘n,,解碼

16、器,傳輸,,,?‘n,,輸出圖象,,預(yù)測器,,,,預(yù)測編碼示意圖,2024年3月3日12時9分,26,,預(yù)測器:,是根據(jù)前面幾個像素的亮度值,預(yù)測而得,量化器:對?n進(jìn)行舍入,整量化,編碼器:可采用成熟的編碼技術(shù),如Huffman編碼等,解碼器:編碼器的逆,線性預(yù)測器:,,2024年3月3日12時9分,27,例5,246884210,24357863,24331447,2468842

17、10,^,?,f,預(yù)測器,,,2024年3月3日12時9分,28,在預(yù)測編碼中,最常用的是差分脈碼調(diào)制(Differential Pulse Code Modulation, DPCM),原理圖如下所示:,輸入,,,,,預(yù)測器,,?n,量化器,,編碼器,,?‘n,,解碼器,傳輸,,,?‘n,,,預(yù)測器,,,,,,,,,,輸出,2024年3月3日12時9分,29,收端解碼時的預(yù)測過程與發(fā)端相同,所用預(yù)測器也相同,收端輸出的信號是發(fā)端的近

18、似值,兩者的誤差是,注意:1)多點預(yù)測,,,,x1,x2,,,,x3,x,2024年3月3日12時9分,30,3)預(yù)測系數(shù)隨著不同的圖象而不同,但對每幅圖象都計算預(yù)測系數(shù)太麻煩,也不現(xiàn)實,可參考前人得到的數(shù)據(jù)選擇使用。在靜止圖象壓縮的國際標(biāo)準(zhǔn)(JPEG)中,對這種方法的前置點形式以及預(yù)測系數(shù)有一推薦值可供參考。,2)每行的最開始的幾個像素?zé)o法預(yù)測,這些像素需要用其他方式編碼,這是采用預(yù)測編碼所需要的額外操作,2024年3月3日12時9分

19、,31,7.變換編碼,原理:圖象數(shù)據(jù)經(jīng)過正交變換后,其變換系數(shù)具有一定的相互獨立性,(例如,對于FT來說,頻普系數(shù)大的變換系數(shù)均集中在低頻部分,而高頻部分的幅值均很小,因而可以對低頻的變換系數(shù)量化、編碼和傳輸,對高頻部分不處理,這樣可以達(dá)到圖象壓縮的目的。,構(gòu)造子圖象,正教變換,量化,編碼,解碼,反正交變換,合并子圖象,,,,,,,,,變換編碼的一般系統(tǒng)框圖,輸入,輸出,2024年3月3日12時9分,32,8.圖象編碼的國際標(biāo)準(zhǔn),,圖象

20、編碼標(biāo)準(zhǔn): JBIG,H.26x,JPEG,MPEG,,國際標(biāo)準(zhǔn)化組織(ID)和國際電報電話咨詢委員會(CCITT)聯(lián)合成立的專家組JPEG(Joint Photographic Experts Group)于1991年3月提出了ISO CDIO918號建議草案:多灰度靜止圖像的數(shù)字壓縮編碼(通常簡稱為JPEG標(biāo)準(zhǔn))。這是一個適用于彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標(biāo)準(zhǔn)。它包括基于DPCM(差分脈沖編碼

21、調(diào)制)、DCT(離散余弦變換)和Huffman編碼的有損壓縮算法兩個部分。,JPEG,2024年3月3日12時9分,33,,JPEG壓縮編碼算法的主要計算步驟如下:正向離散余弦變換(FDCT)。 量化(quantization)。 Z字形編碼(zigzag scan)。 使用差分脈沖編碼調(diào)制(differential pulse code modulation,DPCM)對直流系數(shù)(DC)進(jìn)行編碼。 使用行程長度編碼(run-

22、length encoding,RLE)對交流系數(shù)(AC)進(jìn)行編碼。 熵編碼(entropy coding)。,2024年3月3日12時9分,34,2024年3月3日12時9分,35,2024年3月3日12時9分,36,量化DCT系數(shù)的序號,2024年3月3日12時9分,37,(源于http://www.btc.sh.cn/wsxy/digi/d4z.htm),2024年3月3日12時9分,38,·MPEG-3:原本針對于H

23、DTV(1920×1080),后來被MPEG-2代替。 ·MPEG-4:針對多媒體應(yīng)用的圖像編碼標(biāo)準(zhǔn)。 ·MPEG-7:基于內(nèi)容表示的標(biāo)準(zhǔn),應(yīng)用于多媒體信息的搜索, 過濾,組織和處理。,MPEG,MPEG(Moving Pictures Experts Group)是 ISO/IEC/JTC/SC2/WG11的一個小組。它的工作兼顧了JPEG標(biāo)準(zhǔn)和CCITT專家組的H.261標(biāo)準(zhǔn),于1

24、990年形成了一個標(biāo)準(zhǔn)草案。,MPEG標(biāo)準(zhǔn)分成兩個階段:第一個階段(MPEG-I)是針對傳輸速率為 lMb/s到l.5Mb/s的普通電視質(zhì)量的視頻信號的壓縮;第二個階段(MPEG-2)目標(biāo)則是對每秒30幀的720x572分辨率的視頻信號進(jìn)行壓縮;在擴(kuò)展模式下,MPEG-2可以對分辨率達(dá)1440Xl152高清晰度電視(HDTV)的信號進(jìn)行壓縮。,2024年3月3日12時9分,39,回答問題,2024年3月3日12時9分,40,作業(yè):8.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論