版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、<p> 編 號(hào): </p><p> 審定成績(jī): </p><p> 重慶郵電大學(xué)移通學(xué)院</p><p><b> 畢業(yè)設(shè)計(jì)(論文)</b></p><p> 填表時(shí)間: 2013年06月</p><p> 重慶郵電大學(xué)
2、移通學(xué)院教務(wù)處制</p><p> 設(shè)計(jì)(論文)題目:圖像有損壓縮技術(shù)的研究</p><p> 重慶郵電大學(xué)移通學(xué)院畢業(yè)設(shè)計(jì)(論文)任務(wù)書(shū)</p><p> 設(shè)計(jì)(論文)題目 圖像有損壓縮技術(shù)的研究 </p><p> 學(xué)生姓名 系別 通信工程 專(zhuān)業(yè) 通信工程
3、 班級(jí) 12 </p><p> 指導(dǎo)教師 高飛 職稱(chēng) 講師 聯(lián)系電話(huà) </p><p> 教師單位 重慶郵電大學(xué)移通學(xué)院 下任務(wù)日期 2013 年 1 月 5 日</p><p> 備注:此任務(wù)書(shū)由指導(dǎo)教師填寫(xiě),并于畢業(yè)設(shè)計(jì)(論文)開(kāi)始前下達(dá)給學(xué)生。&l
4、t;/p><p><b> 摘 要</b></p><p> 有損壓縮技術(shù)是利用了人類(lèi)對(duì)圖像或聲波中的某些頻率成分不敏感的特性,允許壓縮過(guò)程中損失一定的信息;雖然不能完全回復(fù)原始數(shù)據(jù),但是所損失的部分對(duì)理解原始圖像的影響縮小,卻換來(lái)了大得多的壓縮比。常見(jiàn)的聲音、圖像、視頻壓縮基本都是有損的。在多媒體應(yīng)用中,常見(jiàn)的壓縮方法有:預(yù)測(cè)編碼,變換編碼,矢量量化編碼,分形編碼
5、等,混合編碼是近年來(lái)廣泛采用的方法。</p><p> 有損數(shù)據(jù)壓縮方法是經(jīng)過(guò)壓縮、解壓的數(shù)據(jù)與原始數(shù)據(jù)不同但是非常接近的壓縮方法。有損數(shù)據(jù)壓縮又稱(chēng)破壞型壓縮,即將次要的信息數(shù)據(jù)壓縮掉,犧牲一些質(zhì)量來(lái)減少數(shù)據(jù)量,使壓縮比提高。它是與無(wú)損數(shù)據(jù)壓縮對(duì)應(yīng)的壓縮方法。根據(jù)各種格式設(shè)計(jì)的不同,有損數(shù)據(jù)壓縮都會(huì)產(chǎn)生丟失:壓縮與解壓文件都會(huì)帶來(lái)漸進(jìn)的質(zhì)量下降。</p><p> 本文首先論述了數(shù)字圖
6、像壓縮技術(shù)的概況及發(fā)展趨勢(shì),詳細(xì)介紹了現(xiàn)代圖像壓縮技術(shù)的標(biāo)準(zhǔn)、分類(lèi)及主要算法。其次著重就圖像的有損壓縮技術(shù)進(jìn)行了研究和討論。通過(guò)查閱大量文獻(xiàn),系統(tǒng)的分析了有損壓縮技術(shù),介紹了主要有損壓縮的方法:預(yù)測(cè)編碼、變換編碼、基于模型編碼等有損壓縮的主要技術(shù),最后通過(guò)結(jié)合無(wú)損壓縮從精確度及壓縮比率等方面與損壓縮進(jìn)行詳細(xì)比較,更深層次的對(duì)損壓縮技術(shù)進(jìn)行了解。并得出圖像有損壓縮技術(shù)的特點(diǎn)和優(yōu)勢(shì),以及在未來(lái)壓縮領(lǐng)域中的應(yīng)用方向。</p>&
7、lt;p> 【關(guān)鍵詞】有損壓縮 無(wú)損壓縮 壓縮編碼技術(shù) 比較 變換編碼</p><p><b> ABSTRACT</b></p><p> Lossy compression is to use the human is not sensitive to image or sound waves of certain frequency comp
8、onents of the features that allow compression loss in the process of certain information; Although not fully recover the raw data, but the loss of part of understanding the influence of the original image is narrow, but
9、the much larger compression ratio. Common voice, image and video compression are hurt. In multimedia applications, the common compression method are: predictive coding, transfo</p><p> Lossy data compressio
10、n method is compressed and decompressed data with different but very close to the original data compression method. Lossy data compression is also called destructiveness compression, data compression is of secondary impo
11、rtance, sacrifice some quality to reduce the amount of data, to improve the compression ratio. It is corresponding compression and lose data compression method. According to different various format design, the lost can
12、produce lossy data compression: compres</p><p> This paper first discusses the general situation and development trend of digital image compression technology, introduced the modern standards, classificatio
13、n and main algorithm of image compression technology. Secondly emphasize image lossy compression techniques are studied and discussed. Through consulting a large number of literature, systematic analysis of lossy compres
14、sion technology, introduces the main lossy compression methods: predictive coding, transform coding, based on the lossy co</p><p> 【Key words】Lossy compression Lossless compression Coding and compressing
15、technology Compare transform coding</p><p><b> 目 錄</b></p><p><b> 前 言1</b></p><p> 第一章 圖像壓縮技術(shù)的研究及進(jìn)展2</p><p> 第一節(jié) 圖像壓縮技術(shù)概述2</p>
16、;<p> 第二節(jié) 圖像壓縮技術(shù)標(biāo)準(zhǔn)2</p><p> 一、靜止圖像壓縮標(biāo)準(zhǔn)2</p><p> 二、運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)3</p><p> 第三節(jié) 圖像壓縮技術(shù)分類(lèi)6</p><p> 第四節(jié) 圖像壓縮技術(shù)的發(fā)展趨勢(shì)7</p><p> 第五節(jié) 本章小結(jié)7</p&g
17、t;<p> 第二章 圖像有損壓縮技術(shù)8</p><p> 第一節(jié) 有損壓縮概述8</p><p> 第二節(jié) 有損壓縮機(jī)制9</p><p> 第三節(jié) 本章小結(jié)10</p><p> 第三章 圖像有損壓縮的主要編碼技術(shù)11</p><p> 第一節(jié) 預(yù)測(cè)編碼11</
18、p><p> 一、脈沖編碼調(diào)制11</p><p> 二、差分脈沖編碼調(diào)制12</p><p> 三、自適應(yīng)差分脈沖編碼調(diào)制13</p><p> 第二節(jié) 變換編碼14</p><p> 第三節(jié) 基于模型編碼15</p><p> 一、基于語(yǔ)義編碼16</p>
19、<p> 二、基于物體編碼17</p><p> 第四節(jié) 分形編碼18</p><p> 一、分形編碼的思路18</p><p> 二、分形編碼的方法和步驟19</p><p> 三、分形編碼的特點(diǎn)19</p><p> 第五節(jié) 其它編碼20</p><p&
20、gt;<b> 一、子帶編碼20</b></p><p> 二、矢量量化編碼21</p><p><b> 三、感知編碼22</b></p><p> 第六節(jié) 本章小結(jié)23</p><p> 第四章 圖像有損壓縮與無(wú)損壓縮比較25</p><p>
21、第一節(jié) 有損壓縮技術(shù)的優(yōu)缺點(diǎn)25</p><p> 一、有損壓縮的優(yōu)點(diǎn)25</p><p> 二、有損壓縮的缺點(diǎn)25</p><p> 第二節(jié) 無(wú)損壓縮技術(shù)的優(yōu)缺點(diǎn)26</p><p> 一、無(wú)損壓縮的優(yōu)點(diǎn)26</p><p> 二、無(wú)損壓縮的缺點(diǎn)26</p><p>
22、 第三節(jié) 兩種不同圖像壓縮方式的綜合比較27</p><p> 一、兩種壓縮方式在精確度上的比較27</p><p> 二、兩種壓縮方式擁有不同的壓縮比率27</p><p> 三、兩種壓縮方式可逆性的差別27</p><p> 第四節(jié) 本章小結(jié)28</p><p><b> 結(jié)
23、論29</b></p><p><b> 致 謝30</b></p><p><b> 參考文獻(xiàn)31</b></p><p><b> 附 錄33</b></p><p><b> 一、英文原文33</b></p&g
24、t;<p><b> 二、英文翻譯36</b></p><p><b> 前 言</b></p><p> 在我們的生活中無(wú)論是普通人還是一些工作在科研領(lǐng)域的科技工作者,都會(huì)對(duì)數(shù)據(jù)信息進(jìn)行傳輸與存儲(chǔ)有所接觸。隨著數(shù)字時(shí)代的到來(lái),影像的制作、處理和存儲(chǔ)都脫離了傳統(tǒng)的介質(zhì),相比傳統(tǒng)方式,數(shù)字圖像有著傳統(tǒng)方式無(wú)法比擬的優(yōu)越性。而
25、對(duì)大量圖像數(shù)據(jù)進(jìn)行傳輸要保證其傳輸?shù)馁|(zhì)量、速度等,對(duì)其進(jìn)行存儲(chǔ)也要考慮其大小容量等。所以,要解決大量圖像數(shù)據(jù)的傳輸與存儲(chǔ),在當(dāng)前傳輸媒介中,存在傳輸帶寬的限制,故在一些限制條件下傳輸盡可能多的活動(dòng)圖像,如何能對(duì)圖像數(shù)據(jù)進(jìn)行最大限度的壓縮,并且保證壓縮后的重建圖像能夠被用戶(hù)所接受等問(wèn)題,就成為研究圖像壓縮技術(shù)的問(wèn)題之源。</p><p> 圖像壓縮的目的就是把原來(lái)較大的圖像用盡量少的字節(jié)表示和傳輸,并且要求復(fù)原圖
26、像有較好的質(zhì)量。利用圖像壓縮可以減輕圖像存儲(chǔ)和傳輸?shù)呢?fù)擔(dān),使圖像在網(wǎng)絡(luò)上實(shí)現(xiàn)快速傳輸和實(shí)時(shí)處理。圖像數(shù)據(jù)之所以可以進(jìn)行壓縮,主要是因?yàn)橐话阍紙D像數(shù)據(jù)是高度相關(guān)的,都含有大量的冗余信息。圖像壓縮編碼的目的就是消除各種冗余,并在給定的畸變下用盡量少的比特?cái)?shù)來(lái)表征和重建圖像,使它符合預(yù)定應(yīng)用場(chǎng)合的要求。</p><p> 雖然人們總是期望無(wú)損壓縮,但冗余度很少的信息對(duì)象,用無(wú)損壓縮技術(shù)并不能得到可接受的結(jié)果。當(dāng)使用
27、的壓縮方法會(huì)造成一些信息損失時(shí),關(guān)鍵的問(wèn)題是看這種損失的影響。有損壓縮經(jīng)常用于壓縮音頻、灰度或彩色圖像和視頻對(duì)象等,因?yàn)樗鼈儾⒉灰缶_的數(shù)據(jù)。在由音頻、彩色圖像、視頻以及其他專(zhuān)門(mén)數(shù)據(jù)組成的多媒體對(duì)象中,可以單獨(dú)使用有損壓縮技術(shù),也可與無(wú)損壓縮技術(shù)共同使用。有損壓縮編碼不具有可恢復(fù)性和可逆性,該編碼在壓縮時(shí)舍棄冗余的數(shù)據(jù)。所以有損壓縮技術(shù)也走進(jìn)了人們的視野。</p><p> 第一章 圖像壓縮技術(shù)的研究及進(jìn)展
28、</p><p> 第一節(jié) 圖像壓縮技術(shù)概述</p><p> 圖像壓縮就是減少表示數(shù)字圖像時(shí)需要的數(shù)據(jù)量。是指以較少的比特有損或無(wú)損地表示原來(lái)的像素矩陣的技術(shù),也稱(chēng)圖像編碼[1]。</p><p> 在我們的生活中無(wú)論是普通人還是一些工作在科研領(lǐng)域的科技工作者,都會(huì)對(duì)數(shù)據(jù)信息進(jìn)行傳輸與存儲(chǔ)有所接觸。隨著數(shù)字時(shí)代的到來(lái),影像的制作、處理和存儲(chǔ)都脫離了傳統(tǒng)的介
29、質(zhì)(紙、膠片等),相比傳統(tǒng)方式,數(shù)字圖像有著傳統(tǒng)方式無(wú)法比擬的優(yōu)越性。但是每種技術(shù)出現(xiàn)的同時(shí),都有制約其發(fā)展的一面。比如數(shù)字電視、遙感照片、由雷達(dá)、飛機(jī)等提供的軍事偵察圖像、可視電話(huà)、會(huì)議電視和傳真照片,在教育、商業(yè)、管理等領(lǐng)域的圖文資料、CT機(jī)、X射線(xiàn)機(jī)等設(shè)備的醫(yī)用圖像、天氣云圖等等,無(wú)論是利用哪種傳輸媒介進(jìn)行傳輸?shù)男畔?,都?huì)遇到需要對(duì)大量圖像數(shù)據(jù)進(jìn)行傳輸與存儲(chǔ)的問(wèn)題。而對(duì)大量圖像數(shù)據(jù)進(jìn)行傳輸要保證其傳輸?shù)馁|(zhì)量、速度等,對(duì)其進(jìn)行存儲(chǔ)也
30、要考慮其大小容量等。所以,要解決大量圖像數(shù)據(jù)的傳輸與存儲(chǔ),在當(dāng)前傳輸媒介中,存在傳輸帶寬的限制,故在一些限制條件下傳輸盡可能多的活動(dòng)圖像,如何能對(duì)圖像數(shù)據(jù)進(jìn)行最大限度的壓縮,并且保證壓縮后的重建圖像能夠被用戶(hù)所接受等問(wèn)題,就成為研究圖像壓縮技術(shù)的問(wèn)題之源。</p><p> 圖像數(shù)據(jù)之所以可以進(jìn)行壓縮,主要是因?yàn)橐话阍紙D像數(shù)據(jù)是高度相關(guān)的,都含有大量的冗余信息。圖像壓縮編碼的目的就是消除各種冗余[2],并在給
31、定的畸變下用盡量少的比特?cái)?shù)來(lái)表征和重建圖像,使它符合預(yù)定應(yīng)用場(chǎng)合的要求。</p><p> 第二節(jié) 圖像壓縮技術(shù)標(biāo)準(zhǔn)</p><p> 一、靜止圖像壓縮標(biāo)準(zhǔn)</p><p> ?、?JPEG標(biāo)準(zhǔn):JPEG全名為Joint Photographic Experts Group,是一個(gè)在國(guó)際標(biāo)準(zhǔn)組織(ISO)下從事靜止圖像壓縮標(biāo)準(zhǔn)制定的委員會(huì)。JPEG標(biāo)準(zhǔn)從198
32、6年正式開(kāi)始制訂,1988年決定采用以圖像質(zhì)量最好的ADCT(Adaptive Discrete Cosine Transform)方式為基礎(chǔ)的算法作標(biāo)準(zhǔn),于1991年3月提出8號(hào)標(biāo)準(zhǔn)“連續(xù)色調(diào)靜止圖像的數(shù)字壓縮編碼”,即JPEG標(biāo)準(zhǔn)。它在較低的計(jì)算復(fù)雜度下,能提供較高的壓縮比與保真度[3]。</p><p> JPEG采用4種編解碼方式:串行DCT[4](Discrete Cosine Transform)方
33、式、漸進(jìn)浮現(xiàn)式DCT方式、無(wú)失真方式和分層方式。由于JPEG優(yōu)良的品質(zhì),使它在短短幾年內(nèi)就獲得極大的成功。隨著多媒體應(yīng)用領(lǐng)域激增,傳統(tǒng)的JPEG壓縮技術(shù)已無(wú)法滿(mǎn)足人們對(duì)多媒體影像資料的要求。因此,更高壓縮率以及更多功能的新一代靜止影像壓縮技術(shù)JPEG2000就誕生了。</p><p> ?、?JPEG2000:JPEG2000[5],正式名稱(chēng)為“ISO 15444”,亦是由JPEG組織負(fù)責(zé)制定。自1997年3月開(kāi)
34、始籌劃,2000年規(guī)定基本編碼系統(tǒng)的最終協(xié)議草案才提出。JPEG2000與JPEG最大的不同,在于它放棄了JPEG所采用的以DCT為主的區(qū)塊編碼方式,而改用以DWT(Discrete Wavelet Transform)為主的多分辨率編碼方式。JPEG2000的新特征有:</p><p> JPEG2000作為JPEG的升級(jí)版,具有良好的低比特率性能,特別是對(duì)細(xì)節(jié)豐富的圖像以0.25bpp的比特率進(jìn)行壓縮時(shí),總
35、體上其壓縮率比JPEG高約30%左右;</p><p> JPEG2000同時(shí)支持有損和無(wú)損壓縮;而JPEG只支持有損壓縮;</p><p> JPEG2000能實(shí)現(xiàn)漸進(jìn)傳送。它先傳輸圖像的輪廓,然后逐步傳輸圖像數(shù)據(jù)的細(xì)節(jié),接收端重構(gòu)圖像時(shí)讓圖像由朦朧到清晰顯示,而不像JPEG那樣由上到下由左到右的顯示; </p><p> JPEG2000支持所謂的“感興趣
36、區(qū)域”編碼(Region of interest coding)??扇我庵付▓D像上感興趣區(qū)域的壓縮質(zhì)量,亦可以選擇指定的部分先解壓縮以突出重點(diǎn)。 </p><p> 二、運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)</p><p> ?。ㄒ唬㎝PEG系列 </p><p> MPEG(Moving Picture Experts Group)運(yùn)動(dòng)圖像專(zhuān)家組成立于1988年,專(zhuān)門(mén)從事運(yùn)動(dòng)圖像
37、和伴音編碼的標(biāo)準(zhǔn)制定。MPEG最初的三個(gè)任務(wù)是制定1.5Mb/s,10Mb/s,40Mb/s的壓縮編碼標(biāo)準(zhǔn),即MPEG-1、MPEG-2、MPEG-3,后因MPEG-2的功能使MPEG-3多余,故MPEG-3被撤消。MPEG-4于1994年開(kāi)始制定,其目的是實(shí)現(xiàn)甚低碼率的音/視頻壓縮編碼。</p><p> MPEG-1是1991年11月提出草案,1992年11月通過(guò),1993年8月公布的。它適用于1.5Mb/
38、s速率的數(shù)字存儲(chǔ)媒體的運(yùn)動(dòng)圖像及伴音的壓縮編碼。MPEG-1追求高的壓縮比,去除圖像序列的時(shí)間冗余度,同時(shí)滿(mǎn)足多媒體等隨機(jī)存取的要求。它的圖像類(lèi)型有三種:I圖像,采用內(nèi)部編碼,不參照其他圖像,亦稱(chēng)內(nèi)部編碼圖像[6];P圖像,采用預(yù)測(cè)編碼,參照前一幅I或P圖像作運(yùn)動(dòng)補(bǔ)償編碼,亦稱(chēng)預(yù)測(cè)編碼;B圖像,采用雙向預(yù)測(cè)編碼,參照前一幅和后一幅I或P圖像作雙向運(yùn)動(dòng)補(bǔ)償編碼,亦稱(chēng)雙向預(yù)測(cè)圖像。</p><p> MPEG-2制
39、定于1994年,其設(shè)計(jì)目標(biāo)是高級(jí)工業(yè)標(biāo)準(zhǔn)的圖像質(zhì)量以及更高的傳輸率。它進(jìn)一步提高了壓縮比,改善了音頻、視頻質(zhì)量,采用的核心技術(shù)是分塊DCT和幀間運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)技術(shù)。MPEG-2所能提供的傳輸率在3~10Mb/s間,在NTSC制下的分辨率可達(dá)720×486;可提供廣播級(jí)的視像和CD級(jí)的音質(zhì);向下兼容MPEG-1,使得大多數(shù)MPEG-2解碼器可播放MPEG-1格式的數(shù)據(jù),如VCD;MPEG-2除了作為DVD的指定標(biāo)準(zhǔn)外,還可以用于為
40、廣播、有線(xiàn)電視網(wǎng)、電纜網(wǎng)絡(luò)以及衛(wèi)星直播提供廣播級(jí)的數(shù)字視頻;MPEG-2可提供一個(gè)較廣范圍的壓縮比,以適應(yīng)不同畫(huà)面質(zhì)量、存儲(chǔ)容量以及帶寬的要求。</p><p> MPEG-4是對(duì)數(shù)字音/視頻數(shù)據(jù)進(jìn)行壓縮、通信、存取和操作管理等的新標(biāo)準(zhǔn),并為各種通信環(huán)境提供一種通用的技術(shù)解決方案。MPEG專(zhuān)家組深入分析了信息領(lǐng)域中計(jì)算機(jī)、通信以及以電視為代表的消費(fèi)電器即3C交叉融合的方式后,認(rèn)為MPEG-4應(yīng)提供用于通信的新方
41、式,其中心是基于內(nèi)容的AV信息存儲(chǔ)、處理與操作,支持交互性、高壓縮比以及通用存儲(chǔ)性等功能。在其結(jié)構(gòu)上應(yīng)具有適應(yīng)性與可擴(kuò)張性,以適應(yīng)軟、硬件技術(shù)的不斷發(fā)展,及時(shí)融合新的技術(shù)。由于MPEG-4的中心是基于內(nèi)容與交互性的,它就不再對(duì)低碼率范圍做出特別要求。</p><p> MPEG-4在通信信息描述中,首次提出了對(duì)象的概念,如視頻對(duì)象VO(Video Object)、音頻對(duì)象AO(Audio Object)等,這是
42、一個(gè)新的飛躍。在編碼方案上,MPEG-4仍是以塊為基礎(chǔ)的混合編碼。MPEG-4標(biāo)準(zhǔn)主要應(yīng)用于視頻電話(huà)、視頻電子郵件和電子新聞等,其傳輸速率要求較低,在4.8~64kb/s之間,分辨率為176144。MPEG-4利用很窄的帶寬,通過(guò)幀重建技術(shù),壓縮和傳輸數(shù)據(jù),以求以最少數(shù)據(jù)獲得最佳圖像質(zhì)量。MPEG-4更適用于交互AV服務(wù)以及遠(yuǎn)程監(jiān)控。</p><p> MPEG-7由MPEG委員會(huì)于1998年10月提出提議,2
43、001年9月正式成為國(guó)際標(biāo)準(zhǔn),又稱(chēng)為“多媒體內(nèi)容描述接口(Multimedia Content Description Interface)”,其目標(biāo)是建立對(duì)多媒體信息內(nèi)容的標(biāo)準(zhǔn)化描述,試圖規(guī)范不同種類(lèi)多媒體信息的描述而不受表達(dá)形式的限制。這些描述要與信息內(nèi)容直接相關(guān)以便用來(lái)快速有效的查詢(xún)、訪(fǎng)問(wèn)各種多媒體信息。</p><p> MPEG-7的應(yīng)用范圍廣泛,既可以應(yīng)用于存儲(chǔ),也可用于流式應(yīng)用(如廣播、將模型加入
44、Internet等)。它可以在實(shí)時(shí)或非實(shí)時(shí)環(huán)境下應(yīng)用,如數(shù)字圖書(shū)館、多媒體編輯等。另外,MPEG-7在教育、新聞、導(dǎo)游信息、娛樂(lè)、研究業(yè)務(wù)、地理信息系統(tǒng)、醫(yī)學(xué)、購(gòu)物、建筑等各方面均有較深的應(yīng)用潛力。</p><p> MPEG-21是基于“多媒體框架(Multimedia Framework)標(biāo)準(zhǔn)”的,其最終目的是建立一個(gè)多媒體框架,以通過(guò)預(yù)購(gòu)網(wǎng)絡(luò)和設(shè)備使多媒體資源在用戶(hù)之間透明方便的使用。MPEG-21的基本
45、框架要素包括數(shù)字項(xiàng)目說(shuō)明、內(nèi)容表示、數(shù)字項(xiàng)目的識(shí)別和描述、內(nèi)容管理和使用、知識(shí)產(chǎn)權(quán)管理和保護(hù)、終端和網(wǎng)絡(luò)、事件報(bào)告等。它支持的功能有:通過(guò)網(wǎng)絡(luò)存儲(chǔ),使用并交互操作多媒體對(duì)象;實(shí)現(xiàn)多種業(yè)務(wù)模型,包括對(duì)版權(quán)和交易的自動(dòng)管理;對(duì)內(nèi)容進(jìn)行隱私的尊重等。目前,這一標(biāo)準(zhǔn)仍處于開(kāi)發(fā)當(dāng)中。</p><p> (二)H.26X系列 </p><p> 1984年國(guó)際電報(bào)電話(huà)咨詢(xún)委員會(huì)的第23研究組建立了
46、一個(gè)專(zhuān)家組專(zhuān)門(mén)研究電視電話(huà)的編碼問(wèn)題。經(jīng)過(guò)研究與努力,1988年形成草案,1990年12月通過(guò)ITU-T的H.261[7]建議。</p><p> H.261是ITU-T針對(duì)可視電話(huà)和會(huì)議、窄帶ISDN等要求實(shí)時(shí)編碼和低延時(shí)應(yīng)用提出的一個(gè)編碼標(biāo)準(zhǔn)。它允許“采用p64kbit的圖像業(yè)務(wù)的圖像編解碼”,因而H.261簡(jiǎn)稱(chēng)p64。其中p是一個(gè)整數(shù),取值范圍為1~30,對(duì)應(yīng)比特率為64kb/s~1.92Mb/s。它建議
47、采用中間格式CIF(Common Intermediate Format)和QCIF(Quarter CIF)解決不同制式通信的矛盾;解決了編碼算法問(wèn)題。H.261采用了運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)和離散余弦變換相結(jié)合的混合編碼方案,獲得很好的圖像壓縮效果。</p><p> 1995年,在H.261的基礎(chǔ)上,ITU-T總結(jié)當(dāng)時(shí)國(guó)際上視頻圖像壓縮編碼的最新進(jìn)展,針對(duì)低比特率視頻應(yīng)用制定了H.263標(biāo)準(zhǔn)。它提高了運(yùn)動(dòng)補(bǔ)償?shù)木龋?/p>
48、常用于超低速率的圖像傳輸,被公認(rèn)為是以像素為基礎(chǔ)的采用第一代編碼技術(shù)的混合編碼方案所能達(dá)到的最佳結(jié)果。之后,ITU-T又對(duì)其進(jìn)行了補(bǔ)充,以提高編碼效率,增強(qiáng)編碼功能。補(bǔ)充修訂的版本有1998年的H.263+,2000年的H.263++。H.263采用第一代編碼技術(shù),在低速率視頻傳輸質(zhì)量,抗誤碼能力方面有明顯提高,在視頻業(yè)務(wù)傳輸中得到廣泛應(yīng)用。</p><p> 與H.261只能工作在CIF、QCIF兩種格式不同
49、,H.263的信源編碼器可以工作于5種圖像格式:QCIF、Sub-QCIF、CIF、4CIF、16CIF。另外,H.263還在H.261基本編碼算法的基礎(chǔ)上提供了四種可選編碼模式:非限制運(yùn)動(dòng)矢量模式、基于語(yǔ)法的算術(shù)編碼模式、高級(jí)預(yù)測(cè)模式以及PB幀模式。由于僅限于五種固定圖像大小、形狀和時(shí)鐘頻率,它應(yīng)用的靈活性較低。</p><p> H.263+[8]即ITU-T在1998年通過(guò)的H.263第二版,增加了12個(gè)
50、新的高級(jí)模式,修正了第一版中的非限制運(yùn)動(dòng)矢量模式。修訂版首先在視頻格式多樣性上做了改進(jìn),還提出一些新技術(shù):如附加增強(qiáng)信息模式和增強(qiáng)參考幀再采樣模式,進(jìn)一步擴(kuò)大適用范圍,支持圖像凍結(jié)和快照,以及多分辨率視頻的應(yīng)用,同時(shí)還增加了一些新技術(shù)來(lái)增強(qiáng)抗誤碼的能力:如分片結(jié)構(gòu)模式、增強(qiáng)參考幀選擇模式等,使視頻信號(hào)經(jīng)過(guò)壓縮編碼后能夠在具有較大噪聲干擾的窄帶信道PSTN(Integrate Services Digital Network)和無(wú)限移動(dòng)信
51、道等上傳輸。通過(guò)使用去方塊效應(yīng)濾波器,降低分辨率更新模式和修正量化模式等新技術(shù),重建圖像的主觀(guān)質(zhì)量顯著提高。由于H.263+的高級(jí)模式有些不能同時(shí)使用,有些需結(jié)合使用,如何選擇合適的編碼模式結(jié)合,對(duì)使用者來(lái)說(shuō)很困難,因此ITU-T于2000年11月提出了H.263++,稱(chēng)為H.263的第三版。它在H.263+的基礎(chǔ)上增加了三個(gè)高級(jí)模式。</p><p> H.26L[9]標(biāo)準(zhǔn)是ITU-T和ISO/IEC聯(lián)合制定
52、的最新的圖像壓縮編碼標(biāo)準(zhǔn),它最先由ITU-T的VCEG于1997年提出的,它的目標(biāo)是提出一種更高性能的視頻質(zhì)量有實(shí)質(zhì)性提高的視頻編碼標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)于2003年3月完成,在ITU-T中被稱(chēng)為Recommendation H .264而在ISO/IEC中成為MPEG-4標(biāo)準(zhǔn)的第10部分(ISO/IEC 14496-10 AVC,簡(jiǎn)稱(chēng)MPEG-4-10)。</p><p> H.26L的一個(gè)基本概念是引入了兩個(gè)不同的層
53、次:視頻編碼層(VCL:Video Coding Layer)以及網(wǎng)絡(luò)適配層(NAL:Network Adapter Layer),前者負(fù)責(zé)對(duì)視頻進(jìn)行高效的壓縮,后者則負(fù)責(zé)根據(jù)網(wǎng)絡(luò)的傳輸需要進(jìn)行編碼數(shù)據(jù)的打包。H.26L相對(duì)于其他標(biāo)準(zhǔn)有以下的特點(diǎn):低碼率、高質(zhì)量、可達(dá)到比H.263+提高一倍以上的編碼效率;廣闊的應(yīng)用范圍,既可用于嚴(yán)格時(shí)延限制的實(shí)時(shí)通信,可用于對(duì)時(shí)延要求不高的其他應(yīng)用;穩(wěn)健性,在網(wǎng)絡(luò)中傳輸時(shí),有較強(qiáng)的抗誤碼性能;對(duì)各種網(wǎng)
54、絡(luò)的友好性,提供了友好的網(wǎng)絡(luò)接口。</p><p> 第三節(jié) 圖像壓縮技術(shù)分類(lèi)</p><p> 圖像壓縮的優(yōu)點(diǎn)在于,如抗干擾、處理精度高、靈活性好等,其中主要缺點(diǎn)是數(shù)據(jù)量太大,傳輸中占頻帶太寬。數(shù)字圖像數(shù)據(jù)量的壓縮按應(yīng)用不同可分為以下三類(lèi):</p><p> ?、?信息保持型數(shù)據(jù)壓縮(無(wú)損壓縮):它要求壓縮圖像的比特?cái)?shù)而不丟失任何信息。主要用在圖像信息保存中
55、,要求圖像存儲(chǔ)能保持信息并能快速存取圖像。例如短時(shí)隨機(jī)存取主要用于處理過(guò)程中的各個(gè)環(huán)節(jié)的存儲(chǔ),它要求經(jīng)過(guò)不同存儲(chǔ)介質(zhì)多次重復(fù)不變質(zhì)、不失真。又如遙感圖像,攝取地球上許多地區(qū),因來(lái)不及處理,可暫時(shí)保存以便以后處理。</p><p> ?、?保真度型數(shù)據(jù)壓縮:傳送的圖像應(yīng)該能夠適應(yīng)通信的通道限制,若接收端是人觀(guān)看的情況,由于人眼的生理特性不需要過(guò)高的空間分辨率和灰度分辨率,因此在壓縮過(guò)程中允許丟失一些人感覺(jué)不到的信息
56、,這就是一種允許微量失真的圖像壓縮。數(shù)字電視、圖像傳輸和多媒體中常用這種壓縮。</p><p> ?、?特征保持型數(shù)據(jù)壓縮(有損壓縮):許多圖像處理的目的是為了計(jì)算機(jī)的識(shí)別、分析、控制,這時(shí)并不需要圖像的全部細(xì)節(jié)及灰度細(xì)節(jié)。只要能保存圖像中的感興趣的特征信息,無(wú)用信息都可丟掉。例如識(shí)別軍艦類(lèi)型、巡航導(dǎo)彈地形識(shí)別等只要輪廓信息就可以了。又如在機(jī)場(chǎng)跑道的識(shí)別中農(nóng)田、房屋信息皆可丟掉,只保留跑道的圖像信息即可。這些圖像
57、信號(hào)可以進(jìn)行特征保持型數(shù)據(jù)壓縮。圖像編碼也可以根據(jù)編碼所在數(shù)據(jù)域劃分為空間域編碼和變換域編碼。</p><p> 第四節(jié) 圖像壓縮技術(shù)的發(fā)展趨勢(shì)</p><p> 從國(guó)際數(shù)據(jù)壓縮技術(shù)的發(fā)展尤其是MPEG的發(fā)展可以看出,基于內(nèi)容的圖像壓縮編碼方法是未來(lái)編碼的發(fā)展趨勢(shì)。它不僅能滿(mǎn)足進(jìn)一步獲得更大的圖像數(shù)據(jù)壓縮比的要求,而且能夠?qū)崿F(xiàn)人機(jī)對(duì)話(huà)的功能。另外,任意形狀物體的模型建立的關(guān)鍵問(wèn)題還沒(méi)
58、有解決,這嚴(yán)重影響其應(yīng)用的廣泛性。</p><p> 通過(guò)元數(shù)據(jù)進(jìn)行編碼也是今后編碼的發(fā)展方向。元數(shù)據(jù)是指詳細(xì)的描述音/視頻信息的基本元素,利用元數(shù)據(jù)來(lái)描述音視頻對(duì)象的同時(shí)也就完成了編碼,因?yàn)榇藭r(shí)編碼的對(duì)象是圖像的一種描述而不再是圖像本身。從另一個(gè)角度來(lái)說(shuō),進(jìn)一步提高壓縮比,提高碼流的附屬功能(碼流內(nèi)容的可訪(fǎng)問(wèn)性、抗誤碼能力、可伸縮性等)也將是未來(lái)的編碼的兩個(gè)發(fā)展方向。 </p><p>
59、;<b> 本章小結(jié)</b></p><p> 圖像壓縮技術(shù)已經(jīng)為開(kāi)拓全新的應(yīng)用領(lǐng)域打下了堅(jiān)實(shí)的基礎(chǔ)。圖像壓縮技術(shù)的基本應(yīng)用在更深更廣層次上的應(yīng)用就成為我們研究的熱點(diǎn)。本章重點(diǎn)對(duì)現(xiàn)代圖像壓縮技術(shù)進(jìn)行概括性介紹。圖像壓縮就是減少表示數(shù)字圖像時(shí)需要的數(shù)據(jù)量。是指以較少的比特有損或無(wú)損地表示原來(lái)的像素矩陣的技術(shù),也稱(chēng)圖像編碼。其次介紹了靜態(tài)與動(dòng)態(tài)圖像的壓縮標(biāo)準(zhǔn)。最后分別介紹了圖像壓縮技術(shù)的分類(lèi)
60、。</p><p><b> 圖像有損壓縮技術(shù)</b></p><p> 隨著多媒體技術(shù)和通訊技術(shù)的不斷發(fā)展,多媒體娛樂(lè)、信息高速公路等不斷對(duì)信息數(shù)據(jù)的存儲(chǔ)和傳輸提出了更高的要求,也給現(xiàn)有的有限帶寬以嚴(yán)峻的考驗(yàn),特別是具有龐大數(shù)據(jù)量的數(shù)字圖像通信,更難以傳輸和存儲(chǔ),極大地制約了圖像通信的發(fā)展,因此圖像壓縮技術(shù)受到了越來(lái)越多的關(guān)注。圖像壓縮的目的就是把原來(lái)較大的圖像
61、用盡量少的字節(jié)表示和傳輸,并且要求復(fù)原圖像有較好的質(zhì)量。利用圖像壓縮可以減輕圖像存儲(chǔ)和傳輸?shù)呢?fù)擔(dān),使圖像在網(wǎng)絡(luò)上實(shí)現(xiàn)快速傳輸和實(shí)時(shí)處理。</p><p> 第一節(jié) 有損壓縮概述</p><p> 有損壓縮[10]是對(duì)利用了人類(lèi)是絕對(duì)圖像或聲波中的某些頻率成分不敏感的特性,允許壓縮過(guò)程中損失一定的信息;雖然不能完全回復(fù)原始數(shù)據(jù),但是所損失的部分對(duì)理解原始圖像的影響縮小有損壓縮,卻換來(lái)了
62、大得多的壓縮比。有損壓縮廣泛應(yīng)用于語(yǔ)音,圖像和視頻數(shù)據(jù)的壓縮。常見(jiàn)的聲音、圖像、視頻壓縮基本都是有損的。</p><p> 有損壓縮可以減少圖像在內(nèi)存和磁盤(pán)中占用的空間,在屏幕上觀(guān)看圖像時(shí),不會(huì)發(fā)現(xiàn)它對(duì)圖像的外觀(guān)產(chǎn)生太大的不利影響。因?yàn)槿说难劬?duì)光線(xiàn)比較敏感,光線(xiàn)對(duì)景物的作用比顏色的作用更為重要,這就是有損壓縮技術(shù)的基本依據(jù)。</p><p> 有損壓縮的特點(diǎn)是保持顏色的逐漸變化,刪除
63、圖像中顏色的突然變化。生物學(xué)中的大量實(shí)驗(yàn)證明,人類(lèi)大腦會(huì)利用與附近最接近的顏色來(lái)填補(bǔ)所丟失的顏色。例如,對(duì)于藍(lán)色天空背景上的一朵白云,有損壓縮的方法就是刪除圖像中景物邊緣的某些顏色部分。當(dāng)在·屏幕上看這幅圖時(shí),大腦會(huì)利用在景物上看到的顏色填補(bǔ)所丟失的顏色部分。利用有損壓縮技術(shù),某些數(shù)據(jù)被有意地刪除了,而被取消的數(shù)據(jù)也不再恢復(fù)。</p><p> 無(wú)可否認(rèn),利用有損壓縮技術(shù)可以大大地壓縮文件的數(shù)據(jù),但是
64、會(huì)影響圖像質(zhì)量。如果使用了有損壓縮的圖像僅在屏幕上顯示,可能對(duì)圖像質(zhì)量影響不太大,至少對(duì)于人類(lèi)眼睛的識(shí)別程度來(lái)說(shuō)區(qū)別不大??墒?,如果要把一幅經(jīng)過(guò)有損壓縮技術(shù)處理的圖像用高分辨率打印機(jī)打印出來(lái),那么圖像質(zhì)量就會(huì)有明顯的受損痕跡。</p><p> 在多媒體應(yīng)用中,常見(jiàn)的壓縮方法[11]有:PCM(脈沖編碼調(diào)制),預(yù)測(cè)編碼,變換編碼,插值和外推法,統(tǒng)計(jì)編碼,矢量量化和子帶編碼等,混合編碼是近年來(lái)廣泛采用的方法。mp
65、3、divX、Xvid、jpeg、rm、rmvb、wma、wmv等都是有損壓縮。有損數(shù)據(jù)壓縮方法是經(jīng)過(guò)壓縮、解壓的數(shù)據(jù)與原始數(shù)據(jù)不同但是非常接近的壓縮方法。有損數(shù)據(jù)壓縮又稱(chēng)破壞型壓縮,即將次要的信息數(shù)據(jù)壓縮掉,犧牲一些質(zhì)量來(lái)減少數(shù)據(jù)量,使壓縮比提高。這種方法經(jīng)常用于因特網(wǎng)尤其是流媒體以及電話(huà)領(lǐng)域。在這篇文章中經(jīng)常成為編解碼。它是與無(wú)損數(shù)據(jù)壓縮對(duì)應(yīng)的壓縮方法。根據(jù)各種格式設(shè)計(jì)的不同,有損數(shù)據(jù)壓縮都會(huì)有g(shù)eneration loss:壓縮與
66、解壓文件都會(huì)帶來(lái)漸進(jìn)的質(zhì)量下降。</p><p><b> 有損壓縮機(jī)制</b></p><p> 由于圖像數(shù)據(jù)之間存在這一定的冗余,所以使得數(shù)據(jù)的壓縮成為可能。信息論的創(chuàng)始人Shannon 提出把數(shù)據(jù)看作是信息和冗余度[12](redundancy)的組合。所謂冗余度是由于一副圖像的各像素之間存在著很大的相關(guān)性,可利用一些編碼的方法刪去它們,從而達(dá)到減少冗余壓縮
67、數(shù)據(jù)的目的。為了去掉數(shù)據(jù)中的冗余,常常要考慮信號(hào)源的統(tǒng)計(jì)特性,或建立信號(hào)源的統(tǒng)計(jì)模型。</p><p> 圖像的冗余包括以下幾種:</p><p> ?、?空間冗余:像素點(diǎn)之間的相關(guān)性;</p><p> ?、?時(shí)間冗余:活動(dòng)圖像兩個(gè)連續(xù)幀之間的冗余;</p><p> ③ 信息熵冗余:?jiǎn)挝恍畔⒘看笥谄潇兀?lt;/p><
68、p> ?、?結(jié)構(gòu)冗余:區(qū)域上存在非常強(qiáng)的紋理結(jié)構(gòu);</p><p> ⑤ 知識(shí)冗余:有固定的結(jié)構(gòu),如人的頭像;</p><p> ?、?視覺(jué)冗余:某些圖像的失真是人眼不易覺(jué)察的。</p><p> 對(duì)數(shù)字圖像進(jìn)行有損壓縮通常利用兩個(gè)基本原理:</p><p> 一是數(shù)字圖像的相關(guān)性。在圖像的同一行相鄰像素之間,相鄰像素之間,活動(dòng)圖
69、像的相鄰幀的對(duì)應(yīng)像素之間往往存在很強(qiáng)的相關(guān)性,去除或減少這些相關(guān)性,也即去除或減少圖像信息中的冗余度也就實(shí)現(xiàn)了對(duì)數(shù)字圖像的有損壓縮。幀內(nèi)像素的相關(guān)稱(chēng)為空域相關(guān)性。相鄰幀間對(duì)應(yīng)像素之間的相關(guān)性稱(chēng)為時(shí)域相關(guān)性。</p><p> 二是人的視覺(jué)心理特征。人的視覺(jué)對(duì)于邊緣急劇變化不敏感(視覺(jué)掩蓋效應(yīng)),對(duì)顏色分辨力弱,利用這些特征可以在相應(yīng)部分,適當(dāng)降低編碼精度而使人從視覺(jué)上并不感覺(jué)到圖像質(zhì)量的下降,從而達(dá)到對(duì)數(shù)字圖像
70、有損壓縮的目的。有損壓縮有兩種壓縮機(jī)制[13]:</p><p> ?、?有損變換編解碼:首先對(duì)圖像或者聲音進(jìn)行采樣、切成小塊、變換到一個(gè)新的空間、量化,然后對(duì)量化值進(jìn)行熵編碼。</p><p> ?、?預(yù)測(cè)編解碼:先前的數(shù)據(jù)以及隨后解碼數(shù)據(jù)用來(lái)預(yù)測(cè)當(dāng)前的聲音采樣或者圖像幀,預(yù)測(cè)數(shù)據(jù)與實(shí)際數(shù)據(jù)之間的誤差以及其它一些重現(xiàn)預(yù)測(cè)的信息進(jìn)行量化與編碼。有些系統(tǒng)中同時(shí)使用這兩種技術(shù),變換編解碼用于壓
71、縮預(yù)測(cè)步驟產(chǎn)生的誤差信號(hào)。 </p><p><b> 第三節(jié) 本章小結(jié)</b></p><p> 在上一章的基礎(chǔ)上,本章則是介紹了圖像壓縮技術(shù)中的一個(gè)重要成員,圖像有損壓縮技術(shù)。有損壓縮是對(duì)利用了人類(lèi)是絕對(duì)圖像或聲波中的某些頻率成分不敏感的特性,允許壓縮過(guò)程中損失一定的信息;并從實(shí)際應(yīng)用角度說(shuō)明了有損壓縮技術(shù)的特點(diǎn)和應(yīng)用方向;并簡(jiǎn)單的介紹了其主流的壓縮方法,這
72、一點(diǎn)將在后一章節(jié)中詳細(xì)介紹。最后對(duì)有損壓縮的機(jī)制進(jìn)行介紹。壓縮可以是有損壓縮也可以是無(wú)損壓縮,對(duì)于如繪制的技術(shù)圖、圖表或者漫畫(huà)優(yōu)先使用無(wú)損壓縮。</p><p> 第三章 圖像有損壓縮的主要編碼技術(shù)</p><p> 雖然人們總是期望無(wú)損壓縮,但冗余度很少的信息對(duì)象用無(wú)損壓縮技術(shù)并不能得到可接受的結(jié)果。當(dāng)使用的壓縮方法會(huì)造成一些信息損失時(shí),關(guān)鍵的問(wèn)題是看這種損失的影響。有損壓縮經(jīng)常用
73、于壓縮音頻、灰度或彩色圖像和視頻對(duì)象等,因?yàn)樗鼈儾⒉灰缶_的數(shù)據(jù)。在由音頻、彩色圖像、視頻以及其他專(zhuān)門(mén)數(shù)據(jù)組成的多媒體對(duì)象中,可以單獨(dú)使用有損壓縮技術(shù),也可與無(wú)損壓縮技術(shù)共同使用。有損壓縮編碼不具有可恢復(fù)性和可逆性,該編碼在壓縮時(shí)舍棄冗余的數(shù)據(jù)。有損壓縮技術(shù)逐漸走進(jìn)了人們的視野。</p><p><b> 第一節(jié) 預(yù)測(cè)編碼</b></p><p> 預(yù)測(cè)編碼[
74、14]是根據(jù)離散信號(hào)之間存在著一定關(guān)聯(lián)性的特點(diǎn),利用前面一個(gè)或多個(gè)信號(hào)預(yù)測(cè)下一個(gè)信號(hào)進(jìn)行,然后對(duì)實(shí)際值和預(yù)測(cè)值的差(預(yù)測(cè)誤差)進(jìn)行編碼。如果預(yù)測(cè)比較準(zhǔn)確,誤差就會(huì)很小。在同等精度要求的條件下,就可以用比較少的比特進(jìn)行編碼,達(dá)到壓縮數(shù)據(jù)的目的。</p><p> 預(yù)測(cè)編碼中典型的壓縮方法有脈沖編碼調(diào)制(PCM,Pulse Code Modulation)、差分脈沖編碼調(diào)制(DPCM,Differential Pu
75、lse Code Modulation)、自適應(yīng)差分脈沖編碼調(diào)制(ADPCM,Adaptive Differential Pulse Code Modulation)等,它們較適合于聲音、圖像數(shù)據(jù)的壓縮,因?yàn)檫@些數(shù)據(jù)由采樣得到,相鄰樣值之間的差相差不會(huì)很大,可以用較少位來(lái)表示。</p><p><b> 一、脈沖編碼調(diào)制</b></p><p> 脈沖編碼調(diào)制[1
76、5](PCM,pulse code modulation)是概念上最簡(jiǎn)單、理論上最完善的編碼系統(tǒng)。它是最早研制成功、使用最為廣泛的編碼系統(tǒng),但也是數(shù)據(jù)量最大的編碼系統(tǒng)。PCM的編碼原理比較直觀(guān)和簡(jiǎn)單,原理框圖如圖3.1所示。在這個(gè)框圖中,它的輸入是模擬信號(hào),首先經(jīng)過(guò)時(shí)間采樣,然后對(duì)每一樣值都進(jìn)行量化,作為數(shù)字信號(hào)的輸出,即PCM樣本序列x(0),x(1),...x(n)。圖中的“量化,編碼”可理解為“量化階大小(step-size)”生
77、成器或者稱(chēng)為“量化間隔”生成器。</p><p> 量化[16]有多種方法。最簡(jiǎn)單的是只應(yīng)用于數(shù)值,稱(chēng)為標(biāo)量量化,另一種是對(duì)矢量(又稱(chēng)為向量)量化。標(biāo)量量化可歸納成兩類(lèi):一類(lèi)稱(chēng)為均勻量化,另一類(lèi)稱(chēng)為非均勻量化。理論上,標(biāo)量量化也是矢量量化的一種特殊形式。采用的量化方法不同,量化后的數(shù)據(jù)量也就不同。因此,可以說(shuō)量化也是一種壓縮數(shù)據(jù)的方法。</p><p> 圖3.1 PCM編碼框圖<
78、;/p><p> 二、差分脈沖編碼調(diào)制</p><p> 在PCM系統(tǒng)中,原始的模擬信號(hào)經(jīng)過(guò)采樣后得到的每一個(gè)樣值都被量化成為數(shù)字信號(hào)。為了壓縮數(shù)據(jù),可以不對(duì)每一樣值都進(jìn)行量化,而是預(yù)測(cè)下一樣值,并量化實(shí)際值與預(yù)測(cè)值之間的差值,這就是DPCM(Differential Pulse Code Modulation,差分脈沖編碼調(diào)制)。</p><p> 1952年貝
79、爾(Bell)實(shí)驗(yàn)室的C.C.Cutler取得了差分脈沖編碼調(diào)制系統(tǒng)的專(zhuān)利,奠定了真正實(shí)用的預(yù)測(cè)編碼系統(tǒng)的基礎(chǔ)。DPCM的組成如圖3.2,其中編碼器和解碼器分別完成對(duì)預(yù)測(cè)誤差量化值的熵編碼和解碼。</p><p> 圖3.2 DPCM系統(tǒng)原理框圖</p><p> DPCM的優(yōu)點(diǎn)是算法簡(jiǎn)單,容易硬件實(shí)現(xiàn),缺點(diǎn)是對(duì)信道噪聲很敏感,會(huì)產(chǎn)生誤差擴(kuò)散。即某一位碼出錯(cuò),對(duì)圖像一維預(yù)測(cè)來(lái)說(shuō),將使該
80、像素以后的同一行各個(gè)像素都產(chǎn)生誤差;而對(duì)二維預(yù)測(cè),該碼引起的誤差還將擴(kuò)散到以下的各行。這樣,將使圖像質(zhì)量大大下降。同時(shí),DPCM的壓縮率也比較低。隨著變換編碼的廣泛應(yīng)用,DPCM的作用已很有限。</p><p> 三、自適應(yīng)差分脈沖編碼調(diào)制</p><p> 進(jìn)一步改善量化性能或壓縮數(shù)據(jù)率的方法是采用自適應(yīng)量化或自適應(yīng)預(yù)測(cè),即自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)。它的核心想法是:<
81、;/p><p> 利用自適應(yīng)的思想改變量化階的大小,即使用小的量化階(step-size)去編碼小的差值,使用大的量化階去編碼大的差值。</p><p> 使用過(guò)去的樣本值估算下一個(gè)輸入樣本的預(yù)測(cè)值,使實(shí)際樣本值和預(yù)測(cè)值之間的差值總是最小。它的編碼簡(jiǎn)化框圖如圖3.3所示。</p><p> 圖3.3 ADPCM方框圖</p><p> ?、?/p>
82、 自適應(yīng)量化:在一定量化級(jí)數(shù)下減少量化誤差或在同樣的誤差條件下壓縮數(shù)據(jù),根據(jù)信號(hào)分布不均勻的特點(diǎn),希望系統(tǒng)具有隨輸入信號(hào)的變化區(qū)間足以保持輸入量化器的信號(hào)基本均勻的能力,這種能力叫自適應(yīng)量化。</p><p> 自適應(yīng)量化必須有對(duì)輸入信號(hào)的幅值進(jìn)行估值的能力,有了估值才能確定相應(yīng)的改變量。若估值在信號(hào)的輸入端進(jìn)行,稱(chēng)前饋?zhàn)赃m應(yīng);若在量化輸出端進(jìn)行,稱(chēng)反饋?zhàn)赃m應(yīng)。信號(hào)的估值必須簡(jiǎn)單,占用時(shí)間短,才能達(dá)到實(shí)時(shí)處理的
83、目的。</p><p> ?、?自適應(yīng)預(yù)測(cè):預(yù)測(cè)參數(shù)的最佳化依賴(lài)信源的特征,要得到最佳預(yù)測(cè)參數(shù)顯然是一件繁瑣的工作。而采用固定的預(yù)測(cè)參數(shù)往往又得不到較好的性能。為了能使性能較佳,又不致于有太大的工作量,可以采用自適應(yīng)預(yù)測(cè)。</p><p> 為了減少計(jì)算工作量,預(yù)測(cè)參數(shù)仍采用固定的,但此時(shí)有多組預(yù)測(cè)參數(shù)可供選擇,這些預(yù)測(cè)參數(shù)根據(jù)常見(jiàn)的信源特征求得。編碼時(shí)具體采用哪組預(yù)測(cè)參數(shù)需根據(jù)特征來(lái)自
84、適應(yīng)地確定。為了自適應(yīng)地選擇最佳參數(shù),通常將信源數(shù)據(jù)分區(qū)間編碼,編碼時(shí)自動(dòng)地選擇一組預(yù)測(cè)參數(shù),使該實(shí)際值與預(yù)測(cè)值的均方誤差最小。隨著編碼區(qū)間的不同,預(yù)測(cè)參數(shù)自適應(yīng)地變化,以達(dá)到準(zhǔn)最佳預(yù)測(cè)。</p><p><b> 第二節(jié) 變換編碼</b></p><p> 預(yù)測(cè)編碼的壓縮能力是有限的。以DPCM為例,一般只能壓縮到每樣值2~4比特。20世紀(jì)70年代后,科學(xué)家們
85、開(kāi)始探索比預(yù)測(cè)編碼效率更高的編碼方法。人們首先討論了KL變換(Karhunen-Loeve Transform)、傅立葉變換等正交變換,得到了比預(yù)測(cè)編碼效率高得多的結(jié)果,但苦于算法的計(jì)算復(fù)雜性太高,進(jìn)行科學(xué)研究可以,實(shí)際使用起來(lái)很困難。直到20世紀(jì)70年代后期,研究者發(fā)現(xiàn)離散余弦變換DCT與KL變換在某一特定相關(guān)函數(shù)條件下具有相似的基向量,而用DCT的變換矩陣來(lái)做正交變換就可以節(jié)省大量的求解特征向量的計(jì)算,因而大大簡(jiǎn)化了算法的計(jì)算復(fù)雜性
86、。DCT的使用使變換編碼壓縮進(jìn)入了實(shí)用階段。小波變換是繼DCT之后科學(xué)家們找到的又一個(gè)可以實(shí)用的正交變換,它與DCT各有千秋,因而分別被不同的研究群體所推崇。</p><p> 變換的基本原理:變換編碼是指先對(duì)信號(hào)進(jìn)行某種函數(shù)變換,從一種信號(hào)(空間)變換到另一種(空間),然后再對(duì)信號(hào)進(jìn)行編碼。如將時(shí)域信號(hào)變換到頻域,因?yàn)槁曇簟D像大部分信號(hào)都是低頻信號(hào),在頻域中信號(hào)的能量較集中,再進(jìn)行采樣、編碼,那么可以肯定能
87、夠壓縮數(shù)據(jù)。</p><p> 變換編碼[17]系統(tǒng)中壓縮數(shù)據(jù)有變換、變換域采樣和量化三個(gè)步驟。變換本身并不進(jìn)行數(shù)據(jù)壓縮,它只把信號(hào)映射到另一個(gè)域,使信號(hào)在變換域里容易進(jìn)行壓縮,變換后的樣值更獨(dú)立和有序。這樣,量化操作通過(guò)比特分配可以有效地壓縮數(shù)據(jù)。</p><p> 在變換編碼系統(tǒng)中,用于量化一組變換樣值的比特總數(shù)是固定的,它總是小于對(duì)所有變換樣值用固定長(zhǎng)度均勻量化進(jìn)行編碼所需的總數(shù)
88、,所以量化使數(shù)據(jù)得到壓縮,是變換編碼中不可缺少的一步。在對(duì)量化后的變換樣值進(jìn)行比特分配時(shí),要考慮使整個(gè)量化失真最小。變換編碼是一種間接編碼方法。它是將原始信號(hào)經(jīng)過(guò)數(shù)學(xué)上的正交變換后,得到一系列的變換系數(shù),再對(duì)這些系數(shù)進(jìn)行量化、編碼、傳輸。圖3.4是變換編碼系統(tǒng)方框圖。</p><p> 圖中接收端輸出信號(hào)與輸入信號(hào)的誤差是因?yàn)檩斎攵瞬捎昧炕鞯牧炕`差所致。當(dāng)經(jīng)過(guò)正交變換后的協(xié)方差矩陣為一對(duì)角矩陣,且具有最小均
89、方誤差時(shí),該變換稱(chēng)為最佳變換,也稱(chēng)Karhunen-Loeve變換[18](K-L變換)。如果變換后的協(xié)方差矩陣接近對(duì)角矩陣,該類(lèi)變換稱(chēng)為準(zhǔn)最佳變換,典型的有DCT(離散余弦變換)、DFT(離散傅立葉變換)、WHT等。</p><p> 圖3.4 變換編碼、解碼原理框圖</p><p> 第三節(jié) 基于模型編碼</p><p> 從80年代中后期開(kāi)始,科學(xué)家們
90、開(kāi)始探討基于模型的編碼,并在包括人臉圖像的編碼等應(yīng)用中使用。如果把以預(yù)測(cè)編碼和變換編碼為核心的基于波形的編碼作為第一代編碼技術(shù),則基于模型的編碼就是第二代編碼技術(shù)。N.Jayant指出,壓縮編碼的極限結(jié)果原則上可通過(guò)那些能夠反映信號(hào)產(chǎn)生過(guò)程最早階段的模型而得到。這就是基于模型編碼的思想。一個(gè)例子是人類(lèi)發(fā)音的“清晰聲帶—聲道模型”(The Articulatory Vocal Cord-Vocal Tract Model),它把注意焦點(diǎn)從
91、線(xiàn)性預(yù)測(cè)編碼(LPC,Linear Predictive Coding)分析擴(kuò)展到聲道區(qū)分析,原則上為很低碼率矢量量化提供了強(qiáng)得多的定義域,并允許更好地處理聲帶-聲道的相互作用。另一個(gè)例子是人臉的線(xiàn)框(wire-frame)模型,它為壓縮可視電話(huà)這類(lèi)以人臉為主要景物的序列圖像提供了一個(gè)強(qiáng)有力的手段。</p><p> 基于模型圖像編碼首先由瑞典Forchheimer等人于1983年提出?;谀P头椒ǖ幕舅枷胧?/p>
92、:在發(fā)送端,利用圖像分析模塊對(duì)輸入圖像提取緊湊和必要的描述信息,得到一些數(shù)據(jù)量不大的模型參數(shù);在接收端,利用圖像綜合模塊重建原圖像,是對(duì)圖像信息的合成過(guò)程?;驹砣鐖D3.5所示。</p><p> 與經(jīng)典方法中的預(yù)測(cè)編碼方法類(lèi)似,基于模型編碼在發(fā)送端既有分析用的編碼器,同時(shí)又有綜合用的解碼器。只有這樣,在發(fā)送端才能獲得與接收端相同的綜合后的重建圖像,并將后者與原始圖像進(jìn)行“比較”,以確定圖像失真是否低于“某種
93、閾值”,以便修正模型參數(shù)。同經(jīng)典方法比較,基于模型編碼還有兩點(diǎn)顯著不同:</p><p> 編碼失真。基于模型編碼所引起的失真已從傳統(tǒng)方法的量化誤差轉(zhuǎn)化為幾何失真,并可能進(jìn)一步轉(zhuǎn)化為物理失真或行為失真。</p><p> 圖3.5 基于模型的圖像編碼基本原理框圖</p><p> 如何評(píng)價(jià)重建圖像質(zhì)量。傳統(tǒng)的以像素為單位計(jì)算原始圖像與重建圖像之間“逼真度”(如
94、均方誤差、信噪比)不能測(cè)量幾何失真和物理失真等,從原理上講根本不適用于基于模型編碼。下面分別介紹基于模型的圖像編碼有兩種技術(shù):一種是基于語(yǔ)義編碼,一種是基于物體編碼。</p><p><b> 一、基于語(yǔ)義編碼</b></p><p> 基于語(yǔ)義[19](semantic-based)編碼采用顯示模型(如人物的頭肩部分)去分析和合成運(yùn)動(dòng)圖像,景物里的物體三維模型為
95、嚴(yán)格已知。瑞典Forchheimer等人于1983年提出的就是基于語(yǔ)義圖像編碼。由于物體模型的有效性,景物中的物體能夠在語(yǔ)義水平描述。它可以有效地利用景物中已知物體的知識(shí),實(shí)現(xiàn)非常高的壓縮比。但它僅能夠處理已知物體,并需要較復(fù)雜的圖像分析與識(shí)別技術(shù)。</p><p> 為了實(shí)現(xiàn)基于語(yǔ)義的圖像編碼,需要根據(jù)景物中特定的一些物體,預(yù)先建立它們的通用3D模型,最常用的是3D線(xiàn)框模型。3D線(xiàn)框模型由頂點(diǎn)在3D空間運(yùn)動(dòng)的
96、互連多角形復(fù)合而成,將色彩信息映射到該模型上就能實(shí)現(xiàn)合成。例如,人物頭部3D線(xiàn)框模型不僅給出面部的幾何形狀,而且提供了面部表情的描述。面部表情的變化(例如眨眼、張嘴)可用面部動(dòng)作編碼系統(tǒng)(FACS,F(xiàn)acial Action Coding System)中的動(dòng)作單元(AU,Action Unit)來(lái)描述。FACS給出一個(gè)包含了人臉可能產(chǎn)生的全部基本動(dòng)作(即AU)的集合,而AU是無(wú)法分成更小動(dòng)作的最小動(dòng)作。把許多AU按照不同的組合方式一起
97、發(fā)生,就形成了臉上的豐富表情。</p><p> 下面以視頻電話(huà)為例說(shuō)明。在開(kāi)始通信時(shí),首先把雙方的基本特征(例如3D模型、臉部的表面紋理等)傳輸?shù)綄?duì)方,建立一個(gè)與特定人臉匹配的3D模型。接下來(lái),隨著頭部的運(yùn)動(dòng)和表情的變化,發(fā)送端抽取頭部的運(yùn)動(dòng)參數(shù)和臉部的表情參數(shù),編碼后傳送到對(duì)方;接收端根據(jù)已知的3D模型和接收到的各種參數(shù),用圖像綜合技術(shù)獲得重建圖像。系統(tǒng)的關(guān)鍵技術(shù)是:人物頭、臉及肩部(簡(jiǎn)稱(chēng)人臉)3D模型的建
98、立;運(yùn)動(dòng)參數(shù)和表情參數(shù)的估計(jì);圖像綜合。</p><p> 為了使已建立的人臉3D模型如同真實(shí)人臉一樣“動(dòng)”起來(lái),必須根據(jù)先驗(yàn)知識(shí)對(duì)臉部進(jìn)行分析,提取有關(guān)的頭部特征參數(shù)及運(yùn)動(dòng)狀態(tài)參數(shù)?;谡Z(yǔ)義常用的人臉部模型見(jiàn)圖3.6,</p><p> 圖3.6 基于語(yǔ)義編碼常用的3D人臉模型(Candide模型)</p><p> 因此,基于語(yǔ)義圖像編碼還不能適合于所有的
99、視頻圖像信號(hào)。在大多數(shù)的情況下,視頻圖像信號(hào)所表現(xiàn)的自然界是多種多樣的,夠造不出比較合適的模型來(lái)表現(xiàn)。目前,基于模型法還是多應(yīng)用于特定的場(chǎng)合,如上述的視頻電話(huà)。</p><p><b> 二、基于物體編碼</b></p><p> 德國(guó)Hannover大學(xué)的Mu man教授在1989年提出的基于物體(object-based或object oriented)圖像編
100、碼是針對(duì)未知物體的,需要實(shí)時(shí)構(gòu)造物體的模型(沒(méi)有先驗(yàn)知識(shí)的)。基于物體編碼不采用顯示模型,適用于處理更一般的已知或未知的物體,因此預(yù)期有更廣泛的應(yīng)用前景。</p><p> 處理時(shí),首先運(yùn)用圖像分析技術(shù),對(duì)景物進(jìn)行分層次的描述,將物體與背景分割出來(lái)。對(duì)于分割后得到的每個(gè)實(shí)際三維物體,分別用一個(gè)物體模型來(lái)描述,并用該模型物體在二維圖像平面上的投影(模型圖像)來(lái)逼近真實(shí)圖像?;谖矬w編碼只追求最終模型能與輸入圖像一
101、致,不要求模型物體與真實(shí)物體的形狀嚴(yán)格一致。因此,假設(shè)模型是一個(gè)具有一般意義的模型,它既可以是二維的,也可以是三維的。每個(gè)分割出來(lái)的實(shí)際運(yùn)動(dòng)物體,用運(yùn)動(dòng)參數(shù)集、形狀參數(shù)集和色彩參數(shù)集進(jìn)行描述,然后再對(duì)這三個(gè)參數(shù)集進(jìn)行編碼與傳送。根據(jù)所假設(shè)的物體模型不同,參數(shù)集會(huì)有些變化?,F(xiàn)在基于物體編碼所用的模型有4種:2D剛體模型,2D柔體模型,3D剛體模型,3D柔體模型。</p><p> 對(duì)于活動(dòng)圖像的基于物體編碼系統(tǒng)的
102、核心技術(shù)是景物的分層次描述、運(yùn)動(dòng)估值和運(yùn)動(dòng)分割。從原理上講,因無(wú)需模式識(shí)別與先驗(yàn)知識(shí),且不受可視電話(huà)中頭肩圖像那樣的限制,對(duì)于圖像分析要簡(jiǎn)單得多,因而有更廣泛的應(yīng)用前景。但因未能充分利用景物的知識(shí),或只能在低層次上運(yùn)用物體知識(shí),編碼效率不如基于語(yǔ)義方法。因此應(yīng)根據(jù)實(shí)際需要來(lái)決定具體選用哪一類(lèi)方法。</p><p> 目前,基于模型編碼進(jìn)一步的研究方向是把基于物體編碼與基于語(yǔ)義編碼等結(jié)合起來(lái),取長(zhǎng)補(bǔ)短。</
103、p><p><b> 第四節(jié) 分形編碼</b></p><p><b> 一、分形編碼的思路</b></p><p> 1988年1月,美國(guó)Georgia理工學(xué)院的M.F.Barnsley在BYTE發(fā)表了分形壓縮方法。分形編碼法(Fractal Coding)的目的是發(fā)掘自然物體(比如天空、云霧、森林等)在結(jié)構(gòu)上的自相
104、似形,這種自相似形是圖像整體與局部相關(guān)性的表現(xiàn)。分形壓縮正是利用了分形幾何中的自相似的原理來(lái)實(shí)現(xiàn)的。首先對(duì)圖像進(jìn)行分塊,然后再去尋找各塊之間的相似形,這里相似形的描述主要是依靠仿射變換確定的。一旦找到了每塊的仿射變換,就保存下這個(gè)仿射變換的系數(shù),由于每塊的數(shù)據(jù)量遠(yuǎn)大于仿射變換的系數(shù),因而圖像得以大幅度的壓縮。分形編碼以其獨(dú)特新穎的思想,成為目前數(shù)據(jù)壓縮領(lǐng)域的研究熱點(diǎn)之一。分形編碼、基于模型編碼與經(jīng)典圖像編碼方法相比,在思想和思維上有了很
105、大的突破,理論上的壓縮比可超出經(jīng)典編碼方法兩三個(gè)數(shù)量級(jí)。</p><p> 二、分形編碼的方法和步驟</p><p> 以平面點(diǎn)集合與圖像為例,迭代函數(shù)[20]系統(tǒng)壓縮編碼大致步驟為:</p><p> ?、?圖像分割:首先將原圖(集合X或圖像)預(yù)分割(或預(yù)分解)為若干分形子圖X(m) (m=1,2,…,M),使得每一個(gè)子圖X(m)具有一定的分形結(jié)構(gòu),及其局部與
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 畢業(yè)設(shè)計(jì)(論文)圖像有損壓縮技術(shù)的研究
- 靜態(tài)圖像有損壓縮技術(shù)的研究.pdf
- 圖像有損壓縮方法研究.pdf
- 半調(diào)圖像的有損壓縮算法研究.pdf
- 基于壓縮感知的多光譜圖像有損壓縮技術(shù)研究.pdf
- 多-高光譜圖像有損壓縮技術(shù)研究.pdf
- 通過(guò)有損壓縮技術(shù)實(shí)現(xiàn)自然圖像有效分割.pdf
- 基于上下文的多維圖像的無(wú)損-有損壓縮技術(shù).pdf
- 面向有損壓縮的視頻圖像的去霧算法.pdf
- 加密域中圖像的參數(shù)自適應(yīng)有損壓縮方法研究.pdf
- 一種易于硬件實(shí)現(xiàn)的圖像有損壓縮算法.pdf
- 基于分類(lèi)DCT的高光譜有損壓縮算法研究.pdf
- 基于角度差鏈碼有損壓縮算法的研究.pdf
- 圖像壓縮處理技術(shù)研究畢業(yè)論文
- 1,其他。正向離散余弦變換4.4.2jpeg有損壓縮算法計(jì)算兩維的dct
- 基于小波變換的圖像壓縮方法[畢業(yè)論文]
- 顯微視頻圖像的編碼與壓縮【畢業(yè)論文】
- 基于硬件的遙感圖像有損小波壓縮系統(tǒng).pdf
- 畢業(yè)論文——圖像增強(qiáng)技術(shù)綜述
- 圖像邊緣檢測(cè)技術(shù)畢業(yè)論文
評(píng)論
0/150
提交評(píng)論