補充多媒體數(shù)據(jù)壓縮技術(shù)_第1頁
已閱讀1頁,還剩22頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、第6章 多媒體數(shù)據(jù)的壓縮,6.1 數(shù)據(jù)壓縮概述數(shù)據(jù)壓縮的必要性數(shù)據(jù)冗余6.2 數(shù)據(jù)壓縮的基本原理信息編碼基礎數(shù)據(jù)壓縮方法6.3 數(shù)據(jù)壓縮的編碼算法統(tǒng)計編碼(行程編碼 哈夫曼編碼 算術(shù)編碼)預測編碼變換編碼6.4 常用多媒體數(shù)據(jù)壓縮標準音頻壓縮編碼標準靜態(tài)圖像壓縮標準動態(tài)圖像壓縮標準視頻壓縮編碼標準,6.1 數(shù)據(jù)壓縮概述,1、 壓縮的必要性 聲音、圖像、視頻和動畫的數(shù)據(jù)量太大聲音

2、1分鐘立體聲音樂采樣頻率為44.1KHZ,16位量化精度的數(shù)據(jù)量為 44.1 * 1000 * 16 * 2 *60 / 8 =10.09MB 存儲一首4分鐘的歌曲約需40MB圖像 1副640*480的RGB彩色圖像的存儲容量為 640*480 * 24 / 8 = 900KB視頻 1秒鐘(25幀/秒)的視頻數(shù)據(jù)量為 25*900KB = 21.97

3、 MB1張650MB的CD ROM光盤只能存儲約 650 / 21.97 = 29.59 秒的視頻,2 數(shù)據(jù)冗余空間冗余:圖像內(nèi)部相鄰像素之間的相關性時間冗余:視頻序列中前后幀之間的相關性視覺或聽覺冗余(人眼或人耳具有一定的掩蔽效應)知識冗余(具有規(guī)律性的結(jié)構(gòu),用于圖像理解上,如人臉)統(tǒng)計冗余(出現(xiàn)的頻率具有一定的規(guī)律性,如元音多,有些輔音很少出現(xiàn))結(jié)構(gòu)冗余(具有紋理結(jié)構(gòu)的圖像區(qū)域)信息熵冗余(又叫編碼冗余,用相同位數(shù)進

4、行編碼產(chǎn)生的冗余),6.2 數(shù)據(jù)壓縮的基本原理,1、信息編碼基礎壓縮的實質(zhì):根據(jù)數(shù)據(jù)的內(nèi)在聯(lián)系將數(shù)據(jù)從一種編碼映射為另一種編碼,又叫壓縮編碼。,數(shù)據(jù)壓縮過程,數(shù)據(jù)壓縮方法的衡量指標壓縮率:越大越好壓縮質(zhì)量:數(shù)據(jù)失真越小越好壓縮與解壓縮的速度:速度越快越好,2、數(shù)據(jù)壓縮方法,6.3 數(shù)據(jù)壓縮的編碼算法,一、無損壓縮:減少或去除數(shù)據(jù)中的冗余,可以無失真地還原成原來的數(shù)據(jù),一般適合壓縮數(shù)據(jù)或程序,但是壓縮比較小,一般在2:1到5:1

5、之間。,1. 行程編碼(游程編碼)原理:將連續(xù)相同的數(shù)據(jù)序列用重復次數(shù)和單個數(shù)據(jù)來表示。應用:用于圖像文件的壓縮(尤其適合于由計算機生成的圖像)如bmp和tiff等圖像格式。 (1)多值信息的編碼 編碼格式:信息重復次數(shù)+被重復的信息 例: 字符串為:atttefppppppddddss 行程編碼為:a3tef6p4d2s (2)二值信息的編碼

6、 編碼格式:0或1重復的次數(shù) 例如二進制數(shù)據(jù)流為 000111111000001111 假設行程約定以0開始,則編碼為:3654 若約定以1開始,則編碼為:03654,2. 哈夫曼(Huffman)編碼,算法步驟:(1)按照符號出現(xiàn)的概率大小進行排序(2)把最小的兩個概率值相加,得到一個新的概率序列(3)重復上述兩個步驟,直到概率值為1 (4)從后往前進行編碼,概率大的

7、賦予1,概率小的賦予0。 (反過來也可以)(5)寫出每個符號的碼字例1:字母A B C D E出現(xiàn)的概率分別為0.15、0.25、0.1、0.37和0.13,其哈夫曼編碼為:,A: 00B: 10C: 010D: 11E: 011,假設共有100個字符,若采用等長編碼,每個字符至少需要3位二進制,100個字母需要300位,采用哈夫曼編碼則只需要15*2+25*2+10*3+37*2+13*3=223位。壓縮比為 300

8、:223 = 1.34:1,例2:字母A B C D E出現(xiàn)的概率分別為0.53、0.25、0.07、0.05和0.1, 其哈夫曼編碼為:,A: 1B: 01C: 0011D: 0010E: 000,若采用等長編碼,至少需要3位二進制,100個字母需要300位,采用哈夫曼編碼則需要:53*1+25*2+7*4+5*4+10*3=181位壓縮比為 300:181 = 1.65:1,3、算術(shù)編碼,編碼原理:將

9、被編碼信源表示為[0,1)區(qū)間的一個實數(shù),根據(jù)各符號出現(xiàn)的概率構(gòu)造其所在區(qū)間,隨著信息字符的不斷出現(xiàn),其所在區(qū)間越來越小,對應表示的實數(shù)也越來越小,那么表示這一消息所需的二進制位數(shù)就越多。例:假設一個4個符號的信源A={a1,a2,a3,a4 } ,各符號出現(xiàn)的概率及起始編碼區(qū)間如下表。,如果要傳送的消息為a1a2a3a2,算術(shù)編碼過程為:區(qū)間計算方法: 新區(qū)間起始位置:前面區(qū)間起始位置 + 當前區(qū)間左端 * 前面區(qū)間長度

10、 新區(qū)間長度:當前符號的概率 * 前面區(qū)間長度,① a1,取值區(qū)間為[0, 0.2)② a2,起點:0+0.2*0.2=0.04,長度0.4*0.2=0.08,新區(qū)間為 [0.04, 0.12)③ a3,起點:0.04+0.6*0.08=0.088,長度0.2*0.08=0.016,新區(qū)間為 [0.088 ,0.104)④ a2,起點:0.088+0.2*0.016=0.0912,長度0.4*0.016=0.0064,新區(qū)

11、間為 [0.0912 0.0976),二、有損壓縮:壓縮時會丟失部分數(shù)據(jù),且丟失的數(shù)據(jù)無法恢復。是不可逆的壓縮,即解壓縮以后的數(shù)據(jù)與原始數(shù)據(jù)不完全一致。,,1. PCM(Pulse Code Modulation,脈沖編碼調(diào)制)采樣:按固定時間間隔獲取一個樣本值量化:按允許的誤差將樣本對應到近似的數(shù)值(幅度上的離散化) 。有均勻量化和非均勻量化。編碼:用二進制代碼表示采樣量化后的樣本值。,2.預測編碼(1)DPCM(差分脈沖編

12、碼調(diào)制),原始信號為:s,預測器產(chǎn)生的預測值為:s”預測誤差:e=s-s”發(fā)送端:發(fā)送經(jīng)過量化的誤差e’接收端:用相同的預測器獲得預測值s”, 輸出s’=s”+e’最終誤差為: s’-s = s”+e’-s = e’ – (s-s”) = e’-e(即量化器產(chǎn)生的量化誤差),(2)ADPCM(自適應脈沖編碼調(diào)制) 自適應量化:當信號分布不均勻時,能隨輸入信號的變化改變量化區(qū)

13、間的大小。自適應預測:采用過去的樣本值估算下一個輸入樣本的預測值,得到最小的實際樣本值與預測值之間的差值。(3)幀間預測編碼 利用視頻圖像各幀之間的時間相關性,減少幀內(nèi)圖像信號的冗余,即不直接傳送當前幀的像素值,而是傳送x和其前一幀或后一幀對應像素x’之間的差值。運動補償?shù)膸g預測幀間內(nèi)插法(4) 線性預測編碼(Linear Predictive Coding,LPC) 采用過去的樣本值,以一種前向反饋的方

14、式預測當前采樣值,預測值可以用過去p個樣本值的線性組合來表示。該方法被廣泛應用于語音處理。,3. 變換編碼 將圖像信號從一個域(如時間域)變換到另外一個域(如頻率域),然后對變換后的信號進行量化與編碼。,正交變換前兩個樣本的聯(lián)合事件,正交變換后兩個樣本的聯(lián)合事件,例:有兩個相鄰的數(shù)據(jù)樣本x1和x2,每個樣本采用3bit編碼,各自都有8個幅度等級,兩個樣本的聯(lián)合事件共有64 種可能, 用64個點表示。對一般的像來說,兩個相鄰

15、的數(shù)據(jù)樣本很有可能出現(xiàn)近似的幅度,即很可能出現(xiàn)在x1=x2直線附近。,對該數(shù)據(jù)進行正交變換,將坐標系逆時針旋轉(zhuǎn)45度,在新坐標系中y1對應到x1=x2這條直線,那么變換后的數(shù)據(jù)樣本集中在y1軸上,對這部分數(shù)據(jù)進行量化、編碼和傳輸,其他數(shù)據(jù)不做處理,這樣就達到了壓縮數(shù)據(jù)的目的。,常用的變換編碼方法有:1、K-L變換2、傅立葉變換3、離散余弦變換等,1.電話語音壓縮標準 數(shù)據(jù):帶寬為200Hz~3.4kHz ,采樣頻率為8

16、kHz, 8位量化,傳輸速率為64kb/s 語音壓縮標準:G.722(64kb/s)、G.721(32kb/s)、G.728(16kb/s)和G.729(8kb/s) 應用:數(shù)字電話通信。,6.4 常用多媒體數(shù)據(jù)壓縮標準6.4.1 音頻壓縮標準,2. 調(diào)幅廣播語音壓縮標準 數(shù)據(jù):帶寬為50hz ~ 7khz的調(diào)幅廣播語音,使用16kHz采樣頻率和14位量化位數(shù)時,所對應的速率為224kb/s。 語音壓縮標準:G.72

17、2應用:優(yōu)質(zhì)語音、音樂、音頻會議和視頻會議等。,3.高保真立體聲的寬帶音頻壓縮標準 數(shù)據(jù):采樣頻率44.1kHz,用16位量化,速率為每聲道705 kb/s 。語音壓縮標準:MPEG音頻MPEG-1音頻: 層Ⅰ(簡化的ASPEC) 層Ⅱ(即MUSICAM,又稱MP2) 層Ⅲ(又稱MP3)。 MPEG-2音頻:多聲道,5.1聲道形式及7.1聲道形式 應用:影劇院、家庭影院系統(tǒng),及將來

18、的高清晰度電視(HDTV)。,6.4.2 靜態(tài)圖像壓縮標準JPEG (joint photographic experts group)聯(lián)合照片專家組 1.JPEG標準 適應于彩色和單色多灰度或連續(xù)色調(diào)的靜止數(shù)字圖像。支持很高的圖像分辨率和量化精度,具有較高的壓縮比和圖像質(zhì)量。包含了基于DCT的有損壓縮方法和基于預測方法的無損壓縮方法。 2.JPEG2000標準 特征:支持低比特率傳輸,支持

19、無損和有損壓縮,象素精度和分辨率的漸進式傳輸,感興趣域編碼,隨機碼流訪問和處理。 經(jīng)典算法:包含三個部分:小波變換、畫布坐標系統(tǒng)、嵌入式優(yōu)化截斷編碼(EBCOT)。,6.4.3 運動圖像和視頻壓縮編碼標準MPEG:運動圖像專家組(Moving Picture Experts Group) MPEG標準和HDTV標準,視頻壓縮標準1.H.261和H.263標準 國際電信聯(lián)盟電信標準組織ITU-T 制定

20、H.261:主要用來支持在ISDN上進行可視電話、視頻會議和其它視聽服務。H.263:主要用于公共電話交換網(wǎng)絡(PSTN)上的視頻會議和其它可視化服務,旨在以盡可能低的碼率(64kpbs以下)進行通信。2.H.26L標準 在所有碼率下都能持續(xù)提供較高的視頻質(zhì)量。 支持的圖像格式常用的有CIF和QCIF。更高的壓縮效率,更靈活的網(wǎng)絡適應性,增強對于差錯的魯棒性。,3.AVS標準2002.6 國家信息產(chǎn)業(yè)部科學技術(shù)司批

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論