版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、低比特率音頻編碼可以減少傳輸音頻信號對信道帶寬的要求,流暢地實現(xiàn)網(wǎng)絡(luò)傳輸,還可以節(jié)約存儲空間,降低存儲的成本,具有重要的實用價值.MPEG音頻編碼標(biāo)準(zhǔn)采用了頻域的量化和編碼算法,將音頻信號分成短的編碼塊,假定每個編碼塊為穩(wěn)態(tài)信號,然后將每個編碼塊轉(zhuǎn)換到頻域進行量化和編碼;對于存在瞬態(tài)信號的編碼塊,將編碼塊分成更短的編碼塊,轉(zhuǎn)化到頻域,進行量化和編碼.由于MPEG音頻編碼標(biāo)準(zhǔn)中編碼塊長度短,編碼過程中,邊信息在整個比特流中所占的比重較大;
2、在MP3編碼比特流中,邊信息所占的比重約為11.5﹪.本文中研究了利用正弦/小波包混合感知音頻編碼技術(shù)來實現(xiàn)在低比特率對音頻信號的編解碼:小波包音頻編碼器利用了小波的時頻局部化特性,實現(xiàn)對穩(wěn)態(tài)和瞬態(tài)音頻信號的描述,因此可以選用較長的編碼塊,邊信息在比特流中的比重較小,在低比特率下可以實現(xiàn)對音頻信號的高質(zhì)量編碼;本文中編碼器編碼比特流中,邊信息所占的比重為3.89﹪.由于小波包濾波器組頻域分辨率低,在純音分量占豐導(dǎo)地位的音頻信號中,采用小
3、波濾波器組不能對占頻信號做最簡潔地描述.對于這種信號,木文中先采用正弦分量提取,然后將剩余的殘羞信號利用小波進行描述. 本文研究工作有四部分,第一部分對小波包域心理聽覺模型進行了研究. 首先研究了人耳心理聽覺的掩蔽原理,人耳心理聽覺時頻域掩蔽現(xiàn)象;然后根據(jù)文中音頻編碼器的需要,改進了MPEG音頻編碼標(biāo)準(zhǔn)中的頻域心理聽覺模型;最后利用頻域和小波域的對稱性,提出了新的直接轉(zhuǎn)化算法,將頻域得到的心理聽覺掩蔽閾值轉(zhuǎn)化到小波域的各
4、個子帶中.測試結(jié)果表明:采用各個子帶的最大許用量化能量失真來對相應(yīng)子帶中的小波變換系數(shù)進行量化反量化后重建,所獲得重建音頻信號的質(zhì)量略好于MP3音頻編解碼器重建音頻信號的質(zhì)量. 第二部分研究了語音和音頻信號中正弦分量的提取,提出了PPMMSE算法,從語音和音頻信號中提取出正弦分量. 首先計算分析信號的功率譜,確定功率譜曲線最大峰值處對應(yīng)的頻率,然后在以該頻率為中心的小區(qū)間內(nèi),采用最小均方誤差法提取正弦分量,將提取的正弦分
5、量從分析信號中去除;然后再計算殘差信號的功率譜,找到功率譜最大峰值處對應(yīng)的頻率,確定出將要提取正弦分量的頻率,振幅和初相位;依次類推從分析信號塊內(nèi)提取出所有的正弦分量.相對于峰值拾取算法,本文所提出的算法不僅適用于穩(wěn)態(tài)信號,而且適用于瞬態(tài)信號,得到參數(shù)的精度較高;十日對于最小均方誤差算法,該算法得到參數(shù)的精度高,計算復(fù)雜度遠遠小于采用最小均方誤差算法需要的計算復(fù)雜度. 第三部分研究了小波包音頻編碼中濾波器和小波變換系數(shù)的量化和碼
6、率控制. 首先研究了信號多分辨率描述的原理以及快速算法實現(xiàn);然后根據(jù)人耳的臨界帶選擇了小波包分解樹結(jié)構(gòu).提出了采用DB20和DB5兩種小波自適應(yīng)切換分別來實現(xiàn)對穩(wěn)態(tài)和瞬態(tài)音頻編碼塊的描述;最后研究了小波變換系數(shù)的量化算法;對小波變換系數(shù)采用了全局均勻矢量量化,和局部子帶小波變換系數(shù)放大,來實現(xiàn)恒比特率的音頻編碼.采用內(nèi)外環(huán)技術(shù)來控制比特率,在內(nèi)環(huán)控制音頻編碼的比特率,在外環(huán),通過調(diào)整放大兇子來控制各個子帶的量化能量失真.
7、 第四部分中,對正弦/小波包混合音頻編解碼器系統(tǒng)進行了研究. 改進了正弦/小波包混合音頻編解碼器框圖.在該框圖中,采用PPMMSE算法從音頻信號中提取正弦分量,融入了內(nèi)外環(huán)碼率控制模塊,頻域心理聽覺模型轉(zhuǎn)化到小波域模塊,和自適應(yīng)小波切換模塊;研究了音頻編碼比特流的語法結(jié)構(gòu),最后對音頻編解碼器進行主客觀質(zhì)量評定,結(jié)果表明:對于大多數(shù)測試信號單通道在64kb/s進行編碼,本文所提供的音頻編解碼器獲得重建音頻信號的質(zhì)量好于MP3音頻編
8、解碼器扶得重建音頻信號的質(zhì)量;編碼器計算復(fù)雜度略大于MP3占頻編碼器的計算復(fù)雜度. 本文的創(chuàng)新點如下: ●提出了新的直接轉(zhuǎn)化算法,將改進后頻域得到的心胛聽覺掩蔽閾值直接轉(zhuǎn)化為小波域相應(yīng)了帶變換系數(shù)的最大許用量化誤差能量失真. ●提出了PPMMSE算法,從分析語音和音頻信號中提取正弦分量;并將該算法應(yīng)用到正弦/小波包混合感知音頻編碼器中. ●提出了采用DB20和DB5兩種小波自適應(yīng)切換分別來實現(xiàn)對穩(wěn)態(tài)和瞬態(tài)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 感知音頻編碼和監(jiān)控音頻編碼(SVAC)關(guān)鍵技術(shù)研究.pdf
- 低碼率感知音頻編碼研究.pdf
- 感知音頻編碼的關(guān)鍵技術(shù)與改進.pdf
- 預(yù)測技術(shù)在感知音頻編碼中的應(yīng)用.pdf
- 感知音頻編碼中的時頻分析技術(shù).pdf
- AAC感知音頻編碼算法的優(yōu)化與設(shè)計.pdf
- 感知音頻編碼器的設(shè)計與改進.pdf
- 心理聲學(xué)模型及其在感知音頻編碼中的應(yīng)用.pdf
- 聽覺心理聲學(xué)模型及其在感知音頻編碼中的應(yīng)用.pdf
- 感知視頻編碼技術(shù)研究.pdf
- 音頻感知編碼模型及關(guān)鍵技術(shù)的研究.pdf
- 基于小波包變換和聽覺掩蔽的同步音頻盲水印技術(shù)研究.pdf
- 基于人類視覺感知的分塊小波圖像編碼技術(shù)研究.pdf
- 感知立體視頻編碼技術(shù)研究.pdf
- Ad Hoc網(wǎng)絡(luò)編碼感知路由技術(shù)研究.pdf
- 混合激勵MVDR語音編碼技術(shù)研究.pdf
- 基于小波包變換的諧波電能計量技術(shù)研究.pdf
- 基于小波包的多載波通信技術(shù)研究.pdf
- 小波包技術(shù)研究及儲層預(yù)測評價.pdf
- 混合式步進電機正弦細分驅(qū)動技術(shù)研究.pdf
評論
0/150
提交評論