正弦-小波包混合感知音頻編碼技術(shù)研究.pdf

上傳人：奔*** IP屬地：河北更新時間：2024-03-10 格式：pdf 頁數(shù)：133 大?。?.19MB 人氣指數(shù)：12 舉報 版權(quán)申訴

已閱讀1頁，還剩132頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、低比特率音頻編碼可以減少傳輸音頻信號對信道帶寬的要求,流暢地實現(xiàn)網(wǎng)絡(luò)傳輸,還可以節(jié)約存儲空間,降低存儲的成本,具有重要的實用價值.MPEG音頻編碼標(biāo)準(zhǔn)采用了頻域的量化和編碼算法,將音頻信號分成短的編碼塊,假定每個編碼塊為穩(wěn)態(tài)信號,然后將每個編碼塊轉(zhuǎn)換到頻域進行量化和編碼;對于存在瞬態(tài)信號的編碼塊,將編碼塊分成更短的編碼塊,轉(zhuǎn)化到頻域,進行量化和編碼.由于MPEG音頻編碼標(biāo)準(zhǔn)中編碼塊長度短,編碼過程中,邊信息在整個比特流中所占的比重較大;

2、在MP3編碼比特流中,邊信息所占的比重約為11.5﹪.本文中研究了利用正弦/小波包混合感知音頻編碼技術(shù)來實現(xiàn)在低比特率對音頻信號的編解碼:小波包音頻編碼器利用了小波的時頻局部化特性,實現(xiàn)對穩(wěn)態(tài)和瞬態(tài)音頻信號的描述,因此可以選用較長的編碼塊,邊信息在比特流中的比重較小,在低比特率下可以實現(xiàn)對音頻信號的高質(zhì)量編碼;本文中編碼器編碼比特流中,邊信息所占的比重為3.89﹪.由于小波包濾波器組頻域分辨率低,在純音分量占豐導(dǎo)地位的音頻信號中,采用小

3、波濾波器組不能對占頻信號做最簡潔地描述.對于這種信號,木文中先采用正弦分量提取,然后將剩余的殘羞信號利用小波進行描述. 本文研究工作有四部分,第一部分對小波包域心理聽覺模型進行了研究. 首先研究了人耳心理聽覺的掩蔽原理,人耳心理聽覺時頻域掩蔽現(xiàn)象;然后根據(jù)文中音頻編碼器的需要,改進了MPEG音頻編碼標(biāo)準(zhǔn)中的頻域心理聽覺模型;最后利用頻域和小波域的對稱性,提出了新的直接轉(zhuǎn)化算法,將頻域得到的心理聽覺掩蔽閾值轉(zhuǎn)化到小波域的各

4、個子帶中.測試結(jié)果表明:采用各個子帶的最大許用量化能量失真來對相應(yīng)子帶中的小波變換系數(shù)進行量化反量化后重建,所獲得重建音頻信號的質(zhì)量略好于MP3音頻編解碼器重建音頻信號的質(zhì)量. 第二部分研究了語音和音頻信號中正弦分量的提取,提出了PPMMSE算法,從語音和音頻信號中提取出正弦分量. 首先計算分析信號的功率譜,確定功率譜曲線最大峰值處對應(yīng)的頻率,然后在以該頻率為中心的小區(qū)間內(nèi),采用最小均方誤差法提取正弦分量,將提取的正弦分

5、量從分析信號中去除;然后再計算殘差信號的功率譜,找到功率譜最大峰值處對應(yīng)的頻率,確定出將要提取正弦分量的頻率,振幅和初相位;依次類推從分析信號塊內(nèi)提取出所有的正弦分量.相對于峰值拾取算法,本文所提出的算法不僅適用于穩(wěn)態(tài)信號,而且適用于瞬態(tài)信號,得到參數(shù)的精度較高;十日對于最小均方誤差算法,該算法得到參數(shù)的精度高,計算復(fù)雜度遠遠小于采用最小均方誤差算法需要的計算復(fù)雜度. 第三部分研究了小波包音頻編碼中濾波器和小波變換系數(shù)的量化和碼

6、率控制. 首先研究了信號多分辨率描述的原理以及快速算法實現(xiàn);然后根據(jù)人耳的臨界帶選擇了小波包分解樹結(jié)構(gòu).提出了采用DB20和DB5兩種小波自適應(yīng)切換分別來實現(xiàn)對穩(wěn)態(tài)和瞬態(tài)音頻編碼塊的描述;最后研究了小波變換系數(shù)的量化算法;對小波變換系數(shù)采用了全局均勻矢量量化,和局部子帶小波變換系數(shù)放大,來實現(xiàn)恒比特率的音頻編碼.采用內(nèi)外環(huán)技術(shù)來控制比特率,在內(nèi)環(huán)控制音頻編碼的比特率,在外環(huán),通過調(diào)整放大兇子來控制各個子帶的量化能量失真.

7、第四部分中,對正弦/小波包混合音頻編解碼器系統(tǒng)進行了研究. 改進了正弦/小波包混合音頻編解碼器框圖.在該框圖中,采用PPMMSE算法從音頻信號中提取正弦分量,融入了內(nèi)外環(huán)碼率控制模塊,頻域心理聽覺模型轉(zhuǎn)化到小波域模塊,和自適應(yīng)小波切換模塊;研究了音頻編碼比特流的語法結(jié)構(gòu),最后對音頻編解碼器進行主客觀質(zhì)量評定,結(jié)果表明:對于大多數(shù)測試信號單通道在64kb/s進行編碼,本文所提供的音頻編解碼器獲得重建音頻信號的質(zhì)量好于MP3音頻編

8、解碼器扶得重建音頻信號的質(zhì)量;編碼器計算復(fù)雜度略大于MP3占頻編碼器的計算復(fù)雜度. 本文的創(chuàng)新點如下: ●提出了新的直接轉(zhuǎn)化算法,將改進后頻域得到的心胛聽覺掩蔽閾值直接轉(zhuǎn)化為小波域相應(yīng)了帶變換系數(shù)的最大許用量化誤差能量失真. ●提出了PPMMSE算法,從分析語音和音頻信號中提取正弦分量;并將該算法應(yīng)用到正弦/小波包混合感知音頻編碼器中. ●提出了采用DB20和DB5兩種小波自適應(yīng)切換分別來實現(xiàn)對穩(wěn)態(tài)和瞬態(tài)

眾賞文庫> 全部分類> 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

正弦-小波包混合感知音頻編碼技術(shù)研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

正弦-小波包混合感知音頻編碼技術(shù)研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

免費下載