語音信號壓縮感知關(guān)鍵技術(shù)研究.pdf_第1頁
已閱讀1頁,還剩124頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、信號的稀疏性是壓縮感知理論的應(yīng)用前提,壓縮感知用最少的觀測數(shù)來對信號進(jìn)行壓縮采樣,實現(xiàn)了信號的降維處理,節(jié)約了采樣和傳輸?shù)某杀?,給信號采樣技術(shù)帶來一場新的革命。對于語音信號而言,由于其具有近似稀疏性,可以將壓縮感知理論與語音信號處理技術(shù)結(jié)合,打破了傳統(tǒng)的建立于奈奎斯特采樣的語音信號處理經(jīng)典模式。用壓縮感知理論中的觀測序列來代替?zhèn)鹘y(tǒng)奈奎斯特語音采樣值,將導(dǎo)致信號特征發(fā)生根本性的變化,從而影響語音信號處理應(yīng)用的各個領(lǐng)域。本課題在對壓縮感知理

2、論深入研究的基礎(chǔ)上,研究了語音信號的壓縮感知稀疏域和基于觀測序列的語音端點檢測算法,提出一種適合語音的觀測矩陣,并對該觀測矩陣投影下的觀測序列模型進(jìn)行研究,針對語音壓縮感知,提出一種碼本映射聯(lián)合l1重構(gòu)算法。論文的主要工作和創(chuàng)新如下:
 ?。?)研究語音觀測序列在不同稀疏域下的壓縮感知重構(gòu)技術(shù),對比語音信號在DCT、DFT、DWT及K-L變換下的稀疏性。研究表明,雖然在K-L變換下語音系數(shù)是最稀疏的,但由于重構(gòu)時需要用到原信號的自

3、相關(guān)矩陣,實際應(yīng)用困難,而在前三種稀疏域下,DCT變換的稀疏性最好。研究了在隨機高斯矩陣投影下,壓縮感知BP重構(gòu)和OMP重構(gòu)的原理及性能。實驗結(jié)果顯示對語音信號而言,在相同觀測點數(shù)下,BP重構(gòu)性能優(yōu)于OMP,但運算復(fù)雜度大。研究了語音觀測在過完備余弦字典及KSVD字典下的壓縮感知,由于系數(shù)稀疏性的增強,其重構(gòu)效果比DCT基均有提高,且KSVD字典重構(gòu)性能優(yōu)于過完備余弦字典。根據(jù)語音幀和非語音幀壓縮感知觀測序列頻譜幅度分布分散且差異較大的

4、特性,提出一種基于壓縮感知觀測序列倒譜距離的語音端點檢測算法,以直接根據(jù)觀測序列特性分析判斷出原始輸入語音的屬性。對不同信噪比下的帶噪語音進(jìn)行端點檢測仿真實驗,其性能與傳統(tǒng)奈奎斯特采樣下的倒譜端點檢測相當(dāng),但可以降低運算量。
 ?。?)針對DCT稀疏基下,語音信號采用隨機高斯觀測矩陣投影時,壓縮感知重構(gòu)零(近似零)系數(shù)定位能力差,導(dǎo)致對重構(gòu)質(zhì)量起主導(dǎo)作用的系數(shù)樣值發(fā)生較大誤差的問題,提出一種適合于語音信號壓縮采樣的行階梯觀測矩陣,

5、并對壓縮觀測序列采用對偶仿射尺度內(nèi)點算法進(jìn)行重構(gòu)。仿真實驗結(jié)果顯示,行階梯矩陣做觀測矩陣,能夠?qū)φZ音信號的零(近似零)系數(shù)進(jìn)行較好的定位,從而得到明顯優(yōu)于高斯觀測矩陣下語音壓縮感知的重構(gòu)性能,并且行階梯觀測矩陣與隨機高斯觀測矩陣相比,相應(yīng)的數(shù)據(jù)量和運算量都大大減小。因此,作者認(rèn)為,行階梯觀測矩陣是適合語音信號壓縮感知采樣的比較理想的投影矩陣。
  (3)鑒于行階梯矩陣投影下得到的語音壓縮觀測序列仍具有較強的相關(guān)性,提出對觀測序列采

6、用Volterra級數(shù)二次建模,分析輸入序列維數(shù)和模型階數(shù)對語音行階梯觀測序列預(yù)測的效果,并聯(lián)合使用Wiener濾波器以提高預(yù)測準(zhǔn)確程度,實現(xiàn)了基于部分CS觀測序列、Volterra模型、Wiener濾波器的CS重構(gòu)。
 ?。?)論文最后針對CS重構(gòu)算法計算量大的問題,提出一種基于觀測序列與原始序列關(guān)系的碼本映射重構(gòu)方法,該方法與l1重構(gòu)相比,對稀疏系數(shù)的位置估計較為準(zhǔn)確,且不需要優(yōu)化算法進(jìn)行重構(gòu),而是從訓(xùn)練得到的碼本中直接得到重

7、構(gòu)系數(shù),重構(gòu)時需要的計算量比BP和OMP算法明顯下降。但由于系數(shù)大小估計不夠準(zhǔn)確,綜合考慮重構(gòu)性能和運算量,采用碼本映射聯(lián)合l1重構(gòu)。該算法訓(xùn)練階段得到語音碼本和觀測碼本,測試階段先估計測試語音的SNR,然后根據(jù)SNR和CS壓縮比選擇相應(yīng)的能量門限?,觀測序列幀能量大于?采用l1重構(gòu),小于l1采用碼本重構(gòu)。實驗表明,在中低SNR環(huán)境下,碼本映射聯(lián)合l1重構(gòu)算法在一定的能量門限下重構(gòu)性能優(yōu)于l1重構(gòu),在高SNR和無噪環(huán)境下,碼本映射聯(lián)合l

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論