版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、??收稿日期:20080512修回日期:20080726。??基金項目:上海市自然科學基金資助項目(04ZR14138)。??作者簡介:宮云梅(1980)女山東乳山人博士研究生主要研究方向:強噪聲環(huán)境中語音增強算法?趙曉群(1962)男黑龍江依安人教授博士主要研究方向:數(shù)字語音信號處理、最佳信號設(shè)計理論、無線通信?史仍輝(1981)男山東梁山人博士研究生主要研究方向:最佳信號設(shè)計理論、RFID技術(shù)及應用。文章編號:10019081(20
2、08)11298103基于語音存在概率和聽覺掩蔽特性的語音增強算法宮云梅趙曉群史仍輝(同濟大學電子與信息工程學院上海200092)(gong_0830@mai.ltongj.iedu.cn)摘?要:低信噪比下譜減語音增強法中一直存在的去噪度、殘留的音樂噪聲和語音畸變度三者間均衡這一關(guān)鍵問題顯得尤為突出。為降低噪聲對語音通信的干擾提出了一種適于低信噪比下的語音增強算法。在傳統(tǒng)的譜減法基礎(chǔ)上根據(jù)噪聲的聽覺掩蔽閾值自適應調(diào)整減參數(shù)利用語音存在
3、概率對語音、噪聲信號估計避免低信噪比下端點檢測(VAD)的不準確有更強的魯棒性。對算法進行了客觀和主觀測試結(jié)果表明:相對于傳統(tǒng)的譜減法在幾乎不損傷語音清晰度的前提下該算法能更好地抑制殘留噪聲和背景噪聲特別是對低信噪比和非平穩(wěn)噪聲干擾的語音信號效果更加明顯。關(guān)鍵詞:語音增強譜減法語音存在概率聽覺掩蔽特性中圖分類號:TN912.3TP391??文獻標志碼:ASpeechenhancementbasedonspeech?presencepro
4、babilityauditymaskingpropertyGONGYun?meiZHAOXiao?qunSHIReng?hui(CollegeofElectronicsInfmationEngineeringTongjiUniversityShanghai201804China)Abstract:InlowSignaltoNoiseRatio(SNR)environmentthetrade?offamongtheamountofnois
5、ereductionthelevelofmusicalresidualnoisethespeechdisttionwasthekeyproblemofspectralsubtractionspeechenhancement.AnimprovedspeechenhancementalgithmflowSNRwasdevelopedindertodecreasetheinterferenceofnoiseonpurespeech.Thisa
6、lgithmwasbasedonthetraditionalspectralsubtractionthesubtractionparameterwasself?adaptivelyadjustedinthelightofthemaskingpropertiesofhumanaudity.Thespeech?presenceprobabilitywasintegratedtoestimatethesignalnoisewhichwould
7、avoidtheinaccuracyofutilizingVoiceActivityDetection(VAD)increasetherobustness.Theexperimentalresultsdemonstratethatthisalgithmiseffectivetoreducetheresidualnoisethebackgroundnoisebutnottodisttthespeecharticulationcompare
8、dtoothermodifiedspectralsubtractionalgithmsespeciallyfthelowSNRnoisyspeechsignalthatbeingdegradedbynon?stationarynoise.Keywds:speechenhancementspectralsubtractionspeech?presenceprobabilityauditymaskingproperty??噪聲的干擾不僅會降
9、低語音通信的質(zhì)量而且也會使基于特征參數(shù)提取的語音處理系統(tǒng)(如低速率語音編碼、語音識別等)性能下降語音增強方法眾多譜減法由于其簡單有效性已為許多實際數(shù)字語音處理系統(tǒng)所采用。但是由于噪聲與語音信號在頻域中的重疊特性在消除噪聲提高語音信號的信噪比的同時必然會引起原始語音信號的失真。常規(guī)譜減法還會產(chǎn)生較強的殘留音樂噪聲如何兼顧去噪度噪聲殘留和減少語音失真是不少學者致力研究的課題。噪聲估計是語音增強算法中關(guān)鍵的部分文獻[1]提出采用最優(yōu)平滑和語音
10、存在條件概率對噪聲進行估計在低信噪比和非平穩(wěn)噪聲的情況下該方法明顯優(yōu)于其他的噪聲估計。文獻[2]最早提出基于語音概率估計的譜減算法不需語音激活檢測(VoiceActivityDetectionVAD)。在給出VAD估計噪聲的基礎(chǔ)上文獻[3~8]將語音存在概率引入到各種增強算法語音增強效果顯著改善但是對噪聲突然上升時[6]或者噪聲突然下降時[5]的估計存在較大的延時性。基于聽覺掩蔽特性調(diào)整減參數(shù)[9]改進增強算法能提高語音的清晰度減少語音
11、的畸變度。文中結(jié)合語音存在概率利用人類聽覺系統(tǒng)的掩蔽特性有選擇性地進行譜減從而較好地兼顧了去噪度噪聲殘留和減少語音失真。通過比較文獻[3]改進的對數(shù)譜最小均方誤差估計(MinimumMeanSquareErrLog?SpectralAmplitudeMMSE?LSA)算法本文提出的算法從主觀和客觀評價性能要更好。1?語音增強算法一幀語音信號時域和改為快速傅立葉變換(FastFourierTransfmFFT)變換的頻域表示:yl(n)=
12、xl(n)dl(n)1?n?NYlk=XlkDlk(1)其中:xl(n)dl(n)yl(n)分別表示第l幀第n樣本點的純凈語音信號、加性噪聲和帶噪語音信號XlkDlkYlk分別表示xl(n)dl(n)yl(n)的第l幀第k個頻譜分量通常xl(n)和dl(n)不相關(guān)所以有:E[Ylk2]=E[Xlk2]E[Dlk2](2)再設(shè)?X(lk)=E[|Xlk|2]和?D(lk)=E[|Dlk|2]分別表示xl(n)和dl(n)的第l幀第k個頻譜
13、分量的功率譜??梢酝ㄟ^語音端點檢測算法檢測到的語音間歇段的統(tǒng)計平均得到?D(lk)。對于分析幀內(nèi)的短時平穩(wěn)過程可以得到原始語音的幅度譜的估計值:第28卷第11期2008年11月?計算機應用ComputerApplications?Vo.l28No.11Nov.200810lge(?b)=15.817.5(?b0.474)17.51(?b0.474)2?(dB)(23)3)計算Bark頻帶上的擴展頻譜。時域一幀帶噪語音信號y(n)經(jīng)過快速
14、傅立葉變換(FFT)變成頻域信號Y(k)利用式(4)對語音信號進行粗估計得語音信號X(k)功率譜為:P(k)=X(k)2(24)其中X(k)為X(k)的幅度譜。計算每一段的能量即:Bb=%khbk=klbp(k)(25)其中:Bb表示第b帶的能量klb和khb分別為b段的離散頻帶的下限和上限。Bb與e(?b)相互卷積就可以得到Bark頻域擴展譜Cb即:Cb=e(?b)?Bb=%m=bmaxm=1e(bm)B(m)1?b?bmax(26)
15、其中bmax為臨界帶個數(shù)取決于時域信號的采樣頻率。4)噪聲掩蔽閾值的計算。有兩種噪聲掩蔽門限:一種是純音掩蔽噪聲(ToneMaskingNoiseTMN)是在Cb下面(14.5b)dB另一種是噪聲掩蔽純音(NoiseMaskingToneNMT)是在Cb下面5.5dB。計算每一幀的各個Bark臨界頻帶掩蔽閾值的偏移量Ob:Ob=%(14.5b)(1%)5.5(27)其中:%=minSFMdBSFMdBmax1定義為音調(diào)系數(shù)SFMdB=1
16、0logGmAm反映信號頻譜平滑程度定義為每個頻帶信號功率譜的幾何平均值Gm和算術(shù)平均值A(chǔ)m之比SFMdBmax為一個經(jīng)驗值大小為60dB表示只存在純音信號的掩蔽效應情況。由于噪聲和音調(diào)的掩蔽特性不同可以通過%的數(shù)值來判斷這個信號是偏噪聲的還是偏語音的:當%=0完全是噪聲%=1完全是純音。實際語音信號既非噪聲又非純音%介于兩者之間。則噪聲掩蔽閾值為:Tb=10lgCb0.1Ob(28)5)聽覺掩蔽閾值的計算。Tb映射到各個頻譜上才能進行
17、后續(xù)工作則最終的對應在各個頻譜上的掩蔽閾值記為Tk。把得到各個頻譜上的掩蔽閾值記為Tk與絕對聽覺閾值比較較大的一個即為要求的聽覺掩蔽閾值得到聽覺掩蔽閾值:Thear(k)=max(TqTk)(29)2?實驗結(jié)果及分析通過對多種不同的噪聲環(huán)境下不同程度輸入信噪比([105]dB)的帶噪語音信號利用文中改進的增強算法進行去噪處理然后從客觀評價標準的分段信噪比(segmentalSNR)和語譜圖兩種方法分析增強后的語音信號。這里選用Noise
18、x92噪聲庫的三種噪聲:高斯白噪聲M109坦克噪聲F16噪聲。并將本文中提出的算法和文獻[3]的改進MMSE?LS算法相比較。幀的分段信噪比:SNRseg=1L%L1l=010lg%N1n=0x(lNn)2%N1n=0[x(lNn)x^(lNn)]2(30)L帶噪語音信號幀的個數(shù)N是每幀未重疊的點數(shù)。表1展示出了在三種不同噪聲環(huán)境下對從10到5dB輸入信噪比的帶噪信號的平均分段信噪比的改進度。顯然本文算法的分段信噪比的改進度比文獻[3]
19、改進的MMSE?LS改進度大特別是對于低信噪比環(huán)境下的非平穩(wěn)噪聲??紤]到信噪比客觀評價標準無法很好評價增強語音中的殘余噪聲下面給出了兩種增強算法對比實驗的語譜圖。我們給出輸入分段信噪比是10dB情況下在純凈語音上疊加的M109坦克噪聲的語譜圖。圖1(a)為干凈原始語音信號相應的語譜圖圖1(b)為原始語音上疊加M109坦克噪聲。圖1(c)為文獻[3]提出改進MMSE?LS算法的實驗結(jié)果能最大限度地去除音樂噪聲但是所引入的語音畸變度也最大對
20、語音的損傷在高頻部分也比較明顯。圖1(d)是本文算法的實驗結(jié)果可以看出增強語音背景噪聲小語音起始段和靜音段增強效果比較好同時語音失真小。表1?各噪聲環(huán)境下分段信噪比的改進度輸入信噪比dB高斯白噪聲改進的MMSE?LS本文算法M109坦克噪聲改進的MMSE?LS本文算法F16噪聲改進的MMSE?LS本文算法55.217.454.287.215.057.6708.8710.317.239.417.499.40511.2013.408.671
21、0.988.6010.341012.1916.239.6412.389.2412.653?結(jié)語本文采用隨時頻變化的平滑因子和語音存在條件概率對每幀信號進行有效的噪聲估計提出了一種改進的語音增強算法通過利用噪聲頻譜的Guass統(tǒng)計模型噪聲幅度譜的Rayleigh模型最小控制遞歸平均(MinimaControlledRecursiveAveragingMCRA)估計的先驗信噪比人耳掩蔽特性以及語音存在概率模型對傳統(tǒng)的譜減算法進行了修正。語音
22、存在概率能夠保留最多的語音成分的同時也將噪聲譜盡可能地保持在聽覺掩蔽閾值之下。從主觀聽覺上感受到更小的語音畸變和更少的可聽聞殘留噪聲和音樂噪聲并且能夠大幅度提高去噪后語音信號的信噪比使整個譜減語音增強系統(tǒng)相對其他改進譜減法能夠較優(yōu)化地在殘余噪聲度、音樂噪聲度以及語音信號畸變度之間取得折中。圖1?帶噪語音經(jīng)過兩種算法增強后的語譜圖參考文獻:[1]?SUNDARRIAJANRLOIZOUPC.Anoise?estimationalgithm
23、fhighlynon?stationaryenvironments[J].SpeechCommunication2006(48):220231.[2]?MCACLAYRJMALPASSML.Speechenhancementusingasoft?decisionnoisesuppressionfilter[J].IEEETransactionsonAcous?ticsSpeechSignalProcessing198028(2):137
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于聽覺掩蔽效應的語音增強算法研究.pdf
- 基于小波變換和聽覺掩蔽特性的語音增強算法的研究.pdf
- 基于人耳聽覺掩蔽效應的語音增強的研究.pdf
- 基于聽覺掩蔽效應的小波包語音增強方法研究.pdf
- 基于約束方差噪聲譜估計和聽覺掩蔽效應的語音增強.pdf
- 基于聽覺特性的語音增強算法研究.pdf
- 基于人耳掩蔽效應的語音增強算法研究.pdf
- 基于噪聲估計和掩蔽效應的語音增強.pdf
- 基于統(tǒng)計模型和掩蔽效應的語音增強.pdf
- 基于聽覺特性及語譜特性的語音增強.pdf
- 基于聽覺掩蔽效應的音頻水印算法的改進與研究.pdf
- 基于聽覺特性的電子耳蝸語音增強的研究.pdf
- 基于聽覺掩蔽效應的數(shù)字助聽器算法研究及DSP的實現(xiàn).pdf
- 基于計算聽覺場景分析的語音增強.pdf
- 基于信號稀疏特性的語音增強算法研究.pdf
- 基于聽覺掩蔽效應的客觀音質(zhì)評價研究.pdf
- 基于二值掩蔽和感知小波包變換的語音增強研究.pdf
- 聽覺特性與魯棒語音識別算法研究.pdf
- 窄帶語音通信中語音增強算法和實現(xiàn)研究.pdf
- 基于語音增強的語音活動檢測算法研究.pdf
評論
0/150
提交評論