多帶激勵(lì)聲碼器關(guān)鍵算法的研究.pdf

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-03-09 格式：pdf 頁數(shù)：117 大?。?.67MB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

已閱讀1頁，還剩116頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、多帶激勵(lì)(MBE)聲碼器在理論上支持高質(zhì)量的語音合成,是目前在低碼率范圍內(nèi)研究最普遍的一種語音模型,具有廣泛應(yīng)用前景。然而MBE聲碼器在實(shí)際參數(shù)估計(jì)、參數(shù)量化、無線傳輸和語音合成過程中均很有可能會引入誤差,進(jìn)而影響語音質(zhì)量,尤其在低碼率應(yīng)用和信源信道雙重噪聲干擾的情況下語音質(zhì)量存在很大落差,相關(guān)算法有待改進(jìn)。本文主要針對參數(shù)估計(jì)和語音合成過程所涉及的關(guān)鍵算法進(jìn)行改進(jìn)。
　　由于傳統(tǒng)雙路徑基音跟蹤算法對約束方程的門限取固定經(jīng)驗(yàn)值,導(dǎo)

2、致基音估計(jì)的魯棒性差。首先構(gòu)造全新的差值不等式作為約束方程,以降低建立門限自適應(yīng)調(diào)整模型的難度。然后通過分析標(biāo)準(zhǔn)基音周期及其倍/次基音所對應(yīng)的單幀擬合誤差之間的最大差值關(guān)系來研究在單幀意義上的倍/次基音干擾特性,推廣得到差值門限過低會降低對倍基音干擾的抑制能力而差值門限過高則會引入更多次基音錯(cuò)誤的因果關(guān)系。從而提出雙門限和全范圍兩種自適應(yīng)雙路徑基音跟蹤算法,相應(yīng)的差值門限分別根據(jù)先前幀基音周期長短的統(tǒng)計(jì)結(jié)果和前一幀的倍基音錯(cuò)誤識別信息進(jìn)

3、行更新。實(shí)驗(yàn)結(jié)果顯示,以上兩種算法對應(yīng)基音估計(jì)的嚴(yán)重錯(cuò)誤概率(GER)均普遍下降,尤其對于女聲,當(dāng)信噪比(SNR)為-5dB時(shí)女聲基音估計(jì)的GER的平均性能改善分別達(dá)到82.13％和82.19%,雖然對應(yīng)基音估計(jì)的一般錯(cuò)誤均值(ME)均普遍增加,但是幅度很小,ME的性能損失相對GER的性能改善而言非常微弱。實(shí)驗(yàn)結(jié)果表明,以上兩種算法對不同講話者和不同程度高斯白噪聲干擾均具有較強(qiáng)的適應(yīng)能力,尤其在嚴(yán)重的高斯白噪聲干擾的情況下基音估計(jì)準(zhǔn)確性

4、的改善更加明顯。
　　子帶劃分不可避免會增加清濁音誤判的概率,現(xiàn)有的常用子帶劃分方式只憑經(jīng)驗(yàn)進(jìn)行劃分,產(chǎn)生的失真影響較大,因此結(jié)合子帶清濁音誤判所導(dǎo)致的失真影響與子帶能量必然有關(guān)的性質(zhì),提出一種基于譜分布特性的子帶劃分方式,根據(jù)當(dāng)前幀的諧波結(jié)構(gòu)以及諧波能量分布,按照兼顧各個(gè)子帶之間的帶寬平衡和能量平衡的原則進(jìn)行劃分。另外,背景噪聲會降低子帶信號的濁音度,傳統(tǒng)子帶清濁音判決算法存在魯棒性差的問題,因此提出一種基于相關(guān)增強(qiáng)的子帶清濁音

5、判決算法:通過對不同背景環(huán)境和SNR的帶噪語音以及純凈語音的清濁音聚類采用Fisher最佳投影矢量進(jìn)行映射,得到新的更具可辨識性的清音聚類和濁音聚類,從而增強(qiáng)特征值與清濁音之間的相關(guān)性;同時(shí)采用以先前幀子帶清濁音狀態(tài)、清濁音狀態(tài)在時(shí)間上的相關(guān)系數(shù)矩陣作為先驗(yàn)概率輸入信息的最大后驗(yàn)概率判決準(zhǔn)則,從而引入相鄰幀清濁音之間的相關(guān)性。實(shí)驗(yàn)結(jié)果表明,上述優(yōu)化算法的判決性能從整體上得到改善,在不同背景環(huán)境下均具有較強(qiáng)的抗噪聲能力,語音聽覺質(zhì)量提高。

6、
　　低碼率MBE聲碼器通常采用線性預(yù)測(LP)全極點(diǎn)模型來逼近MBE譜幅度矢量并最終將其等效為線譜頻率(LSF)參數(shù)形式。當(dāng)MBE譜密度序列過于稀疏或存在頻域采樣偏移時(shí)不能用于準(zhǔn)確估計(jì)自相關(guān)序列,導(dǎo)致LP譜與MBE譜之間的逼近誤差較大,因此提出一種MBE譜密度內(nèi)插修正方案,將MBE譜密度序列擴(kuò)展為頻域均勻分布且頻率充分取樣的序列,并校準(zhǔn)LP增益以避免由MBE譜密度內(nèi)插造成的不同語音幀之間總功率不同程度的波動。另外,LSF系數(shù)提取

7、算法不能確保實(shí)際LSF系數(shù)是升序的,因此提出一種LSF系數(shù)優(yōu)化方案,分別在兩個(gè)方向上進(jìn)行局部微調(diào),并直接將兩者平均作為LSF系數(shù)的最終結(jié)果。實(shí)驗(yàn)結(jié)果表明,上述改進(jìn)算法能夠有效降低LP譜包絡(luò)估計(jì)誤差并避免合成語音出現(xiàn)局部異常尖峰,語音聽覺質(zhì)量提高。
　　低碼率MBE聲碼器通常采用重新生成方式得到濁音諧波相位信息,現(xiàn)有的相位生成算法容易引起語音波形失衡,相應(yīng)語音信號的峰均比偏高,從而導(dǎo)致信號飽和失真概率增加或系統(tǒng)待機(jī)時(shí)間縮短,因此提出

眾賞文庫> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

多帶激勵(lì)聲碼器關(guān)鍵算法的研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

多帶激勵(lì)聲碼器關(guān)鍵算法的研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

免費(fèi)下載