版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、多帶激勵(lì)(MBE)聲碼器在理論上支持高質(zhì)量的語(yǔ)音合成,是目前在低碼率范圍內(nèi)研究最普遍的一種語(yǔ)音模型,具有廣泛應(yīng)用前景。然而MBE聲碼器在實(shí)際參數(shù)估計(jì)、參數(shù)量化、無(wú)線傳輸和語(yǔ)音合成過(guò)程中均很有可能會(huì)引入誤差,進(jìn)而影響語(yǔ)音質(zhì)量,尤其在低碼率應(yīng)用和信源信道雙重噪聲干擾的情況下語(yǔ)音質(zhì)量存在很大落差,相關(guān)算法有待改進(jìn)。本文主要針對(duì)參數(shù)估計(jì)和語(yǔ)音合成過(guò)程所涉及的關(guān)鍵算法進(jìn)行改進(jìn)。
由于傳統(tǒng)雙路徑基音跟蹤算法對(duì)約束方程的門限取固定經(jīng)驗(yàn)值,導(dǎo)
2、致基音估計(jì)的魯棒性差。首先構(gòu)造全新的差值不等式作為約束方程,以降低建立門限自適應(yīng)調(diào)整模型的難度。然后通過(guò)分析標(biāo)準(zhǔn)基音周期及其倍/次基音所對(duì)應(yīng)的單幀擬合誤差之間的最大差值關(guān)系來(lái)研究在單幀意義上的倍/次基音干擾特性,推廣得到差值門限過(guò)低會(huì)降低對(duì)倍基音干擾的抑制能力而差值門限過(guò)高則會(huì)引入更多次基音錯(cuò)誤的因果關(guān)系。從而提出雙門限和全范圍兩種自適應(yīng)雙路徑基音跟蹤算法,相應(yīng)的差值門限分別根據(jù)先前幀基音周期長(zhǎng)短的統(tǒng)計(jì)結(jié)果和前一幀的倍基音錯(cuò)誤識(shí)別信息進(jìn)
3、行更新。實(shí)驗(yàn)結(jié)果顯示,以上兩種算法對(duì)應(yīng)基音估計(jì)的嚴(yán)重錯(cuò)誤概率(GER)均普遍下降,尤其對(duì)于女聲,當(dāng)信噪比(SNR)為-5dB時(shí)女聲基音估計(jì)的GER的平均性能改善分別達(dá)到82.13%和82.19%,雖然對(duì)應(yīng)基音估計(jì)的一般錯(cuò)誤均值(ME)均普遍增加,但是幅度很小,ME的性能損失相對(duì)GER的性能改善而言非常微弱。實(shí)驗(yàn)結(jié)果表明,以上兩種算法對(duì)不同講話者和不同程度高斯白噪聲干擾均具有較強(qiáng)的適應(yīng)能力,尤其在嚴(yán)重的高斯白噪聲干擾的情況下基音估計(jì)準(zhǔn)確性
4、的改善更加明顯。
子帶劃分不可避免會(huì)增加清濁音誤判的概率,現(xiàn)有的常用子帶劃分方式只憑經(jīng)驗(yàn)進(jìn)行劃分,產(chǎn)生的失真影響較大,因此結(jié)合子帶清濁音誤判所導(dǎo)致的失真影響與子帶能量必然有關(guān)的性質(zhì),提出一種基于譜分布特性的子帶劃分方式,根據(jù)當(dāng)前幀的諧波結(jié)構(gòu)以及諧波能量分布,按照兼顧各個(gè)子帶之間的帶寬平衡和能量平衡的原則進(jìn)行劃分。另外,背景噪聲會(huì)降低子帶信號(hào)的濁音度,傳統(tǒng)子帶清濁音判決算法存在魯棒性差的問(wèn)題,因此提出一種基于相關(guān)增強(qiáng)的子帶清濁音
5、判決算法:通過(guò)對(duì)不同背景環(huán)境和SNR的帶噪語(yǔ)音以及純凈語(yǔ)音的清濁音聚類采用Fisher最佳投影矢量進(jìn)行映射,得到新的更具可辨識(shí)性的清音聚類和濁音聚類,從而增強(qiáng)特征值與清濁音之間的相關(guān)性;同時(shí)采用以先前幀子帶清濁音狀態(tài)、清濁音狀態(tài)在時(shí)間上的相關(guān)系數(shù)矩陣作為先驗(yàn)概率輸入信息的最大后驗(yàn)概率判決準(zhǔn)則,從而引入相鄰幀清濁音之間的相關(guān)性。實(shí)驗(yàn)結(jié)果表明,上述優(yōu)化算法的判決性能從整體上得到改善,在不同背景環(huán)境下均具有較強(qiáng)的抗噪聲能力,語(yǔ)音聽(tīng)覺(jué)質(zhì)量提高。
6、
低碼率MBE聲碼器通常采用線性預(yù)測(cè)(LP)全極點(diǎn)模型來(lái)逼近MBE譜幅度矢量并最終將其等效為線譜頻率(LSF)參數(shù)形式。當(dāng)MBE譜密度序列過(guò)于稀疏或存在頻域采樣偏移時(shí)不能用于準(zhǔn)確估計(jì)自相關(guān)序列,導(dǎo)致LP譜與MBE譜之間的逼近誤差較大,因此提出一種MBE譜密度內(nèi)插修正方案,將MBE譜密度序列擴(kuò)展為頻域均勻分布且頻率充分取樣的序列,并校準(zhǔn)LP增益以避免由MBE譜密度內(nèi)插造成的不同語(yǔ)音幀之間總功率不同程度的波動(dòng)。另外,LSF系數(shù)提取
7、算法不能確保實(shí)際LSF系數(shù)是升序的,因此提出一種LSF系數(shù)優(yōu)化方案,分別在兩個(gè)方向上進(jìn)行局部微調(diào),并直接將兩者平均作為L(zhǎng)SF系數(shù)的最終結(jié)果。實(shí)驗(yàn)結(jié)果表明,上述改進(jìn)算法能夠有效降低LP譜包絡(luò)估計(jì)誤差并避免合成語(yǔ)音出現(xiàn)局部異常尖峰,語(yǔ)音聽(tīng)覺(jué)質(zhì)量提高。
低碼率MBE聲碼器通常采用重新生成方式得到濁音諧波相位信息,現(xiàn)有的相位生成算法容易引起語(yǔ)音波形失衡,相應(yīng)語(yǔ)音信號(hào)的峰均比偏高,從而導(dǎo)致信號(hào)飽和失真概率增加或系統(tǒng)待機(jī)時(shí)間縮短,因此提出
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于靜音檢測(cè)技術(shù)的多帶激勵(lì)語(yǔ)音聲碼器的研究.pdf
- 混合激勵(lì)線性預(yù)測(cè)聲碼器算法的研究.pdf
- 基于多帶激勵(lì)模型的語(yǔ)音編碼算法研究.pdf
- 一種簡(jiǎn)化的HELP聲碼器算法研究.pdf
- 一種簡(jiǎn)化的MELP聲碼器算法研究.pdf
- 基于dsp芯片的melp聲碼器的算法實(shí)現(xiàn)
- g.729a聲碼器算法研究和dsps實(shí)現(xiàn)
- 基于dsp芯片的melp聲碼器的算法實(shí)現(xiàn)-(1120)
- 基于TMS320C54的混合激勵(lì)線性預(yù)測(cè)聲碼器.pdf
- 基于數(shù)字對(duì)講機(jī)的MELP聲碼器算法研究與實(shí)現(xiàn).pdf
- 基于FPGA的多帶激勵(lì)語(yǔ)音編碼器的研究與設(shè)計(jì).pdf
- 基于可重構(gòu)技術(shù)的聲碼器研究.pdf
- 低碼率聲碼器實(shí)時(shí)實(shí)現(xiàn)的研究.pdf
- 多帶激勵(lì)語(yǔ)音編碼器及其在寬帶語(yǔ)音上應(yīng)用的研究.pdf
- 自適應(yīng)預(yù)測(cè)聲碼器的實(shí)現(xiàn)
- 自適應(yīng)預(yù)測(cè)聲碼器的實(shí)現(xiàn)
- 基于FPGA的MELP聲碼器的研究與實(shí)現(xiàn).pdf
- 多模多帶振蕩器研究.pdf
- 帶通信開(kāi)銷的多DAG調(diào)度算法研究.pdf
- 帶QoS約束的多播路由算法研究.pdf
評(píng)論
0/150
提交評(píng)論