語音識別中的環(huán)境補償研究.pdf_第1頁
已閱讀1頁,還剩117頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、語音識別技術(shù)雖然經(jīng)過多年的積累已經(jīng)得到很大的發(fā)展,但是還存在諸多問題,特別是語音識別系統(tǒng)環(huán)境魯棒性問題已經(jīng)嚴(yán)重制約了語音識別系統(tǒng)的應(yīng)用和發(fā)展。如何使系統(tǒng)不受周圍環(huán)境噪聲的影響,提高系統(tǒng)的魯棒性,已經(jīng)成為亟待解決的關(guān)鍵問題之一。目前的一些魯棒性環(huán)境補償方法具體可分為兩大類:前端處理方法和后端(聲學(xué)模型)處理方法。近年來,基于統(tǒng)計模型的環(huán)境補償方法受到極大的關(guān)注,已經(jīng)成功運用于前端和后端處理中。本文將在搭建的非特定人大詞匯量連續(xù)語音識別系統(tǒng)

2、平臺上,對這種環(huán)境補償方法進行深入的研究。所使用的連續(xù)語音識別系統(tǒng)由以下三個開源工具構(gòu)筑:劍橋大學(xué)開發(fā)的HTK聲學(xué)模型訓(xùn)練工具、卡內(nèi)基梅隆大學(xué)和劍橋大學(xué)聯(lián)合開發(fā)的CMU-CamToolkit統(tǒng)計語言模型工具包、日本京都大學(xué)和日本IPA(Information-technologyPromotionAgency)聯(lián)合開發(fā)的Julius識別器。 本文的具體工作與創(chuàng)新包括以下幾個方面:1、對噪聲干擾的過程進行了深入的研究,建立了時域、

3、頻域、對數(shù)譜域和倒譜域環(huán)境模型。 2、構(gòu)筑了基于batchEM噪聲估計的特征補償算法。針對兩種定義不同的EM輔助函數(shù),從Bayes理論出發(fā),推導(dǎo)了兩種不同的基于MAP的batchEM算法。 3、采用了基于sequentialEM噪聲估計方法的特征補償算法,解決了語音識別系統(tǒng)在非平穩(wěn)環(huán)境下的環(huán)境魯棒性問題。假設(shè)噪聲環(huán)境的先驗信息服從單一高斯分布,sequentialEM噪聲估計方法也可以在MAP框架下展開。 4、提

4、出了一種基于多次解碼技術(shù)的聲學(xué)模型補償方法,解決了語音識別系統(tǒng)聲學(xué)模型魯棒性問題。該方法是建立在解碼結(jié)果上,通過解碼獲取純凈語音模型,利用基于HMM和MAP的batchEM算法估計出噪聲參數(shù)模型。多次解碼和多次噪聲估計可以使純凈模型和噪聲模型更加精確,從而進一步提高合成的含噪聲學(xué)模型的質(zhì)量和解碼輸出結(jié)果。 5、對聲學(xué)模型補償技術(shù)做進一步深入的研究,將本文所采用的特征補償算法運用于基于多次解碼的聲學(xué)模型補償方法的第一次解碼中,提高

5、第一次解碼結(jié)果和噪聲初始值的精度,因此該方法可以進一步提高噪聲估計的準(zhǔn)確性,保證合成的含噪聲學(xué)模型更加符合當(dāng)前的噪聲環(huán)境,從而加快識別結(jié)果的收斂速度和精度。實驗表明該方法極大地降低了計算復(fù)雜度,用盡可能少的解碼次數(shù)獲取更高的識別性能。 6、針對聲學(xué)模型補償技術(shù)存在動態(tài)HMM倒譜參數(shù)補償困難的問題,本文提出了一種混合補償?shù)姆椒?,即對上面改進型的方法作了進一步改進,將本文所提出的特征補償與聲學(xué)模型補償方法進一步有效地結(jié)合起來,并將其

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論