資源受限情況下基于ASR的關(guān)鍵詞檢索研究.pdf_第1頁
已閱讀1頁,還剩61頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、基于自動(dòng)語音識(shí)別(Automatic Speech Recognition,ASR)的檢索技術(shù)是關(guān)鍵詞檢索(Spoken Term Detection,STD)的主流技術(shù),資源受限情況下(Limited-resource Conditions)的關(guān)鍵詞檢索是當(dāng)前STD重要的研究方向。本論文針對該領(lǐng)域的一些關(guān)鍵技術(shù)問題進(jìn)行研究,主要集中在三個(gè)方面:首先在聲學(xué)模型訓(xùn)練方法上進(jìn)行研究,采用多種途徑提高資源受限情況下的語音識(shí)別性能;其次,在不引

2、入過多虛警的情況下,減少資源受限情況下關(guān)鍵詞檢索的漏警;最后,提升候選結(jié)果的置信度,改善檢索性能。
  基于ASR的關(guān)鍵詞檢索非常依賴于語音識(shí)別的性能,而資源受限情況下的ASR的性能非常差,這極大地影響了STD的性能。針對這一問題,本文在聲學(xué)模型訓(xùn)練方法上進(jìn)行研究,采用多種方法提高ASR系統(tǒng)的識(shí)別率。本文中采用主流的深層神經(jīng)網(wǎng)絡(luò)(DNN)來建立聲學(xué)模型,首先利用數(shù)據(jù)驅(qū)動(dòng)的方法自動(dòng)生成模型訓(xùn)練所需要的問題集;其次為了緩解因數(shù)據(jù)不足而

3、造成的過擬合問題,使用跨語種共享隱層的策略來提高DNN的魯棒性;并通過聲道長度擾動(dòng)(VTLP)和數(shù)據(jù)加噪等數(shù)據(jù)擴(kuò)充的方法,增加訓(xùn)練數(shù)據(jù)。最后,采用DNN序列-區(qū)分性訓(xùn)練(SDT)的方法,如基于最大互信息量(MMI)、最小狀態(tài)級(jí)貝葉斯風(fēng)險(xiǎn)(sMBR)等準(zhǔn)則,進(jìn)一步優(yōu)化聲學(xué)模型,提高資源受限情況下ASR系統(tǒng)的性能。
  在STD評(píng)估中,漏警和虛警是檢索中常見的兩種錯(cuò)誤。而在實(shí)際的檢索任務(wù)中,漏掉一個(gè)關(guān)鍵詞的代價(jià)通常比引入一個(gè)虛警的代價(jià)

4、要大。因此,對于STD系統(tǒng),在不引入過多虛警的情況下,有效減少漏警至關(guān)重要。本文中,我們對資源受限情況下DNN聲學(xué)模型的類概率分布進(jìn)行研究,提出兩種不同的平滑策略來降低STD的漏警,并采用關(guān)鍵詞相關(guān)門限的判決方法控制虛警,改善檢索性能。
  由于ASR不可避免地出現(xiàn)錯(cuò)誤,STD需要根據(jù)候選結(jié)果的檢索置信度做進(jìn)一步的判決。通常情況下,單一系統(tǒng)的檢索置信度可靠性較低,這一問題在資源受限的情況下尤為突出。為此,本文采用不同檢索單元融合及

5、多系統(tǒng)融合的策略,提升候選結(jié)果的置信度。在本文中,我們首先研究CN和FST這兩種不同的檢索單元的各自特點(diǎn)并按照不同的檢索詞長度將二者進(jìn)行融合,各取所長,以提高STD的性能。隨后在多系統(tǒng)融合中,我們將DNN-HMM和BN-GMM-HMM兩種不同的識(shí)別系統(tǒng)以及詞、音節(jié)、詞片和音素四種不同的解碼單元進(jìn)行融合,進(jìn)一步改善檢索性能。
  使用這些改進(jìn)方法,本文在藏語數(shù)據(jù)庫和NIST OpenKWS2014泰米爾語(Tamil)數(shù)據(jù)庫上進(jìn)行了

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論