資源受限情況下基于ASR的關(guān)鍵詞檢索研究.pdf

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-03-08 格式：pdf 頁數(shù)：62 大小：2.97MB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

已閱讀1頁，還剩61頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、基于自動(dòng)語音識(shí)別(Automatic Speech Recognition，ASR)的檢索技術(shù)是關(guān)鍵詞檢索(Spoken Term Detection，STD)的主流技術(shù)，資源受限情況下(Limited-resource Conditions)的關(guān)鍵詞檢索是當(dāng)前STD重要的研究方向。本論文針對該領(lǐng)域的一些關(guān)鍵技術(shù)問題進(jìn)行研究，主要集中在三個(gè)方面:首先在聲學(xué)模型訓(xùn)練方法上進(jìn)行研究，采用多種途徑提高資源受限情況下的語音識(shí)別性能;其次，在不引

2、入過多虛警的情況下，減少資源受限情況下關(guān)鍵詞檢索的漏警;最后，提升候選結(jié)果的置信度，改善檢索性能。
　　基于ASR的關(guān)鍵詞檢索非常依賴于語音識(shí)別的性能，而資源受限情況下的ASR的性能非常差，這極大地影響了STD的性能。針對這一問題，本文在聲學(xué)模型訓(xùn)練方法上進(jìn)行研究，采用多種方法提高ASR系統(tǒng)的識(shí)別率。本文中采用主流的深層神經(jīng)網(wǎng)絡(luò)(DNN)來建立聲學(xué)模型，首先利用數(shù)據(jù)驅(qū)動(dòng)的方法自動(dòng)生成模型訓(xùn)練所需要的問題集;其次為了緩解因數(shù)據(jù)不足而

3、造成的過擬合問題，使用跨語種共享隱層的策略來提高DNN的魯棒性;并通過聲道長度擾動(dòng)(VTLP)和數(shù)據(jù)加噪等數(shù)據(jù)擴(kuò)充的方法，增加訓(xùn)練數(shù)據(jù)。最后，采用DNN序列-區(qū)分性訓(xùn)練(SDT)的方法，如基于最大互信息量(MMI)、最小狀態(tài)級(jí)貝葉斯風(fēng)險(xiǎn)(sMBR)等準(zhǔn)則，進(jìn)一步優(yōu)化聲學(xué)模型，提高資源受限情況下ASR系統(tǒng)的性能。
　　在STD評(píng)估中，漏警和虛警是檢索中常見的兩種錯(cuò)誤。而在實(shí)際的檢索任務(wù)中，漏掉一個(gè)關(guān)鍵詞的代價(jià)通常比引入一個(gè)虛警的代價(jià)

4、要大。因此，對于STD系統(tǒng)，在不引入過多虛警的情況下，有效減少漏警至關(guān)重要。本文中，我們對資源受限情況下DNN聲學(xué)模型的類概率分布進(jìn)行研究，提出兩種不同的平滑策略來降低STD的漏警，并采用關(guān)鍵詞相關(guān)門限的判決方法控制虛警，改善檢索性能。
　　由于ASR不可避免地出現(xiàn)錯(cuò)誤，STD需要根據(jù)候選結(jié)果的檢索置信度做進(jìn)一步的判決。通常情況下，單一系統(tǒng)的檢索置信度可靠性較低，這一問題在資源受限的情況下尤為突出。為此，本文采用不同檢索單元融合及

5、多系統(tǒng)融合的策略，提升候選結(jié)果的置信度。在本文中，我們首先研究CN和FST這兩種不同的檢索單元的各自特點(diǎn)并按照不同的檢索詞長度將二者進(jìn)行融合，各取所長，以提高STD的性能。隨后在多系統(tǒng)融合中，我們將DNN-HMM和BN-GMM-HMM兩種不同的識(shí)別系統(tǒng)以及詞、音節(jié)、詞片和音素四種不同的解碼單元進(jìn)行融合，進(jìn)一步改善檢索性能。
　　使用這些改進(jìn)方法，本文在藏語數(shù)據(jù)庫和NIST OpenKWS2014泰米爾語(Tamil)數(shù)據(jù)庫上進(jìn)行了

眾賞文庫> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲(chǔ)空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

資源受限情況下基于ASR的關(guān)鍵詞檢索研究.pdf

文檔簡介

溫馨提示

最新文檔

評(píng)論

資源受限情況下基于ASR的關(guān)鍵詞檢索研究.pdf

文檔簡介

溫馨提示

最新文檔

評(píng)論

免費(fèi)下載