

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、作為人們最方便、最自然的信息傳遞方式,語音在人類社會中無處不在。尤其是在信息和多媒體技術迅猛發(fā)展的今天,語音通信網(wǎng)絡和計算機互聯(lián)網(wǎng)上的語音數(shù)據(jù)正以前所未有的速度增長。對這些語音數(shù)據(jù)進行分析和處理,并獲取人們感興趣的有用信息,具有重要的理論意義和實用價值。作為語音信息檢索的核心技術,語音關鍵詞檢測(Spoken Term Detection,STD)以搜索并定位語音文檔中的特定詞為目的,在語音分析、信息檢索、數(shù)據(jù)挖掘、信息安全等領域有著廣
2、泛的應用。
近年來,語音關鍵詞檢測已經(jīng)成為語音處理領域的研究熱點,吸引了大量學者展開廣泛而深入的研究。雖然取得了一定的進展,但目前的檢測結(jié)果中仍不可避免地存在著大量錯誤,這降低了關鍵詞檢測系統(tǒng)的性能。從描述檢測結(jié)果的可信程度來看,錯誤的原因在于系統(tǒng)對真實的關鍵詞結(jié)果賦予了較低的置信測度(Confidence Measure),而對虛假的關鍵詞結(jié)果賦予了較高的置信測度。因此,有效的置信測度方法對語音關鍵詞檢測至關重要。然而,目前
3、的方法不僅訓練準則與評價準則不一致,而且缺乏對高級語言學信息的有效利用;此外,面向詞表外詞的檢測仍存在召回率低的問題,尚無刻畫詞表外詞置信測度的有效方法。本文針對以上問題,從詞表內(nèi)詞與詞表外詞兩個方面展開研究,其主要研究內(nèi)容及創(chuàng)新工作如下:
(1)針對目前置信測度訓練準則與評價準則不一致的問題,提出了基于接受者操作特性(Receiver Operating Characteristics,ROC)曲線下面積(Area Unde
4、r ROC Curve,AUC)最大化準則的置信測度。該方法利用輸入語音的聲學特征,以最大化AUC作為優(yōu)化目標,實現(xiàn)了一種子詞加權(quán)置信測度。同時,根據(jù)漢語特點,提出了音節(jié)置信測度向量的表示方法,進而實現(xiàn)了基于AUC最大化的音節(jié)加權(quán)置信測度。與現(xiàn)有基于最小分類錯誤準則的方法相比,所提出的方法使訓練準則與評價準則相一致,同時更有利于參數(shù)的訓練,從而獲得更好的檢測性能。
?。?)針對現(xiàn)有方法缺乏對高級語言學信息有效利用的問題,提出了一
5、種基于上下文背景一致度的置信測度。它利用關鍵詞候選間的關系,將背景詞的不確定性與語音文檔主題的影響考慮到上下文背景一致度的計算當中,并將上下文背景一致度作為置信測度。為此,利用詞出現(xiàn)概率估計背景詞的不確定性,通過合并Lattice中交疊候選來計算詞出現(xiàn)概率。為了考慮主題的影響,提出了基于主題的上下文背景一致度自適應方法。該方法通過直接對主題分類并使用特定主題的語義相似度的思想實現(xiàn)自適應。由于加入了背景詞不確定性和主題信息等先驗知識,使上
6、下文背景一致度的計算變得更為準確。實驗表明,考慮背景詞的不確定性和基于主題的自適應能使檢測性能有明顯提高。
?。?)針對詞表外詞檢測召回率低的問題,提出了一種基于關鍵詞擴展的詞表外詞檢測方法及相關置信測度計算方法。該方法將與原始關鍵詞發(fā)音相似或易混的音節(jié)序列也作為關鍵詞進行搜索。在根據(jù)所擴展的關鍵詞定位可能的候選之后,利用候選的后驗概率以及所擴展的關鍵詞與原始關鍵詞之間的不匹配程度來計算其置信測度。擴展的關鍵詞與原始關鍵詞間的混
7、淆度由聲學模型間K-L散度來度量。為了對K-L散度值進行準確估計,提出了基于上下界的K-L散度估計方法。這一策略能夠有效處理漢語模糊匹配中的音節(jié)插入、刪除等情況,解決了不同長度音節(jié)串間不匹配度量的問題。同時,為了加快搜索關鍵詞的速度,提出了一種基于n元文法的樹狀索引。實驗表明,所提出的基于關鍵詞擴展的詞表外詞檢測方法能夠有效提高召回率,所提出的置信測度也能夠提高詞表外詞檢測性能。
(4)針對詞表外詞檢測缺乏有效置信測度的問題,
8、提出了基于候選片段間相關度的詞表外詞置信測度。通過使用狀態(tài)對齊的方法對候選片段的邊界進行準確定位,并利用基于幀似然比的方法計算初始的置信測度。在此基礎上,提出了兩種基于相關性的置信測度重估方法,即基于反饋機制的置信測度和基于隨機游走模型的置信測度。前者根據(jù)偽相關集合和偽無關集合對每一個候選的置信測度進行重新計算。后者利用任意兩個候選間的相關度和隨機游走模型完成置信測度重新計算。實驗表明,所提出的詞表外詞置信測度能夠有效提升詞表外詞的檢測
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 語音關鍵詞檢出技術及置信度問題研究.pdf
- 基于深度學習的漢語語音關鍵詞檢測方法研究.pdf
- 基于HMM的漢語語音關鍵詞檢測研究與實現(xiàn).pdf
- 面向新聞語料的漢語語音關鍵詞檢測技術研究.pdf
- 漢語語音識別的關鍵詞和集外詞檢測的研究與應用.pdf
- 蒙古語語音關鍵詞檢測技術的研究.pdf
- 語音識別中置信度技術的研究.pdf
- 基于語音關鍵詞檢測的人機交互研究.pdf
- 語音識別中置信度理論研究.pdf
- 語音關鍵詞識別技術的研究.pdf
- 廣播語音敏感關鍵詞識別.pdf
- 面向漢語語音關鍵詞檢出的時間集成神經(jīng)網(wǎng)絡研究.pdf
- 面向語音檢索的漢語關鍵詞識別技術研究及應用.pdf
- 中文語音關鍵詞檢出技術研究.pdf
- 語音關鍵詞識別技術的研究及應用.pdf
- 中等詞匯量的漢語連續(xù)語音關鍵詞識別系統(tǒng).pdf
- 連續(xù)語音中關鍵詞快速檢出的研究.pdf
- 關鍵詞識別中語音確認技術的研究.pdf
- 基于HMM語音關鍵詞識別技術研究.pdf
- 基于模糊理論的語音關鍵詞識別.pdf
評論
0/150
提交評論