基于因子分析和支持向量機的耳語說話人識別.pdf_第1頁
已閱讀1頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、耳語音說話人識別在公共場合下的通訊,安全場所的身份鑒定以及罪犯識別,電話網(wǎng)絡查詢與電話銀行等領域都有著廣泛的實用價值。耳語音的說話人識別技術在日常生活中越來越被重視。
   由于耳語發(fā)音方式的特殊性,耳語音說話人識別受說話人的健康狀況、心理變化、發(fā)音狀態(tài)和信道環(huán)境等因素的影響尤為突出。用正常音建立的說話人識別系統(tǒng)應用到耳語音,識別性能將大為下降。
   聯(lián)合因子分析(JFA)在不匹配信道環(huán)境下耳語說話人識別已經(jīng)取得了很好

2、的效果,它能夠從模型方面分離出說話人和信道信息,從而進行信道補償。本文只采取了聯(lián)合因子分析方法中的一部分,只估計說話人空間,并從中提取出所包含的說話人因子,將說話人因子與支持向量機(SVM)結(jié)合起來構(gòu)建一個基于因子分析-支持向量機(FA-SVM)的耳語說話人識別系統(tǒng)。
   本文在該識別系統(tǒng)的基礎上增加了類內(nèi)協(xié)方差規(guī)整(WCCN),線性判別分析(LDA)和冗余屬性投影(NAP)三種信道補償技術,并將經(jīng)過信道補償之后的說話人因子輸

3、入到支持向量機系統(tǒng)中進行識別。實驗證明采用信道補償之后的系統(tǒng)獲得了比基線系統(tǒng)更好的識別結(jié)果。
   因為估計出的說話人因子仍然會包含信道信息的特點,本文對上述三種方法進行了相應的改進。針對類內(nèi)協(xié)方差規(guī)整,本文采用平滑的類內(nèi)規(guī)整矩陣取代原來的矩陣以改進識別效果。針對冗余屬性投影,本文分析了冗余屬性投影和基線系統(tǒng)之間的關聯(lián),提出了一種介于兩者之間的差異補償-冗余屬性投影(VC-NAP)系統(tǒng),該系統(tǒng)實現(xiàn)了一種可調(diào)的信道補償,避免了因完

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論