版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、近年來,在生物識別技術(shù)領(lǐng)域中,聲紋識別技術(shù)以其獨特的方便性、經(jīng)濟性和準確性等優(yōu)勢受到世人矚目,并日益成為人們?nèi)粘I詈凸ぷ髦兄匾移占暗陌踩炞C方式。聲紋識別屬于生物識別技術(shù)的一種,是一項根據(jù)語音波形中反映說話人生理和行為特征的語音參數(shù),自動識別說話人身份的技術(shù)。與語音識別不同的是,聲紋識別利用的是語音信號中的說話人信息,而不考慮語音中的字詞意思,它強調(diào)說話人的個性而語音識別的目的是識別出語音信號中的言語內(nèi)容,并不考慮說話人是誰,它強調(diào)
2、共性。聲紋識別系統(tǒng)主要包括兩部分,即特征檢測和模式匹配。特征檢測的任務(wù)是選取唯一表現(xiàn)說話人身份的有效且穩(wěn)定可靠的特征,模式匹配的任務(wù)是對訓練和識別時的特征模式做相似性匹配。1特征提取聲紋識別系統(tǒng)中的特征檢測即提取語音信號中表征人的基本特征,此特征應(yīng)能有效地區(qū)分不同的說話人,且對同一說話人的變化保持相對穩(wěn)定??紤]到特征的可量化性、訓練樣本的數(shù)量和系統(tǒng)性能的評價問題,目前的聲紋識別系統(tǒng)主要依靠較低層次的聲學特征進行識別。說話人特征大體可歸為
3、下述幾類:譜包絡(luò)參數(shù)語音信息通過濾波器組輸出,以合適的速率對濾波器輸出抽樣,并將它們作為聲紋識別特征?;糨喞⒐舱穹孱l率帶寬及其軌跡這類特征是基于發(fā)聲器官如聲門、聲道和鼻腔的生理結(jié)構(gòu)而提取的參數(shù)。線性預(yù)測系數(shù)使用線性預(yù)測系數(shù)是語音信號處理中的一次飛躍,以線性預(yù)測導(dǎo)出的各種參數(shù),如線性預(yù)測系數(shù)、自相關(guān)系數(shù)、反射系數(shù)、對數(shù)面積比、線性預(yù)測殘差及其組合等參數(shù),作為識別特征,可以得到較好的效果。主要原因是線性預(yù)測與聲道參數(shù)模型是相符合的。反映
4、聽覺特性的參數(shù)模擬人耳對聲音頻率感知的特性而提出了多種參數(shù),如美倒譜系數(shù)、感知線性預(yù)測等。此外,人們還通過對不同特征參量的組合來提高實際系統(tǒng)的性能,當各組合參量間相關(guān)性不大時,會有較好的效果,因為它們分別反映了語音信號的不同特征。2模式匹配目前針對各種特征而提出的模式匹配方法的研究越來越深入。這些方法大體可歸為下述幾類:概率統(tǒng)計方法語音中說話人信息在短時內(nèi)較為平穩(wěn),通過對穩(wěn)態(tài)特征如基音、聲門增益、低階反射系數(shù)的統(tǒng)計分析,可以利用均值、方
5、差等統(tǒng)計量和概率密度函數(shù)進行分類判決。其優(yōu)點是不用對特征參量在時域上進行規(guī)整,比較適合文本無關(guān)的說話人識別。動態(tài)時間規(guī)整方法說話人信息不僅有穩(wěn)定因素(發(fā)聲器官的結(jié)構(gòu)和發(fā)聲習慣),而且有時變因素(語速、語調(diào)、重音和韻律)。將識別模板與參考模板進行時間對比,按照某種距離測定得出兩模板間的相似程度。常用的方法是基于最近鄰原則的動態(tài)時間規(guī)整DTW。矢量量化方法矢量量化最早是基于聚類分析的數(shù)據(jù)壓縮編碼技術(shù)。Helms首次將其用于聲紋識別,把每個人
6、的特定文本編成碼本,識別時將測試文本按此碼本進行編碼,以量化產(chǎn)生的失真度作為判決標準。Bell實驗室的Rosenberg和Soong用VQ進行了孤立數(shù)字文本的聲紋識別研究。這種方法的識別精度較高,且判斷速度快。隱馬爾可夫模型方法隱馬爾可夫模型是一種基于轉(zhuǎn)移概率和傳輸概率的隨機模型,最早在CMU和IBM被用于語音識別。它把語音看成由可觀察到的符號序列組成的隨機過程,符號序列則是發(fā)聲系統(tǒng)狀態(tài)序列的輸出。在使用HMM識別時,為每個說話人建立發(fā)
7、聲模型,通過訓練得到狀態(tài)轉(zhuǎn)移概率矩陣和符號輸出概率矩陣。識別時計算未知語音在狀態(tài)轉(zhuǎn)移過程中的最大概率,根據(jù)最大概率對應(yīng)的模型進行判決。HMM不需要時間規(guī)整,可節(jié)約判決時的計算時間和存儲量,在目前被廣泛應(yīng)用。缺點是訓練時計算量較大。人工神經(jīng)網(wǎng)絡(luò)方法人工神經(jīng)網(wǎng)絡(luò)在某種程度上模擬了生物的感知特性,它是一種分布式并行處理結(jié)構(gòu)的網(wǎng)絡(luò)模型,具有自組織和自學習能力、很強的復(fù)雜分類邊界區(qū)分能力以及對不完全信息的魯棒性,其性能近似理想的分類器。其缺點是訓
8、練時間長,動態(tài)時間規(guī)整能力弱,網(wǎng)絡(luò)規(guī)模隨說話人數(shù)目增加時可能大到難以訓練的程度。把以上分類方法與不同特征進行有機組合可顯著提高聲紋識別的性能,如NTT實驗室的T.Matsui和S.Furui使用倒譜、差分倒譜、基音和差分基音,采用VQ與HMM混和的方法得到99.3%的說話人確認率。對于說話人確認系統(tǒng),表征其性能的最重要的兩個參量是錯誤拒絕率和錯誤接受率。前者是拒絕真實的說話人而造成的錯誤,后者是接受假冒者而造成的錯誤,二者與閾值的設(shè)定相
9、關(guān)。說話人確認系統(tǒng)的錯誤率與用戶數(shù)目無關(guān),而說話人辨認系統(tǒng)的性能與用戶數(shù)目有關(guān),并隨著用戶數(shù)目的增加,系統(tǒng)的性能會不斷下降。總的說來,一個成功的說話人識別系統(tǒng)應(yīng)該做到以下幾點:能夠有效地區(qū)分不同的說話人,但又能在同一說話人語音發(fā)生變化時保持相對的穩(wěn)定,如感冒等情況。不易被他人模仿或能夠較好地解決被他人模仿問題。在聲學環(huán)境變化時能夠保持一定的穩(wěn)定性,即抗噪聲性能要好聲紋識別應(yīng)用前景與其他生物識別技術(shù),諸如指紋識別、掌形識別、虹膜識別等相比
10、較,聲紋識別除具有不會遺失和忘記、不需記憶、使用方便等優(yōu)點外,還具有以下特性:用戶接受程度高,由于不涉及隱私問題,用戶無任何心理障礙。利用語音進行身份識別可能是最自然和最經(jīng)濟的方法之一。聲音輸入設(shè)備造價低廉,甚至無費用(電話),而其他生物識別技術(shù)的輸入設(shè)備往往造價昂貴。在基于電信網(wǎng)絡(luò)的身份識別應(yīng)用中,如電話銀行、電話炒股、電子購物等,與其他生物識別技術(shù)相比,聲紋識別更為擅長,得天獨厚。由于與其他生物識別技術(shù)相比,聲紋識別具有更為簡便、準
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 聲紋識別讓聲音辨人
- 聲紋識別技術(shù)研究.pdf
- 聲紋識別系統(tǒng)研究.pdf
- VQ聲紋識別算法的研究.pdf
- 基于聲紋識別的門禁系統(tǒng)設(shè)計.pdf
- 說話人聲紋識別的算法研究.pdf
- 基于GMM的聲紋識別技術(shù)的研究.pdf
- 基于Mel倒譜技術(shù)的聲紋識別.pdf
- 聲紋識別中關(guān)鍵技術(shù)的研究.pdf
- 基于Android的聲紋識別和語音識別的設(shè)計.pdf
- 聲紋識別系統(tǒng)與模式識別算法研究.pdf
- 聲紋識別相關(guān)技術(shù)研究及應(yīng)用.pdf
- 基于雙層決策模型的實時聲紋識別研究.pdf
- 基于聲紋識別的身份認證技術(shù)研究.pdf
- 聲紋識別系統(tǒng)與模式匹配算法研究.pdf
- 嵌入式聲紋識別系統(tǒng)研究.pdf
- 智能住宅門禁系統(tǒng)聲紋識別算法研究.pdf
- 聲紋識別系統(tǒng)關(guān)鍵技術(shù)研究.pdf
- 基于優(yōu)化語音提取的聲紋識別系統(tǒng).pdf
- 聲紋識別在微信中的模式匹配研究.pdf
評論
0/150
提交評論