

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、作為一種基于生物特征信息的身份識別方法,說話人識別通過語音來識別說話人的身份,說話人識別在電子商務(wù)、消費、銀行等遠程客戶服務(wù)的身份認證、軍事安全領(lǐng)域的說話人身份自動檢測和認證中具有極大的應用價值和廣泛的應用前景,是當今語音信號處理和生物特征信息檢測和識別領(lǐng)域的重要研究方向。 由于說話人個性以及實際應用環(huán)境的復雜性,說話人識別技術(shù)雖然取得了一定的進步,其瓶頸效應也逐步顯現(xiàn),進一步提高比較困難,離真正的實際應用還有一段距離。
2、 本文從端點檢測、語音增強、特征提取、后端處理等角度對說話人識別進行了研究,取得了一些研究成果。 本文首先回顧了說話人識別的研究發(fā)展歷程,指出了目前說話人識別研究的熱點和難點。 語音信號具有混沌的特征,分形維理論是描述混沌信號的一種手段,本文從分形維的定義出發(fā),提出了一種新的基于波形的算法(Improvement Fractal Dimension algorithm Based on Wave:IBW-FD)。該算法只
3、需計算波形長度,與盒維、Katz維相比,計算更加簡單。通過分形布朗曲線驗證了該算法比盒維和Katz維具有更高的精確度,在高斯白噪聲和三種非平穩(wěn)噪聲下該算法與盒維、Katz維相比抗干擾能力更強。 端點檢測是說話人識別系統(tǒng)的第一步,一直是語音信號處理研究的熱點。本文根據(jù)語音和噪聲的特點,將前面提出的IBW分形維引入端點檢測,將之與能量的方法相結(jié)合,提出了一種基于能量和分維的聯(lián)合端點檢測方法(VAD way ofunite energ
4、y and fractal dimension:UEFD)。 尋找新的有效的說話人識別特征參數(shù)和已有特征參數(shù)的有效組合是說話人識別參數(shù)提取研究的熱點。本文將前面提出的IBW分形維與MFCC特征參數(shù)有機結(jié)合,作為說話人識別系統(tǒng)的混合特征參數(shù)。通過實驗發(fā)現(xiàn),新的混合特征具有一定優(yōu)勢。 基于離散余弦變換的語音增強方法是目前國內(nèi)外語音增強領(lǐng)域內(nèi)研究的熱點,而對于離散分數(shù)余弦變換的研究國際上還比較少,而國內(nèi)外對于離散分數(shù)余弦變換的
5、應用研究就更少,本文基于態(tài)函數(shù),提出了兩種基于態(tài)函數(shù)的離散分數(shù)余弦變換方法——二周期離散分數(shù)余弦變換和三周期離散分數(shù)余弦變換;并把它們應用于語音增強中,結(jié)合了語音增強的特點,提出了四種基于離散分數(shù)余弦變換的語音增強方法一基于二周期離散分數(shù)余弦變換的語音增強算法(speech enhancement based on two cycles Discrete Fractionalcosine TYansform:FDCT2)、改進的基于二周
6、期離散分數(shù)余弦變換的語音增強算法(speech enhancement based on modified two cycles Discrete Fractional cosine Transform:MFDCT2)、基于三周期離散分數(shù)余弦變換的語音增強算法(speech enhancement based on three cycles Discrete Fractional cosine Transform:FDCT3)和改進的基
7、于三周期離散分數(shù)余弦變換的語音增強算法(speech enhancement based on modified three cycles Discrete Fractional cosine Transform:MFDCT3)等四種算法,結(jié)果表明本文提出的幾種算法要優(yōu)于常規(guī)的DCT算法。 在噪聲環(huán)境下語音增強的研究中多級濾波方法具有明顯的優(yōu)勢,其中歐洲電信標準化協(xié)會提出的兩級MEL域維納濾波結(jié)構(gòu)具有較優(yōu)良的降噪效果。但缺點是結(jié)
8、構(gòu)復雜,反復的時域一頻域轉(zhuǎn)換帶來計算量的急劇上升;研究發(fā)現(xiàn),單純地從時域或變換域很難消除語音中存在的噪聲和干擾,而分數(shù)余弦變換是一種非常優(yōu)良的分析工具,本文將前面提出的基于態(tài)函數(shù)的分數(shù)余弦變換應用于語音增強中,提出了分數(shù)余弦變換域上的兩級最優(yōu)濾波和分數(shù)余弦變換域上的分頻段并聯(lián)濾波兩種語音增強方法,該方法直接在分數(shù)余弦變換域上進行濾波,避免了由于Mel域參數(shù)較少導致的頻域不連續(xù)性帶來的時域截斷噪聲。不僅系統(tǒng)結(jié)構(gòu)得到了簡化,而且性能得到了提
9、高。實驗證明,這兩種方法在高斯白噪聲和幾種非平穩(wěn)噪聲下性能優(yōu)于兩級MEL域維納濾波器。在基于GMM的與文本無關(guān)的說話人識別中,噪聲和干擾一直是影響識別率提高的原因,大多數(shù)研究集中在前端處理,但在說話人識別后端處理方面,國內(nèi)外研究不多。本文從各模型幀似然概率的統(tǒng)計特性出發(fā),并提出了一種新的非線性變換方法一歸一化補償變換,該方法對幀似然概率進行變換得到幀得分,將前幾幀得分進行平均,作為當前幀得分的權(quán)值。理論分析表明,與最大似然變換相比,歸一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 混響和噪聲環(huán)境下說話人識別的研究.pdf
- 噪聲環(huán)境下說話人識別算法研究.pdf
- 噪聲環(huán)境下的說話人識別技術(shù).pdf
- 噪聲環(huán)境下說話人識別技術(shù)研究.pdf
- 噪聲環(huán)境下說話人識別方法研究.pdf
- 噪聲背景下說話人識別的若干關(guān)鍵問題研究.pdf
- 在噪聲環(huán)境下說話人識別方法的研究.pdf
- 噪聲環(huán)境下基于個性特征的說話人識別研究.pdf
- 基于前端處理噪聲環(huán)境下穩(wěn)健的說話人識別研究.pdf
- 說話人識別及其在噪聲環(huán)境下的魯棒性研究.pdf
- 噪聲環(huán)境下的基于GMM-SVM說話人識別算法.pdf
- 耳語音說話人識別的研究.pdf
- 噪聲環(huán)境中說話人識別魯棒性研究.pdf
- 說話人識別的前端處理研究.pdf
- 噪聲環(huán)境下基于稀疏表示的說話人識別系統(tǒng)的研究.pdf
- 說話人識別的自適應算法研究.pdf
- 低信噪比環(huán)境下說話人識別研究.pdf
- 高速率網(wǎng)絡(luò)環(huán)境下基于說話人識別的VoIP語音審計系統(tǒng).pdf
- 說話人識別的研究與DSP實現(xiàn).pdf
- 噪聲環(huán)境下說話人特征參數(shù)提取研究.pdf
評論
0/150
提交評論