

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、說(shuō)話人識(shí)別技術(shù),也稱(chēng)為聲紋識(shí)別技術(shù),是根據(jù)說(shuō)話人之間的不同發(fā)音和行為特征來(lái)鑒別說(shuō)話人身份的一種生物識(shí)別方案,它具有采集簡(jiǎn)單、使用方便的優(yōu)點(diǎn)。隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)和智能移動(dòng)終端的飛速發(fā)展,移動(dòng)手持終端設(shè)備已經(jīng)滲透到現(xiàn)實(shí)生活的方方面面,極大的方便了人們的生活、工作和學(xué)習(xí)。越來(lái)越多的移動(dòng)應(yīng)用納入聲紋識(shí)別、語(yǔ)音識(shí)別技術(shù)并發(fā)布在移動(dòng)平臺(tái)的應(yīng)用商店里,如Android平臺(tái)應(yīng)用商店的聲紋解鎖、科大訊飛的靈犀語(yǔ)音助手等。
本文從語(yǔ)音信號(hào)的產(chǎn)生原
2、理入手,介紹了說(shuō)話人識(shí)別系統(tǒng)的基本結(jié)構(gòu)和說(shuō)話人個(gè)性特征參數(shù)的提取流程,包括了預(yù)加重、加窗分幀和端點(diǎn)檢測(cè),詳細(xì)地歸納了常見(jiàn)的說(shuō)話人個(gè)性特征參數(shù)LPC、LPCC和MFCC的提取方法。研究了基于VQ的說(shuō)話人識(shí)別系統(tǒng)和GMM說(shuō)話人識(shí)別系統(tǒng)并在Matlab上進(jìn)行實(shí)驗(yàn)仿真,最后在移動(dòng)智能手機(jī)市場(chǎng)占有率最高的Android系統(tǒng)上實(shí)現(xiàn)了基于VQ的說(shuō)話人識(shí)別系統(tǒng)。本文的主要研究?jī)?nèi)容如下:
?。?)針對(duì)傳統(tǒng)短時(shí)能量和平均過(guò)零率在低信躁比環(huán)境下魯棒性
3、較差,本文提出了一種結(jié)合短時(shí)能量和分形維數(shù)的端點(diǎn)檢測(cè)方法。
?。?)深入研究了基于VQ的說(shuō)話人識(shí)別系統(tǒng),詳細(xì)闡述了VQ基本原理和LBG算法。以CoolEdit錄制的小型語(yǔ)音庫(kù),在Matlab搭建了基于VQ的說(shuō)話人識(shí)別系統(tǒng),并通過(guò)該系統(tǒng)論證不同的碼本尺寸、訓(xùn)練或識(shí)別語(yǔ)音樣本的時(shí)長(zhǎng)和特征參數(shù)的維數(shù)對(duì)系統(tǒng)識(shí)別性能的影響。
?。?)以高斯混合模型作為說(shuō)話人模型,使用K均值聚類(lèi)算法初始化GMM參數(shù)。以TIMIT語(yǔ)音庫(kù),在Matla
4、b上搭建了基于GMM的說(shuō)話人識(shí)別系統(tǒng)并通過(guò)與用戶(hù)友好交互的界面,論證了不同的GMM階數(shù)、訓(xùn)練或識(shí)別語(yǔ)音樣本的時(shí)長(zhǎng)、特征參數(shù)、協(xié)方差閾值和語(yǔ)音幀長(zhǎng)對(duì)系統(tǒng)識(shí)別性能的影響。
?。?)在Android平臺(tái)上實(shí)現(xiàn)了基于VQ的說(shuō)話人識(shí)別系統(tǒng),然后簡(jiǎn)要介紹了該系統(tǒng)結(jié)構(gòu)和各模塊的實(shí)現(xiàn)方法,通過(guò)實(shí)驗(yàn)驗(yàn)證在低信躁環(huán)境下本文提出的結(jié)合短時(shí)能量和分形維數(shù)的端點(diǎn)檢測(cè)方法優(yōu)于傳統(tǒng)基于短時(shí)能量和平均過(guò)零率的端點(diǎn)檢測(cè)方法。
本文最后對(duì)未來(lái)的研究工作進(jìn)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于GMM的說(shuō)話人識(shí)別算法研究及其在安卓平臺(tái)的實(shí)現(xiàn).pdf
- 光照波動(dòng)環(huán)境下人臉識(shí)別算法研究及其安卓平臺(tái)實(shí)現(xiàn).pdf
- 說(shuō)話人識(shí)別算法研究及其實(shí)現(xiàn).pdf
- 說(shuō)話人識(shí)別算法研究與說(shuō)話人辨認(rèn)系統(tǒng)實(shí)現(xiàn).pdf
- 基于SONAR平臺(tái)的說(shuō)話人識(shí)別算法改進(jìn)研究.pdf
- 孤立詞說(shuō)話人識(shí)別算法研究及實(shí)現(xiàn).pdf
- 說(shuō)話人識(shí)別技術(shù)研究及其在醫(yī)院導(dǎo)醫(yī)平臺(tái)中的應(yīng)用.pdf
- 說(shuō)話人識(shí)別系統(tǒng)研究及其DSP實(shí)現(xiàn).pdf
- 基于神經(jīng)網(wǎng)絡(luò)的孤立詞識(shí)別系統(tǒng)在安卓平臺(tái)上的實(shí)現(xiàn).pdf
- 基于MFCC說(shuō)話人識(shí)別算法研究.pdf
- 說(shuō)話人識(shí)別中語(yǔ)音增強(qiáng)算法的研究和系統(tǒng)實(shí)現(xiàn).pdf
- 說(shuō)話人識(shí)別研究及DSP實(shí)現(xiàn).pdf
- AES算法在多核的安卓平臺(tái)下的改進(jìn)及應(yīng)用.pdf
- 說(shuō)話人識(shí)別算法研究及SOPC設(shè)計(jì).pdf
- 噪聲環(huán)境下說(shuō)話人識(shí)別算法研究.pdf
- 說(shuō)話人識(shí)別的自適應(yīng)算法研究.pdf
- 噪音環(huán)境下的說(shuō)話人識(shí)別算法研究.pdf
- 基于GMM的說(shuō)話人識(shí)別算法的研究.pdf
- 基于DSP的說(shuō)話人識(shí)別算法的研究.pdf
- 面向手持應(yīng)用的說(shuō)話人識(shí)別算法研究.pdf
評(píng)論
0/150
提交評(píng)論