版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著噪聲的增加,機(jī)器語(yǔ)音識(shí)別性能急劇惡化,而人類(lèi)聽(tīng)覺(jué)系統(tǒng)的識(shí)別效果卻是相對(duì)穩(wěn)定的,這就啟發(fā)了我們從仿生的角度來(lái)研究語(yǔ)音識(shí)別,而基于聽(tīng)覺(jué)特性的語(yǔ)音識(shí)別研究也是目前的研究熱點(diǎn)和難點(diǎn)之一。因此,基于人耳聽(tīng)覺(jué)特性的語(yǔ)音識(shí)別人機(jī)交互具有非常重要的理論研究意義和較高的實(shí)際應(yīng)用價(jià)值。
首先,對(duì)基于人耳聽(tīng)覺(jué)特性的語(yǔ)音識(shí)別原理進(jìn)行了深入的理論研究,掌握了人耳語(yǔ)音接收過(guò)程的生理學(xué)和人耳聽(tīng)覺(jué)系統(tǒng)對(duì)語(yǔ)音信號(hào)的信號(hào)處理機(jī)制,總結(jié)了語(yǔ)音感知特性和噪聲
2、特性,并給出了典型的基于人耳聽(tīng)覺(jué)特性的語(yǔ)音識(shí)別系統(tǒng),為以后的研究打下的扎實(shí)的理論基礎(chǔ)。
接著,本文研究了基于語(yǔ)音分離的預(yù)處理。本文對(duì)傳統(tǒng)基于端點(diǎn)檢測(cè)和語(yǔ)音增強(qiáng)的預(yù)處理方法進(jìn)行了研究,發(fā)現(xiàn)其只適用于較為簡(jiǎn)單的噪聲(如:高斯白噪聲)環(huán)境下,且隨著信噪比的下降,語(yǔ)音識(shí)別系統(tǒng)的識(shí)別率直線(xiàn)下滑。因此,我們將基于人耳的聽(tīng)覺(jué)選擇能力即“雞尾酒會(huì)效應(yīng)”的語(yǔ)音分離技術(shù)應(yīng)用到前端,更有利于提高語(yǔ)音識(shí)別系統(tǒng)在多聲源和復(fù)雜噪聲環(huán)境下的識(shí)別性能。<
3、br> 然后,本文研究了基于入耳聽(tīng)覺(jué)特性的語(yǔ)音特征提取。本文闡述了幾種常見(jiàn)的語(yǔ)音特征LPCC、MFCC和ZCPA,并對(duì)其優(yōu)缺點(diǎn)進(jìn)行了比較。同時(shí),本文對(duì)人耳聽(tīng)覺(jué)模型進(jìn)行了研究和對(duì)比,在原有的人耳聽(tīng)覺(jué)濾波器GT和GC濾波器的基礎(chǔ)上,針對(duì)GT和GC濾波器頻率選擇特性不夠尖銳的問(wèn)題,提出了GT-4和GC-4濾波器;同時(shí),針對(duì)Mel刻度不符合聽(tīng)覺(jué)特性中臨界帶寬的問(wèn)題,將改進(jìn)的濾波器按ERB刻度排列。隨后將GT-4,GC-4濾波器與MFCC,
4、ZCPA結(jié)合,獲得了改進(jìn)的MFCC、ZCPA特征提取方法。
最后,本文做了大量的驗(yàn)證實(shí)驗(yàn),結(jié)果表明:在不同的聲壓級(jí)和不同信噪比的多種噪聲環(huán)境下,所提算法性能較之MFCC均有不同程度的提高,隨著聲壓級(jí)從40dB降到-20dB,MFCC的識(shí)別率降低了22.83%,而ERBCC-GC4和ZCPA-GC4分別只降低了2.60%和3.47%;隨著信噪比從30dB降到0dB,MFCC的識(shí)別率降低了18.52%,而ERBCC-GC4和Z
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于人耳聽(tīng)覺(jué)特性的譜能量特征及其在情感語(yǔ)音識(shí)別中的應(yīng)用.pdf
- 視覺(jué)聽(tīng)覺(jué)觸覺(jué)在人機(jī)交互中的應(yīng)用
- 語(yǔ)音識(shí)別(人機(jī)交互小論文)
- 基于視覺(jué)的手勢(shì)識(shí)別及其在人機(jī)交互中的應(yīng)用.pdf
- 語(yǔ)音人機(jī)交互及其在智能調(diào)度中的應(yīng)用.pdf
- 基于視覺(jué)的手勢(shì)識(shí)別技術(shù)在人機(jī)交互系統(tǒng)中的應(yīng)用.pdf
- 基于人耳聽(tīng)覺(jué)特性的語(yǔ)音特征提取研究.pdf
- 基于Kinect的手勢(shì)識(shí)別技術(shù)在人機(jī)交互中的應(yīng)用研究.pdf
- 基于HMM的動(dòng)態(tài)圖像軌跡識(shí)別研究及在人機(jī)交互中的應(yīng)用.pdf
- 實(shí)時(shí)手勢(shì)識(shí)別在人機(jī)交互中的應(yīng)用.pdf
- 人機(jī)交互中的動(dòng)態(tài)手勢(shì)識(shí)別及應(yīng)用研究.pdf
- 基于視覺(jué)的手勢(shì)識(shí)別及人機(jī)交互研究.pdf
- 基于表觀(guān)的手勢(shì)識(shí)別及人機(jī)交互研究.pdf
- 面向人機(jī)交互的手勢(shì)識(shí)別.pdf
- 用于人機(jī)交互的視覺(jué)手勢(shì)識(shí)別.pdf
- 用于人機(jī)交互的手勢(shì)識(shí)別研究.pdf
- 基于視覺(jué)的手勢(shì)檢測(cè)與識(shí)別算法及其在人機(jī)交互中的應(yīng)用.pdf
- 基于視覺(jué)的實(shí)時(shí)手勢(shì)跟蹤與識(shí)別及其在人機(jī)交互中的應(yīng)用.pdf
- 注視方向識(shí)別的研究及其在人機(jī)交互中的應(yīng)用.pdf
- 家用機(jī)器人語(yǔ)音識(shí)別及人機(jī)交互系統(tǒng)的研究.pdf
評(píng)論
0/150
提交評(píng)論