2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩137頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、本論文以應(yīng)用型語(yǔ)音控制技術(shù)為目標(biāo),以系統(tǒng)魯棒性為研究重點(diǎn),對(duì)噪聲環(huán)境下嵌入式孤立詞語(yǔ)音識(shí)別技術(shù)的各個(gè)主要方面作了深入探討。通過(guò)對(duì)魯棒語(yǔ)音識(shí)別問(wèn)題進(jìn)行系統(tǒng)的研究和實(shí)驗(yàn),本文形成了一套完整的魯棒語(yǔ)音識(shí)別研究體系,包括了實(shí)驗(yàn)平臺(tái)、魯棒端點(diǎn)檢測(cè)算法、魯棒特征提取算法、特征補(bǔ)償算法、聲學(xué)模型等關(guān)鍵部分,涵蓋了魯棒語(yǔ)音識(shí)別的全過(guò)程,獲得了一些有意義的成果。所有研究成果都被完整地實(shí)現(xiàn)并在語(yǔ)音庫(kù)上進(jìn)行了驗(yàn)證,最終建立了一個(gè)完整的孤立詞語(yǔ)音識(shí)別系統(tǒng),包括

2、語(yǔ)音庫(kù)、軟件程序、硬件實(shí)現(xiàn)、應(yīng)用系統(tǒng)等,以此為基礎(chǔ)可直接構(gòu)建出一個(gè)實(shí)用的語(yǔ)音控制系統(tǒng)。上述這些研究成果具體主要包括以下幾個(gè)方面: (1) 語(yǔ)音識(shí)別實(shí)驗(yàn)系統(tǒng)建立了一個(gè)基于隱馬爾科夫模型 (Hidden Markov Model,HMM) 的語(yǔ)音識(shí)別實(shí)驗(yàn)系統(tǒng)。針對(duì)孤立詞吾音識(shí)別的特點(diǎn)優(yōu)化了系統(tǒng)中的 HMM 算法實(shí)現(xiàn)。給出了一套用于抗噪語(yǔ)音識(shí)別實(shí)驗(yàn)的選詞方案,保證了實(shí)驗(yàn)的代表性。建立了完整的孤立詞識(shí)別語(yǔ)音庫(kù)和噪聲庫(kù)以及噪聲度量標(biāo)準(zhǔn),保

3、證了實(shí)驗(yàn)的可重復(fù)性。 (2) 端點(diǎn)檢測(cè)算法針對(duì)傳統(tǒng)雙門(mén)限端點(diǎn)檢測(cè)算法在噪聲環(huán)境下的不足之處,對(duì)算法細(xì)節(jié)作出了多處改進(jìn)。首次將一種非線(xiàn)性動(dòng)力學(xué)參數(shù)——排列熵 (Permutation Entropy,PE)應(yīng)用于噪聲環(huán)境下的端點(diǎn)檢測(cè),提出了基于能頻比和排列熵差分的雙門(mén)限端點(diǎn)檢測(cè)算法。在實(shí)驗(yàn)平臺(tái)下與傳統(tǒng)算法進(jìn)行了對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果顯示,提出的算法與傳統(tǒng)算法相比,噪聲魯棒性更好,檢測(cè)延時(shí)相當(dāng)。 (3) 特征提取算法系統(tǒng)總結(jié)了目

4、前常用的幾種語(yǔ)音識(shí)別特征參數(shù),特別是詳細(xì)分析了線(xiàn)性預(yù)測(cè)編碼 (Linear Prediction Coding,LPC) 特征和 Mel 頻率倒譜系數(shù) (Mel Frequency Cepstral Coefficient,MFCC ) 特征的原理、優(yōu)缺點(diǎn)和實(shí)現(xiàn)細(xì)節(jié)。針對(duì)LPC特征和MFCC 特征的問(wèn)題,將最小方差無(wú)失真響應(yīng) (Minimum Variance Distortionless Response,MVDR) 潛估汁技術(shù)引入到

5、語(yǔ)音特征提取中,使用這種技術(shù)得到的特征參數(shù)在某種程度上結(jié)合了上述兩種主流特征參數(shù)的優(yōu)點(diǎn)。針對(duì)語(yǔ)音信號(hào)的特點(diǎn),給出了幾種MVDR計(jì)算上的改進(jìn)方法。最后通過(guò)實(shí)驗(yàn)對(duì)比了MVDR方法與其它方法的性能。 (4) 魯棒語(yǔ)音識(shí)別技術(shù)全面研究了包括抗環(huán)境噪聲、說(shuō)話(huà)人自適應(yīng)、信道自適應(yīng)等在內(nèi)的系統(tǒng)魯棒性問(wèn)題。提出了一種用于語(yǔ)音識(shí)別的魯棒特征提取算法,這種算法基于MVDR譜估計(jì)技術(shù),它在Mel頻率尺度上估計(jì)MVDR譜,并對(duì)得到的MVDR譜進(jìn)行調(diào)制譜

6、濾波,然后提取其倒譜系數(shù)作為特征參數(shù)。在汽車(chē)噪聲、人群噪聲和高斯白噪聲三種噪聲環(huán)境下,與MVDR特征提取算法和MFCC特征提取算法按多種信噪比做了對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明使用該算法的系統(tǒng)在這三種噪聲環(huán)境下的識(shí)別率均得到了不同程度的提高。 (5) 硬件實(shí)現(xiàn)問(wèn)題針對(duì)孤立詞語(yǔ)音識(shí)別算法的硬件實(shí)現(xiàn)問(wèn)題,比較了通用處理器、數(shù)字信號(hào)處理器(Digital Signal Processor,DSP)、專(zhuān)用集成電路(Application Spe

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論