面向嵌入式計算的語音識別技術(shù)的實驗研究.pdf_第1頁
已閱讀1頁,還剩77頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、語音識別技術(shù)經(jīng)過幾十年的探索和研究,已經(jīng)取得了一系列突破性的進(jìn)展,一些成熟技術(shù)正逐漸應(yīng)用于實際生活中。近年來,作為一種方便的人機交互手段,語音識別在消費類電子產(chǎn)品和工業(yè)控制等領(lǐng)域迅速發(fā)展,有著廣泛的應(yīng)用前景。嵌入式平臺上的基于隱馬爾可夫模型的非特定人、小詞匯量、孤立詞語音識別技術(shù)正在成為目前研究的熱點之一。本文系統(tǒng)地研究了組成小詞匯量語音識別系統(tǒng)的各種關(guān)鍵技術(shù),在Matlab實驗平臺下完成語音訓(xùn)練和識別算法的設(shè)計,取得相關(guān)實驗數(shù)據(jù),為軟

2、硬件協(xié)同實現(xiàn)語音識別提供依據(jù),并在此基礎(chǔ)上探討了其在FPGA上的實現(xiàn)問題。 語音識別的理論模型對系統(tǒng)的構(gòu)建具有指導(dǎo)意義,本文首先分析了語音信號的聲學(xué)模型和漢語音節(jié)特點,合理地選擇了音節(jié)作為語音識別的基本單元。然后詳細(xì)地論述了語音識別的流程和基于Matlab的軟件實驗平臺,并應(yīng)用隱馬爾可夫模型實現(xiàn)孤立詞語音識別。 隱馬爾可夫模型對時間序列具有很強的建模能力,通過對時間序列特征參數(shù)的訓(xùn)練,為每個語音建立一個隱馬爾可夫模型。待

3、識別語音通過與各個隱馬爾可夫模型匹配,即得到識別結(jié)果。它是一個魯棒性模型,可以確保識別的高『E確率,因此,廣泛應(yīng)用于語音識別領(lǐng)域。論文在Matlab實驗平臺上編寫和仿真了預(yù)處理、端點檢測、特征參數(shù)提取、矢量量化、隱馬爾可夫模型訓(xùn)練和識別幾個子功能模塊,實現(xiàn)了語音識別的整體過程。并用漢語數(shù)字識別驗證了方案的可行。同時,在對經(jīng)典方法深入研究的前提下,本文還探討將動態(tài)窗長、模糊理論等引入語音識別過程,通過對小詞匯量孤立詞的語音識別實驗,取得了

4、一定的效果。 文章最后采用Matlab、VC++、FPGA,建立了一個軟硬件協(xié)同語音識別的實驗研究平臺,探討了語音識別算法在FPGA上的應(yīng)用,重點考慮了基于幀的流程決策、MFCC定點計算和Viterbi算法等幾個問題。結(jié)合FPGA結(jié)構(gòu)特點,直接使用加法器、乘法器、比較器等建立一個Viterbi算法結(jié)構(gòu),采用改進(jìn)的方法計算Viterbi得分和預(yù)計算邏輯實現(xiàn)了一種簡單的基于隱馬爾可夫模型的語音模板匹配。實驗證明了該方案的切實可行。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論