基于HMM算法的仿人機(jī)器人語音識別技術(shù)的研究.pdf_第1頁
已閱讀1頁,還剩65頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、目前隨著科學(xué)技術(shù)的發(fā)展,人們對人機(jī)交互的方式提出了更高的要求。用什么來代替笨拙的鍵盤或按鍵,是人們一直在致力解決的問題,而語言則是人類最方便、快捷有效的交流工具,因此語音識別技術(shù)應(yīng)運(yùn)而生并且取得了飛速的發(fā)展。語音識別技術(shù)就是讓機(jī)器通過語音采集、特征提取、建模等一系列的過程后,將音頻信號變?yōu)槿祟惪吹降奈谋疚淖值囊环N技術(shù)。目前語音識別技術(shù)經(jīng)由幾十年的研究業(yè)已獲得了很大的成果,一些語音產(chǎn)品已經(jīng)投入市場使用,其中語音機(jī)器人產(chǎn)品也得到應(yīng)用。

2、>  本文致力于仿人機(jī)器人語音識別技術(shù)的研究,并采用隱馬爾可夫模型算法成功實(shí)現(xiàn)了仿人機(jī)器人的語音口令控制系統(tǒng)。不同于 PC機(jī)上的系統(tǒng),仿人機(jī)器人語音識別有其自身的局限性,其中噪音是本文主要的影響因素,另外當(dāng)前的HMM算法存在局部最優(yōu)問題,因而如何降噪和對HMM算法的改進(jìn)是本文要解決的主要問題。
  首先,本文對語音識別的原理和實(shí)現(xiàn)流程做了深入研究,在特征提取中選用了具有良好的辨別力和抗干擾性的梅爾倒譜系數(shù),對于非特定人識別采用HM

3、M模型,對HMM模型的三個經(jīng)典問題的Back-forword、Viterbi和Baum-welch算法進(jìn)行深入剖析后,針對Baum-welch的局部最優(yōu)和收斂速度慢等缺點(diǎn),進(jìn)一步采用了K均值算法進(jìn)行改進(jìn)。然后,對實(shí)驗室環(huán)境下的噪音和機(jī)器人本身自帶的機(jī)器噪音利用改進(jìn)的頻譜減法進(jìn)行了抗干擾設(shè)計,提高了識別率。最后對仿人智能機(jī)器人的系統(tǒng)控制方案和硬件平臺設(shè)計搭建進(jìn)行了介紹,并做算法移植。對實(shí)驗結(jié)果在不同實(shí)驗條件下、不同說話風(fēng)格、異性之間音頻的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論