版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、近年來,隨著智能設(shè)備發(fā)展的如火如荼,也帶動(dòng)了人機(jī)交互這一核心組成部分的進(jìn)步。人機(jī)交互從之前的手勢(shì)、手指操作也逐漸向語音這一人類最為自然、便捷、高效的交流方式上轉(zhuǎn)變。語音作為人機(jī)交互的方式包括兩方面內(nèi)容,第一是讓機(jī)器發(fā)出聲音,這是語音合成的研究范疇,第二是讓機(jī)器理解人說的話,這里面又包括能聽懂人類發(fā)音的語義信息,稱之為語音識(shí)別;或者能讓機(jī)器辨別出是誰在說話,稱為說話人識(shí)別,這也是本文的研究目標(biāo)和重點(diǎn)之一。目前語音合成和語音識(shí)別已經(jīng)較為普遍
2、地應(yīng)用到智能和其他一些設(shè)備上,但是能讓機(jī)器區(qū)分出是誰在說話的說話人識(shí)別技術(shù)雖然在實(shí)驗(yàn)室條件下的研究較為成熟,但是其在日常應(yīng)用中較少出現(xiàn),不過其廣闊的應(yīng)用前景使嵌入式相關(guān)的說話人識(shí)別逐漸成為當(dāng)下的研究熱點(diǎn)。
ARM作為目前最為常用的嵌入式處理器,具有低功耗、低成本、高性能的優(yōu)點(diǎn)。并且其外設(shè)端口豐富,有利于開發(fā)多功能系統(tǒng)。本課題的主要任務(wù)是利用現(xiàn)有的資源,選擇合適的說話人識(shí)別算法,最終實(shí)現(xiàn)具有較好實(shí)時(shí)性與準(zhǔn)確性的說話人識(shí)別系統(tǒng)。<
3、br> 本文提出了基于ARM的說話人識(shí)別系統(tǒng)的研究和設(shè)計(jì),主要工作包括理論知識(shí)研究、確定系統(tǒng)方案、編寫系統(tǒng)軟件和整體設(shè)計(jì)實(shí)現(xiàn)四個(gè)部分。本文首先對(duì)相關(guān)數(shù)字信號(hào)處理方面的知識(shí)做了介紹,接著對(duì)準(zhǔn)確率和實(shí)時(shí)性的問題進(jìn)行了考量,在理論算法部分選擇了MFCC,GMM,UBM等算法,最后通過C++語言實(shí)現(xiàn)對(duì)說話識(shí)別處理中的預(yù)處理、Mel頻率倒譜系數(shù)特征提取、GMM模型的訓(xùn)練以及對(duì)說話人辨認(rèn)和確認(rèn)的識(shí)別。本文硬件系統(tǒng)電路包括三星S3C6410處理器以
4、及FLASH存儲(chǔ)器、SDRAM、UDA1341TS音頻處理芯片、LED顯示等結(jié)構(gòu)。在分析了Linux操作系統(tǒng)驅(qū)動(dòng)程序的工作原理的基礎(chǔ)上,研究了嵌入式Linux下驅(qū)動(dòng)程序的開發(fā)過程,建立了交叉編譯環(huán)境,完整的開發(fā)出UDA1341TS音頻編解碼芯片在本系統(tǒng)中的驅(qū)動(dòng)程序,以及 GPIO口的相關(guān)驅(qū)動(dòng),將說話人識(shí)別程序和驅(qū)動(dòng)程序經(jīng)過交叉編譯產(chǎn)生的可執(zhí)行程序下載到實(shí)驗(yàn)板上測(cè)試運(yùn)行。經(jīng)測(cè)試表明該系統(tǒng)能實(shí)時(shí)的采集語音信號(hào),完成對(duì)說話人的判斷,同時(shí)系統(tǒng)具
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 說話人識(shí)別系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 基于FPGA的說話人識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于GMM的說話人識(shí)別系統(tǒng)研究與實(shí)現(xiàn).pdf
- 基于SOPC的說話人識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于FPGA的說話人識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 說話人識(shí)別系統(tǒng)研究與實(shí)現(xiàn).pdf
- 基于Windows CE的說話人識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 說話人識(shí)別系統(tǒng)的研究及實(shí)現(xiàn).pdf
- 基于深度學(xué)習(xí)的說話人識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 說話人識(shí)別系統(tǒng)的研究及DSP實(shí)現(xiàn).pdf
- 基于VQ和HMM的說話人識(shí)別系統(tǒng)研究與實(shí)現(xiàn).pdf
- 說話人識(shí)別系統(tǒng)的研究與開發(fā).pdf
- 基于DSP的說話人識(shí)別系統(tǒng).pdf
- 基于GMM說話人分類的說話人識(shí)別系統(tǒng)研究.pdf
- 基于文本提示的說話人識(shí)別系統(tǒng)的研究和實(shí)現(xiàn).pdf
- 基于LonWorks總線技術(shù)的說話人識(shí)別系統(tǒng)研究與實(shí)現(xiàn).pdf
- 基于GMM的說話人識(shí)別系統(tǒng)研究.pdf
- 基于網(wǎng)絡(luò)的說話人識(shí)別系統(tǒng)研究.pdf
- 分布式說話人識(shí)別系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 說話人識(shí)別系統(tǒng)的魯棒性研究與實(shí)現(xiàn).pdf
評(píng)論
0/150
提交評(píng)論