基于小波變換和GMM的病態(tài)嗓音特征提取及識別研究.pdf_第1頁
已閱讀1頁,還剩62頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、病態(tài)嗓音識別是計算機(jī)技術(shù)在醫(yī)學(xué)領(lǐng)域的滲透與發(fā)展,這將為臨床實現(xiàn)無痛、無損傷化檢查和客觀的診斷作出重要的貢獻(xiàn)。由于嗓音的復(fù)雜性,基于聲學(xué)參數(shù)的病態(tài)嗓音檢查不能僅憑一個或幾個參數(shù)作出診斷,最終也無法擺脫醫(yī)生的經(jīng)驗進(jìn)行主觀判斷。為了真正實現(xiàn)客觀的檢測,許多研究者已經(jīng)作了大量的工作,在病態(tài)嗓音的智能識別和客觀評價方向上作出了重大的貢獻(xiàn),但目前的結(jié)果離真正的進(jìn)入臨床應(yīng)用還存在一定的距離。 本文在前人工作的基礎(chǔ)上,研究了基于小波變換和高斯混

2、合模型(GMM)的病態(tài)嗓音識別系統(tǒng)。從嗓音的發(fā)音機(jī)理、病態(tài)嗓音與正常嗓音在頻域的表現(xiàn)差異,利用小波變換對信號進(jìn)行分解,突出病態(tài)嗓音的特點,本文提出了基于多尺度分析的小波降噪、分解的熵系數(shù)(Entropy Coefficient Based on De-noise,Decomposition of Multi-scale Analysis,ECDDMA)作為模型識別的特征矢量集,運用GMM模型實現(xiàn)了正常與病態(tài)嗓音識別。 本文數(shù)據(jù)庫

3、242例正常嗓音和234例病態(tài)嗓音,其中病態(tài)嗓音樣本全部來自臨床,隨機(jī)各選取80例作為訓(xùn)練集,剩余的作為測試集。詳細(xì)介紹了小波變換和小波降噪的基本理論,并得到了ECDDMA系數(shù)的提取過程及算法。實驗結(jié)果表明:ECDDMA系數(shù)較傳統(tǒng)的模擬人耳聽覺非線性特性的MFCC及其動態(tài)特征更有利于正常與病態(tài)嗓音的識別,并得到了好的識別結(jié)果。并通過實驗分析了特征提取過程中去噪的必要性、模型混合數(shù)的選取對識別性能的影響、小波分解層數(shù)選取對識別性能的影響等

4、問題。 由于ECDDMA系數(shù)的提取是對語音的整個頻域進(jìn)行分析的,因此存在部分特征對識別率的提高沒有作用,反而會使識別性能下降,使運算復(fù)雜,因此有必要進(jìn)行特征選擇,選出有效的特征來構(gòu)建模型,提高識別性能。本文對傳統(tǒng)窮舉法與基于神經(jīng)網(wǎng)絡(luò)特征選擇法進(jìn)行了比較,實驗表明基于窮舉法的特征選擇對于維數(shù)較多的特征矢量是不實用的,也證明了基于神經(jīng)網(wǎng)絡(luò)特征選擇的優(yōu)越性,本文最后使用神經(jīng)網(wǎng)絡(luò)方法從(ECDDMA系數(shù)+能量特征)22維原始特征中選取出

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論