多頻帶非線性分析與感知多譜熵的聲帶疾病嗓音識別.pdf_第1頁
已閱讀1頁,還剩70頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、碩士學(xué)位論文論文題目多頻帶非線性分析與感知多譜熵的聲帶疾病嗓音識別研究生姓名周強指導(dǎo)教師姓名陶智(教授)專業(yè)名稱檢測技術(shù)與自動化裝置研究方向語音信號處理論文提交日期2013年4月多頻帶非線性分析與感知多譜熵的聲帶疾病嗓音識別中文摘要I多頻帶非線性分析與感知多譜熵的聲帶疾病嗓音識別多頻帶非線性分析與感知多譜熵的聲帶疾病嗓音識別中文摘要中文摘要當(dāng)代社會語音是人與人最自然的溝通手段,而且隨著科技的發(fā)展,語音將會在人機交互等智能化領(lǐng)域展現(xiàn)出其優(yōu)

2、越性和必要性。隨著環(huán)境問題、社會和職業(yè)壓力等因素的出現(xiàn),嗓音疾病的發(fā)病率程明顯的上升趨勢。聲帶作為重要的發(fā)聲部位,其病變是導(dǎo)致發(fā)聲出現(xiàn)問題的重要原因。由于無損性、便利性、易傳輸性等優(yōu)勢,聲學(xué)分析的病理嗓音診斷已然成為研究的熱點。針對傳統(tǒng)聲學(xué)特征在描述聲帶疾病對嗓音的影響時存在的局限性和非完備性,從仿生學(xué)、非線性動力學(xué)和高階統(tǒng)計學(xué)角度,提出了多頻帶非線性分析和感知多譜熵分析的嗓音特征提取方法,以提高聲帶疾病嗓音的識別率。具體研究如下:(1

3、)分析了聲帶疾病對嗓音信號的影響和傳統(tǒng)特征的反映及其局限性,進行相關(guān)性和差異性分析并用于特征選擇。接著提出多頻帶非線性分析方法,引入可模擬人耳聽覺特性的Gammatone濾波器組,求取每個頻帶下濾波信號的最大李雅普諾夫指數(shù),它可以細致地刻畫嗓音信號每個頻帶的非線性特性,從而更加細致地體現(xiàn)出聲帶疾病對嗓音的非線性影響。然后提出了感知多譜熵特征,求取各聽覺濾波器頻帶的多譜和進行能量熵分析,其可以較細致地反映嗓音每個頻帶的非高斯性。正常嗓音與

4、聲帶疾病嗓音和聲帶疾病嗓音與甲狀腺亢進疾病嗓音的識別實驗表明本文提出的特征比傳統(tǒng)特征有較高的識別率提升。(2)針對特征不同維間存在的冗余,采用核主成分分析進行特征優(yōu)化,而核函數(shù)的形式及核參數(shù)的設(shè)置直接影響優(yōu)化效果,本文提出了高斯最大似然度的最優(yōu)核參數(shù)選擇算法。識別實驗也表明本文提出的核函數(shù)具有最佳的特征優(yōu)化性能。(3)為了更全面地體現(xiàn)聲帶疾病對嗓音的影響,將篩選后的傳統(tǒng)特征與本文提出特征融合構(gòu)成新的特征向量,實現(xiàn)了特征之間的互補。當(dāng)融合

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論