版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、聽覺感知計(jì)算是神經(jīng)計(jì)算科學(xué)領(lǐng)域的一個(gè)重要研究方向,其任務(wù)是以神經(jīng)生理學(xué)的研究成果為基礎(chǔ),模擬人類聽覺信息處理的神經(jīng)模式,從計(jì)算的角度研究新的聽覺信息處理方法和應(yīng)用系統(tǒng)。聽覺感知計(jì)算模型的研究對新型語音處理技術(shù)的發(fā)展,如聽覺功能修復(fù)、大規(guī)模自動語音識別系統(tǒng)、身份識別、新型人機(jī)交互模式等具有重要的理論意義和應(yīng)用價(jià)值。
本文從聽覺感知計(jì)算的角度出發(fā),主要在聽覺神經(jīng)處理機(jī)理,特征提取算法及識別系統(tǒng)建立等方面展開研究,側(cè)重解決復(fù)雜環(huán)
2、境下魯椿的語音信號特征提取問題。本文的具體工作有以下幾個(gè)方面:
1.提出了一種非負(fù)張量主分量分析算法(NTPCA),計(jì)算張量結(jié)構(gòu)下不同維度的投影矩陣;結(jié)合初始聽覺皮層的時(shí)頻感受野(STRF)模型,引入了時(shí)間、頻率、尺度和相位的高階張量結(jié)構(gòu),把語音信號的時(shí)序和頻率特性統(tǒng)一到一個(gè)皮層表征模型下;通過NTPCA算法進(jìn)行特征提取,給出了一種新的具有魯棒性的語音特征Gabor張量倒譜系數(shù)(GTCC)。算法的稀疏性約束保留了具有稀疏分
3、布的純凈特征分量,同時(shí)抑制了具有稠密分布的噪聲分量。計(jì)算機(jī)仿真實(shí)驗(yàn)結(jié)果證明了GTCC特征的有效性和魯棒性,能夠提高噪聲環(huán)境下語音識別系統(tǒng)的性能。
2.模擬外圍聽覺通路的信號處理機(jī)制,利用一組耳蝸濾波器組模擬耳蝸中基底膜各個(gè)區(qū)域的頻率選擇性,提取耳蝸能量譜特征,利用獨(dú)立子空間分析(ISA)方法將耳蝸能量譜特征投影到統(tǒng)計(jì)獨(dú)立的線性子空間,提取不同說話人的諧波成分特征,利用極大化不同子空間的獨(dú)立性,抑制噪聲成分的干擾。實(shí)驗(yàn)結(jié)果表
4、明,該方法提取的魯棒聽覺特征(RAF)特征具有較好的魯棒性,提高了噪聲環(huán)境下的說話人識別的性能。
3.提出了一種約束的非負(fù)張量分解算法(cNTF),通過稀疏控制算子和正交性約束,控制張量基函數(shù)和特征系數(shù)的稀疏程度,提取張量數(shù)據(jù)中的局部特征表征,結(jié)合皮層表征模型,利用cNTF算法學(xué)習(xí)到的稀疏張量基函數(shù)對語音信號進(jìn)行投影,得到魯棒的稀疏Gabol特征用于說話人識別。從實(shí)驗(yàn)結(jié)果可以看出,皮層張量倒譜系數(shù)(CTCC)特征對于加性噪
5、聲具有魯棒性,能夠適應(yīng)不同的噪聲環(huán)境。
4.建立時(shí)間×頻率×說話人身份的張量模型,利用稀疏非負(fù)張量分解算法學(xué)習(xí)包含可判別信息的張量基函數(shù),以獲得投影到張量基上的最優(yōu)特征系數(shù),最后利用高斯混合模型進(jìn)行說話人的身份識別。實(shí)驗(yàn)結(jié)果證明,本文提出的基于聽覺的非負(fù)張量特征(ANTF)和基于聽覺非負(fù)張量倒譜系數(shù)(ANTCC)特征能夠提高說話人識別系統(tǒng)的性能,增強(qiáng)系統(tǒng)的魯棒性。
本文針對噪聲環(huán)境下語音信號特征提取問題,研究
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 語音增強(qiáng)及魯棒特征提取方法研究.pdf
- 基于聽覺感知模型和統(tǒng)計(jì)學(xué)習(xí)的語音魯棒處理.pdf
- 基于NPC和改進(jìn)的MFCC魯棒語音特征提取研究.pdf
- 魯棒性語音識別的特征提取與模型自適應(yīng)算法研究.pdf
- 基于人耳聽覺特性的語音特征提取研究.pdf
- 噪聲魯棒性語音識別:從特征提取到聲學(xué)模型的研究.pdf
- 花粉圖像魯棒鑒別特征提取方法的研究.pdf
- 基于聽覺模型的語音特征提取和有限命令的連續(xù)語音識別的算法研究.pdf
- 基于聽覺機(jī)理的魯棒特征提取及在說話人識別中的應(yīng)用.pdf
- 群智感知中語音識別特征提取方法的研究.pdf
- 基于FPH特征提取框架的魯棒人臉識別.pdf
- 基于張量子空間的圖像特征提取方法研究.pdf
- 聽覺特性與魯棒語音識別算法研究.pdf
- 基于張量的特征提取技術(shù)研究.pdf
- 基于EMD與特征規(guī)整的含噪語音特征提取方法研究.pdf
- 語音命令中特征提取方法研究.pdf
- 基于張量的心電特征提取及模式分類方法研究.pdf
- 基于非負(fù)張量分解的機(jī)械故障特征提取理論與方法研究.pdf
- 基于聽覺特征的水中目標(biāo)輻射噪聲特征提取.pdf
- 情感語音的特征提取與識別研究.pdf
評論
0/150
提交評論