版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、在智能人-機交互系統(tǒng)中,語音連續(xù)情緒計算是目前流行的研究領(lǐng)域,并且得到了廣泛的應(yīng)用。雖然許多科研人員已經(jīng)提出了解決語音離散情緒識別的可能性,并取得了一些成果,但至今在語音連續(xù)情緒上仍沒有滿意的結(jié)論。
本文的主要研究內(nèi)容是漢語語音連續(xù)情緒計算,即從語音信號中識別說話人當時所處的連續(xù)情緒狀態(tài)。文章描述了一個基于聽覺心理學(xué)的連續(xù)情緒計算模型-包絡(luò)頻譜調(diào)制模式(envelope spectral modulation patter
2、ns,ESMP)與情緒心理學(xué)維數(shù)(效價維、激勵維、支配維和能量維)之間的分布關(guān)系,用于人類語音連續(xù)情緒的自動識別。ESMP是從聽覺感應(yīng)長期臨界頻譜表示中提取的,包含了頻譜和臨界調(diào)制頻率成分,從而通過人類語音知覺頻譜特征而不是傳統(tǒng)的韻律特征來傳遞情緒信息。本文以漢語語音連續(xù)情緒計算為重點,主要研究內(nèi)容包括:
①模糊連續(xù)情緒語料數(shù)據(jù)庫的建立;
②人主觀辨聽實驗:語音情緒維數(shù)分析;
③機器實驗:包絡(luò)頻
3、譜特征提取、頻譜計算和情緒分類。
漢語普通話模糊連續(xù)情緒語音采集:在分析當前國際上一些情緒語料數(shù)據(jù)庫的基礎(chǔ)上,獨立設(shè)計文本,確定錄音人數(shù)、語音種類(自然、模仿、誘出)、模糊情緒種類和語料數(shù)目。所研究的情緒為5種模糊基本情緒狀態(tài):(稍微、比較和非常)喜、怒、驚、悲和懼,1種模糊二次派生情緒(稍微、比較和非常)驚喜,另取參考語音信號表征沒有情緒時的狀態(tài)。通過對采集的模糊情緒語音數(shù)據(jù)進行第一次主觀聽辨實驗,最后建立漢語模糊情緒語
4、音數(shù)據(jù)庫。
第二次、三次主觀辨聽實驗:實驗研究了上述情緒在V-A-D上的分布情況。每一維可劃分7個水平,然后請正常聽力的人對第一次主觀辨聽實驗選出的情緒語料進行再次辨聽,并且鑒定每個情緒語料的7個水平在V-A-D三維空間的分布。從而得到每種情緒在V-A-D三維空間的分布結(jié)果。
計算機實驗:首先,分析了情緒語音相對于參考(無情緒)語音的包絡(luò)特征(上下包絡(luò)線、包絡(luò)譜和包絡(luò)特征向量)。然后,使用全相經(jīng)驗?zāi)B(tài)分解(e
5、nsemble empirical mode decomposition,EEMD)分段冪函數(shù)插值(PPF)算法提取這些特征,通過對情緒語音信號進行EEMD得到一系列情緒本征模態(tài)函數(shù)(emotional intrinsic mode functions,IMFe),提取每一級IMFe的頻率倒譜系數(shù)作為表征說話人情緒的特征參數(shù),對得到的情緒特征參數(shù)用矢量量化進行識別。根據(jù)IMFe頻譜變換獲得包絡(luò)線和包絡(luò)譜,同時通過快速傅立葉變換(FFT)
6、也得到了包絡(luò)特征向量。
在提取包絡(luò)特征的基礎(chǔ)上,文章進一步研究了漢語情緒語音的功率頻譜密度和能量頻譜,進而得到了ESMP。利用Matlab軟件仿真了模糊情緒的EEMD和包絡(luò)頻譜特性,得到模糊情緒的ESMP。同時,根據(jù)ESMP的峰值(PV)、峰值瞬時(IP)、形心(C)、等距寬度(EW)和橫坐標均方(MSA),進一步在V-A-D-P四維空間中分析了維數(shù)水平和ESMP之間的關(guān)系。
在漢語語音模糊情緒分類上,文章提
7、出一種新穎的、基于ESMP提取和模糊支持向量回歸(FSVR)分類器(classifier)的互相關(guān)性算法。該算法應(yīng)用于漢語語音模糊情緒((稍微、比較和非常)喜、驚和驚喜)的分類上。同時,F(xiàn)SVR分類器使用了模糊連續(xù)二分(FCB)過程,并且適用于情緒語音互相關(guān)的包絡(luò)頻譜特征。這種借助FSVR分類器的包絡(luò)頻譜互相關(guān)性算法,可以大幅提高漢語語音模糊情緒識別率,并且在識別非常喜情緒時準確率甚至可以達到92.58%。
綜上所述,在進
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于調(diào)制傳遞函數(shù)的語音包絡(luò)修復(fù).pdf
- 基于Sphinx的漢語連續(xù)語音識別.pdf
- 基于DSP語音頻譜包絡(luò)提取方法的研究及實現(xiàn).pdf
- 漢語語音情緒識別.pdf
- 基于HTK的漢語連續(xù)語音識別研究.pdf
- 基于HMM的漢語連續(xù)數(shù)字語音識別.pdf
- 基于HTK的漢語連續(xù)數(shù)字語音識別研究.pdf
- 基于語音包絡(luò)特征的語音識別系統(tǒng).pdf
- 基于包絡(luò)線調(diào)制的非接觸電能傳輸模式研究.pdf
- 基于音節(jié)的漢語連續(xù)語音聲調(diào)識別方法研究.pdf
- 基于漢語發(fā)音特征的語音編碼模式分析.pdf
- 基于正交模式的連續(xù)波調(diào)制信號仿真研究.pdf
- 漢語連續(xù)語音端點檢測技術(shù)的研究.pdf
- 基于HTK的漢語連續(xù)語音識別系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 噪音環(huán)境下漢語連續(xù)數(shù)字的語音識別.pdf
- 基于GMM語音譜包絡(luò)表示的編碼算法研究.pdf
- 帶噪環(huán)境下的漢語連續(xù)語音識別研究.pdf
- 漢語連續(xù)語音識別中自適應(yīng)技術(shù)的研究.pdf
- 振幅調(diào)制連續(xù)光產(chǎn)生梳狀頻譜的時頻特性研究.pdf
- 漢語連續(xù)語音識別系統(tǒng)的研究與實現(xiàn).pdf
評論
0/150
提交評論