基于語音信號的維度情感識別研究.pdf_第1頁
已閱讀1頁,還剩54頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、自二十世紀末,信息技術迅速發(fā)展,它應經涉及到我們生活的各個方面,使我們的世界更加豐富多彩,而人機交互技術的出現(xiàn)給我們的生活帶來了更多的可能。語音是人與人之間交流最自然、最常用的方式,為了使人機交互更好的實現(xiàn),如何使計算機能夠更好的理解人類語言以及語音信號所包含的情感特征已經成為目前的重點研究方向。人們說話時發(fā)出的語音信號中包含很多帶有語音情感的特征參數(shù),而語音情感識別就是通過計算機來分析這些參數(shù)并對說話者的情感狀態(tài)作出判斷,這一技術的出

2、現(xiàn)使人機交互更和諧舒適。維度語音情感識別是語音情感識別研究中一個新的研究領域,它是從多維度、連續(xù)的角度看待情感。研究中通常將維度語音情感識別建模為一個回歸預測任務,任務過程中是用一些連續(xù)值來表示情感狀態(tài)。對維度語音情感識別技術進行深入探討與研究,不僅可以提高計算機的智能水平,而且有著非常重要的理論價值和現(xiàn)實意義。
  本文最初對維度語音情感識別領域的研究歷史及現(xiàn)狀作了簡要概述,并且對維度語音情感識別研究的研究進展、研究成果以及現(xiàn)有

3、的維度情感識別理論基礎做出了概括性的總結,最終確定了本文的研究思路與過程,同時選定了AVEC2014情感語音庫作為本文研究用的語料庫,并且對語料庫的語音信號進行了分析和預處理,并提取了語音信號的基頻、短時能量、時間特征、共振峰、譜能量、諧波噪聲比、MFCC、Mel頻率倒譜系數(shù)等情感特征參數(shù)用作維度語音情感識別。
  維度語音情感識別在本質上屬于模式識別問題。本文采用了連續(xù)條件神經域(Continuous Conditional N

4、eural Fields,CCNF)模型用于維度語音情感識別,該模型是為了維度情感識別問題而專門設計的。這個模型同與之相似的連續(xù)條件隨機場(Continuous Conditional Random Fields,CCRF)模型和支持向量回歸(Support Vector Regression,SVR)模型相比有了一定的改進,本文中也對這幾種模型的識別結果進行了對比研究,研究結果表明,CCNF模型表現(xiàn)出一定的優(yōu)越性,識別效果以及準確性明

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論