情感語音的嗓音分析與合成.pdf_第1頁
已閱讀1頁,還剩46頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、聲源部分在情感發(fā)聲過程中具有重要的作用,不同情感的發(fā)聲在嗓音音質(zhì)特征上有不同的表現(xiàn)。以往的情感語音研究多集中于韻律特征和少量的音質(zhì)特征,這些特征在特定情感類別的分析中具有顯著性差異,但如果擴(kuò)大情感種類,嘗試分析更全面的情感分類,則需要更多更復(fù)雜的特征參數(shù)。本文主要以情感語音的嗓音音質(zhì)特征為研究對象,通過提取和分析多種情感語音的嗓音音質(zhì)參數(shù),建立參數(shù)與情感的對應(yīng),并依據(jù)對應(yīng)關(guān)系調(diào)整合成模型的輸入,合成情感語音。
  首先在情感種類方

2、面,我們選擇了多數(shù)研究者認(rèn)可的七種情感種類作為研究對象,這七種情感分別是:悲傷、高興、生氣、驚訝、害怕、厭惡和中性。然后分別對七種情感語音樣本進(jìn)行嗓音音質(zhì)參數(shù)提取。本研究一共提取了九個(gè)與嗓音音質(zhì)相關(guān)的參數(shù),分別是基頻抖動(dòng)(jitter)、振幅抖動(dòng)(shimmer)、聲門振幅(pulse Amp)、諧波噪聲率(HNR)、聲門波最大下降率(MFDR)、基頻均值(meanF0)、歸一化振幅商(NAQ)、音高浮動(dòng)范圍(pitch Range)、

3、第一二諧波差值(H1-H2)。接下來使用多種方法對參數(shù)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,在參數(shù)統(tǒng)計(jì)分析結(jié)果中,我們發(fā)現(xiàn):
  (1)存在一些參數(shù)具有情感“普適性”,即在大多數(shù)元音、大多數(shù)情感組合中都具有顯著性差異。比如聲門波最大下降率(MFDR),在包含所有元音和情感樣本的Kruskal-Wallis秩和檢驗(yàn)中,對所有元音都表現(xiàn)出具有情感間的顯著性差異。在具體的情感組合檢驗(yàn)中,相比于其他參數(shù),MFDR在更多的情感組合中具有顯著性差異。
  

4、(2)在具體的情感組合檢驗(yàn)中,我們發(fā)現(xiàn)存在一些參數(shù),它們是否具有情感間顯著性差異與特定元音和情感相關(guān)。比如在元音/e/中,基頻抖動(dòng)(jitter)在anger情感與其他一些情感組合中具有顯著性差異,而在不包含anger的情感組合中都不具有顯著性差異。又如參數(shù)H1-H2,在元音/e/中不具有情感間顯著性差異,而在元音/i/的較多情感組合中具有顯著性差異。
  (3)從情感角度來看,存在一些情感組合較其他情感組合更容易被嗓音音質(zhì)參數(shù)區(qū)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論