基于語法信息的漢語韻律結(jié)構(gòu)預(yù)測.pdf_第1頁
已閱讀1頁,還剩43頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、高自然度的語音合成是人機(jī)交互領(lǐng)域的一個(gè)重要研究課題。為提高合成語音的自然度,需要知道準(zhǔn)確的合成文本的韻律結(jié)構(gòu)。為此,論文分析了漢語文本的語法結(jié)構(gòu)與韻律結(jié)構(gòu)之間的關(guān)系,重點(diǎn)研究了韻律詞和韻律短語的預(yù)測。論文的研究結(jié)果對于揭示文本與語音之間的關(guān)系、提高合成語音的自然度具有重要的理論意義和應(yīng)用價(jià)值。論文的主要研究成果和創(chuàng)新點(diǎn)如下:1.建立了一個(gè)大規(guī)模的文本語料庫。該語料庫包含20000句文本語料,標(biāo)注了語法信息和韻律信息。韻律信息在語言學(xué)專家

2、的指導(dǎo)下手工標(biāo)注。完成的語料庫經(jīng)過了語言學(xué)專家的抽查,并與語言學(xué)專家標(biāo)注結(jié)果進(jìn)行了對比。結(jié)果表明,手工標(biāo)注的韻律詞和韻律短語的綜合參數(shù)得分分別達(dá)到了98%和85%,可用于韻律結(jié)構(gòu)預(yù)測的研究中。2.提出了一種以相鄰語法詞詞長和詞性為特征,利用TBL算法進(jìn)行韻律詞預(yù)測的方法。通過對手工標(biāo)注過的語料庫進(jìn)行統(tǒng)計(jì)分析,發(fā)現(xiàn)相鄰語法詞長和相鄰語法詞詞性是從語法詞映射到韻律詞的主要特征?;谶@一特征,利用TBL轉(zhuǎn)換學(xué)習(xí)算法進(jìn)行了韻律詞的預(yù)測。結(jié)果表明

3、,該方法在測試集上分別得到了97.5%的精確率、召回率以及綜合參數(shù),優(yōu)于現(xiàn)有的研究結(jié)果。3.提出了一種新的用于韻律結(jié)構(gòu)預(yù)測的語法結(jié)構(gòu)描述特征——鄰接度(Adjacent Degree,AD),利用鄰接度描述了語法結(jié)構(gòu)和韻律結(jié)構(gòu)之間的關(guān)系?;卩徑佣冗@一新特征,利用TBL算法進(jìn)行了韻律短語的預(yù)測。測試集上的結(jié)果表明,該方法在韻律短語的預(yù)測上,精確率達(dá)到了75.2%,召回率達(dá)到了77.1%,綜合參數(shù)達(dá)到了76.1%。4. 提出了一種基于鄰接

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論