2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩59頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、語言合成是用人工的方式產(chǎn)生人類語音從而賦予計算機(jī)如人一般自如說話的能力,目前的語音合成研究大多集中在文語轉(zhuǎn)換(Text-To-Speech,TTS)這一階段,即將一般語言的文字轉(zhuǎn)換為語音。這些年來,隨著語音技術(shù)的飛速發(fā)展,語音合成技術(shù)越加趨于成熟,合成的語音在音質(zhì)和自然度上都有了明顯的提高。然而,如何進(jìn)一步提高語音合成系統(tǒng)的性能,使計算機(jī)合成出的聲音更加的清晰與自然一直是語音合成研究領(lǐng)域的焦點問題。此外,隨著國際交流的日益頻繁,在國際交

2、往中只用單一語種進(jìn)行溝通往往已經(jīng)不能滿足人們的需求,有著對跨語種語音合成系統(tǒng)的迫切需要。在缺乏目標(biāo)語種數(shù)據(jù)的情況下如何完成跨語種的說話人自適應(yīng),進(jìn)而實現(xiàn)跨語種的語音合成系統(tǒng)以方便人們的國際交流與溝通,正是本文研究工作的重心所在。本研究分為五個部分:
   第一章簡略地敘述了本文的研究背景。首先介紹了跨語種語音合成技術(shù)的技術(shù)需求與應(yīng)用背景,接著介紹了現(xiàn)有的幾種主流語音合成方法,最后對本文的主要研究方向----基于HMM模型的跨語種

3、語音合成技術(shù)相關(guān)的概念與方法進(jìn)行了大致的說明。
   第二章的前半部分主要是在介紹目前最為常用的基于HMM模型的可訓(xùn)練語音合成技術(shù)(Trainable TTS)的基本框架流程和關(guān)鍵技術(shù)點,后半部分則詳細(xì)描述了這種語音合成系統(tǒng)基礎(chǔ)上的同語種說話人模型自適應(yīng)技術(shù)框架及相關(guān)算法。這兩方面內(nèi)容是本文研究工作的基礎(chǔ)所在,也是后續(xù)章節(jié)研究內(nèi)容的基本出發(fā)點。
   第三章介紹了對第二章中系統(tǒng)的改進(jìn)工作。這里從參數(shù)語音合成系統(tǒng)中與語種最

4、為相關(guān)的模塊——基于決策樹的模型聚類入手,著力研究如何改善現(xiàn)有基線系統(tǒng)的合成效果。研究中分別考查了決策樹構(gòu)建中挑選分裂問題的不同指導(dǎo)準(zhǔn)則、判斷分裂停止的不同條件準(zhǔn)則及它們的不同組合對最終聚類效果和合成語音的影響。
   第四章主要從音素映射的思路出發(fā)來實現(xiàn)中英文跨語種的語音合成模型自適應(yīng)。在跨語種的說話人模型自適應(yīng)中,針對簡單的音素映射效果不佳的問題,結(jié)合自適應(yīng)數(shù)據(jù)的挑選,修正并改進(jìn)了中英文音素映射表,同時通過中英文間的調(diào)型映射

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論