版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、近年來,多語種語音信息處理成為了智能語音信息處理中的重要研究方向。其中,由于跨語言的語音合成能夠利用同一個(gè)語音合成系統(tǒng)合成出不同語言的語音,成為了目前的研究熱點(diǎn)。中國是一個(gè)少數(shù)民族語言和方言眾多的國家,跨語言語音合成技術(shù)的研究對(duì)促進(jìn)方言和民族語言語音技術(shù)的發(fā)展有著重要的意義。但是,目前國內(nèi)外的研究中,并沒有一個(gè)完整的普通話/民族語言或普通話/方言的多語種語音合成系統(tǒng)。本文選取了漢語普通話和藏語拉薩方言作為研究對(duì)象,研究了兩種語言在發(fā)音上
2、的特點(diǎn)及共性,設(shè)計(jì)了普通話和藏語通用的標(biāo)音方案、語音基元的語境信息標(biāo)注格式以及對(duì)聲學(xué)模型進(jìn)行決策樹聚類的問題集。在此基礎(chǔ)上,利用一個(gè)多說話人的普通話語料庫和一個(gè)單說話人的藏語拉薩方言語料庫,將說話人自適應(yīng)訓(xùn)練引入基于隱Markov模型(Hidden Markov Model,HMM)的語音合成方法中,訓(xùn)練獲得了一個(gè)混合語言的平均音模型;之后,再利用待合成藏語或漢語的少量訓(xùn)練語句,采用說話人自適應(yīng)變換算法獲得藏語或者普通話的說話人相關(guān)模型
3、,最終合成出藏語或漢語語音,實(shí)現(xiàn)了漢藏雙語跨語言語音合成系統(tǒng)。論文的主要工作和創(chuàng)新如下:
1.設(shè)計(jì)了一套面向統(tǒng)計(jì)參數(shù)語音合成的藏漢雙語的機(jī)讀音標(biāo)方案。從聲母、韻母和聲調(diào)等方面對(duì)藏語和漢語的發(fā)音特點(diǎn)做了對(duì)比研究,找出了兩者在發(fā)音上的共性,利用國際通用的機(jī)讀音標(biāo),設(shè)計(jì)了一套漢藏雙語的機(jī)讀音標(biāo),實(shí)現(xiàn)了文本到字音的轉(zhuǎn)換。
2.設(shè)計(jì)了一套面向統(tǒng)計(jì)參數(shù)語音合成的漢藏雙語的上下文相關(guān)的標(biāo)注格式。標(biāo)注格式包括聲韻母層、音節(jié)層、詞層、
4、韻律詞層、韻律短語層和語句層6層,用來標(biāo)注藏語或者漢語語句中的每個(gè)聲韻母的語境信息。同時(shí),設(shè)計(jì)了涵蓋兩種語言語音特色的決策樹問題集,用于聲學(xué)模型的訓(xùn)練過程中對(duì)模型的聚類。
3.提出了一種利用說話人自適應(yīng)訓(xùn)練實(shí)現(xiàn)漢藏雙語跨語言語音合成的方法。利用一個(gè)多說話人的普通話語料和一個(gè)單說話人的藏語語料,在HMM模型的訓(xùn)練中引入說話人自適應(yīng)訓(xùn)練,得到一個(gè)語言無關(guān)的平均音模型;然后采用1個(gè)藏語說話人的訓(xùn)練語料或者1個(gè)普通話說話人的訓(xùn)練語料,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 漢藏雙語跨語言語音轉(zhuǎn)換方法的研究.pdf
- 藏語統(tǒng)計(jì)參數(shù)語音合成的合成語音的音質(zhì)評(píng)測.pdf
- 藏語拉薩方言的統(tǒng)計(jì)參數(shù)語音合成的研究.pdf
- 蘭銀官話統(tǒng)計(jì)參數(shù)語音合成的研究.pdf
- 漢藏雙語合成語音音質(zhì)評(píng)測的研究.pdf
- 統(tǒng)計(jì)參數(shù)語音合成中的聲學(xué)模型建模方法研究.pdf
- 面向統(tǒng)計(jì)參數(shù)語音合成的方言文本分析的研究.pdf
- 融合發(fā)音機(jī)理的統(tǒng)計(jì)參數(shù)語音合成方法研究.pdf
- 基于神經(jīng)網(wǎng)絡(luò)的統(tǒng)計(jì)參數(shù)語音合成方法研究.pdf
- 統(tǒng)計(jì)參數(shù)語音合成中的頻譜建模及生成方法研究.pdf
- 基于說話人自適應(yīng)訓(xùn)練的統(tǒng)計(jì)參數(shù)語音合成的研究.pdf
- 統(tǒng)計(jì)參數(shù)語音合成中的基頻建模與生成方法研究.pdf
- 基于正弦模型的參數(shù)語音合成研究.pdf
- 融合發(fā)音運(yùn)動(dòng)特征的統(tǒng)計(jì)參數(shù)語音合成技術(shù)研究.pdf
- 基于AMR-WB的參數(shù)語音合成技術(shù).pdf
- 藏語拉薩話的HMM參數(shù)語音合成方法研究.pdf
- 統(tǒng)計(jì)參數(shù)情感語音合成的研究.pdf
- 藏漢雙語多模態(tài)生理語音數(shù)據(jù)庫的建立和語音特征分析.pdf
- 藏漢雙語培訓(xùn)方案
- 青海藏漢雙語教育實(shí)踐研究.pdf
評(píng)論
0/150
提交評(píng)論