版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、本文在回顧文語轉(zhuǎn)換系統(tǒng)(Text to Speech,TTS)的發(fā)展歷程、應用現(xiàn)狀以及典型技術(shù)的基礎(chǔ)上,就面向航天測試的語音合成系統(tǒng)的設計、實現(xiàn)的全過程進行論述,并就其實現(xiàn)細節(jié)做了全面的介紹。 目前通常意義下的TTS系統(tǒng)多指一種可以將輸入的文本轉(zhuǎn)換為語音輸出的計算機應用系統(tǒng)。TTS可以自動的對文本進行分析,確定文本中各部分的讀音、停頓、語氣語調(diào)等,再根據(jù)預先存儲的語音片斷或可以轉(zhuǎn)換為語音片斷的信息將輸入的文本所對應的語音合成出來
2、作為輸出加以播放。 常見的商業(yè)TTS系統(tǒng)結(jié)構(gòu)復雜,規(guī)模龐大,足以應對日常的文語轉(zhuǎn)換需求,但對于某一專業(yè)領(lǐng)域內(nèi)的文本卻難以產(chǎn)生很好的轉(zhuǎn)換效果,這主要是由于文本中含有大量專業(yè)詞匯無法被TTS中自帶的詞典所識別,所以不能正確確定字詞之間的結(jié)合關(guān)系及停頓標記導致聲音質(zhì)量下降。此外專業(yè)領(lǐng)域內(nèi)可能含有一定量的外文詞匯、字母、縮寫,數(shù)學表達式,單位符號,專業(yè)內(nèi)的特別讀音約定等。以上這些都成為建立面向某一專業(yè)應用領(lǐng)域的TTS系統(tǒng)的主要動機。
3、 航天器可以認為是一種極為復雜的人造系統(tǒng),并且工作于嚴苛的自然條件下,造價也非常昂貴。對航天器在建造過程中以及發(fā)射前所進行的測試就顯得極為重要。為達到足夠高的可靠性,航天測試相當嚴格,過程也非常繁瑣。為降低測試人員的勞動強度,提高測試效率,保證測試的準確性,我們在航天器的測試系統(tǒng)中引入了TTS系統(tǒng),通過語音的交流取代了原有對屏幕的觀察,提高了測試效率,減小測試人員的工作壓力。另外通過選擇悅耳的語音也有降低測試人員心理壓力,放松心情的
4、功效,起到減少失誤和錯誤的作用。 根據(jù)航天測試的需求,我們建立了應用于航天測試的專業(yè)TTS系統(tǒng)。本文給出了該系統(tǒng)設計和實現(xiàn)的全部細節(jié),其中的創(chuàng)新和特點可以總結(jié)如下: 1.將TTS應用于航天測試領(lǐng)域,將之與測試諸系統(tǒng)進行集成,初步形成方便人機交互的VoiceUI。 2.在基本合成聲學單元的選擇方面,采取了不定長單元的設置,用于漢語普通話合成的聲學單元有多音節(jié)詞組、詞、字、單音節(jié)等形式的聲學單元,用于西文單詞、字
5、母及縮寫的合成則是采取單詞、音節(jié)、聲母/韻母音素的發(fā)聲單元等形式。通過采取這樣的聲學單元設置可以在合成質(zhì)量和語音庫的大小之間形成一定的折衷。 3.在韻律模型方面采用了參數(shù)化的Target模型。這主要是由于本系統(tǒng)的韻律結(jié)構(gòu)相對簡單,以祈使、陳述為主,而且其中所涉及到的中外文混讀皆是連續(xù)的中文語流中混有西文單詞或字母組合,外文內(nèi)容對中文的影響相對較小。 4.在Corpus文本的收集方面,除收集常規(guī)的文本內(nèi)容外,更加注重航
6、天測試專業(yè)文本的收集以及相關(guān)詞典的編制。 5.在設計錄音腳本時,采取了評分動態(tài)調(diào)整的策略,改良貪心算法。利用這種設計錄音腳本的算法所形成的腳本中的詞頻分布可以被設置為與原始文本中的詞頻分布相似或任意指定的分布形式。通過這樣的算法,調(diào)整錄音腳本中詞頻分布在一定程度上可以彌補原始文本中的不足。 6.發(fā)聲單元自動篩選。通過采取一系列聚類分析及神經(jīng)網(wǎng)絡等手段將一些不理想的發(fā)聲單元去除。 本文的內(nèi)容依據(jù)該TTS系統(tǒng)在的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 情感語音合成的研究和系統(tǒng)實現(xiàn).pdf
- 實用化的粵語語音合成系統(tǒng)研究與實現(xiàn).pdf
- 基于RFID和語音合成的導盲系統(tǒng)研究.pdf
- 基于ZigBee技術(shù)的語音導游系統(tǒng)研究與實現(xiàn).pdf
- 面向數(shù)字家庭的語音識別系統(tǒng)研究與實現(xiàn).pdf
- 面向航空設備維修測試的IETM系統(tǒng)研究與實現(xiàn).pdf
- 語音手語合成系統(tǒng)研究與開發(fā).pdf
- 情感語音合成系統(tǒng)的研究與實現(xiàn).pdf
- 面向氣象語音呼叫中心的語音合成軟件設計與實現(xiàn).pdf
- 基于混沌理論和語音識別技術(shù)的語音保密通信系統(tǒng)研究.pdf
- 面向IaaS云平臺測試的負載生成系統(tǒng)研究與實現(xiàn).pdf
- 面向局域網(wǎng)的協(xié)同蠕蟲檢測技術(shù)和系統(tǒng)研究與實現(xiàn).pdf
- 語音合成算法研究及嵌入式語音合成系統(tǒng)的實現(xiàn).pdf
- 基于雙層學習模型的可視語音合成系統(tǒng)研究.pdf
- 面向JavaME程序的CSP數(shù)據(jù)流測試系統(tǒng)研究與實現(xiàn).pdf
- 內(nèi)話系統(tǒng)中語音優(yōu)選技術(shù)策略的研究和實現(xiàn).pdf
- 基于語音識別技術(shù)的母豬咳嗽監(jiān)測系統(tǒng)研究與實現(xiàn).pdf
- 面向語音合成的文本處理技術(shù)的改進.pdf
- 漢語語音合成系統(tǒng)的改進與實現(xiàn).pdf
- 嵌入式語音合成系統(tǒng)的研究與實現(xiàn).pdf
評論
0/150
提交評論