2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩58頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著增值業(yè)務的不斷發(fā)展和移動用戶對內容需求的增大,傳統(tǒng)的使用數(shù)據(jù)業(yè)務提供內容的方式已不能滿足需求。語音增值業(yè)務系統(tǒng)通過以話音為主的方式向用戶提供內容。作為語音增值業(yè)務系統(tǒng)的核心,語音增值業(yè)務平臺采用VXML(VoiceExtensibleMarkupLanguage)這一開放標準語言,給業(yè)務內容提供商的語音內容業(yè)務提供執(zhí)行平臺,進而建立起全新的“運營商——業(yè)務提供商——內容提供商”價值鏈。ASR(AutomaticSpeechRecog

2、nition)與TTS(TexttoSpeech)是語音增值業(yè)務平臺開展語音業(yè)務所需的極為重要的媒體資源能力,它們優(yōu)化了用戶與語音增值業(yè)務平臺的交互手段,提高了服務質量,而且促使了新的業(yè)務的出現(xiàn)。 本文對作者攻讀碩士學位期間的工作進行了回顧和總結。作者在課題設計期間負責語音增值業(yè)務平臺中ASR和TTS功能的設計和實現(xiàn)。論文首先分別對語音增值業(yè)務系統(tǒng)與語音增值業(yè)務平臺的概念和結構、ASR與TTS的原理及其標準進行了介紹。接著重點設

3、計了ASR和TTS功能在VAP(VoiceValue-addedServicePlatform)中的一種基于API的實現(xiàn)方案。VAP的TTSC(TexttoSpeechClient)模塊和RN(ResourseNote)模塊受控于VXML模塊,通過引擎的API與ASR或TTS服務器進行交互來提供ASR與TTS媒體資源。TTSC模塊實現(xiàn)文本到語音文件的轉換的功能,這種功能適用于對實時性無要求或合成的文本較小的場合。結合TTS引擎APl的特

4、點,TTSC模塊采用了線程池模式來實現(xiàn)消息的并發(fā)處理及資源的動態(tài)分配。RN模塊在VAP中負責提供各種媒體資源,它由消息分發(fā)模塊RNManager、資源節(jié)點功能模塊RNF(ResourceNoteFunction)等組成。RNF模塊實現(xiàn)了語音和DTMF音信號的識別及文本的播放,其實現(xiàn)依賴于其它由DSP(DigitalSignalProcess)語音卡提供的媒體資源能力。論文在對并發(fā)處理、實時性、資源協(xié)作、資源動態(tài)分配等關鍵問題的分析和解決

5、的基礎上,完成了RNF模塊的設計和實現(xiàn)。論文分別在NMS和Ddialogic兩種語音卡上對RNF模塊進行了實現(xiàn),并對這兩種實現(xiàn)進行了比較。本文最后分析了基于API的實現(xiàn)方式的缺陷,提出了一種基于MRCP(MediaResourceControlProtoco1)協(xié)議的改進方案。使用MRCP協(xié)議作為VAP與ASR/TTS服務器的接口的好處是只需要進行一次編碼就可以集成所有支持該協(xié)議的引擎。論文基于MRCP和NMS的fusion對RNF進行

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論