實時語音改變技術研究與實現(xiàn).pdf_第1頁
已閱讀1頁,還剩66頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著計算機網(wǎng)絡通信技術和多媒體技術的飛速發(fā)展,計算機支持的協(xié)同工作(ComputerSuppoSedCooperativeWork,簡稱CSCW)已成為當前計算機科學領域一個十分活躍的研究課題。目前計算機支持的協(xié)同工作理論廣泛應用于諸如視頻會議、多功能感知、多媒體CAI、協(xié)同辦公、協(xié)同設計、協(xié)同討論等領域?;谝纛l的說話人隱私保護也是遠程協(xié)同工作環(huán)境中的一項重要課題。 本文首先介紹了基于音頻信息中的個人特征的隱私保護的必要性及其

2、相關的關鍵技術,著重介紹了有關語音處理、語音轉換、語音的譜參數(shù)改變、語音的韻律參數(shù)改變的知識和目前國內外該領域的研究現(xiàn)狀及發(fā)展方向。 然后介紹了自行分析、設計與實現(xiàn)的音頻環(huán)境下的實時語音改變方法,對其分析過程和設計思想進行了深入詳細的探討,主要內容包括:對音頻信息的特征參數(shù)提取,譜參數(shù)修改,韻律參數(shù)修改等,著重討論了對基于音段特征的一PLAR系數(shù)曲線變換的譜參數(shù)修改的算法。同時為了得到更好的聽覺效果,本文提出了自適應同步疊加(A

3、SOLA)語音時長規(guī)整算法,以及將ASOLA算法運用到基于線性預測模型的音高規(guī)整中,實現(xiàn)實時語音音高規(guī)整的方法。 在介紹基于音頻的實時語音改變的方法時,圍繞其實現(xiàn)技術,對語音物理模型、信號分解、基音標注、清濁音判決、特征提取、語音重建、語音時長規(guī)整改變、語音音高規(guī)整改變、實時語音改變等一一做了介紹。 最后,運用前面研究的技術,設計實現(xiàn)了基于音頻通信的實時說話人隱私保護原型系統(tǒng)。文中對該系統(tǒng)的功能、實現(xiàn)及其應用一一進行了介

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論