版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、語音信號處理技術(shù)與計算機(jī)科學(xué)、模式識別系統(tǒng)、人工智能等領(lǐng)域與技術(shù)密切相關(guān),融合了語言學(xué)研究與信號處理技術(shù),對語音信號處理技術(shù)的研究會推動相關(guān)技術(shù)的發(fā)展。例如,隨著人機(jī)交互的不斷發(fā)展,以語音為通道的人機(jī)交互環(huán)境將會成發(fā)展的熱點和主流,語音環(huán)境下的交互方式將極大地提高人機(jī)交互的自然性和高效性。因此,對語音信號處理技術(shù)的深入研究具有重要的理論與實踐意義。
語音信號處理技術(shù)可以分語音的合成、編碼以及識別三大類,本文就其中的語音合成技術(shù)
2、中語音更改部分的內(nèi)容:語音時長規(guī)整和語音變調(diào)技術(shù)做重點研究。語音時長規(guī)整即在不改變說話人基頻、音色等特征下實現(xiàn)對語音時長的改變;語音變調(diào)技術(shù)則是在不改變說人語音速度的情況下實現(xiàn)對說話人基頻的改變。在實踐中,語音時長規(guī)整和語音變調(diào)技術(shù)可廣泛應(yīng)用于語音壓縮、傳輸通信、外語教學(xué)、影視后期制作及文語轉(zhuǎn)換等眾多領(lǐng)域。
文章首先概要地闡述了該論文所研究內(nèi)容的背景、意義,并對語音時長規(guī)整與變調(diào)技術(shù)的主要方法和國內(nèi)外研究進(jìn)展做出介紹。其次,研
3、究和闡述了語音信號產(chǎn)生的物理機(jī)制,基于其物理機(jī)制詳細(xì)分析了語音信號的經(jīng)典數(shù)字模型。
在此基礎(chǔ)上,對于語音時長規(guī)整技術(shù),詳細(xì)介紹了典型算法OLA、SOLA、WSOLA以及基于模型的線性預(yù)測法等算法的原理及實現(xiàn)方法,并進(jìn)行仿真對比實驗。針對WSOLA算法在進(jìn)行規(guī)整時采用統(tǒng)一規(guī)整而沒有根據(jù)語音的感知特性做出相應(yīng)的區(qū)分,因而在采樣率偏低或者整體規(guī)整比例偏大的情況下規(guī)整效果將會變差的缺陷,分析了人耳的聽覺預(yù)測原理,提出基于人耳聽覺預(yù)測的
4、改進(jìn)WSOLA時長規(guī)整算法,對人耳感知敏感的轉(zhuǎn)折區(qū)語音進(jìn)行了保留,提高了輸出語音的規(guī)整質(zhì)量。進(jìn)一步針對改進(jìn)算法帶來的規(guī)整比例誤差提出一種動態(tài)時間規(guī)整補(bǔ)償算法,有效地使改進(jìn)算法在提高感知度的情況下,保證了規(guī)整時長的準(zhǔn)確性。
對于語音變調(diào)技術(shù),分析推導(dǎo)了基于時域重采樣方法結(jié)合語音時長規(guī)整的算法、基于線性預(yù)測的方法等算法,并進(jìn)行仿真對比實驗。應(yīng)用線性重采樣結(jié)合基于人耳聽覺預(yù)測的改進(jìn)WSOLA時長規(guī)整算法獲得了很好變調(diào)效果的語音。另一
5、方面,針對聲門激勵信號的模擬和聲道共振峰模型的準(zhǔn)確提取兩方面,提出基于同態(tài)濾波倒譜域處理的方法。用倒譜方法提取人聲元音信號進(jìn)行周期拓展和重采樣,得到根據(jù)規(guī)整需求改變基音周期的聲門模擬激勵,用同態(tài)解卷方法提取聲道傳輸函數(shù)并用線型比例的重采樣方法得到改變共振峰頻率的聲道傳輸函數(shù),有效地實現(xiàn)了保證語音時長不變的情況下對語音的變調(diào)處理,提高了合成語音的自然度。
最后構(gòu)建基于Matlab的GUI語音信號處理平臺,把對語音時長規(guī)整與變調(diào)技
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 語音變調(diào)技術(shù)研究.pdf
- 基于頻率規(guī)整的語音轉(zhuǎn)換技術(shù)研究.pdf
- 語音回路與漢語音節(jié)時長記憶關(guān)系的研究.pdf
- 方音與連續(xù)變調(diào)——語音經(jīng)驗對連續(xù)變調(diào)模式的影響.pdf
- 音頻水印與語音變調(diào)取證.pdf
- 語音識別技術(shù)研究與實現(xiàn).pdf
- 實時語音改變技術(shù)研究與實現(xiàn).pdf
- 語音變調(diào)算法研究及其在語音合成中的作用.pdf
- 工程圖檔檢索中草圖規(guī)整與理解技術(shù)研究與應(yīng)用.pdf
- 機(jī)器人語音變調(diào)系統(tǒng)設(shè)計與實現(xiàn).pdf
- 語音轉(zhuǎn)換技術(shù)研究.pdf
- 語音識別技術(shù)研究.pdf
- 語音識別算法與識控技術(shù)研究.pdf
- 漢語語音識別技術(shù)研究與實現(xiàn).pdf
- 藏語語音識別技術(shù)研究.pdf
- VoIP語音增強(qiáng)技術(shù)研究.pdf
- 基于EMD與特征規(guī)整的含噪語音特征提取方法研究.pdf
- 語音信息隱藏與分析技術(shù)研究.pdf
- 圖像與語音信號的采集技術(shù)研究.pdf
- 基于ZigBee的語音傳輸技術(shù)研究與實現(xiàn).pdf
評論
0/150
提交評論