基于CASA的語音分離技術(shù)及應(yīng)用研究.pdf_第1頁
已閱讀1頁,還剩68頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、近幾年,隨著智能電子產(chǎn)品的廣泛流行,語音技術(shù)尤其是自動語音識別技術(shù)也迎來了新的研究熱潮。在現(xiàn)實環(huán)境中,語音信號通常會受到各種噪聲的干擾,降低了信號的質(zhì)量以及識別度,從而導(dǎo)致了語音技術(shù)不能很好的應(yīng)用和推廣。
  為了解決這個問題通常會考慮利用降噪技術(shù),傳統(tǒng)降噪技術(shù)雖然經(jīng)過多年的發(fā)展,但大部分是基于統(tǒng)計特性的,并且被處理的語音需要滿足一定的約束條件,因此仍然有很多難以解決的問題。人類聽覺系統(tǒng)對語音信號的感知力遠遠超過了現(xiàn)在的聲音信號處

2、理水平,研究人員對人類的聽覺系統(tǒng)進行了研究,希望用機器模擬人類聽覺系統(tǒng)對語音信號的感知過程,計算聽覺場景分析(Computational Auditory Scene Analysis, CASA)就是這類研究中的一種典型方法。研究人員利用 CASA理論開發(fā)出了一些語音除噪系統(tǒng),其中比較成功的系統(tǒng)是Hu-Wang系統(tǒng),這些系統(tǒng)能夠?qū)⒄Z音信號從含有噪聲的混合音頻信號中分離出來。
  本文對CASA的相關(guān)理論技術(shù)以及基于CASA的語音

3、分離系統(tǒng)進行了研究,并對具有代表性的Hu-Wang語音分離系統(tǒng)提出一些改進的方法,論文主要包括下面幾項工作:
  1.提出了一種利用基于單位幀內(nèi)高低頻能量比來約束混合線索的分段算法。在高頻區(qū)域,語音信號不會存在較高的能量,如果此區(qū)域受到噪聲干擾,則分離線索也會受到相應(yīng)的干擾,從而影響時頻單元的分段效果。因此以提高時頻單元在分段環(huán)節(jié)的合并效果作為改進方向,提出了一種基于單位幀內(nèi)高低頻能量比約束混合線索的分段算法。實驗表明此算法能夠有

4、效提高系統(tǒng)的分離性能。
  2.將音質(zhì)客觀評價系統(tǒng)和 CASA系統(tǒng)相融合。語音分離的性能評測標準通常是信噪比,但信噪比提高,并不意味著人對語音質(zhì)量的感知效果會相應(yīng)提高。因此本文嘗試把音質(zhì)客觀評價系統(tǒng)和CASA系統(tǒng)相融合,以達到在提高語音分離信噪比增益的同時也能夠提高音質(zhì)感知的效果。實驗表明此方法能夠較好的提高分離結(jié)果的語音質(zhì)量。
  3.基于CASA技術(shù)的改進語音分離系統(tǒng)設(shè)計與實現(xiàn)。將上述兩種改進方法融入語音分離的相關(guān)環(huán)節(jié),

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論