噪聲背景下的語音端點檢測方法研究.pdf_第1頁
已閱讀1頁,還剩78頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、語音端點檢測技術(shù),是指對輸入語音處理系統(tǒng)的一段純凈或含噪語音信號進行語音段的起止端點的標記,它是各類語音處理系統(tǒng)中的一個重要的前期預處理環(huán)節(jié)。高效的端點檢測技術(shù)不僅能剔除非語音段的信號從而削弱對后續(xù)處理環(huán)節(jié)的干擾,還可以降低整個系統(tǒng)中待處理的數(shù)據(jù)量,進而使運算時間得以減少。在現(xiàn)實生活中,很少存在安靜的采集環(huán)境,所以獲取的語音信號大多是帶有不同背景噪聲的,在這種情況下,對語音端點檢測技術(shù)的研究將對語音處理系統(tǒng)的穩(wěn)定性和實用性大有益處。

2、r>  有效的語音端點檢測技術(shù)可以分為兩類研究方法:一類是基于統(tǒng)計模型的研究方法,此類研究方法檢測效果良好,但由于需要多次試驗進而統(tǒng)計得出語音信號的模型參數(shù),使復雜度變高的同時加大了運算量,所以嚴重影響了語音信號處理系統(tǒng)的實時性;另一類研究方法,是通過提取能夠突出語音段且抑制噪聲段信號的某一種特征值并將其與相應(yīng)的閾值比較,從而切割出語音段部分,此方法稱為特征提取法,這類方法雖然運算量普遍較小,但相應(yīng)的語音信號的特征值會隨著信噪比的降低而

3、難以區(qū)別語音與非語音段,進而影響檢測結(jié)果的正確率。
  本文通過參考幾種基于特征提取的語音端點檢測方法的研究,在此基礎(chǔ)上提出了相應(yīng)的改進算法,以提高噪聲背景下的端點檢測的準確率。主要內(nèi)容概括如下:
  1.提出一種改進的以交叉熵大小為判決準則的算法,對噪聲估計部分采用語音存在概率的算法來估計背景噪聲功率譜,根據(jù)帶噪語音與估計噪聲的子帶能量之間的交叉熵特征值對輸入的語音進行分類,與原始算法相比,改進算法在低信噪比的噪聲環(huán)境中更

4、具有魯棒性。
  2.針對經(jīng)驗?zāi)B(tài)分解的模態(tài)混疊問題,提出基于集合經(jīng)驗?zāi)B(tài)分解與 Teager峭度相結(jié)合的語音端點檢測算法。利用集合經(jīng)驗?zāi)B(tài)分解算法將輸入語音信號分解為多個本征模態(tài)函數(shù),計算每個本征模態(tài)函數(shù)的Teager能量,并對本征模態(tài)函數(shù)的Teager能量的峭度進行根的冪函數(shù)計算,對提取的信號特征信息進行順序統(tǒng)計濾波,尋找合適閾值,實現(xiàn)低信噪比條件下的語音段的檢測工作。
  3.在基于壓縮感知觀測序列語音能量的檢測方法基

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論