語音信號端點檢測算法的研究.pdf_第1頁
已閱讀1頁,還剩72頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、在當前信息科技時代,語音信號識別(ASR)技術(shù)、語音信號編碼(ASC)技術(shù)、及語音信號增強(ASE)技術(shù)[1]將會在安防領域、人機交互領域、通信領域以及未來的消費電子產(chǎn)品領域[2]產(chǎn)生強有力的技術(shù)支撐作用。通過語音信號端點檢測技術(shù),可以準確地分析出一段語音信號中的純語音信號和靜音段[3],該技術(shù)直接對ASR、ASE技術(shù)的性能和ASC技術(shù)的效率產(chǎn)生決定性影響[4]。
  可以用三個環(huán)節(jié)來表征一個完整的語音端點檢測模型:首先,語音信號

2、預處理環(huán)節(jié),包括信號濾波、語音流分幀以及信號加窗等[5]。其次,提取整個語音流的特征向量,小波分析(WA)技術(shù)的多分辨率解析特性是提取語音信號特征向量的極好方法[6]。最后,語音端點判別模型的建立[7]。傳統(tǒng)的語音端點檢測算法有基于時域的雙門限法、基于頻域的普熵法以及基于倒普特征的檢測方法等。
  針對在低信噪比和復雜的噪聲環(huán)境下,為了得到滿意的端點檢測效果,本文提出了基于優(yōu)化極限學習機(ELM)的端點檢測模型,通過優(yōu)化網(wǎng)絡連接參

3、數(shù)以彌補算法本身的不足。
  (1)為了優(yōu)化ELM神經(jīng)網(wǎng)絡的輸入權(quán)值和隱含層偏差,結(jié)合粒子群優(yōu)化(PSO)算法,形成了粒子群優(yōu)化極限學習機(PSO-ELM)端點檢測模型。依靠ELM神經(jīng)網(wǎng)絡的快速學習能力,瞬間完成端點檢測并輸出預測結(jié)果。該算法在一定程度上優(yōu)化了網(wǎng)絡連接結(jié)構(gòu),但是仍然存在一定的缺陷。
  (2)為了更好的優(yōu)化 ELM神經(jīng)網(wǎng)絡的連接參數(shù),最后采用自適應步長果蠅(FOAMR)算法優(yōu)化極限學習機,并將優(yōu)化后算法應用于

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論