麥克風網(wǎng)絡中基于分布式粒子濾波的說話人跟蹤方法研究.pdf_第1頁
已閱讀1頁,還剩126頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、利用麥克風陣列對室內(nèi)說話人進行跟蹤,是根據(jù)分布于空間中的多個麥克風接收的音頻信號對運動說話人的位置信息進行估計?;邴溈孙L陣列的說話人跟蹤技術(shù)在公共安全監(jiān)控、音視頻會議系統(tǒng)、語音識別、車載電話以及機器人等領域都有廣泛應用。近年來,隨著無線傳感器網(wǎng)絡、網(wǎng)絡通信、移動計算以及集成電路技術(shù)的快速發(fā)展,生產(chǎn)小尺寸麥克風的成本越來越低,嵌入式處理器的計算能力顯著增強,分布式麥克風網(wǎng)絡逐漸發(fā)展起來,基于分布式麥克風網(wǎng)絡的聲源定位和跟蹤成為語音處理領

2、域一個新的研究熱點。然而,目前大多數(shù)聲源跟蹤算法主要針對傳統(tǒng)的規(guī)則麥克風陣列,并不能直接用于分布式麥克風網(wǎng)絡。
  貝葉斯濾波是解決室內(nèi)說話人跟蹤問題的典型方法,它采用狀態(tài)空間的方法對說話人跟蹤問題進行建模。當狀態(tài)空間模型為線性、高斯時,卡爾曼濾波是貝葉斯濾波的最優(yōu)解;當狀態(tài)空間模型為非線性、非高斯時,粒子濾波是貝葉斯濾波的有效近似解。在室內(nèi)噪聲和混響條件下,說話人狀態(tài)的后驗分布多為非高斯分布,其觀測模型通常為非線性模型。據(jù)此,本

3、文在貝葉斯濾波理論框架下,對現(xiàn)有的分布式粒子濾波算法進行改進,提高了濾波器的跟蹤精度和魯棒性;通過深入研究粒子濾波理論,提出了一種新的分布式粒子濾波器。在此基礎上,將所提出的分布式粒子濾波算法應用于麥克風網(wǎng)絡進行室內(nèi)說話人跟蹤,提出了一些針對性的改進措施。
  本論文的主要創(chuàng)新工作如下:
  (1)在現(xiàn)有的基于粒子權(quán)重一致性的分布式粒子濾波器中,其似然函數(shù)的計算要求各個節(jié)點的觀測在給定狀態(tài)的條件下相互獨立,且需要已知觀測噪聲

4、的統(tǒng)計信息。針對該問題,本文利用廣域相干場函數(shù)在某一空間位置的取值反應了聲源在該位置處的可能性大小的特點構(gòu)建了一種偽似然函數(shù),進而推導了一種廣域相干場-分布式粒子濾波器,并將其用于麥克風網(wǎng)絡中的說話人跟蹤問題。該方法不要求各個節(jié)點的觀測條件獨立,也無需已知觀測噪聲的統(tǒng)計信息,且易于分布式計算。仿真和實際實驗結(jié)果表明,所提出的方法在噪聲和混響環(huán)境中具有良好的跟蹤性能。
  (2)針對非線性高斯系統(tǒng),提出了一種改進的分布式高斯粒子濾波

5、器,并將其應用于麥克風網(wǎng)絡中的說話人跟蹤問題。該方法在預測階段采用粒子的形式對狀態(tài)的概率密度進行預測,并對各個節(jié)點的局部預測信息進行融合,進而使每個節(jié)點擁有狀態(tài)后驗概率的全局預測結(jié)果;在融合階段根據(jù)一種最優(yōu)的融合規(guī)則對各個節(jié)點的局部估計進行融合并去除了局部估計之間的公共先驗,最終每個節(jié)點都擁有關于狀態(tài)的全局估計。該方法只要求相鄰節(jié)點間的局部通信,且允許各個節(jié)點的局部估計具有一定的相關性。仿真和實際實驗結(jié)果表明,所提出的說話人跟蹤方法在噪

6、聲和混響環(huán)境中能夠?qū)\動的說話人進行有效地跟蹤。
  (3)針對包含線性、高斯子結(jié)構(gòu)的非線性、非高斯系統(tǒng),提出了一種分布式邊緣輔助粒子濾波器。該算法利用邊緣化技術(shù)將線性狀態(tài)分量從狀態(tài)空間模型中分離出來,并利用分布式卡爾曼濾波器來估計;而剩余的非線性狀態(tài)分量則采用分布式輔助粒子濾波器來估計。針對說話人狀態(tài)空間模型包含線性、高斯子結(jié)構(gòu)的特點,將分布式邊緣輔助粒子濾波器應用于說話人跟蹤問題,通過邊緣化技術(shù)將說話人的位置信息從狀態(tài)空間模型

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論