基于高斯混合模型的文本無關(guān)說話人年齡識別_第1頁
已閱讀1頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、蘇州大學學位論文獨創(chuàng)性聲明本人鄭重聲明:所提交的學位論文是本人在導(dǎo)師的擺導(dǎo)下,獨立進行研究工作所取得的成果。除文中已經(jīng)注明引用的內(nèi)容外,本論文不含其他個人或集體已經(jīng)發(fā)表或撰寫過的研究成果,也不含為獲得蘇州大學或其它教育桃構(gòu)的學位證書而使用過的材料。對本文的研究作出重要貢獻的個人和集體,均已在文中以明確方式標明尊本人承擔本聲明的法律責任。論文作者簽名._ 』坌是 日期:乙翌! £:! ! :多基于高斯混合模型的文本無關(guān)說話人年齡識別 摘要

2、基于高斯混合模型的文本無關(guān)說話人年齡識別中文摘要模式識別是一種人工智能技術(shù)的應(yīng)用。其基本思想是在計算機中構(gòu)建一個人類智能的模型,然后利用已有的信息( 數(shù)據(jù)) 對其進行訓(xùn)練,即優(yōu)化其內(nèi)部參數(shù),使得它按照一定的準則逼近“真實的”情況。本文所做的工作是在語音識別領(lǐng)域應(yīng)用模式識別技術(shù),從而達到估計說話人年齡段的目的。在基于說話人的語音特點進行系統(tǒng)訓(xùn)練時,首先提取語音信號的梅爾頻率倒譜系數(shù)( M F c c ,M e I —F r e q u e

3、 n c y c e p s t r u m c o e f f .c i e n t s ) 作為特征參數(shù),然后采用高斯混合模型( G M M ,G a u s s i a nM i x t u r eM o d e I ) 對不同年齡語音進行建模,同時應(yīng)用通用背景模型( u B M ,u n i v e r s a I B a c k r o u n d M o d e I ) 與G M M 相結(jié)合以提高識別率并減少訓(xùn)練識別時間。系

4、統(tǒng)測試識別時,采用與訓(xùn)練階段相同的M F C C 特征參數(shù),通過比較測試樣本相對于各個模型的后驗概率得到最終的識別結(jié)果。實驗結(jié)果表明利用這幾種技術(shù)的組合,我們可以憑借很少的訓(xùn)練樣本實現(xiàn)一定精度的識別率。為將來進一步研究提供依據(jù)。本課題的研究內(nèi)容主要包括以下幾個方面:1 .說話人的語音特征分析,包括語音的能量特點,頻率特點,M F c c 等。2 .應(yīng)用高斯混合模型G M M 對各個年齡段的語音數(shù)據(jù)進行建模并訓(xùn)練,分析識別結(jié)果。3 .應(yīng)用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論