版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、<p><b> 摘要</b></p><p> 語(yǔ)音信號(hào)分離是近幾十年來(lái)廣泛應(yīng)用于通信、雷達(dá)、電子醫(yī)學(xué)等方面的發(fā)展方向,其理論基礎(chǔ)是語(yǔ)音信號(hào)的盲源分離。本文主要介紹了盲源分離和獨(dú)立分量分析概念以及相關(guān)知識(shí),探討ICA研究中的主要問(wèn)題。盲信號(hào)處理算法分為批處理算法和自適應(yīng)算法兩類(lèi),研究得到一種批處理和自適應(yīng)相結(jié)合的快速獨(dú)立分量分析(fast independent compon
2、ent analysis, Fast ICA)算法。在語(yǔ)音信號(hào)的處理和分離中,聲音的信號(hào)多種多樣,但是來(lái)自不同語(yǔ)音源的信號(hào)保持相對(duì)獨(dú)立,利用此特點(diǎn)及盲信號(hào)分離的思想,將Fast ICA算法作用在語(yǔ)音信號(hào)的分離上,從而獲得獨(dú)立的聲音文件。</p><p> 本文重點(diǎn)研究了盲信號(hào)處理的思想和ICA算法,明確了ICA方法的數(shù)學(xué)模型、基本假設(shè)條件以及ICA目標(biāo)函數(shù)的估計(jì)準(zhǔn)則。本文使用三個(gè)聲音文件做實(shí)驗(yàn),用matlab進(jìn)
3、行仿真試驗(yàn),通過(guò)分離前后的波形圖進(jìn)行對(duì)比與分析,來(lái)證明該算法具有良好的語(yǔ)音信號(hào)分離效果。</p><p> 關(guān)鍵詞:語(yǔ)音信號(hào)分離;盲信號(hào)處理算法;獨(dú)立分量分析;ICA固定點(diǎn)算法</p><p><b> 英文摘要</b></p><p><b> 緒論</b></p><p><b>
4、; 研究背景與意義</b></p><p> 數(shù)字信號(hào)處理技術(shù)是1960年開(kāi)始,伴隨著計(jì)算機(jī)技術(shù)的發(fā)展而迅速發(fā)展起來(lái)的一門(mén)學(xué)科技術(shù)。從誕生起,它便顯示出了龐大的潛力,并很快在諸如雷達(dá)和聲納,電子通訊工程,以及電子生物醫(yī)學(xué)等領(lǐng)域中應(yīng)用于實(shí)際,并且取得了非常好的效果,使人們對(duì)這門(mén)技術(shù)給予了很大的期望。但是由于早期技術(shù)能力的不足,數(shù)字信號(hào)處理主要是根據(jù)一個(gè)高斯穩(wěn)態(tài)信號(hào)和系統(tǒng)限制因果最小相位系統(tǒng)的假設(shè),而
5、信號(hào)的分析主要使用其相關(guān)函數(shù)(時(shí)域)和功率譜(頻域)等二階統(tǒng)計(jì)信息。因?yàn)樵谠S多情況下,這些假設(shè)大致成立,因此通過(guò)實(shí)際需要的數(shù)字信號(hào)處理技術(shù)的發(fā)展迅速并逐漸完善,且被日益廣泛的應(yīng)用。</p><p> 在這同時(shí),信息理論,人工神經(jīng)網(wǎng)絡(luò),多維信號(hào)處理技術(shù),進(jìn)化算法,模糊推理,盲信號(hào)處理等等技術(shù)在過(guò)去十年中取得的突破顯著,并已經(jīng)應(yīng)用到信號(hào)處理領(lǐng)域。在理論和技術(shù)方面,這些新的突破已逐漸成為現(xiàn)代信號(hào)處理的里程碑。使得無(wú)論
6、各行各業(yè)的研究人員都需要學(xué)習(xí)并掌握現(xiàn)代信號(hào)處理方法,并將其應(yīng)用于行業(yè)中。</p><p> 隨著數(shù)字信號(hào)處理技術(shù)的應(yīng)用在各個(gè)領(lǐng)域的應(yīng)用逐漸深化,以及數(shù)字信號(hào)處理技術(shù)本身的不斷發(fā)展,大家開(kāi)始并不滿(mǎn)足于處理線(xiàn)性時(shí)不變因果最小相位系統(tǒng)以及平穩(wěn)高斯信號(hào),以及經(jīng)典的信號(hào)處理理論,因此非平穩(wěn),非高斯和非線(xiàn)性、時(shí)變的非因果最小相位系統(tǒng)被推出舞臺(tái)。同時(shí),由于對(duì)于高階統(tǒng)計(jì)量和小波變換的研究有很大的進(jìn)展,現(xiàn)在已經(jīng)能夠?qū)?非高斯以及
7、非平穩(wěn)信號(hào)進(jìn)行信號(hào)分析并進(jìn)行處理。曾經(jīng)一度讓人認(rèn)為無(wú)法解決的加性有色噪聲的信號(hào)處理,也已經(jīng)取得了實(shí)質(zhì)性的進(jìn)展。此外,自適應(yīng)信號(hào)處理算法以及高分辨率頻譜分析等方面也有了突破性的發(fā)展。</p><p><b> 本文研究方向</b></p><p> 雞尾酒會(huì)效應(yīng)(cocktail party effect),也稱(chēng)為選擇性關(guān)注(selective attention)
8、,即為盲源分離的一個(gè)實(shí)際例子,指人在嘈雜的環(huán)境中或者很多人同時(shí)說(shuō)話(huà)的環(huán)境下依舊能分辨出自己感興趣的聲音,這說(shuō)明人類(lèi)的大腦可以進(jìn)行類(lèi)似于盲源語(yǔ)音分離的工作,在實(shí)驗(yàn)中,我們并不能認(rèn)為計(jì)算機(jī)可以完全替代人腦對(duì)于語(yǔ)音的識(shí)別程度,但是通過(guò)軟件將原本混合在一起的語(yǔ)音信號(hào)分開(kāi),來(lái)模擬嘈雜環(huán)境下的語(yǔ)音識(shí)別是可以實(shí)現(xiàn)的。</p><p><b> 盲信號(hào)處理相關(guān)知識(shí)</b></p><p
9、><b> 盲信號(hào)處理的概述</b></p><p> 盲信號(hào)處理(Blind Signal Processing, BSP)是近年來(lái)在現(xiàn)代數(shù)學(xué)信號(hào)處理領(lǐng)域中的重要發(fā)展方向。它指在信號(hào)在無(wú)參考信號(hào)的條件下,來(lái)估計(jì)出原始信號(hào)的方法,用系統(tǒng)的輸出數(shù)據(jù),通過(guò)處理手段來(lái)獲得我們想要了解的相關(guān)信息。盲信號(hào)處理已經(jīng)能夠在移動(dòng)通信、電子信息處理、生物醫(yī)學(xué)工程、雷達(dá)與探測(cè)等等專(zhuān)業(yè)領(lǐng)域中廣泛應(yīng)用。&
10、lt;/p><p> 盲信號(hào)處理中的“盲”指信號(hào)源是未知的,并且混合信號(hào)也是未知的,因此我們?cè)诿ば盘?hào)處理的過(guò)程中無(wú)法使用這點(diǎn)。例如,人們?cè)谟靡苿?dòng)設(shè)備通信時(shí),發(fā)出的信號(hào)是未知的,而且如果人們?cè)诖蠼稚洗螂娫?huà),過(guò)程中可能在不斷走動(dòng),信號(hào)源也會(huì)移動(dòng),導(dǎo)致信道不斷變化,因此這也是未知的。通信的任務(wù)即為從接受到的信號(hào)去恢復(fù)本身的原始信號(hào)。</p><p> 盲信號(hào)處理雖然是近幾十年內(nèi)才剛剛發(fā)展起來(lái)的一
11、門(mén)新研究領(lǐng)域,但是由于其應(yīng)用范圍廣泛,使得各國(guó)科研人員都大力投入在這門(mén)學(xué)科中,但是研究進(jìn)程不算太快,因?yàn)槠渖婕暗闹R(shí)面以及應(yīng)用面都很廣闊但是理論卻并不是很成熟,因此其中的許多問(wèn)題都需要進(jìn)一步的探討和解決。例如以下幾方面:</p><p> 1、帶噪聲的語(yǔ)音信號(hào)盲處理</p><p> 很多實(shí)際應(yīng)用的情況下,混合語(yǔ)音信號(hào)中往往摻雜著許多噪音,由于本身限制信號(hào)處理的制約條件就已經(jīng)很多,因此
12、在含有大量噪音的情況下去進(jìn)行盲信號(hào)處理還是十分困難的,即使現(xiàn)在很多算法在原語(yǔ)音信號(hào)含有噪聲的情況下也能展現(xiàn)出較好的處理性能,但是由于噪聲種類(lèi)繁多并且不好控制,進(jìn)行盲信號(hào)處理還是有很大程度的制約。因此在現(xiàn)有的多數(shù)盲信號(hào)處理的計(jì)算方法中,都會(huì)假設(shè)原信號(hào)不含噪音,亦或者是將噪音看作另一個(gè)獨(dú)立的原信號(hào)來(lái)進(jìn)行處理。</p><p> 2、非平穩(wěn)的語(yǔ)音信號(hào)盲處理</p><p> 我們的計(jì)算過(guò)程中
13、一般使用的是平穩(wěn)的語(yǔ)音信號(hào),但是實(shí)際情況中,很多原信號(hào)都是非平穩(wěn)的。在非平穩(wěn)特性下如何進(jìn)行盲信號(hào)處理也是該學(xué)科所面臨的一大難題。</p><p> 3、卷積語(yǔ)音信號(hào)的盲處理</p><p> 我們進(jìn)行盲信號(hào)處理時(shí)一般使用的是直接傳遞來(lái)的語(yǔ)音信號(hào),而大部分實(shí)際情況中,系統(tǒng)接收到的信號(hào)是通過(guò)不同途徑傳遞到接收器中的信號(hào),在傳遞的過(guò)程中,必然會(huì)產(chǎn)生信號(hào)的反射過(guò)程,使得接收到的信號(hào)并非原信號(hào)本
14、身,在這種情況下的信號(hào)盲處理還沒(méi)有什么很好的解決方式。</p><p> 4、ICA算法的實(shí)際應(yīng)用</p><p> 在進(jìn)行科學(xué)研究中,我們可以在理論的狀態(tài)下用ICA算法進(jìn)行識(shí)別語(yǔ)音、處理圖像、雷達(dá)聲吶信號(hào)處理、處理電子醫(yī)學(xué)信號(hào)等等,但是如何將純理論狀態(tài)下的算法進(jìn)行實(shí)際推廣還有一定難度,因?yàn)閷?shí)際情況遠(yuǎn)遠(yuǎn)比理論狀態(tài)下要復(fù)雜的多。將ICA算法推廣到實(shí)際應(yīng)用是這門(mén)學(xué)科發(fā)展的當(dāng)務(wù)之急。<
15、/p><p><b> 盲信號(hào)處理的方法</b></p><p> 盲信號(hào)處理依據(jù)其經(jīng)過(guò)傳輸信道的混合方式可劃分為三類(lèi),依次為線(xiàn)性瞬時(shí)混合信號(hào)盲處理、線(xiàn)性卷積混合信號(hào)盲處理以及非線(xiàn)性混合信號(hào)盲處理三類(lèi)。</p><p> 依據(jù)其原信號(hào)和觀測(cè)信號(hào)數(shù)目的差距可劃分為欠定、適定和超定三種情況。</p><p> 依據(jù)其原信
16、號(hào)分布的不同可劃為超高斯、亞高斯、超高斯和亞高斯混合分離,同時(shí)其信號(hào)還可分為平穩(wěn)、非平穩(wěn)等。</p><p> 依據(jù)其信道中是否有噪聲及其特性可劃分為有噪聲、無(wú)噪聲、含加性噪聲和乘性噪聲等。</p><p> 而與此同時(shí),我們可以把盲信號(hào)處理的目的分為兩種,即盲辨識(shí)和盲源分離。一般情況下,我們需要先進(jìn)行盲辨識(shí),之后進(jìn)行盲源分離處理。其中盲辨識(shí)的目的是為了求出傳輸通道中用的何種混合矩陣來(lái)
17、組成混合系統(tǒng)。而盲源分離的目的則是為了通過(guò)混合矩陣來(lái)求出原信號(hào)的最佳估計(jì)。</p><p> 盲信號(hào)處理的研究與應(yīng)用</p><p> 近幾年來(lái),盲信號(hào)處理已然成為當(dāng)今時(shí)代信息處理領(lǐng)域的熱門(mén)話(huà)題之一,特別是在生物醫(yī)學(xué)工程,醫(yī)學(xué)影像,語(yǔ)音增強(qiáng),通信系統(tǒng),地震勘測(cè),地球物理,計(jì)量經(jīng)濟(jì)學(xué)和數(shù)據(jù)挖掘等領(lǐng)域表現(xiàn)出龐大的發(fā)展?jié)摿?,尤其是盲源分離技術(shù),通過(guò)ICA技術(shù)的不斷挖掘和應(yīng)用于實(shí)際,它已經(jīng)變得
18、相當(dāng)令人矚目。</p><p> 下面介紹盲信號(hào)處理被應(yīng)用的最為廣泛的兩個(gè)領(lǐng)域:</p><p><b> 1、生物醫(yī)學(xué)信號(hào)</b></p><p> 在生物醫(yī)學(xué)領(lǐng)域,盲信號(hào)處理可以被應(yīng)用到心電圖(ECG),腦電圖(EEG)信號(hào)分離,可聽(tīng)信號(hào)分析,以及功能性磁共振成像(FMRI)分析等等方面?,F(xiàn)在在電子醫(yī)學(xué)方面,心腦電圖等等的數(shù)據(jù)處理上,
19、已經(jīng)很廣泛的應(yīng)用了盲信號(hào)處理的思想與技術(shù)來(lái)進(jìn)行識(shí)別、除偽跡等工作。</p><p><b> 2、語(yǔ)音識(shí)別領(lǐng)域</b></p><p> 語(yǔ)音識(shí)別是新一代人機(jī)交互所需的重要技術(shù)之一,也是機(jī)器即將更加人性化所需的技術(shù)基礎(chǔ),而噪聲則是阻礙其進(jìn)行語(yǔ)音識(shí)別的主要影響原因之一,尤其是類(lèi)似于“雞尾酒會(huì)效應(yīng)”的環(huán)境下,噪聲復(fù)雜且多變,這使得機(jī)器想進(jìn)行語(yǔ)音識(shí)別變得更加的困難,而盲
20、信號(hào)處理就可以幫助去除噪音,起到抑制信號(hào)干擾,加強(qiáng)語(yǔ)音信號(hào)程度,提高語(yǔ)音質(zhì)量的重要作用,因此盲信號(hào)處理在語(yǔ)音識(shí)別領(lǐng)域起到了重要的推進(jìn)作用。</p><p><b> 獨(dú)立分量分析</b></p><p> 獨(dú)立分量分析(Independent Component Analysis, ICA)是1990年前后得以發(fā)展并被廣泛認(rèn)知和使用的一種新型信號(hào)處理技術(shù),它是一種
21、從多個(gè)源信號(hào)通過(guò)混合系統(tǒng)得出的線(xiàn)性混合信號(hào)中,通過(guò)計(jì)算混合矩陣,來(lái)分離出源信號(hào)的技術(shù)。在這個(gè)計(jì)算過(guò)程中,除去已知源信號(hào)是相互獨(dú)立以外并無(wú)其它條件,來(lái)分離或近似分離出原信號(hào)的分析過(guò)程。</p><p> 從原理上來(lái)講,只靠單一通道去觀察信號(hào)本身是無(wú)法做到這種目的的分解手段,只有通過(guò)尋求一組把這些信源按不同混合組合起來(lái)的多通道同步觀察才有可能完成。從另一個(gè)方面講,ICA是多導(dǎo)信號(hào)的一種處理方法,但是把一組觀察信號(hào)分
22、解成幾個(gè)獨(dú)立成分,分解結(jié)果必然不唯一,因此分解需要加一定的約束條件來(lái)使得到的答案更接近我們所期望的結(jié)果。ICA算法是基于在各個(gè)領(lǐng)域中困擾許久的盲源問(wèn)題而被廣泛重視并研究的,故其又稱(chēng)盲源分離算法。</p><p><b> 獨(dú)立分量分析的定義</b></p><p> ICA是在多變量(多維)統(tǒng)計(jì)數(shù)據(jù)中來(lái)找出其中隱藏因素及成分的手段,它被廣泛認(rèn)為是主要成分分析(Pr
23、incipal Component Analysis, PCA)和因子分析(Factor Analysis)的擴(kuò)展手段。ICA是在僅知混合信號(hào)而不知源信號(hào)、混合機(jī)制及噪聲干擾的情況下,</p><p> 在信號(hào)處理領(lǐng)域中,盲信號(hào)處理(其中包括盲辨識(shí)、盲信源分解、盲通道均衡等等)是在20世紀(jì)90年代后期才發(fā)展起來(lái)的,ICA是其中的一個(gè)重要組成部分。最早提出ICA理念的是Jutten與Herault分別于1986年
24、和1991年在Signal Processing期刊上發(fā)表的論文。他們?cè)谡撐闹嘘U述的理念讓人耳目一新,但是理論上卻不夠完善。在這之后,由Comon在1994年發(fā)表了一份新的論文,在理論上賦予了比較嚴(yán)密的數(shù)學(xué)定義。到了20世紀(jì)末,隨著科學(xué)技術(shù)的發(fā)展,ICA出現(xiàn)了很多不同的處理算法,被廣泛應(yīng)用于全世界很多科研單位的科學(xué)研究中。</p><p> 從時(shí)間上我們可以看出,ICA的發(fā)展歷程非常晚,從出現(xiàn)到現(xiàn)在時(shí)間很短,但
25、是不論是理論上還是實(shí)際應(yīng)用上,ICA都在被世人所廣泛關(guān)注著,在國(guó)內(nèi)外都是重點(diǎn)的研究對(duì)象。特別在應(yīng)用方面,ICA所展示出的適用范圍和前景是十分可觀的。目前其主要應(yīng)用于盲源分離、語(yǔ)音識(shí)別、通信領(lǐng)域、生物醫(yī)學(xué)工程、心腦功能成像、時(shí)間序列分析以及數(shù)據(jù)挖掘等等領(lǐng)域。</p><p><b> ICA基本概念</b></p><p> ICA 的基本過(guò)程如下圖所示</p
26、><p><b> 圖 21</b></p><p> 由圖示,在信源s(t)中的各個(gè)分量相互獨(dú)立的前提下,經(jīng)過(guò)混合系統(tǒng)A混合,再由觀察x(t)來(lái)通過(guò)解混系統(tǒng)B將其分離開(kāi)來(lái),使得輸出的y(t)能夠最大限度的逼近于s(t)。一般情況下,我們將解混系統(tǒng)分為兩步——即為球化W和正交變換系統(tǒng)U,通過(guò)這兩步來(lái)達(dá)到解混的目的。</p><p> 并且通
27、過(guò)這個(gè)整體過(guò)程我們可以知道,獨(dú)立分量分析實(shí)際上只是一個(gè)優(yōu)化手段,因?yàn)檫@個(gè)問(wèn)題其實(shí)并沒(méi)有唯一解,我們所能做的只是在某一衡量獨(dú)立性的判斷依據(jù)最優(yōu)的意義下來(lái)尋求問(wèn)題的最近似答案,來(lái)使得y(t)中的各個(gè)分量能夠盡可能的相互獨(dú)立;y(t)與s(t)不只是相互近似,得出的結(jié)果在幅度大小和排列順序上都允許它們有一定程度的不同。</p><p> 解混系統(tǒng)B中,我們采用兩步法來(lái)進(jìn)行解混時(shí),第一步的“球化”是使輸出z(t)的各個(gè)
28、分量z1(t)、z2(t)等等的方差為1,并且互不相關(guān)(但不一定相互獨(dú)立);第二步的“正交變換”是使輸出的分量y1、y2等等的方差繼續(xù)保持為1,同時(shí)使其相互獨(dú)立。</p><p> 由于輸出的z1(t)、z2(t)等分量均滿(mǎn)足了二階統(tǒng)計(jì)量中對(duì)于獨(dú)立性的要求,因此進(jìn)行第二步的時(shí)候我們只需要考慮三階以上的統(tǒng)計(jì)量(通常情況下主要是三階和四階統(tǒng)計(jì)量),來(lái)使算法能夠簡(jiǎn)化。因此在各種文獻(xiàn)中,有時(shí)能看到將ICA成為一種“對(duì)于
29、任意多變量數(shù)據(jù)來(lái)尋求一種非正交坐標(biāo)系統(tǒng)的分解方法”。其中的坐標(biāo)軸方向是由二階以及高階統(tǒng)計(jì)量來(lái)決定的。</p><p> 圖2-1中的流程圖中并沒(méi)有考慮噪聲,這種情況下的模型如下:</p><p> 1、無(wú)噪聲ICA模型</p><p> 給定隨機(jī)變量的一組觀測(cè)x1(t)、x2(t)、x3(t)… xn(t),其中t是樣本或者時(shí)間的編號(hào),假設(shè)他們是由獨(dú)立分量線(xiàn)性
30、混合而成的:</p><p><b> (2.1)</b></p><p> 式中的A即為混合系統(tǒng),是一個(gè)未知矩陣。</p><p> 用向量和矩陣符號(hào)方式來(lái)表述上式。隨機(jī)向量x指混合向量,由x1、x2… xn組成,s指元素s1、s2… sn,A指混合矩陣系數(shù)aij。</p><p> 利用向量和矩陣符號(hào),可以
31、將混合模型表示成如下形式:</p><p><b> (2.2)</b></p><p> 如果在計(jì)算中要用到混合系統(tǒng)A中的列向量時(shí),前模型也可以寫(xiě)為如下形式:</p><p><b> (2.3)</b></p><p> 當(dāng)我們將噪聲的情況考慮進(jìn)去時(shí),會(huì)得到以下情況。</p>
32、<p> 2、有噪聲ICA模型</p><p> 現(xiàn)實(shí)中很大部分情況,在語(yǔ)音信號(hào)處理中是有加性噪聲的存在的,我們將上面基本無(wú)噪聲ICA模型擴(kuò)展到有噪聲的情況下,就會(huì)得到如下新的模型:</p><p><b> (2.4)</b></p><p><b> 式中的是噪聲向量。</b></p>
33、<p> 如果噪聲是直接添加在原信號(hào)的情況下時(shí),信號(hào)原噪聲可用如下公式來(lái)表示:</p><p><b> (2.5)</b></p><p> 以上即為有噪聲情況下的ICA模型。</p><p><b> 語(yǔ)音信號(hào)特性與分析</b></p><p><b> 語(yǔ)音的
34、特性</b></p><p> 語(yǔ)音,即語(yǔ)言的物質(zhì)外殼,是人類(lèi)交談的語(yǔ)言符號(hào)的傳輸系統(tǒng)。語(yǔ)音由人的發(fā)聲系統(tǒng)發(fā)出,承載著語(yǔ)言意義。</p><p> 語(yǔ)音的物理基礎(chǔ)主要為音長(zhǎng)、音強(qiáng)、音調(diào)、音色,這是語(yǔ)音的四要素。</p><p> 音長(zhǎng),取決于發(fā)聲持續(xù)時(shí)間的長(zhǎng)短,也可稱(chēng)之為“時(shí)長(zhǎng)”;音強(qiáng)指聲波振動(dòng)幅度的大小,也稱(chēng)“響度”;音調(diào)指聲波的頻率,即每秒鐘振
35、動(dòng)次數(shù)的多少,頻率快則音調(diào)高,慢則音調(diào)低;音色指聲音的本質(zhì)與特色,也稱(chēng)為“音質(zhì)”,是一種聲音相較于其余聲音信號(hào)辨識(shí)度的基本特質(zhì)。</p><p> 語(yǔ)音信號(hào)有如下兩點(diǎn)特性:</p><p><b> 1、短時(shí)平穩(wěn)性</b></p><p> 由對(duì)語(yǔ)音信號(hào)的研究我們可以知道,語(yǔ)音信號(hào)是一種不平穩(wěn)并且會(huì)隨時(shí)間改變的傳輸信號(hào)。而從另一個(gè)角度來(lái)說(shuō)
36、,人的發(fā)聲系統(tǒng)的結(jié)構(gòu)在一定時(shí)間內(nèi)的變化是有限的,在極短的時(shí)間內(nèi)(10~30ms),人的聲帶形狀是基本穩(wěn)定不變的。由此我們可以認(rèn)為語(yǔ)音的特性在較短的時(shí)間內(nèi)是穩(wěn)定不變的,語(yǔ)音的短時(shí)平穩(wěn)性是我們進(jìn)行語(yǔ)音信號(hào)分析以及處理的基礎(chǔ)。</p><p><b> 2、清音和濁音</b></p><p> 語(yǔ)音主要分為清音、濁音以及爆破音三種,它們?cè)诋a(chǎn)生的方式上有極大的差別,在這里
37、我們只討論清音與濁音。</p><p> 清音由隨機(jī)性噪音所產(chǎn)生,在時(shí)域和頻域上并無(wú)明顯周期性及特征,與白噪音相似;而濁音由周期性脈沖產(chǎn)生,在時(shí)域上有非常明顯的周期性,在頻域上濁音的能量主要出現(xiàn)在低頻段中,并且會(huì)有共振峰結(jié)構(gòu)。</p><p><b> 3、語(yǔ)音的時(shí)域特征</b></p><p> 在大部分情況下,發(fā)聲人說(shuō)話(huà)內(nèi)容時(shí)間均不同
38、,毫無(wú)規(guī)律可言,所以語(yǔ)音信號(hào)是隨時(shí)改變的,但是由語(yǔ)音的短時(shí)平穩(wěn)性作為基礎(chǔ),我們才可以在語(yǔ)音處理中進(jìn)行計(jì)算與分析。人在講話(huà)時(shí),句與句、字與字之間必然會(huì)存在一定時(shí)間內(nèi)的間隔,因此從時(shí)域上來(lái)看,語(yǔ)音信號(hào)可以分為兩種音段:有音段和無(wú)音段。通過(guò)檢測(cè)語(yǔ)音信號(hào)中有音段和無(wú)音段,可以去除語(yǔ)音中比較明顯的噪聲,且無(wú)音段越多,語(yǔ)音的稀疏性就越好。</p><p><b> 4、語(yǔ)音的頻域特征</b></
39、p><p> 語(yǔ)音信號(hào)中,頻譜能量一般集中于的區(qū)間中。由于語(yǔ)音信號(hào)主要分為濁音和清音,濁音信號(hào)所含的能量較多,占據(jù)整個(gè)語(yǔ)音信號(hào)的大部分,頻譜集中在低頻段,并且會(huì)表現(xiàn)出周期性;清音信號(hào)出現(xiàn)則較隨機(jī),在頻譜圖上基本與白噪音類(lèi)似。</p><p> 有關(guān)語(yǔ)音信號(hào)處理的基礎(chǔ)知識(shí)</p><p> 根據(jù)所要分析的參數(shù)的不同,語(yǔ)音信號(hào)處理的手段又可分為時(shí)域、頻域、倒頻域等手段
40、。其中時(shí)域分析較簡(jiǎn)潔,并且物理意義十分明確。</p><p> 在進(jìn)行頻譜分析時(shí),我們需要對(duì)語(yǔ)音信號(hào)進(jìn)行加窗處理,通過(guò)一個(gè)波形函數(shù)的分段來(lái)使得每次只需要處理“窗”所分出的數(shù)據(jù)。由于在顯示中,語(yǔ)音信號(hào)一般有一定長(zhǎng)度,而我們并不需要對(duì)所有數(shù)據(jù)進(jìn)行一次性處理。語(yǔ)音信號(hào)一般是在10~30ms之間,我們可將其視為平穩(wěn)的。因此我們可以每次只取一段數(shù)據(jù),進(jìn)行分析,然后取下一段數(shù)據(jù)分析,依此類(lèi)推。</p><
41、;p> 由于人說(shuō)話(huà)的聲音可分為濁音、清音以及靜音三部分,所以我們需要改變?cè)Z(yǔ)音的基音頻率,來(lái)達(dá)到變聲的目的。方法是直接將采樣數(shù)據(jù)乘一個(gè)余弦函數(shù),通過(guò)這種方法可以將原語(yǔ)音信號(hào)的頻段調(diào)到一個(gè)更高的頻段,來(lái)達(dá)到變聲的目的。這種方法適于分析時(shí)域及頻域特效。</p><p> 語(yǔ)音信號(hào)的MATLAB程序</p><p> 輸入語(yǔ)音信號(hào)的MATLAB波形圖分析</p><
42、;p> 在實(shí)驗(yàn)中,我們通過(guò)Matlab來(lái)處理選取的音頻文件,因?yàn)镸atlab僅支持格式的音頻文件讀取及處理,因此我在網(wǎng)上找了三個(gè)wav音頻來(lái)進(jìn)行模擬算法,分別為信號(hào)一:天下無(wú)賊中的對(duì)白;信號(hào)二:龍吼的聲音;信號(hào)三:一段薩克斯音樂(lè),來(lái)確保三種信號(hào)沒(méi)有類(lèi)似性。</p><p> 通過(guò)書(shū)籍以及網(wǎng)絡(luò)查閱,編寫(xiě)了程序來(lái)用matlab對(duì)這三個(gè)音頻信號(hào)進(jìn)行處理及分析,程序如附錄所示。</p><p
43、><b> 圖3-1</b></p><p> 混合語(yǔ)音信號(hào)的MATLAB波形圖分析</p><p> 通過(guò)程序處理,來(lái)將以上三個(gè)原始信號(hào)進(jìn)行混合,然后用來(lái)模擬ICA算法,下為經(jīng)過(guò)程序處理混合后的語(yǔ)音信號(hào)的波形圖分析,程序如附錄所示。</p><p><b> 圖3-2</b></p><
44、p><b> FastICA算法</b></p><p> 語(yǔ)音信號(hào)數(shù)據(jù)的預(yù)處理</p><p> 在大多數(shù)情況下,我們進(jìn)行語(yǔ)音信號(hào)盲處理時(shí)得到的數(shù)據(jù)都具有著相關(guān)性,所以需要在處理之前對(duì)數(shù)據(jù)進(jìn)行球化,因?yàn)榍蚧幚砜扇コ鱾€(gè)觀測(cè)信號(hào)之間的相關(guān)性,使得之后在提取獨(dú)立分量的過(guò)程中更加簡(jiǎn)單一些。并且很多時(shí)候,將進(jìn)行了球化處理的結(jié)果與未進(jìn)行球化處理的結(jié)果來(lái)比較可以發(fā)
45、現(xiàn),前者的收斂性往往更好。</p><p> 對(duì)語(yǔ)音信號(hào)數(shù)據(jù)進(jìn)行預(yù)處理的方式如下:</p><p> 假設(shè)一個(gè)零均值的隨機(jī)向量Z=(Z1,Z2,… ,ZM)T滿(mǎn)足E{ZZT}=I,即可稱(chēng)該向量為球化向量。球化處理即為去相關(guān),與主分量分析是目標(biāo)一致的。在ICA中,對(duì)于均值為0的獨(dú)立原信號(hào)S(t)=[S1(t),S2(t),…,Sn(t)]T,有E{SiSj}=E{Si}E{Sj}=0,當(dāng)
46、i≠j,并且其協(xié)方差矩陣是單位陣cov(S)=I,由此可以得知原信號(hào)S(t)是球化的。接下來(lái)對(duì)觀測(cè)信號(hào)X(t),我們需要尋找一個(gè)線(xiàn)性變換,來(lái)讓在投影到新的子空間后會(huì)變成球化向量,即:</p><p><b> (4.1)</b></p><p> 其中W0為球化矩陣,Z為球化向量。</p><p> 接下來(lái)用主分量分析,通過(guò)計(jì)算樣本向量能
47、夠得到一個(gè)變換:</p><p><b> (4.2)</b></p><p> 上式中代表協(xié)方差矩陣CX的特征值矩陣,U代表協(xié)方差矩陣CX的特征向量矩陣。</p><p> 由此我們可以得知,線(xiàn)性變換W0滿(mǎn)足球化變換的要求,由正交變換的規(guī)律,能夠保證UTU=UUT=I。因此協(xié)方差矩陣能夠?qū)懗扇缦滦问剑?lt;/p><p&
48、gt;<b> (4.3)</b></p><p> 接下來(lái)將X(t)=AS(t)代入到Z(t)=W0X(t),并令,有</p><p><b> (4.4)</b></p><p> 因?yàn)樯鲜街芯€(xiàn)性變換是連接兩個(gè)球化隨機(jī)矢量和,我們可以得知必然是正交變換。假如我們將上式中的視為一個(gè)新的觀測(cè)信號(hào),那么可以認(rèn)為,我們
49、將原混合矩陣A經(jīng)過(guò)球化簡(jiǎn)化成為了一個(gè)新的正交矩陣。</p><p> 正交變換相當(dāng)于是對(duì)多維矢量所在的坐標(biāo)軸進(jìn)行了一次旋轉(zhuǎn)。在多維情況下,混合矩陣A是NN的,經(jīng)過(guò)球化處理之后的新混合矩陣,因?yàn)槠浔旧頌檎痪仃嚕杂啥认陆禐椋钥梢哉f(shuō)球化處理能使我們進(jìn)行ICA問(wèn)題的工作量降低了很多。</p><p> 在ICA問(wèn)題的處理中,進(jìn)行球化處理的方法可以有效降低問(wèn)題的計(jì)算量和復(fù)雜度,并且算法不
50、算困難,通過(guò)傳統(tǒng)PCA即可解決。</p><p> FastICA 算法</p><p> FastICA 算法,也稱(chēng)為固定點(diǎn)(Fixed-Point)算法,是一種快速尋優(yōu)迭代算法,有效的統(tǒng)一了自適應(yīng)與批處理的計(jì)算方式,在每一次迭代過(guò)程中都運(yùn)算了大量的樣本數(shù)據(jù)。FastICA 算法有很多種形式,如基于峭度、基于似然最大、基于負(fù)熵等等,在這里我們主要使用基于負(fù)熵的ICA算法。</p
51、><p> 1997年,芬蘭赫爾辛基大學(xué)學(xué)者 Aapo Hyvärinen等人率先提出了一種基于四階累積量的固定點(diǎn)算法,并且在這之后他們于1999年又提出了一種改進(jìn)的方法——基于負(fù)熵的ICA固定點(diǎn)算法。而在2001年,他們?cè)诔霭娴腎ndependent Component Analysis一書(shū)中,進(jìn)行了進(jìn)一步的簡(jiǎn)化。由于新的算法相較于自適應(yīng)以及批處理算法具有更快的收斂速度,由此這種算法也稱(chēng)“快速I(mǎi)CA算法
52、”(fast ICA,F(xiàn)ICA)。</p><p> 由于FastICA算法是以負(fù)熵最大作為尋找方向的,所以我們需要先確定下負(fù)熵的判斷條件。從信息論理論中,我們可以知道:如果所有隨機(jī)變量均為等方差的情況下,那么其中高斯變量的熵是最大的。所以我們能夠利用這個(gè)性質(zhì)來(lái)度量非高斯性。由中心極限定理,如果一個(gè)隨機(jī)變量X由許多相互獨(dú)立的隨機(jī)變量Si(i=1,2,3,…n)之和組成,那么只要Si具有有限的均值與方差,不論它是
53、哪種分布,隨機(jī)變量X必然比Si更接近高斯分布。所以,在分離的過(guò)程中,能夠使用分離結(jié)果的非高斯性的度量來(lái)表示分離結(jié)果之間的獨(dú)立性。各獨(dú)立分量分離完成的條件就是其非高斯性的度量達(dá)到最大值。</p><p><b> 負(fù)熵的定義:</b></p><p><b> (4.5)</b></p><p> 上式中的是一個(gè)和Y擁
54、有相同方差的高斯隨機(jī)變量;是該隨機(jī)變量的微分熵。其式如下:</p><p><b> (4.6)</b></p><p> 根據(jù)信息論的理論我們可以知道,如果幾個(gè)隨機(jī)變量有相同的方差,那么高斯分布的隨機(jī)變量具有較大的微分熵。當(dāng)上式中的Y具有高斯分布時(shí),;并且的非高斯性越強(qiáng),它的微分熵就會(huì)越小,的值也會(huì)相對(duì)越大,所以我們可以將作為隨機(jī)變量Y的非高斯性測(cè)度。</
55、p><p> 但是因?yàn)橛?jì)算微分熵需要知道Y的概率密度分布函數(shù),而我們并不能得知這點(diǎn),因此只能采取下式作為近似算法:</p><p><b> (4.7)</b></p><p> 其中是均值運(yùn)算;為非線(xiàn)性函數(shù),可以設(shè)g1(y)=tanh(y),或,亦或者。在這里,由于,所以通常取=1。</p><p> 快速I(mǎi)CA算
56、法的目的是找到一個(gè)方法來(lái)使得WTX(Y=WTX)的非高斯性達(dá)到最大。快速I(mǎi)CA算法的推導(dǎo)過(guò)程如下:</p><p> 第一,通過(guò)對(duì)E{G(WTX)}進(jìn)行優(yōu)化來(lái)得到WTX的最大近似負(fù)熵。由Kuhn-Tucker條件可得,E{(WTX)2}=||W||2=1的約束條件下,E{G(WTX)}能再滿(mǎn)足下式的條件點(diǎn)上得到最優(yōu)值:</p><p><b> (4.8)</b>
57、</p><p> 上式中,的值恒定,,W0是優(yōu)化后的W。接下來(lái)用F來(lái)表示(4.8)式左邊的函數(shù),可以得到F的雅克比矩陣JF(W):</p><p><b> (4.9)</b></p><p> 為了簡(jiǎn)化以上的矩陣求逆過(guò)程,我們可以將其近似為(4.9)式的第一項(xiàng)。因?yàn)閿?shù)據(jù)已經(jīng)進(jìn)行了球化處理,有,得到下式:</p><
58、p><b> (4.10)</b></p><p> 由上式的變換,雅克比矩陣變?yōu)榱藢?duì)角陣,較易進(jìn)行求逆計(jì)算。計(jì)算得到以下近似牛頓迭代公式:</p><p><b> (4.11)</b></p><p> 在上式中,是W的新值,,將解進(jìn)行規(guī)范化能有有效提高解的穩(wěn)定性。簡(jiǎn)化后即可得快速I(mǎi)CA算法的迭代公式如下
59、:</p><p><b> (4.12)</b></p><p> 在實(shí)際應(yīng)用中,快速I(mǎi)CA算法所要用到的期望要用其估計(jì)值來(lái)取代。最好的估計(jì)值必然是數(shù)據(jù)相應(yīng)的樣本平均。在理想條件下,快速I(mǎi)CA算法應(yīng)該計(jì)算所有的樣本有效數(shù)據(jù),但是這樣會(huì)大大降低計(jì)算效率。因此,通常在實(shí)際應(yīng)用中,我們要取一部分樣本的平均來(lái)作為估計(jì)值,而這樣做會(huì)使得估計(jì)的精確度很大限度上受制于所取樣本
60、數(shù)目的多少。因此在迭代計(jì)算中,樣本應(yīng)該分別來(lái)選取。如果計(jì)算中的收斂并不理想的話(huà),應(yīng)該相應(yīng)增加樣本數(shù)量來(lái)提高收斂度和估計(jì)的精確度。</p><p> 快速I(mǎi)CA算法分離的基本步驟</p><p> 將觀測(cè)數(shù)據(jù)中心化,使其均值為0:</p><p><b> (4.13)</b></p><p> 對(duì)數(shù)據(jù)球化處理,求
61、自相關(guān)系數(shù)以及對(duì)自相關(guān)系數(shù):</p><p> 自相關(guān)系數(shù): (4.14)</p><p> 對(duì)自相關(guān)系數(shù):
62、 (4.15)</p><p> 球化處理: (4.16)</p><p> 選擇一個(gè)任意正交矩陣作為初始權(quán)矢量W0;</p><p> 用迭代公式更新每一列Wi,令</p><p><b>
63、 (4.17)</b></p><p> 其中非線(xiàn)性函數(shù)g可以使用以下函數(shù):</p><p><b> (4.18)</b></p><p><b> 將W正交化:</b></p><p><b> (4.19)</b></p><p&g
64、t; 如果W不收斂(迭代后的改變更大),則返回第四步。</p><p><b> 混合語(yǔ)音信號(hào)波形圖</b></p><p> 在論文上一部分中,已經(jīng)得到了通過(guò)隨機(jī)混合矩陣進(jìn)行混合的語(yǔ)音信號(hào)的波形圖,如下所示:</p><p><b> 圖4-1</b></p><p><b>
65、 分離語(yǔ)音信號(hào)波形圖</b></p><p> 對(duì)得到的混合語(yǔ)音信號(hào)進(jìn)行ICA分離,通過(guò)matlab編程處理的算法進(jìn)行分析,得到了如下三個(gè)分離出的語(yǔ)音信號(hào)的波形圖,如下圖所示:</p><p><b> 圖4-2</b></p><p><b> 對(duì)比與分析</b></p><p>
66、; 通過(guò)將原信號(hào)與分離信號(hào)放在一起直觀對(duì)比進(jìn)行分析:</p><p><b> 圖4-3</b></p><p> 通過(guò)對(duì)比原語(yǔ)音信號(hào)和進(jìn)行FICA分離之后得到的語(yǔ)音信號(hào)的波形圖以及聽(tīng)取分離后得到音頻文件,我們可以發(fā)現(xiàn)如下幾點(diǎn):</p><p> FICA算法比較有效的對(duì)語(yǔ)音信號(hào)進(jìn)行了分離;</p><p>
67、在多次試驗(yàn)中我們發(fā)現(xiàn)FICA算法不可避免的打亂了輸入信號(hào)和輸出信號(hào)的順序,在上圖這次試驗(yàn)中,原信號(hào)1是對(duì)應(yīng)解混信號(hào)3,原信號(hào)2是對(duì)應(yīng)解混信號(hào)1,原信號(hào)3是對(duì)應(yīng)解混信號(hào)2;</p><p> FICA算法對(duì)信號(hào)的幅值有較大改變,證明FICA算法可用于信號(hào)的放大處理上。</p><p><b> 結(jié)論</b></p><p> 通過(guò)以上的實(shí)驗(yàn)
68、部分,我們能夠得出快速I(mǎi)CA算法可以有效的進(jìn)行語(yǔ)音信號(hào)的分離處理。達(dá)到了實(shí)驗(yàn)的初衷:實(shí)現(xiàn)一個(gè)快速I(mǎi)CA算法,并將其應(yīng)用于語(yǔ)音信號(hào)上,檢驗(yàn)其效果。并且得出了快速I(mǎi)CA算法的幾點(diǎn)特點(diǎn),而且發(fā)現(xiàn)這種方法在語(yǔ)音信號(hào)的放大上存在的潛力。但是本次實(shí)驗(yàn)也有幾點(diǎn)缺點(diǎn),比如沒(méi)有能對(duì)比語(yǔ)音信號(hào)混合和分離的頻譜及幅值等信號(hào)圖,如果這些信息全部可以得到的話(huà)對(duì)本次實(shí)驗(yàn)?zāi)軌蚋姓f(shuō)服力。</p><p> 在本次畢業(yè)設(shè)計(jì)的工作中,我首先閱讀
69、了關(guān)于獨(dú)立分量分析及快速I(mǎi)CA算法的相關(guān)資料,制定了本次畢業(yè)設(shè)計(jì)的工作時(shí)間安排及進(jìn)程。上網(wǎng)學(xué)習(xí)matlab的使用方法及尋找相關(guān)程序信息,收集并編輯可用的語(yǔ)音信號(hào),通過(guò)matlab進(jìn)行算法的編程及調(diào)試,然后進(jìn)行了本次實(shí)驗(yàn),最后撰寫(xiě)論文。</p><p><b> 致謝</b></p><p><b> 主要參考文獻(xiàn)</b></p>
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 畢業(yè)論文設(shè)計(jì)盲信號(hào)處理
- 盲信號(hào)語(yǔ)音分離技術(shù)的研究與實(shí)現(xiàn)——畢業(yè)論文
- 樂(lè)音信號(hào)盲分離.pdf
- 雷達(dá)信號(hào)盲分離系統(tǒng).pdf
- 盲信號(hào)分離算法的研究.pdf
- 盲源分離與盲信號(hào)提取問(wèn)題研究.pdf
- 通信信號(hào)盲分離方法研究.pdf
- 盲信號(hào)分離的DSP實(shí)現(xiàn).pdf
- 盲信號(hào)分離算法及其應(yīng)用.pdf
- 高效盲信號(hào)分離算法的研究.pdf
- 跳頻信號(hào)的盲分離和參數(shù)的盲估計(jì).pdf
- 盲信號(hào)分離算法比較與研究.pdf
- 混沌信號(hào)的盲反卷積和含噪混合信號(hào)的盲分離.pdf
- 水聲信號(hào)處理的盲信號(hào)分離方法研究.pdf
- 基于盲信號(hào)分離的肺音信號(hào)提取研究.pdf
- 多路語(yǔ)音信號(hào)的盲分離.pdf
- 欠定盲信號(hào)分離方法研究.pdf
- 語(yǔ)音混合信號(hào)的盲分離研究.pdf
- 盲信號(hào)分離ICA理論與應(yīng)用.pdf
- 盲信號(hào)分離算法研究與應(yīng)用.pdf
評(píng)論
0/150
提交評(píng)論