2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩38頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、<p><b>  摘要</b></p><p>  頻譜分析是將信號(hào)表示成不同頻率的正弦分量或虛指數(shù)分量的疊加,即從頻率的角度分析信號(hào),它在聲音處理、圖像處理、數(shù)字音頻、地震勘探等方面有著廣泛的應(yīng)用??焖俑盗⑷~(FFT)算法和S3C2410芯片的出現(xiàn),為頻域分析的實(shí)時(shí)處理提供了有效的解決方案。</p><p>  本文對(duì)基于S3C2410的聲音信號(hào)頻譜分析

2、系統(tǒng)進(jìn)行了開發(fā),主要工作如下:</p><p>  首先,對(duì)聲音信號(hào)的時(shí)域和頻域處理方法進(jìn)行了分析,根據(jù)聲音信號(hào)短時(shí)平穩(wěn)的特點(diǎn),詳細(xì)闡述了其短時(shí)分析方法,并探討了聲音信號(hào)的基音周期檢測(cè)方法。</p><p>  然后,詳細(xì)介紹了本系統(tǒng)采用的主要硬件設(shè)備的功能和特點(diǎn),包括S3C2410芯片。在此基礎(chǔ)上,完成了系統(tǒng)的硬件和軟件設(shè)計(jì),給出了核心程序?qū)崿F(xiàn)過(guò)程及部分原代碼,實(shí)現(xiàn)了一種基于S3C241

3、0的聲音頻譜分析系統(tǒng)。該系統(tǒng)結(jié)構(gòu)簡(jiǎn)單、使用方便,可利用ARM9強(qiáng)大的數(shù)據(jù)處理功能對(duì)聲音信號(hào)進(jìn)行頻譜分析。</p><p>  最后,對(duì)此設(shè)計(jì)方案進(jìn)行了理論分析和仿真實(shí)驗(yàn),并在S3C2410上就一些相關(guān)問(wèn)題做了實(shí)驗(yàn),取得較為滿意的結(jié)果,驗(yàn)證了該系統(tǒng)的可行性。</p><p>  關(guān)鍵詞:聲音頻譜分析;聲音處理;快速傅立葉變換;S3C2410</p><p><b

4、>  Abstract</b></p><p>  Signal is regarded as superposition of different frequency sine component or virtual function component in spectrum analysis.Spectrum analysis is applied extensively in the

5、speech processing,image processing,digital audio,seismic exploration etc..Since fast Fourier transform(FFT)and S3C2410chip appeared,it provides effective solutions for real-time</p><p>  processing of spectr

6、um analysis.</p><p>  This thesis developed spectrum analysis system based on speechS3C2410.Major works areas follows:</p><p>  First,the time—domain processing and frequency-domain processing o

7、f speech signal are introduced in this thesis.According to short·term stationary characteristics of speech signal,the thesis exposition short—term analysis method in detail.And also discuss the pitch detection</p

8、><p>  method based on speech signal.</p><p>  Second.the functions and features of main hardware equipments are introduced.This system include S3C2410 .The systems hardware and software design are

9、 completed and part of source code about core procedure are provided.We developed the spectrum analysis system of speech signal based on S3C2410.The system has a simple structure and is easy to use.while we use the power

10、ful processing function of S3C2410 to analyze speech signal.</p><p>  Finally,the total scheme of this system is demonstrated in theory and is tested on the S3C2410,and results is satisfactory.Analysis resul

11、ts prove that the system is feasible.</p><p>  Key Words:Spectrum Analysis;Speech Processing;FFT;S3C2410</p><p><b>  目錄</b></p><p><b>  摘要1</b></p>&

12、lt;p>  Abstract2</p><p><b>  引言5</b></p><p><b>  1 緒論6</b></p><p>  1.1 課題研究的背景和意義6</p><p>  1.2頻譜分析系統(tǒng)的發(fā)展現(xiàn)狀7</p><p>  1.3本課

13、題的主要任務(wù)8</p><p>  2 聲音信號(hào)的時(shí)域分析9</p><p>  2.1 聲音信號(hào)的抽樣及其數(shù)字化9</p><p>  2.2聲音信號(hào)的時(shí)間依賴10</p><p>  2.3 短時(shí)自相關(guān)函數(shù)11</p><p>  2.3.1 自相關(guān)函數(shù)的定義和性質(zhì)11</p><p

14、>  2.3.2短時(shí)自相關(guān)函數(shù)12</p><p>  2.4基音周期估計(jì)方法12</p><p>  2.4.1 基音檢測(cè)預(yù)處理13</p><p>  2.4.2自相關(guān)法基音檢測(cè)算法13</p><p>  2.4.3基音檢測(cè)的后處理14</p><p>  3 聲音信號(hào)頻域分析15</p&

15、gt;<p>  3.1 頻譜分析原理與方法15</p><p>  3.1.1頻譜分析原理15</p><p>  3.1.2頻譜分析方法17</p><p>  3.2傅里葉變換的原理及算法18</p><p>  3.2.1 傅立葉變換的基本定義18</p><p>  3.2.2離散傅立

16、葉變換19</p><p>  3.2.3快速傅立葉變換20</p><p>  3.3短時(shí)傅立葉變換21</p><p>  3.4基于短時(shí)傅立葉變換的語(yǔ)譜圖22</p><p>  3.5基音同步分析方法23</p><p>  3.5.1 短時(shí)頻譜用于基音檢測(cè)23</p><p&g

17、t;  3.5.2基音同步頻譜分析24</p><p>  4 S3C2410微處理器簡(jiǎn)介26</p><p><b>  4.1概述26</b></p><p>  4.2S3C2410芯片功能及內(nèi)部結(jié)構(gòu)26</p><p>  4.2.1S3C2410芯片功能單元26</p><p>

18、;  4.2.2S3C2410系統(tǒng)管理27</p><p>  4.3ADC和觸摸屏接口操作27</p><p>  4.3.1 結(jié)構(gòu)圖27</p><p>  4.3.2 觸摸屏接口舉例28</p><p>  4.4 功能描述29</p><p>  4.4.1 A/D 轉(zhuǎn)換時(shí)間29</p>

19、<p>  4.4.2 觸摸屏接口工作模式29</p><p>  5頻譜分析系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)31</p><p>  5.1聲音采集軟硬件設(shè)計(jì)方案31</p><p>  5.1.1聲音采集硬件系統(tǒng)設(shè)計(jì)方案31</p><p>  5.1.2聲音采集軟件系統(tǒng)設(shè)計(jì)32</p><p>  5.2基

20、于S3C2410聲音頻譜分析系統(tǒng)的軟件設(shè)計(jì)32</p><p>  5.2.1基于S3C2410處理器器的LCD顯示原理32</p><p>  5.2.2ADC驅(qū)動(dòng)程序設(shè)計(jì)34</p><p>  5.2.3FFT的程序設(shè)計(jì)35</p><p>  5.3運(yùn)行效率分析36</p><p><b>

21、  結(jié)論37</b></p><p><b>  參考文獻(xiàn)38</b></p><p><b>  致  謝39</b></p><p><b>  引言</b></p><p>  目前,嵌入式技術(shù)已經(jīng)廣泛深入的融入到了各行各業(yè)當(dāng)中,日常生活的各個(gè)角落都可以

22、看到嵌入式技術(shù)的身影。相對(duì)于通用PC,嵌入式系統(tǒng)是專門針對(duì)某一特定領(lǐng)域進(jìn)行優(yōu)化設(shè)計(jì)的系統(tǒng),具有軟硬件可裁剪,成本低,體積小,功耗低,可靠性高等特點(diǎn)。手機(jī),PDA,傳真機(jī),打印機(jī),自動(dòng)販賣機(jī)等都是典型的嵌入式系統(tǒng)。這里,簡(jiǎn)單介紹一些嵌入式系統(tǒng)的定義。廣義來(lái)說(shuō),凡是不用于通用目的的可編程計(jì)算機(jī)設(shè)備,就可以算是嵌入式計(jì)算機(jī)系統(tǒng)。狹義而言,嵌入式系統(tǒng)是指以應(yīng)用為核心,以計(jì)算機(jī)技術(shù)為基礎(chǔ),軟硬件可裁剪,適于應(yīng)用系統(tǒng)對(duì)功能、可靠性、成本、體積和功耗

23、要求嚴(yán)格的專用計(jì)算機(jī)系統(tǒng)。嵌入式系統(tǒng)的核心部件是嵌入式處理器,嵌入式處理器目前主要有ARM,Aml86/88,386EX,SC一400,Power PC,68000,MIPS系列等。對(duì)于開發(fā)者而言,可以根據(jù)各自的實(shí)際需求選擇不同的嵌入式處理器。將嵌入式技術(shù)與頻譜分析相結(jié)合,其功能將更加強(qiáng)大。其中ARM處理器核中自帶了DSP功能,既可以執(zhí)行算法還可以進(jìn)行事務(wù)處理,并且支持廣泛的操作系統(tǒng),適應(yīng)于未來(lái)智能化發(fā)展方向。結(jié)合ARM技術(shù)的信號(hào)頻譜分

24、析模塊,集運(yùn)算,顯示,良好的用戶界面為一體,</p><p><b>  1 緒論</b></p><p>  1.1 課題研究的背景和意義</p><p>  自然界的運(yùn)動(dòng)和變化都有它們的固有規(guī)律,其中很多規(guī)律表現(xiàn)為周期性。大至宇宙天體,小至基本粒子,它們的運(yùn)動(dòng)都有周期性。人類社會(huì)的發(fā)展也有周期性,這就是為什么很多歷史事件具有驚人的相似性。不

25、管是簡(jiǎn)單的重復(fù),還是螺旋式的上升,都是周期性的表現(xiàn)。人耳對(duì)聲音敏感的不是聲波本身而是聲波的頻率,例如男聲、女生和低音、高音;人眼對(duì)光敏感的不是光波本身,而是光波的頻率(顏色),例如紅光、綠光。所以,頻率的概念和時(shí)間的概念一樣重要。這就是為什么人們把頻域和時(shí)域相提并論。</p><p>  頻譜分析在生產(chǎn)實(shí)踐和科學(xué)研究中有著廣泛的應(yīng)用。例如,對(duì)各類旋轉(zhuǎn)機(jī)械、電機(jī)、機(jī)床等機(jī)器的主體或部件進(jìn)行實(shí)際運(yùn)行狀態(tài)下的譜分析,可

26、以提供設(shè)計(jì)數(shù)據(jù)和檢驗(yàn)設(shè)計(jì)結(jié)果,或者診斷故障,保證設(shè)備的安全運(yùn)行等。在聲納系統(tǒng)中,為了尋找海洋水面船只或潛艇,需要對(duì)噪聲信號(hào)進(jìn)行頻譜分析,以提供有用信息,判斷艦艇運(yùn)行速度、方向、位置、大小等。因此,對(duì)頻譜分析方法的研究一直是信號(hào)處理技術(shù)中的一個(gè)重要課題。</p><p>  所謂頻譜分析就是頻域分析,頻譜估計(jì)就是周期性估計(jì)。頻譜分析和估計(jì)不僅是揭示信號(hào)特征的重要方法,也是處理信號(hào)的重要手段。這些方法和手段已經(jīng)廣泛地

27、應(yīng)用于通信、雷達(dá)、地震、聲納、生物醫(yī)學(xué)、物理、化學(xué)、音樂(lè)、經(jīng)濟(jì)等領(lǐng)域。地震信號(hào)的處理和股票市場(chǎng)的預(yù)測(cè)就是其中兩個(gè)例子。如此廣泛的應(yīng)用主要?dú)w功于聲音處理理論和技術(shù)的進(jìn)步,因?yàn)榭焖俑盗⑷~變換FFT算法和S3C2410芯片的出現(xiàn),為各式各樣的頻域問(wèn)題,提供了一個(gè)統(tǒng)一的、經(jīng)濟(jì)的、單片繼承的解決辦法。</p><p>  頻譜分析儀,顧名思義它的功能是確定一個(gè)變化過(guò)程(稱為信號(hào))的頻率成份,以及各頻率成份之間的相對(duì)強(qiáng)弱關(guān)系

28、。頻譜儀是和示波器相對(duì)偶的,它們具有同樣的重要性。示波器在時(shí)域里顯示或表征(輸入)信號(hào),而頻譜儀在頻域里顯示或表征(輸入)信號(hào)。</p><p>  傳統(tǒng)的頻譜分析儀主要依靠硬件來(lái)測(cè)量頻率成份,例如用濾波器來(lái)分開各頻率成份。對(duì)模擬濾波器設(shè)計(jì)制造有經(jīng)驗(yàn)的人,不難想象制造高穩(wěn)定度、高精度的這種頻譜分析儀的困難程度。首先是設(shè)計(jì)所得的元件值,幾乎全是非標(biāo)準(zhǔn)的。而且必須先經(jīng)過(guò)“老化”。其次是濾波器中心頻率會(huì)隨時(shí)間、環(huán)境溫度

29、“漂移”,還有調(diào)試等問(wèn)題。利用S3C2410芯片來(lái)設(shè)計(jì)頻譜分析系統(tǒng)則可以較好解決這些問(wèn)題。因?yàn)轭l譜分析主要是依靠軟件來(lái)計(jì)算頻率成份。</p><p>  1.2頻譜分析系統(tǒng)的發(fā)展現(xiàn)狀</p><p>  頻譜分析儀是以模擬或數(shù)字方式顯示信號(hào)頻譜的一類信號(hào)分析儀。頻譜分析儀大體可分為掃描調(diào)諧式頻譜儀及傅立葉分析儀兩大類。掃描調(diào)諧式頻譜儀如掃頻超外差接收機(jī),能分別顯示復(fù)雜信號(hào)中各個(gè)不同頻率分量

30、的幅度,但不能提供相關(guān)相位信息。這類儀器主要用于連續(xù)信號(hào)和周期信號(hào)的頻譜分析。其優(yōu)點(diǎn)是具有大的動(dòng)態(tài)范圍及寬的頻率范圍(5Hz~325kHz),但不適合做瞬態(tài)信號(hào)及超低頻信號(hào)的分析。傅立葉分析儀采用數(shù)字采樣及數(shù)學(xué)變換(以傅立葉變換為基礎(chǔ))技術(shù)得到被測(cè)信號(hào)的傅立葉頻譜。采用傅立葉分析儀能在被測(cè)信號(hào)存在的有限時(shí)間內(nèi),提取信號(hào)的全部頻譜信息,并能顯示頻率、幅值及相位。傅立葉分析儀基本上用于低頻信號(hào)(10uHz~l00kHz)的分析以及要求實(shí)時(shí)快

31、速測(cè)量的場(chǎng)合。與前一類頻譜儀相比,傅立葉分析儀可以十倍、百倍地提高測(cè)量速度并能在超低頻時(shí)保持頻率測(cè)量精度。由于采用傅立葉分析儀能同時(shí)測(cè)量每個(gè)頻率分量的幅值和相位,適合于分析暫態(tài)過(guò)程,測(cè)量多個(gè)信號(hào)的統(tǒng)計(jì)特性,評(píng)價(jià)兩個(gè)或多個(gè)信號(hào)之間的連接特性及相關(guān)性等。</p><p>  掃描調(diào)諧式頻譜分析儀己從早期的單通道頻率響應(yīng)分析儀擴(kuò)展到多通道,其典型代表是英國(guó)公司的1250頻響分析儀,它配上相應(yīng)的擴(kuò)展器可擴(kuò)展到36通道。天

32、津電子儀器廠生產(chǎn)的TDl250具有類似的性能。與傅立葉(FFT)頻譜分析儀相比,這類頻響分析儀只局限于頻響分析,應(yīng)用范圍較窄,其優(yōu)點(diǎn)是具有自動(dòng)抑制噪聲能力,而且頻率范圍寬。目前生產(chǎn)傅立葉分析儀的國(guó)家較多,從占領(lǐng)世界市場(chǎng)的情況看,美國(guó)居首位,其次為同、法、英、丹麥、中國(guó)等。我國(guó)先后引進(jìn)的這類產(chǎn)品HP3562A,HP35660A,HP3567A,CF.920,CF.930/940,B&K2034,SOLARTRONl220等幾十種。

33、具有代表性的是HP3567A多通道頻譜/網(wǎng)絡(luò)分析儀,頻率范圍可達(dá)102.4kHz,動(dòng)態(tài)范圍80dB,精度0.1 dB,最高通道數(shù)可達(dá)16,可實(shí)現(xiàn)譜分析、波形分析及網(wǎng)絡(luò)分析。</p><p>  1965年庫(kù)利一圖基在《計(jì)算數(shù)學(xué)》雜志上發(fā)表了快速傅立葉變換(FFT)算法,F(xiàn)FT和頻譜分析很快發(fā)展成為機(jī)械設(shè)備故障診斷、震動(dòng)分析、無(wú)線電通信、信息圖像處理和自動(dòng)控制等多種學(xué)科重要的理論基礎(chǔ)。傅立葉分析儀的發(fā)展趨勢(shì)是:分析

34、頻段向高頻擴(kuò)展,向多通道、高指標(biāo)、多功能發(fā)展,核心處理芯片用S3C2410,體積更趨小型化。國(guó)內(nèi)自80年代初就有不少單位開始了基于FFT的頻譜分析儀的研制,但由于國(guó)內(nèi)在基本元器件、基本配套件和基本工藝三方面落后于發(fā)達(dá)國(guó)家,因而多數(shù)走的是“以軟件代替硬件”的道路,即以IBM PC/AT等微機(jī)為核心,配上A/D轉(zhuǎn)換板及S3C2410芯片,以微機(jī)軟件為主實(shí)現(xiàn)各種數(shù)字信號(hào)處理功能及顯示功能。因而,具有研制周期短、靈活性好、價(jià)格低的優(yōu)點(diǎn);缺點(diǎn)是高

35、速實(shí)時(shí)性能較差,不適用于惡劣環(huán)境。國(guó)內(nèi)不少單位己生產(chǎn)出不同性能的動(dòng)態(tài)信號(hào)分析系統(tǒng)、FFT信號(hào)分析儀等,在開發(fā)性能優(yōu)越的動(dòng)態(tài)信號(hào)分析軟件包方面,國(guó)內(nèi)一些高等院校具有一定優(yōu)勢(shì)。</p><p>  雖然使用FFT技術(shù)對(duì)瞬態(tài)過(guò)程和平穩(wěn)過(guò)程的頻譜分析己有很長(zhǎng)的歷史,但是,聲音過(guò)程與一個(gè)穩(wěn)定的元音和擦音不同。當(dāng)激勵(lì)和聲道特性改變時(shí),所得到的聲音信號(hào)特性隨時(shí)間發(fā)生變化。因此,適用于平穩(wěn)隨機(jī)信號(hào)的標(biāo)準(zhǔn)傅立葉變換不能直接用于聲音

36、信號(hào)。對(duì)聲音頻譜分析應(yīng)能得到時(shí)變頻譜參數(shù)。但在相對(duì)短的時(shí)隙內(nèi),聲音信號(hào)可看作準(zhǔn)周期性序列。將短時(shí)分析思想應(yīng)用于聲音頻譜分析,可得到聲音時(shí)變頻譜。</p><p>  1.3本課題的主要任務(wù)</p><p>  從上面簡(jiǎn)單的介紹可以看出,傳統(tǒng)的頻譜分析儀不能象通用計(jì)算機(jī)那樣,對(duì)過(guò)去記錄下來(lái)的信號(hào)進(jìn)行非實(shí)時(shí)處理,它只有加上輸入信號(hào)才能進(jìn)行分析。然而,基于S3C2410頻譜儀可以象通用計(jì)算機(jī)一樣

37、用作非實(shí)時(shí)處理?;赟3C2410頻譜儀的缺點(diǎn)是,在目前S3C2410芯片制造技術(shù)的條件下,可以實(shí)時(shí)處理的最高頻率只達(dá)到兆赫的數(shù)量級(jí),更高頻率的信號(hào)可以進(jìn)行非實(shí)時(shí)處理,實(shí)時(shí)處理有待于S3C2410芯片速度的進(jìn)一步提高,或者增加測(cè)量手段。</p><p>  根據(jù)現(xiàn)有的條件,本文所要研究的是一個(gè)基于S3C2410的聲音信號(hào)頻譜分析系統(tǒng)。本系統(tǒng)以ARM9為基礎(chǔ),利用ARM9強(qiáng)大的數(shù)據(jù)處理能力來(lái)對(duì)采集到的聲音信號(hào)進(jìn)行頻

38、譜分析。聲音信號(hào)是時(shí)變信號(hào),然而,聲音信號(hào)的特性隨時(shí)間變化比較緩慢,大致可以認(rèn)為在每10ms至30ms短時(shí)時(shí)間間隔內(nèi)信號(hào)的特性基本不變,可以認(rèn)為是時(shí)不變的。女性的基音頻率從100Hz至500Hz,男性的基音頻率為50Hz至250Hz,頻率分辨率必須兼顧男女性。對(duì)于本頻譜分析系統(tǒng)軟件設(shè)計(jì)是非常重要的一環(huán),我們是基于這樣的思想來(lái)進(jìn)行軟件設(shè)計(jì)的。軟件設(shè)計(jì)主要實(shí)現(xiàn)的功能有基音檢測(cè)、頻譜分析及分析結(jié)果在PC機(jī)屏上顯示。</p>&l

39、t;p>  2 聲音信號(hào)的時(shí)域分析</p><p>  語(yǔ)言是聲音的聲學(xué)表現(xiàn),是人類信息交流最自然、最有效、最方便的手段,也是人類進(jìn)行思維的一種依托。人類開始進(jìn)入了信息化時(shí)代,用現(xiàn)代手段研究聲音處理技術(shù),使人們能夠更加有效地產(chǎn)生、傳輸、存儲(chǔ)和獲取聲音信號(hào),這對(duì)于促進(jìn)社會(huì)的發(fā)展具有十分重要的意義。</p><p>  聲音信號(hào)是一個(gè)時(shí)間序列,進(jìn)行聲音分析時(shí),最直觀的就是它的時(shí)域波形。時(shí)

40、域分析直觀明了,計(jì)算簡(jiǎn)單且運(yùn)算量小(相比后面將要介紹的頻譜分析)。時(shí)域分析提供了最基本也是很重要的用于聲音分析的參數(shù),廣泛用于聲音的預(yù)處理等方面。</p><p>  2.1 聲音信號(hào)的抽樣及其數(shù)字化</p><p>  模擬聲音信號(hào)是連續(xù)信號(hào),無(wú)法被DSP處理。因此聲音處理的第一步是將模擬信號(hào)轉(zhuǎn)化為數(shù)字信號(hào),也就是常說(shuō)的模/數(shù)轉(zhuǎn)換,這其中主要包括兩個(gè)步驟:采樣和量化。</p>

41、<p>  聲音信號(hào)是隨時(shí)間而變的信號(hào),它所占據(jù)的頻率范圍可達(dá)10kHz以上,但是對(duì)聲音信號(hào)清晰度和可懂度有明顯影響的成份,最高頻率約為5.7kHz。但聲音信號(hào)本身冗余度是比較大的,少數(shù)輔音清晰度下降并不明顯影響語(yǔ)句的可懂度。</p><p>  一個(gè)正常人聲音的頻率一般在40Hz~4000Hz的范圍內(nèi),成年男子的聲音頻率較低,婦女和兒童的聲音頻率較高。電話聲音頻率范圍在60Hz~3400Hz左右。

42、現(xiàn)代的聲音合成或識(shí)別系統(tǒng)中,需將聲音頻率的上限提高到10kHz左右。根據(jù)奈奎斯特采樣定律(Nyquist Sampling Theorem),采樣頻率應(yīng)為原始聲音頻率的兩倍以上,考慮到濾波器性能的影響,這個(gè)閾值還應(yīng)該提高。一般來(lái)說(shuō),電話聲音的采樣率為8kHz(G.71 1標(biāo)準(zhǔn)),普通聲音的采樣率在15kHz~20kHz左右。否則,如果采樣率不滿足采樣定律,將會(huì)產(chǎn)生頻譜混疊,使信號(hào)中的高頻失真。</p><p> 

43、 考慮到高頻噪音的存在,為了防止頻率高于二分之一采樣頻率的高頻噪音產(chǎn)生頻譜混疊,通常聲音信號(hào)在采樣前要進(jìn)行一次預(yù)濾波以濾掉高頻噪音。預(yù)濾波還有一個(gè)目的是避免50Hz的電源干擾,因此預(yù)濾波是一個(gè)帶通濾波器,其下截止頻率=50 Hz,上截止頻率根據(jù)需要定義。</p><p>  采樣后的聲音數(shù)據(jù)要能為DSP所存儲(chǔ)和處理還必須進(jìn)行量化處理。量化過(guò)程中,不可避免地會(huì)引入誤差。量化時(shí),如果采用較多的量化級(jí)數(shù)來(lái)記錄樣點(diǎn)的幅度

44、,量化誤差就較小,相應(yīng)的比特(Bit)數(shù)就會(huì)增多。但是這是以增加存儲(chǔ)容量和處理時(shí)的計(jì)算量為代價(jià)的,因此必須根據(jù)應(yīng)用場(chǎng)合合理地選擇量化字長(zhǎng)。</p><p>  2.2聲音信號(hào)的時(shí)間依賴</p><p>  由于人自身的發(fā)音器官的運(yùn)動(dòng),聲音信號(hào)是一種典型的非平穩(wěn)信號(hào)。但是,由于聲音的形成過(guò)程是與器官的運(yùn)動(dòng)密切相關(guān)的,這種物理運(yùn)動(dòng)比起聲音振動(dòng)速度來(lái)要緩慢得多,因此聲音信號(hào)常常可假設(shè)為短時(shí)平穩(wěn)的

45、,即在10~30ms這樣的時(shí)間段內(nèi),其頻譜特性和某些物理特征參量可近似地看作是不變的。幾乎所有的聲音信號(hào)處理方法都是基于這個(gè)假設(shè)。這樣,我們就可以采用平穩(wěn)過(guò)程的分析處理方法來(lái)處理了。以后的幾乎所有的處理方法都立足于這種短時(shí)平穩(wěn)的假定。本章所要討論的短時(shí)能量、短時(shí)平均差幅度以及自相關(guān)函數(shù),都是在這種短時(shí)平穩(wěn)假設(shè)下從時(shí)域來(lái)分析一些物理參量。這種時(shí)間依賴處理的基本手段,是用一個(gè)長(zhǎng)度有限的窗序列{w(m)}截取一段聲音信號(hào)來(lái)進(jìn)行分析,并讓這個(gè)窗

46、滑動(dòng)以便分析任一時(shí)刻附近的信號(hào),其一般表達(dá)式為:</p><p>  (2.1) </p><p>  其中T[·]表示某種運(yùn)算,x(m)為輸入信號(hào)序列。幾種常用時(shí)間依賴處理方法是:</p><p>  當(dāng)T[x(m)]為時(shí),相應(yīng)于短時(shí)能量;</p><p>  當(dāng)T[x(m)]=|sgn[x(m)

47、]一sgn[x(m-1)]|時(shí),就是短時(shí)平均過(guò)零率;</p><p>  當(dāng)T[x(m)]為x(m)x(m+k)時(shí),就是短時(shí)自相關(guān)函數(shù)。</p><p>  式(2.1)是卷積形式的,因此Q可以理解為離散信號(hào)T[x(m)]經(jīng)過(guò)一個(gè)單位沖激響應(yīng)為{w(m)}的FIR低通濾波器產(chǎn)生的輸出,如圖2.1所示。</p><p><b> ?。?lt;/b>&l

48、t;/p><p>  圖2.1短時(shí)分析原理的一般表示</p><p>  由于窗函數(shù)一般取為(x,z)中間大兩頭小的光滑函數(shù),這樣的沖激響應(yīng)所對(duì)應(yīng)的濾波器具有低通特性。其帶寬和頻率響應(yīng)取決于窗函數(shù)的選擇。用得最多的三種窗函數(shù)是矩形(Rectangular)窗、漢明(Hamming)窗和漢寧(Hanning)窗。</p><p><b>  1) 矩形窗 <

49、;/b></p><p>  矩形窗屬于時(shí)間變量的零次冪窗。矩形窗使用最多,習(xí)慣上不加窗就是使信號(hào)通過(guò)了矩形窗。這種窗的優(yōu)點(diǎn)是主瓣比較集中,缺點(diǎn)是旁瓣較高,并有負(fù)旁瓣,導(dǎo)致變換中帶進(jìn)了高頻干擾和泄漏,甚至出現(xiàn)負(fù)譜現(xiàn)象。 </p><p><b>  2) 三角窗 </b></p><p>  三角窗亦稱費(fèi)杰(Fejer)窗,是冪窗的一次方

50、形式。與矩形窗比較,主瓣寬約等于矩形窗的兩倍,但旁瓣小,而且無(wú)負(fù)旁瓣。 </p><p>  3) 漢寧(Hanning)窗 </p><p>  漢寧窗又稱升余弦窗,漢寧窗可以看作是3個(gè)矩形時(shí)間窗的頻譜之和,或者說(shuō)是 3個(gè)sin(t)型函數(shù)之和,而括號(hào)中的兩項(xiàng)相對(duì)于第一個(gè)譜窗向左、右各移動(dòng)了π/T,從而使旁瓣互相抵消,消去高頻干擾和漏能??梢钥闯觯瑵h寧窗主瓣加寬并降低,旁瓣則顯著減小,從

51、減小泄漏觀點(diǎn)出發(fā),漢寧窗優(yōu)于矩形窗.但漢寧窗主瓣加寬,相當(dāng)于分析帶寬加寬,頻率分辨力下降。</p><p>  這些窗函數(shù)都有低通特性。矩形窗的主瓣寬度最小,但其旁瓣高度最高;漢明窗的主瓣最寬,而旁瓣高度最低。漢寧窗和漢明窗的差異在于前者隨頻率增加衰減很快,而后者基本保持一個(gè)常量。矩形窗的旁瓣太高,會(huì)產(chǎn)生嚴(yán)重的泄露現(xiàn)象(Gibbs),因此只在某些特殊場(chǎng)合中采用;漢寧窗衰減太快,低通特性不平滑;漢明窗旁瓣最低,可以

52、有效地克服泄露現(xiàn)象,具有更平滑的低通特性。漢明窗由于其平滑的低通特性和最低的旁瓣高度而得到最為廣泛的應(yīng)用。</p><p>  長(zhǎng)窗具有較高的頻率分辨率,但具有較低的時(shí)間分辨率;短窗的頻率分辨率低,但卻具有較高的時(shí)間分辨率。對(duì)于同一種窗函數(shù),主瓣寬度與窗長(zhǎng)成反比,一般說(shuō)來(lái),窗長(zhǎng)越長(zhǎng),它對(duì)信號(hào)的平滑作用越厲害,如果想要反映變化快的信息,應(yīng)該縮短窗長(zhǎng)。在對(duì)聲音信號(hào)進(jìn)行短時(shí)傅立葉分析時(shí),窗的長(zhǎng)度的選擇必須折中進(jìn)行考慮。

53、一方面,短窗具有較好的時(shí)間分辨率因而能夠提取出聲音信號(hào)中的短時(shí)變化,但同時(shí)卻損失了頻率分辨率。還應(yīng)當(dāng)注意到,聲音信號(hào)的基音周期是有一個(gè)覆蓋范圍的,因此,窗寬的選擇還應(yīng)當(dāng)考慮到這個(gè)因素。</p><p>  2.3 短時(shí)自相關(guān)函數(shù)</p><p>  2.3.1 自相關(guān)函數(shù)的定義和性質(zhì)</p><p>  能量有限信號(hào){x(m,z)}的自相關(guān)函數(shù)定義為: </p

54、><p><b> ?。?.2)</b></p><p>  信號(hào)的自相關(guān)函數(shù)具有一些有用的性質(zhì):</p><p><b>  (1)偶性:</b></p><p>  (2),即零滯后自相關(guān)值最大。</p><p>  (3)若{x(n)}為能量有限信號(hào),則其能量為;</

55、p><p>  2.3.2短時(shí)自相關(guān)函數(shù)</p><p>  這種修正自相關(guān)函數(shù)又稱為協(xié)方差函數(shù),它不具有偶對(duì)稱性,即。自相關(guān)函數(shù)的計(jì)算,除直接計(jì)算之外,還有多種快速算法。例如:快速傅立葉變換法、遞歸計(jì)算法等。目前,高速數(shù)字信號(hào)處理器可以在一個(gè)很短的指令周期內(nèi)做一次乘加運(yùn)算,而且專為卷積運(yùn)算、遞歸運(yùn)算設(shè)計(jì)了一些效率很高的運(yùn)算指令。所以,如果采用數(shù)字信號(hào)實(shí)現(xiàn)自相關(guān)運(yùn)算,常常是直接進(jìn)行計(jì)算反而更加

56、簡(jiǎn)單有效,不必采用結(jié)構(gòu)復(fù)雜的快速算法。自相關(guān)計(jì)算在功率譜估計(jì)、線性預(yù)測(cè)分析和基音檢測(cè)等方面經(jīng)常用到。</p><p>  2.4基音周期估計(jì)方法</p><p>  基音周期(或基音頻率)是聲音信號(hào)的一個(gè)重要參數(shù),在聲音產(chǎn)生的數(shù)字模型中它也是激勵(lì)源的一個(gè)重要參數(shù)。在聲音分析、聲音合成和聲音識(shí)別中,估計(jì)基音周期都是一個(gè)重要任務(wù)。</p><p>  濁音信號(hào)是一種準(zhǔn)周

57、期性信號(hào),其周期稱為基音周期。由于它只是準(zhǔn)周期性的,所以只能采用短時(shí)平均方法估計(jì)其周期,基音周期估計(jì)也常稱為基音周期檢鋇,t](PitchDetection)。</p><p>  前兩節(jié)介紹的自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)都能反映原信號(hào)的周期,因此它們可構(gòu)成兩種最常用的基音檢測(cè)方法。聲音信號(hào)包含十分豐富的諧波分量,基音頻率最低可達(dá)80Hz左右,最高可達(dá)500Hz左右,但基音頻率處在100Hz~200Hz的情況占

58、多數(shù)。因此,濁音信號(hào)可能包含有三四十次諧波分量,而其基波分量往往不是最強(qiáng)的分量。因?yàn)槁曇粜盘?hào)的第一共振峰通常在300Hz~lkHz范圍內(nèi),這就是說(shuō),2~8次諧波成份常常比基波分量還強(qiáng)。豐富的諧波成份使聲音信號(hào)的波形變得非常復(fù)雜,給基音檢測(cè)帶來(lái)了困難,經(jīng)常發(fā)生基頻估計(jì)結(jié)果為其實(shí)際基音頻率的二、三次倍頻或二次分頻的情況。加之還有清濁混雜等情況,使基音檢測(cè)和清濁判別成為一大難題??梢哉f(shuō),至今沒(méi)有一種萬(wàn)能的方法在任何情況下都能準(zhǔn)確可靠地估計(jì)出基

59、音周期。</p><p>  值得注意的是,從估計(jì)基音周期的角度來(lái)看,短時(shí)自相關(guān)函數(shù)所包含的信息有許多是多余的。真正反映基音周期的只是其中少數(shù)幾個(gè)峰值,而其余大多數(shù)都是由于聲道的諧振特性引起的。因此,為了突出反映基音周期的信息同時(shí)壓縮與此無(wú)關(guān)的信息,就應(yīng)該對(duì)聲音信號(hào)進(jìn)行適當(dāng)?shù)念A(yù)處理。</p><p>  2.4.1 基音檢測(cè)預(yù)處理</p><p>  由于聲道的共振

60、峰特性會(huì)對(duì)基音周期造成干擾,為了提高自相關(guān)法和平均幅度差函數(shù)法檢測(cè)基音周期的可靠性,采用兩種預(yù)處理方法對(duì)原始信號(hào)進(jìn)行預(yù)處理:</p><p>  (1)中心削波處理。對(duì)于估計(jì)基音周期真正有用的只是出現(xiàn)在基音周期處的自相關(guān)峰,其余較低的峰都是多余的。有用的自相關(guān)峰是由于聲音信號(hào)中的一些最高峰形成的,這些最高峰是由于準(zhǔn)周期激勵(lì)脈沖產(chǎn)生的;無(wú)關(guān)的峰是聲道對(duì)激勵(lì)脈沖產(chǎn)生的響應(yīng)。基于這種認(rèn)識(shí),完全有理由采用中心削波處理去掉

61、聲音信號(hào)中所有低振幅部分而僅保留高振幅的峰值。</p><p>  (2)先對(duì)聲音信號(hào)進(jìn)行低通濾波,然后計(jì)算短時(shí)自相關(guān)函數(shù)。這樣處理的依據(jù)是,聲音信號(hào)的基音頻率一般都在500Hz以下,即使女高音升C調(diào)最高也不會(huì)超過(guò)lkHz。因此,從只保留基音頻率的角度出發(fā),用低通濾波器事先對(duì)聲音信號(hào)進(jìn)行濾波是有好處的。用一個(gè)通帶為900Hz的線性相位低通濾波器濾除高次諧波分量,這樣處理以后的信號(hào),基本上只含有第一共振峰以下的基波

62、和諧波分量。實(shí)驗(yàn)表明,用這種方法作預(yù)處理,對(duì)改善自相關(guān)法和平均幅度差函數(shù)法的基音檢測(cè)都有明顯的效果。</p><p>  2.4.2自相關(guān)法基音檢測(cè)算法</p><p>  由短時(shí)自相關(guān)函數(shù)的定義可知,對(duì)于準(zhǔn)周期信號(hào),短時(shí)自相關(guān)函數(shù)在基音周期的各個(gè)整數(shù)倍點(diǎn)上有很大的峰值。如果我們能求得第一最大峰值點(diǎn)并計(jì)算其與零點(diǎn)的距離,該距離就是估計(jì)出來(lái)的基音周期。</p><p>

63、;  下面結(jié)合L.R.Rabiner一篇論文中介紹的具體例子來(lái)敘述這種自相關(guān)基音檢測(cè)算法計(jì)算步驟。這里設(shè)信號(hào)的采樣率10kHz,窗序列采用300點(diǎn)長(zhǎng)的矩形窗,連續(xù)分析信號(hào)時(shí)采有10ms(且P 100個(gè)樣點(diǎn))的幀問(wèn)隔,即每相鄰兩幀重疊200個(gè)樣點(diǎn)。截止頻率為900Hz的低通濾波器是一個(gè)20階線性相位的有限沖激響應(yīng)濾波器。下面是對(duì)每一幀進(jìn)行基音周期估計(jì)的計(jì)算步驟:</p><p>  (1)用900Hz低通濾波器對(duì)一

64、幀聲音信號(hào){x(n)}進(jìn)行濾波,并去掉開頭20個(gè)輸出值不用(置0),得到{x(n)};</p><p>  (2)分別求{ x(n)}的前部100個(gè)樣點(diǎn)和后部100個(gè)樣點(diǎn)的最大幅度,并取其中較小的一個(gè),乘以因子0.68作為門限電平;</p><p>  2.4.3基音檢測(cè)的后處理</p><p>  聲音信號(hào)的周期性從波形上觀察可以看得很明顯,但是其形狀表現(xiàn)得比較復(fù)

65、雜,自動(dòng)基音檢測(cè)算法很難做到處處準(zhǔn)確可靠。基音周期估值落在其實(shí)際基音的倍頻或分頻所對(duì)應(yīng)的周期等情況時(shí)有發(fā)生。沒(méi)有任何一種預(yù)測(cè)方法能夠準(zhǔn)確計(jì)算出所有的基音周期。往往大部分的點(diǎn)是比較準(zhǔn)確的,但是也有一部分偏離到標(biāo)準(zhǔn)值的兩倍或一半的點(diǎn),好在聲音信號(hào)的基音頻率通常是連續(xù)地緩慢變化的,因此可以采用某種平滑技術(shù)來(lái)糾正個(gè)別估值的錯(cuò)誤。常用的平滑技術(shù)有三種:</p><p>  (1)中值濾波平滑處理</p>&l

66、t;p>  中值平滑處理是一種采用滑動(dòng)窗的直方圖統(tǒng)計(jì)處理的方法。其基本原理是:設(shè){x(n)}為輸入信號(hào),{y(n)}為中值濾波器的輸出,窗長(zhǎng)為2L+l,那么此處的輸出值y()就是將窗的中心移到處時(shí)窗內(nèi)輸入樣點(diǎn)的中值。所謂中值就是將窗內(nèi)的2L+1個(gè)輸入樣本進(jìn)行統(tǒng)計(jì),求出一個(gè)累計(jì)直方圖,其中1/2分位數(shù)就是中值。</p><p>  例如五點(diǎn)窗,若窗中心處于處時(shí),相應(yīng)的五個(gè)輸入樣本值依次為:x(2),x(-1)

67、,x(),x(+1),x (+2)=4,5,0,6,6。顯然,它們的中值為5,那么中值濾波器的輸出值Y()就是5,而原輸入信號(hào)X()=0,通過(guò)中值濾波得到了糾正。然后濾波窗向后平移一個(gè)樣點(diǎn),用同樣的方法求出窗內(nèi)樣本的中值,即得到Y(jié)(no+1)。如此進(jìn)行下去,中值濾波可以糾正個(gè)別奇異點(diǎn)而不影響周圍的樣點(diǎn)的值。</p><p>  (2)動(dòng)態(tài)規(guī)劃平滑處理</p><p>  動(dòng)態(tài)規(guī)劃平滑處理的

68、基本思想是:定義一個(gè)代價(jià)函數(shù),由每一步尋找最低累計(jì)代價(jià)的路徑,達(dá)到最終累計(jì)總代價(jià)最小。 </p><p>  3 聲音信號(hào)頻域分析</p><p>  大量的實(shí)驗(yàn)表明,人類感知聲音的過(guò)程和聲音本身的頻譜特性關(guān)系密切。人類本身的聽覺(jué)對(duì)聲音的頻譜特性更為敏感。兩段時(shí)域上相差很大的聲音如果具有類似的頻譜特性,人類在感知它們時(shí)的感覺(jué)也是相似的。聲音信號(hào)的頻譜具有非常明顯的語(yǔ)言聲學(xué)意義,能反映一些非

69、常重要的聲音特征,比如共振峰頻率和帶寬等。因此,對(duì)聲音信號(hào)進(jìn)行頻譜分析,是認(rèn)識(shí)聲音信號(hào)和處理聲音信號(hào)的重要方法。</p><p>  傅立葉變換是分析線性系統(tǒng)和平穩(wěn)信號(hào)穩(wěn)態(tài)特性的強(qiáng)有力手段,它在許多工程和科學(xué)領(lǐng)域中得到了廣泛的應(yīng)用。這種以復(fù)指數(shù)函數(shù)為基函數(shù)的正交變換,理論上很完善,計(jì)算上很方便,概念上易于為人們理解,在聲音處理領(lǐng)域也是一個(gè)非常重要的工具。</p><p>  聲音信號(hào)是一種

70、典型的非平穩(wěn)信號(hào),但是其非平穩(wěn)性是由發(fā)音器官的物理運(yùn)動(dòng)過(guò)程而產(chǎn)生的。這個(gè)物理運(yùn)動(dòng)過(guò)程與聲波振動(dòng)的速度比起來(lái)要緩慢得多,因此我們可以假定它在10ms~30ms這樣短的時(shí)間段中是平穩(wěn)的,用前一章所述的時(shí)間依賴方法來(lái)進(jìn)行分析處理。短時(shí)傅立葉分析,就是在基于短時(shí)平穩(wěn)的假定下,用穩(wěn)態(tài)分析的方法處理非平穩(wěn)信號(hào)的一種方法,也可稱為時(shí)間依賴傅立葉變換。</p><p>  3.1 頻譜分析原理與方法</p><

71、;p>  3.1.1頻譜分析原理</p><p>  頻譜分析主要是指離散傅立葉變換的譜分析。眾所周知,任何信號(hào)都可以視作無(wú)限個(gè)不同頻率的正弦交變信號(hào)的疊加,在數(shù)學(xué)上它由傅立葉序列來(lái)表述。假設(shè)有一周期信號(hào)x(f),其周期為乃那么它的傅立葉序列為:</p><p><b>  (3.1)</b></p><p>  式中,,為傅立葉系數(shù),為

72、各次諧波的頻率。</p><p>  對(duì)于某一瞬時(shí)態(tài)信號(hào)可以設(shè)定其周期丁趨向無(wú)窮大,這時(shí)序列可以化為:</p><p><b>  (3.2)</b></p><p>  這里傅立葉系數(shù)變?yōu)檫B續(xù)的頻率函數(shù):</p><p><b>  (3.3)</b></p><p>  

73、式(3.3)即是著名的傅立葉變換,式(3.2)是傅立葉反變換,如果將信號(hào)x(f)經(jīng)A/D采樣變成數(shù)字信號(hào)序列x(t),則對(duì)照式(3.3)可以得出離散傅立葉變換及其逆變換如式(3.4)和(3.5)所示:</p><p><b>  (3.4)</b></p><p><b>  (3.5)</b></p><p>  式中n

74、,k為序列號(hào),N為數(shù)字信號(hào)序列的點(diǎn)數(shù)。</p><p>  若A/D轉(zhuǎn)換的頻率是Z,且采樣點(diǎn)數(shù)為偶數(shù),則序列號(hào)k=N/2處代表的頻率為Z/2,序列號(hào)k=l處代表的頻率為T/N,其它后代表的頻率以此規(guī)則類推。當(dāng)采樣點(diǎn)是2的整數(shù)次方時(shí),即可用著名的基2的FFT算法進(jìn)行快速運(yùn)算,獲得Y(k)。</p><p>  一般Y(k)的值是復(fù)數(shù),對(duì)其求模即得該頻率下譜的幅度,一系列的模則構(gòu)成x(n)的離

75、散化的幅度譜(即通常講的頻譜),基于FFT的譜分析稱為線性譜分析。當(dāng)k固定時(shí)的Y(k)的虛部與實(shí)部之比即為該頻率成份下的相位,由此還可以構(gòu)成相位譜。如果獲得x(n)點(diǎn)數(shù)不足2的整數(shù)次方,最簡(jiǎn)單的辦法就是在實(shí)際的x(n)后補(bǔ)若干零值,使其滿足總點(diǎn)數(shù)為2的整數(shù)次方,這樣就可以用常規(guī)的FFT算法。但由于增加了FFT的計(jì)算長(zhǎng)度,耗時(shí)量會(huì)顯著加大,因此在目標(biāo)信號(hào)的時(shí)間動(dòng)態(tài)許可范圍內(nèi)應(yīng)盡可能減少x(n)的點(diǎn)數(shù)。另外,對(duì)x(n)的A/D采樣頻率也要滿

76、足奈奎斯特抽樣定律,該定理描述如下:</p><p>  假設(shè)x(f)是一個(gè)時(shí)間函數(shù),它的最高頻率為Z(截止頻率),則若|f|>時(shí),x(t)的傅立葉變換X(f)=0,那么,該函數(shù)x(t)可以完全由時(shí)間間隔的時(shí)域抽樣(或者說(shuō)抽樣頻率)序列唯一確定,即函數(shù)x(t)可以表示為:</p><p><b>  (3.6)</b></p><p> 

77、 顯然,抽樣定理包含著兩個(gè)限制,一是頻率函數(shù)的帶寬限制,即時(shí),x(f)=0;一是對(duì)抽樣間隔的限制,即=1/(2),它也是最大的抽樣問(wèn)隔。這種等間隔的抽樣又叫奈奎斯特(Nyquist)抽樣,叫做奈奎斯特抽樣頻率。抽樣定理指的是采樣頻率。實(shí)際應(yīng)用中,一般保留一定的余量,取得比奈奎斯特采樣頻率高于此。</p><p>  3.1.2頻譜分析方法</p><p>  進(jìn)行FFT運(yùn)算時(shí),一般先用各種

78、窗函數(shù)給x(n)加權(quán),然后再進(jìn)行FFT運(yùn)算,這樣可在一定程度上改善起伏現(xiàn)象。FFT的另一個(gè)不足是其分辨率往往較低,即使在x(n)后補(bǔ)上大量的零點(diǎn),也只能減小FFT運(yùn)算上Y(k)的離散化間隔,實(shí)際上并不能幫助使用者明確頻譜的真正細(xì)節(jié),且增加零點(diǎn)數(shù)造成FFT運(yùn)算的點(diǎn)數(shù)增加,使運(yùn)算速度大大降低。鑒于FFT分辨力不足的問(wèn)題,可以用高分辨力的非線性譜分析方法。非線性譜分析的方法很多,如AR模型方法、自回歸滑動(dòng)平均(ARMA)模型方法、量小交叉嫡方

79、法等,其中AR模型方法問(wèn)世較早,研究與應(yīng)用都比較成熟,且有多種較快運(yùn)算速度的算法。</p><p>  除此之外,由于傅立葉變換無(wú)時(shí)間局部信息,也就是說(shuō),信號(hào)x(f)任何時(shí)刻的微小變化都會(huì)牽動(dòng)整個(gè)頻譜;反過(guò)來(lái),任何有限頻段上的信息都不足以確定在任意時(shí)間小范圍內(nèi)的函數(shù)x(t)。為了了解實(shí)時(shí)信號(hào)的局部特性,發(fā)展起來(lái)了預(yù)先加窗的辦法,使頻譜反映時(shí)間局部特性。因此,出現(xiàn)了許多基于傅立葉變換的譜分析方法。經(jīng)常應(yīng)用于工程實(shí)踐

80、的除了FFT,還有短時(shí)傅立葉變換(STFT)、子波變換(WT)和ZOOM-FFT。從數(shù)學(xué)上看,三種不同的變換都是將所研究的信號(hào)在一組特定基函數(shù)上的分解問(wèn)題,但由于基函數(shù)不同,就有了不同的分辨率特征。變換的分辨率特性完全取決于基函數(shù)的特征,即基函數(shù)的頻率帶寬和持續(xù)時(shí)間。</p><p>  FFT是在單頻上做分解,即=0,頻率分辨率可以任意設(shè)置,但基函數(shù)在時(shí)問(wèn)軸上無(wú)限延伸=,故無(wú)時(shí)間分辨率。STFT法一旦窗函數(shù)選定

81、,基函數(shù)的包絡(luò)不再改變,只是載波改變,其頻寬和時(shí)寬也就確定,所以,時(shí)間和頻率分辨率在整個(gè)時(shí)頻平面固定不變。而且,由于一個(gè)窄的波形有一個(gè)寬的譜,而一個(gè)寬的波形有一個(gè)窄的譜,波形和頻譜的寬度兩者不能同時(shí)兼顧,即滿足下式所揭示的“不確定性原理"或稱“測(cè)不準(zhǔn)原理”:</p><p><b>  (3.7)</b></p><p>  在分析信號(hào),尤其是在分析聲音和圖

82、像信號(hào)的時(shí)候,不同的頻率上需要有不同的分辨率,低頻處應(yīng)該有較高的頻率分辨率,而在高頻段頻率分辨率可以降低,使頻率分辨率隨頻率f而改變?;诖搜芯勘尘?,為了解決FFT和STFT中時(shí)間分辨率與頻率分辨率之間的矛盾,提出了子波變換。子波變換(WT)的公式如下:</p><p><b> ?。?.8)</b></p><p>  WT的基函數(shù)是基本子波的伸縮和平移,取基本子波

83、,g(t)為高斯函數(shù),令,若a減小,包絡(luò)壓縮,同時(shí)f增大,載頻升高,也增大。</p><p>  而ZOOM.FFT是用“局部細(xì)化放大"的方法,使感興趣的重點(diǎn)頻區(qū)得到較高的分辨率,若輪流按頻區(qū)逐段細(xì)化,還可以使整個(gè)頻譜圖得到詳細(xì)的分析。目前有兩種細(xì)化方法,一種是對(duì)某一局部的波形做簡(jiǎn)單的放大,它并不提高分辨率,比較容易實(shí)現(xiàn):另一種是將局部頻段重新處理后得到的較原來(lái)頻譜圖上分辨率遠(yuǎn)為提高的頻譜圖。</

84、p><p>  應(yīng)用最廣泛的是移頻式ZOOM-FFT方法,它基于DFT變換的移頻原理,將信號(hào)乘以單位旋轉(zhuǎn)因子后,就能把頻率移至所需細(xì)化的處,頻率分量停留在頻率為0處的位置上。這樣就形成了一個(gè)以為頻率起點(diǎn)的新的信號(hào),然后再將由此做始點(diǎn)的頻率截出感興趣的頻段,按普通FFT工作步驟做頻譜圖,得到的是以為起始點(diǎn),有限范圍頻段的細(xì)化頻譜。</p><p>  綜上所述,目前發(fā)展起來(lái)了很多種頻譜分析方法,

85、這些方法都以傅立葉變換為基礎(chǔ)的,可以根據(jù)不同的檢測(cè)目的和要求來(lái)選用不同的方法。</p><p>  3.2傅里葉變換的原理及算法</p><p>  3.2.1 傅立葉變換的基本定義</p><p>  一個(gè)波形的傅立葉變換,其實(shí)質(zhì)是把這個(gè)波形是把這個(gè)波形分解成許多不同頻率的正弦波之和。如果被分解的波形為x(f),那么傅立葉變換在數(shù)學(xué)上可表示成:</p>

86、<p><b>  (3.9)</b></p><p>  式中t表示時(shí)間,f表示頻率。x(f)稱為x(t)的傅立葉變換,又把x(f)叫做時(shí)間函數(shù)的頻譜。</p><p>  式(3.9)是對(duì)時(shí)間域和頻率域而言的,它可以看作是時(shí)間函數(shù)x(t)在頻率域上的表示。顯然,頻率域上所包含的信息和時(shí)間域上所包含的信息應(yīng)該是完全相同的,唯一的差別只是形式不同而己。&

87、lt;/p><p>  通常,x(f)是頻率f的一個(gè)復(fù)函數(shù),即:</p><p>  R(f)和I(f)分別為實(shí)部和虛部,則振幅譜|x(f)|表示為:</p><p><b>  (3.10)</b></p><p><b>  相位函數(shù)表示為:</b></p><p><

88、b> ?。?.11)</b></p><p>  傅立葉逆變換定義為:</p><p><b> ?。?.12)</b></p><p>  式(3.12)表明,如果已知一個(gè)時(shí)間窗函數(shù)的傅立葉變換,那么就能夠確定該時(shí)間函數(shù)。式(3.9)和式(3.12)叫做傅立葉變換對(duì)。傅立葉變換對(duì)的存在需滿足時(shí)間函數(shù)x(t)在下式意義上是可積

89、的,即。</p><p>  以上是對(duì)無(wú)限長(zhǎng)信號(hào)截取無(wú)限個(gè)樣本值進(jìn)行計(jì)算的,只能進(jìn)行離散、有限長(zhǎng)運(yùn)算,所以實(shí)現(xiàn)傅立葉變換,就必須對(duì)(3.9)中無(wú)限長(zhǎng)信號(hào)x(t)做截?cái)?,即截取有限長(zhǎng)一段信號(hào),并且對(duì)x(t)和x(f)做時(shí)域、頻域上的離散化,截取有限個(gè)樣本點(diǎn)。對(duì)信號(hào)做如此處理后進(jìn)行的傅立葉變換稱作離散傅立葉變換(DFT)。</p><p>  3.2.2離散傅立葉變換</p>&

90、lt;p>  對(duì)x(t)進(jìn)行等間隔采樣離散化,用x(n)表示,且設(shè)x(n)是一個(gè)周期為N的周期序列,則x(n)的離散傅立葉變換x(k)后為:</p><p><b>  (3.13)</b></p><p>  (k=0,1…..,N) (3.14)</p><p>  式中,稱為旋轉(zhuǎn)因子。</p>

91、<p>  進(jìn)行這樣的處理以后,會(huì)產(chǎn)生一定的誤差,但在實(shí)際中,很多情況下,x(t)是帶限信號(hào),即:x(t)=0(t>)。根據(jù)抽樣定理,當(dāng)頻域和時(shí)域的采樣點(diǎn)足夠多時(shí),這些離散信號(hào)時(shí)完全能夠代替連續(xù)信號(hào),所以實(shí)現(xiàn)傅立葉變換時(shí)完全有可能的。</p><p>  如果時(shí)域信號(hào)x(t)在處是連續(xù)的,為抽樣間隔,那么,存在如下定理:</p><p>  定理1 函數(shù)x(t)以時(shí)間間隔t

92、抽樣后的譜是一個(gè)周期為l/t的周期函數(shù)。</p><p>  定理2頻譜x(f)以間隔f抽樣后所得到的傅立葉變換(即時(shí)域函數(shù))也是一個(gè)周期函數(shù)。</p><p>  定理1和定理2表明,時(shí)域的抽樣相應(yīng)于頻域的周期化,頻域的抽樣也相應(yīng)于時(shí)域的周期化,因此有定理3。</p><p>  定理3 函數(shù)x(t)以抽樣間隔抽樣的抽樣序列x(n)的譜,就是將函數(shù)x(t)的譜X(

93、f)以周期為l/進(jìn)行周期延拓。</p><p>  x(f)的周期延拓,就是把x(f)以周期l/移動(dòng)到整個(gè)頻率軸上。</p><p>  DFT是基于周期性的采樣數(shù)據(jù)而提出的,而事實(shí)上,這個(gè)周期是由采樣的時(shí)間窗所指定的。對(duì)在某個(gè)時(shí)間窗里的采樣數(shù)據(jù)做變換,這個(gè)時(shí)間窗就被認(rèn)為是信號(hào)的周期了。一旦選定了一個(gè),變換所得的譜的最小間隔就確定了。而且對(duì)這個(gè)譜再進(jìn)行反變換所重建的信號(hào),將具有以為間隔的周

94、期性。因此,DFT的一項(xiàng)重要工作就是選取時(shí)間窗。</p><p>  另外也應(yīng)該看到,如果信號(hào)x(n)有N個(gè)離散的數(shù)據(jù)點(diǎn),那么要想得到Ⅳ個(gè)獨(dú)立的正弦波幅值,其計(jì)算量正比于,即做次乘法。當(dāng)N值較大時(shí),其運(yùn)算量也大的驚人。為了解決這一問(wèn)題,就要使用快速傅立葉變換的算法(FFT)。</p><p>  3.2.3快速傅立葉變換</p><p><b>  根據(jù)D

95、FT的定義:</b></p><p><b> ?。?.15)</b></p><p>  式中,x(n)是N點(diǎn)離散時(shí)間序列,X(k)是x(n)的傅立葉變換。由上式可見,對(duì)于k為某一確定值,計(jì)算一個(gè)X(k),需要N次復(fù)數(shù)乘法運(yùn)算和(N一1)次復(fù)數(shù)加法運(yùn)算。若要計(jì)算N點(diǎn)x(后),則需要2次復(fù)數(shù)乘法和(N一1)次復(fù)數(shù)加法。計(jì)算量很大。</p>&

96、lt;p>  根據(jù)不同的實(shí)現(xiàn)方法,發(fā)展起來(lái)多種FFT算法,其基本原理是利用三角函數(shù)的周期性和對(duì)稱性,將較長(zhǎng)序列的DFT逐次分解為較短序列的DFT,從而減少運(yùn)算量。這種方法可以使傅立葉變換的復(fù)數(shù)乘法運(yùn)算量從次減少到(N/2)次。當(dāng)N=1024時(shí),運(yùn)算量節(jié)省近200倍。這種分解基本上分為兩類:一類是將時(shí)間序列x(n)進(jìn)行逐次分解,由此得到的FFT算法稱為按時(shí)間抽取算法;另一類是將傅立葉變換序列x(k)進(jìn)行分解,叫做按頻率抽取算法。對(duì)這

97、兩種算法,庫(kù)利一圖基和桑德一圖基進(jìn)行了理論推導(dǎo),故又稱庫(kù)利一圖基算法和桑德一圖基算法。對(duì)每一算法,按基本的蝶形運(yùn)算的構(gòu)成又分為基2、基4、基8以及任意因子等的FFT算法。</p><p>  3.3短時(shí)傅立葉變換</p><p>  短時(shí)傅立葉分析是分析緩慢時(shí)變頻譜的一種簡(jiǎn)便方法,在聲音分析中已經(jīng)得到廣泛應(yīng)用。其方法是,先將聲音信號(hào)分成短段,再將各短段進(jìn)行傅立葉變換。各聲音段可以認(rèn)為是從各

98、個(gè)不同的平穩(wěn)信號(hào)波形中截取出來(lái)的,各段聲音的短時(shí)頻譜就是各個(gè)平穩(wěn)信號(hào)波形的頻譜的近似。</p><p>  信號(hào){x(n)}的短時(shí)傅立葉變換的定義為:</p><p><b> ?。?.16)</b></p><p>  其中{w(n)}為一窗序列,顯然是個(gè)二維函數(shù),也稱時(shí)頻函數(shù)。</p><p>  我們可以從兩個(gè)角度

99、來(lái)理解時(shí)頻函數(shù)的物理意義:</p><p>  第一種理解是:當(dāng)n固定時(shí),例如n=,則是將窗函數(shù)的起點(diǎn)移至處截取信號(hào)x(n),再做傅立葉變換而得到的一個(gè)頻譜函數(shù)。這是直接由式(3.28)從頻率軸方向來(lái)理解的。第二種解釋是從時(shí)間軸方向來(lái)理解:當(dāng)頻率固定時(shí),例如w=wk,則可看作是信號(hào)經(jīng)過(guò)一個(gè)中心頻率為的帶通濾波器后產(chǎn)生的輸出。這是因?yàn)槭?3.28)中窗序列函數(shù){w(n)}通常具有低通頻率響應(yīng),而的傅立葉變換為,這里

100、的指數(shù)對(duì)x(n)的調(diào)制作用,是使其頻譜產(chǎn)生移位,即將x(n)頻譜中對(duì)應(yīng)于頻率的分量平移到零頻。</p><p>  3.4基于短時(shí)傅立葉變換的語(yǔ)譜圖</p><p>  短時(shí)傅立葉變換幅度的平方是信號(hào)x(n)在時(shí)間n處的頻譜能量密度函數(shù)。因?yàn)楫?dāng)我們把x(n)看成是能量有限信號(hào)時(shí),其頻譜能量在頻域是連續(xù)分布的,只能以密度函數(shù)的形式給出。不難證明,它是信號(hào)x(n)的短時(shí)自相關(guān)函數(shù)的傅立葉變換,

101、即:</p><p><b>  (3.17)</b></p><p>  其中短時(shí)自相關(guān)函數(shù)定義為:</p><p><b>  (3.18)</b></p><p>  在實(shí)際計(jì)算時(shí),一般用離散傅立葉代替連續(xù)傅立葉變換,這就需要對(duì)信號(hào)進(jìn)行周期性擴(kuò)展,也就是把x(n)w(n)看成是某個(gè)周期性信號(hào)的

102、一個(gè)周期,然后對(duì)它作離散傅立葉變換,這時(shí)得到的是功率譜。值得注意的是,如果窗長(zhǎng)為L(zhǎng),那么x(n)w(n)的長(zhǎng)度為L(zhǎng),則的長(zhǎng)度為2L。如果我們對(duì)x(n)w(n)以L為周期進(jìn)行擴(kuò)展的話,在自相關(guān)域就會(huì)出現(xiàn)混疊,即這個(gè)周期函數(shù)的循環(huán)相關(guān)在一個(gè)周期中的值就與線性相關(guān)的值不同了,這樣得到的功率譜只是真正功率譜的一組欠采樣,即L個(gè)采樣值。若想得到功率譜的全部2L個(gè)值,可以在x(n)w(n)之后補(bǔ)L個(gè)零,將它擴(kuò)展成為周期為2L的信號(hào)再作離散傅立葉變換

103、。這時(shí)的循環(huán)相關(guān)與線性相關(guān)才是等價(jià)的。</p><p>  能量密度譜函數(shù)(或功率譜函數(shù))是二維的非負(fù)實(shí)值函數(shù)。用時(shí)間n作為橫坐標(biāo),w作縱坐標(biāo),將的值表示為灰度級(jí)所構(gòu)成的二維圖像就是語(yǔ)譜圖(Spectrogram)。這種反映聲音信號(hào)動(dòng)態(tài)頻譜特性的時(shí)頻圖在聲音分析中有重要的實(shí)用價(jià)值,被稱為可視語(yǔ)言。語(yǔ)譜圖的時(shí)間分辨率和頻率分辨率是由所用窗函數(shù)的特性決定的。我們?nèi)钥赏ㄟ^(guò)前節(jié)兩種解釋來(lái)估計(jì)它的時(shí)間、頻率分辨率。<

104、/p><p>  先看頻率分辨率。按前節(jié)第一種解釋,假定時(shí)間固定,例如n=no,對(duì)信號(hào)乘以窗函數(shù)w(n)的作用,在頻域相當(dāng)于用以w(n)的頻率響應(yīng)W()與信號(hào)頻譜相卷積。設(shè)W()的通帶帶寬為b,那么可分辨的頻率寬度即為b。這就是說(shuō),卷積作用將使相隔的頻率差小于b的任何兩個(gè)譜峰都合并為一個(gè)單峰。因?yàn)閷?duì)于同一種窗函數(shù)而言,其通帶寬度與窗長(zhǎng)是成反比的,因此,如果希望頻率分辨率高,則窗長(zhǎng)應(yīng)盡量長(zhǎng)一些。</p>

105、<p>  我們?cè)賮?lái)看時(shí)間分辨率。按前節(jié)第二種解釋,假定頻率固定,例如w=k,對(duì)信號(hào)乘以窗函數(shù)w(n)的作用,相當(dāng)于對(duì)時(shí)間序列x(n)作低通濾波。其輸出信號(hào)的帶寬就是w(n)的帶寬b。根據(jù)采樣定理,對(duì)這種信號(hào)只需以2b為采樣率就可以充分反映,可見它所具有的時(shí)問(wèn)分辨寬度為1/(2b)。因此,如果希望時(shí)間分辨率高,則窗長(zhǎng)應(yīng)盡量取短一些。由此可見,短時(shí)傅立葉變換的時(shí)間分辨率和頻率分辨率是相互矛盾的,這是短時(shí)傅立葉變換本身的固有弱點(diǎn)。

106、為了彌補(bǔ)這一缺點(diǎn),聲音分析中一般同時(shí)作兩種語(yǔ)譜圖,一種是窄帶語(yǔ)譜圖,另一種是寬帶語(yǔ)譜圖。前者用于獲得高的頻率分辨率,后者用于獲得高的時(shí)間分辨率。短時(shí)傅立葉分析一般采用漢明窗作為分析窗,與窄帶語(yǔ)譜圖和寬帶語(yǔ)譜圖相應(yīng)的窗長(zhǎng)分別為51.2ms和6.4ms,由于ls長(zhǎng)的漢明窗的帶寬約為1.91Hz,因此51.2ms和6.4ms的漢明窗的頻率分辨寬度分別為1.91/0.0512≈37.5 Hz和1.91/0.0064≈298Hz。這些分析參數(shù)的選

107、取原則,在聲音識(shí)別的特征提取中也是有參考價(jià)值的。</p><p>  3.5基音同步分析方法</p><p>  對(duì)于真正的周期性信號(hào),只有用整數(shù)倍周期長(zhǎng)度的矩形窗截取信號(hào)來(lái)進(jìn)行分析,即基音同步分析,才能準(zhǔn)確地得到它的諧波譜。如果用非整數(shù)倍周期長(zhǎng)的窗或非矩形窗截取信號(hào),諧波泄露現(xiàn)象總是存在的,只不過(guò)是其嚴(yán)重程度可大可小而己。真周期性信號(hào)的合成只要考慮如何把一個(gè)周期合成好,其余復(fù)制就是了,因

108、此這樣進(jìn)行合成的效率是很高的。盡管實(shí)際聲音信號(hào)都不是真周期性的,但實(shí)踐證明,基音同步分析與合成的思想在聲音處理中是十分有用的。要進(jìn)行基音同步分析,首先要能準(zhǔn)確地檢測(cè)到基音周期,下面我們介紹一種高精度的基音檢測(cè)算法,然后再介紹基音同步分析方法。</p><p>  3.5.1 短時(shí)頻譜用于基音檢測(cè)</p><p>  時(shí)域基音周期檢測(cè)精度很難做到比±1個(gè)樣本的誤差還小,而利用短時(shí)頻

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論