版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、作為音樂信息檢索領(lǐng)域內(nèi)的重要分支,樂器識(shí)別的關(guān)鍵在于音色信息的提取。基于樂器音色形成機(jī)制,樂器音色的穩(wěn)定成分主要表現(xiàn)為樂音不同頻率成份的時(shí)間演變。傳統(tǒng)上,音色信息的表達(dá)是通過人工設(shè)計(jì)的音色特征,因此樂器音色主要表現(xiàn)為音色特征時(shí)間序列的演變。本文的研究工作側(cè)重于西洋樂器單音的音色識(shí)別。
首先,本文將經(jīng)過特征選擇與降維的音色特征組合,按多種方式作為淺層分類器的輸入來實(shí)現(xiàn)樂器音色識(shí)別。其中,高斯混合模型與通用背景模型將樂器音色信息建
2、模成概率分布,隱馬爾可夫模型將樂器音色信息建模成隱狀態(tài)概率分布與轉(zhuǎn)移概率。無論哪一種分類器,基于信息增益(Information Gain,IG)原則的特征選擇方法都表現(xiàn)出相對(duì)優(yōu)越的性能。通用背景模型優(yōu)于其他兩類分類器,取得了92.3%的整體準(zhǔn)確率。另外,本文將音色特征時(shí)間序列的時(shí)間整合作為支持向量機(jī)的輸入來實(shí)現(xiàn)樂器音色識(shí)別。對(duì)于不同的音色特征,時(shí)間整合的組合特征,即統(tǒng)計(jì)量與多變量自回歸的組合特征(Combination of Mult
3、ivariate Auto Regression,CMAR),相對(duì)于單純的多變量自回歸的特征(Multivariate Auto Regression,MAR)表現(xiàn)出一定的優(yōu)勢(shì)。同時(shí),基于梅爾頻率倒譜系數(shù)(Mel-Frequency Cepstral Coefficient,MFCC)的時(shí)間整合組合特征取得相對(duì)明顯優(yōu)勢(shì)。此現(xiàn)象源于人工設(shè)計(jì)音色特征的缺陷。對(duì)于MFCC時(shí)間整合的組合特征而言,同樣取得了92.3%的整體準(zhǔn)確率。同時(shí),兩方案都
4、表現(xiàn)出管樂器的識(shí)別性能不如弦樂器的特點(diǎn)。
其次,本文將包含音色特征序列的時(shí)間整合特征,作為深度分類器的輸入來實(shí)現(xiàn)樂器音色識(shí)別。相對(duì)于支持向量機(jī),深度分類器極大地緩解了管樂器識(shí)別效果的不足。同時(shí),深度分類器也提高了樂器識(shí)別的整體性能且抑制了樂器間以及樂器家族間的混淆。與支持向量機(jī)類似,CMAR特征相對(duì)于單純的MAR特征表現(xiàn)出一定優(yōu)勢(shì),且MFCC取得相對(duì)明顯優(yōu)勢(shì)。無論何種音色特征,基于t-分布隨機(jī)領(lǐng)域嵌入(t-Distribute
5、d Stochastic Neighbor Embedding,t-SNE)的聚集效果表現(xiàn)為:(1)隨著深度分類器模型層數(shù)的增加,不同樂器對(duì)應(yīng)的二維矢量特征呈現(xiàn)類內(nèi)聚集以及類間分離的趨勢(shì);(2)對(duì)于CMAR而言,各層聚集效果相對(duì)要好。同時(shí),聚集的效果與樂器識(shí)別測(cè)度的分析結(jié)果保持一致。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)實(shí)現(xiàn)了99.57%的最高整體準(zhǔn)確率;深度神經(jīng)網(wǎng)絡(luò)(Deep Neural N
6、etwork,DNN)則為99.02%。深度分類器通過逐層的非線性變換實(shí)現(xiàn)了對(duì)人工設(shè)計(jì)音色特征的提煉。雖然提煉后的音色特征的音色屬性區(qū)分度更好,但深度模型并沒有完全突破人工設(shè)計(jì)音色特征的壁壘。
最后,本文通過深度卷積自編碼器(Deep Convolutional Auto Encode,DCAE)從樂音時(shí)間波形中直接提取時(shí)域音色特征,并通過CNN與DNN的分類識(shí)別測(cè)度及t-SNE聚類來評(píng)價(jià)時(shí)域音色特征。從評(píng)價(jià)結(jié)果來看,無監(jiān)督訓(xùn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 西洋樂器的音色識(shí)別_797.pdf
- 西洋樂器的音色特征值提取與研究.pdf
- 西洋樂器之管弦樂的分類(附圖)
- 西洋樂器鋼琴音樂民族化創(chuàng)作發(fā)展研究.pdf
- 基于稀疏表示和深度神經(jīng)網(wǎng)絡(luò)模型的西洋樂器自動(dòng)分類方法.pdf
- 基于音頻的數(shù)字媒體中樂器識(shí)別方法研究.pdf
- 基于情感的虛擬樂器的音色建模研究.pdf
- 基于MIDI的樂器控制系統(tǒng)和音符的自動(dòng)識(shí)別方法研究.pdf
- 樂器音色特征的分析.pdf
- 論傳統(tǒng)民族音樂在西洋樂器中的運(yùn)用——以鋼琴作品皮黃為例
- 基于EMD的虹膜識(shí)別方法研究.pdf
- 基于輪廓的形狀識(shí)別方法研究.pdf
- 基于ICA的眉毛識(shí)別方法研究.pdf
- 基于視頻的車型識(shí)別方法的研究.pdf
- 基于視頻的手勢(shì)識(shí)別方法研究.pdf
- 基于筆跡的性別識(shí)別方法研究.pdf
- 基于模型的飛機(jī)識(shí)別方法研究.pdf
- 基于文本的語(yǔ)言識(shí)別方法研究.pdf
- 基于深度學(xué)習(xí)的表情識(shí)別方法研究.pdf
- 基于CNN的字符識(shí)別方法研究.pdf
評(píng)論
0/150
提交評(píng)論