音樂要素自動分析關(guān)鍵技術(shù)研究.pdf_第1頁
已閱讀1頁,還剩170頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、音樂,這種人類最古老、最普及的藝術(shù)形式,是人們的文化與精神生活中不可或缺的一部分。隨著現(xiàn)今互聯(lián)網(wǎng)時代的到來,音樂已經(jīng)成為一種以海量、無序、分散為特點的全新的網(wǎng)絡(luò)音樂形式,這也使研究對海量的網(wǎng)絡(luò)音樂(數(shù)據(jù)庫)資源進行搜索與瀏覽的音樂信息檢索技術(shù)成為了熱點課題。與此同時,在音樂教學(xué)與創(chuàng)作領(lǐng)域,呼喚音樂理論的計算化、智能化應(yīng)用來輔助原始的教學(xué)與創(chuàng)作方式的需求也日益增加,從而使基于樂理的音樂智能計算技術(shù)的研究具有急迫性。而上述兩種技術(shù)的一個共同

2、關(guān)鍵的核心研究問題是:如何智能地分析并獲取音頻音樂內(nèi)容的各種要素(構(gòu)成音樂結(jié)構(gòu)的基本音樂要素與構(gòu)成音樂表現(xiàn)形式的形式音樂要素)。
  于是,針對目前音樂音頻處理的研究狀況與實用需求,本文認為,音樂要素分析技術(shù)是本領(lǐng)域的研究關(guān)鍵,并在此基礎(chǔ)上提出了一個全新的音樂處理體系框架——音樂計算體系,其核心目標是研究智能地、自動地識別音樂的各種要素信息,并將這些信息應(yīng)用于構(gòu)建音樂內(nèi)容的分析、檢索與轉(zhuǎn)譯的智能方法。為了達成上述核心研究目標,本文

3、主張將音樂理論與計算方法的緊密結(jié)合,提倡綜合運用音樂理論、認知心理學(xué)、音樂認知學(xué)、神經(jīng)科學(xué)、人工智能、信號處理等理論來解決音樂信號的分析識別問題。
  本文的關(guān)鍵研究內(nèi)容具體包括如下幾個方面:
  1)提出了音樂計算體系框架,并從理論、方法、任務(wù)、應(yīng)用這四個層次對其進行了詳細的闡述。在理論層,本文提出了一種音樂內(nèi)涵的分析方法,將音樂內(nèi)涵劃分為聲響屬性、理性認知屬性、非理性認知屬性三個維度,并從這一結(jié)構(gòu)出發(fā)解釋音樂計算體系的理

4、論基礎(chǔ);在方法層,本文進一步將研究方法所涉及到的音樂要素劃分為三層次,并聯(lián)合音樂內(nèi)涵分析法,將音樂計算所涉及到的研究方法歸為八類,同時指出了本文重點研究的方法;而在任務(wù)層,本文延續(xù)使用音樂要素的分類方法,將研究任務(wù)進行分類,并重點闡述了各個研究任務(wù)之間的聯(lián)系;最后,在應(yīng)用層,本文明確提出了音樂計算體系框架期望的兩大應(yīng)用方向,并闡述了在這兩方向上所涉及的關(guān)鍵技術(shù)。
  2)針對音樂信號所需的獨特的信號處理技術(shù),本文深入研究常數(shù)Q變換

5、等具有音樂特性表達能力的技術(shù),提出了一種音高校正技術(shù),利用統(tǒng)計方法對音樂頻譜特征進行判斷來修正由物理條件造成的演奏音高偏移現(xiàn)象。同時,本文提出了一種具有獨特的時間延遲、集成及幀間集成機制、可以有效處理時序模式識別問題的時間集成人工神經(jīng)網(wǎng)絡(luò),來處理音樂要素識別中所提取的樂音特征序列;并針對時間集成網(wǎng)的特點設(shè)計了熵誤差函數(shù)訓(xùn)練算法,增強了網(wǎng)絡(luò)訓(xùn)練的效率、收斂及泛化能力。
  3)在音樂調(diào)性核心要素的分析方法研究上,本文基于人類對音樂認

6、知的分布式認知理論假設(shè)模型,提出了適合調(diào)性音樂要素特性描述的音級分布矩陣特征。這里,音級分布矩陣不僅從音級的角度描述了各個音級頻譜分布特征,還描述了每一八度內(nèi)部各頻帶(半音)的頻譜特性,是一種兼具認知分布式思想與結(jié)構(gòu)式觀點的認知音樂特征。綜合運用音樂信號處理技術(shù),本文將此特征運用于真實音樂的調(diào)式及和弦要素識別上。
  4)利用新穎的長短時音頻特征融合的方法,本文對音樂風(fēng)格分類問題進行了研究:提出MFCC等描述音質(zhì)的經(jīng)典特征及節(jié)拍直

7、方圖作為音樂長時韻律的特征構(gòu)成混合特征,并配合高斯混合模型,對音樂風(fēng)格進行分類;同時,我們提出歌曲風(fēng)格向量的表示方法,并用雷達圖提供可視化分析——雷達圖對類別之間的混識程度和雙重風(fēng)格歌曲的分類提供了有效的幫助。此外,本文還利用支持向量機作為分類器,基于音樂結(jié)構(gòu)信息的背景知識,對音樂中人聲與純音樂的分類問題進行了研究。
  5)根據(jù)腦神經(jīng)科學(xué)及認知心理學(xué)關(guān)于人類對音樂感知的研究成果,本文提出了一套基于選擇性注意認知理論的音樂聲響顯著

8、部分度量方法,提出了聲學(xué)聽覺顯著度特征——它是通過建立統(tǒng)計模型描述樂音子帶結(jié)構(gòu)差異及時序差異的三維特征向量,而本文將其應(yīng)用于旋律部分的識別技術(shù)中;而對于旋律分析的結(jié)果表示,本文提出了更加接近人類的實際聽感與感知目標的旋律流。同時,本文利用音樂理論、經(jīng)典認知學(xué)樂理模型,進一步將顯著度特征進行擴充:從音樂的上下文相關(guān)性及和聲結(jié)構(gòu)特性出發(fā),提出了樂理聽覺顯著度特征,與之前的聲學(xué)聽覺顯著度特征形成補充,并印證了本文提出的音樂內(nèi)涵分析理論。最后,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論