版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、光學(xué)樂譜識(shí)別技術(shù)將數(shù)字化樂譜圖像轉(zhuǎn)化為計(jì)算機(jī)能理解的代碼格式,對音樂信息處理具有重要意義,同時(shí)對發(fā)展農(nóng)村音樂教育、娛樂水平,甄選有利于農(nóng)業(yè)生產(chǎn)的音樂作品等工作提供技術(shù)支持。以便攜式數(shù)碼相機(jī)設(shè)備采集的視覺圖像更適合農(nóng)業(yè)的作業(yè)環(huán)境,經(jīng)濟(jì)優(yōu)勢明顯。受點(diǎn)聚焦和自然環(huán)境因素的影響,視覺樂譜圖像具有背景復(fù)雜、光照不均勻、五線譜傾斜、彎曲、模糊等問題,嚴(yán)重影響了樂譜識(shí)別效果。文章針對視覺五線譜圖像識(shí)別的難點(diǎn),對樂譜自動(dòng)定位、二值化、譜線檢測及樂符識(shí)別
2、等關(guān)鍵問題的解決方法進(jìn)行了探討,以期提高印刷體視覺樂譜的識(shí)別效率。本文主要貢獻(xiàn)和創(chuàng)新點(diǎn)如下:
(1)將非監(jiān)督特征學(xué)習(xí)理論引入到樂譜自動(dòng)定位方法中。不依賴于五線譜的結(jié)構(gòu)特點(diǎn),以圖像塊為判別單元,通過K-means聚類算法提取圖像塊特征,采用支撐向量機(jī)進(jìn)行分類,利用同類結(jié)果的連通域搜索確定樂譜位置。與其他特征提取方法的比較表明,非監(jiān)督特征學(xué)習(xí)方法在視覺圖像塊分類適應(yīng)性和復(fù)雜性上都具有一定優(yōu)越性,當(dāng)漢字為干擾因素時(shí)降低了樂譜檢測的錯(cuò)
3、誤率。
(2)提出了基于灰度差分的雙層區(qū)域劃分方法,以動(dòng)態(tài)多閾值二值化方法解決視覺樂譜圖像不規(guī)則區(qū)域自然光照不均勻問題。該方法以灰度差分變化率區(qū)分前景與背景圖像塊,再依據(jù)前景圖像塊的背景灰度值,將前景圖像塊集合劃分成光照強(qiáng)度相對一致的區(qū)域,最后對每個(gè)區(qū)域采用簡單的Otus閾值進(jìn)行二值化。這種層次處理方式,與全局閾值、局部閾值及其它樂譜二值化方法相比,不受光照方向等限制,可以劃分出不規(guī)則形狀的二值化區(qū)域,有效提高了圖像二值化效果
4、。
(3)改進(jìn)了基于像素游程的細(xì)化算法和拐點(diǎn)的提取算法。通過直接在筆畫交叉位置出現(xiàn)斷點(diǎn)的方式,降低了細(xì)化后圖像矢量線段提取的復(fù)雜度;在雙角度閾值拐點(diǎn)提取方法基礎(chǔ)上,通過粗判斷細(xì)分析的方法,改進(jìn)拐點(diǎn)位置判斷的準(zhǔn)確度,從而提高矢量線度提取的精度。
(4)在矢量線段分析基礎(chǔ)上,提出了一種以折線模擬彎曲譜線的音高識(shí)別方法。首先,在一個(gè)小節(jié)范圍內(nèi),對水平線段的組合方式進(jìn)行了分析,改進(jìn)了最短路徑譜線檢測算法,確定譜線段組;然后,
5、以水平線段及相鄰線段間的補(bǔ)充線段形成的折線表示譜線;最后,根據(jù)符頭所在位置調(diào)整譜線間距參數(shù),識(shí)別音高。以折線表示譜線,與校正彎曲譜線方法相比,具有方法簡單、效果穩(wěn)定性好的特點(diǎn)。
(5)提出了一種基于細(xì)化圖像斷點(diǎn)分析的樂符分割方法。在不去除譜線情況下,以譜線斷點(diǎn)為種子,設(shè)定規(guī)則以區(qū)域增長算法完成對譜線上樂符的切分;同時(shí),針對帶有譜線的樂符識(shí)別問題,改進(jìn)了方向梯度直方圖(Histogram of OrientedGradient,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 液晶數(shù)字表視覺識(shí)別關(guān)鍵技術(shù)研究.pdf
- 基于機(jī)器視覺的蓮蓬識(shí)別關(guān)鍵技術(shù)研究.pdf
- 步態(tài)識(shí)別關(guān)鍵技術(shù)研究.pdf
- 語種識(shí)別關(guān)鍵技術(shù)研究.pdf
- 掌紋識(shí)別關(guān)鍵技術(shù)研究.pdf
- 基于生物視覺機(jī)制的場景識(shí)別關(guān)鍵技術(shù)研究.pdf
- 語音識(shí)別關(guān)鍵技術(shù)研究.pdf
- 網(wǎng)絡(luò)業(yè)務(wù)識(shí)別關(guān)鍵技術(shù)研究.pdf
- VPN協(xié)議識(shí)別關(guān)鍵技術(shù)研究.pdf
- 事件關(guān)系識(shí)別關(guān)鍵技術(shù)研究.pdf
- 自動(dòng)車牌識(shí)別關(guān)鍵技術(shù)研究.pdf
- 手指靜脈識(shí)別關(guān)鍵技術(shù)研究.pdf
- 人臉表情識(shí)別關(guān)鍵技術(shù)研究.pdf
- 人體行為識(shí)別關(guān)鍵技術(shù)研究.pdf
- 手部靜脈識(shí)別關(guān)鍵技術(shù)研究.pdf
- 交通對象識(shí)別關(guān)鍵技術(shù)研究.pdf
- 語音情感識(shí)別關(guān)鍵技術(shù)研究.pdf
- 槍號識(shí)別關(guān)鍵技術(shù)研究.pdf
- 動(dòng)態(tài)文本識(shí)別關(guān)鍵技術(shù)研究.pdf
- 基于機(jī)器視覺的交通標(biāo)志識(shí)別關(guān)鍵技術(shù)研究.pdf
評論
0/150
提交評論