壓縮域音頻指紋及其魯棒性研究.pdf_第1頁
已閱讀1頁,還剩73頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著多媒體技術、數(shù)據(jù)壓縮技術以及互聯(lián)網(wǎng)技術的日益發(fā)展,海量的多媒體信息出現(xiàn)在我們的生活當中。依靠人們掌握的關鍵信息(如音頻文件的標題、作者、出版時間、關鍵詞等)來從眾多的音頻文件中快速而準確的找到目標音頻(即所需要的音頻文件)正變的越來越困難?;趦热莸囊纛l指紋索引方式無需關鍵信息,完全依賴于音頻內容本身,并且索引出的候選結果少,它正逐漸在音頻檢索、音頻識別、音頻內容完整性校驗等領域發(fā)揮著重要作用。目前的相關研究主要集中在非壓縮域音頻指

2、紋索引理論和技術,鮮有關于壓縮域音頻指紋的研究文獻,且甚少涉及指紋算法的魯棒性測試和改進。
   本文首先介紹了音頻指紋索引技術的研究背景和意義,從音頻指紋的多樣性和魯棒性、壓縮域音頻指紋以及音頻指紋快速索引算法等多個角度綜述了國內外的研究現(xiàn)狀;接著對壓縮域音頻指紋涉及的相關原理知識進行了歸納。
   從實際應用出發(fā),在分析和研究了壓縮域音頻特征的基礎上,提出了壓縮域音頻指紋算法,該算法根據(jù)解壓過程中的MDCT頻譜能量直

3、接計算壓縮域音頻的指紋,無需對壓縮域音頻進行完全解碼。考慮到目前的手持音頻設備采集到的一般是非壓縮音頻,本文還設計了相應的非壓縮域音頻指紋算法,此算法參考標準的音頻壓縮流程,從PCM音頻信號計算MDCT頻譜,然后再計算指紋。這兩種算法所生成的指紋可以在同一個音頻指紋數(shù)據(jù)庫中進行有效檢索。對指紋算法的相似性、區(qū)分性、誤碼率和魯棒性等技術特征進行了測試和分析,實驗表明文中所述算法具有良好的性能,其正確識別率符合實際應用的要求。論文還從索引匹

4、配的角度介紹了一種基于Hash模型的指紋快速索引算法。
   在對魯棒性測試結果進行分析的基礎上,本文對線性速度變化這樣一種常見的時域失真現(xiàn)象進行了魯棒性改進研究。分別結合自相關函數(shù)的移位不變性和Fourier-Mellin變換的尺度不變性對本文算法的魯棒性進行了優(yōu)化設計。測試結果表明,基于相關函數(shù)的優(yōu)化算法將抗線性速度變化的能力從±5%提高到±7%,而基于Fourier-Mellin變換的優(yōu)化方案將抗線性速度變化的能力提高到±

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論