基于音頻的多媒體文件重復(fù)性檢測.pdf_第1頁
已閱讀1頁,還剩72頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、隨著“云存儲”、“大數(shù)據(jù)”時(shí)代的到來,網(wǎng)絡(luò)數(shù)據(jù)量成井噴式增長,在每天以不可思議的速度增長的網(wǎng)絡(luò)數(shù)據(jù)中,音視頻數(shù)據(jù)占據(jù)了很大的比例。這些網(wǎng)絡(luò)音視頻數(shù)據(jù)大都存在重復(fù)的現(xiàn)象,重復(fù)的多媒體文件給音視頻網(wǎng)站的管理帶來了很多難題,而解決這些難題僅僅依靠人力是幾乎無法完成的,因此對多媒體文件重復(fù)性檢測的研究具有非常重要的意義。目前對多媒體文件的重復(fù)性檢測的研究主要分為基于文字描述、基于圖像和基于音頻的重復(fù)性檢測?;谖淖置枋龅姆椒ㄟ^于主觀性,對于惡意

2、刪改的文件無法檢測;基于圖像的方法無法對純音頻文件進(jìn)行檢測,并且其檢測速度慢,準(zhǔn)確率較低無法滿足現(xiàn)實(shí)要求。因此,本文從音頻入手,研究基于音頻的多媒體文件重復(fù)性檢測的方法。本文主要完成了以下工作:
  首先,本文研究了音頻的特征表示方法。本文從目前研究經(jīng)常使用的聲學(xué)特征層出發(fā),對時(shí)域特征、頻域特征和倒譜域特征進(jìn)行了介紹,并重點(diǎn)研究了倒譜域的Mel頻率倒譜系數(shù)(MFCC)和頻域的音級輪廓(PCP)特征以及在兩者基礎(chǔ)上發(fā)展而來的美爾音級

3、輪廓(MPCP)特征的原理和計(jì)算方法。除此之外,本文提出了新的融合特征(MP)。
  其次,本文研究了基于model-free音頻文件重復(fù)性檢測的過程,包括多媒體文件格式統(tǒng)一化處理、特征表示、滑動窗口、交叉遞歸圖和重復(fù)性判定。格式統(tǒng)一化處理是從多媒體文件中提取音頻數(shù)據(jù)并進(jìn)行解碼。特征表示即是提取音頻的四個(gè)特征來表示音頻數(shù)據(jù)?;瑒哟翱谑菍τ诙嗝襟w文件不等長的情況使用滑動策略。交叉遞歸圖是以二維圖的形式來分析兩段音頻特征的相似性。重復(fù)

4、性判定是通過交叉遞歸圖定量分析兩段音頻特征之間的相似度,進(jìn)而通過與閾值比較判定兩個(gè)多媒體文件是否重復(fù)。本文分別比較了四個(gè)音頻特征(MFCC、PCP、MPCP、MP)的實(shí)驗(yàn)性能,并且通過實(shí)驗(yàn)發(fā)現(xiàn),基于model-free音頻文件重復(fù)性檢測系統(tǒng)具有不錯的檢測準(zhǔn)確率。
  最后,本文研究了基于model-based音頻文件重復(fù)性檢測的過程,包括多媒體文件格式統(tǒng)一化處理、特征表示、滑動窗口、交叉遞歸圖、基于交叉遞歸圖的特征向量提取、Max

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論