基于機器學(xué)習(xí)算法的自動圖像標注.pdf_第1頁
已閱讀1頁,還剩51頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、“語義清晰”是大規(guī)模數(shù)字圖像管理的重要前提,現(xiàn)有的基于底層特征的圖像內(nèi)容和高級人為理解的圖像語義之間存在巨大的鴻溝,因此通過計算機自動獲取圖像語義內(nèi)容的研究具有十分重要的意義。自動圖像標注的實質(zhì)是通過對圖像的底層視覺特征的處理和分析來獲取高層語義關(guān)鍵詞,用這組語義關(guān)鍵詞表示圖像的含義?;诜诸惖淖詣訄D像標注方法是當前圖像標注領(lǐng)域中使用最廣泛的方法之一。
   本文的研究目標是結(jié)合當前標注模型的特點應(yīng)用機器學(xué)習(xí)算法對圖像進行標注,

2、與前期基于分類模型的自動圖像標注經(jīng)典算法相比,本文采用的決策樹改進算法在分類精度和時間上有所改善,并且該系統(tǒng)可以利用人能理解的規(guī)則模型來標注圖像。為了獲取標注規(guī)則,本文將采集到的圖像數(shù)據(jù)庫預(yù)定義一組需要的關(guān)鍵詞(或語義概念)。利用圖像分割技術(shù)將數(shù)據(jù)庫中的圖像分割成許多不同的區(qū)域,每個區(qū)域大致對應(yīng)于一個語義對象。然后對圖像分割后所得到的各個區(qū)域提取出底層視覺特征,包括顏色、紋理和形狀特征等。提取出區(qū)域的特征屬性后,手動將有意義的區(qū)域歸并為

3、幾個類,這幾個類均為預(yù)定義的語義概念。特征屬性數(shù)據(jù)可以作為后續(xù)機器學(xué)習(xí)的訓(xùn)練數(shù)據(jù)。然后該系統(tǒng)可以通過機器學(xué)習(xí)方法從這些特征數(shù)據(jù)中學(xué)習(xí)到語義概念,利用預(yù)定義關(guān)鍵詞來標注各個區(qū)域,最后圖像就可以被這些關(guān)鍵詞標注出來。本文主要關(guān)注的機器學(xué)習(xí)算法為改進后的NewNBtree算法、SimpleC4.5算法和FastRandomForest算法,通過訓(xùn)練可以得到相應(yīng)的標注模型,最終實現(xiàn)自動圖像標注。在自動語義標注階段,本文利用圖像信息熵的概念對噪聲

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論