基于場景語義圖像標(biāo)注關(guān)鍵技術(shù)的研究.pdf_第1頁
已閱讀1頁,還剩58頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、隨著計算機(jī)技術(shù)的發(fā)展以及互聯(lián)網(wǎng)應(yīng)用的興起,如何有效地管理與檢索圖像已成為目前信息檢索領(lǐng)域中的重要課題。由于傳統(tǒng)的基于內(nèi)容的圖像檢索方式無法解決“語義鴻溝”(低層的視覺特征與高層的語義表達(dá)存在巨大的差異)問題,基于語義的圖像檢索正逐漸成為研究的熱點?;谡Z義的圖像檢索的關(guān)鍵和難點在于基于語義的圖像標(biāo)注。本文回顧了圖像標(biāo)注的發(fā)展歷程及其各自的基本理論的優(yōu)缺點,全面綜述了基于語義的圖像標(biāo)注的研究現(xiàn)狀。本文的工作主要體現(xiàn)在:
   提出

2、了一種基于概率潛在語義分析與高斯混合模型相結(jié)合的自動語義圖像標(biāo)注方法。該方法主要包括圖像低層視覺特征提取、利用概率潛在語義分析技術(shù)對訓(xùn)練圖像進(jìn)行潛在語義發(fā)現(xiàn)、圖片的高斯混合模型表示等過程。首先,將訓(xùn)練集中的每一幅圖像都看成是一篇文檔,將對圖像進(jìn)行標(biāo)注的關(guān)鍵字看成是文檔中所含有的詞匯,將通過上述方式構(gòu)建得到的“文檔-詞匯”矩陣作為概率潛在語義分析模型的輸入值,通過期望最大值算法對概率潛在語義分析模型進(jìn)行擬合,得到模型參數(shù),并以此作為依據(jù)來

3、對圖像進(jìn)行類別劃分和提取圖像的潛在語義。其次,通過圖像分割技術(shù)將每幅圖像都分割成幾個均勻的區(qū)域,將同一類別下每幅圖像的各個區(qū)域都看成是特征空間中的一個點,提取每個區(qū)域的特征向量并通過期望最大值算法對其進(jìn)行聚類,得到表示每一個圖像類別的高斯混合模型。最后,計算測試圖像在每個高斯混合模型中后驗概率的大小,并結(jié)合該圖像類別下關(guān)鍵字的分布規(guī)律來對測試圖像進(jìn)行語義標(biāo)注。
   本文提出的圖像語義標(biāo)注方法不需要事先知道訓(xùn)練圖像的分類信息,在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論