基于圖像分割和區(qū)域語義相關(guān)性的圖像標(biāo)注算法研究.pdf_第1頁
已閱讀1頁,還剩90頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、隨著計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)和智能通訊技術(shù)的飛速發(fā)展,大量的圖像數(shù)據(jù)在網(wǎng)絡(luò)上廣泛傳播,并且呈現(xiàn)爆炸式增長,如何有效地管理和利用這些圖像資源已經(jīng)成為當(dāng)前面臨的一項(xiàng)難題。雖然人們在圖像檢索領(lǐng)域已經(jīng)取得了不少成果,但是仍然存在很多問題。基于文本的圖像檢索由于效率低和人為主觀性早已無法滿足當(dāng)前大數(shù)據(jù)時(shí)代的需求;基于內(nèi)容的圖像檢索由于無法解決“語義鴻溝”問題而阻礙了其發(fā)展;基于語義的自動圖像標(biāo)注是當(dāng)前圖像檢索領(lǐng)域的主要發(fā)展方向,研究者在該領(lǐng)域做了很多

2、研究和探索,但是仍然面臨著很多技術(shù)難題。針對圖像檢索領(lǐng)域的研究現(xiàn)狀和發(fā)展趨勢以及當(dāng)前所面臨的諸多難題,本文提出了一系列有效的改進(jìn)方法,主要有以下幾點(diǎn):
  (1)基于語義的自動圖像標(biāo)注需要利用圖像分割算法對圖像進(jìn)行預(yù)處理,并且準(zhǔn)確而有效的進(jìn)行圖像分割,對后面圖像特征提取以及標(biāo)注模型的構(gòu)建非常重要。本文提出了一種改進(jìn)的圖像分割算法,該算法的基本思想是:首先使用Mean Shift算法對圖像進(jìn)行預(yù)分割,由于Mean Shift算法對圖

3、像邊緣比較敏感,因而可以很好的提取出圖像的邊緣信息,但是該算法也很容易產(chǎn)生很多小的區(qū)域,針對這一缺點(diǎn),本文利用Ncut算法對上一步得到的圖像區(qū)域進(jìn)行進(jìn)一步處理,由于Ncut算法總是傾向于得到較大的圖像區(qū)域,因而可以解決Mean Shift的過分割問題,并且由于Ncut處理的是已經(jīng)分割好的圖像區(qū)域,而不是像素點(diǎn),所以大大減少了計(jì)算量,提高了算法性能,然而Ncut算法也存在一定的不足,該算法是一個(gè)NP難題,進(jìn)行分割之前需要首先指定分割區(qū)域個(gè)

4、數(shù),如果該參數(shù)設(shè)置不當(dāng),也很容易產(chǎn)生過分割和欠分割現(xiàn)象,因而本文利用區(qū)域合并與分裂算法對Ncut處理后得到的分割結(jié)果進(jìn)行進(jìn)一步校正,對過分割區(qū)域進(jìn)行合并,對欠分割區(qū)域進(jìn)行分裂,盡可能提高圖像分割結(jié)果的準(zhǔn)確度。
  (2)本文提出了一種結(jié)合區(qū)域語義相關(guān)性和高斯混合模型的改進(jìn)圖像語義標(biāo)注方法。傳統(tǒng)的高斯混合模型都是直接根據(jù)語義后驗(yàn)概率的大小來得到圖像標(biāo)注結(jié)果:一種是直接選擇語義后驗(yàn)概率較大的N個(gè)語義詞作為圖像的標(biāo)注結(jié)果,另一種是直接選

5、擇語義后驗(yàn)概率大于某個(gè)閾值的語義詞作為圖像標(biāo)注結(jié)果。而這種方法得到的標(biāo)注結(jié)果并不準(zhǔn)確,很容易產(chǎn)生一些多余的或者錯(cuò)誤的標(biāo)注詞,影響標(biāo)注結(jié)果的準(zhǔn)確度。而且考慮到模型中的“語義鴻溝”問題,后驗(yàn)概率的大小并不能完全決定其權(quán)重,僅依據(jù)后驗(yàn)概率進(jìn)行分類決策可能存在較大誤差。針對以上問題,本文提出了一種基于區(qū)域語義相關(guān)性的GMM圖像標(biāo)注方法,將各區(qū)域之間的語義相關(guān)性融合到GMM模型中進(jìn)行綜合決策,對該模型的標(biāo)注結(jié)果進(jìn)行有效的校準(zhǔn)和優(yōu)化,從而提高標(biāo)注結(jié)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論