基于回聲狀態(tài)網(wǎng)絡的圖像語義映射方法研究.pdf_第1頁
已閱讀1頁,還剩78頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、隨著計算機、互聯(lián)網(wǎng)以及存儲技術(shù)等高新技術(shù)的發(fā)展,數(shù)字圖像的傳播及存儲數(shù)量正在以驚人的速度增長。因此人們需要更加快速、準確的圖像檢索方法來查詢所需要的圖像及相關(guān)信息。傳統(tǒng)基于內(nèi)容的圖像檢索方式僅僅通過計算圖像間低層特征的距離獲取不同圖像之間的相似程度,無法解決“語義鴻溝”問題,得到的查詢結(jié)果并不十分理想。因此基于語義的圖像檢索技術(shù)隨之產(chǎn)生并發(fā)展迅速,逐漸成了圖像檢索領域的研究重點。
  目前,研究者通常利用傳統(tǒng)機器學習算法來實現(xiàn)圖像

2、語義映射,而傳統(tǒng)機器學習算法訓練速度慢,且泛化能力不足。為了提高圖像語義映射的實時性,研究選用回聲狀態(tài)網(wǎng)絡靜態(tài)分類模型作為圖像語義映射的關(guān)鍵算法。為提高分類器的對圖像低層特征的適應性及泛化能力,本研究引入集成學習的思想,提出了多儲備池回聲狀態(tài)網(wǎng)絡圖像語義映射模型,并將映射得到的語義特征融入到圖像檢索之中,提高圖像檢索的準確度。論文的主要研究內(nèi)容及工作如下:
  (1)研究對回聲狀態(tài)網(wǎng)絡分類模型訓練過程中存在的問題進行優(yōu)化,根據(jù)儲備

3、池內(nèi)狀態(tài)變量的變化量,變化速度及變化趨勢來判斷訓練結(jié)束與否,有效避免震蕩和發(fā)散現(xiàn)象對訓練速度和準確度的影響。
  (2)為提高語義映射速度,本研究將回聲狀態(tài)網(wǎng)絡靜態(tài)分類模型應用于圖像語義映射之中,該網(wǎng)絡訓練速度快,且避免了傳統(tǒng)神經(jīng)網(wǎng)絡存在局部最優(yōu)的問題。同時,為解決圖像特征數(shù)據(jù)維數(shù)較高的問題,本文引入集成學習思想,將圖像特征按照特征種類進行劃分,針對劃分后的圖像特征分別構(gòu)造儲備池形成多儲備池回聲狀態(tài)網(wǎng)絡圖像語義映射模型,并線性融合

4、各儲備池得到的結(jié)果。由于集成學習方法便于通過并行算法實現(xiàn),因此本研究以多核并行的方式實現(xiàn)多儲備池回聲狀態(tài)網(wǎng)絡模型。實驗結(jié)果表明優(yōu)化后的分類器性能得到了一定程度的提高。
  (3)在圖像語義映射的基礎上,本研究將語義特征融入到圖像檢索之中。提出了顏色模糊相關(guān)圖(CFC)的概念并利用該方法提取圖像低層特征,該方法在顏色自相關(guān)圖(CAC)的基礎上考慮了不同顏色量化值之間的相似程度,同時保留了顏色自相關(guān)圖空間復雜度低的優(yōu)點。之后利用通過語

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論