面向圖像檢索和分類的監(jiān)督哈希方法研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩54頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、近年來(lái),隨著社會(huì)和經(jīng)濟(jì)的快速發(fā)展,互聯(lián)網(wǎng)技術(shù)在我們的日常工作和生活中扮演著越來(lái)越重要的角色,而且隨著電子設(shè)備和社交媒體的普及,多媒體數(shù)據(jù)(文字、圖像和視頻等)增長(zhǎng)迅速。圖像因其豐富的內(nèi)容和強(qiáng)有力的表達(dá)形式更是深受人們的喜愛(ài),并呈現(xiàn)指數(shù)型的增長(zhǎng)趨勢(shì),這就為圖像的檢索和存儲(chǔ)帶來(lái)一定的挑戰(zhàn)。
  最近鄰算法是信息檢索中的經(jīng)典方法,但是在大規(guī)模的數(shù)據(jù)中進(jìn)行精確的最近鄰查找是非常困難的。為了解決這一問(wèn)題,近似近鄰查找算法得到廣大研究者的青睞

2、。這種算法因其效率比較高,復(fù)雜度相對(duì)較低,結(jié)果相對(duì)準(zhǔn)確,在近些年來(lái)成為學(xué)術(shù)研究的熱點(diǎn)。
  對(duì)于相似性檢索,傳統(tǒng)的方法是利用數(shù)據(jù)的原始特征進(jìn)行相似性度量。當(dāng)數(shù)據(jù)量較小時(shí),這種方法效果比較好。但隨著數(shù)據(jù)量的增大和特征維數(shù)的增高,特征匹配因其極高的計(jì)算復(fù)雜度變得不再適用,同時(shí)對(duì)設(shè)備的存儲(chǔ)性能帶來(lái)了極大的挑戰(zhàn)。于是,哈希方法應(yīng)運(yùn)而生?;诠5姆椒ㄒ蚱鋬?yōu)越的計(jì)算和存儲(chǔ)性能在近些年來(lái)發(fā)展迅速,受到越來(lái)越多學(xué)者和研究人員的關(guān)注?;诠<夹g(shù)

3、的相似性檢索方法將原始空間的數(shù)據(jù)特征信息映射到二維的海明空間,同時(shí)盡可能的保持原始數(shù)據(jù)的局部特性、語(yǔ)義信息等。通過(guò)計(jì)算哈希碼兩兩之間的海明距離,近似近鄰檢索能夠很快的返回檢索結(jié)果。哈希方法具有線性的檢索復(fù)雜度并且通過(guò)將數(shù)據(jù)轉(zhuǎn)化為緊致的二進(jìn)制哈希碼,大大的降低了存儲(chǔ)代價(jià),更有效的利用存儲(chǔ)空間,提高了存儲(chǔ)設(shè)備的性能。因此,由于哈希方法具有很高的性能,進(jìn)而能夠更好的應(yīng)用到大規(guī)模的數(shù)據(jù)檢索任務(wù)中。
  哈希方法可以根據(jù)學(xué)習(xí)過(guò)程中是否利用標(biāo)

4、簽分為兩類:非監(jiān)督方法和監(jiān)督方法。監(jiān)督哈希方法目的是在哈希碼學(xué)習(xí)過(guò)程中充分利用訓(xùn)練數(shù)據(jù)的特征以及標(biāo)簽,使得學(xué)到的哈希碼能夠保持原始數(shù)據(jù)的語(yǔ)義特性,因而相對(duì)于非監(jiān)督哈希方法來(lái)說(shuō)具有更高的準(zhǔn)確性,更能運(yùn)用到一些實(shí)際的應(yīng)用中。
  如今有很多監(jiān)督哈希方法被研究出來(lái),有一些也有不錯(cuò)的效果。但是大部分的哈希方法都是用來(lái)做檢索任務(wù)而不能用來(lái)分類。也就是說(shuō),我們并不能夠利用哈希碼來(lái)預(yù)測(cè)數(shù)據(jù)的類別,即使哈希碼本身含有豐富的語(yǔ)義信息。這是一種極大的

5、信息損失。并且如果我們可以直接利用哈希碼進(jìn)行分類,哈希方法則在實(shí)際項(xiàng)目中發(fā)揮更高的價(jià)值。針對(duì)這一問(wèn)題,我們提出了一種可以進(jìn)行標(biāo)簽預(yù)測(cè)的監(jiān)督哈希學(xué)習(xí)方法,稱為類圖保持哈希。這種哈希方法能夠?qū)⒄Z(yǔ)義標(biāo)簽信息與哈希碼融合在一起,學(xué)到的哈希碼具有豐富的語(yǔ)義信息,并利用學(xué)到的映射矩陣和哈希碼,直接預(yù)測(cè)檢索數(shù)據(jù)的標(biāo)簽。該方法首先通過(guò)同時(shí)保證標(biāo)簽的一致性和保持類圖相似性學(xué)習(xí)到哈希函數(shù),再通過(guò)最小化哈希碼跟哈希函數(shù)之間的量化誤差學(xué)到哈希碼,同時(shí)提出了一種

6、迭代的優(yōu)化方法。該方法在三個(gè)圖像數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),并與當(dāng)前效果比較好的集中哈希方法進(jìn)行了對(duì)比。實(shí)驗(yàn)結(jié)果表明無(wú)論在圖像檢索還是分類任務(wù)上,類圖保持哈希都有著比較好的效果。
  但是,現(xiàn)實(shí)生活中只有極少的圖片是本身就帶有標(biāo)簽的,而大部分圖片都沒(méi)有標(biāo)簽信息。如何能利用少量的標(biāo)簽信息在大規(guī)模圖像中做檢索,是半監(jiān)督哈希方法所關(guān)注的問(wèn)題。如今很多半監(jiān)督的哈希方法為了能更好的對(duì)目標(biāo)函數(shù)進(jìn)行優(yōu)化,往往采用先松弛再對(duì)連續(xù)數(shù)據(jù)閾值化的方法,這樣會(huì)有

7、一些信息損失。并且,為了更好地利用圖像本身的特征,很多方法都用了相似性矩陣來(lái)保持相似性,而相似性矩陣一般都是n×n的,計(jì)算和存儲(chǔ)都相當(dāng)耗時(shí),甚至在大規(guī)模的數(shù)據(jù)集上無(wú)法運(yùn)行。為此,我們提出了一種半監(jiān)督圖割哈希算法,能夠利用圖割的優(yōu)化方法直接對(duì)哈希碼進(jìn)行優(yōu)化,減少了因松弛帶來(lái)的信息損失。同時(shí),我們將相似性矩陣用稀疏嵌入的方法進(jìn)行了降維,加快了計(jì)算的速度。我們?cè)趦蓚€(gè)數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果說(shuō)明了我們提出的半監(jiān)督圖割哈希在部分標(biāo)簽上與其他幾

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論