基于二維索引的結構化P2P高維數(shù)據(jù)范圍檢索.pdf_第1頁
已閱讀1頁,還剩56頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、近年來,隨著網(wǎng)絡技術的發(fā)展,很多P2P系統(tǒng)相繼出現(xiàn),P2P技術也越來越被人們所關注。目前P2P技術已經(jīng)被應用在很多方面,主要有信息檢索、文件共享、電子商務、分布式計算等領域。其中,信息檢索作為查找網(wǎng)絡信息的主要手段,是P2P技術目前最常見的應用。
   一直以來,高維數(shù)據(jù)都是數(shù)據(jù)庫領域研究的熱點,在實際中也有很多應用,例如數(shù)據(jù)挖掘、多媒體信息檢索等領域。相似性檢索是個非常關鍵的問題,即在數(shù)據(jù)集中找到與某個對象相似性較大的數(shù)據(jù)。高

2、維數(shù)據(jù)檢索過程中,距離計算是影響檢索效率的一個重要因素,為了減少距離計算,近些年已經(jīng)提出了一些解決辦法,主要是以近似向量表示或者為數(shù)據(jù)建立~維索引為思路,前者通常是為高維數(shù)據(jù)尋找一個近似的向量表示形式,簡化搜索空間。為數(shù)據(jù)建立一維索引是將高維數(shù)據(jù)通過某種方法轉(zhuǎn)化為~維數(shù)據(jù),以降低維度帶來的影響。
   高維空間與我們所熟悉的低維空間不同,其中的數(shù)據(jù)分布有其獨特的特點,即高維數(shù)據(jù)空間幾乎是中空的,這使得大多數(shù)多元密度估計方法無法得

3、出準確的結果,因為密度相對低的區(qū)域占了分布的很大一部分體積,而密度高的區(qū)域卻缺乏足夠的觀測值。本文在分析了高維空間的這些分布特點之后,根據(jù)數(shù)據(jù)量將其分割成若干個子空間,使得這些子空間中的數(shù)據(jù)量分布大致均勻。子空間的劃分是對數(shù)據(jù)空間縱向的分割。在子空間建立的基礎上再進行分區(qū)劃分,分區(qū)的劃分是對數(shù)據(jù)空間橫向的分割??臻g劃分之后,綜合近似向量表示和為數(shù)據(jù)建立一維距離索引的基礎上,為數(shù)據(jù)建立二維索引值,在數(shù)據(jù)索引和結構化P2P網(wǎng)絡Chord節(jié)點

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論