面向?qū)W術(shù)文獻(xiàn)檢索的P2P網(wǎng)絡(luò)研究.pdf_第1頁
已閱讀1頁,還剩47頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、Google Scholar為我們搜索各種來源的學(xué)術(shù)文獻(xiàn)信息提供了一個簡單易用的平臺。它使用網(wǎng)絡(luò)爬蟲來把各種來源的文獻(xiàn)信息集中存儲到Google自己的數(shù)據(jù)庫里,然后通過web向用戶提供這些信息。從技術(shù)上來講,Google Scholar是基于客戶端/服務(wù)器端模型的,作為一個集中式的系統(tǒng),有著它自身的缺陷。近年來,P2P(Peer-to-Peer,點對點)計算越來越盛行,它能夠以分布,自治的方式來處理海量數(shù)據(jù),其特征在搜索能力、可擴(kuò)展性、

2、高效率,以及對故障和動態(tài)環(huán)境的應(yīng)變能力方面展現(xiàn)了巨大的潛力。 在本篇論文中,我們提出了一種面向?qū)W術(shù)文獻(xiàn)檢索的P2P網(wǎng)絡(luò)研究--PPScholar,它建立在P2P網(wǎng)絡(luò)和Dublin Core元數(shù)據(jù)標(biāo)準(zhǔn)的基礎(chǔ)之上。我們的主要研究內(nèi)容就是如何使各個學(xué)術(shù)文獻(xiàn)信息源的數(shù)據(jù)庫以P2P的方式合作,建立起一個適用于學(xué)術(shù)文獻(xiàn)檢索的基于元數(shù)據(jù)的P2P網(wǎng)絡(luò)。在研究過程中,我們主要致力于兩大問題:一是如何隱藏信息源的異構(gòu)性;二是如何建立一個適合于本應(yīng)用

3、的P2P網(wǎng)絡(luò)。在建立P2P網(wǎng)絡(luò)的過程中,我們基于在Gnutella網(wǎng)絡(luò)中發(fā)現(xiàn)的兩種冪律分布,在Gnutella網(wǎng)絡(luò)的基礎(chǔ)之上,增加學(xué)習(xí)型節(jié)點來以多種方式改進(jìn)我們的應(yīng)用。 首先,我們根據(jù)在P2P網(wǎng)絡(luò)中發(fā)現(xiàn)的節(jié)點連接數(shù)的冪率分布規(guī)律,將那些擁有連接數(shù)多,性能強(qiáng)大的節(jié)點選擇為學(xué)習(xí)型節(jié)點,形成一種兩層架構(gòu)的P2P網(wǎng)絡(luò)。這些學(xué)習(xí)型節(jié)點可以學(xué)習(xí)整個網(wǎng)絡(luò)的知識,比如緩沖查詢請求與結(jié)果等,從而使得查詢請求能夠在少數(shù)的學(xué)習(xí)型節(jié)點中就能得到結(jié)果。同

4、時通過模擬實驗,在將TTL(Time-to-Live)控制在可接受的前提下,盡量選擇那些擁有連接數(shù)最多,性能最強(qiáng)大的節(jié)點作為學(xué)習(xí)型節(jié)點,從而盡可能減少學(xué)習(xí)型節(jié)點的數(shù)量。另外,我們還根據(jù)P2P網(wǎng)絡(luò)中發(fā)現(xiàn)的搜索關(guān)鍵字的冪率分布規(guī)律,提出了新的緩沖算法--適應(yīng)性最少頻率使用算法(Adaptive Least Frequently Used),并根據(jù)此算法在學(xué)習(xí)型節(jié)點中建立緩沖區(qū),作為學(xué)習(xí)型節(jié)點的學(xué)習(xí)能力之一。 通過實際模擬實驗,我們驗

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論