基于局部鄰域的最大密度子圖檢測方法研究與實現(xiàn).pdf_第1頁
已閱讀1頁,還剩79頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、現(xiàn)實世界存在著大量包含多類對象、對象之間存在多種關(guān)系的復(fù)雜網(wǎng)絡(luò),這些網(wǎng)絡(luò)表現(xiàn)出的基于平均密度的聚集效應(yīng)為我們研究對象之間的深層次關(guān)系提供機(jī)會。最大密度子圖檢測是一個重要的圖挖掘問題,可應(yīng)用在計算機(jī)、生物科學(xué)、社會學(xué)和物理學(xué)等多個學(xué)科領(lǐng)域。該問題的目的是求解給定圖中,結(jié)點之間連邊相對密切的子圖,使得子圖的平均密度達(dá)到最大。對于提出改進(jìn)的高準(zhǔn)確率、穩(wěn)定性算法和高效率計算策略是本文的關(guān)鍵。
  本文提出一種基于局部廣度優(yōu)先擴(kuò)張與收縮的方

2、法來檢測給定圖中的最大密度子圖。本算法主要分為三部分:擴(kuò)張、收縮和下一次迭代。首先,選定圖中的最優(yōu)結(jié)點,并從該結(jié)點出發(fā)做局部廣度優(yōu)先擴(kuò)張,直到?jīng)]有結(jié)點可進(jìn)行擴(kuò)張;其次,對擴(kuò)張所得到的擴(kuò)張結(jié)點集合進(jìn)行收縮,從而得出當(dāng)前迭代過程的局部最大密度子圖;再次,在該局部最大密度子圖相對于原圖的補(bǔ)圖上不斷進(jìn)行上述迭代,直至補(bǔ)圖為空;每次迭代結(jié)束,保留平均密度相對較大的密度子圖,最終保留的子圖即為所求原圖的最大密度子圖。進(jìn)一步地,針對大規(guī)模圖上的最大密

3、度子圖挖掘所遇到的困難,本文采用分治策略,提出廣度搜索結(jié)合最小割的圖分割方法將大圖分割成多個子圖,然后采用單機(jī)和集群求解top-K最大密度子圖。在單機(jī)中,使用平行滑動分片策略,將分片逐個加載進(jìn)內(nèi)存進(jìn)行計算,將該分片求解得到的最大密度子圖寫回硬盤覆蓋原分片;對于集群,本文分別在Hadoop平臺上完成基于MapReduce框架的算法實現(xiàn)和在Giraph平臺上完成基于BSP框架的算法實現(xiàn)。
  實驗表明,本文所提出的局部廣度優(yōu)先擴(kuò)張與收

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論