版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、隨著近年來互聯(lián)網(wǎng)技術(shù)的快速興起,在線社交網(wǎng)絡(luò)作為一種現(xiàn)實(shí)社交在互聯(lián)網(wǎng)中的投射物,越來越具有相當(dāng)?shù)难芯績r(jià)值。在現(xiàn)實(shí)社會關(guān)系中,以自然人為節(jié)點(diǎn),人與人之間的各種直接聯(lián)系為邊,可以構(gòu)建出一個(gè)十分復(fù)雜的社交關(guān)系網(wǎng)。人類的社會性和地理、文化等因素又共同決定著這種現(xiàn)實(shí)社交關(guān)系網(wǎng)必定是以各種各樣或大或小的社交圈組成的,而現(xiàn)實(shí)中的這種社交圈特征投射到在線社交網(wǎng)絡(luò)中,則表現(xiàn)為以虛擬用戶為節(jié)點(diǎn)的虛擬社區(qū)。
虛擬社區(qū)檢測對于理解在線社交網(wǎng)絡(luò)的結(jié)構(gòu)特
2、征以及其演化規(guī)律、從而為進(jìn)一步理解人類社會關(guān)系特征、乃至于理解人類行為規(guī)律都有著十分重要的作用。從應(yīng)用的角度來講,在社交網(wǎng)絡(luò)中發(fā)現(xiàn)虛擬社區(qū)可以讓互聯(lián)網(wǎng)服務(wù)提供者更好地理解用戶的行為模式和興趣愛好,從而更好的為用戶提供個(gè)性化服務(wù)。而在信息安全的層面,虛擬社區(qū)檢測技術(shù)在應(yīng)對網(wǎng)絡(luò)水軍、非法信息傳播控制等上都具有相當(dāng)高的現(xiàn)實(shí)意義。
本文分析了社區(qū)發(fā)現(xiàn)領(lǐng)域的現(xiàn)有理論和技術(shù),總結(jié)出其面臨的幾個(gè)問題,在綜合考慮模型效果、在線社交網(wǎng)絡(luò)數(shù)據(jù)形式
3、以及處理效率的的基礎(chǔ)上,提出了基于隱狄利克雷分布的社區(qū)發(fā)現(xiàn)模型及其實(shí)現(xiàn)。本文的主要工作以及研究成果包括:
1、介紹了社交網(wǎng)絡(luò)大數(shù)據(jù)挖掘的基本背景以及社區(qū)發(fā)現(xiàn)的已有相關(guān)研究和工作,在對已有工作進(jìn)行闡述和分析的基礎(chǔ)上,總結(jié)出現(xiàn)有工作所面臨的問題,并提出了相應(yīng)的解決辦法;
2、基于貝葉斯圖模型,提出了一種可綜合考慮交互信息、網(wǎng)絡(luò)結(jié)構(gòu)以及交互行為時(shí)間信息的社區(qū)發(fā)現(xiàn)模型COT(Community Over Time),可用于從
4、在線社交網(wǎng)絡(luò)的交互數(shù)據(jù)中發(fā)現(xiàn)具有特定主題傾向及周期性行為模式的動(dòng)態(tài)交互社區(qū);
3、為了使COT模型適應(yīng)于大數(shù)據(jù)時(shí)代海量數(shù)據(jù)處理的要求,本文在對COT模型進(jìn)行詳細(xì)分析和優(yōu)化的基礎(chǔ)上提出了一種可有效應(yīng)用于并行與分布式計(jì)算環(huán)境下的近似模型AD-COT(Approximate Distributed COT),大大提升了COT模型的可擴(kuò)展性;
4、利用新浪微博的大規(guī)模數(shù)據(jù)集,本文基于Apache Spark平臺對COT及AD
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于隱狄利克雷分配模型的中、高分辨率遙感影像分類研究.pdf
- 基于鏈接的Blog社區(qū)發(fā)現(xiàn)技術(shù)研究與實(shí)現(xiàn).pdf
- 平移狄利克雷邊界條件的平均曲率流研究.pdf
- 結(jié)合監(jiān)督信息的狄利克雷混合模型及其應(yīng)用.pdf
- 多標(biāo)簽隱含狄利克雷分配及其并行化應(yīng)用.pdf
- 大學(xué)畢業(yè)論文狄利克雷函數(shù)的性質(zhì)及應(yīng)用
- 微博的大規(guī)模社區(qū)發(fā)現(xiàn)技術(shù)研究與實(shí)現(xiàn).pdf
- 社區(qū)發(fā)現(xiàn)技術(shù)的研究與實(shí)現(xiàn).pdf
- 基于詞頻分布的文本隱寫技術(shù)研究.pdf
- 狄利克雷級數(shù)、廣義歐拉和類數(shù)以及標(biāo)號選舉路.pdf
- 基于Spark的分布式社區(qū)發(fā)現(xiàn)算法設(shè)計(jì)與實(shí)現(xiàn).pdf
- 拉普拉斯方程的圓的狄利克雷問題的傅氏解
- 拉普拉斯方程的圓的狄利克雷問題的傅氏解
- 基于SOA的服務(wù)發(fā)現(xiàn)技術(shù)研究與實(shí)現(xiàn).pdf
- 基于鏈接分析的Web社區(qū)發(fā)現(xiàn)技術(shù)研究.pdf
- 基于譜聚類的社區(qū)發(fā)現(xiàn)技術(shù)研究.pdf
- 基于圖壓縮的重疊社區(qū)發(fā)現(xiàn)技術(shù)研究.pdf
- 基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)方法的研究與實(shí)現(xiàn).pdf
- 基于JPEG圖像的隱寫分析技術(shù)研究與實(shí)現(xiàn).pdf
- 兩類調(diào)和方程的狄利克雷問題的解法和調(diào)和函數(shù)極值原理的研究.pdf
評論
0/150
提交評論