版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、社會(huì)網(wǎng)絡(luò)分析已經(jīng)成為數(shù)據(jù)挖掘領(lǐng)域中研究的熱點(diǎn)之一。隨著研究的深入,社會(huì)網(wǎng)絡(luò)的概念也被逐步擴(kuò)大,也出現(xiàn)了大量的社會(huì)網(wǎng)絡(luò)平臺(tái)。例如以好友關(guān)系為基礎(chǔ)的Facebook、人人等,以信息傳播為基礎(chǔ)的Twitter、新浪微博等,以用戶興趣為基礎(chǔ)的Flick,豆瓣等,還包括以學(xué)者合作為基礎(chǔ)的DBLP等等。用戶每天在社會(huì)網(wǎng)絡(luò)平臺(tái)中產(chǎn)生大量的實(shí)體及關(guān)系。社會(huì)網(wǎng)絡(luò)中實(shí)體之間的關(guān)系是錯(cuò)綜復(fù)雜的,通過挖掘?qū)嶓w間的潛在關(guān)系,能夠深入理解社會(huì)網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu)、信息
2、傳播、群體行為和社會(huì)輿情等。因此,社會(huì)網(wǎng)絡(luò)中的關(guān)系挖掘已經(jīng)成為相關(guān)領(lǐng)域研究的的基礎(chǔ)。
傳統(tǒng)社會(huì)網(wǎng)絡(luò)中的關(guān)系挖掘主要關(guān)注人及人之間的關(guān)系,而真實(shí)社會(huì)網(wǎng)絡(luò)中的實(shí)體除了包括人之外,還包含很多其他實(shí)體。例如知識(shí)圖譜研究關(guān)注的概念實(shí)體,信息推薦關(guān)注的項(xiàng)目、位置等。社會(huì)網(wǎng)絡(luò)中的關(guān)系主要包括兩類:同質(zhì)關(guān)系和異質(zhì)關(guān)系。兩類關(guān)系通常同時(shí)存在,并且是相互關(guān)聯(lián)的。因此,實(shí)體和關(guān)系是社會(huì)網(wǎng)絡(luò)關(guān)系挖掘算法關(guān)注的焦點(diǎn)。從數(shù)據(jù)挖掘的視角出發(fā),針對(duì)社會(huì)網(wǎng)絡(luò)中
3、實(shí)體間的復(fù)雜關(guān)系進(jìn)行挖掘分析,能夠從結(jié)構(gòu)、內(nèi)容、行為等多角度理解社會(huì)網(wǎng)絡(luò)。
本文從關(guān)系挖掘的角度出發(fā),主要針對(duì)以下幾個(gè)方面開展研究:
首先,社會(huì)網(wǎng)絡(luò)中用戶之間的社區(qū)特征、消息的話題相似性、用戶行為的趨同性等表現(xiàn)出大量的同質(zhì)關(guān)系。針對(duì)社會(huì)網(wǎng)絡(luò)中的同質(zhì)關(guān)系很難在單一尺度下分析的問題,提出了基于擴(kuò)散小波的多尺度分析框架。在統(tǒng)一的框架下針對(duì)社會(huì)網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu)、話題、用戶行為等進(jìn)行多尺度分析。
其次,針對(duì)大規(guī)模異質(zhì)
4、關(guān)系數(shù)據(jù)中的稀疏性和非平衡問題,提出了基于關(guān)聯(lián)矩陣的稀疏非負(fù)矩陣分解算法 HSNMF-CM。算法中選擇異質(zhì)關(guān)系對(duì)應(yīng)的較小一類實(shí)體的相關(guān)關(guān)系構(gòu)建關(guān)聯(lián)矩陣,既降低了矩陣的稀疏度,又提高了算法的處理效率。HSNMF-CM在塊坐標(biāo)下降的框架下,通過稀疏約束下的高效投射算法快速求解矩陣分解。針對(duì)高階異質(zhì)關(guān)系,算法通過聚類指示矩陣融合的方法處理復(fù)雜的異質(zhì)關(guān)系數(shù)據(jù)。
再次,針對(duì)大規(guī)模微博消息流的突發(fā)話題檢測(cè)問題,在動(dòng)態(tài)窗口劃分的基礎(chǔ)上,通過
5、聯(lián)合聚類算法挖掘用戶、消息和特征實(shí)體之間的關(guān)系,實(shí)現(xiàn)快速、準(zhǔn)確的突發(fā)話題檢測(cè)。從實(shí)體影響力的角度定義突發(fā)話題,充分考慮話題的動(dòng)態(tài)性。針對(duì)中文微博,以字為特征實(shí)體,實(shí)現(xiàn)高效的實(shí)體關(guān)系建模。最后以突發(fā)字為基礎(chǔ)構(gòu)建詞、有意義串。因此能夠檢測(cè)新詞、口語(yǔ)化詞等誘導(dǎo)的突發(fā)現(xiàn)象。
最后,針對(duì)微博中的異常檢測(cè)問題,從同、異質(zhì)關(guān)系協(xié)同的角度開展研究,提出了基于異質(zhì)關(guān)系矩陣分解的異常檢測(cè)算法。從內(nèi)容、交互行為、用戶屬性等方面定量度量用戶和消息對(duì)應(yīng)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向社會(huì)網(wǎng)絡(luò)應(yīng)用的關(guān)系抽取研究.pdf
- 面向社會(huì)網(wǎng)絡(luò)分析的數(shù)據(jù)挖掘方法研究.pdf
- 面向社會(huì)化媒體的社會(huì)網(wǎng)絡(luò)挖掘與分析.pdf
- 面向社會(huì)網(wǎng)絡(luò)的人物關(guān)系抽取研究.pdf
- 面向社會(huì)網(wǎng)絡(luò)的用戶行為挖掘與應(yīng)用研究.pdf
- 面向社會(huì)網(wǎng)絡(luò)應(yīng)用的人物關(guān)系抽取方法研究.pdf
- mba論文面向社會(huì)網(wǎng)絡(luò)的用戶行為挖掘與應(yīng)用研究pdf
- 可面向社會(huì)Agent設(shè)計(jì)的網(wǎng)絡(luò)監(jiān)測(cè)框架研究.pdf
- 面向社會(huì)網(wǎng)絡(luò)的隱私保護(hù)關(guān)鍵技術(shù)研究.pdf
- mba論文面向社會(huì)工程學(xué)的sns分析和挖掘pdf
- 面向含敏感關(guān)系社會(huì)網(wǎng)絡(luò)的匿名模型及算法研究.pdf
- 面向社會(huì)網(wǎng)絡(luò)的用戶隱私分析與保護(hù).pdf
- 面向社會(huì)化媒體內(nèi)容的若干聚類算法研究.pdf
- 面向社會(huì)媒體的高校網(wǎng)絡(luò)輿情分析系統(tǒng).pdf
- 面向客戶關(guān)系挖掘的克隆選擇算法研究.pdf
- 面向社會(huì)網(wǎng)絡(luò)的用戶隱私分析與保護(hù)(1)
- 面向網(wǎng)絡(luò)入侵檢測(cè)的序列模式挖掘算法研究.pdf
- 面向社會(huì)網(wǎng)絡(luò)的表示學(xué)習(xí)方法與推薦技術(shù)研究.pdf
- 多關(guān)系社會(huì)網(wǎng)絡(luò)社區(qū)挖掘方法研究.pdf
- mba論文面向社會(huì)網(wǎng)絡(luò)的用戶隱私分析與保護(hù)pdf
評(píng)論
0/150
提交評(píng)論