在線金融論壇惡意用戶群組檢測方法及應(yīng)用.pdf_第1頁
已閱讀1頁,還剩44頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、近年來,互聯(lián)網(wǎng)的迅猛發(fā)展促進(jìn)了信息技術(shù)與網(wǎng)絡(luò)通信技術(shù)的發(fā)展。社會生活的高度信息化,使網(wǎng)絡(luò)承載了蘊(yùn)含價值的數(shù)據(jù),擁有海量用戶的社會化網(wǎng)絡(luò)媒體,已經(jīng)被組織和個人廣泛地用來輔助決策。在線金融論壇上存在巨大的用戶群與潛在的商機(jī),使虛假意見和垃圾信息被廣泛地制造和傳播,該類危害的源頭即惡意用戶群組。針對以上問題,我們利用網(wǎng)頁信息提取、數(shù)據(jù)存儲、情感分析、網(wǎng)絡(luò)關(guān)系建模、重疊社區(qū)檢測等技術(shù),來采集在線金融論壇用戶行為數(shù)據(jù)、構(gòu)建用戶關(guān)系網(wǎng)絡(luò)、對用戶關(guān)系

2、網(wǎng)絡(luò)進(jìn)行社區(qū)劃分、檢測惡意用戶群組并評價檢測結(jié)果。本文的主要工作如下:
  1.通過對在線金融論壇網(wǎng)站頁面的研究,分析論壇用戶行為,利用網(wǎng)頁信息抽取技術(shù)采集論壇頁面信息,匹配實驗所需的用戶行為數(shù)據(jù),并存儲到本地關(guān)系型數(shù)據(jù)庫MySQL中。
  2.基于機(jī)器學(xué)習(xí),對訓(xùn)練集進(jìn)行分詞、特征選取,選擇合適的情感分類器,對用戶評論內(nèi)容的情感進(jìn)行分類預(yù)測,依據(jù)預(yù)測分類結(jié)果,構(gòu)建用戶行為網(wǎng)絡(luò)關(guān)系模型,并描述用戶相似情感網(wǎng)絡(luò)的相關(guān)全局性統(tǒng)計特

3、征,得出相似情感網(wǎng)絡(luò)既滿足“小世界”特性,也滿足無尺度特性。
  3.考慮到節(jié)點(diǎn)屬性對數(shù)據(jù)結(jié)構(gòu)的影響,結(jié)合節(jié)點(diǎn)拓?fù)浣Y(jié)構(gòu)和節(jié)點(diǎn)屬性信息,提出一種基于節(jié)點(diǎn)拓?fù)浣Y(jié)構(gòu)和節(jié)點(diǎn)屬性的重疊社區(qū)檢測算法,對在線金融論壇用戶關(guān)系網(wǎng)絡(luò)和斯坦福大學(xué)的三個社交網(wǎng)絡(luò)數(shù)據(jù)集進(jìn)行重疊社區(qū)檢測,并與常見的社區(qū)檢測算法作比較,驗證了本文提出算法的可行性與有效性。
  4.提出相應(yīng)的社區(qū)檢測的外部指標(biāo),綜合這些外部指標(biāo)檢測股票論壇中的惡意用戶群組,并結(jié)合具體案

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論