

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、縱觀近年來中文微博發(fā)展的趨勢(shì),隨著用戶數(shù)量不斷增加,用戶在微博中的關(guān)系網(wǎng)絡(luò)逐步完善,微博中潛在的隱私泄露問題也日益成為人們關(guān)注的焦點(diǎn),其中蘊(yùn)含的巨大商機(jī)亦待爆發(fā)。本文的工作圍繞中文微博的隱私泄露問題展開,提出了一套中文微博隱私挖掘方案。主要工作包括以下幾個(gè)方面:
(1)針對(duì)中文微博隱私挖掘?qū)?shù)據(jù)的特殊需求,設(shè)計(jì)并實(shí)現(xiàn)了一套基于Web技術(shù)的數(shù)據(jù)挖掘系統(tǒng)。提出了基于開放平臺(tái)接口與頁面解析技術(shù)相結(jié)合的微博數(shù)據(jù)獲取方案:通過線性控制開
2、放平臺(tái)接口的訪問頻率,解決了訪問受限問題;配合網(wǎng)絡(luò)爬蟲技術(shù),彌補(bǔ)了開放平臺(tái)獲取數(shù)據(jù)信息不完全等問題。
(2)將基于模塊度優(yōu)化的啟發(fā)式算法應(yīng)用到微博網(wǎng)絡(luò)的社區(qū)檢測(cè)中,并對(duì)其鄰接矩陣的構(gòu)造提出了針對(duì)微博特性的改進(jìn)方案。利用 D3可視化引擎將微博網(wǎng)絡(luò)抽象成無向圖,在強(qiáng)關(guān)系網(wǎng)絡(luò)的基礎(chǔ)上,提出了結(jié)合微博關(guān)系有向性、二度人脈特性的鄰接矩陣邊權(quán)重算法,實(shí)現(xiàn)了微博網(wǎng)絡(luò)關(guān)系從有向性到無向性的轉(zhuǎn)換。經(jīng)檢驗(yàn),該方案在保證算法效率的前提下,使得社區(qū)檢
3、測(cè)的成功率從80.32%提高到了90.16%。
(3)通過基于社區(qū)檢測(cè)的隱私分析方法,利用社區(qū)中相同的公開信息來推斷目標(biāo)用戶未公開的隱私信息,以不低于50%的置信度獲得用戶的地理位置信息、職業(yè)信息、教育信息。
(4)采用借助SAE分詞服務(wù)的自建詞庫的中文關(guān)鍵字提取方法,幫助實(shí)現(xiàn)對(duì)用戶興趣等信息的挖掘。根據(jù)中文微博關(guān)鍵字提取與傳統(tǒng)關(guān)鍵字提取工作的區(qū)別進(jìn)行方案的設(shè)計(jì),設(shè)計(jì)了處理中文微博嘈雜信息的啟發(fā)式噪聲過濾規(guī)則。利用社
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向微博數(shù)據(jù)挖掘的網(wǎng)絡(luò)爬蟲系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 面向微博用戶行為數(shù)據(jù)挖掘的爬蟲系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于數(shù)據(jù)挖掘技術(shù)的微博營銷系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于評(píng)論與轉(zhuǎn)發(fā)的微博聯(lián)合主題挖掘系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 中文微博短文本主題挖掘方法研究與原型系統(tǒng)開發(fā).pdf
- 微博信息采集系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 微博系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)開題報(bào)告
- 基于汽車領(lǐng)域的中文微博意見挖掘研究.pdf
- 微博數(shù)據(jù)采集系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 微博用戶管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 微博故障管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 面向隱式微博主題挖掘系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 校園網(wǎng)微博系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于Android的手機(jī)微博系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 面向隱式微博主題挖掘系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
- 微博信息采集與分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于數(shù)據(jù)挖掘的微博輿情監(jiān)測(cè)與分析系統(tǒng)研究與實(shí)現(xiàn).pdf
- 中文微博子話題構(gòu)建技術(shù)研究與實(shí)現(xiàn).pdf
- 微博意見領(lǐng)袖輿情監(jiān)控系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 微博用戶隱私關(guān)注與使用行為研究.pdf
評(píng)論
0/150
提交評(píng)論