2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩124頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、社會(huì)網(wǎng)絡(luò)分析已經(jīng)成為數(shù)據(jù)挖掘領(lǐng)域中研究的熱點(diǎn)之一。隨著研究的深入,社會(huì)網(wǎng)絡(luò)的概念也被逐步擴(kuò)大,也出現(xiàn)了大量的社會(huì)網(wǎng)絡(luò)平臺(tái)。例如以好友關(guān)系為基礎(chǔ)的Facebook、人人等,以信息傳播為基礎(chǔ)的Twitter、新浪微博等,以用戶興趣為基礎(chǔ)的Flick,豆瓣等,還包括以學(xué)者合作為基礎(chǔ)的DBLP等等。用戶每天在社會(huì)網(wǎng)絡(luò)平臺(tái)中產(chǎn)生大量的實(shí)體及關(guān)系。社會(huì)網(wǎng)絡(luò)中實(shí)體之間的關(guān)系是錯(cuò)綜復(fù)雜的,通過挖掘?qū)嶓w間的潛在關(guān)系,能夠深入理解社會(huì)網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu)、信息

2、傳播、群體行為和社會(huì)輿情等。因此,社會(huì)網(wǎng)絡(luò)中的關(guān)系挖掘已經(jīng)成為相關(guān)領(lǐng)域研究的的基礎(chǔ)。
  傳統(tǒng)社會(huì)網(wǎng)絡(luò)中的關(guān)系挖掘主要關(guān)注人及人之間的關(guān)系,而真實(shí)社會(huì)網(wǎng)絡(luò)中的實(shí)體除了包括人之外,還包含很多其他實(shí)體。例如知識(shí)圖譜研究關(guān)注的概念實(shí)體,信息推薦關(guān)注的項(xiàng)目、位置等。社會(huì)網(wǎng)絡(luò)中的關(guān)系主要包括兩類:同質(zhì)關(guān)系和異質(zhì)關(guān)系。兩類關(guān)系通常同時(shí)存在,并且是相互關(guān)聯(lián)的。因此,實(shí)體和關(guān)系是社會(huì)網(wǎng)絡(luò)關(guān)系挖掘算法關(guān)注的焦點(diǎn)。從數(shù)據(jù)挖掘的視角出發(fā),針對(duì)社會(huì)網(wǎng)絡(luò)中

3、實(shí)體間的復(fù)雜關(guān)系進(jìn)行挖掘分析,能夠從結(jié)構(gòu)、內(nèi)容、行為等多角度理解社會(huì)網(wǎng)絡(luò)。
  本文從關(guān)系挖掘的角度出發(fā),主要針對(duì)以下幾個(gè)方面開展研究:
  首先,社會(huì)網(wǎng)絡(luò)中用戶之間的社區(qū)特征、消息的話題相似性、用戶行為的趨同性等表現(xiàn)出大量的同質(zhì)關(guān)系。針對(duì)社會(huì)網(wǎng)絡(luò)中的同質(zhì)關(guān)系很難在單一尺度下分析的問題,提出了基于擴(kuò)散小波的多尺度分析框架。在統(tǒng)一的框架下針對(duì)社會(huì)網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu)、話題、用戶行為等進(jìn)行多尺度分析。
  其次,針對(duì)大規(guī)模異質(zhì)

4、關(guān)系數(shù)據(jù)中的稀疏性和非平衡問題,提出了基于關(guān)聯(lián)矩陣的稀疏非負(fù)矩陣分解算法 HSNMF-CM。算法中選擇異質(zhì)關(guān)系對(duì)應(yīng)的較小一類實(shí)體的相關(guān)關(guān)系構(gòu)建關(guān)聯(lián)矩陣,既降低了矩陣的稀疏度,又提高了算法的處理效率。HSNMF-CM在塊坐標(biāo)下降的框架下,通過稀疏約束下的高效投射算法快速求解矩陣分解。針對(duì)高階異質(zhì)關(guān)系,算法通過聚類指示矩陣融合的方法處理復(fù)雜的異質(zhì)關(guān)系數(shù)據(jù)。
  再次,針對(duì)大規(guī)模微博消息流的突發(fā)話題檢測(cè)問題,在動(dòng)態(tài)窗口劃分的基礎(chǔ)上,通過

5、聯(lián)合聚類算法挖掘用戶、消息和特征實(shí)體之間的關(guān)系,實(shí)現(xiàn)快速、準(zhǔn)確的突發(fā)話題檢測(cè)。從實(shí)體影響力的角度定義突發(fā)話題,充分考慮話題的動(dòng)態(tài)性。針對(duì)中文微博,以字為特征實(shí)體,實(shí)現(xiàn)高效的實(shí)體關(guān)系建模。最后以突發(fā)字為基礎(chǔ)構(gòu)建詞、有意義串。因此能夠檢測(cè)新詞、口語(yǔ)化詞等誘導(dǎo)的突發(fā)現(xiàn)象。
  最后,針對(duì)微博中的異常檢測(cè)問題,從同、異質(zhì)關(guān)系協(xié)同的角度開展研究,提出了基于異質(zhì)關(guān)系矩陣分解的異常檢測(cè)算法。從內(nèi)容、交互行為、用戶屬性等方面定量度量用戶和消息對(duì)應(yīng)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論