基于聚類技術的校園網絡用戶行為數(shù)據(jù)分析研究.pdf_第1頁
已閱讀1頁,還剩49頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、目前,隨著校園網絡用戶個性化需求的日益增長,網絡信息服務的使用從集中統(tǒng)一型向分布式個性化演進,校園網絡中的用戶有著各自的上網習慣和興趣,各用戶使用網絡的時間、服務及關注的內容焦點都有差異。校園網絡服務也從傳統(tǒng)的網絡聊天、瀏覽新聞網頁等方面向更細致、更個性化的服務轉變,如網絡購物、網絡課堂、娛樂游戲等,這為校園網絡用戶提供了極大的便利。然而,現(xiàn)階段的個性化校園網絡用戶服務在及時性、穩(wěn)定性等方面仍無法滿足實際應用的需求,因此,為校園網用戶提

2、供更加及時、更高質量的網絡服務,成為網絡用戶行為的研究方向之一。本文將借助挖掘處理、聚類分析技術來研究網絡用戶的行為,并進一步分析網絡用戶的興趣和需求,以優(yōu)化用戶體驗。高等院校內的校園網使用者有著比較高的文化教育水平和專業(yè)水平,并且不同的用戶有著不同的網絡使用習慣以及更加個性化的網絡需求,因此,在校園網中獲取的數(shù)據(jù)相比社會網絡數(shù)據(jù)有著更高的可研究性。
  本文的主要研究工作和創(chuàng)新點概括如下:
  1.本文梳理了近年來國內外有

3、關網絡用戶行為的分析研究現(xiàn)狀,歸納總結出校園網絡用戶行為的概念及特點、數(shù)據(jù)挖掘的流程和方法,并根據(jù)校園網絡用戶行為分析數(shù)據(jù)的特點,選擇了K-means聚類算法進行改進,并用于聚類分析。
  2.本文在傳統(tǒng)經典的K-means聚類算法的基礎上,提出了基于興趣矩陣的相似度計算方法。該算法通過構造用戶興趣度矩陣的方式改進了用戶間相似度的計算方法,即用戶的上網行為以矩陣的形式表示出來,其中,每個矩陣有七行,每一行表示日期的記錄,即(周一、

4、周二...周日),每個矩陣元素表示在某影響條件分類下網絡使用量占當天總使用量的比重值,每一列表示網絡用戶在同一影響條件分類下,不同日期的網絡使用量占當天總使用量的比重值,進而使用聚類技術,對校園局域網用戶行為進行相似度計算。該算法在一定程度上降低了無效數(shù)據(jù)的影響,提高了用戶行為相似度聚類的時效性和有效性,能夠較好的應用于校園局域網用戶行為的具體研究中。
  3.本文提出了對影響用戶行為的條件進行篩選的算法,即根據(jù)用戶行為隨條件變化

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論