版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、所謂時序數(shù)據(jù)是指觀察對象的某一特征或行為按時間排序的集合。實際應用中很大一部分時序數(shù)據(jù)是由系統(tǒng)產(chǎn)生用于記錄用戶的行為。分析這些數(shù)據(jù)背后的用戶行為模式,將會對用戶和系統(tǒng)模式的識別與未來狀態(tài)的預測帶來積極的影響。然而,這些刻畫用戶行為的時序數(shù)據(jù)卻體量龐大且表現(xiàn)形式復雜,給處理這些這些數(shù)據(jù)帶來了巨大困難。
本文遵循“數(shù)據(jù)中挖掘模式,模式預測未來”的思路,意在從用戶時序數(shù)據(jù)中挖掘出有用的行為模式,并以此為基礎分別預測出小規(guī)模群組和復雜
2、群體(系統(tǒng))的未來行為狀態(tài)。為此,文章針對如下關鍵問題提出了有效的解決方案:第一,是時間序列的表示問題。由于用戶行為的多樣性,使得用傳統(tǒng)方法表示用戶行為存在諸多問題,如維數(shù)災難等。本文創(chuàng)造性地提出了一種用戶行為模式的內(nèi)容-結構表示方法,它是利用聚類和貪婪算法,將原始用戶時序數(shù)據(jù)用一個極其簡單的序列表示。此表示方法既保留了原始序列的主要信息,又方便了后續(xù)的行為模式挖掘工作。其次,是時間序列模式相似度衡量問題。由于用戶行為序列數(shù)據(jù)所指向的對
3、象眾多,因此衡量其相似度必不可少。然而不同對象行為序列的多維和非等長特性卻給此項工作帶來了挑戰(zhàn)。本文基于內(nèi)容-結構表示,分別從用戶行為偏好以及偏好分布特點兩方面去衡量不同用戶序列行為的相似度。實驗表明,此相似度衡量方法表現(xiàn)良好。第三,是群體用戶行為的預測問題。本文分別從微觀和宏觀的角度預測了群體行為趨勢。微觀方面,利用基于內(nèi)容-結構模式的表示和相似度衡量方法,預測了小規(guī)模群組的行為趨勢。宏觀方面,利用相空間重構的方法將復雜群體(系統(tǒng))行
4、為序列數(shù)據(jù)映射到相空間,然后基于此空間構建預測算法。其中在尋找相空間中相似點用于預測時,創(chuàng)新性地提出了改進的 K鄰近值算法,使得預測準確性有了很大幅度地提升。
本文的主要貢獻在于三個方面,首先提出了一種新的用戶序列行為的“內(nèi)容-結構”表示方法和相似度度量方式。其次,分別從微觀和宏觀的角度提出了預測小規(guī)模群組和復雜群體行為的有效方法,并利用改進的 K鄰近值算法大大提升了復雜群體行為預測的準確度。
實驗結果表明,本文的方
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 序列挖掘在臨床行為模式發(fā)現(xiàn)中的應用研究.pdf
- 海量數(shù)據(jù)庫中的小模式發(fā)現(xiàn).pdf
- 用戶訪問模式的發(fā)現(xiàn)及其應用.pdf
- 序列模式挖掘在Web用戶訪問序列挖掘中的應用研究.pdf
- 序列模式發(fā)現(xiàn)及其應用研究.pdf
- 面向網(wǎng)絡用戶行為模式發(fā)現(xiàn)的數(shù)據(jù)挖掘技術探索.pdf
- 數(shù)據(jù)庫中序列模式發(fā)現(xiàn)的研究.pdf
- 序列模式發(fā)現(xiàn)中關鍵問題的研究.pdf
- 基于用戶行為模式特征的時間序列異常檢測.pdf
- 互聯(lián)網(wǎng)中的海量用戶行為挖掘算法研究.pdf
- 序列模式發(fā)現(xiàn)模型的研究.pdf
- 基于海量用戶行為的推薦算法研究.pdf
- 時間序列數(shù)據(jù)的模式發(fā)現(xiàn)及預測方法研究.pdf
- 基于用戶行為的社區(qū)發(fā)現(xiàn)研究.pdf
- mba論文面向網(wǎng)絡用戶行為模式發(fā)現(xiàn)的數(shù)據(jù)挖掘技術探索pdf
- 序列模式發(fā)現(xiàn)中關鍵問題的研究與實現(xiàn).pdf
- 海量客運數(shù)據(jù)中的頻繁旅行模式發(fā)現(xiàn)算法研究與實現(xiàn).pdf
- WEB用戶訪問序列模式挖掘.pdf
- 蛋白質(zhì)序列模式發(fā)現(xiàn)算法.pdf
- 生物地理學優(yōu)化算法及其在生物序列模式發(fā)現(xiàn)中的應用.pdf
評論
0/150
提交評論