復(fù)雜結(jié)構(gòu)的時間序列數(shù)據(jù)挖掘與預(yù)測方法研究.pdf_第1頁
已閱讀1頁,還剩113頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、近年來,在數(shù)據(jù)挖掘領(lǐng)域,時間序列數(shù)據(jù)的挖掘技術(shù)取得了很大的進展。隨著網(wǎng)絡(luò)技術(shù)和無線傳感器等數(shù)據(jù)感知搜集技術(shù)的不斷強大,一方面,時間序列數(shù)據(jù)的結(jié)構(gòu)越來越復(fù)雜,數(shù)據(jù)量的海量性也在不斷地增加,另一方面,人們越來越需要從這些更為復(fù)雜的數(shù)據(jù)中發(fā)現(xiàn)更多的更為有用的信息和知識。與此同時,計算機的計算能力的不斷強大,也對研究這些更為復(fù)雜結(jié)構(gòu)的數(shù)據(jù)的特征以及挖掘發(fā)現(xiàn)出其中的信息和知識提供了可能。而對于諸如流式時間序列、不確定性時間序列、多時間序列等復(fù)雜結(jié)

2、構(gòu)的時間序列的數(shù)據(jù)挖掘技術(shù)還研究的不多,以往的傳統(tǒng)的時間序列數(shù)據(jù)挖掘技術(shù)大多是對于相對簡單結(jié)構(gòu)的時間序列數(shù)據(jù)的挖掘。因此,對于復(fù)雜結(jié)構(gòu)的時間序列數(shù)據(jù)的挖掘成為時間序列數(shù)據(jù)挖掘的新的熱點問題,而結(jié)構(gòu)的復(fù)雜性也使得對于復(fù)雜結(jié)構(gòu)的時間序列數(shù)據(jù)挖掘技術(shù)面臨著新的挑戰(zhàn)性問題。
  傳感器網(wǎng)絡(luò)中的數(shù)據(jù)是最為典型的數(shù)據(jù)流時間序列,每時每刻都在不斷地產(chǎn)生流式數(shù)據(jù),在短時間內(nèi)有大量的數(shù)據(jù)以非??斓乃俣冗B續(xù)到達,數(shù)據(jù)量往往可能是無限大的,系統(tǒng)沒有條件

3、保存整個數(shù)據(jù),這些數(shù)據(jù)隨時間動態(tài)變化。針對無線傳感器網(wǎng)絡(luò)中的數(shù)據(jù)流時間序列的的復(fù)雜結(jié)構(gòu)特性,主要基于節(jié)省無線傳感器網(wǎng)絡(luò)中電池能量消耗效率問題,提出了一種無線傳感器網(wǎng)絡(luò)中Top-k數(shù)據(jù)異常檢測的方法PECTMA。其中,提出了4個算法,自回歸持續(xù)讀檢測算法CRVMR,Top-k排序算法Top-k-sort,空間冗余清除算法ESR和Top-k個異常的匯集算法BRCR。總體的思想是,減少傳感器節(jié)點需要傳輸?shù)臄?shù)據(jù)的傳輸量,以節(jié)省電池能源。通過與知

4、名的可用于無線傳感器網(wǎng)絡(luò)中的異常檢測的方法TA和TAG的對比實驗,驗證了PECTMA方法的有效性和效率。
  在許多現(xiàn)實應(yīng)用中,例如受傳感器等數(shù)據(jù)采集儀器設(shè)備的精度的制約、不同粗細粒度的數(shù)據(jù)集合之間的數(shù)據(jù)轉(zhuǎn)換、隱私保護等,數(shù)據(jù)的不確定性普遍存在。一方面由于時間序列數(shù)據(jù)往往存在高緯度的特性,再一方面由于不確定性數(shù)據(jù)的概率不確定性的特性,使得傳統(tǒng)的數(shù)據(jù)管理中的數(shù)據(jù)表示、存儲與索引、查詢與挖掘等所有的技術(shù),不能直接應(yīng)用于不確定性時間序列

5、數(shù)據(jù)的相似性查找。研究了可用于不確定性時間序列數(shù)據(jù)的降維表示、索引與剪枝、查找等理論與技術(shù),針對不確定性時間序列數(shù)據(jù)結(jié)構(gòu)的復(fù)雜性,首次給出了不確定性時間序列上的概率最近鄰的定義;將不確定性時間序列進行PLA降維,轉(zhuǎn)換到PLA空間,并提出了三個定理,用以加速查找效率;基于該三個定理,提出了不確定性時間序列數(shù)據(jù)中的概率K最近鄰查找的方法PKNNU,給出了相應(yīng)的查找算法PKNNS。通過實驗,驗證了PKNNS算法的有效性和效率。
  論壇

6、網(wǎng)絡(luò)是一種典型的虛擬社會網(wǎng)絡(luò),社會網(wǎng)絡(luò)的一些特性,如網(wǎng)絡(luò)規(guī)模大小、存在小社會社區(qū)結(jié)構(gòu)、社區(qū)關(guān)系強度、有影響力的節(jié)點、節(jié)點在社區(qū)中的穩(wěn)定性等一些重要的統(tǒng)計量,往往正是論壇社會網(wǎng)絡(luò)不斷動態(tài)演變的外在表現(xiàn),反映著論壇輿情的演進趨勢情況,這些量也形成論壇網(wǎng)絡(luò)中的多個變量的時間序列數(shù)據(jù)。結(jié)合社區(qū)結(jié)構(gòu)分析和多時間序列趨勢之間的關(guān)聯(lián)規(guī)則分析,提出了一種論壇輿情趨勢預(yù)測方法FSTP。首次對多時間序列的趨勢之間的關(guān)聯(lián)規(guī)則給出了定義;建立了論壇輿情預(yù)測的時

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論