不確定性時間序列的降維與相似性匹配研究.pdf_第1頁
已閱讀1頁,還剩73頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、時間序列是按時間順序排列的實數(shù)序列,它反映了實體屬性在時間順序上的特征。時間序列的降維、相似性匹配及聚類研究是數(shù)據(jù)挖掘領域的重要研究方面,在位置定位系統(tǒng)、環(huán)境監(jiān)測、物聯(lián)網等領域中有廣泛的應用。并且隨著信息技術的發(fā)展和現(xiàn)實應用需求的不斷擴大,在無線傳感器網絡、無線射頻識別網絡、移動對象跟蹤、氣象雷達網絡和隱私保護等應用中逐漸涌現(xiàn)出一類特殊的數(shù)據(jù),即不確定性數(shù)據(jù),不確定性時間序列是一條在每個時間點上有多個觀察值的序列。
  由于對時間

2、序列的研究主要集中在序列的降維、相似性匹配、存儲和索引方面,并未涉及時間序列相似的基本性質,為了彌補該領域的不足,對時間序列相似的交換性、傳遞性和分配性進行研究,證明時間序列相似具有交換性,不具有傳遞性和分配性,為時間序列的相似性研究奠定了基礎;隨后提出了序列最優(yōu)相似集合的概念,并且證明尋找時間序列的最優(yōu)相似集合是NP完全問題,為時間序列在聚類挖掘中尋找啟發(fā)式算法提供了理論依據(jù)。
  由于不確定時間序列的長度很大,并且每個采樣點的

3、取值具有不確定性,導致了維度災難和龐大的可能世界集,所以對不確定時間序列降維是實現(xiàn)對其方便存儲、快速查詢和相似性匹配的首要任務。不確定時間序列普遍采用小波變換的降維方法,但是該方法沒有考慮到采樣點之間的相關性,并且小波變換不能處理任意長度的時間序列,為解決該問題,提出基于概率統(tǒng)計和數(shù)據(jù)相關性的降維方法,該方法將不確定時間序列分為概率維度和時間維度,并分別對兩維度進行降維。在時間維度,根據(jù)采樣點之間的相關性,使用某個采樣點代表后續(xù)相關度高

4、的采樣點;在概率維度,使用大概率點表示相鄰的小概率點,實驗效果表明,使用該方法對不確定時間序列進行降維后,降維序列可以保持原序列的變化趨勢,壓縮程度顯著,并且可近似的恢復原序列。
  不確定時間序列固有的維度災難和龐大的可能世界集問題同樣給序列的相似性匹配和聚類過程帶來巨大的困難,為解決該問題,分別提出了基于桶分割和算術編碼的相似性匹配算法和基于趨勢的相似性匹配及聚類算法,其中基于編碼的相似性匹配算法不僅可以將不確定時間序列規(guī)約為

5、一條確定的時間序列,并通過距離度量完成相似性匹配,而且可以通過規(guī)約后的確定時間序列近似的恢復原不確定時間序列;基于趨勢的相似性度量方法根據(jù)時間序列的整體變化趨勢,將時間序列映射為短的趨勢符號序列,并利用一階連接性指數(shù)和塔尼莫特系數(shù)完成相似性度量;基于趨勢的聚類方法通過定義趨勢高度,并對趨勢符號序列迭代進行區(qū)間劃分和趨勢判斷,并以此構建趨勢樹,最后將趨勢樹根結點中趨勢符號相同的時間序列聚集為一類。實驗結果表明,基于編碼的相似性匹配算法不僅

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論