基于Shapelet的時間序列分類方法研究.pdf_第1頁
已閱讀1頁,還剩186頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、時間序列(Time Series)是按時間順序排列的一組觀測值的集合,通常時間序列是作為一個整體來進行處理發(fā)現(xiàn)其整體規(guī)律,這種規(guī)律是單個值不能體現(xiàn)的。另外,由于時間序列的數(shù)據(jù)量大、維度高、更新快以及高噪聲等特點,引起來大量研究者的關(guān)注。目前時間序列分析在機器學習、數(shù)據(jù)挖掘以及數(shù)據(jù)倉庫等領(lǐng)域中日益重要,時間序列分析被評為21世紀數(shù)據(jù)挖掘領(lǐng)域10大最具挑戰(zhàn)性的研究問題之一。
  時間序列分類就是把一個未知的時間序列劃分到某些預(yù)定義的或

2、者已知的類別中,可以視時間序列分類為有指導(dǎo)的學習。時間序列的分類是時間序列研究里面的一個熱點問題,也是一個廣泛應(yīng)用的問題,在制造領(lǐng)域時間序列分類問題具有廣泛的應(yīng)用場景。在制造業(yè)領(lǐng)域,對時間序列進行分類研究,借助于時間序列的分類結(jié)果可以實現(xiàn)機器異常檢測、系統(tǒng)入侵檢測、工藝流程控制,借助于時間序列的分類分析,促進智能制造的發(fā)展。
  目前時間序列分類問題,尤其是制造領(lǐng)域的時間序列分類,主要面臨以下問題和挑戰(zhàn):(1)數(shù)據(jù)多源異構(gòu)問題:在

3、制造領(lǐng)域存在著各式各樣的制造設(shè)備,這些設(shè)備產(chǎn)生形形色色的異構(gòu)數(shù)據(jù),如何將這些數(shù)據(jù)自動提取成規(guī)整的時間序列成為了巨大挑戰(zhàn)。(2)數(shù)據(jù)規(guī)模問題:在制造領(lǐng)域,在生產(chǎn)流水線上存在著大量的制造設(shè)備,這些設(shè)備以較高的頻率產(chǎn)生觀測數(shù)據(jù),這必然會導(dǎo)致大規(guī)模數(shù)據(jù)的產(chǎn)生,如何在大數(shù)據(jù)環(huán)境下對數(shù)據(jù)進行存儲與分析成為了另外的一個挑戰(zhàn)。(3)快速分類問題:制造領(lǐng)域內(nèi)的設(shè)備采集頻率高,導(dǎo)致了時間序列維度高,高維的時間序列又導(dǎo)致了分類訓練時間長,如何針對高維時間序列

4、快速構(gòu)建分類器成為制造領(lǐng)域時間分類問題的很大挑戰(zhàn)。(4)時間序列分類的可解釋性問題:時間序列通常不具有直接的特征,即使通過復(fù)雜的特征選擇技術(shù),維度的潛在特征依舊非常高,時間序列本質(zhì)的特征難以捕獲,而在制造領(lǐng)域為了通過時間序列分類結(jié)果指導(dǎo)企業(yè)的生產(chǎn)與管理決策,必須對時間序列分類結(jié)果給出直觀的可解釋性的分類結(jié)果。
  本文對時間序列分類問題進行了深入研究,針對智能制造領(lǐng)域內(nèi)時間序列分類過程中各個流程(包括時間序列提取、時間序列表示、時

5、間序列分類)中存在問題與挑戰(zhàn),從面向智能制造一體化平臺的多源異構(gòu)設(shè)備數(shù)據(jù)提取模型、時間序列表示方法以及具有快速的、可解釋性的基于shapelet的分類算法三個方向展開了一系列的研究。本文的主要工作和貢獻包括:
  (1)針對制造領(lǐng)域中設(shè)備數(shù)據(jù)多源異構(gòu)的問題,我們提出了一種面向智能制造一體化平臺的設(shè)備數(shù)據(jù)提取模型。該模型中包含了設(shè)備模版以及四個數(shù)據(jù)處理策略(數(shù)據(jù)同步策略、數(shù)據(jù)切片策略、數(shù)據(jù)拆分策略、數(shù)據(jù)索引策略)。該模型通過預(yù)定義的

6、設(shè)各模版,將四種數(shù)據(jù)處理策略分別應(yīng)用于數(shù)據(jù)同步、數(shù)據(jù)切片、數(shù)據(jù)拆分和數(shù)據(jù)索引過程。我們將該設(shè)備數(shù)據(jù)模型集成到我們所構(gòu)建的智能制造一體化大數(shù)據(jù)平臺(An Industrial Big Data Platform,IBDP)中?;诖四P?,我們從多個企業(yè)的若干數(shù)據(jù)源提取各種形式的設(shè)備數(shù)據(jù),并將多源異構(gòu)的設(shè)備數(shù)據(jù)統(tǒng)一的以時間序列的形式保存到IBDP中?;谔崛〉臅r間序列,我們進而分析了該平臺上設(shè)備數(shù)據(jù)處理流程并給出了一個溫度感知設(shè)備數(shù)據(jù)分析案

7、例。該案例充分展示了,通過對時間序列進行分析發(fā)現(xiàn)其蘊含的價值,進而指導(dǎo)企業(yè)生產(chǎn)。
  (2)針對時間序列具有數(shù)據(jù)量大、維度高以及更新快等特點,導(dǎo)致在原始數(shù)據(jù)難以分析的問題,我們提出了一種基于重要點的時序數(shù)據(jù)分段線性表示方法(a Piecewise Linear Representation method based on Important Data Points,PLR-IDP)。該方法通過計算單點和分段擬合誤差查找重要點,然后

8、通過連接重要點分段擬合時間序列。PLR-IDP在對時間序列擬合的時候綜合考慮了單點擬合誤差、片段擬合誤差和全局擬合誤差。理論分析和實驗結(jié)果顯示該算法在降低時間序列的維度的同時能夠很好的反映時序數(shù)據(jù)的關(guān)鍵特征,整體誤差小。
  (3)針對目前基于shapelet發(fā)現(xiàn)算法運行速度較慢的問題,提出了一種基于重要點的快速shapelet發(fā)現(xiàn)算法和一種快速shapelet選擇算法。Shapelet是時間序列中的一個較短的子序列,它能夠很好區(qū)

9、別出不同的類。在該算法中,通過重要點對時間序列子序列進行過濾,降低了shapelet候選的數(shù)量,進而加快了shapelet發(fā)現(xiàn)的速度。
  (4)針對shapelet變換算法訓練時間過長的問題,提出了一種快速shapelet選擇算法,來加速shape let變換分類過程。該算法對(3)中所提出的基于重要點的加速算法進行了繼承并擴展。該算法中使用了兩種加速策略:采樣時間序列和過濾shapelet候選。通過這兩種加速策略,我們的算法可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論