版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、時間序列相似性問題是時間序列挖掘中的一個重要而基礎(chǔ)的問題,為其他的挖掘手段提供必要的技術(shù)支持和手段,也經(jīng)常作為其他挖掘問題的一個子程序,自從提出以來一直是一個備受關(guān)注的研究熱點問題。圍繞靜態(tài)時間序列比較、動態(tài)時間序列匹配等方面,開展了六方面的研究工作:時間序列建模、靜態(tài)時間序列的相似比較、動態(tài)時間序列的相似匹配、時間序列相似比較的提前終止和效率估算、相似序列的排序以及相似序列搜索原型系統(tǒng)的研究。 為改變當(dāng)前時間序列建模表示方法缺少
2、時間特征的現(xiàn)狀,通過分析逐段聚集平均(Piecewise Aggregate Approximation,PAA)表示方法,提煉出時間序列的時間特性,對于較近時間段的數(shù)據(jù)具有較高的參考價值,而較遠(yuǎn)時間段內(nèi)的數(shù)據(jù)則具有較低的參考價值。改造PAA表示方法,得到逆向逐段聚集平均(Reversed Piecewise Aggregate Approximation,RPAA)表示方法,對不同的分段引入不同的影響因子,證明了基于RPAA 方法的距
3、離下界于Euclidean距離,保證在時間序列相似搜索中不會發(fā)生漏查。實驗結(jié)果表明,RPAA 較PAA在相似搜索中具有較小的錯差率。將自適應(yīng)逐段常量近似(Adaptive Piecewise Constant Approximation,APCA)表示方法擴(kuò)展到動態(tài)時間序列的分段中,得到自適應(yīng)逐段常量近似(Adaptive Piecewise Constant Approximation onStream,APCAS)。APCAS能夠在
4、線性時間內(nèi)完成在線時間序列流的分段,比APCA具有更少的內(nèi)存消耗和更短的分段時間。當(dāng)前的動態(tài)時間序列彎曲距離(Dynamic Time Warping,DTW)下界函數(shù),要么采用序列間的較少特征而與實際的DTW具有較大差異,要么不具備對稱特性而限制了下界函數(shù)的應(yīng)用范圍。在分析DTW下界函數(shù)特性的基礎(chǔ)上,給出了一種DTW下界函數(shù)LB_HUST,證明了LB_HUST具有對稱性和下界性。將LB_HUST擴(kuò)展到時間序列集合的距離計算中,證明了L
5、B_HUST在時間序列集合計算中的性質(zhì)。 實驗結(jié)果表明,LB_HUST不僅是時間序列基于DTW計算的一種緊密而對稱的下界函數(shù),而且在時間序列聚類中能夠取得較好效果。為改變當(dāng)前時間序列流匹配中多是采用單一的相似比較手段的現(xiàn)狀,給出一種支持多種比較方法的時間序列流匹配模型框架Multi-Tsource,將比較方法和其他的時間序列流處理手段分離。在Multi-Tsource的基礎(chǔ)上,分別重點分析了基于Euclidean和DTW的比較方
6、法,最后通過實驗驗證了Multi-Tsource框架的可行性。結(jié)果表明,支持多種比較方法并不會使系統(tǒng)的效率有顯著降低,通過分發(fā)機(jī)制可以使多種比較方法相互獨立,為系統(tǒng)的動態(tài)擴(kuò)展提供了保證。為提高計算的效率,將提前終止技術(shù)引入到了DTW 距離的計算中,在分析DTW提前終止性質(zhì)的基礎(chǔ)上,給出DTW提前終止算法EA_DTW,用實驗驗證了DTW提前終止算法的效率。EA_DTW方法可以跳過冗余的DTW 方格計算,經(jīng)常在不需要全部計算精確DTW距離的
7、情形下即可完成序列的DTW相似比較,從而節(jié)省計算資源。 以前的提前終止技術(shù)的效率都是建立在實驗驗證的基礎(chǔ)上,而缺乏理論化的工具,為此,設(shè)計了一種提前終止的效率估算方法EA_Estimate,通過對有效計算路徑上溢出的估計,最終估算出最終的提前終止的效率。理論計算和實際的計算的實驗對比結(jié)果表明,EA_Estimate可以確定一個大致的效率范圍,幫助用戶確定最終有效值。由于時間序列不具備顯式的關(guān)鍵字,目前出現(xiàn)的基于關(guān)鍵字的排序方法不
8、能直接應(yīng)用于時間序列的排序。在對時間序列排序的問題進(jìn)行定義的基礎(chǔ)上,根據(jù)時間序列與序列集合邊界的關(guān)系得出了基于時間序列邊界的排序方法TS-Sort,并且在實現(xiàn)時實現(xiàn)了基于劃分的改進(jìn)方法,證明了改進(jìn)方法與直接方法的等效性。最后通過實驗對TS-Sort進(jìn)行了驗證。結(jié)果表明,TS-Sort不僅可以作為一項時間序列處理的工具,而且可能根據(jù)排序的結(jié)果對所處理的數(shù)據(jù)有深層次的認(rèn)識。 以上述研究成果為基礎(chǔ),設(shè)計和實現(xiàn)了一個時間序列相似搜索的原
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 23139.時間序列的相似性分析問題研究
- 時間序列相似性聚類算法研究.pdf
- 不確定時間序列的相似性匹配問題研究.pdf
- 面向相似性的時間序列數(shù)據(jù)挖掘研究.pdf
- 面向時間序列相似性的序列模式挖掘及應(yīng)用.pdf
- 多元時間序列相似性搜索算法研究.pdf
- 基于形態(tài)特征的時間序列相似性搜索研究.pdf
- 時間序列特征表示及相似性度量方法研究.pdf
- 基于相似性分析的時間序列數(shù)據(jù)挖掘研究.pdf
- 心電時間序列的表示方法和相似性度量問題研究.pdf
- 時間序列的相似性挖掘及其在股票時間序列中的應(yīng)用.pdf
- 4740.基于形態(tài)的時間序列相似性研究
- 時間序列的相似性查詢與異常檢測.pdf
- RSS時間序列相似性度量及應(yīng)用研究.pdf
- 時間序列挖掘和相似性查找技術(shù)的研究.pdf
- 時間序列挖掘與相似性查找技術(shù)研究.pdf
- 面向相似性的時間序列聚類方法研究.pdf
- 基于相似性分析的時間序列異常檢測研究.pdf
- 基于時間序列相似性的數(shù)據(jù)挖掘方法研究.pdf
- 基于動態(tài)時間彎曲的時間序列相似性搜索技術(shù)的研究.pdf
評論
0/150
提交評論