版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、時序是一種不同于其它類型的序列數(shù)據(jù),它通過在離散的時間點(diǎn)取樣形成。它在現(xiàn)實(shí)世界的許多領(lǐng)域廣泛存在,例如:生物醫(yī)學(xué)、金融、氣象學(xué)、自然科學(xué)等。時序處理技術(shù)是一種非常重要而有價值的技術(shù),已經(jīng)在許多重要領(lǐng)域成功應(yīng)用,例如:傳感器網(wǎng)絡(luò)監(jiān)控、金融數(shù)據(jù)分析、DNA序列分析、移動對象跟蹤以及運(yùn)動捕獲等。然而,時序是一種典型的高維和海量類型數(shù)據(jù),當(dāng)前時序處理技術(shù)依然面臨很大挑戰(zhàn)。
圍繞時序分段處理方法和分段時序的查詢優(yōu)化技術(shù),展開了五個方
2、面的研究工作:時序分段相關(guān)處理技術(shù)、基于聚類的靜態(tài)分段時序的查詢優(yōu)化方法、基于分區(qū)的靜態(tài)時序逆向近鄰查詢優(yōu)化方法、動態(tài)分段時序的特定模式查詢優(yōu)化方法、基于網(wǎng)格的動態(tài)分段時序的相關(guān)模式查詢優(yōu)化方法。
由于時序分段在時序處理技術(shù)中具有重要意義,針對缺乏動態(tài)非等長時序分段方法的問題,在詳細(xì)分析了靜態(tài)時序和動態(tài)時序的等長和非等長分段方法的基礎(chǔ)上,利用點(diǎn)對累積近似(Piecewise Aggregate Approximation,
3、PAA)和點(diǎn)對線性近似(Piecewise Linear Approximation,PLA)的增量計算特性,給出了一種多數(shù)據(jù)流的自適應(yīng)分段算法QONSP,并證明了它僅有線性的時間復(fù)雜度。實(shí)驗(yàn)結(jié)果表明,QONSP能對上千個動態(tài)時序進(jìn)行自適應(yīng)分段,通過調(diào)節(jié)參數(shù)可控制分段的精度和平均長度。
為了提高分段之后的靜態(tài)時序的查詢效率,研究了聚類對時序范圍查詢的影響。給出了一種基于等長分段的對稱低邊界函數(shù)SLBS,并證明了它下界于分段
4、時序間的歐氏距離。利用SLBS,給出了基于聚類的靜態(tài)時序范圍查詢優(yōu)化方法RQIC,它同時集成了靜態(tài)查詢優(yōu)化技術(shù),包括:first-k過濾、三角不等式修剪以及低邊界過濾。實(shí)驗(yàn)結(jié)果表明,RQIC在大部分?jǐn)?shù)據(jù)集上保持了60%以上的修剪能力,且與PLA查詢方法的查詢性能接近。
針對當(dāng)前缺乏基于B+樹索引的靜態(tài)分段時序查詢優(yōu)化方法,研究了分段靜態(tài)時序的逆向近鄰查詢優(yōu)化技術(shù)。通過利用靜態(tài)分段時序具有的普遍適應(yīng)的性質(zhì):任意兩個不同時序,
5、它們?nèi)绻麖恼w上且(或)在局部趨勢上保持相似,則它們將可能是靠近的對象,對靜態(tài)時序進(jìn)行分區(qū),并根據(jù)分區(qū)大小和分區(qū)相似度進(jìn)行分區(qū)分裂和合并,將分區(qū)后的時序?qū)ο笏饕揭活wB+樹中。最后,在著名算法iDistance基礎(chǔ)上,給出了基于過濾-精煉框架的查詢優(yōu)化方法RiDistance。實(shí)驗(yàn)結(jié)果表明,RiDistance是有效的,它的查詢效率比序列掃描方法快1~2數(shù)量級。
在對分段之后的動態(tài)時序的查詢處理方面,為了改進(jìn)存在的模式匹配
6、函數(shù)難以適應(yīng)快速數(shù)據(jù)流模式長度和幅度變化的問題,研究了動態(tài)分段時序的特定模式查詢優(yōu)化方法。引入了一種新的模式相似距離函數(shù),并證明它是一種度量函數(shù),因而可以利用三角不等式加快模式匹配速度。同時給出了一種快速的模式匹配算法和一種基于統(tǒng)計信息預(yù)測可能出現(xiàn)的模式的概率算法?;诮鹑跀?shù)據(jù)流的實(shí)驗(yàn)結(jié)果表明,給出的模式相似函數(shù)比其他同類函數(shù)更易適應(yīng)幅度偏移和縮放的變化,查詢方法能夠監(jiān)視大部分金融數(shù)據(jù)流中的特定模式。
進(jìn)一步地,針對子序列
7、匹配相關(guān)性查詢的缺點(diǎn)以及缺乏動態(tài)環(huán)境下的主題發(fā)現(xiàn)算法,研究了基于網(wǎng)格技術(shù)的動態(tài)分段時序相關(guān)性查詢優(yōu)化方法。引入了能適應(yīng)長度和幅度的變化的局部模式相似函數(shù)SDD,并證明了它滿足度量函數(shù)特性。利用前述的動態(tài)分段技術(shù)和SDD,給出了基于網(wǎng)格投影技術(shù)的相關(guān)性模型MCALP,它能夠監(jiān)控多數(shù)據(jù)流中的最小相關(guān)(交叉相關(guān))和最大相關(guān)(主題相關(guān)),并證明了它的兩個提高查詢效率的性能定理。該模型包括監(jiān)視最小相關(guān)的查詢方法MCPDG和P-主題查詢方法PMDG
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- Oracle數(shù)據(jù)查詢優(yōu)化方法研究.pdf
- 一個查詢優(yōu)化器的查詢優(yōu)化方法與實(shí)現(xiàn)技術(shù)研究.pdf
- 基于時鐘偏斜調(diào)度的VLSI時序優(yōu)化方法研究.pdf
- 大場景分段曲面重建和優(yōu)化方法.pdf
- Web信息集成系統(tǒng)及查詢優(yōu)化方法研究.pdf
- 基于查詢計劃的查詢優(yōu)化研究.pdf
- 基于GPU的復(fù)雜SQL查詢優(yōu)化方法研究.pdf
- 無線傳感網(wǎng)數(shù)據(jù)查詢優(yōu)化方法研究.pdf
- HBase多列查詢方法研究與優(yōu)化.pdf
- 空間查詢優(yōu)化研究.pdf
- 船舶建造分段制造計劃優(yōu)化方法及工具.pdf
- oracle數(shù)據(jù)庫sql查詢語句優(yōu)化方法研究
- 層次化物理設(shè)計中時序預(yù)算及優(yōu)化方法.pdf
- 基于分段動態(tài)時間彎曲的時間序列查詢.pdf
- MapReduce連接聚集查詢優(yōu)化方法的研究與實(shí)現(xiàn).pdf
- 基于多策略的流數(shù)據(jù)查詢優(yōu)化方法研究.pdf
- 數(shù)據(jù)倉庫查詢優(yōu)化方法及索引技術(shù)研究.pdf
- 一種分頁查詢優(yōu)化方法的研究與實(shí)現(xiàn).pdf
- 一種面向深層網(wǎng)絡(luò)的查詢優(yōu)化方法研究.pdf
- 漢語認(rèn)知數(shù)據(jù)庫查詢優(yōu)化方法研究及其應(yīng)用.pdf
評論
0/150
提交評論