版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第二章,時(shí)間序列的預(yù)處理,本章結(jié)構(gòu),平穩(wěn)性檢驗(yàn) 純隨機(jī)性檢驗(yàn),2.1平穩(wěn)性檢驗(yàn),特征統(tǒng)計(jì)量平穩(wěn)時(shí)間序列的定義平穩(wěn)時(shí)間序列的統(tǒng)計(jì)性質(zhì)平穩(wěn)時(shí)間序列的意義平穩(wěn)性的檢驗(yàn),概率分布,概率分布的意義隨機(jī)變量族的統(tǒng)計(jì)特性完全由它們的聯(lián)合分布函數(shù)或聯(lián)合密度函數(shù)決定 時(shí)間序列概率分布族的定義實(shí)際應(yīng)用的局限性,,特征統(tǒng)計(jì)量,均值 方差自協(xié)方差自相關(guān)系數(shù),,,,,平穩(wěn)時(shí)間序列的定義,嚴(yán)平穩(wěn)嚴(yán)平穩(wěn)是一種條件比較苛刻的平穩(wěn)性定
2、義,它認(rèn)為只有當(dāng)序列所有的統(tǒng)計(jì)性質(zhì)都不會(huì)隨著時(shí)間的推移而發(fā)生變化時(shí),該序列才能被認(rèn)為平穩(wěn)。寬平穩(wěn)寬平穩(wěn)是使用序列的特征統(tǒng)計(jì)量來(lái)定義的一種平穩(wěn)性。它認(rèn)為序列的統(tǒng)計(jì)性質(zhì)主要由它的低階矩決定,所以只要保證序列低階矩平穩(wěn)(二階),就能保證序列的主要性質(zhì)近似穩(wěn)定。,平穩(wěn)時(shí)間序列的統(tǒng)計(jì)定義,滿(mǎn)足如下條件的序列稱(chēng)為嚴(yán)平穩(wěn)序列滿(mǎn)足如下條件的序列稱(chēng)為寬平穩(wěn)序列,,,,嚴(yán)平穩(wěn)與寬平穩(wěn)的關(guān)系,一般關(guān)系嚴(yán)平穩(wěn)條件比寬平穩(wěn)條件苛刻,通常情況下,嚴(yán)平穩(wěn)
3、(低階矩存在)能推出寬平穩(wěn)成立,而寬平穩(wěn)序列不能反推嚴(yán)平穩(wěn)成立特例不存在低階矩的嚴(yán)平穩(wěn)序列不滿(mǎn)足寬平穩(wěn)條件,例如服從柯西分布的嚴(yán)平穩(wěn)序列就不是寬平穩(wěn)序列當(dāng)序列服從多元正態(tài)分布時(shí),寬平穩(wěn)可以推出嚴(yán)平穩(wěn),平穩(wěn)時(shí)間序列的統(tǒng)計(jì)性質(zhì),常數(shù)均值 自協(xié)方差函數(shù)和自相關(guān)函數(shù)只依賴(lài)于時(shí)間的平移長(zhǎng)度而與時(shí)間的起止點(diǎn)無(wú)關(guān) 延遲k自協(xié)方差函數(shù) 延遲k自相關(guān)系數(shù),,,,自相關(guān)系數(shù)的性質(zhì),規(guī)范性 對(duì)稱(chēng)性 非負(fù)定性 非唯一性,,,,平穩(wěn)時(shí)間序列的
4、意義,時(shí)間序列數(shù)據(jù)結(jié)構(gòu)的特殊性可列多個(gè)隨機(jī)變量,而每個(gè)變量只有一個(gè)樣本觀察值平穩(wěn)性的重大意義極大地減少了隨機(jī)變量的個(gè)數(shù),并增加了待估變量的樣本容量極大地簡(jiǎn)化了時(shí)序分析的難度,同時(shí)也提高了對(duì)特征統(tǒng)計(jì)量的估計(jì)精度,平穩(wěn)性的檢驗(yàn)(圖檢驗(yàn)方法),時(shí)序圖檢驗(yàn) 根據(jù)平穩(wěn)時(shí)間序列均值、方差為常數(shù)的性質(zhì),平穩(wěn)序列的時(shí)序圖應(yīng)該顯示出該序列始終在一個(gè)常數(shù)值附近隨機(jī)波動(dòng),而且波動(dòng)的范圍有界、無(wú)明顯趨勢(shì)及周期特征自相關(guān)圖檢驗(yàn) 平穩(wěn)序列通常具有短期
5、相關(guān)性。該性質(zhì)用自相關(guān)系數(shù)來(lái)描述就是隨著延遲期數(shù)的增加,平穩(wěn)序列的自相關(guān)系數(shù)會(huì)很快地衰減向零,例題,例2.1檢驗(yàn)1964年——1999年中國(guó)紗年產(chǎn)量序列的平穩(wěn)性例2.2檢驗(yàn)1962年1月——1975年12月平均每頭奶牛月產(chǎn)奶量序列的平穩(wěn)性例2.3檢驗(yàn)1949年——1998年北京市每年最高氣溫序列的平穩(wěn)性,例2.1時(shí)序圖,,例2.1自相關(guān)圖,,例2.2時(shí)序圖,,例2.2 自相關(guān)圖,,例2.3時(shí)序圖,,例2.3自相關(guān)圖,,2.2
6、純隨機(jī)性檢驗(yàn),純隨機(jī)序列的定義純隨機(jī)性的性質(zhì)純隨機(jī)性檢驗(yàn),純隨機(jī)序列的定義,純隨機(jī)序列也稱(chēng)為白噪聲序列,它滿(mǎn)足如下兩條性質(zhì),,標(biāo)準(zhǔn)正態(tài)白噪聲序列時(shí)序圖,,白噪聲序列的性質(zhì),純隨機(jī)性 各序列值之間沒(méi)有任何相關(guān)關(guān)系,即為 “沒(méi)有記憶”的序列 方差齊性 根據(jù)馬爾可夫定理,只有方差齊性假定成立時(shí),用最小二乘法得到的未知參數(shù)估計(jì)值才是準(zhǔn)確的、有效的,,,純隨機(jī)性檢驗(yàn),檢驗(yàn)原理假設(shè)條件檢驗(yàn)統(tǒng)計(jì)量 判別原則,,Barlett定理,
7、如果一個(gè)時(shí)間序列是純隨機(jī)的,得到一個(gè)觀察期數(shù)為 的觀察序列,那么該序列的延遲非零期的樣本自相關(guān)系數(shù)將近似服從均值為零,方差為序列觀察期數(shù)倒數(shù)的正態(tài)分布,假設(shè)條件,原假設(shè):延遲期數(shù)小于或等于 期的序列值之間相互獨(dú)立備擇假設(shè):延遲期數(shù)小于或等于 期的序列值之間有相關(guān)性,,,檢驗(yàn)統(tǒng)計(jì)量,Q統(tǒng)計(jì)量 LB統(tǒng)計(jì)量,,,判別原則,拒絕原假設(shè)當(dāng)檢驗(yàn)統(tǒng)計(jì)量大于 分位點(diǎn),或該統(tǒng)計(jì)量的P值小于 時(shí),則可以以 的置信水平拒絕
8、原假設(shè),認(rèn)為該序列為非白噪聲序列接受原假設(shè)當(dāng)檢驗(yàn)統(tǒng)計(jì)量小于 分位點(diǎn),或該統(tǒng)計(jì)量的P值大于 時(shí),則認(rèn)為在 的置信水平下無(wú)法拒絕原假設(shè),即不能顯著拒絕序列為純隨機(jī)序列的假定,,,例2.4:標(biāo)準(zhǔn)正態(tài)白噪聲序列純隨機(jī)性檢驗(yàn),,樣本自相關(guān)圖,檢驗(yàn)結(jié)果,由于P值顯著大于顯著性水平 ,所以該序列不能拒絕純隨機(jī)的原假設(shè)。,例2.5,對(duì)1950年——1998年北京市城鄉(xiāng)居民定期儲(chǔ)蓄所占比例序列的平穩(wěn)性與純隨機(jī)性進(jìn)行檢驗(yàn),例2.5時(shí)
9、序圖,,例2.5自相關(guān)圖,,例2.5白噪聲檢驗(yàn)結(jié)果,非平穩(wěn)時(shí)間序列平穩(wěn)化處理,Box-Cox變換f(x,λ)=(x^λ?1)/λ if λ ≠0 = log(x) if λ =0差分: B為后移算子BX[t]=X[t-1] B^d X[t]=X[t-d] d階差分 (1-B)^d X[t],Box-Cox 變換,library(MASS)library(car)library(pander)
10、l <- lm(Volume ~ log(Height) + log(Girth), data = trees) #建立線(xiàn)性模型qqPlot(l) #殘差的QQ圖,不大符合正態(tài)分布,,,boxcox(Volume ~ log(Height) + log(Girth), data = trees) #找lambda,,,boxcox(Volume ~ log(Height) + log(Girth), data = tr
11、ees, lambda = seq(-0.08, 0, length = 10)),,,kk=boxcox(Volume ~ log(Height) + log(Girth), data = trees, lambda = seq(-0.08,0, length = 10))kk$x[which(kk$y==max(kk$y))] # -0.06707071,,# 縮小尋找的范圍,大約是-0.067volume &
12、lt;- (trees$Volume^(-0.67) - 1)/(-0.067) #變換trees.t <- cbind(trees, volume) #重新擬合模型l.t <- lm(volume ~ log(Height) + log(Girth), data = trees.t) #建立線(xiàn)性模型qqPlot(l.t) #殘差可認(rèn)為是正態(tài)了,,,,pander(l.t)## ## ------------
13、--------------------------------------------------## Estimate Std. Error t value Pr(>|t|) ## ----------------- ---------- ------------ --------- ----------## **(Intercept)** -0.1368 1.517 -0.09022 0.9288
14、 ## ## **log(Height)** 1.745 0.3877 4.502 0.000108 ## ## **log(Girth)** 2.358 0.1422 16.58 5.213e-16 ## --------------------------------------------------------------## ## Table: Fitting linear model: volume ~ log
15、(Height) + log(Girth),,pander(anova(l.t))## ## -------------------------------------------------------------## Df Sum Sq Mean Sq F value Pr(>F) ## ----------------- ---- -------- --------- --------- --
16、-------## **log(Height)** 1 5.854 5.854 245.8 2.154e-15## ## **log(Girth)** 1 6.546 6.546 274.9 5.213e-16## ## **Residuals** 28 0.6669 0.02382 ## -------------------------------------------------------------## ##
17、 Table: Analysis of Variance Table,2.forecast包的BoxCox.lambda和BoxCox,BoxCox.lambda這個(gè)函數(shù)用于數(shù)值向量或時(shí)間序列,可以得到\lambda的估計(jì)精確值。library(forecast),,BoxCox.lambda(trees$Volume, method = "loglik") #算出來(lái)的結(jié)果和boxcox有點(diǎn)差異## [1]
18、-0.05volume.f <- BoxCox(trees$Volume, lambda = -0.05)trees.f <- cbind(trees, volume.f) #重新擬合模型l.f <- lm(volume.f ~ log(Height) + log(Girth), data = trees.f) #建立線(xiàn)性模型,,pander(l.f)## ## --------------------
19、------------------------------------------## Estimate Std. Error t value Pr(>|t|) ## ----------------- ---------- ------------ --------- ----------## **(Intercept)** -5.454 0.6731 -8.103 8.013e-09 ## #
20、# **log(Height)** 0.965 0.172 5.609 5.269e-06 ## ## **log(Girth)** 1.678 0.06313 26.58 2.073e-21 ## --------------------------------------------------------------## ## Table: Fitting linear model: volume.f ~ log(Hei
21、ght) + log(Girth),,pander(anova(l.f))## ## -------------------------------------------------------------## Df Sum Sq Mean Sq F value Pr(>F) ## ----------------- ---- -------- --------- --------- ------
22、---## **log(Height)** 1 2.534 2.534 540.1 7.646e-20## ## **log(Girth)** 1 3.315 3.315 706.7 2.073e-21## ## **Residuals** 28 0.1314 0.004691 ## -------------------------------------------------------------## ## Ta
23、ble: Analysis of Variance Table,qqPlot(l.f),,3.1 方法性工具,差分運(yùn)算延遲算子線(xiàn)性差分方程,差分運(yùn)算,一階差分 階差分 步差分,,,,延遲算子,延遲算子類(lèi)似于一個(gè)時(shí)間指針,當(dāng)前序列值乘以一個(gè)延遲算子,就相當(dāng)于把當(dāng)前序列值的時(shí)間向過(guò)去撥了一個(gè)時(shí)刻 記B為延遲算子,有,,,,延遲算子的性質(zhì),,其中,,,,,,,用延遲算子表示差分運(yùn)算,階差分 步差分,,,,,,,線(xiàn)
24、性趨勢(shì)采用1階差分 y[t]=(1-B) X[t]=X[t]-X[t-1]拋物線(xiàn)趨勢(shì)采用2階差分 y[t]=(1-B) ^2X[t]=X[t]+X[t-2]-2X[t-1],季節(jié)差分,y[t]=(1-B^s) X[t]=X[t]-X[t-s] s 為周期 月度數(shù)據(jù) s=12 季度數(shù)據(jù)s=4,對(duì)數(shù)變換與差分運(yùn)算結(jié)合,金融經(jīng)濟(jì)數(shù)據(jù) 工業(yè)總產(chǎn)值 y[t]=(1-B)^2 log(X[t]) 股票收盤(pán)
25、價(jià) y[t]=(1-B) log(X[t])=log(X[t]/X[t-1]) 稱(chēng)為股票收益率,采用泰勒展開(kāi) 約為 y[t]=(X[t]-X[t-1])/X[t-1],線(xiàn)性差分方程,線(xiàn)性差分方程齊次線(xiàn)性差分方程,,,齊次線(xiàn)性差分方程的解,特征方程特征方程的根稱(chēng)為特征根,記作齊次線(xiàn)性差分方程的通解不相等實(shí)數(shù)根場(chǎng)合有相等實(shí)根場(chǎng)合復(fù)根場(chǎng)合,,,,非齊次線(xiàn)性差分方程的解,非齊次線(xiàn)性差分方程的特解使得非齊
26、次線(xiàn)性差分方程成立的任意一個(gè)解非齊次線(xiàn)性差分方程的通解齊次線(xiàn)性差分方程的通解和非齊次線(xiàn)性差分方程的特解之和,,,,異常值處理,數(shù)值檢驗(yàn) 缺損值的補(bǔ)足模型分析,數(shù)值檢驗(yàn),if mean(X[1:t])-k sd(X[1:t])<X[t+1]< mean(X[1:t])+k sd(X[1:t]) k=6, #6 sigma, X[t+1] 正常 否則 為離群點(diǎn) 如果為離群點(diǎn) X*[t+1]=2X[
27、t]-X[t-1] #線(xiàn)性外推,缺損值的補(bǔ)足,平滑法 插值估算法,模型分析,估計(jì)模型 殘差分析 如果殘差分析不能通過(guò),則替換或加入啞變量,例子: 人口自然增長(zhǎng)率收集,時(shí)間跨度1950-2005時(shí)間間隔相同, 年度數(shù)據(jù) ,不允許出現(xiàn)半年,2年等間隔數(shù)據(jù) 統(tǒng)一計(jì)算方法:(年初+年末)/2,序列范圍一致性:雖然1997香港回歸,并不能計(jì)算進(jìn)入。 統(tǒng)一指標(biāo)口徑:出生后但隨后死亡,列入出生也例如死亡。,趨勢(shì)因子和季節(jié)因子的估計(jì)與
28、去除,時(shí)間序列經(jīng)典分解 y[t]=m[t]+S[t]+a[t] m[t]為趨勢(shì)因子, S[t] 為季節(jié)因子 a[t]為隨機(jī)因子,無(wú)季節(jié)因子,僅趨勢(shì)因子,y[t]=m[t]+a[t],去除m[t]方法:最小二乘法滑動(dòng)平均法差分方法,最小二乘法,用函數(shù)參數(shù)族擬合m[t] 例如 m[t]=a+bt+ct^2 極小化 sum(y[t]- a-bt-ct^2)^2得到 a,b,c的估計(jì),讀取人口,y=scan
29、()3929214530848372398819638453128607021706335323191876314433213855837150189209629797667621216892228496103021537123202624132164569151325798179323175203302031226545805,讀取時(shí)間,x=scan()1790180018101820
30、1830184018501860187018801890190019101920193019401950196019701980,,fit=lm(y~x+I(x^2))summary(fit)plot(x,y)lines(fit$fitted.values~x)plot(x,fit$residuals,type="l"),滑動(dòng)平均(低通濾波,線(xiàn)性濾波器),雙邊平滑 m[t] 在[
31、t-q,t+q]近似線(xiàn)性 m1[t] =sum(y[t-q:t+q])/(2q+1) =mean(y[t-q:t+q]) =mean(m[t-q:t+q])+mean(a[t-q:t+q]) ≈ mean(m[t-q:t+q]) ≈m[t]mean(a[t-q:t+q]) 快速震蕩 m[t]緩慢變化趨勢(shì),,z=scan()47375117509134684320382536733694
32、3708333333673614336236553963440545955045570057165138501053536074503156485506423048273885,,x1=seq(1951,1980,by=1)n=length(z);m=rep(0,n); q=2for(t in (q+1):(n-q)){m[t]=mean(z[(t-q):(t+q)])},SMOOTH
33、程序, 左邊,#0.1<a<0.3a=0.2 for(t in 1:q){m1=0 for(j in 0: (n-t))m1=m1+a*(1-a)^j*z[t+j] m[t]=m1},右邊,for(t in (n-q+1):n){m1=0 for(j in 0: (t-1))m1=m1+a*(1-a)^j*z[t-j] m[t]=m1},,plot(x1,z,type="l")
34、lines(x1,m,col="red")w=z-mplot(x1,w,type="l"),遞歸關(guān)系,tn-q m[t]=sum_{j=0}^{t-1} a(1-a)^j y[t-j],差分,k 階差分作用k次多項(xiàng)式趨勢(shì)項(xiàng),其結(jié)果為常數(shù)(歸納法可證)人口數(shù)據(jù)2階差分z=diff(y,differences=2)plot(x[-c(1:2)],z,type="l&qu
35、ot;),趨勢(shì)項(xiàng)和季節(jié)項(xiàng)同時(shí)存在,y[t]=m[t]+S[t]+a[t] 周期d; S[t+d]=S[t] sum(S[1:d])=0例月度數(shù)據(jù) d=12 ,n年 第j 年第k 個(gè)月數(shù)據(jù)記為y[k,j],月事故死亡率,年,月,,X=scan()900781068928913710017108261137110744971399389161892777506981803884228714
36、951210120982387439129871086808162730681247870938795561009396208285843381608034771774617776792586348945100789179803784887874864777926957772681068890929910625930283148850826587967
37、836689277918129911594341048498279110907086339240,方法一、小趨勢(shì)法,設(shè)第j年趨勢(shì)相同為M[j],由于 mean(S[1:d])=0 則M[j]=mean(y[1:d,j]) S[k]=mean(y[k,1:n]-M[1:n]),,XM=matrix(X,12,6)ts.plot(X)M=apply(XM,2,mean)d=12S=rep(0,12
38、)for(i in 1:d)S[i]=mean(XM[i,]-M),,n=6;Y1=Xfor(i in 1:n){for(j in 1:d)Y1[j+(i-1)*d]=X[j+(i-1)*d]-M[i]-S[j]}ts.plot(Y1),方法二 、滑動(dòng)平均,第一步 用滑動(dòng)平均估計(jì)去趨勢(shì)項(xiàng) 1.周期d=2q偶數(shù)時(shí) m[t]=(sum(y[t-q+1:t+q-1]) +1/2(y[t-q]+y[
39、t+q]))/d 2.周期為d=2q+1奇數(shù) m[t]=mean(y[t-q:t+q]),,q=d/2m=rep(0,12*6)for(t in (q+1):(12*6-q))m[t]=(sum(X[(t-q+1):(t+q-1)])+X[t-q]/2+X[t+q]/2)/d,第二步去季節(jié)項(xiàng),w[k]為y[k+j*d]-m[k+j*d], q<=k+jd<=n-q的平均值,這里1<=k<=d 因?yàn)?/p>
40、sum(w[k])不等于0 所以S[k]=w[k]-mean(w[1:d]),w=rep(0,d);N=12*6for(k in 1:d){w1=0;j=ceiling((q-k)/d);j1=0while(k+j*d<=N-q){w1=w1+X[k+j*d]-m[k+j*d]j=j+1;j1=j1+1}w[k]=w1/j1},,a=0.2;N=length(X) for(t in 1:q){m1=0 f
41、or(j in 0: (N-t))m1=m1+a*(1-a)^j*X[t+j] m[t]=m1},,for(t in (N-q+1):N){m1=0 for(j in 0: (t-1))m1=m1+a*(1-a)^j*X[t-j] m[t]=m1},,Y2=Xfor(i in 1:6){for(j in 1:d)Y2[j+(i-1)*d]=X[j+(i-1)*d]-m[j+(i-1)*d]-S[j]}x1=c
42、(1:n)ts.plot(Y2)lines(x1,Y1,col="red"),方法三、 差分,d步差分去季節(jié)y[t]-y[t-d] 再采用多部差分去趨勢(shì),,ts.plot(Y1)lines(Y2,col="red")Y3=c(rep(0,d),diff(X,lag=12))lines(Y3,col="blue")Y4=c(rep(0,d+1),diff(diff(
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 第二章隨機(jī)過(guò)程和隨機(jī)序列
- 第二章連續(xù)時(shí)間系統(tǒng)的時(shí)域分析
- 第二章-樣品前處理技術(shù)
- 第二章秸稈收集處理體系
- 第二章 坐標(biāo)系統(tǒng)和時(shí)間系統(tǒng)
- 第二章
- 第二章
- 第二章 時(shí)間價(jià)值與風(fēng)險(xiǎn)價(jià)值--1
- 第二章 時(shí)間價(jià)值與風(fēng)險(xiǎn)價(jià)值--2
- 數(shù)字信號(hào)處理 答案 第二章
- 第二章誤差及數(shù)據(jù)處理
- 第二章
- 第二章 金屬材料熱處理
- 第二章實(shí)數(shù)(二)
- 第二章[0001]
- 擼(第二章)
- 第二章緒論
- 第二章極限
- 第二章 實(shí)數(shù)
- 第二章例題
評(píng)論
0/150
提交評(píng)論