

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、1,應用多元統(tǒng)計分析,第三章 多元正態(tài)總體 參數(shù)的假設檢驗(二),2,第三章 多元正態(tài)總體參數(shù)的假設檢驗目 錄(二),§3.3 多總體均值向量的檢驗§3.4 協(xié)差陣的檢驗§3.5 獨立性檢驗§3.6 正態(tài)性檢驗 第三章所涉及的最大似然估計量小結(jié),3,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗--兩個p元正態(tài)總體,當p
2、=1時,因,且相互獨立,故有,1. 兩總體協(xié)差陣相等(但未知)時均值向量的檢驗 設X(α)(α=1,…,n)為來自總體X~Np(μ(1),Σ)的隨機樣本;Y(α)(α=1,…,m)為來自總體Y~ Np(μ(2),Σ)的隨機樣本,且相互獨立,Σ未知.檢驗,4,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗--兩個p元正態(tài)總體,取檢驗統(tǒng)計量為,~ t (n+m-2) (在H0成立時) ,
3、即,5,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗--兩個p元正態(tài)總體,推廣到p元總體,檢驗統(tǒng)計量的形式類似,可考慮以下檢驗統(tǒng)計量T2:,其中A1和A2是兩總體的樣本離差陣.它們是一元統(tǒng)計中的偏差平方和∑(X(i)-X)2在p元情況下的推廣.以下來證明統(tǒng)計量T 2 ~T 2 (p,n+m-2).,,因,6,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗--兩個p元正
4、態(tài)總體,由Wishart分布的可加性知 A1+ A2~Wp(n+m-2,Σ),由T2統(tǒng)計量的定義3.1.5可知,7,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗--兩個p元正態(tài)總體,利用T2與F的關系,檢驗統(tǒng)計量取為,可以證明T2 (或F)統(tǒng)計量是檢驗以上假設H0的似然比統(tǒng)計量.(見習題3-10),8,第三章 多元正態(tài)總體參數(shù)的假設檢驗§
5、3.3 多總體均值向量的檢驗--兩總體均值檢驗例子,例3.3.1 為了研究日、美兩國在華投資企業(yè)對中國經(jīng)營環(huán)境的評價是否存在差異,今從兩國在華投資企業(yè)中各抽出10家,讓其對中國的政治、經(jīng)濟、法律、文化環(huán)境進行打分,評分結(jié)果見表3.2(表中1至10號為美國在華投資企業(yè)的代號,11至20號為日本在華投資企業(yè)的代號.數(shù)據(jù)來源于:國務院發(fā)展研究中心APEC在華投資企業(yè)情況調(diào)查). 解 比較日、美兩國在華投資企業(yè)對中國多方面的經(jīng)
6、營環(huán)境的評價是否有差異問題,就是兩總體均值向量是否相等的檢驗問題.,(見yydy331a.sas或yydy331b.sas),9,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗--兩總體均值檢驗例子,,10,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗--兩總體均值檢驗例子,記美國在華投資企業(yè)對中國4個方面的經(jīng)營環(huán)境的評價為4維總體X,并設X~N4(μ(1),Σ).日
7、本在華投資企業(yè)對中國經(jīng)營環(huán)境的評價為4維總體Y,并設Y~N4(μ(2),Σ). 來自兩總體的樣本容量n=m=10.檢驗,取檢驗統(tǒng)計量為,由樣本值計算得:X=(64, 43, 30.5, 63)′, Y=(51.5, 51, 40, 70.5)′,,,,11,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗--兩總體均值檢驗例子,進一步計
8、算可得:,12,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗--兩總體均值檢驗例子,對給定顯著性水平α=0.01,利用統(tǒng)計軟件進行檢驗時,首先計算p值(此時檢驗統(tǒng)計量F~F(4,15)): p=P{F≥6.2214}=0.0037 .因p值=0.0037<0.01=α,故否定H0,即日、美兩國在華投資企業(yè)對中國經(jīng)營環(huán)境的評價存在顯著性差異.在這種情況下,可能犯第
9、一類錯誤,且犯第一類錯誤的概率為0.01.,13,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗--兩個p元正態(tài)總體,2. 兩總體協(xié)差陣不等時均值向量的檢驗 在一元統(tǒng)計中(p=1時),當σ12≠ σ22時,檢驗H0:μ(1)=μ(2)也沒有很好的方法,以下介紹實用中的幾種方法. ① 當n=m時,作為成對數(shù)據(jù)進行處理.令Z(i)=X(i) -Y(i) (i=1,…,n),化為單個p元
10、總體Z的均值檢驗問題 H0:μ(1)=μ(2) H0: μZ=0 利用前面介紹的方法進行檢驗. 注意:在這里兩組樣本相互獨立的信息沒有利用.,14,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗--兩個p元正態(tài)總體,② 當n≠m時(不妨設n<m):想法也是化為單個p元新總體的均值檢驗問題.若只取n對數(shù)據(jù)按方法①處理,又將損失一些信息.改進的辦法是利用X(i
11、) (i=1,…,n)和Y(j) (j=1,…,m),構(gòu)造新總體Z的樣本Z(i) ,令,可以證明:,15,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗--兩個p元正態(tài)總體,所以Z(i) ~N p(μ(1)-μ(2),ΣZ) (i=1,…,n),且相互獨立.利用前面介紹的單個正態(tài)總體均值向量的檢驗方法進行檢驗. ③ 當Σ1 , Σ2相差甚大時, 可構(gòu)造近似檢驗統(tǒng)計量進行檢驗(見參考文獻[1
12、]).,其中,16,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗—多元方差分析,多個正態(tài)總體均值向量的檢驗問題也稱為多元方差分析 . 設有k個p元正態(tài)總體Np(μ(t),Σ) (t=1,…,k),樣品 (t=1,…,k,α=1,…,nt )是來自Np(μ(t),Σ)的隨機樣本,檢驗 H0:μ(1)=…=μ(k),H1:至少存在i≠j使得μ(i)≠μ(j)
13、 (即μ(1),…,μ(k)中至少有一對不等).,當p=1時,此檢驗問題就是一元方差分析問題,比如比較k個不同品牌的同類產(chǎn)品中一個質(zhì)量指標X(如耐磨度)有無顯著差異的問題,我們把不同品牌對應不同總體(假定為正態(tài)總體),這種多組比較問題就是檢驗問題.,17,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗—多元方差分析,,從第i個總體抽取容量為n
14、i的隨機樣本如下(i=1,…,k;記n=n1+n2+…+nk):,18,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗—多元方差分析(p=1),,當p=1時,利用一元方差分析的思想來構(gòu)造檢驗統(tǒng)計量.記,則有平方和分解公式: SST=SSA+SSE,19,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗—多元方差分析
15、(p=1),,直觀考察,若H0成立(即k個總體均值無顯著差異),當總偏差平方和SST固定不變時,應有組間偏差平方和 SSA小,而組內(nèi)偏差平方和 SSE大,因而比值SSA/SSE應很小. 檢驗統(tǒng)計量取為,給定顯著性水平α,按傳統(tǒng)檢驗方法,查F分布臨界值表得Fα滿足: P{F>Fα}=α,否定域W={F>Fα }.,20,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗—多元方
16、差分析,,推廣到k個p元總體Np(μt,Σ) (假定k個總體的協(xié)差陣相等,且記為Σ),記第i個p元總體的數(shù)據(jù)陣為,對總離差陣進行分解:,21,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗—多元方差分析,,其中,稱為組間離差陣.,故交叉項=O,,稱為組內(nèi)離差陣.,22,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗—多元方差分析,,根據(jù)直觀想法及用似然比原理得到檢
17、驗H0的統(tǒng)計量為,由Wishart分布的定義容易得出: ① 因 Ai ~Wp(ni-1,Σ)且相互獨立(i=1,…,k),由可加性可得A=A1+…+Ak~Wp(n-k,Σ) (n=n1+…+nk). ② 在H0下,T~Wp (n-1,Σ). ③ 還可以證明在H0下,B~Wp(k-1,Σ),且B與A相互獨立.,23,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗—多元方差
18、分析,根據(jù)Λ分布的定義,可知,給定顯著性水平α,查Wilks分布臨界值表,可得λα,使 P{Λ<λα}=α,故否定域W={Λ<λα }. 當手頭沒有Wilks臨界值表時,可用χ2分布或F分布來近似,即由Λ的函數(shù)的近似分布進行檢驗(見參考文獻[1]或[2]).,24,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗—多元方差分析的例子,,例3.3.2
19、 為了研究某種疾病,對一批人同時測量了四個指標:β脂蛋白(X1),甘油三酯(X2),α脂蛋白(X3),前β脂蛋白(X4).按不同年齡、不同性別分為三組(20至35歲的女性、20至25歲的男性和35至50歲的男性),數(shù)據(jù)見書中表3.3.試問這三組的四項指標間有無顯著性差異? 解 比較三個組(k=3)的4項指標(p=4)間是否有差異問題,就是多總體均值向量是否相等的檢驗問題.設第i組為4維總體N4(μ(i),Σ)(i=1,
20、2,3).來自3個總體的樣本容量n1=n2=n3=20.檢驗 H0: μ(1)=μ(2)=μ(3) H1:μ(1),μ(2),μ(3)至少有一對不相等.,( 見yydy332?.sas ),25,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗--兩總體均值檢驗例子,,26,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗--多元方差分析的例子,因似然比統(tǒng)計量Λ
21、~Λ(p,n-k,k-1),此例中k-1=2,可以利用Λ統(tǒng)計量與F統(tǒng)計量的關系,取檢驗統(tǒng)計量為F統(tǒng)計量:,由樣本值計算得:X=(259.08, 84.12, 32.37, 17.8)′,,,27,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗--多元方差分析的例子,28,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗--多元方差分析的例子,進一步計算可得,對給定α
22、=0.01,利用統(tǒng)計軟件(如SAS系統(tǒng)),首先計算p值(此時檢驗統(tǒng)計量F~F(8,108)): p=P{F≥3.09007}=0.003538.因p值=0.003538<0.01=α,故否定H0,這表明三個組的指標之間有顯著的差異.在這種情況下,可能犯第一類錯誤,且第一類錯誤的概率為0.01.,29,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗--多元方差分
23、析的例子,進一步地若還想了解三個組指標間的差異究竟是哪幾項指標引起的,可以對4項指標逐項用一元方差分析方法進行檢驗,我們將發(fā)現(xiàn)三組指標間只有第一項指標X1有顯著差異. 事實上,用一元方差分析檢驗第一項指標X1在三個組中是否有顯著差異時,因,30,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.3 多總體均值向量的檢驗--多元方差分析的例子,其中t11和a11分別是T和A中的第一個對角元素.
24、 p1=P{F1≥8.8780}=0.0004401(檢驗統(tǒng)計量F1~F(2,57))p值=0.0004401顯著地小于0.01,故第一項指標X1在三個組中有顯著差異.,31,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.4 協(xié)差陣的檢驗--單個p元正態(tài)總體,設X(α)(α=1,…,n)為來自p元正態(tài)總體Np(μ,Σ)(Σ>0未知)的隨機樣本,檢驗 H0:Σ= Σ0(Σ0>0為已知陣),H1:Σ≠Σ
25、0 1. 當Σ0 =Ip時檢驗H0:Σ=Ip,H1:Σ≠Ip 利用似然比原則來導出檢驗統(tǒng)計量λ1,當Σ=Ip成立時,似然函數(shù)L(μ,Ip)在μ=X達最大值.,,32,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.4 協(xié)差陣的檢驗--單個p元正態(tài)總體,所以似然比統(tǒng)計量,其中,33,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.4 協(xié)差陣的檢驗--單個p元正態(tài)總體,利用定理3.2.1可知,當n很大
26、且H0成立時, ξ=-2lnλ1的近似分布為χ2(p(p+1)/2),參數(shù)空間?的維數(shù)為p+p(p+1)/2,而?0的維數(shù)為p,故卡方分布的自由度為p(p+1)/2. 取ξ作為檢驗統(tǒng)計量,按傳統(tǒng)檢驗方法,對給定顯著性水平α,否定域為 {ξ>χα2},其中χα2 滿足:P{ξ> χα2 }=α.,34,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.4 協(xié)差陣的檢驗--單個p元
27、正態(tài)總體,2. 當Σ0 ≠I p時檢驗H0 :Σ=Σ0 ,H1 :Σ≠Σ0 因Σ0>0,存在p階非退化陣D,使DΣ0D′=I p, 令 Y(α)=DX (α)(α=1,…,n),則Y(α)~N p(Dμ,DΣD′)==N p(μ*,Σ*)檢驗H 0 :Σ=Σ0 H0 :Σ*= I p 從新樣本Y(α)(α=1,…,n)出發(fā),檢驗H0:Σ*=Ip的檢驗統(tǒng)計量取為,記為,3
28、5,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.4 協(xié)差陣的檢驗--單個p元正態(tài)總體,其中,若注意到DΣ0D′=I p ,即,,36,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.4 協(xié)差陣的檢驗--單個p元正態(tài)總體,研究似然比統(tǒng)計量λ2的抽樣分布是很困難的.通常根據(jù)定理3.2.1由λ2的近似分布來構(gòu)造檢驗法. 當樣本容量n很大,在H0成立時,-2lnλ2 的極限分布為χ2(p(p+1)/
29、2). 除此外在不同適用范圍下還有其它近似分布可用來構(gòu)造檢驗法.,則似然比統(tǒng)計量λ2還可以表示為,37,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.4 協(xié)差陣的檢驗--單個p元正態(tài)總體,3. 檢驗H0:Σ=σ2Σ0 (σ2 未知) 當Σ0 =Ip 時此檢驗常稱為球性檢驗.利用似然比原則來導出檢驗統(tǒng)計量λ3:,當σ2給定時,似然函數(shù)L(μ,σ2Σ0)在μ=X達最大值,且,,38,第三章 多元
30、正態(tài)總體參數(shù)的假設檢驗§3.4 協(xié)差陣的檢驗--單個p元正態(tài)總體,,可得出,39,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.4 協(xié)差陣的檢驗--單個p元正態(tài)總體,所以似然比統(tǒng)計量,或等價于,當樣本容量n很大,在H0為真時有以下近似分布:,40,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.4 協(xié)差陣的檢驗--多個p元正態(tài)總體,設有k個總體Np(μ(t),Σt)(t=1,…,k),X(α)(
31、t)(t=1,…,k;α=1,…,n t)來自第t個總體Np(μ(t) ,Σt )的隨機樣本,記n=n1+n2+…+nk. 檢驗H0 :Σ1=Σ2=…=Σk≡Σ,H1 : Σ1, Σ2,…,Σk不全相等. 樣本{ X(α)(t)}的似然函數(shù)為,似然比統(tǒng)計量λ4為,,41,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.4 協(xié)差陣的檢驗--多個p元正態(tài)總體,42,第三章 多元正態(tài)總體參數(shù)的假設檢驗
32、67;3.4 協(xié)差陣的檢驗--多個p元正態(tài)總體,則似然比檢驗統(tǒng)計量為,( 其中 A=A1+…+Ak),43,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.4 協(xié)差陣的檢驗--多個p元正態(tài)總體,根據(jù)無偏性的要求進行修正,將λ4中的ni用ni -1替代,n用n-k替代.然后對λ4取對數(shù),可得到統(tǒng)計量:,當樣本容量n很大時,在H0為真時M有以下近似分布: (1-d)M=-2(1-d)lnλ4*~χ2(f)
33、其中 f=p(p+1)(k-1) /2,,44,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.4 協(xié)差陣的檢驗--多個p元正態(tài)總體(例),例3.4.1 對例3.3.2表3.3中給出的身體指標化驗數(shù)據(jù),試判斷三個組(即三個總體)的協(xié)差陣是否相等(α=0.10) 解 這是三個4維正態(tài)總體的協(xié)差陣是否相等的檢驗問題.設第i組為4維總體N4(μ(i),Σi)(i=1,2,3).來自三個總體的樣本容量n1=n2=n
34、3=20.檢驗H0:Σ1=Σ2=Σ3,H1:Σ1,Σ2,Σ3至少有一對不相等.在H0成立時,取近似檢驗統(tǒng)計量為χ2(f)統(tǒng)計量:,由樣本值計算三個總體的樣本協(xié)差陣:,45,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.4 協(xié)差陣的檢驗--多個p元正態(tài)總體(例),,,46,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.4 協(xié)差陣的檢驗--多個p元正態(tài)總體(例),47,第三章 多元正態(tài)總體參數(shù)的假設檢驗
35、§3.4 協(xié)差陣的檢驗--多個p元正態(tài)總體(例),進一步計算可得,48,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.4 協(xié)差陣的檢驗--多個p元正態(tài)總體(例),對給定α=0.10,利用統(tǒng)計軟件(如SAS系統(tǒng)),首先計算p值(設檢驗統(tǒng)計量ξ~χ2(20)):p=P{ξ≥ 20.331621}=0.4373646.因p值=0.4373646>0.10=α,故H0相容,這表明三個組的協(xié)差陣之間沒
36、有顯著的差異.,49,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.4 --多個正態(tài)總體均值向量和協(xié)差陣的同時檢驗,設有k個總體Np(μ(t),Σt)(t=1,…,k), X(α)(t)(t=1,…,k; α=1,…,nt)來自第t個總體Np(μt ,Σt )的隨機樣本,記n=n1+n2+…+nk. 檢驗 H0 : μ(1) = μ(2) =… =μ(k) =μ, Σ1=Σ2=…=Σk = Σ, H1
37、 : μ(1) , μ(2) ,… ,μ(k) 或Σ1, Σ2,…,Σk不全相等.,記,50,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.4 --多個正態(tài)總體均值向量和協(xié)差陣的同時檢驗,似然比統(tǒng)計量λ5為,51,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.4 --多個正態(tài)總體均值向量和協(xié)差陣的同時檢驗,則檢驗以上假設H0的樣本{ X(t)(α)} 似然函數(shù)為,52,第三章 多元正態(tài)總體參數(shù)的假設檢驗&
38、#167;3.4 --多個正態(tài)總體均值向量和協(xié)差陣的同時檢驗,若用Λ表示當協(xié)差陣均相同時檢驗k個總體均值向量是否相等的似然比統(tǒng)計量,將發(fā)現(xiàn)這里的檢驗統(tǒng)計量λ5=Λ·λ4 . 在實際應用中我們采用類似的修正方法,在λ5中用nt-1替代nt,用n-k替代n.修正后的統(tǒng)計量記為λ5*:,53,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.4 --多個正態(tài)總體均值向量和協(xié)差陣的同時檢驗,當樣本容量n很大,在H0為
39、真時λ5*有以下近似分布:,其中,54,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.4 --多個正態(tài)總體均值向量和協(xié)差陣的同時檢驗,例3.4.2 對例3.3.2表3.3給出的身體指標化驗數(shù)據(jù),試判斷三個組(即三個總體)的均值向量和協(xié)差陣是否全都相等(α=0.05)? 解 這是三個4維正態(tài)總體的均值向量和協(xié)差陣是否同時相等的檢驗問題.取近似檢驗統(tǒng)計量為近似χ2統(tǒng)計量: ξ==-2(1-
40、b)lnλ5* ~χ2( f ).由樣本值計算三個總體的樣本協(xié)差陣見例3.4.1,所有樣本的總離差陣T見例3.3.2.進一步計算可得,55,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.4 --多個正態(tài)總體均值向量和協(xié)差陣的同時檢驗,對給定α=0.05,利用統(tǒng)計軟件(如SAS系統(tǒng)),首先計算p值(設檢驗統(tǒng)計量ξ~ χ2(28)): p=P{ξ≥ 43.1408}= 0.03373.因p值=0.0337
41、3<0.05=α,故否定H0,這表明三個組的均值向量和協(xié)差陣之間有顯著的差異.在這種情況下,可能犯第一類錯誤,且第一類錯誤的概率0.05.,,56,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.5 獨立性檢驗,設總體X~Np(μ,Σ),將X剖分為k個子向量,而μ和Σ也相應剖分為,其中p= p1+…+ pk,且知pt維子向量X(t)~Npt(μ(t),Σtt) (t=1,…,k). 若k個隨機子向量相互獨
42、立,把p維(高維)隨機向量的問題化為k個低維隨機向量的問題來處理,在處理多元統(tǒng)計分析的許多問題中將帶來極大的方便.,57,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.5 獨立性檢驗,在第二章我們已介紹過若X(1),…,X(k)相互獨立,則有Σij =O(對一切i≠j).因此檢驗X(1),…,X(k)是否相互獨立的問題等價于檢驗對任二個子向量,其協(xié)差陣Σij 是否等于O(對一切i≠j). 在正態(tài)總體下,獨立性
43、檢驗可化為檢驗H0: Σij =O(一切i≠j),H1: Σij ≠O,至少有一對i≠j. 設X(t)(t=1,…,n,n>p)為來自總體X的隨機樣本.將樣品X(t) ,樣本均值X和樣本離差陣A作相應剖分為,,58,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.5 獨立性檢驗,用似然比原理,在H0成立時, X(t)(α) ~ Npt(μ(t),Σtt )(t=1,…,k; α=1,…,n) 且相互獨立,故
44、樣本的似然函數(shù)為,所以似然比統(tǒng)計量的分子為,59,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.5 獨立性檢驗,似然比統(tǒng)計量為,Box證明了,在H0成立下當n→∞時,-blnV~χ2(f),其中,60,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.5 獨立性檢驗--例,例3.4.1 試檢驗例3.2.1女性汗液數(shù)據(jù)中隨機向量X的三個分量是否相互獨立(α=0.05). 解 記隨機向量X=(X1,X2
45、,X3)′,假定X~N3(μ,Σ),且記Σ=(σij).檢驗 H0:σ12=0,σ13=0,σ23=0, H1: σ12,σ13,σ23不全為0. 取檢驗統(tǒng)計量為,當X的三個分量相互獨立,且樣本容量n很大時,ξ近似于χ2(f) .,61,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.5 獨立性檢驗--例,由表3.1的樣本值計算樣本離差陣A,可得:,此例中n=20, p=3, p1=p2=p3=1, k=3.進
46、一步計算可得: b=17.1667, f=3,,62,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.5 獨立性檢驗--例,對給定顯著性水平α=0.05,用統(tǒng)計軟件SAS系統(tǒng)計算時,通過計算p值進行檢驗: p=P{ξ≥9.7555}=0.02076.因p值=0.02076<0.05=α,故否定H0,即隨機向量的三個分量不相互獨立.在這種情況下,可能犯第一類錯誤,且第一類錯誤的概
47、率為0.05.,63,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.6 正態(tài)性檢驗,,在均值和協(xié)差陣的檢驗中,以及以后將介紹的一些統(tǒng)計方法中都是假定樣本來自p元正態(tài)總體.所作統(tǒng)計推斷的結(jié)論是否正確,在某種意義上取決于實際總體與正態(tài)總體接近的程度如何?因此建立一些方法來檢驗多元觀測數(shù)據(jù)與多元正態(tài)數(shù)據(jù)的差異是否顯著是十分必要的. 設X(α)=(Xα1 , …, Xαp)′ (α=1,…,n)是來自p元總體X的樣本,試
48、問總體X是否服從Np(μ,Σ)分布? 若總體X=(X1,…,Xp)′~Np(μ,Σ),利用多元正態(tài)分布的一些性質(zhì)可知(記μ=(μ1,…,μp)′,Σ=(σij)p×p ): ,64,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.6 正態(tài)性檢驗,① 每個分量Xi~N(μi,σii) (i=1,…,p). ② 任二個分量(Xi , Xj )~二元正態(tài)分布. ③ 設l=(l1,…,
49、lp)′為任給的p維常向量,令ξ=l′X,則ξ~N1( l′μ,l′Σl ). ④ 令η=(X-μ)′Σ-1(X-μ),則η~χ2(p). ⑤ 正態(tài)隨機向量X的概率密度等高線為橢球.,若總體X為多元正態(tài)總體,必具有以上所列的幾條性質(zhì).如果X具有以上這些性質(zhì),也不一定能得出X為p元正態(tài)分布.但如果經(jīng)過檢驗,比如發(fā)現(xiàn)某個分量Xi與正態(tài)分布有顯著差異,即可得出p元總體X與p元正態(tài)分布也有顯著差異.利用以上性質(zhì),要來
50、構(gòu)造出好的滿意的多元正態(tài)的整體性檢驗十分困難.,65,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.6正態(tài)性檢驗--一維邊緣分布的正態(tài)性檢驗,在實際應用中如果經(jīng)過從多方面得到的檢驗結(jié)果與正態(tài)分布均無顯著性差異,也就認為該總體X與p元正態(tài)無顯著差異. 設p維隨機向量X=(X1,…,Xp)′,檢驗分量Xi~N(μi,σ2) (i=1,…,p) ,把p維正態(tài)性檢驗化為p個一維數(shù)據(jù)的正態(tài)性檢驗.常用的檢驗方法有以下幾種
51、. 1. χ2檢驗法 這是適用于連續(xù)型或離散型隨機變量分布的擬合優(yōu)度檢驗方法,也稱為Pearson χ2 檢驗法. 2. 柯氏(Kolmogorov,A.N.)檢驗法 這是適用于連續(xù)型分布的擬合優(yōu)度檢驗方法.,66,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.6正態(tài)性檢驗--一維邊緣分布的正態(tài)性檢驗,3. 偏峰檢驗法 4. W (Wilks)檢驗
52、和D檢驗 5. Q-Q (QuantileQuantile)圖檢驗法 6. P-P (ProbabilityProbability )圖檢驗法 7. “3σ”原則檢驗法 8. A2和W2統(tǒng)計量檢驗法 方法3至方法8都是只適用于正態(tài)分布的檢驗法.,67,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.6正態(tài)性檢驗--二維數(shù)據(jù)的正態(tài)性檢驗,設X=(X1,…,Xp)′ 為
53、p維隨機向量,X的任二個分量的n次觀測數(shù)據(jù)記為X(i)=(Xi1,Xi2)′(i=1,…,n).下面介紹檢驗二維觀測數(shù)據(jù)是否來自二元正態(tài)分布的方法. 1. 等概橢圓檢驗法 若二維隨機向量X=(X1,X2)′~N2(μ,Σ),則X的概率密度函數(shù)等高線 f(x1,x2)=a ? (X-μ)′Σ-1(X-μ)=b2右邊是中心在(μ1,μ2)由(X-μ)′Σ-1(X-μ)=b2決定的橢圓.
54、由本章§3.1的介紹的知識可知 D2=(X-μ)′Σ-1(X-μ)~χ2 (2).對給定p0∈(0,1),則存在d0使 P{ D2 ≤d0}=p0 注:此檢驗法較粗糙,詳見教材P99例3.6.1,68,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.6正態(tài)性檢驗--二維數(shù)據(jù)的正態(tài)性檢驗,2. 二維數(shù)據(jù)的χ2圖檢驗法 因二維數(shù)據(jù)的χ2圖檢驗法與p
55、維數(shù)據(jù)的χ2圖檢驗法原理完全相同.故關于二維數(shù)據(jù)的χ2 圖檢驗方法請參閱下面p維數(shù)據(jù)的χ2圖檢驗方法.,69,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.6正態(tài)性檢驗--p維數(shù)據(jù)的正態(tài)性檢驗,設X(α)=(Xα1 , …, Xαp)′ (α=1,…,n)是來自p元總體X的樣本, 檢驗H0: X~Np(μ,Σ),H1:X不服從Np (μ,Σ). 1. χ2統(tǒng)計量的Q-Q圖檢驗法(或P-P圖檢驗法) 這是由
56、正態(tài)分布的性質(zhì)④構(gòu)造的檢驗法. 在H0下,樣品X到總體中心μ的廣義平方距離(或稱馬氏距離)D2(X,μ)記為D2 ,則有 D2 =(X-μ)′Σ-1(X-μ)~χ2(p)以下構(gòu)造的檢驗方法就是檢驗統(tǒng)計量D2是否~χ2(p).直觀的想法是:由樣品X(α)計算D2α(α=1,…,n),對D2α排序: ,70,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.6正態(tài)性檢驗--p維數(shù)據(jù)的正態(tài)性檢驗,
57、 D2(1)≤ D2(2) ≤…≤ D2(n) . 統(tǒng)計量 D2 的經(jīng)驗分布函數(shù)取為,其中H(D2(t) |p)表示χ2 (p)的分布函數(shù)在D2(t)的值. 設χ2 分布的pt分位數(shù)為χt2 ,顯然χt2滿足: H(χt 2 |p)= pt.即χ2 分布的pt 分位數(shù)χt2 =H-1(pt |p). 由經(jīng)驗分布得到樣本的
58、pt 分位數(shù)D2(t)=Fn-1(pt ).若H(x|p) ≈Fn(x),應有D2(t) ≈χt2 ,繪制點(D2(t) , χt2 )的散布圖,當X為正態(tài)總體時,這些點應散布在一條直線上.,71,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.6正態(tài)性檢驗--p維數(shù)據(jù)的正態(tài)性檢驗,這種檢驗法其實就是卡方分布的Q-Q圖檢驗法. 類似地也可以繪制點(pt , H(D2(t) |p))的散布圖,當X為正態(tài)總體時,這些點
59、也應散布在一條直線上.這種檢驗法其實就是卡方分布的P-P圖檢驗法. 具體檢驗步驟如下: ,,(1) 由n個p維樣本點X(α) (α=1,…,n)計算樣本均值X,樣本協(xié)差陣S:,72,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.6正態(tài)性檢驗--p維數(shù)據(jù)的正態(tài)性檢驗,(2) 計算樣品點X(t)到X的廣義平方距離(即馬氏距離),(3) 對廣義平方距離D2t 按從小到大的次序排序,(4) 計算pt=(t-0.5)/n
60、 (t=1, 2,…,n) ,χt2 ,其中χt2滿足: H(χt2 |p)= pt (或計算H(D2(t)|p)的值).,73,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.6正態(tài)性檢驗--p維數(shù)據(jù)的正態(tài)性檢驗,(5) 以平方距離為橫坐標,χ2 分位數(shù)為縱坐標作為平面坐標系,用n個點(D2(t) ,χt2 )繪制散點圖,即得到卡方分布的Q-Q圖;或者用另n個點(pt , H(D2(t) | p))繪制散點圖,即得卡
61、方分布的P-P圖. (6) 考察這n個點是否散布在一條通過原點,斜率為1的直線上.若是,接受數(shù)據(jù)來自p維正態(tài)總體的假設;否則拒絕正態(tài)性假設.,74,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.6正態(tài)性檢驗--p維數(shù)據(jù)的正態(tài)性檢驗,2. 主成分檢驗法 設X(i)=(Xi1, Xi2,…, Xip)′(i=1,…,n)為來自p維總體X=(X1,…,Xp)′的觀測數(shù)據(jù)(樣本).檢驗H0: X~Np(μ,
62、Σ),H1:X不服從Np(μ,Σ). 設樣本協(xié)差陣S的特征值為λ1≥λ2≥…≥λp>0,相應的特征向量為l1,l2,…,lp.記lt=(l1t , l2t ,… , lpt)′.令 Zt= l1t X1+ l2t X2+…+ lptXp (t=1,2,…,p)即新變量Z1,…,Zp 是X1,…,Xp的線性組合.且可以證明: Z1,…,Zp 是相互獨立的.,75,第三章 多元正態(tài)總體參數(shù)的假設檢驗§3.6正
63、態(tài)性檢驗--p維數(shù)據(jù)的正態(tài)性檢驗,p維觀測數(shù)據(jù)提供的信息大部分可由前幾個新變量所提供.這時p維數(shù)據(jù)的正態(tài)性檢驗可化為幾個相互獨立的新變量的一元數(shù)據(jù)的正態(tài)性檢驗.這些新變量在第七章主成分分析中被稱為主成分.故此檢驗法稱為主成分檢驗法. 如果正態(tài)性假設不能成立,一般應考慮對數(shù)據(jù)進行變換,使非正態(tài)數(shù)據(jù)更接近正態(tài),然后對變換后的數(shù)據(jù)進行統(tǒng)計分析.有關變換的方法請見參考文獻[5]、[6]或[7].,76,第三章 多元正態(tài)總體
64、參數(shù)的假設檢驗所涉及的最大似然估計量—單個總體,單個p維正態(tài)總體Np(μ,Σ),設X(i)(i=1,…,n)為來自p維總體的隨機樣本.樣本的似然函數(shù)為,,77,第三章 多元正態(tài)總體參數(shù)的假設檢驗所涉及的最大似然估計量—單個總體,,78,第三章 多元正態(tài)總體參數(shù)的假設檢驗所涉及的最大似然估計量—單個總體,,79,第三章 多元正態(tài)總體參數(shù)的假設檢驗所涉及的最大似然估計量—單個總體,,80,第三章 多元正態(tài)總體參數(shù)的假
65、設檢驗所涉及的最大似然估計量—兩個總體,兩個p維正態(tài)總體Np(μ(1),Σ)和Np(μ(2),Σ),設X(t)(i)( t=1,2; i=1,…,nt)為來自p維總體的隨機樣本.樣本的似然函數(shù)為(n=n1 + n2 ),81,第三章 多元正態(tài)總體參數(shù)的假設檢驗所涉及的最大似然估計量—兩個總體,82,第三章 多元正態(tài)總體參數(shù)的假設檢驗所涉及的最大似然估計量—兩個總體,83,第三章 多元正態(tài)總體參數(shù)的假設檢驗所涉及的最大
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論