spss-第6講-非參數(shù)檢驗_第1頁
已閱讀1頁,還剩75頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第6講 非參數(shù)檢驗,前面已經(jīng)討論的許多統(tǒng)計分析方法對總體有特殊的要求,如T檢驗要求總體符合正態(tài)分布,F(xiàn)檢驗要求誤差呈正態(tài)分布且各組方差整齊,等等。這些方法常用來估計或檢驗總體參數(shù),統(tǒng)稱為參數(shù)檢驗。,但許多調(diào)查或?qū)嶒炈玫目蒲袛?shù)據(jù),其總體分布未知或無法確定。因為有的數(shù)據(jù)不是來自所假定分布的總體,或者數(shù)據(jù)根本不是來自一個總體,還有可能數(shù)據(jù)因為某種原因被嚴重污染,這樣在假定分布的情況下進行推斷的做法就有可能產(chǎn)生錯誤的結(jié)論。此時人們希望檢驗對一

2、個總體分布形狀不必作限制。,這種不是針對總體參數(shù),而是針對總體的某些一般性假設(shè)(如總體分布)的統(tǒng)計分析方法稱非參數(shù)檢驗(Nonparametric Tests)。 非參數(shù)檢驗對數(shù)據(jù)分布沒有要求,適于參數(shù)檢驗的數(shù)據(jù)都可以用非參數(shù)檢驗的方法進行檢驗,有研究表明,非參數(shù)檢驗的統(tǒng)計效能大約為參數(shù)檢驗的95%,這是一個能夠接受的水平。 非參數(shù)檢驗根據(jù)樣本數(shù)目以及樣本之間的關(guān)系可以分為單樣本非參數(shù)檢驗、兩獨立樣本非參數(shù)檢驗、多獨立樣

3、本非參數(shù)檢驗、兩配對樣本非參數(shù)檢驗和多配對樣本非參數(shù)檢驗幾種。,6.1.1 統(tǒng)計學上的定義和計算公式,6.1 SPSS單樣本K-S檢驗,定義:單樣本K-S檢驗是以兩位前蘇聯(lián)數(shù)學家Kolmogorov和Smirnov命名的,也是一種擬合優(yōu)度的非參數(shù)檢驗方法。單樣本K-S檢驗是利用樣本數(shù)據(jù)推斷總體是否服從某一理論分布的方法,適用于探索連續(xù)型隨機變量的分布形態(tài)。,單樣本K-S檢驗可以將一個變量的實際頻數(shù)分布與正態(tài)分布(Normal)、均勻

4、分布(Uniform)、泊松分布(Poisson)、指數(shù)(Exponential)分布進行比較。其零假設(shè)H0為樣本來自的總體與指定的理論分布無顯著差異。,6.2 兩配對樣本非參數(shù)檢驗,6.2.1 統(tǒng)計學上的定義和計算公式,定義:兩配對樣本(2 Related Samples)非參數(shù)檢驗是在對總體分布不很清楚的情況下,對樣本來自的兩相關(guān)配對總體分別進行檢驗。,兩配對樣本非參數(shù)檢驗一般用于同一研究對象(或兩配對對象)分別給予兩種不同處理

5、的效果比較,以及同一研究對象(或兩配對對象)處理前后的效果比較。前者推斷兩種效果有無差別,后者推斷某種處理是否有效。,兩配對樣本非參數(shù)檢驗的前提要求兩個樣本應(yīng)是配對的。在應(yīng)用領(lǐng)域中,主要的配對資料包括:具有年齡、性別、體重、病況等非處理因素相同或相似者。首先兩個樣本的觀察數(shù)目相同,其次兩樣本的觀察值順序不能隨意改變。,SPSS中有以下3種兩配對樣本非參數(shù)檢驗方法。,1.兩配對樣本的McNemar變化顯著性檢驗,McNemar變化顯著性檢

6、驗以研究對象自身為對照,檢驗其兩組樣本變化是否顯著。其零假設(shè)為:樣本來自的兩配對總體分布無顯著差異。 McNemar變化顯著性檢驗要求待檢驗的兩組樣本的觀察值是二值數(shù)據(jù),在實際分析中有一定的局限性。,McNemar變化顯著性檢驗基本方法采用二項分布檢驗。它通過對兩組樣本前后變化的頻率,計算二項分布的概率值。,2.兩配對樣本的符號(Sign)檢驗,當兩配對樣本的觀察值不是二值數(shù)據(jù)時,無法利用前面一種檢驗方法,這時可以采用兩配對樣本

7、的符號(Sign)檢驗方法。其零假設(shè)為:樣本來自的兩配對樣本總體的分布無顯著差異。,兩配對樣本的符號檢驗利用正、負符號的個數(shù)多少來進行檢驗。首先,將第二組樣本的各個觀察值減去第一組樣本對應(yīng)的觀察值,如果得到差值是一個正數(shù),則記為正號;差值為負數(shù),則記為負號。然后計算正號的個數(shù)和負號的個數(shù)。,通過比較正號的個數(shù)和負號的個數(shù),可以判斷兩組樣本的分布。例如,正號的個數(shù)和負號的個數(shù)大致相當,則可以認為兩配對樣本數(shù)據(jù)分布差距較?。徽柕膫€數(shù)和負號

8、的個數(shù)相差較多,可以分為兩配對樣本數(shù)據(jù)分布差距較大。,SPSS將自動對差值正負符合序列作單樣本二項分布檢驗,計算出實際的概率值。如果得到的概率值小于或等于用戶的顯著性水平?,則應(yīng)拒絕零假設(shè)H0,認為兩配對樣本來自的總體分布有顯著差異;如果概率值大于顯著性水平,則不能拒絕零假設(shè)H0,認為兩配對樣本來自的總體分布無顯著差異。,3.兩配對樣本的Wilcoxon符號平均秩檢驗,兩配對樣本的符號檢驗考慮了總體數(shù)據(jù)變化的性質(zhì),但沒有考慮兩組樣本變化

9、的程度。兩配對樣本的Wilcoxon符號平均秩檢驗考慮了這方面的因素。其零假設(shè)為:樣本來自的兩配對樣本總體的分布無顯著差異。,兩配對樣本的Wilcoxon符號平均秩檢驗首先按照符號檢驗的方法,將第二組樣本的各個觀察值減去第一組樣本對應(yīng)的觀察值,如果得到差值是一個正數(shù),則記為正號;差值為負數(shù),則記為負號。同時保存差值的絕對值數(shù)據(jù)。然后將絕對差值數(shù)據(jù)按升序排序,并求出相應(yīng)的秩,最后分別計算正號秩總合W +、負號秩總合W 

10、?以及正號平均秩和負號平均秩。,如果正號平均秩和負號平均秩大致相當,則可以認為兩配對樣本數(shù)據(jù)正負變化程度基本相當,分布差距較小。,兩配對樣本的Wilcoxon符號平均秩檢驗按照下面的公式計算Z統(tǒng)計量,它近似服從正態(tài)分布,研究問題Mydata A.sav 分析歷史、數(shù)學、外語成績之間是否存在顯著性差異。,6.2.2 SPSS中實現(xiàn)過程,實現(xiàn)步驟1、正態(tài)性檢驗分析——非參數(shù)檢驗——舊對話框——1樣本K-S2、分析——非參數(shù)檢驗—

11、—舊對話框——2個相關(guān)樣本,圖10-23 在菜單中選擇“2 Related Samples”命令,6.2.3 結(jié)果和討論,(1)Wilcoxon檢驗結(jié)果如下兩表所示。,(2)符號檢驗結(jié)果如下兩表所示。,(3)McNemar檢驗結(jié)果如下兩表所示。,(4)Marginal Homo檢驗結(jié)果如下兩表所示。,6.3 多配對樣本非參數(shù)檢驗,6.3.1 統(tǒng)計學上的定義和計算公式,定義:多配對樣本非參數(shù)檢驗是對多個匹配樣本的總體分布是否存在顯

12、著性差異進行統(tǒng)計分析。 SPSS中有以下3種多配對樣本非參數(shù)檢驗方法。,1.多配對樣本的Friedman檢驗,多配對樣本的Friedman檢驗是利用秩實現(xiàn)多個配對總體分布檢驗的一種方法,多配對樣本的Friedman檢驗要求數(shù)據(jù)是定距的。其零假設(shè)為:樣本來自的多個配對總體的分布無顯著差異。,多配對樣本的Friendman檢驗的實現(xiàn)原理是:首先以樣本為單位,將各個樣本數(shù)據(jù)按照升序排列,求得各個樣本數(shù)據(jù)在各自行中的秩,然后計算各樣本的

13、秩總和及平均秩。,如果多個配對樣本的分布存在顯著的差異,那么數(shù)值普遍偏大的組秩和必然偏大,數(shù)值普遍偏小的組,秩和也必然偏小,各組的秩之間就會存在顯著差異。如果各樣本的平均秩大致相當,那么可以認為各組的總體分布 沒有顯著差異。,2.多配對樣本的Kendall協(xié)同系數(shù)檢驗,多配對樣本的Kendall協(xié)同系數(shù)檢驗和Friedman檢驗非常類似,也是一種多配對樣本的非參數(shù)檢驗,但分析的角度不同。多配對樣本的Kendall協(xié)同系數(shù)檢驗主要用在分析

14、評判者的判別標準是否一致公平方面。它將每個評判對象的分數(shù)都看作是來自多個配對總體的樣本。一個評判對象對不同被判定對象的分數(shù)構(gòu)成一個樣本,其零假設(shè)為:樣本來自的多個配對總體的分布無顯著差異,即評判者的評判標準不一致。,Kendall協(xié)同系數(shù)檢驗中會計算Friedman檢驗方法,得到friedman統(tǒng)計量和相伴概率。如果相伴概率小于顯著性水平,可以認為這10個節(jié)目之間沒有顯著差異,那么可以認為這5個評委判定標準不一致,也就是判定結(jié)果不一致。

15、,3.多配對樣本的Cochran Q檢驗,多配對樣本的Cochran Q檢驗也是對多個互相匹配樣本總體分布是否存在顯著性差異的統(tǒng)計檢驗。不同的是多配對樣本的Cochran Q檢驗所能處理的數(shù)據(jù)是二值的(0和1)。其零假設(shè)是:樣本來自的多配對總體分布無顯著差異。,6.3.2 SPSS中實現(xiàn)過程,研究問題mydataA.sav 分析歷史、數(shù)學、外語、法律成績之間是否存在顯著性差異。,實現(xiàn)步驟1、正態(tài)性檢驗分析——非參數(shù)檢驗——舊對話

16、框——1樣本K-S2、分析——非參數(shù)檢驗——舊對話框——K個相關(guān)樣本,圖10-28 在菜單中選擇“K Related Samples”命令,圖10-32 “Several Related Samples:Statistics”對話框(二),6.3.3 結(jié)果和討論,(1)多配對樣本的Friendman檢驗,(2)多配對樣本的Kendall協(xié)同系數(shù)檢驗,描述性統(tǒng)計部分結(jié)果表格如下。,(3)多配對樣本的Cochran Q檢驗結(jié)果如下兩

17、表所示。,6.4.1 統(tǒng)計學上的定義和計算公式,6.4 兩獨立樣本非參數(shù)檢驗,定義:兩獨立樣本的非參數(shù)檢驗是在對總體分布不很了解的情況下,通過分析樣本數(shù)據(jù),推斷樣本來自的兩個獨立總體分布是否存在顯著差異。一般用來對兩個獨立樣本的均數(shù)、中位數(shù)、離散趨勢、偏度等進行差異比較檢驗。,兩個樣本是否獨立,主要看在一個總體中抽取樣本對另外一個總體中抽取樣本有無影響。如果沒有影響,則可以認為兩個總體是獨立的。SPSS提供了4種兩獨立樣本的非參數(shù)

18、檢驗方法。,1.兩獨立樣本的Mann-Whitney U檢驗,兩獨立樣本的Mann-Whitney U檢驗的零假設(shè)H0為樣本來自的兩獨立總體均值沒有顯著差異。,兩獨立樣本的Mann-Whitney U檢驗主要通過對平均秩的研究來實現(xiàn)推斷。秩簡單地說就是名次。如果將數(shù)據(jù)按照升序進行排序,這時每一個具體數(shù)據(jù)都會有一個在整個數(shù)據(jù)中的位置或名次,這就是該數(shù)據(jù)的秩,數(shù)據(jù)有多少個,秩便有多少個。,2.兩獨立樣本的K-S檢驗,兩獨立樣本的K-S檢驗?zāi)?/p>

19、夠?qū)瑟毩颖镜目傮w分布情況進行比較。其零假設(shè)是H0為樣本來自的兩獨立總體分布沒有顯著差異。,兩獨立樣本的K-S檢驗實現(xiàn)方法是:首先將兩組樣本數(shù)據(jù)(X1,X2,…,Xm)和(Y1,Y2,…,Yn)混合并按升序排列(m和n是兩組樣本的樣本容量),分別計算兩組樣本秩的累計頻率和每個點上的累計頻率;最后將兩個累計頻率相減,得到差值序列數(shù)據(jù)。,兩獨立樣本的K-S檢驗將關(guān)注差值序列。SPSS將自動計算K-S Z統(tǒng)計量,并依據(jù)正態(tài)分布表給出對應(yīng)的相

20、伴概率值。如果相伴概率小于或等于用戶的顯著性水平?,則應(yīng)拒絕零假設(shè)H0,認為兩個樣本來自的總體分布有顯著差異;如果相伴概率值大于顯著性水平,則不能拒絕零假設(shè)H0,認為兩個樣本來自的總體分布無顯著差異。,3.兩獨立樣本的游程檢驗(Wald-Wolfwitz Runs),兩獨立樣本的游程檢驗用來檢驗樣本來自的兩獨立總體的分布是否存在顯著差異。其零假設(shè)是H0為樣本來自的兩獨立總體分布沒有顯著差異。,樣本的游程檢驗中,計算游程的方法與觀察值的秩

21、有關(guān)。首先,將兩組樣本混合并按照升序排列。在數(shù)據(jù)排序時,兩組樣本的每個觀察值對應(yīng)的樣本組標志值序列也隨之重新排列,然后對標志值序列按照前面10.3節(jié)的方法求游程。,如果計算出的游程數(shù)相對比較小,則說明樣本來自的兩總體的分布形態(tài)存在較大差距;如果得到的游程數(shù)相對比較大,則說明樣本來自的兩總體的分布形態(tài)不存在顯著差距。,SPSS將自動計算游程數(shù)得到Z統(tǒng)計量,并依據(jù)正態(tài)分布表給出對應(yīng)的相伴概率值。如果相伴概率小于或等于用戶的顯著性水平?,則應(yīng)

22、拒絕零假設(shè)H0,認為兩個樣本來自的總體分布有顯著差異;如果相伴概率值大于顯著性水平,則不能拒絕零假設(shè)H0,認為兩個樣本來自的總體分布無顯著差異。,4.兩獨立樣本的極端反應(yīng)檢驗(Moses Extreme Reactions),兩獨立樣本的極端反應(yīng)檢驗用來檢驗樣本來自的兩獨立總體的分布是否存在顯著差異。其零假設(shè)H0為樣本來自的兩獨立總體分布沒有顯著差異。,兩獨立樣本的極端反應(yīng)檢驗將一個樣本作為控制樣本,另外一個樣本作為實驗樣本。以控制樣本

23、作對照,檢驗實驗樣本是否存在極端反應(yīng)。首先將兩組樣本混合并按升序排列;然后找出控制樣本最低秩和最高秩之間所包含的觀察值個數(shù),即跨度(Span)。為控制極端值對分析結(jié)果的影響,也可以先去掉樣本兩個最極端的觀察值后再求跨度,這個跨度稱為截頭跨度。,兩獨立樣本的極端檢驗計算跨度和截頭跨度。如果跨度或截頭跨度很小,則表明兩個樣本數(shù)據(jù)無法充分混合,可以認為實驗樣本存在極端反應(yīng)。,SPSS自動計算跨度和截頭跨度,依據(jù)分布表給出對應(yīng)的相伴概率值。如果

24、相伴概率小于或等于用戶的顯著性水平?,則應(yīng)拒絕零假設(shè)H0,認為兩個樣本來自的總體分布有顯著差異;如果相伴概率值大于顯著性水平,則不能拒絕零假設(shè)H0,認為兩個樣本來自的總體分布無顯著差異。,6.4.2 SPSS中實現(xiàn)過程,? 研究問題 mydataA.sav 分析男生、女生在數(shù)學成績上是否存在顯著性差異。,實現(xiàn)步驟1、正態(tài)性檢驗2、分析——非參數(shù)檢驗——舊對話框——2個獨立樣本,圖10-15 在菜單中選擇“2 Indep

25、endent Samples”命令,6.4.3 結(jié)果和討論,(1)兩獨立樣本Mann-Whitney U檢驗結(jié)果如下面兩表所示。,(2)兩獨立樣本K-S檢驗輸出結(jié)果如下兩表所示。,(3)兩獨立樣本極端反應(yīng)檢驗輸出結(jié)果如下兩表所示。,(4)兩獨立樣本游程檢驗輸出結(jié)果如下兩表所示。,6.5 多獨立樣本非參數(shù)檢驗,6.5.1 統(tǒng)計學上的定義和計算公式,定義:多獨立樣本非參數(shù)檢驗分析樣本數(shù)據(jù)是推斷樣本來自的多個獨立總體分布是否存在顯著差異

26、。SPSS多獨立樣本非參數(shù)檢驗一般推斷多個獨立總體的均值或中位數(shù)是否存在顯著差異。,多個樣本之間是否獨立,需要看在一個總體中抽取樣本對其他總體中抽取樣本是否有影響。如果沒有影響,則認為這些總體之間是獨立的。,例如,隨機抽取3個班級之間學生的學生成績,分析3個班級總體的成績是否存在顯著的差異。由于對各個班級都是隨機抽取樣本,抽樣沒有相互影響,可以認為這三個班級學生成績是獨立的。 SPSS中有3種多獨立樣本非參數(shù)檢驗方法。,1.多獨

27、立樣本的中位數(shù)檢驗(Median),多獨立樣本的中位數(shù)檢驗通過對多組數(shù)據(jù)的分析推斷多個獨立總體分布是否存在顯著差異。多獨立樣本的中位數(shù)檢驗的零假設(shè)H0為:樣本來自的多個獨立總體的中位數(shù)無顯著差異。,2.多獨立樣本的K-W檢驗,多獨立樣本的K-W檢驗是Kruskal-Waillis檢驗的縮寫,是一種推廣的平均秩檢驗。其零假設(shè)為:樣本來自的多個獨立總體的分布無顯著差異。,多獨立樣本的K-W檢驗的基本方法是:首先將多組樣本數(shù)混合按升序排列,并

28、求出每個觀察值的秩,然后對多組樣本的秩分別求平均值。,如果各組樣本的平均秩大致相等,則可以認為多個獨立總體的分布沒有顯著差異。如果各樣本的平均秩相差很大,則不能認為多個獨立總體的分布無顯著差異。,3.多獨立樣本的Jonkheere-Terpstra檢驗,多獨立樣本的Jonkheere-Terpstra檢驗用于分析樣本來自的多個獨立總體分布是否存在顯著差異。其零假設(shè)是:樣本來自的多個獨立總體的分布無顯著差異。,多獨立樣本的Jonkheer

29、e-Terpstra檢驗的基本方法和兩獨立樣本的Mann-Whitney U檢驗比較類似,也是計算一組樣本的觀察值小于其他組樣本觀察值的個數(shù)。,? 研究問題 mydataA.sav ,請分析不同專業(yè)的學生的數(shù)學、外語成績是否存在顯著性差異。,6.5.2 SPSS中實現(xiàn)過程,實現(xiàn)步驟1.正態(tài)性檢驗2.數(shù)值型變量3.K個獨立樣本,圖10-19 在菜單中選擇“K Independent Samples”命令,6.5.3

30、結(jié)果和討論,(1)多獨立樣本K-W檢驗結(jié)果如下兩表所示。,(2)多獨立樣本中位數(shù)檢驗結(jié)果如下兩表所示。,(3)多獨立樣本Jonckheere檢驗結(jié)果如下表所示。,小 結(jié),非參數(shù)檢驗主要用于那些總體分布不能用有限個實參數(shù)來刻畫,或者不考慮被研究的對象為何種分布以及是否已知的情況。這種方法進行的并不是參數(shù)間的比較,而是分布位置、分布形狀之間的比較,研究目標總體與理論總體分布是否相同,或者各樣本所在總體的分布位置是否相同等。,小

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論