

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第9章 方差分析,介紹 1、方差分析的概念 2、方差分析的過程,本章內(nèi)容,9.1 方差分析的概念與方差分析的過程9.2 單因素方差分析9.3 單因變量多因素方差分析過程9.4 多因變量線性模型的方差分析9.5 重復測量設計的方差分析9.6 方差成分分析9.7 正交實驗設計練習題(對銀行數(shù)據(jù)進行方差分析),9.1.1方差分析的概念,在科學實驗中常常要探討不同實驗條件或處理方法對實驗結果的影響。通常是比較不同實驗條件下
2、樣本均值間的差異方差分析是檢驗多組樣本均值間的差異是否具有統(tǒng)計意義的一種方法。例如醫(yī)學界研究幾種藥物對某種疾病的療效;農(nóng)業(yè)研究土壤、肥料、日照時間等因素對某種農(nóng)作物產(chǎn)量的影響不同飼料對牲畜體重增長的效果等都可以使用方差分析方法去解決,方差分析基本原理,認為不同處理組的均值間的差別基本來源有兩個:(1)隨機誤差,如測量誤差造成的差異或個體間的差異,稱為組內(nèi)差異,用變量在各組的均值與該組內(nèi)變量值之偏差平方和的總和表示, 記作SS
3、w,組內(nèi)自由度dfw(2)實驗條件,即不同的處理造成的差異,稱為組間差異。用變量在各組的均值與總均值之偏差平方和表示,記作SSb,組間自由度dfb總偏差平方和SSt 、 SSb 、 SSw的公式P147,方差分析基本原理(續(xù)),組內(nèi)SSw 、組間SSb除以各自的自由度(組內(nèi)dfw =n-m,組間dfb=m-1,其中n為樣本總數(shù),m為組數(shù)),得到其均方MSw和MSb,一種情況是處理沒有作用,即各組樣本均來自同一總體, MSb/MSw≈
4、1。另一種情況是處理確實有作用,那么, MSb>>MSw (遠遠大于)。MSb/MSw比值構成F分布,用F值與其臨界值比較,推斷各樣本是否來自相同的總體.,方差分析的假設檢驗,零假設H0:m組樣本均值都相同,即μ1= μ2=....= μm如果經(jīng)過計算結果組間均方遠遠大于組內(nèi)均方( MSb>>MSw ),F(xiàn)>F0.05(dfb,dfw), p0.05不能拒絕零假設,說明樣本來自相同的正態(tài)總體,處理間無差
5、異。,9.1.2 方差分析中的術語,1、因素與處理:因素是影響因變量變化的客觀條件;處理是影響因變量變化的人為條件。也可通稱為因素。用分類變量表示,取有限的離散值2、水平:因素的不同等級稱作水平。水平值取有限的離散值。如:性別中的0,1(男、女)等3、單元(cell):指各因素的水平之間的每個組合。如性別(0,1)和年齡(10,11,12)的六種組合。,9.1.2 方差分析中的術語(續(xù)),4、因素的主效應和因素間的交互效應(如藥物A
6、、B的主效應及AB的交互效應)5、均值比較:均值的相對比較是比較各因素對因變量的效應大小的相對比較,如研究A、B的單獨效應之和是否等于它們的交互效應,或A、B的效應是否相等。均值的多重比較是研究因素單元對因變量的影響之間是否存在顯著性差異。如A、B的療效是否存在顯著性差異。6、單元均值、邊際均值:在多因素方差分析中,每種因素水平組合的因變量均值稱為單元均值。一個因素水平的因變量均值稱為邊際均值(Marginal Means),
7、方差分析中的術語(續(xù)),7、協(xié)方差分析:在一般進行方差分析時,要求除研究的因素外應該保證其他條件的一致。作動物實驗往往采用同一胎動物分組給予不同的處理,研究不同處理對研究對象的影響就是這個道理。如研究身高與體重的關系時要求按性別分別進行分析,以消除性別因素的影響。要消除其他因素的影響,應采用協(xié)方差分析。8、重復測量:組內(nèi)變異的主要的原因是實驗對象之間的個體差異。由于個體差異存在,即使實驗對象受到相同的處理,他們的因變量值也可能相當不同
8、。重復測量設計的方差分析也是像協(xié)方差分析一樣,是在研究中減少個體差異帶來的誤差方差的一種有效方法,而且由于對相同個體進行重復測量,在一定程度上降低了人力、物力、財力的消耗。如果重復測量是在一段時間內(nèi)或一個溫度間隔內(nèi)進行的,還可以研究因變量對時間、溫度等自變量的變化趨勢,這種重復測量研究稱為趨勢研究。,9.1.3 方差分析過程,1、One-Way過程:單因素簡單方差分析過程。在Compare Means菜單項中,可以進行單因素方差分析、
9、均值多重比較和相對比較。2、General Linear Model(簡稱GLM)過程:GLM過程由Analyze菜單直接調(diào)用。這些過程可以完成簡單的多因素方差分析和協(xié)方差分析,不但可以分析各因素的主效應,還可以分析各因素間的交互效應。,General Linear Model(簡稱GLM)過程,在General Linear Model菜單項下有四項:Univariate:提供回歸分析和一個因變量和一個或幾個因素變量的方差分析。
10、Multivariate:可進行多因變量的多因素分析Repeated Measure:可進行重復測量方差分析Variance Component:可進行方差成分分析。通過計算方差估計值,可以幫助我們分析如何減小方差。,9.2 單因素方差分析,也稱有一維方差分析,對二組以上的均值加以比較。檢驗由單一因素影響的一個(或幾個相互獨立的)分析變量由因素各水平分組的均值之間的差異是否有統(tǒng)計意義。并可以進行兩兩組間均值的比較,稱作組間均值的
11、多重比較,還可以對該因素的若干水平分組中哪些組均值不具有顯著性差異進行分析,即一致性子集檢驗。One-Way ANOVA過程要求:因(分析)變量屬于正態(tài)分布總體,若因(分析)變量的分布明顯的是非正態(tài),應該用非參數(shù)分析過程。對被觀測對象的實驗不是隨機分組的,而是進行的重復測量形成幾個彼此不獨立的變量,應該用Repeated Measure菜單項,進行重復測量方差分析,條件滿足時,還可以進行趨勢分析。,9.2.1 簡單的一維方差分析,
12、使用系統(tǒng)默認值進行一維方差分析:P151 比較四種飼料對豬體重增加的作用有無不同(注意:分組變量的定義)data09-01Analyze->Compare Means->One-Way ANOVADependent List:weightFactor:fodder結果只有方差分析表結果中比較有用的值:Sig顯著性概率值。結論:四種飼料對豬體重增加的作用有顯著性差異。零假設H0:組間均值無顯著性差異(即四種飼料
13、對豬體重增加的平均值無顯著性差異);,9.2.2--9.2.3 單因素方差分析的選擇項和例子,使用選擇項的單因素方差分析:P155 比較四種飼料對豬體重增加的作用data09-01Analyze->Compare Means->One-Way ANOVADependent List:weightFactor:fodderContrasts選項: 多項式比較(AD與BC比較和AC與BD比較)Post Hoc選項:
14、 均值多重比較LSD和Tamhane’s T2 ,一致性子集檢驗Duncan(各種方法的使用條件-方差齊或不齊)Options選項:Descriptive描述統(tǒng)計量,Homogeneity-of-variance方差齊次性檢驗,Means plot均值分布圖結果除了方差分析表,還有很多選項相應的結果結論:四種飼料對豬體重增加的作用有顯著性差異,還可得知ABCD四種飼料對豬平均體重增加多少(越來越多)。P159 同種三葉草被接種上
15、不同的菌種,其含氮量情況data09-02(注意Post Hoc各種方法結果的使用條件-方差齊或不齊).,9.3 單因變量多因素方差分析過程(多因素,? 2),1、單因變量多因素方差分析概述2、單因變量多因素方差分析的菜單和選擇項3、使用系統(tǒng)默認值進行隨機區(qū)組設計資料的方差分析4、2×2析因實驗方差分析實例5、拉丁方區(qū)組設計的方差分析實例6、協(xié)方差分析實例7、多維交互效應方差分析實例,9.3.1單因變量多因素方差
16、分析概述,1、概述是對一個獨立變量是否受多個因素或變量影響而進行的方差分析。SPSS調(diào)用UNIANOVA過程,檢驗不同水平組合之間因(分析)變量均值由于受不同因素影響是否有差異的問題。 UNIANOVA過程可以分析每一個因素的作用(主效應),也可以分析因素之間的交互作用(交互效應)??梢赃M行協(xié)方差分析,以及各因素變量與協(xié)變量之間的交互作用。UNIANOVA過程要求因變量是從多元正態(tài)總體隨機采樣得來,且總體中各單元的方差相同,也可
17、以通過方差齊次性檢驗選擇均值比較結果。因變量和協(xié)變量必須是數(shù)值型變量,協(xié)變量與因變量彼此不獨立。因素變量是分類變量,可以是數(shù)值型和字符型。固定因素變量(Fixed Factor)是反應處理的因素。隨機因素是隨機設置的因素,是在確定模型時需要考慮會對實驗有影響的因素,對實驗結果影響的大小可以通過方差成分分析確定。2、關于模型:GLM Univariate功能很強,可以建立包括各種主效應、交互效應的模型。必須認真分析因素變量的具體情況
18、,來確定自己的模型,否則會產(chǎn)生不可解釋的輸出結果。,9.3.2 單因變量多因素方差分析的菜單和選擇項,菜單:Analyze->General Linear Model-> Univariate 選項:選擇分析模型Model:默認全模型Full Factorial:包括所有因素變量的主效應、所有協(xié)變量的主效應、所有因素與因素的交互效應,不包括協(xié)變量與其他因素的交互效應。自定義模型Custom:主效應(Main effe
19、cts及其因素變量)、交互變量(有交互效應維數(shù)之分)選擇分解平方和的方法(默認為TYPE III)Include Intercept in model:系統(tǒng)默認截距包括在回歸模型中。選擇對照方法Contrasts選擇分布圖形Plots選擇多重比較分析Post Hoc保存運算結果的選擇項Save選擇輸出項Options,9.3.3 使用系統(tǒng)默認值進行隨機區(qū)組設計資料的方差分析,P168 比較不同種系、劑量的雌性大白鼠子宮重量
20、,看不同種系、不同劑量對雌性大白鼠子宮重量是否有顯著性作用data09-03Analyze->General Linear Model-> Univariate Dependent:wuteriFixed Factor(s):mouse、etrogenModel選項: Custom(Main effect, mouse和etrogen)主效應方差分析檢驗結果(截距,主效應,誤差Error)結果中比較有用的值:S
21、ig顯著性概率值(各自主效應,截距-線性回歸關系)結論:不同種系、不同劑量對雌性大白鼠子宮重量均有有顯著性作用。注意:選擇只有主效應,原因是每種組合只有一個觀測量。如果分析交互作用,無法計算差異的顯著性,9.3.4 析因實驗方差分析概念,多因素析因實驗的方差分析:析因實驗是把各因素的各水平的全部組合排列出來,然后按每個條件的組合作一次或多次重復的實驗,所得的全部數(shù)據(jù)個數(shù)n=a*b*...*k,其中a,b,... 為各因素的水平數(shù),k
22、為每種組合內(nèi)的重復數(shù)。析因分析的好處在于對各因素間的交互影響項的方差都可以加以析離并檢驗其顯著性。,9.3.4 2×2析因實驗方差分析實例,兩因素、兩水平的實驗設計。例子:P171使用兩種藥物A(0-不用,1-用)和B (0-不用,1-用)治療缺鐵性貧血(2*2=4種組合,每種組合有3個病人),看A、B、AB的作用data09-04Analyze->General Linear Model-> Univari
23、ate Dependent:redcellFixed Factors:drugA、drugB保留全模型選項(不對Model操作)選擇Plot選項: 作三個圖drugA、drugB、 drugA*drugB選擇輸出Option選項:選 drugA、drugB、 drugA*drugB、Overall進入Display Means for框中結果除了方差分析表( (截距、主效應、交叉效應、誤差Error),還有很多選項相應的結果
24、結論p173:兩種藥物A和B均對治療缺鐵性貧血有顯著療效,兩種藥物A和B的協(xié)同作用也很顯著。,9.3.5 拉丁方區(qū)組設計的方差分析實例,拉丁方實驗設計的特點:有兩個以上因素變量,每個因素變量的水平數(shù)相等。例子:P174為了評價六種不同甜菜,選擇地塊土壤條件相同,將六種甜菜(變量variety)種子播種在六行(變量rep)、六列(變量Col)的地塊上,記錄兩次收獲(變量Harvest)的產(chǎn)量(變量yield)data09-05(3因素
25、6*6拉丁方,n=6*6*2=72 Cases)實驗的假設是:不同地塊(行、列)對產(chǎn)量均值無影響,不同種子產(chǎn)量均值無影響Analyze->General Linear Model-> Univariate Dependent:yieldFixed Factors:rep、col、varietyModel:只分析三個主效應rep、col、variety(Main effects)主效應方差分析檢驗結果(截距,主效應
26、,誤差Error)結果中比較有用的值:Sig顯著性概率值(各自主效應,不同品種的甜菜variety 有顯著性差異,即平均產(chǎn)量的差異主要是品種不同造成的,而跟地塊無關),9.3.6 協(xié)方差分析實例,協(xié)方差分析是利用線性回歸方法消除混雜因素的影響后進行的方差分析。例子:P176 鎘作業(yè)工人按暴露于鎘煙塵的年數(shù)大于等于10年和不足10年兩組。兩組工人的年齡未經(jīng)控制(人隨著年齡的增長,肺活量也會有所下降),測量了每個工人的肺活量。課題研究暴
27、露于鎘粉塵的年數(shù)和肺活量的關系(要消除年齡的影響), Data09-06,Time接觸鎘粉塵時間分組(1為>=10年,2為General Linear Model-> Univariate Dependent: VitalcpFixed Factors:timeCovariate:AgeOption:Display Means For:time(分Time顯示肺活量均值) Disp
28、lay :Parameter Estimates(肺活量與年齡的線性回歸方程,分time)結果中比較有用的值:Sig顯著性概率值(各主效應,年齡Age有顯著性差異, TIME無顯著性差異,即肺活量的差異是由于被試者的年齡差異所致,與被試者接觸鎘粉塵時間的時間是否大于10年無關),9.3.7 多維交互效應方差分析實例,p178實驗數(shù)據(jù)為教育心理學實驗,心理運動測驗分數(shù)與被試者必須瞄準的目標大小關系的資料Data09-07四個大小不同的
29、目標:Target三部測驗設備:Device兩種不同明暗程度的照明環(huán)境:Light4×3×2的析因實驗設計(24個組合單元,每組5個Cases,共24×5=120Cases)Analyze->General Linear Model-> Univariate Dependent:ScoreFixed Factors: Target、 Device、 LightModel:保留全模型
30、選項(不對Model操作)選擇輸出Option選項:選Target*Device* Light進入Display Means for框中:各種組合均值選擇Plot選項: 作四個圖Target、 Device、 Light 、 Target*Device* Light結果中比較有用的值:Sig顯著性概率值(各主效應,交互效應,均對Score有顯著性作用),9.4 多因變量線性模型的方差分析P181,概述: GLM Multivari
31、ate過程提供回歸分析和多因變量的方差分析。多因變量方差分析模型除包括多個因變量外,還可以包括一個或幾個因素變量或協(xié)變量。因素變量把總體分為幾個組。使用這個一般線性模型過程,可以檢驗因素變量在因變量的聯(lián)合分布的各組均值的效應,可以研究因素間的交互效應和單一因素的效應,另外還包括協(xié)變量效應和協(xié)變量與因素間的交互效應。對回歸分析,協(xié)變量作為自變量(預測變量)GLM Multivariate過程可以檢驗平衡和不平衡模型。模型中每個單元包括相
32、同數(shù)量的觀測量為平衡設計。,9.4.3多因變量線性模型方差分析實例,實例:數(shù)據(jù)是對男33人、女26人的頭部四個解剖部位的測量結果,研究男女頭部有無顯著性差異。Data09-08菜單:Analyze->General Linear Model-> MultivariateDependent:Basilar、length、postorb、zygomaFixed Factors: SexModel:保留全模型選項(不對Mo
33、del操作)Option:Descriptive Statistics結果中比較有用的值:Sig顯著性概率值(不同性別的頭部四個解剖部位沒有顯著性差異),9.5 重復測量設計的方差分析,概述P187:重復測量設計方差分析的樣本必須包括同質的實驗單位或進行多次重復測量的實驗。GLM重復測量屬于高級分析過程,是對同一因變量進行重復測量,可以是同一條件下進行的重復測度,目的在于研究各種處理之間是否存在顯著性差異的同時,研究被試著之間的差
34、異;也可以是不同條件下的重復測度,目的在于研究各種處理間是否存在顯著性差異的同時,研究形成重復測量條件間的差異以及這些條件與處理間的交互效應。重復測量設計方差分析的數(shù)據(jù)文件結構:若干次重復測量結果作為不同因變量出現(xiàn)在數(shù)據(jù)文件中。,9.5 重復測量方差分析實例1,P188實例1-Data09-09 :設置了三個級別的視覺刺激作為處理因素變量vsno(視覺刺激等級1、2、3),4位被試者均接受三個級別的視覺刺激,并在同樣條件下測試三次(t
35、ime1,time2,time3) 。 H0:三個級別的視覺刺激之間(被試者內(nèi))無顯著性差異。菜單:Analyze->General Linear Model-> Repeated MeasureWithin-Subject Factor Name:timeNuber of Levels:3Define: Within-Subjects Variables [time]:time1,time2,time3Betw
36、een-Subject Factor:vsno結果中比較有用的值:Sig顯著性概率值(三次測量之間沒有顯著性差異, 4位被試者之間對每種相同視覺刺激的反映也沒有顯著性差異,而對不同的視覺刺激等級有顯著性差異),9.5.4 重復測量方差分析實例2,P191實例-Data09-10a :研究四種藥物對某生化指標的作用(med1, med2, med3, med4) ,5位被試者參與實驗,零假設H0:四種藥物對某生化指標作用之間(被試者內(nèi))
37、無顯著性差異。菜單:Analyze->General Linear Model-> Repeated MeasureWithin-Subject Factor Name:medNuber of Levels:4Define: Within-Subjects Variables [med]:med1-med4Option: Display Means for: Med Disp
38、lay: Descriptive Statistics結果中比較有用的值:Sig顯著性概率值(四種藥物對某生化指標作用之間有顯著性差異,而5位被試者之間對每種相同藥物的反映也有顯著性差異),9.5.5 關于趨勢分析,P194概念:當重復測量的條件是某些順序變量時,可以分析重復測量的因變量隨順序變量變化的趨勢。實例-Data09-11 :選擇16名實驗對象(no),使用兩種方法(group)鍛煉他們的記憶力。訓練一段時間后,每隔一天測
39、試一次記憶情況,共測試5次。每次測試對每個參與實驗的人員均按一定的法則打分(day1-day5)。這是一個組內(nèi)因素、一個組間因素的重復測量設計的例題。因為組內(nèi)因素是與時間有關的變量,因此不但可以分析比較兩種訓練記憶的方法哪個更有效,還可以得到隨時間的推移,記憶分數(shù)隨時間下降的數(shù)學模型(線性關系Linear、二次關系Quadratic、三次關系Cubic)。菜單:Analyze->General Linear Model->
40、 Repeated MeasureWithin-Subject Factor Name:days (Nuber of Levels:5)Define: Within-Subjects Variables [days]:day1-day5Between-Subject Factor:groupModel:Main effects(days,Group)Plots:Days*GroupOption: Display Means
41、 for: Days,group,overall Display: Descriptive Statistics和Estimate of effect size 結果中比較有用的值:Sig顯著性概率值(多元、組內(nèi)、趨勢分析)和趨勢圖(Days*group的Plot圖),9.6 方差成分分析,概述P198:是對混合效應模型中各隨機效應對因變量變異的貢獻進行分析。菜單:Analyze->General L
42、inear Model-> Variance Components定義因變量和隨機因素選分析模型Model:Full Model或Custom選分析方法Option:四選一MINQUE正態(tài)最小二次無偏估計,默認方法 ANOVA(Analysis of Variance)Maximum likelihood(ML)最大似然法Restricted maximum likelihood (REML)有限最大似然法,9.6.
43、2 方差成分分析實例,p200實例Data09-07 :教育心理學實驗,心理運動測驗分數(shù)與被試者必須瞄準的目標大小關系的資料四個大小不同的目標:Target三部測驗設備:Device兩種不同明暗程度的照明環(huán)境:Light4×3×2的析因實驗設計(24個組合單元,每組5個Cases,共120Cases)菜單:Analyze->General Linear Model-> Variance Comp
44、onentsDependent:ScoreFixed Factors: Target、 DeviceRandom Factor: LightModel:保留全模型選項(不對Model操作)Option:Method(ANOVA)、Sum of Square(type III)、Display(Sum of Square)結果中比較有用的值:方差成分估計表(Variance Estimates中的Estimates,看其大小,
45、說明方差最大來源與亮度、目標、設備的交互效應。亮度因素是不可忽視的,亮度應該在測試中作為測試條件考慮),9.7 正交實驗設計,功能203:進行實驗之前,要進行實驗設計,以保證用最少的人力物力和時間取得好的實驗效果。菜單:Data->Orthogonal Design ->Generate生成正交主效應設計(不屬于typical安裝)實例P205:要求生成4因素3水平9次實驗的正交實驗設計表,練習題(對銀行數(shù)據(jù)進行方差分析
46、)提示:如果單因素只有兩個水平的字符變量,請用第八章的T檢驗),不同性別的收入是否不同?(8.4獨立樣本T檢驗)是否少數(shù)民族的收入是否不同?(8.4獨立樣本T檢驗或9.2單因素方差分析)不同工種的收入是否不同? (9.2單因素方差分析)不同性別和工種的收入是否不同?(9.3單因變量多因素方差分析)是否少數(shù)民族和工種的收入是否不同?(9.3單因變量多因素方差分析)不同工種的收入是否不同(消除是否少數(shù)民族的影響)? (9.3.6
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論