第05章 t檢驗3_第1頁
已閱讀1頁,還剩66頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第五章 t 檢驗( t Test ),寧波大學醫(yī)學院  沈其君,t 檢驗——問題提出,假設檢驗是通過兩組或多組的樣本統(tǒng)計量的差別或樣本統(tǒng)計量與總體參數(shù)的差異來推斷他們相應的總體參數(shù)是否相同;醫(yī)療衛(wèi)生實踐中最常見的是計量資料兩組比較的問題;t檢驗 (t test, student t test)和u檢驗(u test)是用于計量資料兩組比較的最常用的假設檢驗方法如兩種療法治療糖尿病的療效比較,,,,,25例糖尿病患者

2、隨機分成兩組,甲組單純用藥物治療,乙組采用藥物治療合并飲食療法,二個月后測空腹血糖(mmol/L) 問兩種療法治療后患者血糖值是否相同?,藥物治療,藥物治療合并飲食療法,?1,?2,n1=12,,,=15.21,,=10.85,n2=13,,,甲組,乙組,總體,樣本,?,?=,,推 斷,,,t 檢驗——問題提出,根據(jù)研究設計t檢驗可由三種形式:單個樣本的t檢驗配對樣本均數(shù)t檢驗(非獨立兩樣本均數(shù)t檢驗)兩個獨立樣本均數(shù)t檢驗t

3、檢驗是以t分布為基礎的,為便于學習在介紹t檢驗前先介紹t分布,t分布——t值與t分布的引入,X,?,,,0,N(?,?2),N(0,1),,,,,,,樣本均數(shù)正態(tài)分布,觀察值正態(tài)分布,t分布,標準正態(tài)分布,S代替?,t分布 特征,不服從標準正態(tài)分布,小樣本時服從自由度ν=n-1的t分布 t分布曲線是以0為中心的對稱分布自由度較小時,曲線峰的高度低于標準正態(tài)曲線,且曲線峰的寬度也較標準正態(tài)分布曲線峰狹,尾部面積大于標準正態(tài)曲線尾部面

4、積,而且自由度越小,t分布的這種特征越明顯 (翹尾低狹峰),,t分布 特征,自由度ν越大,t分布越接近于正態(tài)分布;當自由度ν逼近∞時,t分布趨向于標準正態(tài)分布。 自由度ν不同,曲線形態(tài)不同, t分布是一簇曲線。,概率?、自由度?與t值關系         ——t界值,標準正態(tài)分布中u值大小與尾部面積(概率?)有關,以 (單側)和u?/2(雙側)表示;在t分布中,當自由度一定時?越小,|t|越大;在?一定時,自由

5、度越小,|t|越大,大于u值在t分布中,t值與?、?的大小有關;在單側時(尾部面積取單側)t 界值表示為t ?,? , 雙側時表示為t?/2,? ,其意義為,一定自由度?和概率?下的 t值t ?,? , t?/2,? 可通過查t界值表——附表2獲得;例如?=9,單側?=0.05 ,查附表2得單側 t0.05,9=1.833自由度??n-1?35-1?34 ,查附表2,得t0.05/2,34=2.032,概率?、自由度?與t值關系

6、         ——t界值,第一節(jié) 單個樣本t檢驗,又稱單樣本均數(shù)t檢驗(one sample t test),適用于樣本均數(shù)與已知總體均數(shù)μ0的比較,其比較目的是檢驗樣本均數(shù)所代表的總體均數(shù)μ是否與已知總體均數(shù)μ0有差別。已知總體均數(shù)μ0一般為標準值、理論值或經(jīng)大量觀察得到的較穩(wěn)定的指標值。單樣t檢驗的應用條件是總體標準?未知的小樣本資料( 如n<50),且服從正態(tài)分布。,單個樣本 t 檢驗原理,,已知總體,?

7、0,,未知總體,?,,樣本,,在 H0 :? =? 0的假定下,可以認為樣本是從已知總體中抽取的,根據(jù)t分布的原理,單個樣本t檢驗的公式為:,,,,自由度?=n-1,,單個樣本t檢驗——實例分析,例5.1 以往通過大規(guī)模調(diào)查已知某地新生兒出生體重為3.30kg.從該地難產(chǎn)兒中隨機抽取35名新生兒作為研究樣本,平均出生體重為3.42kg,標準差為0.40kg,問該地難產(chǎn)兒出生體重是否與一般新生兒體重不同?本例已知總體均數(shù)?0=3.3

8、0kg,但總體標準差?未知,n=35為小樣本,,S=0.40kg,故選用單樣本t檢驗。,單個樣本t檢驗——檢驗步驟,1. 建立檢驗假設,確定檢驗水準H0:???0,該地難產(chǎn)兒與一般新生兒平均出生體重相同;H1:???0,該地難產(chǎn)兒與一般新生兒平均出生體重不同;??0.05。2. 計算檢驗統(tǒng)計量在μ=μ0成立的前提條件下,計算統(tǒng)計量為:,單個樣本t檢驗——檢驗步驟,3. 確定P值,做出推斷結論本例自由度??n-1?35-1?3

9、4,查附表2,得t0.05/2,34=2.032。因為t ? t0.05/2,34,故P?0.05,表明差異無統(tǒng)計學意義,按 ??0.05水準不拒絕H0,根據(jù)現(xiàn)有樣本信息,尚不能認為該地難產(chǎn)兒與一般新生兒平均出生體重不同。,第二節(jié) 配對樣本均數(shù)t檢驗,配對樣本均數(shù)t檢驗簡稱配對t檢驗(paired t test),又稱非獨立兩樣本均數(shù)t檢驗,適用于配對設計計量資料均數(shù)的比較,其比較目的是檢驗兩相關樣本均數(shù)所代表的未知總體均數(shù)是否有差別

10、。 配對設計(paired design)是將受試對象按某些重要特征相近的原則配成對子,每對中的兩個個體隨機地給予兩種處理。,配對設計概述,應用配對設計可以減少實驗的誤差和控制非處理因素,提高統(tǒng)計處理的效率。 配對設計處理分配方式主要有三種情況:①兩個同質(zhì)受試對象分別接受兩種處理,如把同窩、同性別和體重相近的動物配成一對,或把同性別和年齡相近的相同病情病人配成一對;②同一受試對象或同一標本的兩個部分,隨機分配接受兩種不同處理,如

11、例5.2資料;③自身對比(self-contrast)。即將同一受試對象處理(實驗或治療)前后的結果進行比較,如對高血壓患者治療前后、運動員體育運動前后的某一生理指標進行比較。,配對樣本均數(shù)t檢驗原理,配對設計的資料具有對子內(nèi)數(shù)據(jù)一一對應的特征,研究者應關心是對子的效應差值而不是各自的效應值。進行配對t檢驗時,首選應計算各對數(shù)據(jù)間的差值d,將d作為變量計算均數(shù)。配對樣本t檢驗的基本原理是假設兩種處理的效應相同,理論上差值d的總體均

12、數(shù)μd 為0,現(xiàn)有的不等于0差值樣本均數(shù)可以來自μd = 0的總體,也可以來μd ≠ 0的總體。,配對樣本均數(shù)t檢驗原理,可將該檢驗理解為差值樣本均數(shù)與已知總體均數(shù)μd(μd = 0)比較的單樣本t檢驗.其檢驗統(tǒng)計量為: 式中d為每對數(shù)據(jù)的差值,為差值樣本的均數(shù),Sd為差值樣本的標準差, 為差值樣本均數(shù)的標準差,即差值樣本的標準誤,n為配對樣本的對子數(shù)。,配對樣本均數(shù)t檢驗——實例分析,例5.2 有12名接種卡介苗的兒童,8

13、周后用兩批不同的結核菌素,一批是標準結核菌素,一批是新制結核菌素,分別注射在兒童的前臂,兩種結核菌素的皮膚浸潤反應平均直徑(mm)如表5-1所示,問兩種結核菌素的反應性有無差別。,配對樣本均數(shù)t檢驗——檢驗步驟,建立檢驗假設,確定檢驗水準H0:?d=0,兩種結核菌素的皮膚浸潤反應總體平均直徑差異為0;H1:?d?0,兩種結核菌素的皮膚浸潤反應總體平均直徑差異不為0;??0.05。計算檢驗統(tǒng)計量先計算差值d及d2如上表第四、五列

14、所示,本例?d = 39, ?d 2 ? 195。,配對樣本均數(shù)t檢驗——檢驗步驟,先計算差數(shù)的標準差 計算差值的標準誤按公式計算,得:,,,,配對樣本均數(shù)t檢驗——檢驗步驟,確定 P 值,作出推斷結論自由度計算為 ν=n-1=n-1=12-1=11,查附表2,得t0.05(11) = 2.201, t0.01(11) = 3.106,本例t > t0.01(11), P < 0.01,差

15、別有統(tǒng)計學意義,拒絕H0,接受H1,可認為兩種方法皮膚浸潤反應結果的差別有統(tǒng)計學意義。,第三節(jié) 兩獨立樣本t檢驗,兩獨立樣本t 檢驗(two independent sample t-test),又稱成組 t 檢驗。 適用于完全隨機設計的兩樣本均數(shù)的比較,其目的是檢驗兩樣本所來自總體的均數(shù)是否相等。 完全隨機設計是將受試對象隨機地分配到兩組中,每組患者分別接受不同的處理,分析比較處理的效應。,第三節(jié) 兩獨立樣本t檢驗,兩獨立

16、樣本t檢驗要求兩樣本所代表的總體服從正態(tài)分布N(μ1,σ12)和N(μ2,σ22),且兩總體方差σ12、σ22相等,即方差齊性(homogeneity of variance, homoscedasticity)。若兩總體方差不等,即方差不齊,可采用t’檢驗,或進行變量變換,或用秩和檢驗方法處理(見第九章)。,兩獨立樣本t檢驗原理,兩獨立樣本t檢驗的檢驗假設是兩總體均數(shù)相等,即H0:μ1=μ2,也可表述為μ1-μ2=0,這里可將兩樣本

17、均數(shù)的差值看成一個變量樣本, 就是差值的標準誤,則在H0條件下兩獨立樣本均數(shù)t檢驗可視為樣本與已知總體均數(shù)μ1-μ2=0的單樣本t檢驗, 統(tǒng)計量計算公式為,,其中,兩獨立樣本t檢驗原理,Sc2稱為合并方差(combined/pooled variance),上述公式可用于已知兩樣本觀察值原始資料時計算,當兩樣本標準差S1和S2已知時,合并方差Sc2為:,兩獨立樣本t檢驗——實例分析,例5.3 25例糖尿病患者隨機分成兩組,甲組單純用

18、藥物治療,乙組采用藥物治療合并飲食療法,二個月后測空腹血糖(mmol/L)如表5-2 所示,問兩種療法治療后患者血糖值是否相同?,兩獨立樣本t檢驗——檢驗步驟,建立檢驗假設,確定檢驗水準H0:?1=?2,兩種療法治療后患者血糖值的總體均數(shù)相同;H1:?1??2,兩種療法治療后患者血糖值的總體均數(shù)不同;??0.05。計算檢驗統(tǒng)計量,兩獨立樣本t檢驗——檢驗步驟,代入公式,得:,兩獨立樣本t檢驗——實例分析,按公式計算,算得:

19、確定P值,作出推斷結論 兩獨立樣本t檢驗自由度為 ? =n1+n2-2 =12+13-2=23; 查t界值表,t0.05(23)=2.069,t0.01(23)=2.807.,,兩獨立樣本t檢驗——實例分析,由于 t0.01(23)> t ? t0.05(23),0.01 < P ? 0.05,按??0.05的水準拒絕H0,接受H1,差異有統(tǒng)計學意義。故可認為該地兩種療法治療糖尿病患者二個月后測得的空腹血糖值的

20、均數(shù)不同。幾何均數(shù)資料 t 檢驗,服從對數(shù)正態(tài)分布,先作對數(shù)變換,再作 t 檢驗。,t 檢驗應用條件,兩組計量資料小樣本比較;樣本對總體有較好代表性,對比組間有較好組間均衡性——隨機抽樣和隨機分組;樣本來自正態(tài)分布總體,配對t檢驗要求差值服從正態(tài)分布,實際應用時單峰對稱分布也可以;大樣本時,用u 檢驗,且正態(tài)性要求可以放寬;兩獨立樣本均數(shù)t檢驗要求方差齊性——兩組總體方差相等或兩樣本方差間無顯著性。,第四節(jié) 方差不齊時兩樣本均數(shù)

21、檢驗,當兩總體方差不等(方差不齊)時,兩獨立樣本均數(shù)的比較,可采用檢驗,亦稱近似t檢驗 方差齊性檢驗——F檢驗F檢驗要求資料服從正態(tài)分布 檢驗統(tǒng)計量F值按下列公式計算,ν1=n1-1, ν2= n2-1,方差齊性檢驗,為較大的樣本方差, 為較小的樣本方差;檢驗統(tǒng)計量F值為兩個樣本方差之比,若樣本方差的不同僅為抽樣誤差的影響,F(xiàn)值一般不會偏離1太遠。求得F值后,查附表3(方差齊性檢驗用的F界值表)得P值。 取α=0.05水準,

22、若F≥F0.05(ν1,ν2),P≤0.05,拒絕H0,接受H1,可認為兩總體方差不等; 若F<F0.05(ν1,ν2),P>0.05,兩總體方差相等。,方差齊性檢驗——實例分析,例5.4 兩組小白鼠分別飼以高蛋白和低蛋白飼料,4周后記錄小白鼠體重增加量(g)如表5-3所示,問兩組動物體重增加量的均數(shù)是否相等?,方差齊性檢驗——實例分析,建立檢驗假設,確定檢驗水準H0:?12=?22,即高蛋白與低蛋白飼料喂養(yǎng)后小白鼠體重增加量的總

23、體方差相同;H1:?12≠?22,即高蛋白與低蛋白飼料喂養(yǎng)后小白鼠體重增加量的總體方差不同;?=0.05。計算檢驗統(tǒng)計量,對表的數(shù)據(jù)計算可得:,方差齊性檢驗——實例分析,按公式計算確定P值,作出統(tǒng)計推論 自由度ν1=n1-1= 12-1 = 11, ν2 = n2-1= 13-1 = 12, 查附表3F界值表, F0.05(11,12) = 3.34  F > F0.05(11,12) P

24、 < 0.05差別有統(tǒng)計學意義,方差齊性檢驗——實例分析,按?=0.05水準,拒絕H0,接受H1 認為兩組體重增加量的總體方差不等不可直接用兩獨立樣本均數(shù)t 檢驗而應用檢驗 t’檢驗,檢驗,Satterthwaite法近似t檢驗、Welch法近似t檢驗和Cochran & Cox法近似t 檢驗 Cochran & Cox法是對臨界值校正 Satterthwaite法和Welch法是對自由度進行校正 介紹

25、Satterthwaite法和Cochran & Cox法,檢驗,統(tǒng)計量的計算公式為 Cochran & Cox法校正臨界值 的公式為式中,,Satterthwaite法檢驗的自由度校正公式為 根據(jù)自由度查t界值表,作出推斷結論 Satterthwaite法是統(tǒng)計軟件中普遍使用的方法 對例5.4資料進行檢驗,,檢驗,t’ 檢驗實例分析步驟,建立檢驗假設,確定檢驗水準H0:?1??2,即兩種飼

26、料小白鼠增重總體均數(shù)相同;H1:?1??2,即兩種飼料小白鼠增重總體均數(shù)不相同;??0.05計算檢驗統(tǒng)計量兩總體方差不同,應選用t’ 檢驗,t’ 檢驗實例分析步驟,確定P值,作出推斷結論 按Satterthwaite法計算校正自由度,得,,,t’ 檢驗實例分析步驟,查t界值表,得t0.05(12)=2.179,t> t0.05(12), P < 0.05 按Cochran & Cox法計算校正界值,

27、先查t界值表 得t0.05(11)=2.201,t0.05(12)=2.179, 再按公式計算,t’ 檢驗實例分析步驟,確定P值   得P < 0.05兩種檢驗方法所獲得的界值雖略有差異, 但結論是一致的。按?=0.05水準,拒絕H0,接受H1, 差異有統(tǒng)計學意義??烧J為兩種飼料飼養(yǎng)后小白鼠增重的均數(shù)不同,高蛋白組高于低蛋白組。,,第五節(jié) u 檢驗,根據(jù)數(shù)理統(tǒng)計的中心極限定理,不論變量X的分布是否服從正態(tài)分布,

28、當隨機抽樣的樣本例數(shù)足夠大,樣本均數(shù)服從正態(tài)分布其中?為原來的總體均數(shù), ?為總體標準差     為均數(shù)標準誤標準正態(tài)變量為,,,,U 檢驗原理,當總體標準差?已知,或樣本量較大(如n>50)時樣本均數(shù)與總體均數(shù)比較、配對設計樣本均數(shù)比較和兩獨立樣本均數(shù)比較的假設檢驗,可以計算檢驗統(tǒng)計量u值 標準正態(tài)變量u的界值雙側時,      單側時所計算的統(tǒng)計量u值與這些界值比較,很容易確定P值和作出推斷結論,,

29、,U 檢驗原理,成組設計的兩樣本均數(shù)比較的統(tǒng)計量u值計算中,兩均數(shù)差的標準誤為統(tǒng)計量u值的計算公式為,,,U 檢驗——實例分析,例5-4 研究正常人與高血壓患者膽固醇含量(mg%)的資料如下,試比較兩組血清膽固醇含量有無差別。正常人組 高血壓組,,,U 檢驗——實例分析步驟,建立檢驗假設, 確定檢驗水平    ,即正常人與高血壓患者血清膽固醇值總體均數(shù)相同;    ,即正常人與高血壓患者血清膽固醇值總體均數(shù)不同;?=0

30、.05,雙側。計算統(tǒng)計量u值將已知數(shù)據(jù)代入公式,得,,,U 檢驗——實例分析步驟,確定P值, 作出推斷結論本例u=10.40>2.58,故P<0.01,按?=0.05水準拒絕H0,接受H1,可以認為正常人與高血壓患者的血清膽固醇含量有差別,高血壓患者高于正常人。,,第六節(jié) t 檢驗中的注意事項,1. 假設檢驗結論正確的前提 作假設檢驗用的樣本資料,必須能代表相應的總體,同時各對比組具有良好的組間均衡性,才能得出有意義

31、的統(tǒng)計結論和有價值的專業(yè)結論。這要求有嚴密的實驗設計和抽樣設計,如樣本是從同質(zhì)總體中抽取的一個隨機樣本,試驗單位在干預前隨機分組,有足夠的樣本量等。,第六節(jié) t 檢驗中的注意事項,2. 檢驗方法的選用及其適用條件,應根據(jù)分析目的、研究設計、資料類型、樣本量大小等選用適當?shù)臋z驗方法。 t 檢驗是以正態(tài)分布為基礎的,資料的正態(tài)性可用正態(tài)性檢驗方法檢驗予以判斷。若資料為非正態(tài)分布,可采用數(shù)據(jù)變換的方法,嘗試將資料變換成正態(tài)分布資料

32、后進行分析。,第六節(jié) t 檢驗中的注意事項,3.雙側檢驗與單側檢驗的選擇 需根據(jù)研究目的和專業(yè)知識予以選擇。單側檢驗和雙側檢驗中的t值計算過程相同,只是t界值不同,對同一資料作單側檢驗更容易獲得顯著的結果。單雙側檢驗的選擇,應在統(tǒng)計分析工作開始之前就決定,若缺乏這方面的依據(jù),一般應選用雙側檢驗。,第六節(jié) t 檢驗中的注意事項,4.假設檢驗的結論不能絕對化 假設檢驗統(tǒng)計結論的正確性是以概率作保證的,作統(tǒng)計結論時不能絕對化。

33、在報告結論時,最好列出概率 P 的確切數(shù)值或給出P值的范圍,如寫成0.02<P<0.05,同時應注明采用的是單側檢驗還是雙側檢驗,以便讀者與同類研究進行比較。當 P 接近臨界值時,下結論應慎重。,第六節(jié) t 檢驗中的注意事項,5.正確理解P值的統(tǒng)計意義 P 是指在無效假設 H0 的總體中進行隨機抽樣,所觀察到的等于或大于現(xiàn)有統(tǒng)計量值的概率。其推斷的基礎是小概率事件的原理,即概率很小的事件在一次抽樣研究中幾乎是不可能

34、發(fā)生的,如發(fā)生則拒絕H0。因此,只能說明統(tǒng)計學意義的“顯著” 。,第六節(jié) t 檢驗中的注意事項,6.假設檢驗和可信區(qū)間的關系 假設檢驗用以推斷總體均數(shù)間是否相同,而可信區(qū)間則用于估計總體均數(shù)所在的范圍,兩者既有聯(lián)系又有區(qū)別。,第七節(jié) 假設檢驗中兩類錯誤,假設檢驗是針對H0,利用小概率事件的原理對總體參數(shù)做出統(tǒng)計推論。無論拒絕H0還是接受H0,都可能犯錯誤。,,第七節(jié) 假設檢驗中兩類錯誤,當H0為真時,檢驗結論拒絕H0接受H1,

35、這類錯誤稱為第一類錯誤或Ⅰ型錯誤(type Ⅰ error),亦稱假陽性錯誤檢驗水準,就是預先規(guī)定的允許犯Ⅰ型錯誤概率的最大值,用表示 當真實情況為H0不成立而H1成立時,檢驗結論不拒絕H0反而拒絕H1,這類錯誤稱為第二類錯誤或Ⅱ型錯誤(type Ⅱ error),亦稱假陰性錯誤,第七節(jié) 假設檢驗中兩類錯誤,概率大小用β表示,只取單側,一般未知,在已知兩總體差值d(如μ1-μ2)、和 n 時,才能算出 為了更好地理解兩類錯誤的意義

36、,以樣本均數(shù)與總體均數(shù)比較的u 檢驗來說明 設H0: ? =? 0, H1: ? < ?0 H0實際上是成立的,但由于抽樣誤差的存在,偶然得到較大的 值(絕對值)以及u 值(絕對值),,第七節(jié) 假設檢驗中兩類錯誤,使得,按=0.05的檢驗水準,拒絕H0,接受H1,結論為?<?0 此時犯Ⅰ型錯誤,其最大可能概率值為? 若? 確實小于?0,即H0不成立,H1成立,由于抽樣的偶然性,得到較小的 值(絕對值)以及u值(絕對值

37、)使得,檢驗結論不拒絕H0。此時犯Ⅱ型錯誤,其概率為β,,Ⅰ型錯誤與Ⅱ型錯誤示意圖 (以單側u檢驗為例),第七節(jié) 假設檢驗中兩類錯誤,?愈小,?愈大;相反,?愈大,?愈小 同時減?、裥湾e誤?和Ⅱ型錯誤?,唯一的方法就是增加樣本含量n 1-β稱為檢驗效能(power of a test),也稱把握度 意義為,當兩總體確有差別,按檢驗水準α,假設檢驗能發(fā)現(xiàn)其差別(拒絕H0)的能力。和β一樣,1-β只取單側。,Ⅰ型錯誤與Ⅱ型錯誤

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論