版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、102,1,第三章 總體均數(shù)的估計(jì)與假設(shè)檢驗(yàn),寧夏醫(yī)學(xué)院公共衛(wèi)生學(xué)院流行病學(xué)與衛(wèi)生統(tǒng)計(jì)學(xué)教研室喬慧,102,2,教學(xué)目標(biāo):1 .掌握 (1) 均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤的概念 (2) 總體均數(shù)可信區(qū)間的計(jì)算及其適用條件 (3) t 檢驗(yàn)的應(yīng)用條件和計(jì)算 (4) 假設(shè)檢驗(yàn)的的基本步驟及第一類(lèi)錯(cuò)誤、第二類(lèi)錯(cuò)誤的概念,102,3,熟悉: (1) 標(biāo)準(zhǔn)差與均數(shù)標(biāo)準(zhǔn)誤的區(qū)別 (2) 參考值范圍和總體均數(shù)可信區(qū)間的區(qū)別 (3) 假
2、設(shè)檢驗(yàn)的基本原理(4) t 分布的特征了解: (1) t ‘ 檢驗(yàn)的方法(2) 正態(tài)性檢驗(yàn)(3) 兩樣本方差比較的F檢驗(yàn) (4) 變量變換,102,4,例如欲了解某地2000年正常成年女性血清總膽固醇的平均水平,隨機(jī)抽取該地101名正常成年女性作為樣本觀(guān)測(cè)對(duì)象,計(jì)算得血清總膽固醇的樣本均數(shù),并以此樣本均數(shù)估計(jì)該地正常成年女性血清總膽固醇總體的水平。,102,5,統(tǒng)計(jì)推斷,統(tǒng)計(jì)推斷 statistical inf
3、erence,如:樣本均數(shù) 樣本標(biāo)準(zhǔn)差S 樣本率 P,如:總體均數(shù) 總體標(biāo)準(zhǔn)差 總體率,內(nèi)容:參數(shù)估計(jì)(estimation of parameters) 包括:點(diǎn)估計(jì)與區(qū)間估計(jì)2. 假設(shè)檢驗(yàn)(test of hypothesis),102,6,抽樣誤差的定義,假如事先知道某地18歲男生的平均身高為167.7cm。為了估計(jì)18歲男生的平均身高(總體均數(shù)),研究
4、者從所有符合要求的18歲男生中每次抽取100人,共計(jì)抽取了三次。,=169.62cmS= 4.81cm,,,,=167.75cmS= 5.27cm,=165.19cmS= 4.41cm,102,7,如果沒(méi)有個(gè)體變異……,,No Variation!No Sampling Error!,102,8,如果沒(méi)有抽樣研究……,No Random sampling!No Sampling Error!,,102,9,抽樣誤差的定義
5、,三次抽樣得到了不同的結(jié)果,原因何在?,,,,102,10,【定義】由于個(gè)體變異的存在,因隨機(jī)抽樣而產(chǎn)生的樣本統(tǒng)計(jì)量和總體參數(shù)之間以及樣本統(tǒng)計(jì)量和樣本統(tǒng)計(jì)量之間的差異,稱(chēng)為抽樣誤差(sampling error)。各種參數(shù)都有抽樣誤差,計(jì)量資料中我們以均數(shù)為研究對(duì)象。,抽樣誤差的定義,102,11,抽樣誤差的規(guī)律性,在抽樣研究中,抽樣誤差是不可避免的,但它有一定的分布規(guī)律。 既然抽樣誤差是有規(guī)律的,那么到底它的分布規(guī)律到底是怎樣的
6、?,用模擬實(shí)驗(yàn)來(lái)詮釋,102,12,,例3-1 某市1999年18歲男生身高服從N(167.7,5.32),從該總體中進(jìn)行隨機(jī)抽樣,每次樣本含量為10人,樣本數(shù)為100個(gè)。見(jiàn)表3-1,第一節(jié) 均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤,102,13,見(jiàn)P34~36表3-1,從同一總體中隨機(jī)抽取樣本例數(shù)相等的多個(gè)樣本,每個(gè)樣本都可算得一個(gè)樣本均數(shù),由于抽樣誤差的存在,樣本均數(shù)是不相等的,但樣本均數(shù)的分布呈現(xiàn)一定特點(diǎn)。,102,14,將此100個(gè)樣本均數(shù)看成新
7、變量值,則這100個(gè)樣本均數(shù)構(gòu)成一新分布,繪制直方圖。,圖3-2 從正態(tài)分布總體N(167.7, 5.32)隨機(jī)抽樣所得樣本均數(shù)分布,102,15,① ,各樣本均數(shù) 未必恰好等于總體均數(shù)② 各樣本均數(shù)間存在差異;③ 樣本均數(shù)的分布為中間多,兩邊少,左右基本對(duì)稱(chēng)。 ④ 樣本均數(shù)的變異范圍較之原變量的變異范圍大大縮小。可算得這100個(gè)樣本均數(shù)的均數(shù)為167.69cm、標(biāo)準(zhǔn)差為1.69cm。,樣本均數(shù)的抽樣分布具有
8、如下特點(diǎn):,102,16,從正態(tài)總體中隨機(jī)抽樣,其樣本均數(shù)服從正態(tài)分布;從任意總體中隨機(jī)抽樣,當(dāng)樣本含量足夠大時(shí),其樣本均數(shù)的分布逐漸逼近正態(tài)分布;樣本均數(shù)之均數(shù)的位置始終在總體均數(shù)的附近;隨著樣本含量的增加,樣本均數(shù)的離散程度越來(lái)越小,表現(xiàn)為樣本均數(shù)的分布范圍越來(lái)越窄,其高峰越來(lái)越尖。,102,17,,102,18,數(shù)理統(tǒng)計(jì)推理和中心極限定理,從均數(shù)為μ,標(biāo)準(zhǔn)差為σ的正態(tài)總體中隨機(jī)抽樣,樣本均數(shù)服從均數(shù)為μ,標(biāo)準(zhǔn)差為
9、 的正態(tài)分布。從均數(shù)為μ,標(biāo)準(zhǔn)差為σ的任意總體中隨機(jī)抽樣,當(dāng)樣本含量足夠大時(shí),樣本均數(shù)近似服從均數(shù)為μ,標(biāo)準(zhǔn)差為 的正態(tài)分布。,102,19,標(biāo)準(zhǔn)誤的定義,標(biāo)準(zhǔn)誤是描述抽樣誤差大小的指標(biāo);與描述個(gè)體值離散趨勢(shì)的指標(biāo)類(lèi)似,樣本均數(shù)的標(biāo)準(zhǔn)差就反映了從某個(gè)總體中隨機(jī)抽樣所得樣本之均數(shù)分布的離散程度。用樣本均數(shù)的標(biāo)準(zhǔn)差來(lái)反映抽樣誤差的大小。又稱(chēng)標(biāo)準(zhǔn)誤(standard error)。,102,
10、20,標(biāo)準(zhǔn)誤的計(jì)算,計(jì)算公式為其中,σ為總體標(biāo)準(zhǔn)差,n為抽樣的樣本例數(shù)在研究工作時(shí),由于總體標(biāo)準(zhǔn)差常常未知,可以利用樣本標(biāo)準(zhǔn)差近似估計(jì),102,21,標(biāo)準(zhǔn)誤的意義,反映了樣本統(tǒng)計(jì)量(樣本均數(shù),樣本率)分布的離散程度,體現(xiàn)了抽樣誤差的大小。標(biāo)準(zhǔn)誤越大,說(shuō)明樣本統(tǒng)計(jì)量(樣本均數(shù),樣本率)的離散程度越大,即用樣本統(tǒng)計(jì)量來(lái)直接估計(jì)總體參數(shù)越不可靠。反之亦然。標(biāo)準(zhǔn)誤的大小與標(biāo)準(zhǔn)差有關(guān),在例數(shù)n一定時(shí),從標(biāo)準(zhǔn)差大的總體中抽樣,標(biāo)準(zhǔn)誤較大
11、;而當(dāng)總體一定時(shí),樣本例數(shù)越多,標(biāo)準(zhǔn)誤越小。說(shuō)明我們可以通過(guò)增加樣本含量來(lái)減少抽樣誤差的大小。,,102,22,第二節(jié) t 分布 (t-distribution),102,23,一、t 分布的概念,102,24,102,25,,式中 為自由度(degree of freedom, df),3.實(shí)際工作中,由于 未知,用 代替,則 不再服從標(biāo)準(zhǔn)正態(tài)分布,而服從t 分布。,102,26,t分布
12、的演化,由于總體標(biāo)準(zhǔn)差往往是未知的,此時(shí)往往用樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差,這里,ν為自由度,取值為n-1由W.S. Gosset提出,102,27,二、t 分布的圖形與特征,分布只有一個(gè)參數(shù),即自由度,102,28,,圖3-3 不同自由度下的t 分布圖,102,29,1.特征:,102,30,2 t界值表:詳見(jiàn)附表2,可反映t分布曲線(xiàn)下的面積。單側(cè)概率或單尾概率:用 表示;雙側(cè)概率或雙尾概率:用 表
13、示。,102,31,102,32,舉例:,102,33,第三節(jié) 總體均數(shù)的估計(jì),102,34,一、參數(shù)估計(jì) 用樣本統(tǒng)計(jì)量推斷總體參數(shù)??傮w均數(shù)估計(jì):用樣本均數(shù)(和標(biāo)準(zhǔn)差)推斷總體均數(shù)。,102,35,102,36,按預(yù)先給定的概率(1??)所確定的包含未知總體參數(shù)的一個(gè)范圍。 總體均數(shù)的區(qū)間估計(jì):按預(yù)先給定的概率(1??)所確定的包含未知總體均數(shù)的一個(gè)范圍。 如給定?=0.05,該范圍稱(chēng)為參數(shù)的95%可信區(qū)間
14、或置信區(qū)間; 如給定?=0.01,該范圍稱(chēng)為參數(shù)的99%可信區(qū)間或置信區(qū)間。,2.區(qū)間估計(jì)(interval estimation):,102,37,二、總體均數(shù)可信區(qū)間的計(jì)算,102,38,二、總體均數(shù)可信區(qū)間的估計(jì),,(一) 總體均數(shù)的點(diǎn)估計(jì)(point estimation)與區(qū)間估計(jì),參數(shù)的估計(jì),,,,,點(diǎn)估計(jì):由樣本統(tǒng)計(jì)量 直接估計(jì) 總體參數(shù),區(qū)間估計(jì):在一定可信度(Confidence le
15、vel) 下,同時(shí)考慮抽樣誤差,102,39,第三節(jié) 總體均數(shù)的估計(jì),點(diǎn)估計(jì)(point estimation):是用相應(yīng)樣本統(tǒng)計(jì)量直接作為其總體參數(shù)的估計(jì)值。如 ,但未考慮抽樣誤差的大小。,區(qū)間估計(jì)(interval estimation):是按預(yù)先給定的概率(1-α)所確定的包含未知總體參數(shù)的一個(gè)范圍。該范圍稱(chēng)為參數(shù)的可信區(qū)間或置信區(qū)間(confidence interval,CI),(1-α)稱(chēng)為可
16、信度或置信度(confidence level),用開(kāi)區(qū)間表示的可信區(qū)間中兩個(gè)數(shù)值稱(chēng)為可信限或置信限(confidence limit,CL),102,40,,總體均數(shù)可信區(qū)間的計(jì)算需考慮:(1)總體標(biāo)準(zhǔn)差?是否已知, (2)樣本含量n的大小通常有兩類(lèi)方法:(1)t分布法 (2)u分布法,102,41,第三節(jié) 總體均數(shù)的估計(jì),(1)σ已知:按U 分布總體均數(shù)雙側(cè)1-α可信區(qū)間為,二.總體均數(shù)可信區(qū)間的計(jì)算,1.單
17、一總體均數(shù)可信區(qū)間,總體均數(shù)單側(cè)1-α可信區(qū)間為,102,42,第三節(jié) 總體均數(shù)的估計(jì),(2)σ未知,但n足夠大:按U分布(近似正態(tài)分布)總體均數(shù)雙側(cè)1-α可信區(qū)間為,二.總體均數(shù)可信區(qū)間的計(jì)算,1.單一總體均數(shù)可信區(qū)間,總體均數(shù)單側(cè)1-α可信區(qū)間為,102,43,例3-3 某地抽取正常成人200名,測(cè)得其血清膽固醇的均數(shù)為 ,標(biāo)準(zhǔn)差S=1.20mmol/L ,估計(jì)該地正常成年人血清膽固醇均數(shù)的95%
18、和99%置信區(qū)間。,第三節(jié) 總體均數(shù)的估計(jì),95%CI:,99%CI:,102,44,第三節(jié) 總體均數(shù)的估計(jì),(3)σ未知,但n較小 :按t 分布總體均數(shù)雙側(cè)1-α可信區(qū)間為,二.總體均數(shù)可信區(qū)間的計(jì)算,1.單一總體均數(shù)可信區(qū)間,總體均數(shù)單側(cè)1-α可信區(qū)間為,102,45,例3-2 已知某地27例健康成年男性血紅蛋白量的均數(shù)為 ,標(biāo)準(zhǔn)差S=15g/L ,試問(wèn)該地健康成年男性血紅蛋白量的95%和99%置信區(qū)
19、間。本例n=27,S=15,第三節(jié) 總體均數(shù)的估計(jì),95%CI:,99%CI:,102,46,第三節(jié) 總體均數(shù)的估計(jì),從總體標(biāo)準(zhǔn)差相等,但總體均數(shù)不等的兩個(gè)正態(tài)總體N(μ1,σ2)和 N(μ2,σ2)進(jìn)行隨機(jī)抽樣。則兩總體均數(shù)(μ1- μ2)之差的雙側(cè)1-α可信區(qū)間為,二.總體均數(shù)可信區(qū)間的計(jì)算,2.兩總體均數(shù)之差的可信區(qū)間,自由度:ν=n1+n2-2,102,47,第三節(jié) 總體均數(shù)的估計(jì),兩總體均數(shù)(μ1- μ
20、2)之差的單側(cè)1-α可信區(qū)間為,當(dāng)兩樣本的樣本含量均較大時(shí),102,48,例3-4 為了解氨甲喋呤(MTX)對(duì)外周血IL-2水平的影響,某醫(yī)生將61名哮喘患者隨機(jī)分為兩組。其中對(duì)照組29例( ),采用安慰劑;實(shí)驗(yàn)組32例( ),采用小劑量氨甲喋呤(MTX)進(jìn)行治療。測(cè)得對(duì)照組治療前IL-2的均數(shù)為20.10 IU/ml ( ),標(biāo)準(zhǔn)差為7.02 IU/ml ( );試驗(yàn)組治療前IL-2的均數(shù)為16.89 IU/ml
21、 ( ),標(biāo)準(zhǔn)差為8.46 IU/ml ( )。問(wèn)兩組治療前基線(xiàn)的IL-2總體均數(shù)相差有多大?,,102,49,第三節(jié) 總體均數(shù)的估計(jì),,102,50,三、可信區(qū)間的確切涵義,102,51,,1. 95%的可信區(qū)間的理解:(1)所要估計(jì)的總體參數(shù)有95%的可能在我們所估計(jì)的可信區(qū)間內(nèi)。(2)從正態(tài)總體中隨機(jī)抽取100個(gè)樣本,可算得100個(gè)樣本均數(shù)和標(biāo)準(zhǔn)差,也可算得100個(gè)均數(shù)的可信區(qū)間,平均約有95個(gè)可信區(qū)間包
22、含了總體均數(shù) ,估計(jì)錯(cuò)誤的概率是5%,為小概率事件。(3)但在實(shí)際工作中,只能根據(jù)一次試驗(yàn)結(jié)果估計(jì)可信區(qū)間,我們就認(rèn)為該區(qū)間包含了總體均數(shù)?。,102,52,,2.可信區(qū)間的兩個(gè)要素(1)準(zhǔn)確度:用可信度(1??)表示:即區(qū)間包含總體均數(shù)?的理論概率大小 。當(dāng)然它愈接近1愈好,如99%的可信區(qū)間比95%的可信區(qū)間要好 。(2)精確度:即區(qū)間的寬度 區(qū)間愈窄愈好,如95%的可信區(qū)間比99%的可信區(qū)間要好 。,102,53,,當(dāng)
23、n確定時(shí),上述兩者互相矛盾。提高準(zhǔn)確度(可信度),則精確度降低(可信區(qū)間會(huì)變寬),勢(shì)必降低可信區(qū)間的實(shí)際應(yīng)用價(jià)值,故不能簡(jiǎn)單認(rèn)為99%可信區(qū)間比95%可信區(qū)間要好。相反,在實(shí)際應(yīng)用中,95%可信區(qū)間更為常用。在可信度確定的情況下,增加樣本含量可減小區(qū)間寬度,提高精確度。,102,54,四、總體均數(shù)可信區(qū)間與參考值范圍的區(qū)別,102,55,第三節(jié) 總體均數(shù)的估計(jì),表3-2 總體均數(shù)的可信區(qū)間與參考值范圍的區(qū)別,四. 可信區(qū)
24、間與參考值范圍的區(qū)別,,正態(tài)分布偏態(tài)分布 PX~P100-X,102,56,注意:標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的區(qū)別。 1)概念不同:標(biāo)準(zhǔn)差是描述樣本中個(gè)體值間的變異程度的指標(biāo),標(biāo)準(zhǔn)差越小,表示變量值圍繞均數(shù)的波動(dòng)越小。標(biāo)準(zhǔn)誤是描述樣本均數(shù)間變異程度的指標(biāo),標(biāo)準(zhǔn)誤越小,表示樣本均數(shù)圍繞總體均數(shù)的波動(dòng)越小。,2) 用途不同:標(biāo)準(zhǔn)差常用于表示變量值對(duì)均數(shù)波動(dòng)的大小,當(dāng)資料呈正態(tài)分布時(shí),與均數(shù)結(jié)合可估計(jì)正常值范圍;標(biāo)
25、準(zhǔn)誤常用于表示樣本統(tǒng)計(jì)量(樣本均數(shù)、樣本率)對(duì)總體參數(shù)(總體均數(shù)、總體率)的波動(dòng)情況,可估計(jì)參數(shù)的可信區(qū)間、進(jìn)行假設(shè)檢驗(yàn)。,102,57,3)與例數(shù)的關(guān)系不同:當(dāng)樣本含量足夠大時(shí),標(biāo)準(zhǔn)差趨向穩(wěn)定。而標(biāo)準(zhǔn)誤隨例數(shù)的增大而減小,甚至趨向于0。若樣本含量趨向于總例數(shù),則標(biāo)準(zhǔn)誤接近于0。,聯(lián)系;二者均為變異指標(biāo),如果把總體中各樣本均數(shù)看成一個(gè)變量,則標(biāo)準(zhǔn)誤可稱(chēng)為樣本均數(shù)的標(biāo)準(zhǔn)差。兩者均可與均數(shù)結(jié)合運(yùn)用,但描述的內(nèi)容各不相同。,102,
26、58,第四節(jié) t 檢驗(yàn),102,59,第四節(jié) t 檢驗(yàn)和u 檢驗(yàn),在實(shí)際應(yīng)用中,常常遇到這樣的問(wèn)題:某一樣本均數(shù)是否來(lái)自于已知均數(shù)總體??jī)蓚€(gè)不同樣本均數(shù)是否來(lái)自同一總體等等?回答這類(lèi)問(wèn)題,除可用前面介紹的參數(shù)估計(jì)方法外,更多采用統(tǒng)計(jì)推斷的另一方面——假設(shè)檢驗(yàn)來(lái)解決。,假設(shè)檢驗(yàn)的概念,一般科研程序: 假說(shuō)----驗(yàn)證----對(duì)假說(shuō)作出結(jié)論,102,60,假設(shè)檢驗(yàn)過(guò)去稱(chēng)顯著性檢驗(yàn)。它是利用小概率反證法思想,從問(wèn)題的
27、對(duì)立面(H0)出發(fā)間接判斷要解決的問(wèn)題(H1)是否成立。然后在H0成立的條件下計(jì)算檢驗(yàn)統(tǒng)計(jì)量,最后獲得P值來(lái)判斷。,假設(shè)檢驗(yàn)基本思想及步驟,102,61,第四節(jié) t 檢驗(yàn)和u 檢驗(yàn),假設(shè)檢驗(yàn)的步驟,例3-5 某醫(yī)生測(cè)量了36名從事鉛作業(yè)的男性工人的血紅蛋白含量,算得其均數(shù)為130.83g/L,標(biāo)準(zhǔn)差為25.74g/L。問(wèn)從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值140g/L?,以單樣本t 檢驗(yàn)為例,102,62,,從資料
28、提供的信息來(lái)看,樣本均數(shù)130.83g/L與總體均數(shù)140g/L不相等,其原因可有以下兩個(gè)方面: ①樣本估計(jì)的總體均數(shù)等于140,差別僅僅是由于抽樣誤差所致;(偶然的、隨機(jī)的、較小的) 統(tǒng)計(jì)學(xué)上稱(chēng)為差異無(wú)顯著性。 ②除抽樣誤差外,鉛作業(yè)工人與正常成年男性的血紅蛋白含量存在本質(zhì)上的差異。(必然的、大于隨機(jī)誤差)。統(tǒng)計(jì)學(xué)上稱(chēng)為差異有顯著性。兩種情況只有一個(gè)是正確的,且二者必居其一,需要我們作出推斷。,102,63
29、,第四節(jié) t 檢驗(yàn)和u 檢驗(yàn),,造成兩者不等的原因: ①同一總體,即 ,但有抽樣誤差存在;,②非同一總體,即 存在本質(zhì)上的差別,同時(shí)有抽樣誤差存在。,,102,64,分析:研究者可能有兩種目的,1)推斷兩總體有無(wú)差別,不管鉛作業(yè)工人的血紅蛋白含量高于正常人群值還是低于正常值,兩種可能性都存在,研究者都同樣關(guān)心,應(yīng)當(dāng)用雙側(cè)檢驗(yàn)。2)根據(jù)專(zhuān)業(yè)知識(shí),已知鉛作業(yè)工人的血紅蛋白含量不會(huì)高于
30、正常人群值或是研究者只關(guān)心鉛作業(yè)工人的血紅蛋白含量是否低于正常人群值,應(yīng)當(dāng)用單側(cè)檢驗(yàn)。一般認(rèn)為雙側(cè)檢驗(yàn)較為穩(wěn)妥,故較為常用。,,102,65,102,66,對(duì)于檢驗(yàn)假設(shè),須注意: ① 檢驗(yàn)假設(shè)是針對(duì)總體而言,而不是針對(duì)樣本; ② H0和H1是相互聯(lián)系,對(duì)立的假設(shè),后面的結(jié)論是根據(jù)H0和H1作出的,因此兩者不是可有可無(wú),而是缺一不可;③ H1的內(nèi)容直接反映了檢驗(yàn)單雙側(cè)。若H1中只是? ??0 或 ? <?0,則此檢驗(yàn)
31、為單側(cè)檢驗(yàn)。它不僅考慮有無(wú)差異,而且還考慮差異的方向。④ 單雙側(cè)檢驗(yàn)的確定,首先根據(jù)專(zhuān)業(yè)知識(shí),其次根據(jù)所要解決的問(wèn)題來(lái)確定。若從專(zhuān)業(yè)上看一種方法結(jié)果不可能低于或高于另一種方法結(jié)果,此時(shí)應(yīng)該用單側(cè)檢驗(yàn)。一般認(rèn)為雙側(cè)檢驗(yàn)較保守和穩(wěn)妥。,102,67,102,68,P的含義是指從H0規(guī)定的總體隨機(jī)抽樣,抽得等于及大于(或/和等于及小于)現(xiàn)有樣本獲得的檢驗(yàn)統(tǒng)計(jì)量(如t、u等)值的概率。 當(dāng)求得檢驗(yàn)統(tǒng)計(jì)量的值后,一般可通過(guò)特制的統(tǒng)計(jì)用表直
32、接查出P值。,3. 確定P值,102,69,4.作出推斷結(jié)論 ①如果P≤a時(shí),結(jié)論為按所取檢驗(yàn)水準(zhǔn)α拒絕H0,接受H1,差異有統(tǒng)計(jì)學(xué)顯著性意義,即存在本質(zhì)差異。 ②如果P>a ,結(jié)論為按所取檢驗(yàn)水準(zhǔn)α不拒絕H0,差異無(wú)統(tǒng)計(jì)學(xué)顯著性意義。即差異是由抽樣誤差引起的。,102,70,102,71,第四節(jié) t 檢驗(yàn)和u 檢驗(yàn),當(dāng)樣本含量n較小時(shí),理論上要求t 檢驗(yàn)的樣本隨機(jī)地取自正態(tài)總體,兩小樣本均數(shù)比較時(shí)還要求兩樣本所對(duì)
33、應(yīng)的總體方差相等,即方差齊性。但實(shí)際應(yīng)用時(shí),與上述條件略有偏離,對(duì)結(jié)果亦影響不大。 而u 檢驗(yàn)則要求樣本含量 n 較大,或 n 雖小但總體標(biāo)準(zhǔn)差已知。,t 檢驗(yàn)(t-test)和u 檢驗(yàn)(u-test)是計(jì)量資料中最常用且較為簡(jiǎn)單的兩種假設(shè)檢驗(yàn)方法。,102,72,第四節(jié) t 檢驗(yàn)和u 檢驗(yàn),,例3-5 某醫(yī)生測(cè)量了36名從事鉛作業(yè)的男性工人的血紅蛋白含量,算得其均數(shù)為130.83g/L,標(biāo)準(zhǔn)差為25.74g/L
34、。問(wèn)從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值140g/L?,一、單樣本t 檢驗(yàn)(樣本均數(shù)與總體均數(shù)的比較),目的:推斷該樣本所代表的未知總體均數(shù)與已知總體均數(shù)是否相等,102,73,第四節(jié) t 檢驗(yàn)和u 檢驗(yàn),1. 建立檢驗(yàn)假設(shè)、確定檢驗(yàn)水準(zhǔn)并確定單、雙側(cè)檢驗(yàn)。,102,74,第四節(jié) t 檢驗(yàn)和u 檢驗(yàn),計(jì)算統(tǒng)計(jì)量(statistic):不同的檢驗(yàn)方法和類(lèi)型選用相應(yīng)的統(tǒng)計(jì)量。,102,75,第四節(jié) t 檢
35、驗(yàn)和u 檢驗(yàn),確定P值 P值的意義:H0成立的可能性(概率)有多大。查 t 值表:,102,76,第四節(jié) t 檢驗(yàn)和u 檢驗(yàn),做推斷結(jié)論: (包括統(tǒng)計(jì)結(jié)論和專(zhuān)業(yè)結(jié)論),假設(shè)檢驗(yàn)的推斷結(jié)論是對(duì)“H0是否真實(shí)”作出判斷。這種判斷是通過(guò)比較P值與檢驗(yàn)水準(zhǔn)α的大小來(lái)進(jìn)行的。,按α=0.05水準(zhǔn),拒絕H0,接受H1,差別有統(tǒng)計(jì)學(xué)意義??烧J(rèn)為從事鉛作業(yè)的男性工人平均血紅蛋白含量低于正常成年男性。,102,77,配對(duì)t 檢驗(yàn)適用
36、于配對(duì)設(shè)計(jì)的計(jì)量資料。配對(duì)設(shè)計(jì)是將受試對(duì)象按照某些重要特征(可疑混雜因素)配成對(duì)子,每對(duì)的兩個(gè)受試對(duì)象隨機(jī)分配到兩處理組。配對(duì)設(shè)計(jì)類(lèi)型:①兩同質(zhì)受試對(duì)象分別接受兩種不同的處理;②同一受試對(duì)象分別接受兩種不同處理;③同一受試對(duì)象(一種)處理前后的數(shù)據(jù)。,二、配對(duì)t 檢驗(yàn) (paired / matched t-test),102,78,表3-3 兩種方法對(duì)乳酸飲料中脂肪含量的測(cè)定結(jié)果(%),102,79,(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水
37、準(zhǔn)H0:?d=0,即兩種方法的測(cè)定結(jié)果相同H1:?d≠0,即兩種方法的測(cè)定結(jié)果不同?=0.05 (2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量本例n=10,?d=2.724,?d2=0.8483,,,,102,80,按公式(3-16) (3)確定P值,作出推斷結(jié)論 查附表2的t界值表得P<0.001。按?=0.05水準(zhǔn),拒絕H0,接受H1,有統(tǒng)計(jì)學(xué)意義。可認(rèn)為兩種方法對(duì)脂肪含量的測(cè)定結(jié)果不同,哥特里-羅紫
38、法測(cè)定結(jié)果較高。,102,81,第四節(jié) t 檢驗(yàn)和u 檢驗(yàn),適用于完全隨機(jī)設(shè)計(jì)兩樣本均數(shù)的比較,通過(guò)樣本信息推斷所屬的兩總體均數(shù)是否不等。,三、兩樣本t 檢驗(yàn)(成組t 檢驗(yàn))(two-sample/group t-test),兩組完全隨機(jī)設(shè)計(jì)是將同質(zhì)的受試對(duì)象完全隨機(jī)分配到兩個(gè)不同處理組。,當(dāng)兩樣本含量較小時(shí),且均來(lái)自正態(tài)總體時(shí),要根據(jù)兩總體方差是否相等而采用不同的檢驗(yàn)方法。,102,82,,102,83,,計(jì)算公式為,102,8
39、4,第四節(jié) t 檢驗(yàn)和u 檢驗(yàn),例3-7 為研究國(guó)產(chǎn)四類(lèi)新藥阿卡波糖膠囊的降血糖效果,某醫(yī)院用40名Ⅱ型糖尿病病人進(jìn)行同期隨機(jī)對(duì)照實(shí)驗(yàn)。實(shí)驗(yàn)者將這些病人隨機(jī)等分到試驗(yàn)組(用阿卡波糖膠囊和對(duì)照組(用拜唐蘋(píng)膠囊),分別測(cè)得試驗(yàn)開(kāi)始前和8周后的空腹血糖,算得空腹血糖下降值見(jiàn)表,能否認(rèn)為該國(guó)產(chǎn)四類(lèi)新藥阿卡波糖膠囊與拜唐蘋(píng)膠囊對(duì)血糖的降糖效果不同。,102,85,第四節(jié) t 檢驗(yàn)和u 檢驗(yàn),檢驗(yàn)步驟:,102,86,第四節(jié) t
40、檢驗(yàn)和u 檢驗(yàn),查t 臨界值表:t0.05/2,38=2.204 t 0.05 按α=0.05水準(zhǔn)不拒絕H0,差別無(wú)統(tǒng)計(jì)學(xué)意義。故還不能認(rèn)為阿卡波糖膠囊與拜唐蘋(píng)膠囊對(duì)空腹血糖的降糖效果不同。,102,87,例6-4 某口腔科測(cè)得長(zhǎng)春市13—16歲居民男性20人的恒牙初期腭弓深度均值為17.15mm,標(biāo)準(zhǔn)差為1.59mm;女性34人的均值為16.92mm,標(biāo)準(zhǔn)差為1.42mm。根據(jù)這份數(shù)據(jù)可否認(rèn)為該市13—16歲
41、居民腭弓深度有性別差異?,102,88,檢驗(yàn)步驟:,102,89,查t 臨界值表:t0.5/2,50=0.679 t 0.5 按α=0.05水準(zhǔn)不拒絕H0,差別無(wú)統(tǒng)計(jì)學(xué)意義。故還不能認(rèn)為該市13—16歲居民腭弓深度有性別差異。,102,90,u檢驗(yàn) 適用于兩樣本含量較大的資料(如都>60)。目的仍然是推斷兩總體均數(shù)有無(wú)差別。,,代表兩樣本均數(shù)之差的標(biāo)準(zhǔn)誤,,102,91,例 某地對(duì)抽樣調(diào)查了部分健康成
42、人的紅細(xì)胞數(shù),其中男性360人,均數(shù)為 ,標(biāo)準(zhǔn)差為 ,女性255人,均數(shù)為 ,標(biāo)準(zhǔn)差為 , 試問(wèn)該地男女紅細(xì)胞數(shù)的均數(shù)有無(wú)差別?,,1)建立假設(shè),確定檢驗(yàn)水準(zhǔn) H0:該地男女紅細(xì)胞數(shù)的均數(shù)相等,即μ1= μ2 H1:該地男女紅
43、細(xì)胞數(shù)的均數(shù)不等,即μ1≠ μ2,α=0.05,雙側(cè),102,92,(2)選定檢驗(yàn)方法并計(jì)算檢驗(yàn)統(tǒng)計(jì)量,(3)確定P值,作出推斷結(jié)論查u界值表(即t界值表中ν為∞一欄),13.63 > u0.05,雙尾=1.96 ,故雙尾概率P < 0.05。 按α=0.05水準(zhǔn),拒絕H0,接受H1,差異有統(tǒng)計(jì)學(xué)意義??烧J(rèn)為該地男女紅細(xì)胞數(shù)的均數(shù)不等,男高于女。,102,93,兩樣本均數(shù)比較方法的選擇,102,94,第四節(jié) t 檢驗(yàn)和u 檢
44、驗(yàn),例3-8 在上例國(guó)產(chǎn)新藥阿卡波糖膠囊的降血糖效果研究中,測(cè)得用拜唐蘋(píng)膠囊的對(duì)照組20例病人和用阿卡波膠囊的試驗(yàn)組20例病人,其8周時(shí)糖化血紅蛋白HbA1c(%)下降值如下表。問(wèn)用兩種不同藥物的病人其HbA1c下降值是否不同?,表3-5 對(duì)照組和試驗(yàn)組HbA1c下降值(%),,102,95,第四節(jié) t 檢驗(yàn)和u 檢驗(yàn),(1) Cochran & Cox近似t 檢驗(yàn)(對(duì)臨界值校正),2.總體方差不等的 t’ 檢驗(yàn),10
45、2,96,故當(dāng)兩個(gè)小樣本比較時(shí),若樣本例數(shù)相等,直接用t檢驗(yàn)法較為方便,只是由t界值表查P值時(shí),自由度用n-1,而不用,102,97,第四節(jié) t 檢驗(yàn)和u 檢驗(yàn),,2.計(jì)算檢驗(yàn)統(tǒng)計(jì)量,1.建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn),102,98,,(3)確定P值,作出推斷結(jié)論。查t界值表t0.05/2,19=2.093。,由t?=0.9650.05。按?=0.05水準(zhǔn),不拒絕H0,無(wú)統(tǒng)計(jì)學(xué)意義。還不能認(rèn)為用兩種不同藥物的病人其HbA1c下降值不
46、同。,102,99,,2. Satterthwaite近似t檢驗(yàn) : Cochran & Cox法是對(duì)臨界值校正 而Satterthwaite法則是對(duì)自由度校正。,102,100,,以?=28.4?28、t=0.965查附表2的t界值表得0.20<P<0.40。結(jié)論同前。,按Satterthwaite法對(duì)例3-8做檢驗(yàn),得,102,101,,3.Welch法近似t檢驗(yàn) Welch法也是對(duì)自由度進(jìn)行校正
47、。校正公式為,102,102,對(duì)例3-8,如按Welch法,則,以?=29.4?29、t =0.965查附表2的t界值表得0.20<P<0.40。結(jié)論同前。,102,103,進(jìn)行兩小樣本均數(shù)比較,若兩總體正態(tài)分布且總體方差不等,可采用:①數(shù)據(jù)變換;②近似t 檢驗(yàn)——t’檢驗(yàn);③秩轉(zhuǎn)換的非參數(shù)檢驗(yàn)。,進(jìn)行兩小樣本均數(shù)比較,若兩總體非正態(tài)分布且總體方差不等,可采用:①數(shù)據(jù)變換;②秩轉(zhuǎn)換的非參數(shù)檢驗(yàn)。,進(jìn)行兩小樣本均數(shù)比較,若
48、兩總體滿(mǎn)足正態(tài)分布且總體方差齊,可直接采用:t 檢驗(yàn),102,104,,I型錯(cuò)誤和II型錯(cuò)誤檢驗(yàn)水準(zhǔn)的選擇雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)結(jié)論的概率性,需注意的幾個(gè)問(wèn)題,102,105,I 型錯(cuò)誤和 II 型錯(cuò)誤,假設(shè)檢驗(yàn)是利用小概率反證法思想,根據(jù)P值判斷結(jié)果,此推斷結(jié)論具有概率性,因而無(wú)論拒絕還是不拒絕H0,都可能犯錯(cuò)誤。拒絕了實(shí)際上是成立的H0,這類(lèi)棄真的錯(cuò)誤稱(chēng)為第一類(lèi)錯(cuò)誤(Type I Error)。不拒絕實(shí)際上是不成立的H0,這類(lèi)
49、存?zhèn)蔚腻e(cuò)誤稱(chēng)為第二類(lèi)錯(cuò)誤(Type II Error)當(dāng)P ≤? 而拒絕H0,要注意第一類(lèi)錯(cuò)誤出現(xiàn);當(dāng)P >? 而不拒絕H0,要注意第二類(lèi)錯(cuò)誤的出現(xiàn)。,102,106,I 型錯(cuò)誤和 II 型錯(cuò)誤,102,107,I 型錯(cuò)誤:“實(shí)際無(wú)差別,但下了有差別的結(jié)論”,假陽(yáng)性錯(cuò)誤。犯這種錯(cuò)誤的概率是?(其值等于檢驗(yàn)水準(zhǔn)) II型錯(cuò)誤:“實(shí)際有差別,但下了無(wú)差別的結(jié)論”,假陰性錯(cuò)誤。犯這種錯(cuò)誤的概率是?(取單側(cè),其值未知) 。 但 n 一
50、定時(shí), ? 增大,? 則減少 。,102,108,第六節(jié) 假設(shè)檢驗(yàn)的基本步驟及其注意事項(xiàng),1-β稱(chēng)為檢驗(yàn)的效能 當(dāng)所研究的總體與H0確有差別時(shí),按檢驗(yàn)水準(zhǔn)α能夠發(fā)現(xiàn)該差異的能力。 一般情況下對(duì)同一檢驗(yàn)水準(zhǔn)α,功效大的檢驗(yàn)方法更可取。 在醫(yī)學(xué)科研設(shè)計(jì)中,檢驗(yàn)效能(1-β)不宜低于0.75,否則檢驗(yàn)結(jié)果很可能反映不出總體的真實(shí)差異,出現(xiàn)非真實(shí)的陰性結(jié)果。,102,109,減少I(mǎi)型錯(cuò)誤的主要方法:假設(shè)檢驗(yàn)時(shí)設(shè)定
51、? 值。,減少I(mǎi)I型錯(cuò)誤的主要方法:提高檢驗(yàn)效能。,提高檢驗(yàn)效能的最有效方法:增加樣本量。,如何選擇合適的樣本量:實(shí)驗(yàn)設(shè)計(jì)。,102,110,,I 型錯(cuò)誤和 II 型錯(cuò)誤圖示,,,,界值,1-?,拒絕H0,不拒絕H0,?,102,111,結(jié)論的概率性,無(wú)論做出何種推斷結(jié)論,總是有風(fēng)險(xiǎn)的!拒絕H0時(shí)可能犯I類(lèi)錯(cuò)誤;不拒絕H0時(shí)可能犯II類(lèi)錯(cuò)誤;尤其是檢驗(yàn)統(tǒng)計(jì)量位于檢驗(yàn)界值的附近時(shí),下結(jié)論更應(yīng)慎重;,?,102,112,第五節(jié)
52、 假設(shè)檢驗(yàn)中的注意事項(xiàng),1.要有嚴(yán)密的研究設(shè)計(jì) 這是假設(shè)檢驗(yàn)的前提。組間應(yīng)均衡,具有可比性,也就是除對(duì)比的主要因素(如臨床試驗(yàn)用新藥和對(duì)照藥)外,其它可能影響結(jié)果的因素(如年齡、性別、病程、病情輕重等)在對(duì)比組間應(yīng)相同或相近。保證均衡性的方法主要是從同質(zhì)總體中隨機(jī)抽取樣本,或隨機(jī)分配樣本。,102,113,2.不同的資料應(yīng)選用不同檢驗(yàn)方法 應(yīng)根據(jù)分析目的、資料類(lèi)型以及分布、設(shè)計(jì)方案的種類(lèi)、樣本含量大小等選用適當(dāng)?shù)臋z驗(yàn)方
53、法。如:配對(duì)設(shè)計(jì)的計(jì)量資料采用配對(duì)t檢驗(yàn)。而完全隨機(jī)設(shè)計(jì)的兩樣本計(jì)量資料,若為小樣本(即任一ni 60)且方差齊,則選用兩樣本t檢驗(yàn);若方差不齊,則選用近似t?檢驗(yàn)(Cochran & Cox法或Satterthwaite法)。若為大樣本(所有ni>60),則可選用大樣本u檢驗(yàn)。,102,114,3.正確理解“顯著性”一詞的含義,這里的“顯著”和“不顯著”是統(tǒng)計(jì)學(xué)術(shù)語(yǔ)。不應(yīng)把“顯著”誤解為差別很大,甚至理解為醫(yī)
54、學(xué)實(shí)踐中有重要的價(jià)值;同理,也不能把“不顯著”誤解為差別不大,或一定相等?,F(xiàn)在采用“有無(wú)統(tǒng)計(jì)學(xué)意義”表達(dá)。,102,115,4.結(jié)論不能絕對(duì)化 因統(tǒng)計(jì)結(jié)論具有概率性質(zhì),故“肯定”、“一定”、“必定”等詞不要使用。在報(bào)告結(jié)論時(shí),最好列出檢驗(yàn)統(tǒng)計(jì)量的值,注明檢驗(yàn)水準(zhǔn),以便讀者與同類(lèi)研究進(jìn)行比較或進(jìn)行循證醫(yī)學(xué)時(shí)采用Meta分析。 另外,是否拒絕H0 ,不僅決定于被研究事物本身有無(wú)本質(zhì)差異,還決定于抽樣誤差的大小、檢驗(yàn)水準(zhǔn)α的高
55、低以及單側(cè)、雙側(cè)檢驗(yàn)。,102,116,5.假設(shè)檢驗(yàn)是為專(zhuān)業(yè)服務(wù)的,統(tǒng)計(jì)結(jié)論必須和專(zhuān)業(yè)結(jié)論有機(jī)地相結(jié)合,才能得出恰如其分、符合客觀(guān)實(shí)際的最終結(jié)論。若統(tǒng)計(jì)結(jié)論和專(zhuān)業(yè)結(jié)論一致,則最終結(jié)論就和這兩者均一致(即均有或均無(wú)意義);若統(tǒng)計(jì)結(jié)論和專(zhuān)業(yè)結(jié)論不一致,則最終結(jié)論需根據(jù)實(shí)際情況加以考慮。若統(tǒng)計(jì)結(jié)論有意義,而專(zhuān)業(yè)結(jié)論無(wú)意義,則可能由于樣本含量過(guò)小或設(shè)計(jì)存在問(wèn)題,那么最終結(jié)論就沒(méi)有意義。,102,117,第六節(jié) 假設(shè)檢驗(yàn)的基本步驟及其注意事項(xiàng),
56、置信區(qū)間與假設(shè)檢驗(yàn)的區(qū)別和聯(lián)系,區(qū)間估計(jì)與假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的兩種方法。置信區(qū)間用于說(shuō)明量的大小即推斷總體均數(shù)的范圍,而假設(shè)檢驗(yàn)用于推斷質(zhì)的不同即判斷兩總體均數(shù)是否不同。它們之間既相互聯(lián)系,又有區(qū)別。,102,118,6.可信區(qū)間與假設(shè)檢驗(yàn)各自不同的作用,要結(jié)合使用。,一方面,可信區(qū)間亦可回答假設(shè)檢驗(yàn)的問(wèn)題,算得的可信區(qū)間若包含了H0,則按?水準(zhǔn),不拒絕H0;若不包含H0,則按?水準(zhǔn),拒絕H0,接受H1。,鉛作業(yè)工人血紅蛋白含量的95%
57、可信區(qū)間為(122.12-139.54)g/l,未包含已知總體均數(shù)140 g/l,因此拒絕H0的假設(shè)。,102,119,另一方面,可信區(qū)間不但能回答差別有無(wú)統(tǒng)計(jì)學(xué)意義,而且還能比假設(shè)檢驗(yàn)提供更多的信息,即提示差別有無(wú)實(shí)際的專(zhuān)業(yè)意義。,102,120,圖3-7 可信區(qū)間在統(tǒng)計(jì)推斷上提供的信息,102,121,雖然可信區(qū)間亦可回答假設(shè)檢驗(yàn)的問(wèn)題,并能提供更多的信息,但并不意味著可信區(qū)間能夠完全代替假設(shè)檢驗(yàn)??尚艆^(qū)間只能在預(yù)先規(guī)定的概率 ?
58、檢驗(yàn)水準(zhǔn)?的前提下進(jìn)行計(jì)算,而假設(shè)檢驗(yàn)?zāi)軌颢@得一較為確切的概率P值。,102,122,根據(jù)以上的結(jié)論,置信區(qū)間與相應(yīng)的假設(shè)檢驗(yàn)既能提供相互等價(jià)的信息,又有各自不同的功能。把置信區(qū)間與假設(shè)檢驗(yàn)結(jié)合起來(lái),可以提供更全面、完整的信息。因此,國(guó)際上規(guī)定,在報(bào)告假設(shè)檢驗(yàn)結(jié)論的同時(shí),必須報(bào)告相應(yīng)的區(qū)間估計(jì)結(jié)果。,102,123,第六節(jié),正態(tài)性檢驗(yàn) 和兩樣本方差比較的F檢驗(yàn),102,124,t 檢驗(yàn)的應(yīng)用條件是正態(tài)總體且方差齊性;配對(duì)t 檢驗(yàn)則要求
59、每對(duì)數(shù)據(jù)差值的總體為正態(tài)總體。 進(jìn)行兩小樣本t檢驗(yàn)時(shí),一般應(yīng)對(duì)資料進(jìn)行方差齊性檢驗(yàn),尤其兩樣本方差懸殊時(shí)。 若方差齊,采用一般的t 檢驗(yàn);若方差不齊,則采用t’檢驗(yàn)。,102,125,第七節(jié) 正態(tài)性檢驗(yàn)和兩樣本方差齊性檢驗(yàn),一、正態(tài)性檢驗(yàn),正態(tài)性檢驗(yàn)方法有兩大類(lèi):圖示法和計(jì)算法,一).圖示法:1. 概率圖(probability-probability plot,P-P plot) 是以實(shí)際或觀(guān)察的累積頻率(X)對(duì)被檢驗(yàn)
60、分布(如正態(tài)分布)的理論或期望累積頻率(Y)作圖。2. 百分位數(shù)圖(quantile-quantile plot ,Q-Q plot) 是以實(shí)際或觀(guān)察的分位數(shù)(X)對(duì)被檢驗(yàn)分布的理論或期望分位數(shù)(Y)作圖。而Q-Q圖的效率較高。,102,126,,圖3-8 例3-1中100個(gè)樣本均數(shù)的P-P圖,102,127,102,128,,,圖3-9 例3-1中100個(gè)樣本均數(shù)的Q-Q圖,102,129,第七節(jié) 正態(tài)性檢驗(yàn)和兩樣本方差齊
61、性檢驗(yàn),一、正態(tài)性檢驗(yàn),正態(tài)性檢驗(yàn)方法有兩大類(lèi):圖示法和計(jì)算法,二)計(jì)算法:1. 矩法(method of moment ,又稱(chēng)動(dòng)差法)效率最高。分別對(duì)偏度(skewness)和峰度(kurtosis)做檢驗(yàn)。,偏度系數(shù)(coefficient of skewness)偏度——指分布不對(duì)稱(chēng)的程度和方向。樣本偏度系數(shù)用g1表示,總體偏度系數(shù)用γ1表示。理論上γ1=0為對(duì)稱(chēng),γ1>0為正偏態(tài),γ1<0為負(fù)偏態(tài);,102,1
62、30,第七節(jié) 正態(tài)性檢驗(yàn)和兩樣本方差齊性檢驗(yàn),一、正態(tài)性檢驗(yàn),峰度系數(shù)(coefficient of kurtosis)峰度——指分布與正態(tài)分布曲線(xiàn)相比的冒尖程度或平坦程度。樣本峰度系數(shù)用g2表示,總體峰度系數(shù)用γ2表示。理論上γ2=0為正態(tài)峰,γ2>0為尖峭峰,γ2<0為平闊峰。 當(dāng)同時(shí)滿(mǎn)足對(duì)稱(chēng)和正態(tài)峰兩個(gè)條件時(shí),才能認(rèn)為該資料服從正態(tài)分布。,102,131,第七節(jié) 正態(tài)性檢驗(yàn)和兩樣本方差齊性檢驗(yàn),一
63、、正態(tài)性檢驗(yàn),例3-10 試用矩法對(duì)表3-1中計(jì)算機(jī)模擬抽樣所得100個(gè)樣本均數(shù)進(jìn)行正態(tài)性檢驗(yàn)。,1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn),102,132,第七節(jié) 正態(tài)性檢驗(yàn)和兩樣本方差齊性檢驗(yàn),一、正態(tài)性檢驗(yàn),2)計(jì)算統(tǒng)計(jì)量,102,133,第七節(jié) 正態(tài)性檢驗(yàn)和兩樣本方差齊性檢驗(yàn),102,134,第七節(jié) 正態(tài)性檢驗(yàn)和兩樣本方差齊性檢驗(yàn),3)確定P值,做出推斷結(jié)論查t 界值表ν → ∞,t0.50/2, ∞=0.6745偏度P>
64、0.50,峰度P>0.50按α=0.10水準(zhǔn),不拒絕H0,差別無(wú)統(tǒng)計(jì)學(xué)意義。尚不能認(rèn)為這些樣本均數(shù)的總體均數(shù)不服從正態(tài)分布。,102,135,第七節(jié) 正態(tài)性檢驗(yàn)和兩樣本方差齊性檢驗(yàn),兩總體方差齊性檢驗(yàn)的推斷過(guò)去多采用F檢驗(yàn),由于該檢驗(yàn)理論上要求資料服從正態(tài)分布,而許多資料方差不齊時(shí),往往偏離正態(tài)性。因此,今年來(lái),多采用更為穩(wěn)健、不以來(lái)總體分布具體形式的Levene檢驗(yàn)。,本節(jié)僅介紹F 檢驗(yàn),關(guān)于Levene檢驗(yàn)將在第四章第七節(jié)
65、中介紹。,102,136,二、兩樣本方差比較的F檢驗(yàn) 兩小樣本t 檢驗(yàn)時(shí),檢查兩樣本方差代表的總體方差是否相等(決定t 檢驗(yàn)的方法)。,1. Levene檢驗(yàn) 2. F檢驗(yàn),,102,137,,102,138,,,圖3-10 不同自由度時(shí)F分布的圖形,102,139,,102,140,方差齊性檢驗(yàn)的基本思想:即使兩個(gè)總體方差相等,即方差齊,樣本方差也會(huì)有抽樣波動(dòng),樣本方差不等是否是由于抽樣誤差所致?F值是兩
66、個(gè)方差之比,如果僅僅是由于抽樣誤差的影響,F(xiàn) 值不會(huì)偏離1太遠(yuǎn)。,102,141,(2) 計(jì)算檢驗(yàn)統(tǒng)計(jì)量,例3-10 對(duì)例3-8,用F 檢驗(yàn)判斷兩總體糖化血紅蛋白的方差是否不等。,(1) 建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn),102,142,(3) 確定P值,作出推斷結(jié)論,102,143,1.由于方差齊性F檢驗(yàn)在樣本含量較小時(shí)不敏感,而在樣本含量較大時(shí)太敏感,因此統(tǒng)計(jì)學(xué)家對(duì)兩樣本均數(shù)比較是否進(jìn)行方差齊性檢驗(yàn)持有不同的看法。有人提出當(dāng)一個(gè)樣本的方
67、差是另一個(gè)樣本方差的3倍以上時(shí),可認(rèn)為方差不齊。2.當(dāng)樣本含量較大時(shí)(如n1和n2均大于60),可不必做方差齊性檢驗(yàn)。,注意!,102,144,三、變量變換,常用的變量變換有對(duì)數(shù)變換、平方根變換、倒數(shù)變換、平方根反正弦變換等,應(yīng)根據(jù)資料性質(zhì)選擇適當(dāng)?shù)淖兞孔儞Q方法。,102,145,變量變換的目的:1.使各組達(dá)到方差齊性2.使資料轉(zhuǎn)換為正態(tài)分布,以滿(mǎn)足方差分析和t檢驗(yàn)的應(yīng)用條件3.直線(xiàn)化,常用于曲線(xiàn)擬和。,102,146,102
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 統(tǒng)計(jì)學(xué)第三章習(xí)題
- 統(tǒng)計(jì)學(xué)第三章new
- 統(tǒng)計(jì)學(xué)第三章統(tǒng)計(jì)整理
- 《統(tǒng)計(jì)學(xué)》-第三章-統(tǒng)計(jì)整理
- 統(tǒng)計(jì)學(xué)原理第三章-統(tǒng)計(jì)整理
- 統(tǒng)計(jì)學(xué)第三章,統(tǒng)計(jì)分組
- 應(yīng)用統(tǒng)計(jì)學(xué)講義第三章
- 統(tǒng)計(jì)學(xué)第三章選擇題
- 統(tǒng)計(jì)學(xué)資料第三章統(tǒng)計(jì)整理編輯
- 應(yīng)用統(tǒng)計(jì)學(xué)-第三章圖表法
- 統(tǒng)計(jì)學(xué)第三章練習(xí)題附答案
- 《統(tǒng)計(jì)學(xué)》第三章課后作業(yè)題
- 統(tǒng)計(jì)學(xué)第三章課后習(xí)題畫(huà)圖作業(yè)
- 統(tǒng)計(jì)學(xué)原理第三章(統(tǒng)計(jì)資料整理)習(xí)題答案
- 疲勞與斷裂第三章疲勞應(yīng)用統(tǒng)計(jì)學(xué)基礎(chǔ)
- 統(tǒng)計(jì)學(xué)第三章-數(shù)據(jù)分布特征的描述
- 生物統(tǒng)計(jì)第三章
- 統(tǒng)計(jì)學(xué)第五版第三章課后習(xí)題答案
- [學(xué)習(xí)]統(tǒng)計(jì)學(xué)--第三章平均數(shù)與標(biāo)準(zhǔn)差
- 統(tǒng)計(jì)學(xué)第五版第三章課后習(xí)題答案
評(píng)論
0/150
提交評(píng)論