研究生醫(yī)學統(tǒng)計學非參數(shù)檢驗_第1頁
已閱讀1頁,還剩60頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第八章 秩轉換的非參數(shù)檢驗,參數(shù)檢驗和非參數(shù)檢驗,?參數(shù)檢驗(parametric test ):我們介紹的統(tǒng)計推斷方法,通常要求樣本來自已知分布形式的總體(如正態(tài)總體) ,在這些假設的基礎上,對總體參數(shù)進行估計和檢驗,稱為參數(shù)檢驗。?非參數(shù)統(tǒng)計(nonparametric test):有許多資料不符合參數(shù)統(tǒng)計的要求,不能用參數(shù)統(tǒng)計的方法進行檢驗,而需要一種不依賴于總體分布類型,也不對總體參數(shù)進行統(tǒng)計推斷,而是對總體的分布形式進行比較

2、的假設檢驗,稱為非參數(shù)檢驗。,參數(shù)檢驗和非參數(shù)檢驗優(yōu)缺點,參數(shù)檢驗?優(yōu)點: ?對資料的分析利用充分 ?統(tǒng)計分析的效率高?缺點: ?對資料的要求高 ?適用范圍有限,非參數(shù)檢驗?優(yōu)點:適用范圍廣;受限條件少;穩(wěn)健性較好 ?偏態(tài)、分布不明的資料 ? 等級資料 ?含不確定數(shù)值的資料 ?方差不齊的資料?缺點:

3、 ?對信息的利用不充分,檢驗效率低(易犯Ⅱ型錯誤),參數(shù)檢驗: 總體分布已知的假設檢驗非參數(shù)檢驗:總體分布類型未知,假設檢驗的方法與總體分布類型無關。 當參數(shù)檢驗的條件不能滿足時,需用非參數(shù)檢驗方法;另等級資料、含有不確定值的資料必須用非參數(shù)檢驗。當資料滿足參數(shù)檢驗的方法時,需用參數(shù)檢驗的方法,因其檢驗效率較非參數(shù)檢驗方法高。本章介紹非參數(shù)檢驗中的一種:秩和檢驗,秩和檢驗(rank test),非參數(shù)檢驗的方法很多,秩和檢驗是

4、較常用的,檢驗效率較高的一種。其基本原理是編秩求和。,秩次與秩和,秩次(rank),秩統(tǒng)計量 是指全部觀察值按某種順序排列的位序;秩和(rank sum) 同組秩次之和。,X 110 117 119 122 127 133 135 141 Y 120 127 132

5、 140 143 162 177 181 秩次 1 2 3 4 5 6.5 6.5 8 9 10 11 12 13 14 15 16 秩和TX: 48.5 秩和Ty:87.5,秩和,A組: - 、?、+、+、+、 ++ 秩和: 1 2 4.5 4.5 4.5 8.5

6、 TA=25 B組: +、++、++、++、+++、+++ 秩和: 4.5 8.5 8.5 8.5 11.5 11.5 TB=53,TA+TB=

7、N(N+1)/2=78,?,秩次:在一定程度上反映了等級的高低;秩和:在一定程度上反映了等級的分布位置。對等級的分析,轉化為對秩次的分析。秩和檢驗就是通過秩次的排列求出秩和,進行假設檢驗。,,秩和檢驗的形式:,根據(jù)已知資料類型分為:1、配對資料符號秩和檢驗(wilcoxon signed-rank test)2、成組設計兩樣本比較(Wilcoxon Mann-Whitney test)3、成組設計多個樣本比較(Kruskal-

8、Wallis H test)4、隨機區(qū)組設計多個樣本比較的Friedman M檢驗,第一節(jié) 配對樣本比較的Wilcoxon符號秩檢驗,適用情況:配對設計計量資料,當不滿足配對t檢驗條件時(如:不是正態(tài)分布)檢驗目的:檢驗差值總體中位數(shù)是否等于0(為什么?)檢驗步驟與參數(shù)檢驗相同,1.建立檢驗假設和確定檢驗水準 H0:兩部位測得結果相同,即差值總體中位數(shù)等于零 H1:兩部位測得結果不同,即差值總體中位數(shù)不等于零

9、 α=0.05,2.計算檢驗統(tǒng)計量T值①求每對數(shù)據(jù)差值,②編秩:按差值絕對值從小到大, 若遇差值等于零,舍去不計, 遇有差值的絕對值相等,取平均秩次。③分別求秩和,正秩和以T+表示,負秩和的絕對值以T-表示。T+及T-之和等于n(n+1)/2??扇稳+或T-作為檢驗統(tǒng)計量T。,3.確定P值和作出推斷結論:當n≤50時,查配對比較的符號秩和檢驗用T界值表。當n>

10、;50,采用正態(tài)近似法,計算u值,查u界值來判斷結果。,,,如果相同秩次較多時,應作校正計算。,例 8-1 對12份血清分別用原方法和新方法測谷-丙轉氨酶,結果見表8-1的第(2)、(3)欄。問兩法所得結果有無差別?,H0:差值的總體中位數(shù)Md=0H1:Md≠0依表8-1第(4)欄,任取正秩和或負秩和為T=11.5。本例n=11,T=11.5,查附表9,得雙側0.05<P<0.10,按 水準,

11、不拒絕H0,還不能認為兩法測谷-丙轉氨酶結果有差別。,符號秩和檢驗 T 界值表,N=11 雙側 單側 13~53 0.10 0.05 10 ~ 56 0.05 0.

12、025 7 ~ 59 0.02 0.01 5 ~ 61 0.01 0.005,間距 40 46 52 56,11(11+1)/4=33(理論值),秩和檢驗的結論判斷,A組的實際秩在界值之外,則拒絕H0,接受H1。 (小于或等于下界,大于或等

13、于上界) A組的實際秩在界值之內,則不拒絕H0。 (大于下界且小于上界),符號秩和檢驗的基本思想,總秩和為T=n(n+1)/2如H0成立,則正負各半,T+ 與 T- 均接近 n(n+1)/4。如果相差太大,超出了事先規(guī)定的界值, 則H0不成立。,配對符號秩和檢驗,Wilcoxon符號秩和檢驗計算等級之差值,對差值絕對值進行編秩,并冠以差值的符號。查 T 界值表,或用近似 u 檢驗,計算 P 值;界定

14、 P 值,作出結論。,例 8-2 已知某地正常人尿氟含量的中位數(shù)為45.30 。今在該地某廠隨機抽取12名工人,測得尿氟含量見表8-2第(1)欄。問該廠工人的尿氟含量是否高于當?shù)卣H说哪蚍浚?H0:尿氟含量的總體中位數(shù)M=45.30H1:M>45.30據(jù)表8-2第(3)、(4)欄,取T=1.5。有效差值個數(shù)n=11。據(jù)n=11和T=1.5查附表9,得單側P<0.005,按 水準

15、,拒絕H0,接受H1,可認為該廠工人的尿氟含量高于當?shù)卣H说哪蚍俊?表8-2 12名工人的尿氟含量與45.30比較,扁平足療效例,用配對設計觀察兩種方法治療扁平足效果記錄如下,問那種方法好。 病例號 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 A法 好 好 好 好 差 中 好 好 中 差 好 差 好 中 好 中

16、 B法 差 好 差 中 中 差 中 差 中 差 好 差 中 差 中 差,建立假設H0:兩法療效差值的總體中位數(shù)為0;H1:差值的總體中位數(shù)不為0。建立檢驗水準? =0.05,計算檢驗統(tǒng)計量編秩:求秩和:T+=61.5,T-=4.5 確定檢驗統(tǒng)計量T :T+或T-作為統(tǒng)計量T,界定P 值本例T+=61.5,T-=4.5,已超出附表8中雙側P0.01相對應的界值5~61,故得P? 0.01。

17、結論按? =0.05水準拒絕H0,接受H1,認為兩種方法療效的總體分布不同。結合資料可認為A法優(yōu)于B法。,第二節(jié) 兩個獨立樣本比較的Wilcoxon秩和檢驗,適用情況:完全隨機設計兩組計量資料比較當不滿足t檢驗條件時或兩組等級資料比較檢驗目的:檢驗兩總體中位數(shù)(分布)是否相同(為什么?),例 8-3 對10例肺癌病人和12例矽肺0期工人用X線片測量肺門橫徑右側距RD值(cm),結果見表8-5。問肺癌病人的RD值是否高于矽肺0期工人

18、的RD值?,本例兩樣本資料經方差齊性檢驗,推斷得兩總體方差不等(P<0.01),現(xiàn)用Wilcoxon秩和檢驗。H0:肺癌病人和矽肺0期工人的RD值總體分布位置相同H1:肺癌病人的RD值高于矽肺0期工人的RD值以樣本例數(shù)小者為n1,其秩和(T1)為T=141.5本例n1=10,n2- n1=2,T=141.5,查附表10,得單側0.025<P<0.05,按 水準,拒絕H0,接受H1,

19、可認為肺癌病人的RD值高于矽肺0期工人的RD值。,表8-5 肺癌病人和矽肺0期工人的RD值(cm)比較,正態(tài)近似法,n1>10或n2-n1 >10時,例 8-4 39名吸煙工人和40名不吸煙工人的碳氧血紅蛋白HbCO(%)含量見表8-6。問吸煙工人的HbCO(%)含量是否高于不吸煙工人的HbCO(%)含量?,H0:吸煙工人和不吸煙工人的HbCO含量總體分布位置相同H1:吸煙工人的HbCO含量高于不吸煙工人的HbCO含量

20、求T值,計算u值、①先確定各等級的合計人數(shù)、秩范圍和平均秩,再計算兩樣本各等級的秩和,見(7)欄和(8欄); ②本例T=1917; ③用公式(8-2)計算u值,n1=39,n2=40,N=39+40=79,,查附表2, 得單側P<0.0005,按水準,拒絕H0,接受H1,可認為吸煙工人的HbCO(%)含量高于不吸煙工人的HbCO(%)含量。 表8-6 吸煙工人和不吸煙工人的

21、HbCO(%)含量比較,基本思想,如果H0 成立,即兩組分布位置相同, 則A組的實際秩和應接近理論秩和n1(N+1)/2; (B組的實際秩和應接近理論秩和n2(N+1)/2). 或相差不大。如果相差較大,超出了預定的界值,則可認為H0不成立。,第三節(jié) 完全隨機設計多個樣本比較的Kruskal-Wallis H檢驗,第三節(jié) 完全隨機設計多個樣本比較的Kruskal-Wallis H檢驗,先對所有數(shù)據(jù)編秩;計算 H

22、 統(tǒng)計量;查 H 界值表,或用近似 ?2 檢驗;確定P 值,作出結論。,例 8-5 用三種藥物殺滅釘螺,每批用200只活釘螺,用藥后清點每批釘螺的死亡數(shù),再計算死亡率(%),結果見表8-9。問三種藥物殺滅釘螺的效果有無差別? 表8-9 三種藥物殺滅釘螺的死亡率(%)比較,H0:三種藥物殺滅釘螺的死亡率總體分布位置相同H1:三種藥物殺滅釘螺的死亡率總體分布位置不全相同本例按公式(8-4):

23、本例N=15,n1=n2=n3=5,查附表11得P<0.01,按 水準,拒絕H0,接受H1,可認為三種藥物殺滅釘螺的效果不同。,,當各樣本相同秩次較多時(超過25%),計算校正Hc值。Hc=H/c其中,c=1-3. 確定P值,做出推斷結論(1)當組數(shù)k=3,每組例數(shù)小于5,可查附表中的H界值表得到P值。(2)當不滿足上述條件時,H近似服從自由度為k-1的χ2分布,可查χ2界值表得到P值。,,例

24、 8-6 比較小白鼠接種三種不同菌型傷寒桿菌9D、11C、和DSC1后存活日數(shù),結果見表8-10。問小白鼠接種三種不同菌型傷寒桿菌的存活日數(shù)有無差別?,H0:接種三種不同菌型傷寒桿菌的存活日數(shù)總體分布位置相同H1:接種三種不同菌型傷寒桿菌的存活日數(shù)總體分布位置不全相同N=10+9+11=30。按公式(8-4) 和公式(8-5):HC=9.77/0.98=9.

25、97H0,接受H1,可認為小白鼠接種不同菌型傷寒桿菌的存活日數(shù)有差別。,表 8-10 小白鼠接種三種不同菌型傷寒桿菌的存活日數(shù)比較,例 8-7 四種疾病患者痰液內嗜酸性粒細胞的檢查結果見表8-11。問四種疾病患者痰液內的嗜酸性粒細胞有無差別? 表8-11 四種疾病患者痰液內嗜酸性粒細胞比較,H0:四種疾病患者痰液內嗜酸性粒細胞總體分布位置相同H1:四種疾病患者痰液內嗜酸性粒細胞總體分布位置不全相同如表8

26、-11第(2)欄的秩和R1是用第(2)欄各等級的頻數(shù)與第(8)欄平均秩相乘再求和,仿此得表8-11下部Ri行??烧J為四種疾病患者痰液內的嗜酸性粒細胞有差別。,多個獨立樣本兩兩比較的Nemenyi法檢驗,,例 8-8 對例8-6資料(表8-10)作三個樣本間的兩兩比較。,H0:任意兩存活日數(shù)總體分布位置相同H1:任意兩存活日數(shù)總體分布位置不同本例在例8-6中已算得C=0.98。根據(jù)表8-10下部ni行和 行數(shù)據(jù),

27、按公式(8-6):可認為小白鼠接種11C的存活日數(shù)高于接種9D的存活日數(shù);,第四節(jié) 隨機區(qū)組設計多個樣本比較的Friedman M檢驗,例 8-9 8名受試對象在相同實驗條件下分別接受4種不同頻率聲音的刺激,他們的反應率(%)資料見表8-12。問4種頻率聲音刺激的反應率是否有差別?表 8-12 8名受試對象對4種不同頻率聲音刺激的反應率(%)比較,本例為百分率資料,不服從正態(tài)分布,現(xiàn)用Friedman M檢驗。H0:

28、4種頻率聲音刺激的反應率總體分布位置相同H1:4種頻率聲音刺激的反應率總體分布位置不全相同本例按公式(8-7)本例n=8和g=4,查附表12得P<0.05,按 水準,拒絕H0,接受H1,可認為4種頻率聲音刺激的反應率有差別。,F近似法 隨機區(qū)組設計的多個相關樣本比較,當區(qū)組個數(shù)較多時,還可近似用秩轉換的F檢驗,其公式見表8-13。表8-13 秩轉換的F檢驗公式對例8-9

29、資料(見表8-12)有:n=8,g=4, =112+162+23.52+29.52=1799.5,例 8-10 對例8-9資料(表8-12)作四個樣本間的兩兩比較。,H0:任意兩反應率總體分布位置相同H1:任意兩反應率總體分布位置不同本例根據(jù)表8-12有n=8,g=4,按公式(8-9) 和公式(8-10)

30、 有 :,表 8-15 表8-12相關樣本的兩兩比較,非參數(shù)檢驗的適用條件,極度偏態(tài)的資料或分布未知的資料等級資料; 有不確定數(shù)值的資料;方差不齊的資料。,4.17,非參數(shù)檢驗!統(tǒng)計量近似正態(tài)分布,而不是資料 服從正態(tài)分布!,秩和檢驗的正確應用,主要對等級資料進行分析;秩和檢驗可用于任意分布(distribution free)的資料;T檢驗與H檢驗的關系 H檢驗

31、 T檢驗 n=2 F檢驗 t檢驗,,,秩和檢驗用于定量資料,計量資料中: 極度偏態(tài)資料,或個別數(shù)值偏離過大 各組離散度相差懸殊 資料中含有不確定值 大于5年 <0.001 1:1024以上 兼有等級和定量性

32、質的資料,參數(shù)檢驗與非參數(shù)檢驗,在總體的分布類型已知的條件下,對總體的參數(shù)進行檢驗,稱為參數(shù)檢驗。在總體的分布類型未知或者不考慮總體的分布的條件下,對總體的分布進行檢驗,稱為非參數(shù)檢驗。適用于任意分布類型的資料,不受總體分布的制約。,成組設計兩樣本比較,如資料滿足 t 檢驗的條件,應該用 t 檢驗進行分析。此時,如果對這類資料用Wilcoxon秩和檢驗,實際上是將觀察單位的具體數(shù)值舍棄不用,只保留了秩次的信息,使檢驗功效降低;尤其樣

33、本含量較小時,降低更加明顯。 如資料不滿足 t 檢驗的條件,而用了t 檢驗,同樣降低了檢驗效能。,醫(yī)學研究中的等級資料,療 效:痊愈、顯效、有效、無效、惡化化驗結果:-、?、++、+++體格發(fā)育:下等、中下、中等、中上、上等心功能分級:I、II、III…文化程度:小學、中學、大學、研究生營養(yǎng)水平:差、一般、好,注意:,多個樣本比較的計數(shù)資料有時也可用 RXC表χ2檢驗,但在χ2檢驗中,各反應變量級別的次序可任意排列,所得χ2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論