《醫(yī)學(xué)統(tǒng)計學(xué)》最新版ch08秩和檢驗72h_第1頁
已閱讀1頁,還剩67頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、Medical Statistics 醫(yī)學(xué)統(tǒng)計學(xué),秩和檢驗Rank Sum Test基于秩次的非參數(shù)統(tǒng)計學(xué)方法Non-Parametric Statistics Methods,主要內(nèi)容,秩和檢驗的應(yīng)用范圍(掌握)秩次與秩和 (掌握)成組設(shè)計兩樣本比較的秩和檢驗(掌握)成組設(shè)計多樣本比較的秩和檢驗(熟悉)配對設(shè)計樣本比較的秩和檢驗(掌握)隨機區(qū)組設(shè)計樣本比較的秩和檢驗(了解)秩和檢驗的正確應(yīng)用(掌握)參數(shù)統(tǒng)計學(xué)和非

2、參數(shù)統(tǒng)計學(xué)(了解),已經(jīng)學(xué)過的假設(shè)檢驗方法,數(shù)值變量資料在滿足正態(tài)性、方差齊性時,對均數(shù)進行比較,采用t檢驗或方差分析。無序分類資料(dichotomous、polynomous)率或構(gòu)成比的比較采用卡方檢驗。,,未解決的:數(shù)值變量資料在嚴(yán)重不滿足正態(tài)性(極度偏態(tài)、數(shù)據(jù)不規(guī)則),對平均水平進行比較。數(shù)值變量資料在方差相差懸殊,無法利用變量變換達(dá)到方差齊性時,對平均水平進行比較。等級資料的分析,欲充分利用次序信息,比較組間等

3、級差異。,醫(yī)學(xué)研究中的等級資料,療 效:痊愈、顯效、有效、無效、惡化化驗結(jié)果:-、?、+、++、+++體格發(fā)育:下等、中下、中等、中上、上等心功能分級:I、II、III文化程度:小學(xué)、中學(xué)、大學(xué)、研究生營養(yǎng)水平:差、一般、好,等級資料的特點,既非呈連續(xù)分布的定量資料,也非僅按性質(zhì)歸屬于獨立的若干類的定性資料;比“定量”粗,而比一般的“定性”細(xì);等級間既非等距,亦不能被度量。,秩次與秩和,秩次(rank),秩統(tǒng)計量

4、(rank statistics) 是指全部觀察值按某種順序排列的位序;秩和(rank sum) 同組秩次之和,編秩,A組: - ± + + + ++ 1 2 3 4 5 7秩次 1 2 4.5 4.5 4.5 8.5 TA=25 B組: + ++ ++ ++ ++

5、+ +++ 6 8 9 10 11 12秩次 4.5 8.5 8.5 8.5 11.5 11.5TB=53,TA+TB=N(N+1)/2=78,,秩次:在一定程度上反映了等級的高低;秩和:在一定程度上反映了等級的分布位置。對等級的分析,轉(zhuǎn)化為對秩次的分析。秩和檢驗就是通過秩次的排列求出秩和

6、,進行假設(shè)檢驗。,成組設(shè)計兩樣本比較的秩和檢驗,某實驗室檢測了兩組各6人的尿蛋白,結(jié)果如下,問所得兩組結(jié)果有無差異?A組:?±+++++ 124.54.54.58.5B組:+++++++++++++ 4.58.58.58.511.511.5 TA=25、TB=53,成組設(shè)計兩樣本比較的秩和檢驗,基本思想(Wi

7、lcoxon成組秩和檢驗) 如果H0 成立,即兩組分布位置相同, A組的實際秩和應(yīng)接近理論秩和n1(N+1)/2; B組的實際秩和應(yīng)接近理論秩和n2(N+1)/2 或相差不大。如果相差較大,超出了預(yù)定的界值,則可認(rèn)為H0不成立。,為什么?若兩組沒有差異,最理論的情形是所有觀察值一樣,即秩次均為(N+1)/2。,,檢驗假設(shè) H0 :A、B兩組分布相同; H1

8、:A、B兩組分布不同(相互偏離)。 ? =0.05。,A組 B組 和 實際秩和 25 53 78 理論秩和 n1(N+1)/2 n2(N+1)/2 N(N+1)/2 39 39

9、 78差值 -14 14 0 抽樣誤差?如果H0成立,則理論秩和與實際秩和之差純粹由抽樣誤差造成。,兩樣本秩和檢驗 T 界值,,該范圍表明,在當(dāng)前水準(zhǔn)下,只要實際秩和位于范圍內(nèi),都可以認(rèn)為實際秩和和理論秩和的偏離屬于抽樣誤差n1=6 n2-n1=0

10、 雙側(cè) 單側(cè) 28~50 0.10 0.05 26 ~ 52 0.05 0.025 24 ~ 54 0.02 0.01 23

11、 ~ 55 0.01 0.005,間距 22 26 30 32,6(12+1)/2=39(理論值),檢驗結(jié)果,如果H0成立,則按0.05水準(zhǔn),A組秩和之界值為26~52?,F(xiàn)A組的實際秩和為25,在界值之外,故拒絕H0,接受H1,認(rèn)為兩組的分布位置不同。,秩和檢驗的結(jié)論判斷,A組的實際秩和在界值之外, (小于或等于下界,大于或等于上界)

12、 則拒絕H0,接受H1。A組的實際秩和在界值之內(nèi), (大于下界且小于上界) 則不拒絕H0。,兩組等級資料間的秩和檢驗,用復(fù)方豬膽膠囊治療老年性慢性支氣管炎患者403例,療效見表。問該藥對此兩型支氣管炎療效是否相同?,,建立檢驗假設(shè):H0 :兩型老慢支療效分布相同;H1 :兩型老慢支療效分布不同。? =0.05。編秩 ,求秩和。確定檢驗統(tǒng)計量T 若兩樣本例數(shù)不等,以例數(shù)較少者為n1,檢驗統(tǒng)計量T=

13、T1=40682.5。確定P值,作出推斷結(jié)論,正態(tài)近似法(n1,n2-n1超出表的范圍時),n1>10或n2-n1 >10時相同秩次多時校正,,P<0.01,按? =0.05水準(zhǔn),拒絕H0 ,接受H1,差異有統(tǒng)計學(xué)意義??烧J(rèn)為復(fù)方豬膽膠囊治療老年性慢性支氣管炎喘息型與單純型的療效有差別。,,,,,構(gòu)成比的比較與平均秩次的比較,group A group B控制 100

14、 0 顯效 0 100有效 0 100無效 100 0構(gòu)成比比較:不同平均秩比較:相同,成組設(shè)計多樣本比較的秩和檢驗,Kruskal-Wallis法先對所有數(shù)據(jù)編秩;計算 H 統(tǒng)計量;查 H 界值表,或用近似 ?2 檢驗;界定 P

15、值,作出結(jié)論。,成組設(shè)計多樣本比較的秩和檢驗,H0 :各組總體的等級分布相同;H1 :各組總體的等級分布不同或不全相同。? =0.05。,,,,H 的校正與?2近似,當(dāng)有相同秩次時,H 需校正: 當(dāng) n 較大時, H 近似服從 ? = k – 1 的 ?2 分布。 故可按 ? 2 分布獲得概率 P,作出統(tǒng)計推斷。,,某醫(yī)院用三種復(fù)方小葉枇杷治療老年性慢性支氣管炎,試比較其療效有無差異。,,檢驗假設(shè)

16、H0 :三藥療效總體分布相同;H1 :三藥療效總體分布不同或不全相同。? =0.05。編秩 先計算各等級合計人數(shù),再確定秩次范圍,計算平均秩次。,,因每組例數(shù)遠(yuǎn)遠(yuǎn)超過5,故按?=k?1=3?1=2查?2界值表,得?20.005,2 =10.60,Hc> ?20.005,2 ,P<0.005。按? =0.05水準(zhǔn)拒絕H0,接受H1,認(rèn)為三藥療效有差別。,,,,統(tǒng)計量 H 的意義(1),設(shè)有k個對比組各組樣本含量:

17、ni秩和: Ri平均秩和: 總樣本含量: N=n1+n2+…+nk總秩和為: N(N+1)/2總秩次之平均為:(N+1)/2。,統(tǒng)計量 H 的意義(2),設(shè)無相同等級,則秩次的總離均差平方和為:秩次的組間離均差平方和為:H值:,,,,,等級資料的多組比較是兩組比較的擴展,相當(dāng)于單因素方差分析的秩和檢驗。屬于秩變換檢驗:將原始觀察值編秩后,再進行統(tǒng)計,多組間的兩兩比較,如果多

18、組等級比較拒絕H0,認(rèn)為組間存在差異,則可進行兩兩比較 ( t 檢驗法):自由度為v=N-k。H 為Kruskal-Wallis中的 H 統(tǒng)計量( H或HC )。,,,建立檢驗假設(shè)H0 :三個處理組中任兩個總體分布均相同;H1 :至少有兩個總體分布不同。? =0.05。計算各組平均秩次 令老復(fù)方組為第1組、復(fù)方I為第2組、復(fù)方II為第3組。,,,,,,確定P值,作出推斷結(jié)論 按?=522?3查t界值表,得P值

19、。按? =0.05水準(zhǔn),拒絕H0,接受H1,三種方劑療效總體分布不全相同,差別主要存在于老復(fù)方小葉枇杷與復(fù)方I組之間,其余組間差別無統(tǒng)計學(xué)意義。,配對設(shè)計樣本比較的秩和檢驗,Wilcoxon符號秩和檢驗計算等級之差值,對差值進行編秩。查 T 界值表,或用近似 u 檢驗,計算 P 值;界定 P 值,作出結(jié)論。,Wilcoxon符號秩和檢驗,H0:差值的總體中位數(shù)為0;H1:差值的總體中位數(shù)不為0。? =0.05。當(dāng)n

20、≤50時,查界值表當(dāng)n>50時,用u近似,,,用配對設(shè)計觀察兩種方法治療扁平足效果記錄如下,問那種方法好。,配對資料的編秩,按差值絕對值大小從小到大編秩。若差值為0,不參與編秩。若差值絕對值相等,則取平均秩。按差值的正負(fù)號在秩次上冠以符號。累積正秩次和負(fù)秩次,得到正秩和和負(fù)秩和。正負(fù)秩和的絕對值秩和應(yīng)等于n(n+1)/2。,,H0:差值的總體中位數(shù)為0;H1:差值的總體中位數(shù)不為0。? =0.05。編秩,求秩和,確定檢

21、驗統(tǒng)計量T。T+=61.5,T-=4.5。 確定 P值和推斷結(jié)論,符號秩和檢驗的基本思想,總秩和為T=n(n+1)/2如H0成立,則正負(fù)各半,T+ 與 T- 均接近 n(n+1)/4。如果相差太大,超出了事先規(guī)定的界值, 則H0不成立。,符號秩和檢驗 T 界值表,N=11 雙側(cè) 單側(cè) 13 ~

22、 53 0.10 0.05 10 ~ 56 0.05 0.025 7 ~ 59 0.02 0.01 5 ~ 61 0.01

23、 0.005,間距 40 46 52 56,11(11+1)/4=33(理論值),,本例中雙側(cè)0.05的界值為10-56,0.01的界值為5-61。正、負(fù)秩和均在范圍之外,故P<0.01。拒絕H0,差別有統(tǒng)計學(xué)意義,說明兩種方法療效總體分布不同。,正態(tài)近似法(n>50時),配伍設(shè)計樣本比較的秩和檢驗,Friedman法分別對每一配伍組中的觀察值進行編秩;計算Friedman M 統(tǒng)計量;查M界值表

24、或自由度為k-1的卡方界值表,計算 P 值;界定 P 值,作出結(jié)論。,,五位評委分別評定了4種葡萄酒的等級(一至四級),結(jié)果如表8.5,問對四種酒的評判是否一致(四種酒的等級有無差別)? (設(shè)一級為最優(yōu),二級其次,依次類推。),,檢驗假設(shè) H0:對四種葡萄酒評判結(jié)果的總體分布相同;H1:評判結(jié)果的總體分布不同或不全相同。? =0.05。編秩并求秩和 先在每一配伍組內(nèi)將數(shù)據(jù)從小到大編秩(見括弧內(nèi)數(shù)字),如有相同數(shù)據(jù),取平均

25、秩次;再按處理組求各組秩和Ri,i=1,2,?,k。,,按式(8.8)計算檢驗統(tǒng)計量M值,,,確定P值,作出推斷性結(jié)論 根據(jù)配伍組數(shù)b與處理組數(shù)k查附表13,得到P值范圍。本例b=5,k=4,查表得:M0.05=7.80,M0.01=9.96。0.05<M<M0.01,0.01<P<0.05。下結(jié)論,按? =0.05水準(zhǔn)拒絕H0,接受H1,差異有統(tǒng)計學(xué)意義,即可認(rèn)為四種酒的等級有差別。,,若b或k超出附表1

26、3的范圍時,M近似服從?=k-1的?2分布。故可按?2分布界值,獲得概率P,作出統(tǒng)計推斷。如有相同秩次,且M按近似 ?2分布進行統(tǒng)計推斷時,需采用校正公式:,,,秩和檢驗的正確應(yīng)用,適用范圍:主要對等級資料進行分析;理論上來講,可以適用于任意分布(distribution free)的資料;在用于定量資料時,需注意使用條件。T檢驗與H檢驗的關(guān)系 H檢驗

27、 T檢驗 n=2 F檢驗 t檢驗,,,秩和檢驗用于定量資料,計量資料中: 極度偏態(tài)資料,或個別數(shù)值偏離過大 各組離散度相差懸殊 資料中含有不確定值 大于5年 <0.001 1:1024以上 兼有等級和定量性質(zhì)的資料,用二種食物配方飼養(yǎng)大白鼠,觀

28、察心肌壞死面積。分析二組間的差異。A組:(n=29, mean= 3.61) 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.2, 0.3, 0.4, 0.4, 0.6, 1, 1.6, 2.2, 2.6, 3.3, 4.3, 5.1, 5.4, 5.5, 6.1, 6.2, 9.7, 13.8, 36B組: (n=28, mean=1.06) 0, 0, 0, 0

29、, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.2, 0.2, 0.2 0.3, 0.4, 0.4, 0.9, 0.9, 1.3, 1.7, 2.8, 7.4, 13,正確選擇分析方法:例一,特點,0特別多,無論用什么變換均不可能改變分布的偏性;0與其它數(shù)的區(qū)別是質(zhì)的區(qū)別。,分析一:兩組心肌壞死率比較,按四格表作?2檢驗:,無心肌壞死 有心肌壞死 合計 心肌壞死率(%) 甲組

30、 10 19 29 65.5 乙組 15 13 28 46.4 P = 0.24,,分析二:二組平均心肌壞死面積的比較,二組平均心肌壞死面積的 t 檢驗: t =-1.7755,P = 0

31、.0814,分析三:按等級資料處理:,兩組秩和檢驗:n秩和理論秩和 A組29968841B組28685812合計5716531653u = 2.119, P =0.0341。,正確選擇分析方法:例二,兩組完全隨機設(shè)計計量資料的比較(已知兩組確實不同質(zhì)),分析方法一 兩組秩和檢驗,兩組秩和檢驗:n 秩和 理論秩和 A組10

32、 83.5 105.0B組10 126.5 105.0合計20 210.0 210.0u = 1.63, P =0.1040。,分析方法二 兩組t檢驗,是否可以用兩組資料的t檢驗?服從正態(tài)性的要求(P分別為0.4359和0.4408)。服從方差齊性的要求(P=0.7217)。利用兩個樣本均數(shù)的t檢驗,,分組n均數(shù)

33、標(biāo)準(zhǔn)誤 標(biāo)準(zhǔn)差A(yù)組104.840.88 2.79B組107.971.00 3.15差值 -3.13 1.33 自由度 18t=-2.36P=0.0301,成組設(shè)計兩樣本比較,如資料滿足 t 檢驗的條件,應(yīng)該用 t 檢驗進行分析。此時,如果對這類資料用Wilcoxon秩和檢驗,實際上是將觀察單位的具體數(shù)值舍棄不用,只保留了秩次的信息,使檢驗功效降低;尤其樣本含量較

34、小時,降低更加明顯。 如資料不滿足 t 檢驗的條件,而用了t 檢驗,同樣降低了檢驗效能。,參數(shù)檢驗和非參數(shù)檢驗,以往所用的統(tǒng)計學(xué)方法,都假設(shè)樣本來自于某個分布,并對該分布的參數(shù)進行統(tǒng)計推斷。稱為參數(shù)檢驗(Parametric Methods)t檢驗、F檢驗要求正態(tài)性、獨立性。相關(guān)與回歸分析。在假設(shè)正確時,參數(shù)統(tǒng)計學(xué)方法效率高,因為可以直接利用分布的有關(guān)規(guī)律去進行推斷。當(dāng)樣本含量不夠、分布形式未明,現(xiàn)有參數(shù)方法無法解決時,需

35、要對樣本來自的總體進行盡量少的假設(shè),稱為非參數(shù)統(tǒng)計學(xué)方法(Non-parametric Methods)。,非參數(shù)統(tǒng)計學(xué)方法分類,基于二項分布的方法(忽略原始分布的情形)基于Permutation的方法。Wilcoxon成組秩和檢驗、配對秩和檢驗、Kwallis檢驗等等。利用秩次的組合來得到抽樣分布,據(jù)此得到獲得現(xiàn)有樣本及更大樣本的概率?;贐ootstrap的方法對樣本進行再抽樣,得到抽樣分布!目前很Fashion!基于

36、平滑(Smoothing)的方法,基于二項分布的方法,檢驗總體中位數(shù)是否為某常數(shù)例:40個樣品測量值為72.1、72.8……、79.7等等,欲檢驗其中位數(shù)是否大于75。若將樣本按是否大于75分類,其實就是檢驗個體取值大于75的總體率是否大于0.5!(注意:單側(cè)檢驗),基于Permutation的秩和檢驗,如果組間沒有差異,秩次應(yīng)當(dāng)是隨機散布,每組是從這些秩次中的一個隨機抽樣。那么在總樣本含量為7,A組為2時,從總樣本中隨機選出2個

37、,一共可以 個子數(shù)據(jù)集。每一個子數(shù)據(jù)集對應(yīng)于一個秩和,每個出現(xiàn)的頻率約是0.05。其中最極端的兩個,一個是1、2,另一個是6、7,且這兩個秩和只會出現(xiàn)一次,故雙側(cè)0.10的界值為3-13。同樣,我們也可以在所有子數(shù)據(jù)集中找到與現(xiàn)有樣本相同的那個子集,以及比它具有更大差別的那些子集,累積他們的概率,作為P值!,,比如,對于共7個個體、A組有2個時,在H0成立時,A組各種秩和的頻率圖為若現(xiàn)A組實際秩和為5,做單

38、側(cè)檢驗,則P值為?,,參數(shù)估計 假設(shè)檢驗 單參數(shù) 兩參數(shù)之差 總體與樣本 兩樣本 多樣本 均 數(shù) (幾何均數(shù))率(二項分布)事件數(shù)(Poisson分布)構(gòu)成比(分布) - -等 級 -

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論