四格表分析_第1頁
已閱讀1頁,還剩28頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、內(nèi)容,卡方檢驗入門,概 述,卡方檢驗是以卡方分布為基礎(chǔ)的一種常用假設(shè)檢驗方法,主要用于分類變量,它基本的無效假設(shè)是(不包括配對資料):H0:行分類變量與列分類變量無關(guān)聯(lián)H1:行分類變量與列分類變量有關(guān)聯(lián)?=0.05統(tǒng)計量 ,其中Ai是樣本資料的計數(shù),Ti是在H0為真的情況下的理論數(shù)(期望值)。,卡方檢驗,在H0為真時,實際觀察數(shù)與理論數(shù)之差A(yù)i-Ti 應(yīng)該比較接近0。所以在H0為真時,檢驗統(tǒng)計

2、量 服從自由度為k-1的卡方分布。 即: ,拒絕H0。 上述卡方檢驗由此派生了不同應(yīng)用背景的各種問題的檢驗,特別最常用的是兩個樣本率的檢驗等。,方法原理,方法原理,理論頻數(shù)基于H0成立,兩樣本所在總體無差別的前提下計算出各單元格的理論頻數(shù)來,,方法原理,從卡方的計算公式可見,當(dāng)觀察頻數(shù)與期望頻數(shù)完全一致時,卡方值為0;觀察頻數(shù)與期望頻數(shù)越接近,兩者之間的差異越小,卡方

3、值越?。环粗?,觀察頻數(shù)與期望頻數(shù)差別越大,兩者之間的差異越大,卡方值越大。當(dāng)然,卡方值的大小也和自由度有關(guān)。,方法原理,卡方分布 顯然,卡方值的大小不僅與A、E之差有關(guān),還與單元格數(shù)(自由度)有關(guān),,操作步驟,1. 建立檢驗假設(shè)和確定檢驗水準(zhǔn)H0:使用含氟牙膏和一般牙膏兒童齲患率相等H1:使用含氟牙膏和一般牙膏兒童齲患率不等2. ?=0.053.計算檢驗統(tǒng)計量?2值,,操作步驟,4. 確定P值和作出推斷結(jié)論查附表8,?2

4、界值表,得p>0.05。按 ? = 0.05水準(zhǔn),不拒絕H0,尚不能認(rèn)為使用含氟牙膏比使用一般牙膏兒童的齲患率低。對于四格表,卡方的計算公式又可進(jìn)行簡化,以方便手工計算,卡方檢驗假設(shè)的等價性,兩組兒童的齲齒率相同兩組發(fā)生率的比較使用不同的牙膏并不會影響齲齒的發(fā)生(兩個分類變量間無關(guān)聯(lián))兩變量的相關(guān)分析,四格表?2值的校正,英國統(tǒng)計學(xué)家Yates認(rèn)為,?2分布是一種連續(xù)型分布,而四格表資料是分類資料,屬離散型分布,由此計算

5、的?2值的抽樣分布也應(yīng)當(dāng)是不連續(xù)的,當(dāng)樣本量較小時,兩者間的差異不可忽略,應(yīng)進(jìn)行連續(xù)性校正(在每個單元格的殘差中都減去0.5)若n > 40 ,此時有 1< T ?5時,需計算Yates連續(xù)性校正?2值T <1,或n<40時,應(yīng)改用Fisher確切概率法直接計算概率,確切概率法,,分析實例,注意:確切概率法不屬于?2檢驗的范疇,但常作為?2檢驗應(yīng)用上的補充。,分析實例,1.建立檢驗假設(shè)和確立檢驗水準(zhǔn)H0:新

6、藥組與對照組療效相等,即 ?1 = ?2H1:新藥組與對照組療效不等,即 ?1 ? ?22.計算概率和確定P值本例n=a+b = 36 < 40,不滿足?2檢驗的應(yīng)用條件,宜采用四格表確切概率法。,方法原理,在四格表周邊合計不變的條件下,在相應(yīng)的總體中進(jìn)行抽樣,四格表中出現(xiàn)各種排列組合情況的概率本例即28、8、22、14保持不變的條件下,若H0成立,計算出現(xiàn)各種四格表的概率,,方法原理,然后將其中小于等于現(xiàn)有樣本概率的概

7、率值相加,即為P值:本例中P值=P(0)+ P(6)+P(7)+P(8)=0.0361<0.05,一點補充,確切概率法可以考慮單邊檢驗對于較大的行乘列表,確切概率法的計算量將變得十分驚人,有可能超出硬件系統(tǒng)可以支持的范圍,配對設(shè)計兩樣本率比較的 χ2檢驗,方法原理,例6.9 用A、B兩種方法檢查已確診的乳腺癌患者140名,A法檢出91名(65%),B法檢出77名(55%),A、B兩法一致的檢出56名(40%

8、),問哪種方法陽性檢出率更高?,方法原理,顯然,本例對同一個個體有兩次不同的測量,從設(shè)計的角度上講可以被理解為自身配對設(shè)計上述問題為:兩種“處理”之差別分析,方法原理,注意考慮該例四格表中兩處理陽性檢出率是否相同只要考慮四格表中的非對角元素的差異假設(shè)檢驗步驟如下:H0:兩法總體陽性檢出率無差別,即B = CH1:兩法總體陽性檢出率有差別,即B ? C,方法原理,,注意事項,McNemar檢驗(配對卡方檢驗)只會利用非主對角

9、線單元格上的信息,即它只關(guān)心兩者不一致的評價情況,用于比較兩個評價者間存在怎樣的傾向。因此,對于一致性較好的大樣本數(shù)據(jù)(a,d較大且b,c較小時),McNemar檢驗可能會失去實用價值。例如對1萬個案例進(jìn)行一致性評價,9995個都是完全一致的,在主對角線上,另有5個分布在左下的三角區(qū),顯然,此時一致性相當(dāng)?shù)暮谩5绻褂肕cNemar檢驗,此時反而會得出兩種評價有差異的結(jié)論來。此時,可以考慮邊際卡方檢驗,見P130,注意事項,配對

10、四格表卡方與成組設(shè)計卡方由于配對設(shè)計的資料同一對觀察結(jié)果間一般是非獨立的,而成組設(shè)計的資料一般可以認(rèn)為是獨立的,所以配對四格表資料不能用成組設(shè)計的?2或Fisher檢驗的,而要用配對設(shè)計的?2或配對設(shè)計的直接計算概率法進(jìn)行檢驗。,Poisson分布資料推斷,Poisson分布資料是離散型資料,但不具有分類特征,故視為計量資料。Poisson分布兩樣本來自總體均數(shù)是否相等的比較1.兩樣本觀察單位相同:在每個樣本的觀察值大

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論