版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、衛(wèi)生統(tǒng)計學(xué),第十五章 多因素對某定性指標(biāo) 的影響分析,第一節(jié) Logistic回歸分析一、基本概念 應(yīng)變量是分類變量 1 出現(xiàn)陽性結(jié)果(發(fā)病、有效、死亡等) Y = 0 出現(xiàn)陰性結(jié)果(未發(fā)病、無效、存活等),,,P:Y=1的率,P/(1-P)稱優(yōu)勢(比數(shù)),?0 :表示暴露劑量為0時個體發(fā)病與不 發(fā)病概率之比的自然對數(shù)?i : 表示在其它
2、自變量不變的條件下, Xi改變一個單位時logit P = 的改變量。,,,Logistic 回歸的特點(diǎn),1、Logistic 回歸方程中,各自變量Xi變化范圍可以從 - ? 到 + ? ,Xi 可以是定量指標(biāo)、等級指標(biāo)或定性指標(biāo)(需經(jīng)數(shù)量化),而應(yīng)變量P的變化范圍為0到1。 Z→∞時,P值漸近于1 Z→-∞時,P值漸近于02、Logistic 回歸系數(shù)和流行病學(xué)中反映各危險因素對疾病作用大小的
3、優(yōu)勢比有直接的聯(lián)系,并把單因素兩水平下的優(yōu)勢比的定義擴(kuò)展到多因素任意取值。,,設(shè)在一組自變量取值X0 下,某病發(fā)病的概率為P0 ,而在另外一組取值X1 下,某病發(fā)病的概率為P1,,,,變量Xi 由 改變?yōu)?而固定其它自 變量取值時,有ORi = exp[? i( ─ )] OR
4、i >1,高水平(數(shù)據(jù)大)率大,特別當(dāng) ─ = 1 時,,(Xi =1為暴露, Xi =0為非暴露) ORi = exp ?i 3、對于流行病學(xué)兩類調(diào)查研究方法? 前瞻性的隊列研究和回顧性的病例對 照研究,所建立的Logistic 回歸方 程,除常數(shù)項不同外,其它各回歸系 數(shù)均相同。,二、Logistic 回歸模型的配合,1.應(yīng)變量為二分類的Logistic 回歸模型參數(shù)
5、估計采用最大似然函數(shù)估計法(maximum likelihood estimate),即根據(jù)n例實(shí)際觀測數(shù)據(jù)建立一個樣本的似然函數(shù):,,,,Pi:i例暴露條件下陽性率,Yi=1陽性,Yi=0 陰性。若某對象陽性,,用迭代方法使以下目標(biāo)函數(shù)達(dá)極大值,估計出bj,(1)AIC檢驗(yàn)法(Akaike Information Criterion) L是最大似然
6、函數(shù),g為應(yīng)變量分類變量的分類數(shù),k為模型中包含的自變量個數(shù)。AIC值越小,模型擬合越好。用于同一組數(shù)據(jù)下的不同模型間的比較。,H0: H1: 不全為0(含全不為0),,,,(2)SC檢驗(yàn)法(Schwarte Criterion),式中,L是最大似然函數(shù),g為應(yīng)變量分類變量的分類數(shù),k為模型中包含的自變量個數(shù),n是樣本例數(shù)。和AIC一樣,SC值越小,模型擬合越好。用于比較同一組數(shù)據(jù)下的不同模型間的比較。,,,(3)似然比檢驗(yàn)法,
7、服從自由度為k-p的χ2分布,p和k是兩個模型中包含的自變量個數(shù)。P<α,則有統(tǒng)計學(xué)意義。(4)計分檢驗(yàn)法(Score)公式很復(fù)雜,它服從χ2分布,用于檢驗(yàn)?zāi)P椭腥孔宰兞繉?yīng)變量的聯(lián)合作用。,,,(5)Wald檢驗(yàn)法,H0: H1:Wald 似然比檢驗(yàn)法最可靠。 Somers’ D、 Gamma、 Tau-a 和C,越接近于1 說明模型擬合得的越好。選項“LACKFIT”對模型進(jìn)行擬合優(yōu)度檢驗(yàn)(
8、Goodness of fit statistics),P越大則說明模型擬合的越好。,,,,,例15-1. 為研究病情x1(0表示不嚴(yán)重,1表示嚴(yán)重)、年齡x2(歲)及不同治療方法x3(0表示傳統(tǒng)療法,1表示新療法)對某病療效的影響,某研究者隨機(jī)抽取40名某病的患者,其中有20名患者采用傳統(tǒng)療法,另20名患者采用新療法,經(jīng)過一段治療后記錄下康復(fù)的情況y(0表示未康復(fù),1表示康復(fù)),作logistic回歸分析。,data ex15_1;
9、input y x1-x3 @@;cards;1 0 20 0 1 0 23 0 1 0 32 0 1 0 38 0 1 1 25 0 1 0 20 1 1 0 24 1 1 0 28 11 0 30 1 1 0 32 1 1 0 38 1 1 1 26 1 1 1 29 1 1 1 34 1 1 1 33 1 1 1 38 11 1 40 1 0 0 22 0 0 0 26 0 0 0 29 0 0 0 34 0 0 0
10、 30 0 0 0 38 0 0 0 37 00 1 24 0 0 1 25 0 0 1 29 0 0 1 32 0 0 1 34 0 0 1 37 0 0 1 40 0 0 1 40 00 0 33 1 0 0 36 1 0 1 24 1 0 1 34 1 0 1 32 1 0 1 36 1 0 1 38 1 0 0 39 1;proc logistic descending simple;model y=x1-x3 /
11、stb scale=none aggregate lackfit ; units x2=10;run;,Response Profile Ordered Total Value y Frequency 1 1 17 2 0 23,Devia
12、nce and Pearson Goodness-of-Fit StatisticsCriterion DF Value Value/DF Pr > ChiSqDeviance 31 33.9290 1.0945 0.3281Pearson 31 27.2708 0.8797 0.6585,Testing
13、Global Null Hypothesis: BETA=0Test Chi-Square DF Pr > ChiSqLikelihood Ratio 9.5290 3 0.0230Score 8.5958 3 0.0352Wald 6.
14、9431 3 0.0737,Analysis of Maximum Likelihood Estimates Standard StandardizedParameter DF Estimate Error Chi-Squar
15、e Pr > ChiSq EstimateIntercept 1 2.3789 2.0279 1.3762 0.2407x1 1 -0.7767 0.7497 1.0731 0.3002 -0.2168x2 1 -0.1068 0.0677
16、 2.4864 0.1148 -0.3517x3 1 1.9570 0.8036 5.9303 0.0149 0.5464,Odds Ratio Estimates Point 95% WaldEffect Estimate
17、 Confidence Limitsx1 0.460 0.106 1.999x2 0.899 0.787 1.026x3 7.078 1.465 34.198 Adjust
18、ed Odds Ratios Effect Unit Estimate x2 10.0000 0.344,data ex15_1;input y x1-x3 @@;cards;1 0 20 0 1 0 23 0 1 0 32 0 1 0
19、38 0 1 1 25 0 1 0 20 1 1 0 24 1 1 0 28 11 0 30 1 1 0 32 1 1 0 38 1 1 1 26 1 1 1 29 1 1 1 34 1 1 1 33 1 1 1 38 11 1 40 1 0 0 22 0 0 0 26 0 0 0 29 0 0 0 34 0 0 0 30 0 0 0 38 0 0 0 37 00 1 24 0 0 1 25 0 0 1 29 0 0 1 3
20、2 0 0 1 34 0 0 1 37 0 0 1 40 0 0 1 40 00 0 33 1 0 0 36 1 0 1 24 1 0 1 34 1 0 1 32 1 0 1 36 1 0 1 38 1 0 0 39 1;proc logistic descending simple;model y=x1-x3 /selection=stepwise sle=0.1 sls=0.1 stb scale=none agg
21、regate lackfit; units x2=5;run;,The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates Standard Stan
22、dardizedParameter DF Estimate Error Chi-Square Pr > ChiSq EstimateIntercept 1 2.2718 1.9771 1.3204 0.2505x2 1 -0.1135 0.0663 2.9302 0
23、.0869 -0.3739x3 1 1.8346 0.7744 5.6126 0.0178 0.5122,Odds Ratio Estimates Point 95% WaldEffect Estimate Confidence Limitsx2
24、 0.893 0.784 1.017x3 6.263 1.373 28.573Adjusted Odds RatiosEffect Unit Estimate x2 5.0000 0.567,平均康復(fù)率大1歲是小1歲的0.893倍,平均康復(fù)率新療法是舊療
25、法的6.263倍,平均康復(fù)率大5歲是小5歲的0.567倍,2.應(yīng)變量為有序分類變量的logistic回歸模型,醫(yī)學(xué)研究中經(jīng)常要用到的應(yīng)變量為有序分類變量,例如治療效果分為“無效、好轉(zhuǎn)、有效、治愈”,疾病的嚴(yán)重程度分為“無、輕、中、重”與“I期、Ⅱ期、Ⅲ期”等,分析各種因素自變量對這種有序分類變量的應(yīng)變量的影響時也可采用logistic回歸模型。SAS軟件中的logistic回歸過程是以累積概率函數(shù)的形式提供的。,設(shè)應(yīng)變量y為k個等級的有
26、序分類變量,不妨設(shè)y的k個取值按等級順序?yàn)?、2、…、k。對y取值小于等于等級j(j=1、2、…、k)的概率即取前j個值的累積概率用來表示,則有:,,,,,當(dāng),j=1、2、…、k-1,例如對k=3時有:,,,因而應(yīng)變量y取等級1、2、3的概率為:,例15-2. 某醫(yī)院外科采用兩種不同繃帶(x1=0為第一種繃帶,x1=1為第二種繃帶)和兩種不同的包扎方式(x2=0為第一種包扎方式,x2=1為第二種包扎方式)進(jìn)行腿部潰瘍處理。治療效果分為三
27、個等級:不愈、有效、痊愈(y=0為不愈,y=1為有效、y=2為痊愈)。治療結(jié)果如表15-3 所示。試分析不同的治療方式對治療效果的影響。,data ex15_2;input y x1 x2 f@@;cards;00019 1 004200 2 0 109110 8 2 10600121 1 013201 2 0 11
28、 1011110 2 115;proc logistic descending ;model y=x1 x2 /stb scale=none aggregate lackfit ; freq f;run;,Analysis of Maximum Likelihood Estimates Standard
29、 StandardizedParameter DF Estimate Error Chi-Square Pr > ChiSq EstimateIntercept 1 -2.6678 0.4656 32.8253 <.0001Intercept2 1 -1.1709
30、 0.3929 8.8791 0.0029 x1 1 1.6430 0.4380 14.0708 0.0002 0.4550 x2 1 -0.1903 0.4189 0.2063 0.6496 -0.0527
31、 Odds Ratio Estimates Point 95% WaldEffect Estimate Confidence Limitsx1 5.171 2.191 12.201x2 0.827 0.364 1.879,,,Y取值2、痊愈:等級1;Y取值
32、1、有效:等級2;Y取值0、無效:等級3。,三種治療效果的概率估計為:,痊愈:,,有效:,,無效:,,但是回歸系數(shù)的假設(shè)檢驗(yàn)結(jié)果只有繃帶種類x1有統(tǒng)計意義,包扎方式x2無統(tǒng)計意義。x1的OR=5.171,95%的可信區(qū)間為(2.191,12.201),區(qū)間不包含1,表示使用第二種繃帶約是使用第一種繃帶效果(痊愈的比例,痊愈及有效的比例)的5.171倍。,第二節(jié) 條件Logistic回歸,在研究設(shè)計階段,為控制混雜干擾因素常按干擾因
33、素的不同取值設(shè)置相匹配的配比組,病例與對照之比為1:1或n:m。 ,i=1,2,…,n,,例15-3 收集了63對有關(guān)子宮內(nèi)膜癌的數(shù)據(jù),Y=0為對照,Y=1為病例,自變量因素為膽囊有無病變(gall=0為無病變,gall=1為有
34、病變)和有無高血壓Hyper(hyper=0為無,hyper=1為有).試分析在控制血壓的條件下膽囊有無病變所引起的相對風(fēng)險。,data li15_3; input i y x1-x2@@; t=2-y;cards;1 1 0 0 1 0 0 0 2 1 0 0 2 0 0 03 1 0 1 3 0 0 1 4 1 0 0 4 0 1 05 1 1 0 5 0 0
35、 1 6 1 0 1 6 0 0 07 1 1 0 7 0 0 0 8 1 1 1 8 0 0 19 1 0 0 9 0 0 0 10 1 0 0 10 0 0 0………………………………………………..;proc phreg; model t*y(0)=x1-x2/ ties=discrete; strata i; run;,The PHREG Proc
36、edure Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr > ChiSq Likelihood Ratio 4.5487
37、 2 0.1029 Score 4.3620 2 0.1129 Wald 4.0060 2 0.1349 A
38、nalysis of Maximum Likelihood Estimates Parameter Standard HazardVariable DF Estimate Error Chi-Square Pr > ChiSq
39、 Ratio x1 1 0.97041 0.53073 3.3432 0.0675 2.639 x2 1 0.34807 0.37696 0.8526 0.3558 1.416,data li15_3; input i y x1-x2@@
40、; t=2-y; cards; 1 1 0 0 1 0 0 0 2 1 0 0 2 0 0 0 3 1 0 1 3 0 0 1 4 1 0 0 4 0 1 0 5 1 1 0 5 0 0 1 6 1 0 1 6 0 0 0 7 1 1 0 7 0 0 0 8 1 1 1 8 0 0 1
41、 9 1 0 0 9 0 0 0 10 1 0 0 10 0 0 0 11 1 1 0 11 0 0 0 12 1 0 0 12 0 0 1 ……………………………………………… ;proc phreg; model t*y(0)=x1-2/selection=stepwisesle=0.1 sls=0.1 ties=discrete; strata i; run;,An
42、alysis of Maximum Likelihood Estimates Parameter Standard HazardVariable DF Estimate Error Chi-Square Pr > ChiSq Ratiox1
43、 1 0.95551 0.52623 3.2970 0.0694 2.600 Summary of Stepwise Selection Variable
44、 Number Score WaldStep Entered Removed In Chi-Square Chi-Square Pr > ChiSq1 x1 1 3.5556 .
45、 0.0593,子宮內(nèi)膜癌發(fā)病率有膽囊病變平均是無膽囊病變的2.6倍,例15-4 為研究肥胖X1(X1=1為肥胖,X1=0為不肥胖)、口服避孕藥雌激素X2(X2=1為服用雌激素,X2=0 未服用雌激素)與子宮內(nèi)膜癌的關(guān)系,隨機(jī)選取20名患者。對于每名患者,再隨機(jī)選取年齡相近的2名正常人作為對照。,data li15_4; input i x1-x2 y @@; t=2-y; cards; 1 1 1 1 1 0 0 0 1 0
46、 0 0 2 1 1 1 2 1 1 0 2 0 1 0 3 1 1 1 3 0 1 0 3 1 1 0 4 0 1 1 4 0 0 0 4 0 1 0 5 0 0 1 5 1 0 0 5 0 1 0 6 1 1 1 6 0 0 0 6 1 0 0 7 1 1 1 7 0 1 0 7 1 1 0 8 1 1 1 8 1 0 0 8 1 1 0 9 1 0 1 9 1 1 0
47、 9 1 1 0 10 0 1 1 10 0 1 0 10 0 0 0 11 0 1 1 11 0 1 0 11 1 0 0 12 0 1 1 12 0 1 0 12 0 1 0 13 1 1 1 13 0 0 0 13 1 1 0 14 1 1 1 14 0 0 0 14 1 0 0 15 1 1 1 15 0 0 0 15 0 1 0 16 0 1 1 16 0 1 0 16 0 1 0 17 0 1 1 17 0 0 0
48、17 1 0 0 18 1 1 1 18 1 0 0 18 0 1 0 19 1 0 1 19 0 1 0 19 0 1 0 20 1 1 1 20 0 1 0 20 0 0 0;proc phreg; model t*y(0)=x1-x2/selection=stepwise sle=0.1 sls=0.1 ties=discrete;strata i; run;,Testing Global Null Hypothesis:
49、 BETA=0Test Chi-Square DF Pr > ChiSqLikelihood Ratio 10.6377 2 0.0049Score 8.8725 2 0.0118Wald 5.9789
50、2 0.0503 Analysis of Maximum Likelihood Estimates Parameter Standard HazardVariable DF Estimate Error Ch
51、i-Square Pr > ChiSq Ratiox1 1 1.82388 0.84948 4.6098 0.0318 6.196x2 1 1.58959 0.80897 3.8611 0.0494 4.902,第三節(jié) Logisti
52、c 回歸模型的醫(yī)學(xué)應(yīng)用及其注意事項,一、Logistic 回歸模型在醫(yī)學(xué)中的應(yīng)用 1、分析流行病學(xué)的研究中進(jìn)行危險因子的篩選。2、校正混雜因子。把混雜因子當(dāng)作自變量來對 待,利用Logistic 回歸對其進(jìn)行調(diào)正和分析。3、Logistic 曲線擬合可用于分析藥物或毒物的 劑量反應(yīng)。 4、判別分析與預(yù)測。,二、Logistic 回歸模型應(yīng)用的注意事項,1.變量的取值形式Y(jié): 兩分類,多分類有序,多分類無
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)學(xué)統(tǒng)計學(xué)-logistic回歸
- 醫(yī)學(xué)統(tǒng)計學(xué)16-logistic回歸
- 醫(yī)學(xué)統(tǒng)計學(xué)一元相關(guān)與回歸
- 醫(yī)學(xué) 統(tǒng)計學(xué)
- 醫(yī)學(xué)統(tǒng)計學(xué)
- 衛(wèi)生統(tǒng)計學(xué) 醫(yī)學(xué)統(tǒng)計學(xué) 習(xí)題
- 醫(yī)學(xué) 統(tǒng)計學(xué)
- 《統(tǒng)計學(xué)》線性回歸模型
- 醫(yī)學(xué)統(tǒng)計學(xué)復(fù)習(xí)
- 醫(yī)學(xué)統(tǒng)計學(xué)13
- 診斷醫(yī)學(xué)統(tǒng)計學(xué)
- 醫(yī)學(xué)統(tǒng)計學(xué)任
- 醫(yī)學(xué)統(tǒng)計學(xué)研
- 醫(yī)學(xué)統(tǒng)計學(xué)題庫
- 醫(yī)學(xué)統(tǒng)計學(xué)方法
- 醫(yī)學(xué)統(tǒng)計學(xué)2
- 醫(yī)學(xué)統(tǒng)計學(xué)題庫
- 醫(yī)學(xué)統(tǒng)計學(xué)護(hù)理
- 10《醫(yī)學(xué)統(tǒng)計學(xué)》
- 醫(yī)學(xué)統(tǒng)計學(xué)04
評論
0/150
提交評論