版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、Logistic回歸分析,胡利人流行病與衛(wèi)生統(tǒng)計學教研室,2024/3/21,2,回歸分析的分類,多個因變量(y1,y2,…yk),一個因變量 y,2024/3/21,3,,醫(yī)學研究中常碰到應變量的可能取值僅有兩個(即二分類變量),如發(fā)病與未發(fā)病、陽性與陰性、死亡與生存、治愈與未治愈、暴露與未暴露等,顯然這類資料不滿足多重線性回歸的條件,什么情況下采用Logistic回歸?,2024/3/21,4,logistic回歸(logist
2、ic regression)是研究因變量為二分類或多分類觀察結果與影響因素(自變量)之間關系的一種多變量分析方法,屬概率型非線性回歸。在分析疾病與各種危險因素間的定量關系,同時為了能真實反映暴露因素與觀察結果間的關系,需要控制混雜因素的影響,已知主要控制混雜的方法包括:分層分析和多重回歸。,2024/3/21,5,控制混雜因素的方法,(1)Mantel-Haenszel分層分析:適用于樣本量大、分析因素較少的情況。 當分層較多
3、時,由于要求各格子中例數(shù)不能太少,所需樣本較大,往往難以做到; 當混雜因素較多時,分層數(shù)也呈幾何倍數(shù)增長,這將導致部分層中某個格子的頻數(shù)為零,無法利用其信息。,2024/3/21,6,2024/3/21,7,按飲酒與否分層計算OR值,2024/3/21,8,(2)線性回歸分析: 由于因變量是分類變量,不能滿足其正態(tài)性要求;有些自變量對因變量的影響并非線性。,2024/3/21,9,logistic回歸:研究某個二分類
4、(或無序及有序多分類)目標變量與有關因素的關系,不僅適用于病因學分析,也可用于其他方面的研究 。 logistic回歸的分類: (1)二分類資料logistic回歸 非條件logistic回歸 條件logistic回歸(配對或配比資料) (2)多分類資料logistic回歸,2024/3/21,10,非條件logistic回歸,用途,探討二項分類結果變量發(fā)生概率的主要影響因素, 臨床上常用于篩選與疾
5、病預后的主要影響因素,評價治療措施的效果,應用條件,應變量為二項分類變量,自變量可以是定量變量 ,也可以是分類變量,2024/3/21,11,2024/3/21,12,RR(相對危險度relative risk):表示暴露組與非暴露組發(fā)病率(或死亡率)的比值。也稱為危險比(risk ratio)。反映了暴露與疾病發(fā)生的關聯(lián)強度。RR表明暴露組發(fā)病或死亡的危險是非暴露組的多少倍。,2024/3/21,13,2024/3/21,14,相對
6、危險度RR的本質是暴露組與非暴露組發(fā)病率之比或發(fā)病概率之比。但病例對照研究不能計算發(fā)病率,只能計算比值比OR值。 OR與RR的含義是相同的,也是指暴露組的疾病危險性為非暴露組的多少倍。當疾病發(fā)病率小于5%時,OR是RR的極好近似值。,OR>1,說明 該因素使疾病的危險性增加,為危險因素;OR<1,說明 該因素使疾病的危險性減小為保護因素.,2024/3/21,15,Logistic回歸模型的構造,設x1, x2
7、 , … , xp為一組自變量,y為應變量。當y是陽性反應時,記為y=1;當y是陰性反應時,記為y=0。用P表示發(fā)生陽性反應的概率;用1-P就是發(fā)生陰性反應的概率,2024/3/21,16,logistic回歸模型,,上式中, β0 為常數(shù)項, βj為偏回歸系數(shù),2024/3/21,17,2024/3/21,18,優(yōu)勢(Odds): 優(yōu)勢比(Odds ratio) 表示一個暴露水平與另一個暴露水平相比,所引起某種結局的危險
8、度之比 OR 與βj 之間的關系:,偏回歸系數(shù)βj 的流行病學意義,在其他自變量固定不變的情況下,自變量 xj 的暴露水平每改變一個測量單位時,所引起的優(yōu)勢比OR 的自然對數(shù)改變量,2024/3/21,19,2024/3/21,20,,2024/3/21,21,對于發(fā)病率很低的慢性疾病如心腦血管病、惡性腫瘤等,優(yōu)勢比可作為相對危險度(relative risk , RR)的近似估計。即:,,2024/3/21,22,參數(shù)估計
9、與假設檢驗,參數(shù)估計:構造似然函數(shù),采用極大似然函 數(shù)法求解假設檢驗,似然比法 Wald 檢驗法,2024/3/21,23,,,,2024/3/21,24,觀察例數(shù),2024/3/21,25,,2024/3/21,26,2024/3/21,27,logistic回歸模型的假設檢驗,2024/3/21,28,2024/3/21,29,對所擬合模型的假設檢驗:,2024/3/21,30,變量篩選,2024/3/21
10、,31,實例分析,,2024/3/21,32,2024/3/21,33,2024/3/21,34,SAS程序,data a;input x1 x2 x3 x4 x5 x6 x7 y;cards;0015.652.343.611.9800006.233.892.110.9901015.142.732.881.020…………………0004.31.792.641.311
11、103.350.811.681.311104.781.42.150.9911105.231.123.691.0311102.891.21.951.391;proc logistic des;model y=x1-x7;run;,2024/3/21,35,,,,2024/3/21,36,,2024/3/21,37,逐步回歸分析,proc logistic des;mod
12、el y=x1-x7/stb selection=stepwise sle=0.1 sls=0.1;run;,用逐步回歸法擬合模型,變量選入和剔除水平均為0.10,2024/3/21,38,,,,2024/3/21,39,,,2024/3/21,40,2024/3/21,41,logistic逐步回歸分析篩選出三個有統(tǒng)計學意義的變量為x2、x4和x7,回歸系數(shù)分別為1.7324、-2.1630和4.2578。吸煙(x2)的優(yōu)勢比5.
13、645,表示在控制其他因素后吸煙者 (x2=1)發(fā)生該病的危險性是不吸煙者(x2=0)的5.645倍膽固醇(x4)是保護因素,表示控制其他因素影響后,膽固醇每增加一個單位發(fā)生該病的危險性是原來的0.115倍。,2024/3/21,42,結果中還給出了標準化偏回歸系數(shù),高密度脂蛋白(x7)引起腔隙性腦梗死多發(fā)的危險性大于吸煙(x2),而膽固醇(x4)是保護因素。,,2024/3/21,43,,2024/3/21,44,logistic回歸
14、的應用及其注意事項,一、logistic回歸的應用1. 流行病學危險因素分析 logistic回歸分析參數(shù)的流行病學含義清楚,即得到某一危險因素的回歸系數(shù) 后,可以方便的估計出該因素在不同水平下的OR值或近似RR值,非常適合于流行病學研究。 在流行病學危險因素研究中,為了排除混雜因素的影響,可以通過擬合包含多變量的logistic回歸模型,得到調(diào)整后的優(yōu)勢比。,2024/3/21,45,2. 臨床試驗數(shù)據(jù)分析
15、 臨床評價某種藥物或治療方法的效果,非處理因素在試驗組和對照組間分布不均衡,就有可能夸大或掩蓋實驗組的治療效果。 盡管在分組時要求按隨機化原則分配,但由于樣本含量有限,非處理因素在試驗組和對照組間的分布仍可能不均衡,需要在分析階段對構成混雜的因素進行調(diào)整,當評價指標為兩分類變量時,可以利用logistic回歸分析得到調(diào)整后的藥物或某種治療方法的評價結果。,2024/3/21,46,3.預測與判別 Logi
16、stic回歸模型是一個概率型模型,對非條件Logistic回歸,在給定的條件下可通過logistic回歸模型計算某事件發(fā)生的概率。因此可以利用它預測某事件發(fā)生的概率。在臨床上也可以根據(jù)疾病與臨床檢查指標資料,建立logistic回歸模型,對新的對象可根據(jù)其臨床檢查指標,計算其患某種疾病的概率的大小,進行判別分析。,2024/3/21,47,,某患者吸煙(x2=1),膽固醇水平(x4=5.7) 高密度脂蛋白(x7=2.0
17、) ,則該患者多發(fā)腔隙性腦梗死的概率是P=?,2024/3/21,48,二、注意事項 1、數(shù)值變量資料的賦值 若自變量是數(shù)值變量,最好將其按變量值的大小分成幾組,按順序賦值為1,2,3…k,否則參數(shù)的實際意義可能不明確。 例如,對于年齡變量,如果利用實際數(shù)值則求出的OR值表示年齡每增加一歲時的優(yōu)勢比,實際意義不大。,2024/3/21,49,如果將年齡分成幾個不同的水平(年齡段),就比較容易解釋,
18、處理上也比較靈活,分析時既可以按得分處理,也可以將其化作k-1個啞變量(dummy variable),啞變量法強調(diào)參數(shù)解釋,其他各水平的恰為相對水平1的優(yōu)勢比;任意兩水平的優(yōu)勢比可以由相應的回歸系數(shù)之差得到。,,,2024/3/21,50,年齡(歲)xage,2024/3/21,51,2、因變量賦值 與分類變量賦值方法相同,但需注意“陽性反應”的賦值,如果因變量賦值的順序相反,回歸系數(shù)絕對值不變,但符號相反。在SAS軟件的lo
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- logistic回歸模型
- logistic回歸分析
- 多元線性回歸與logistic回歸
- Logistic回歸和稀有事件logistic回歸模型的模擬研究.pdf
- 應用stata做logistic回歸
- (1)線性回歸、logistic回歸和一般回歸.pdf
- 醫(yī)學統(tǒng)計學logistic回歸
- logistic回歸在醫(yī)學中應用
- 醫(yī)學統(tǒng)計學-logistic回歸
- matlab軟件包與logistic回歸
- 分類資料的logistic回歸分析spss
- 城市擇校生問題的Logistic回歸分析.pdf
- 第十二章 logistic回歸分析
- 醫(yī)學統(tǒng)計學16-logistic回歸
- 多分類Logistic回歸及其統(tǒng)計推斷.pdf
- 如何用spss做logistic回歸分析解讀
- 34545.logistic回歸模型的統(tǒng)計診斷
- spss二元logistic回歸案例分析
- logistic 回歸模型支持的 學分銀行認同研究
- 病例對照研究的Stereotype Logistic回歸模型.pdf
評論
0/150
提交評論