基于隨機森林的肝硬化上消化道出血風險預測.pdf_第1頁
已閱讀1頁,還剩54頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、目的:基于肝硬化患者的臨床病歷數(shù)據(jù),構建肝硬化患者上消化道出血的隨機森林預測模型。通過隨機森林模型實現(xiàn)對肝硬化患者并發(fā)上消化道出血發(fā)病與否及發(fā)病概率預測,識別出將會發(fā)生上消化道出血的肝硬化患者,把握疾病發(fā)展動態(tài)。從而可以通過避免接觸上消化道出血誘因,以及盡早的干預與預防性治療等措施,降低肝硬化上消化道出血的發(fā)生率及致死率。
  方法:通過回顧性收集山西醫(yī)科大學第一臨床醫(yī)院消化內科2006年1月~2015年12月期間出院的肝硬化患者

2、病歷中的基本信息、既往疾病史、并發(fā)癥、入院臨床表現(xiàn)及體征、入院血常規(guī)、血生化、相關抗原、凝血功能檢查等資料。利用卡方檢驗及T檢驗篩選出與并發(fā)上消化道出血有關聯(lián)的變量,并經臨床專家結合臨床實際剔除為上消化道出血的表現(xiàn)的變量。將數(shù)據(jù)集按3:1:1比例隨機分成訓練數(shù)據(jù)集、驗證數(shù)據(jù)集和測試數(shù)據(jù)集三部分。以篩選出的自變量為輸入,是否并發(fā)上消化道出血為輸出,在訓練數(shù)據(jù)集中分別建立logistic回歸、決策樹和隨機森林預測模型,驗證數(shù)據(jù)集用于決策樹和

3、隨機森林模型模型性能提升時各不同參數(shù)設置模型的預測性能比較,最終在測試數(shù)據(jù)集中評價三種最終模型預測的準確度、靈敏度、特異度、陽性預測值、陰性預測值和AUC指標并進行比較。
  結果:通過篩選,最終用于建模的變量為:Child-Pugh分級、惡心、腹脹、浮腫、腹水、移動性濁音、上消化道出血病史、脾切手術史、總蛋白、白蛋白、總膽紅素、堿性磷酸酶、谷氨酰轉肽酶、血糖、膽固醇、尿素氮、血清鉀、凝血酶原百分活動度、活化部分凝血活酶時間、癌胚

4、抗原和CA19-9抗原,共21個。logistic回歸預測模型在測試數(shù)據(jù)集中預測結果為:準確度81.50%、靈敏度60.00%、特異度89.20%、陽性預測值66.70%、陰性預測值86.10%、AUC值0.854。決策樹模型通過驗證數(shù)據(jù)集的驗證,最佳參數(shù)設置為:采用信息熵(information)為分裂屬性選擇度量標準,后剪枝處理復雜度參數(shù)CP為0.026,損失矩陣(loss)設置為C(0,3,1,0)。決策樹模型在測試數(shù)據(jù)集中預測結

5、果為:準確度75.10%、靈敏度78.00%、特異度74.10%、陽性預測值52.00%、陰性預測值90.40%、AUC值0.720。隨機森林模型通過驗證數(shù)據(jù)集的驗證,最佳參數(shù)設置為:模型包含樹的棵數(shù)(ntree)為500,隨機選擇的特征數(shù)(mtry)為4。隨機森林模型在測試數(shù)據(jù)集中預測結果為:準確度88.90%、靈敏度64.00%、特異度97.80%、陽性預測值91.40%、陰性預測值88.30%、AUC值0.909。通過比較各項指標

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論