醫(yī)院信息數據挖掘及實現(xiàn)技術的探索.pdf_第1頁
已閱讀1頁,還剩128頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、探索基于SPSS Clementine的在線醫(yī)院數據挖掘技術的實現(xiàn),達到節(jié)約資源、共享資源的目的。在此基礎上,探討數據挖掘技術在因素預測、疾病判別診斷、疾病關聯(lián)分析中的應用,結合實例研究重慶市結核病流行過程及發(fā)展趨勢、乳腺癌腋窩高位淋巴結轉移的危險因素及判別分類模型和糖尿病與并發(fā)癥的關聯(lián)知識發(fā)掘。為臨床管理人員、醫(yī)務人員、科研工作者進行科學管理、提高診療水平以及開展醫(yī)學研究提供輔助決策與綜合分析的工具。當前信息領域內普遍存在的“知識發(fā)現(xiàn)

2、”問題迫切需要研究和解決,就方法學而言,科學地選擇適當的數據挖掘算法是獲得準確知識規(guī)則的關鍵;而在線醫(yī)院數據挖掘技術的實現(xiàn)對提高醫(yī)院管理水平和醫(yī)療質量具有重要的應用價值。 隨著計算機技術、生物醫(yī)學工程研究的飛速發(fā)展,計算機信息技術在醫(yī)學領域廣泛應用,使得大量醫(yī)學信息被精確記錄下來,積累了大量的數據資源,激增的數據背后隱藏著許多重要的有用信息。從這些大量的數據資源中挖掘深層次的、隱含的、有價值的知識顯得越來越重要。到目前為止,在國

3、內,數據挖掘技術在醫(yī)療服務領域的研究有所報道,但未見其在線分析系統(tǒng)的研究應用;針對不同目標的實際應用,科學地選擇適當的數據挖掘算法的方法學研究尚屬先例。 本研究采用Java網絡編程語言,實現(xiàn)基于SPSS Clementine的在線醫(yī)院數據挖掘的技術。利用來源于重慶市三所醫(yī)療機構(重慶市結核病防治所、重慶醫(yī)科大學附屬第一醫(yī)院、附屬第二醫(yī)院)的醫(yī)院數據,包括結核病、乳腺癌和糖尿病的資料。分別采用ARIMA模型、BP神經網絡模型、GM

4、l(1,1)模型對結核病發(fā)病率進行預測分析比較;采用Logistic模型、CHAID模型、RBFN模型、RBFN-Logistic混合模型、RBFN-CHAID混合模型對乳腺癌腋窩高位淋巴結轉移判別分類比較;采用Apriori關聯(lián)分析模型對糖尿病與并發(fā)癥的關聯(lián)強度進行描述。主要研究內容:①采用Java網絡編程語言,對在線數據挖掘技術的實現(xiàn)進行探索。②分析重慶市結核病流行過程,乳腺癌腋窩高位淋巴結轉移的危險因素以及糖尿病與并發(fā)癥的關聯(lián)。③

5、采用ARIMA模型、BP神經網絡模型、GM(1,1)模型對結核病發(fā)病率進行預測分析。④采用Logistic模型、CHAID模型、RBFN模型、RBFN-Logistic混合模型、RBFN-CHAID混合模型對乳腺癌腋窩高位淋巴結轉移判別分類。⑤利用準確率(Accuracy)和可靠性(Reliability)指標評價模型的準確性和可靠性。 研究結果表明:①初步整合了SPSS Clementine,實現(xiàn)了在線醫(yī)院數據采集、執(zhí)行引擎、

6、分析結果處理和分析結果查詢的流程處理。②結核病有明顯的季節(jié)流行高峰,基本是每年一、三季度發(fā)病人數較少,二、四季度發(fā)病人數較多。一個結核病流行年各季度發(fā)病率與一年前的一個半結核病流行年各季度發(fā)病率有關系。對結核病發(fā)病率的預測必須考慮季節(jié)因素、周期性及隨機因素的影響,才能做出準確的預測。③ARIMA模型、BPANN2模型和GM(1,1)模型比較,前兩者對結核病發(fā)病率的預測的相對誤差分別為0.05872和0.06999,GM(1,1)模型為0

7、.01210,說明殘差GM(1,1)模型對結核病具有較好的預測性能。④乳腺癌腋窩高位淋巴結轉移與腋窩中低淋巴結狀況、腫瘤大小有明顯關系。⑤RBFN模型采用權值矩陣表達診斷知識,Logistic模型與RBFNl-Logistic混合模型采用Logistic回歸系數表達診斷知識,二者均不易被使用者解讀;CHAJD模型和RBFN-CHAID混合模型采用了自然語言以樹型的方式表達,提高了結果的可理解性。⑥Logistic模型、CHAID模型、R

8、BFN模型、RBFN-Logistic混合模型、RBFN-CHAID混合模型的平均預測準確率分別為83.34%、83.79%、85.61%、83.77%、79.74%,|r-1|分別為0.0720、0.0625、0.0549、0.0766、0.0948。RBFN模型所獲知識的可靠程度以及對測試集合測試的準確率明顯優(yōu)于其它算法。⑦CHAID模型提取的診斷規(guī)則描述簡單易懂,應用方便,可判斷各診斷指標對乳腺癌腋窩高位淋巴結轉移診斷貢獻的大小,

9、從CHAID決策樹型可見,中低淋巴結狀況對乳腺癌腋窩高位淋巴結轉移診斷起決定性作用,腫瘤大小則可作為診斷的重要指標。因此,CHAID模型是一種簡便可行的計算機輔助診斷方法,可從病例自動提取診斷規(guī)則,具有較廣泛的實用價值,可應用于其它疾病的診斷研究。③泌尿道感染、腎病、眼部病變、神經病變、高脂血癥、高血壓、心臟病、冠心病等與糖尿病具有明顯并發(fā)傾向。 結論:①在線醫(yī)院數據挖掘技術是未來醫(yī)院信息系統(tǒng)的重要組成部分,對提高醫(yī)院管理水平和

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論