

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、隨著醫(yī)院信息系統(tǒng)(HospitalInformationSystem,HIS)的發(fā)展,臨床數(shù)據(jù)庫已經(jīng)積累了大量的關(guān)于患者的醫(yī)療診斷的信息。如何發(fā)掘數(shù)據(jù)背后的關(guān)系模式,以提供新的醫(yī)學(xué)知識,為患者提供更為個人的,及時(shí)的預(yù)警和治療得到了越來越多的關(guān)注。因此,需要開發(fā)和應(yīng)用新的醫(yī)療數(shù)據(jù)挖掘方法來發(fā)現(xiàn)這些隱藏的知識。
本文針對醫(yī)學(xué)數(shù)據(jù)挖掘的一些關(guān)鍵點(diǎn)進(jìn)行了研究,尤其是在疾病早期預(yù)警方面。早期預(yù)警系統(tǒng)的目標(biāo)是確定臨床惡化的跡象,并提供嚴(yán)重
2、臨床事件預(yù)警。由于醫(yī)療數(shù)據(jù)往往在高維空間里,充分描述數(shù)據(jù)所需的空間規(guī)模是指數(shù)級增長的,計(jì)算量可以大到不切實(shí)際而且數(shù)據(jù)點(diǎn)很稀疏無法建模。為了解決這些問題,我們提出了核密度邏輯回歸混合模型,監(jiān)督度量學(xué)習(xí)等算法對醫(yī)療數(shù)據(jù)進(jìn)行處理。最后,我們搭建了一個雙層預(yù)警系統(tǒng):該系統(tǒng)的第一層從現(xiàn)有的臨床電子病歷數(shù)據(jù)庫中自動識別有惡化風(fēng)險(xiǎn)的患者。第二層通過無線傳感器采集高危患者的實(shí)時(shí)生命體征數(shù)據(jù)并進(jìn)行危險(xiǎn)篩查。我們采用數(shù)據(jù)挖掘技術(shù)這兩個層面上分析數(shù)據(jù),給予病
3、人的實(shí)時(shí)分析結(jié)果。論文的主要工作及貢獻(xiàn)如下:
1.提出了一種基于密度的邏輯回歸(DLR)分類模型以解決臨床數(shù)據(jù)挖掘算法中的邏輯回歸中非線性分類的問題。其主要思想是根據(jù)Nadarays-Watson密度估計(jì)將訓(xùn)練數(shù)據(jù)映射到特定的特征空間,然后組建優(yōu)化模型優(yōu)化特征權(quán)重以及Nadarays-Watson密度估計(jì)算法的寬度。其主要優(yōu)點(diǎn)在于:它不僅優(yōu)于標(biāo)準(zhǔn)的邏輯回歸,而且優(yōu)于基于RBF內(nèi)核的核邏輯回歸(KLR)。特別是與核邏輯回歸分析(
4、KLR)和支持向量機(jī)(SVM)相比,該方法不僅達(dá)到更好的分類精度,而且有更好的時(shí)間效率。該方法的另一個顯著優(yōu)點(diǎn)是,它可以很自然地?cái)U(kuò)展到數(shù)值類型和分類型混合的數(shù)據(jù)集中。除此之外,該方法在醫(yī)療數(shù)據(jù)挖掘中有模型可解釋的優(yōu)點(diǎn),這恰恰是其它算法,如核邏輯回歸分析(KLR)和支持向量機(jī)(SVM)所不具備的。
2.提出了一種監(jiān)督度量學(xué)習(xí)算法–基于內(nèi)核密度的度量學(xué)習(xí)算法(KernelDensityMetricLearning(KDML))以解
5、決臨床數(shù)據(jù)挖掘中數(shù)據(jù)特征過多引起的模型過擬合問題。該算法通用性強(qiáng),可以提供非線性的,基于概率的距離量度。通過基于內(nèi)核概率密度估計(jì),KDML構(gòu)建了一個從原始空間至目標(biāo)特征空間的直接非線性映射。KDML內(nèi)部嵌入的非線性映射能夠解決線性度量學(xué)習(xí)在數(shù)據(jù)集上分類錯誤的問題。同時(shí),該算法解決了當(dāng)特征分布不均時(shí),歐幾里得距離在原始空間上的量度導(dǎo)致k近鄰分類失效的問題。除此之外,算法可以實(shí)現(xiàn)與現(xiàn)有的度量學(xué)習(xí)算法結(jié)合。我們同時(shí)提出了一種綜合的優(yōu)化算法,來
6、優(yōu)化馬氏矩陣和非線性映射中的超參數(shù)。通過在數(shù)據(jù)集上的實(shí)驗(yàn)證明KDML能夠顯著提高現(xiàn)有度量算法在k近鄰分類中的分類精度。
3.提出了一種新的監(jiān)督學(xué)習(xí)算法-快速通量判別算法(FastFluxDiscriminant,F(xiàn)FD),來解決大尺度非線性分類問題。算法提出了一個新的子模優(yōu)化框架,通過分解整個特征空間的核密度估計(jì)函數(shù),將原始高維數(shù)據(jù)轉(zhuǎn)化至低維子空間。子空間的特征將被轉(zhuǎn)換,并在新的特征空間進(jìn)行線性建模。與其他基于核算法非線性模型
7、不同,由于原始空間的權(quán)重系數(shù)可知,F(xiàn)FD模型具有可解釋性的優(yōu)點(diǎn),同時(shí)通過降維,使得算法的訓(xùn)練和測試時(shí)間大大縮短。在實(shí)際數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果證明,該模型在保持高精度的分類結(jié)果的基礎(chǔ)上,具有稀疏性,可解釋性和多尺度性等優(yōu)點(diǎn)。
4.提出了一個應(yīng)用在病房中的早期預(yù)警系統(tǒng)(EarlyWarningSystem),為臨床病人提供早期預(yù)警,從而在病人病情進(jìn)一步惡化之前為醫(yī)生提供早期介入的機(jī)會。通過引入Bucketing技術(shù)來捕捉病人重要體征的
8、變化,并填補(bǔ)病人缺失的數(shù)據(jù),使得數(shù)據(jù)可以應(yīng)用在實(shí)際的模型中。同時(shí),我們結(jié)合邏輯回歸,BiasedBucketBagging(解決過擬合為題),探索性下采樣(解決類間不均衡問題)等算法完成系統(tǒng)。此外,在實(shí)時(shí)預(yù)測系統(tǒng)中,我們引入通過指數(shù)移動平均平滑初級預(yù)測結(jié)果,來較少數(shù)據(jù)波動對模型輸出的影響。
5.設(shè)計(jì)了無線醫(yī)療監(jiān)控系統(tǒng)-臨床監(jiān)測無線傳感器網(wǎng)絡(luò),能夠獲得病人的實(shí)時(shí)醫(yī)療數(shù)據(jù)時(shí)間序列。該系統(tǒng)針對無線傳感器網(wǎng)絡(luò)在普通病房布置運(yùn)用的可能性
9、進(jìn)行了深入的臨床實(shí)驗(yàn)?;?02.15.4的無線Mesh網(wǎng)絡(luò),TelosB硬件平臺,針對病人流動性大,醫(yī)療無線傳感器網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)多變性的特點(diǎn),通過引入動態(tài)中繼協(xié)議(DRAP),收集樹協(xié)議(CTP)來解決節(jié)點(diǎn)數(shù)據(jù)傳輸和能量限制的問題。在醫(yī)院病房中的實(shí)驗(yàn)證明,系統(tǒng)提供了足夠的時(shí)間分辨率以支持臨床突發(fā)事件的監(jiān)測,實(shí)現(xiàn)了利用無線傳感器網(wǎng)絡(luò)持續(xù)對病人監(jiān)護(hù)的預(yù)期目標(biāo)。在此基礎(chǔ)上,我們提出了一種針對一般的病情惡化的綜合數(shù)據(jù)挖掘算法。通過提取一階,二階
10、時(shí)間序列特征,去趨勢波動分析(DetrendedFluctuationAnalysis(DFA)),頻譜分析,近似熵(ApproximativeEntropy(ApEn)),時(shí)間序列交叉相關(guān)性分析,整合得到時(shí)間序列的特征集。然后,通過引入一系列數(shù)據(jù)挖掘方法來進(jìn)行時(shí)間序列分類,其中包括前向特征選擇,線性和非線性分類算法等。最終,我們將算法應(yīng)用在2001年至2008年不同重癥監(jiān)護(hù)病房病人的數(shù)據(jù)上,結(jié)果顯示文中提出的綜合數(shù)據(jù)挖掘算法能夠顯著提
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 流數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究.pdf
- 制造執(zhí)行系統(tǒng)中數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究.pdf
- 面向服務(wù)的數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究.pdf
- 科技文獻(xiàn)數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究.pdf
- 船舶AIS數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究.pdf
- 數(shù)據(jù)挖掘網(wǎng)格若干關(guān)鍵技術(shù)研究.pdf
- 動車組故障數(shù)據(jù)挖掘的關(guān)鍵技術(shù)研究.pdf
- 基于數(shù)據(jù)挖掘的入侵檢測關(guān)鍵技術(shù)研究.pdf
- 面向醫(yī)療的數(shù)據(jù)融合關(guān)鍵技術(shù)研究.pdf
- 18927.時(shí)空序列數(shù)據(jù)挖掘中若干關(guān)鍵技術(shù)研究
- 網(wǎng)格中基于軟計(jì)算的數(shù)據(jù)挖掘若干關(guān)鍵技術(shù)研究.pdf
- 數(shù)據(jù)挖掘技術(shù)在冠心病早期預(yù)警系統(tǒng)中的應(yīng)用研究.pdf
- 數(shù)據(jù)挖掘應(yīng)用平臺及其關(guān)鍵技術(shù)研究.pdf
- 動態(tài)數(shù)據(jù)流挖掘關(guān)鍵技術(shù)研究.pdf
- 支持挖掘的流式數(shù)據(jù)脫敏關(guān)鍵技術(shù)研究.pdf
- 面向電信領(lǐng)域的數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究.pdf
- 基于SOA的金融數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究.pdf
- 微博數(shù)據(jù)挖掘理論的若干關(guān)鍵技術(shù)研究.pdf
- 數(shù)據(jù)挖掘技術(shù)在冠心病早期預(yù)警系統(tǒng)中的應(yīng)用研究
- 數(shù)據(jù)挖掘網(wǎng)格中作業(yè)分配與調(diào)度關(guān)鍵技術(shù)研究.pdf
評論
0/150
提交評論