面向挖掘的肺癌數(shù)據(jù)庫設(shè)計及實現(xiàn).pdf_第1頁
已閱讀1頁,還剩67頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、面向醫(yī)學(xué)海量資源寶庫的智能化再加工的所謂醫(yī)學(xué)數(shù)據(jù)倉庫技術(shù)以及面向臨床的醫(yī)學(xué)數(shù)據(jù)庫知識挖掘技術(shù)已成為從事數(shù)據(jù)庫技術(shù)研究的科研人員與醫(yī)務(wù)工作者通力合作的熱點、難點和重點。本課題正在開發(fā)的肺癌數(shù)據(jù)庫挖掘系統(tǒng)是計算機(jī)教研室與我校第一附屬醫(yī)院呼吸科共同研制的、以科研為主要目的、支持?jǐn)?shù)據(jù)挖掘和知識獲取的綜合型數(shù)據(jù)庫系統(tǒng),用于肺癌的相關(guān)研究。
  本論文的主要工作如下:
  1.建立了具有層次關(guān)系的肺癌數(shù)據(jù)庫系統(tǒng)的樹形代碼體系。在分析肺癌

2、數(shù)據(jù)庫數(shù)據(jù)特點、肺癌研究需求及醫(yī)學(xué)數(shù)據(jù)挖掘難點等基礎(chǔ)上,建立了具有層次關(guān)系的肺癌數(shù)據(jù)庫系統(tǒng)的樹形代碼體系,實現(xiàn)了醫(yī)學(xué)數(shù)據(jù)代碼化、標(biāo)準(zhǔn)化和特征化;在保證醫(yī)學(xué)對象數(shù)據(jù)自然聚合性(如:一張化驗單的數(shù)據(jù)必須自然聚合,方能綜合反映患者一種狀態(tài))基礎(chǔ)上,為肺癌數(shù)據(jù)庫擴(kuò)充了N1NF功能,全面提高了數(shù)據(jù)庫系統(tǒng)的時空效率。
  2.建立了肺癌數(shù)據(jù)庫查詢及數(shù)據(jù)挖掘的數(shù)據(jù)模型,并給出了相關(guān)操作的形式化定義及基本算法思想。本文把醫(yī)學(xué)對象(如疾病、診斷、醫(yī)

3、療方案等)表示為多個屬性單元,通過屬性單元的不同運(yùn)算(或者操作)實現(xiàn)所謂的查詢分析、統(tǒng)計匯總及數(shù)據(jù)挖掘等綜合性操作。將關(guān)系數(shù)據(jù)庫中面向字段的表達(dá)式組合的、按自然關(guān)聯(lián)通過連接操作重新聚合的、面向大批量數(shù)據(jù)庫字段(包括多個數(shù)據(jù)表)的查詢,簡化為面向?qū)哟未a化的數(shù)據(jù)集合運(yùn)算(或者操作),并引入了相似度的概念,解決了醫(yī)學(xué)數(shù)據(jù)挖掘中的模糊匹配問題。
  3.肺癌數(shù)據(jù)庫中,為了保證數(shù)據(jù)存儲的時空效率,描述患者的數(shù)據(jù)通常由多個物理數(shù)據(jù)庫表存儲。

4、為了為終端用戶提供一個以全局模式分析及各種條件組合的環(huán)境以及以醫(yī)學(xué)對象整體的方式對結(jié)果進(jìn)行解釋的目的,本文引入了泛關(guān)系模式的概念,把肺癌數(shù)據(jù)庫的所有屬性組成一個關(guān)系模式,這個關(guān)系模式就稱為泛關(guān)系模式,并提供了專用的泛關(guān)系數(shù)據(jù)庫操作接口。為了解決泛關(guān)系模式中數(shù)據(jù)表連接操作中的大體積、大冗余及時空低效率問題,本文提出增量式(只聚集涉及的數(shù)據(jù)庫表、數(shù)據(jù)庫字段)泛關(guān)系運(yùn)算的概念,引入與關(guān)聯(lián)和或關(guān)聯(lián)的構(gòu)造算法,取得了較為理想的運(yùn)行效果。
 

5、 4.建立自然表接口。以臨床實際使用的表單作為數(shù)據(jù)錄入修改、查詢統(tǒng)計、數(shù)據(jù)挖掘等綜合操作的用戶操作接口,稱之為自然表接口,增強(qiáng)了操作界面的用戶友好性,受到了用戶的一致好評。
  5.建立數(shù)據(jù)處理模板。以代碼重用、功能封裝、面向?qū)ο?、OLE技術(shù)、組合使用等為主要特點的程序模板化技術(shù),是目前軟件技術(shù)中倍受推崇的技術(shù)之一。本文把這一技術(shù)引入到肺癌數(shù)據(jù)庫系統(tǒng)之中,建立代碼驅(qū)動的數(shù)據(jù)處理模板。模板采用基于樹視圖的表達(dá)結(jié)構(gòu),可清晰地表達(dá)數(shù)據(jù)之

6、間的層次關(guān)系、并列關(guān)系以及數(shù)據(jù)的組合狀態(tài)。針對不同的肺癌數(shù)據(jù),只要進(jìn)行模板的組合,用相應(yīng)的代碼驅(qū)動各個組合的模板,就可輕松地解決各種層次型數(shù)據(jù)和組合型數(shù)據(jù)的界面表達(dá)。在本文中,模板的組合使用構(gòu)成了系統(tǒng)中各部分的用戶界面,便于用戶的交互,解決了數(shù)據(jù)的輸入輸出、查詢條件的構(gòu)造生成、挖掘條件的組合生成、結(jié)果的表達(dá)等問題。
  6.軟件開發(fā)與實現(xiàn)。在MicrosoftWindowsXP系統(tǒng)上,采用MicrosoftSQLServer200

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論