版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、,、y ,0 5 5 6 6分類號—£業(yè) 單位代碼:1 0 1 5 9學(xué) 號:2 0 0 3 2 2 0 9 5中回鏨升太零碩士學(xué)位論文題 目:急性白血病相關(guān)基因的文本挖掘分析N i n i n gR e l a t i o n s h i pB e t w e e nA c u t ek l l l 【e “a a n dR e l a t e dC e n e sb yT e x t u a lD a t aN i n i n g研
2、究生:——上L 』L導(dǎo) 師: 堡重學(xué)科專業(yè): 煎盤叢生魚墨生墮鹽塋論文課題起止時間: ! 唑主i 旦二! 堂主! 旦論文完成時間:! 堂圭』基,一一一?一?一、 { 、?! 奎鰱塑量?/}急性白血病相關(guān)基因的文本挖掘分析目 的尋找一種通過文本挖掘獲取醫(yī)學(xué)文獻(xiàn)中的有益信息進(jìn)而用于解釋生物數(shù)據(jù)的方法。本文以急性白血病為例,通過主題詞和自然語言兩種途徑以疾病與基因的共現(xiàn)關(guān)系為基礎(chǔ)進(jìn)行聚類分析’,挖掘基因與疾病之間的關(guān)系,并對兩種途徑的有效性進(jìn)
3、行評價。材料與方法以“l(fā) e u k e m i a [ m a j r ] A N Dg e n e s [ m a j r ] ”為檢索策略通過P U B M E D 檢索1 9 6 6 年到2 0 0 5 年9 月6 日的有關(guān)白血病與基因關(guān)系的相關(guān)文獻(xiàn),共檢得3 5 2 9 篇。將檢索結(jié)果分別保存為X M L 格式和M e d l i n e 格式,作為挖掘樣本。對X M L 格式的樣本,根據(jù)主題詞的樹狀結(jié)構(gòu)從中篩選急性白血病類和
4、基因類主題詞進(jìn)行處理,選取出現(xiàn)頻次大于等于3 的主要主題詞共7 5 個進(jìn)行統(tǒng)計,生成詞篇矩陣,對生成的詞篇矩陣采用二值( B i n a r y ) 資料測量中的h a m a n n 變換,使用重心法( c e n t r o i d c l u s t e r i n g ) 進(jìn)行聚類。對m e d l i n e 格式樣本采用M M T x 進(jìn)行處理,從處理結(jié)果中提取語義類型為“n e o p l a s t i cp r o c
5、 e s s ”出現(xiàn)頻次大于3 0 的前3 0 個腫瘤類概念為列,另取語義類型為“g e n eo rg e —n o m e ”出現(xiàn)頻次大于6 7 的前6 0 個基因類概念為行,計算生成腫瘤類概念與基因類概念的共句矩陣,對生成的矩陣采用計數(shù)資料( c o u n t s ) 測量中的c h i :s q u a r e 法,使用最大距離( f u r t h e s tn e i g h b o r ) 進(jìn)行聚類。結(jié) 果從X M L
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 急性白血病
- 急性白血病
- 白血病相關(guān)基因的功能研究.pdf
- 急性白血病病例分析模板
- 急性白血病MLL基因重排的檢測.pdf
- 急性白血病e
- 急性白血病圖譜
- 小兒急性白血病
- 白血病相關(guān)BCR-ABL基因的序列分析.pdf
- 急性白血病ppt
- 急性白血病合并銀屑病的臨床分析.pdf
- 小兒急性白血病的危險因素分析.pdf
- 急性髓系白血病FANCG基因表達(dá)的研究.pdf
- 急性髓系白血病基因突變的檢測.pdf
- HLA基因多態(tài)性與急性白血病相關(guān)性的研究.pdf
- 成人急性淋巴白血病
- 急性白血病相關(guān)致病基因突變研究及其臨床意義.pdf
- 急性白血病診治進(jìn)展
- 急性髓系白血病WT1及其相關(guān)基因表達(dá)的意義.pdf
- WT1基因高表達(dá)急性白血病和伴有t(821)急性髓細(xì)胞白血病療效及預(yù)后分析.pdf
評論
0/150
提交評論