基于人血漿microRNAs的數(shù)據(jù)挖掘技術(shù)構(gòu)建肺癌預(yù)測(cè)系統(tǒng).pdf_第1頁(yè)
已閱讀1頁(yè),還剩88頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、肺癌位居中國(guó)惡性腫瘤發(fā)病率和死亡率首位,肺癌預(yù)防的重要手段是開(kāi)展早期發(fā)現(xiàn)、早期診斷和早期治療,有必要研究高敏感性和特異性的腫瘤生物標(biāo)志物。microRNAs(miRNAs)可調(diào)控基因參與細(xì)胞的生長(zhǎng)、增殖、分化和凋亡等過(guò)程,大量的研究表明循環(huán)miRNAs和多種腫瘤的發(fā)生和發(fā)展有關(guān),具有作為包括肺癌在內(nèi)的疾病診斷生物標(biāo)志物的潛力。
  目的:
  該研究應(yīng)用決策樹(shù)(Decision Tree,DT)、人工神經(jīng)網(wǎng)絡(luò)(Artific

2、ial Neual Networks,ANN)和支持向量機(jī)(SupportVector Machines,SVM)等數(shù)據(jù)挖掘方法聯(lián)合血漿miRNA生物標(biāo)志、流行病學(xué)參數(shù)和臨床癥狀資料建立肺癌預(yù)測(cè)模型。
  對(duì)象和方法:
  1.研究對(duì)象:肺癌組為2016年6月至2017年2月取自鄭州大學(xué)第一附屬醫(yī)院呼吸內(nèi)科、河南省腫瘤醫(yī)院胸外科、河南省胸科醫(yī)院呼吸內(nèi)科和胸外科的148例初診的原發(fā)性肺癌患者;對(duì)照組為2016年7月取自淇縣疾病

3、預(yù)防控制中心體檢的148例健康人群。經(jīng)知情同意后收集研究對(duì)象的信息和血液標(biāo)本。
  2.實(shí)驗(yàn)方法:血漿miRNAs(miR-16、miR-21、miR-20a、miR-210、miR-145、miR-126、miR-223、miR-197、miR-30a、miR-30d、miR-25)表達(dá)水平的檢測(cè)采用實(shí)時(shí)熒光定量PCR法。
  3.數(shù)據(jù)挖掘:采用SPSS Clementine21.0軟件。基于單因素分析結(jié)果和Logisti

4、c回歸分析優(yōu)化結(jié)果,先將數(shù)據(jù)預(yù)處理,按3:1的比例將所有樣本隨機(jī)分成訓(xùn)練集和預(yù)測(cè)集,用訓(xùn)練好的模型對(duì)預(yù)測(cè)集進(jìn)行預(yù)測(cè),應(yīng)用Fisher判別分析、DT C5.0、ANN和SVM算法分別建立模型,并采用診斷試驗(yàn)評(píng)價(jià)指標(biāo)比較模型的預(yù)測(cè)結(jié)果。
  4.統(tǒng)計(jì)學(xué)分析:Excel2010建立數(shù)據(jù)庫(kù),采用SPSS21.0軟件進(jìn)行統(tǒng)計(jì)分析。定量資料分析符合正態(tài)分布時(shí)采用兩獨(dú)立樣本 t檢驗(yàn),不符合正態(tài)分布時(shí)采用Mann-Whitney U檢驗(yàn);定性資料

5、間的比較采用χ2檢驗(yàn);肺癌的影響因素采用二分類Logistic回歸分析。檢驗(yàn)水準(zhǔn)為α=0.05。
  結(jié)果:
  1.血漿miRNAs表達(dá)水平檢測(cè)結(jié)果:肺癌組的10種血漿miRNAs(miR-21、miR-20a、miR-210、miR-145、miR-126、miR-223、miR-197、miR-30a、miR-30d、miR-25)的表達(dá)水平高于對(duì)照組,差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。
  11種血漿miRNA

6、s(miR-16、miR-21、miR-20a、miR-210、miR-145、miR-126、miR-223、miR-197、miR-30a、miR-30d、miR-25)的表達(dá)水平與年齡、肺癌的組織學(xué)類型無(wú)關(guān)(P>0.05);血漿中miR-30a和 miR-21表達(dá)水平與性別有關(guān)(P<0.05);血漿中miR-21和miR-25表達(dá)水平與吸煙程度、飲酒有關(guān)(P<0.05)。血漿中miR-210的表達(dá)水平和肺癌的分期有關(guān)(P<0.05

7、);血漿中miR-126的表達(dá)水平和肺癌淋巴結(jié)轉(zhuǎn)移有關(guān)(P<0.05)。
  2.肺癌影響因素分析結(jié)果:?jiǎn)我蛩胤治鼋Y(jié)果顯示肺癌組和對(duì)照組間的流行病學(xué)參數(shù)和臨床癥狀(吸煙程度、發(fā)熱、胸悶胸痛、咳嗽、痰中帶血、咯血)的分布的差異和10種血漿miRNAs(miR-21、miR-20a、miR-210、miR-145、miR-126、miR-223、miR-197、miR-30a、miR-30d、miR-25)的表達(dá)水平的差異有統(tǒng)計(jì)學(xué)意義

8、(P<0.05);多因素Logistic回歸分析結(jié)果顯示,發(fā)熱、胸悶胸痛、咳嗽、血漿中miR-20a(P=0.016)和miR-223(P=0.001)相對(duì)表達(dá)量升高可能是肺癌的危險(xiǎn)因素。
  3.數(shù)據(jù)挖掘模型的評(píng)價(jià)結(jié)果:由吸煙程度、發(fā)熱、胸悶胸痛、咳嗽、痰中帶血、咯血、10種血漿miRNAs(miR-21、miR-20a、miR-210、miR-145、miR-126、miR-223、miR-197、miR-30a、miR-30

9、d、miR-25)的表達(dá)水平這16個(gè)變量建立的16項(xiàng)DT C5.0模型和由發(fā)熱、胸悶胸痛、咳嗽、痰中帶血、咯血、血漿中miR-20a和miR-223表達(dá)水平建立的優(yōu)化DT C5.0模型的準(zhǔn)確度分別為98.78%和87.80%,AUC分別為0.985和0.883;16項(xiàng)SVM模型和優(yōu)化SVM模型的準(zhǔn)確度分別為98.78%和89.02%,AUC分別為0.985和0.893;16項(xiàng)ANN模型和優(yōu)化ANN模型的準(zhǔn)確度分別為87.80%和84.1

10、5%,AUC分別為0.879和0.835;16項(xiàng)Fisher判別分析模型和優(yōu)化Fisher判別分析模型的準(zhǔn)確度分別為82.93%和82.93%,AUC分別為0.828和0.824。16項(xiàng)DT C5.0模型和16項(xiàng)SVM模型的AUC均優(yōu)于其他6種模型(P<0.05);其他6種模型的AUC之間的差異沒(méi)有統(tǒng)計(jì)學(xué)意義(P>0.05)。
  結(jié)論:
  1.人血漿中10種miRNAs(miR-21、miR-20a、miR-210、mi

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論