基于MeSH主題詞關聯(lián)規(guī)則的醫(yī)學熱點挖掘研究——以哮喘為例.pdf_第1頁
已閱讀1頁,還剩87頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、在當今信息爆炸的社會,生物醫(yī)學作為21世紀的重點研究領域,其文獻增長速度驚人。但面對數(shù)量龐大的文獻,人們不再滿足于對數(shù)據(jù)庫中的數(shù)據(jù)進行檢索存取等簡單操作,而是希望計算機自動智能地分析數(shù)據(jù)庫中的大量數(shù)據(jù),以揭示隱藏在這些數(shù)據(jù)中的更重要信息,即關于這些數(shù)據(jù)整體特征的描述及對其發(fā)展趨勢的預測。本研究嘗試使用關聯(lián)規(guī)則方法對哮喘相關文獻挖掘其近年的研究熱點,目的在于尋求一種效果比較理想的計算機處理文獻方法分析特定專題領域的研究熱點,解決依靠人工閱

2、讀工作量過大和人工分析具有主觀性的問題。
   本研究以PubMed數(shù)據(jù)庫中2004-2008年發(fā)表的以哮喘為主題的文獻作為研究對象。下載文獻的XML題錄,提取各篇文獻的主題詞和對應副主題詞,并統(tǒng)計主題詞/副主題詞出現(xiàn)的頻次,截取頻次大于100的主題詞作為高頻主題詞。高頻主題詞和各篇文獻形成詞篇矩陣,利用SPSS Clementine軟件做關聯(lián)規(guī)則挖掘,生成規(guī)則800余條。構建高頻主題詞共現(xiàn)矩陣,利用SPSS統(tǒng)計軟件對矩陣做層次

3、聚類。分析出哮喘研究熱點的6大領域。然后依據(jù)聚類樹狀圖最底層兩兩合并的主題詞,在各自作為前件的關聯(lián)規(guī)則中找出高置信度的共同后件,組成形如(主題詞A/主題詞B)→主題詞C的“共同關聯(lián)規(guī)則”。通過“共同關聯(lián)規(guī)則”分析各領域的研究熱點。
   哮喘的研究熱點集中在6大領域:(1)哮喘免疫學發(fā)病機制;(2)哮喘誘因及流行病學;(3)氣道重塑;(4)哮喘診斷與評估;(5)哮喘治療;(6)職業(yè)性哮喘。通過“共同關聯(lián)規(guī)則”分析得到的各領域的研

4、究熱點詳見文內。檢索SCI影響因子大于3.8的呼吸系統(tǒng)核心期刊2004-2008期間發(fā)表的哮喘相關文獻,通過人工閱讀文摘對文獻主題內容提取并分類,結果發(fā)現(xiàn)90%以上的文獻的主題內容在本研究總結的研究熱點中出現(xiàn)。
   本研究利用關聯(lián)規(guī)則分析方法對哮喘相關文獻進行研究熱點挖掘分析,具有較好的準確度,為計算機處理文獻分析特定專題領域的研究熱點做出了一個新的嘗試。相對于成熟的共詞聚類分析方法,本研究在其基礎上能賦予更多的主題詞之間關系

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論