中藥提取工藝文獻知識組織方法研究.pdf_第1頁
已閱讀1頁,還剩102頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、1研究背景
   目前中醫(yī)藥信息以冪次方增長,使用戶真正需要的知識湮沒于浩瀚的信息海洋中,百度、Google等搜索引擎的出現(xiàn)在一定程度上緩解了知識獲取難的問題,然而由于缺乏高效的知識組織方法支撐,知識不能便利的為用戶所用成為信息利用研究無法逾越的障礙,彰顯了進行知識組織方法研究的迫切性;然而當前知識組織研究仍然停留在以文獻單元為基礎的發(fā)展階段,未在理論和實踐上取得重大突破,更加劇了信息占有量和知識利用之間的矛盾,因此本研究將以中

2、藥提取工藝文獻知識為例進行組織方法學上的探討。
   2研究思路
   知識組織的目的是提供優(yōu)質(zhì)的知識服務,因此本研究以科研人員的潛在需求為導向,分別對中藥提取工藝文獻知識進行了以數(shù)據(jù)單元和知識單元為基礎的組織實踐:以數(shù)據(jù)單元為基礎的組織實踐,主要是對中藥提取工藝文獻進行知識抽取、知識重組、知識存檢等初步組織活動;以知識單元為基礎的組織實踐,主要是對科研人員感興趣的關鍵知識點“影響因素”尋求合適的評價方法進行知識再組織,

3、組織結果可為用戶提供多篇同類文獻中各個提取影響因素的綜合分析結果。
   3研究內(nèi)容
   本研究進行的知識組織方法實踐分為四個階段來完成:一是在需求基礎上確定知識組織實踐對象;二是實施以數(shù)據(jù)單元為基礎的知識組織方式,對非結構化文獻知識進行初步組織;三是實施以知識單元為基礎的組織方式研究,選擇合適的評價方法進行知識再組織;四是對知識組織實踐結果進行討論分析。
   下面將分別闡述知識組織方法實施的四個階段:

4、>   第一階段:確定知識組織對象
   本階段以需求為導向確定組織對象。本研究在確定知識組織對象時遵循了三個原則:一是尋求科研人員的興趣點和需求,使研究工作更有意義:二是文獻知識環(huán)境穩(wěn)定類似,為數(shù)據(jù)的再組織分析減少困難;三是具備一定量的科研型數(shù)據(jù),科研型數(shù)據(jù)是開展深層次知識服務的數(shù)據(jù)基礎。
   首先,本研究從“中國引文數(shù)據(jù)庫”中檢索統(tǒng)計2007年中藥類期刊文獻(共30510篇)的下載量,下載量高在很大程度上反映了科

5、研人員對此領域的關注程度,本研究對下載量排名靠前100名的熱點文獻進行主題內(nèi)容分類,其中“中藥提取工藝類文獻”占40%,是前100篇熱點文獻中科研人員最感興趣的文獻類型,同時此類文獻的數(shù)據(jù)環(huán)境穩(wěn)定、主題因素相近,因此本研究最終確定“中藥提取工藝文獻”為知識組織對象。
   然后本研究從中國中醫(yī)藥期刊文獻數(shù)據(jù)庫和中國生物醫(yī)學文獻數(shù)據(jù)庫(CBM)中檢索“中藥提取工藝類文獻”共12645篇,制訂文獻篩選原則剔除不符合要求的文獻;另外,

6、考慮到要針對多個作者對同一中藥成分提取影響因素的不同觀點進行綜合分析,因此要求對同一中藥成分的提取研究達10篇以上方可作為目標文獻,最終共獲得1299篇中藥提取工藝文獻作為本次知識組織的具體對象。
   第二階段:知識抽取
   此階段是對1299篇中藥提取工藝文獻進行相關知識點的抽取,為后期知識再組織創(chuàng)造條件,屬知識的初步組織階段。
   本研究首先對抽取內(nèi)容進行設計分析,其次為知識抽取工作定制了采集系統(tǒng),以完

7、成對中藥提取工藝文獻知識的重組和知識存檢,最終本研究抽取了包括關鍵知識點“影響因素”在內(nèi)的相關知識點29個,共涉及了61個中藥成分、44個來源中藥的提取工藝信息。
   本研究通過實施以數(shù)據(jù)單元為基礎的知識組織方式,滿足了科研人員快速查閱瀏覽中藥提取工藝文獻信息的需要,從檢索層次上提高了知識獲取效率,然而這種組織形式只能提供相關事實、數(shù)據(jù)的羅列,遠不能觸及到知識組織的真正內(nèi)核,不能滿足用戶從利用知識層次上獲取知識的需要,亦無法為

8、科研人員提供現(xiàn)有文獻數(shù)據(jù)導向基礎上的綜合評價和參考建議,因此必須尋求新的方式推進知識組織工作。
   第三階段:知識再組織
   此階段是對中藥提取工藝文獻關鍵知識點“影響因素”進行知識再組織,目的是通過一定的方法為用戶批量整合同類數(shù)據(jù),并快速提供綜合的參考結果。
   以知識單元為基礎的知識組織方式處于初級發(fā)展階段,未找到明確的理論實踐指導;而知識單元的單體存在狀態(tài)又模糊不確定,使實際操作困難重重。鑒于此,本研

9、究認為知識單元雖從物理載體上難以衡量確定,但可從功能實現(xiàn)的角度開展研究。本研究認為知識單元層次的組織特點一是要深入知識內(nèi)核,對文獻所含內(nèi)容進行分析,找到知識生產(chǎn)創(chuàng)造過程中的關鍵數(shù)據(jù),并以人類創(chuàng)造利用知識的特點組織知識,二是以知識本身為單位,為人們直接提供問題的解,無須他們再投入大量精力去尋找、權衡、比較、分析便可得到他們需要的綜合分析結果。
   在中藥提取工藝文獻中,每篇文獻作者都對關鍵知識點“影響因素”的種類進行了研究,并對

10、其影響程度的大小賦予了秩次排序,作者不同,其所認為的影響因素的總體組成及各個因素的排序也不同;此類知識以觀點秩次排序的方式呈現(xiàn),如何才能綜合考察同類文獻中對同一中藥成分提取各個影響因素的綜合作用呢?
   本研究根據(jù)研究目的通過選擇一定的評價方法計算各個影響因素的綜合影響作用,為用戶提供所有相關文獻各個影響因素的綜合秩次大排序。本研究選擇了Topsis法、頻數(shù)統(tǒng)計方法、秩和比三種方法分別進行綜合評價的預試驗,結果表明頻數(shù)統(tǒng)計法只

11、能代表有多少個作者認為某影響因素有作用,能在一定程度上體現(xiàn)該影響因素的影響覆蓋范圍,但在影響力度的表現(xiàn)性上較差,無法量化表達該影響因素的綜合影響力度,尤其是無法處理頻次相同而又存在著較大差異的影響因素比較上。Topsis法雖然可以量化表達影響程度,但對實驗設計方法的一致性要求比較高,本次預實驗中選用了為大部分作者所使用的方差分析值參與運算,但仍有不少文獻由于未使用方差分析而不能采集到均差值;另外,從各篇文獻中采集到的均差值由于作者對多指

12、標處理方式的不同,導致計算方法和計算結果都存在一定差異,另外Topsis法不能有效的排除異常值的干擾,并且計算步驟相對繁瑣。而秩和比法則克服了其它兩種方法的明顯缺陷,而且根據(jù)研究目的只需得到各個影響因素的秩次便可參與秩次計算;同時,從三種方法的計算結果來看,秩和比法和頻數(shù)統(tǒng)計法的計算結果相近,在一定程度上得到相互驗證,因此本研究最終采用秩和比方法對“影響因素”進行再組織,為科研工作者提供各個影響因素的綜合影響作用排序。
   第

13、四階段:組織結果分析
   本次研究結果主要包括四個部分:一是通過以數(shù)據(jù)單元為基礎的實踐完成了對1299篇中藥提取工藝文獻的知識抽取,滿足了用戶檢索層次上的信息查詢需要;二是對61種同中藥來源的中藥成分提取的“影響因素”通過秩和比方法進行知識再組織,獲得了多篇文獻中有關61種中藥成分各個提取影響因素作用的綜合大排名,可為用戶直接提供經(jīng)綜合分析后的各個影響因素的綜合影響力度,是以知識本身為單位進行的一次以知識單元為基礎的組織方法實

14、踐;三是本研究還利用頻數(shù)統(tǒng)計法計算得出科研人員較為公認的某項“最佳提取工藝”具體的操作方式;四是開發(fā)了2個系統(tǒng)軟件以輔助課題的研究工作。另外,本研究所得結果是在當前文獻量基礎上得出,因此只是為科研人員提供數(shù)據(jù)參考,更準確的結論應在更有針對性的實驗中獲得。
   4創(chuàng)新點
   本研究的創(chuàng)新性貢獻在于通過秩和比評價方法對以秩次排序方式呈現(xiàn)的知識、具備一定的研究型數(shù)據(jù)、知識環(huán)境相近的文獻知識類型進行了組織實踐,可幫助用戶從多

15、篇同類文獻中快速得到關鍵問題的綜合分析結果及參考建議,是從以數(shù)據(jù)單元為基礎的組織方式向以知識單元為基礎的組織方式轉(zhuǎn)變的初步嘗試,在中醫(yī)藥信息領域未見此類知識組織方法的實例研究。
   5研究意義
   本研究重點從實踐的角度探索了中藥提取工藝文獻知識的組織方式,體現(xiàn)在方法學研究上,是對非結構化文獻知識進行的一次以知識單元為基礎的組織方法實踐,為中藥文獻知識組織、服務提供了研究基礎;體現(xiàn)在數(shù)據(jù)利用方面,本研究在組織同類文獻

16、知識的基礎上,通過秩和比方法對關鍵知識點中藥成分提取“影響因素”進行了深層次的再組織利用,對從數(shù)據(jù)采集到數(shù)據(jù)如何綜合利用方面做出了積極的探討:體現(xiàn)在數(shù)據(jù)服務方面,所提供的各個影響因素的綜合影響程度排序,可為科研人員感興趣的問題提供知識本身層次上的參考建議。
   6小結
   本項研究從需求分析、知識抽取、知識重組、再到知識存檢、知識再組織以及結果討論,每一步都對知識組織研究做出了積極的探索和嘗試,積累了一定的經(jīng)驗,為中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論