計算機聯(lián)機和光盤檢索_第1頁
已閱讀1頁,還剩47頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第三章 計算機聯(lián)機和光盤檢索,,計算機檢索原理與特點 計算機檢索的組成 計算機檢索的發(fā)展 計算機檢索技術 計算機檢索的程序,,計算機信息檢索的原理,計算機檢索是利用計算機對各類信息資源進行存儲與檢索。存儲過程:大量的數(shù)據(jù)按一定的格式輸入到計算機中,經(jīng)過計算機的加工處理,以一定的結構有序地存儲在計算機的存儲介質(zhì)上。查找過程:用戶的需求輸入到計算機中,由計算機對其進行處理,并與已存儲在計算機中的信息進行查詢與匹配,最后按要求的格

2、式輸出檢索結果。,,,存儲,,檢索,規(guī)范化,,,計算機信息檢索原理,檢索標識,數(shù)據(jù)庫,文獻信息,檢索結果,標引,情報提問,檢索式,匹配運算,,什么是標引?,標引:根據(jù)文獻特征分析,提取檢索標識的過程??梢苑譃橹黝}標引、分類標引、關鍵詞標引等。 主題標引是指根據(jù)文獻的主題內(nèi)容,按照某種規(guī)范化主題詞典或詞表,給予主題詞和副主題詞作為檢索標識; 分類標引是指根據(jù)文獻的學科歸屬,采用某種文獻資料分類法,給

3、予分類號作為檢索標識。,標引舉例,乙肝發(fā)病機制分類標引:R512.62 乙型肝炎主題標引:肝炎,乙型/ 病因?qū)W關鍵詞:乙肝,發(fā)病機制  轉(zhuǎn)基因作物安全性爭論與事實 -分類法類號: S33  農(nóng)藝學 -主題標引: 作物 、遺傳工程 、安全性  -關鍵詞:轉(zhuǎn)基因作物 ,安全,計算機信息檢索的特點,檢索速度快,效益高;檢索功能強,數(shù)量大;檢索途徑多,手段靈活;檢索范圍廣;服務方式多。,,,,計算機信

4、息檢索系統(tǒng)組成,硬件:運算器、控制器、存儲器、輸入輸出裝置等軟件:系統(tǒng)操作程序、數(shù)據(jù)庫管理程序、聯(lián)機控制程序、應用程序等。通訊線路:電話通訊網(wǎng)、數(shù)據(jù)通訊網(wǎng)、衛(wèi)星通訊網(wǎng)等。檢索終端:信息用戶與檢索系統(tǒng)主機進行人機對話,實現(xiàn)聯(lián)機檢索的設備。包括上網(wǎng)設備、調(diào)制解調(diào)器等。數(shù)據(jù)庫:是計算機檢索的對象。是由一個或數(shù)個文檔構成,并能夠滿足某一特定目的或某一特定數(shù)據(jù)處理系統(tǒng)需要的一種數(shù)據(jù)集合。,,數(shù)據(jù)庫(Database),一定專業(yè)范圍內(nèi)的信息

5、記錄及其索引的集合體,是計算機信息檢索系統(tǒng)的重要組成部分,是信息資源,是檢索對象.數(shù)據(jù)庫可以分為書目數(shù)據(jù)庫、數(shù)值數(shù)據(jù)庫、事實數(shù)據(jù)庫及全文數(shù)據(jù)庫等。,書目數(shù)據(jù)庫(Bibliographic Database),書目數(shù)據(jù)庫存儲的是二次文獻,包括文獻的外部特征、題錄、文摘和主題詞等,檢索結果是所需文獻的線索而非原文。圖書館的館藏書目檢索往往又稱為OPAC即Online Public Access Catalogue(聯(lián)機公共檢索系統(tǒng))

6、   許多書目數(shù)據(jù)庫是印刷型文獻檢索工具的機讀版,如:MEDLINE、CBMDISC等,數(shù)值數(shù)據(jù)庫(Numeric Database),主要包含的是數(shù)字數(shù)據(jù),如各種統(tǒng)計數(shù)據(jù)、科學實驗數(shù)據(jù)、科學測量數(shù)據(jù)等。例如圖書的尺寸和規(guī)格、藥物的各種理化參數(shù)、人體生理上的各種數(shù)值,人口統(tǒng)計數(shù)據(jù)都可收入數(shù)值數(shù)據(jù)庫。美國國立醫(yī)學圖書館編制的化學物質(zhì)毒性數(shù)據(jù)庫RTECS,包含10萬多種化學物質(zhì)的急、慢性毒理實驗數(shù)據(jù)。,事實數(shù)據(jù)庫(Fact Databa

7、se),存儲的是用來描述人物、機構、事物等信息的情況、過程、現(xiàn)象的事實數(shù)據(jù)。如名人錄、機構指南、大事記等,均可歸入事實數(shù)據(jù)庫。美國MEDLARS系統(tǒng)的醫(yī)生咨詢數(shù)據(jù)庫(PDQ),能提供有關癌癥治療和臨床實驗的相關病因、診斷標準、治療方案等信息。,全文數(shù)據(jù)庫(Full Text Database),存儲的是原始文獻的全文,如雜志論文、報紙新聞、法院案例等。全文檢索可直接獲取原始資料,而不是書目檢索時的線索,提高了用戶的檢索效率。目前

8、我國常用的全文數(shù)據(jù)庫有中國學術期刊全文數(shù)據(jù)庫(CNKI)、萬方數(shù)據(jù)庫、維普中文科技期刊數(shù)據(jù)庫等全文數(shù)據(jù)庫。,數(shù)據(jù)庫的構成,記錄(Record)是構成數(shù)據(jù)庫的一個完整的信息單元,每條記錄描述了原始信息的外部和內(nèi)部特征。書目數(shù)據(jù)庫中的一條記錄通常代表一篇文獻,其它類型數(shù)據(jù)庫中的記錄則是某種信息單元,如一種治療方案、一組理化指數(shù)等。,,D923.404 知識產(chǎn)權法: 論點·法規(guī)·案例 / 

9、;劉春田主編. - 北京: 法律出版社, 2004.1 276頁; 23cm. - 21世紀法律教育法規(guī)叢書·核心課程關聯(lián)導讀 ISBN 7-5036-4545-8: CNY24.00,比記錄更小的單位是字段,是組成記錄的數(shù)據(jù)項目。例如在書目數(shù)據(jù)庫Medline中一條記錄代表一篇文獻,在這條記錄中有題名(TI)、著者(AU)、來源(SO)、主題詞(MH)等字段

10、。,字段(Field),文檔(File),數(shù)據(jù)庫中一部分記錄的集合。許多大型數(shù)據(jù)庫為了方便用戶,常常把數(shù)據(jù)庫分割成若干文檔,如Medline數(shù)據(jù)庫分為現(xiàn)期文檔和若干個回溯文檔。文檔是數(shù)據(jù)庫的結構。數(shù)據(jù)庫是由一個順排文檔和若干個倒排文檔所構成。,按文獻記錄的存取號從小到大排列。218653(AN) Nonverbal Communication in Teaching/ /Smith, Howard . Reviews o

11、f Educational Research.V49 n49 p631-72 Wtr1983 ……218654218655……,,順排文檔,倒排文檔,關鍵詞索引文檔表索引詞  記錄號   字段號Article 195895 AB2Artifacts 218653

12、 AB22Behavior 218653 AB17Body 195895 TH2 195895 AB10……,倒排文檔:從數(shù)據(jù)庫全部記錄的基本字段中,按照著者、主題、分類等提取出所有的檢索詞,分

13、別按字順排列而重新形成的索引文檔。如下圖:,,計算機信息檢索發(fā)展階段,脫機檢索階段(1954-1964)聯(lián)機檢索階段(1965-1971)國際聯(lián)機檢索階段(1972-1994)網(wǎng)絡信息檢索階段(1995-),,脫機檢索(off-line retrieval),是六十年代發(fā)展起來的批次檢索,用戶不與檢索系統(tǒng)發(fā)生直接聯(lián)系,只需把檢索要求送往檢索中心,由檢索人員在計算機主機旁進行文獻檢索的一種方式。優(yōu)點:價格便宜,無網(wǎng)絡通訊費,檢索費

14、用由用戶平攤,隨機存儲。缺點:一次機會檢索,檢索結果延誤,委托性檢索。,,聯(lián)機檢索(on-line retrieval),聯(lián)機檢索是用戶利用終端設備,通過通信網(wǎng)絡或通信線路與檢索系統(tǒng)聯(lián)機,進行“人機對話”,從檢索中心的數(shù)據(jù)庫查找所需要的文獻信息過程。特點:檢索的速度快,檢索結果可以得到及時修改。缺點:檢索費用高,專業(yè)人員檢索。,,,國際聯(lián)機檢索(international on-line retrieval),該系統(tǒng)是70年代出現(xiàn)

15、的一門現(xiàn)代化情報檢索手段,目前已發(fā)展到相當高的水平,計算機聯(lián)機網(wǎng)絡和檢索終端已遍及世界所有主要國家和地區(qū)。特點:(1)可以實現(xiàn)資源共享;(2)檢索速度快;(3)信息資源專業(yè)化;(4)查全率和查準率較高。,,,世界上著名的國際聯(lián)機檢索系統(tǒng),1.DIALOG:世界上規(guī)模最大的聯(lián)機檢索系統(tǒng),有900多個數(shù)據(jù)庫,其中廣泛使用的有600多個,內(nèi)容涉及多個學科領域,文獻存儲量超過3億篇。2.ORBIT:提供專利、化學、能源、市場、工程

16、和電子等方面的信息,約有100個數(shù)據(jù)庫。3.BRS:內(nèi)容涉及醫(yī)學、生物科學、教育、健康、物理和社會科學及其它綜合性學科。有150個數(shù)據(jù)庫和40個私用數(shù)據(jù)庫。,,,世界上著名的國際聯(lián)機檢索系統(tǒng),4.OCLC:聯(lián)機計算機圖書館中心,是世界上最大的為讀者提供文獻信息機構。有60個數(shù)據(jù)庫,提供會議錄、工業(yè)通告、圖書評論等信息。5.STN:有聯(lián)邦德國、美國、日本共同合作創(chuàng)建的數(shù)據(jù)庫,有110個數(shù)據(jù)庫,多個數(shù)據(jù)庫向中國免費服務。6.DI

17、MDI:德國醫(yī)學文獻資料學會于1969年推出的聯(lián)機檢索系統(tǒng)。有55個數(shù)據(jù)庫,側(cè)重于提供生命科學領域資料。如:生物化學、腫瘤學、公共衛(wèi)生、海洋生物學、獸醫(yī)學、食品科學等。,光盤數(shù)據(jù)庫檢索,光盤 是80年代發(fā)展起來的激光存儲載體,繼紙張感光材料、磁性載體之后問世的又一種新型的信息存儲介質(zhì)。能存儲數(shù)據(jù)、文字、圖形、圖像、聲音、動畫等各種信息。一張普通的光盤、信息存儲量約為550兆。光盤的分類:按存儲方式分為 (1

18、)只讀型光盤:CD-ROM (2)寫讀光盤:WORM (3)可擦寫型光盤:ERM,,光盤數(shù)據(jù)庫檢索的類型,單機版局域網(wǎng)絡版 Web server 版,光盤檢索的定義和特點,特點: (1)投資成本低; (2)價格低; (3)運行速度快; (4)檢索效果好; (5)下載方便;

19、 (6)安全性能高。,,光盤檢索的系統(tǒng)組成,單機光盤檢索系統(tǒng)組成: (1)數(shù)據(jù)庫:光盤 (2)軟件:系統(tǒng)軟件和檢索軟件 (3)硬件:計算機、光盤驅(qū)動器、顯示屏、打印機等網(wǎng)絡光盤檢索系統(tǒng)組成: (1)光盤塔(光盤庫、磁盤陣列、鏡像站) (2)光盤組網(wǎng)軟件 (3)光盤塔服務器,,計算機信息檢索技術,1.布爾邏輯檢索2.截詞檢索3.位置運算檢索4.限定檢索,,,1.布爾邏輯檢索,在檢索過程中用于

20、表達詞于詞之間的邏輯關系的算符就稱為布爾邏輯運算符。分為三種邏輯關系:邏輯與、邏輯或、邏輯非;分別用AND、 OR、 NOT表示。,,邏輯與(and),A AND B:檢索詞A和檢索詞B同時出現(xiàn)在一條記錄中。其作用是縮小檢索范圍,提高查準率。,例如 查找韶關學院學生會有關情況資料:   韶關學院 and 學生會,,邏輯或(or),A OR B:記錄中出現(xiàn)檢索詞A或檢索詞B或兩詞同時出現(xiàn)在一條記錄中。其作用是擴大檢索范圍,提高查全率

21、,例如查圖書館利用博客開展信息服務的文章:  ?。ú┛?or Blog or 網(wǎng)絡日志)and 圖書館,,邏輯非(not),A NOT B:記錄必須包含檢索詞A但不能包含檢索詞B。即在含有A檢索詞的文獻中去除含有B檢索詞的文獻。其作用是縮小檢索范圍,提高查準率。,,例如查找有關中國地質(zhì)大學(武漢)的研究生招生目錄: 中國地質(zhì)大學 not 北京 and 研究生 and 招生簡章,,運算順序,布爾邏輯算符的運算次序:NOT

22、 > AND > OR( )號里的部分運算優(yōu)先,例如查找網(wǎng)絡信息檢索方面的文獻,信息檢索 and (網(wǎng)絡 not 計算機),2.截詞檢索,截詞檢索就是把檢索詞截斷,取其中的一部分,在加上截詞符號一起進行檢索。主要用于檢索詞的單復數(shù)、詞性的詞尾變化、詞根相同的一類詞,以及同一詞的拼法變異等。 通用的截詞符有:?和*,,截詞,截詞符無限截斷:* 或 # * 代表兩個或兩個以上字母有限截斷:?

23、 ?代表一個字母;如:child*,可查到child, children, childish, childhood 等所有以child開頭的單詞。 按截斷的位置不同又分為左截斷、右截斷和中間截斷,如:??學院 左截斷,3.位置運算檢索,用鄰近運算符連接兩個檢索詞進行檢索。它表示要求兩個檢索詞同時出現(xiàn)在同一記錄中,兩詞的相互位置必須符合規(guī)定的相鄰度才能被命中檢出。 鄰近運算

24、符:with (W)、nWords (nW)、near (N)、nNear (nN)等 with:連接兩個詞檢索,詞的順序不能調(diào)換,凡是在同一記錄的同一字段中出現(xiàn)兩個詞; near:兩個詞在同一個句子中出現(xiàn),詞的順序可以及調(diào)換?!?如:CD(W)ROM library (2N) literacy,,4.限定檢索,字段限制限制符包括“ in, =,>, <”等對特定字段進行限

25、制檢索,如年份限制檢索、語種限制檢索、文獻類型限制檢索等。如:English in LA:要求檢索的文獻為英文文獻。,(1)篇名內(nèi)檢索:WTO in ti(2)文摘內(nèi)檢索: 大學圖書館 in ab(3)出版年份(限制性字段)檢索:2005 in py 出版年份的限制除可用“in”之外,還可用>、=、=1996(5)作者的限制檢索:bush in au,字段限定檢索舉例,(6)出版類型(限制性字段)的限制檢索:re

26、view in pt; pt=editorial(7)著者通訊地址檢索:nanchang university in ad(8)文獻標識(限制性字段)限制檢索:information literacy in ab如利用維普數(shù)據(jù)庫查有關企業(yè)的結構調(diào)整方面論文: TI = 企業(yè) and  KY = 結構調(diào)整,字段限定檢索,檢索步驟,1.根據(jù)課題內(nèi)容,選擇合適數(shù)據(jù)庫,并確定檢索途徑;2.分析課題內(nèi)容,進行概念分析,提煉出主題

27、概念,擬出檢索詞,轉(zhuǎn)換成系統(tǒng)采用的檢索標識,準備若干自由詞備用;3.用邏輯運算符構造提問表達式;4.進行檢索,對檢出文獻進行相關性分析、評價;5.必要時對檢索詞或檢索式進行修改,直至檢出結果符合要求;6.查找原文。,,檢索實例,例1檢索艾滋病治療近十年國內(nèi)外研究進展(1)分析課題內(nèi)容,選擇相關數(shù)據(jù)庫國內(nèi):CBMdisc(1996-2006);國外:Medline(1996-2006);AIDSline(1996-2000)

28、采用主題途徑和自由詞途徑檢索(2)提煉主題概念:艾滋病(AIDS)/治療(therapy)艾滋病又稱為獲得性免疫缺陷綜合癥(acquired immunodeficiency syndrome) (2)(3)列出檢索表達式: (獲得性免疫缺陷綜合癥 OR 艾滋病 OR AIDS)and 治療(4)瀏覽檢索結果,修改檢索式:綜述 in pt(5)重新檢索(6)查找原文,,中國農(nóng)村勞動力向城市轉(zhuǎn)移的經(jīng)濟與社會影響檢索目

29、的:寫paper,查找參考文獻學科:經(jīng)濟學、社會學數(shù)量:幾篇即可文種:英文年代范圍:1999年以后數(shù)據(jù)庫: EBSCO ,Academic Research Library是否需要全文:是,中國農(nóng)村勞動力向城市轉(zhuǎn)移的經(jīng)濟與社會影響檢索詞China rural or peasant?migrant or migrants or migrationsocial impact or economic impact檢索

30、技術的運用布爾邏輯 China*(rural+peasant)截詞檢索 migrant#字段限制檢索 impact in ti,檢索結果的反饋調(diào)整,擴大檢索范圍的措施降低檢索詞的專指度,可從詞表或檢出文獻中選擇泛指詞。如:公共圖書館改為圖書館調(diào)節(jié)檢索式的網(wǎng)羅度,如刪除某個不重要的檢索詞。 education and teen-age改為education進行族性檢索,可用分類號或用OR連接一組同

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論