版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、<p> 高校圖書館流通數(shù)據(jù)挖掘的新思路</p><p> 〔摘要〕圖書館流通數(shù)據(jù)是圖書館業(yè)務(wù)流程優(yōu)化的重要依據(jù)之一,對(duì)其分析方法層出不窮,但用于指導(dǎo)圖書館實(shí)踐活動(dòng)的甚少。本文通過參考與借鑒情報(bào)學(xué)基本定律與分析方法,重新定義并建立基于圖書借閱頻次的評(píng)價(jià)指標(biāo),即圖書半衰期、圖書集合普賴斯指數(shù)、圖書滯架指數(shù)、圖書h指數(shù),以及基于讀者借閱次數(shù)與行為的分析方法,即讀者h(yuǎn)指數(shù)等指標(biāo)和圖書耦合/共現(xiàn)網(wǎng)絡(luò)模型,從
2、而提高對(duì)高校圖書館流通數(shù)據(jù)的分析能力和組織能力,希冀為優(yōu)化采購(gòu)和布局配置,向讀者提供積極、主動(dòng)、個(gè)性化信息服務(wù)提供新的思路。 </p><p> 〔關(guān)鍵詞〕OPAC數(shù)據(jù);流通數(shù)據(jù);高校圖書館;評(píng)價(jià)指標(biāo) </p><p> DOI:10.3969/j.issn.1008-0821.2013.10.033 </p><p> 〔中圖分類號(hào)〕G251.5〔文獻(xiàn)標(biāo)識(shí)碼
3、〕A〔文章編號(hào)〕1008-0821(2013)10-0143-06 </p><p> 圖書館借閱信息是伴隨著圖書館門戶公開化而誕生的副產(chǎn)品,但其在館藏采購(gòu)、館藏管理、讀者需求分析等方面具有不可忽視的作用。隨著圖書館資源和管理數(shù)字化進(jìn)程加快,每日都會(huì)從圖書館管理系統(tǒng)中產(chǎn)生龐雜的表單信息,如何讓信息從無序到有序,便于從中了解讀者借閱興趣與傾向、館藏圖書的利用率,有必要對(duì)流通數(shù)據(jù)進(jìn)行深度剖析。但是對(duì)于借閱數(shù)據(jù)的深度
4、挖掘停留在研究層面的較多,付諸指導(dǎo)圖書館實(shí)踐的較少,為了避免陷入數(shù)據(jù)豐富但信息貧乏的尷尬局面,圖書館有必要增強(qiáng)對(duì)流通數(shù)據(jù)的分析能力和組織能力,并以此為客觀依據(jù),向讀者提供積極、主動(dòng)、個(gè)性化信息服務(wù),這也與泛在圖書館所要求打破被動(dòng)服務(wù)壁壘,提高以讀者驅(qū)動(dòng)為導(dǎo)向的主動(dòng)服務(wù)意識(shí)的宗旨相一致[1-2]。 </p><p> 1圖書館借閱數(shù)據(jù)利用現(xiàn)狀 </p><p> 目前國(guó)內(nèi)外學(xué)者對(duì)于圖書館
5、流通數(shù)據(jù)的分析主要從以下4個(gè)方面開展: </p><p> 1.1利用統(tǒng)計(jì)學(xué)概念分析借閱數(shù)據(jù) </p><p> 制定若干統(tǒng)計(jì)指標(biāo)對(duì)圖書館流通數(shù)據(jù)進(jìn)行頻次分析是最常見也是最簡(jiǎn)便的方法,且統(tǒng)計(jì)結(jié)果具有一定參考價(jià)值。如對(duì)圖書館流通數(shù)據(jù)中的宏觀人次、書次指標(biāo)進(jìn)行統(tǒng)計(jì),可以了解館藏利用和讀者用書的總體狀況;對(duì)個(gè)人借書、單本圖書借閱指標(biāo)進(jìn)行統(tǒng)計(jì),能夠揭示不同讀者借閱特點(diǎn)和各類圖書的利用率;對(duì)高校
6、范圍內(nèi)(非)出版物的引文進(jìn)行統(tǒng)計(jì),可以直觀得出本館館藏對(duì)校內(nèi)讀者的滿足率[3-5]。 </p><p> 1.2采用數(shù)據(jù)挖掘技術(shù)進(jìn)行讀者需求分析 </p><p> 大多數(shù)圖書館管理系統(tǒng)都是事務(wù)處理型[6],主要應(yīng)用于日常業(yè)務(wù)操作,而數(shù)據(jù)倉(cāng)庫(kù)是分析處理型,能夠從無序數(shù)據(jù)流中挖掘出讀者和圖書館員感興趣的信息:如建立一種基于模式識(shí)別中Mercer核聚類算法的自動(dòng)分類和統(tǒng)計(jì)分析法,按照中圖法
7、22個(gè)大類對(duì)館藏圖書類型和借閱記錄進(jìn)行量化編碼,實(shí)現(xiàn)讀者群分類以及對(duì)讀者借閱文獻(xiàn)類型、流量進(jìn)行實(shí)時(shí)監(jiān)測(cè)和統(tǒng)計(jì)[7];或建立事務(wù)數(shù)據(jù)庫(kù),基于Apriori算法[8-9]、改進(jìn)算法FP-Growth[10]、鄰接矩陣[11]等挖掘圖書借閱數(shù)據(jù)的關(guān)聯(lián)規(guī)則,進(jìn)而構(gòu)建各學(xué)科書籍之間的關(guān)聯(lián)度以及讀者對(duì)圖書信息資源的借閱模式[12-14]。 </p><p> 1.3利用聚類法對(duì)讀者和圖書進(jìn)行細(xì)分 </p>&
8、lt;p> 有學(xué)者利用Clementine兩步聚類模型對(duì)高校讀者進(jìn)行聚類分析,將其分為積極型、一般型和消極型3類[15],或利用系統(tǒng)聚類算法建立圖書館讀者細(xì)分模型[16-17],并針對(duì)不同類型的讀者開展個(gè)性化服務(wù),如制定不同借閱規(guī)則、賦予不同借閱權(quán)限;或利用K-means算法分別對(duì)圖書和讀者進(jìn)行了聚類,從中分析圖書的借閱規(guī)律、讀者借閱圖書的某種傾向及讀者是否活躍,從而制定出相應(yīng)的決策,以便有針對(duì)性地豐富館藏資源和優(yōu)化館藏布局,并
9、為圖書館開展個(gè)性化服務(wù)提供參考[18-19]。 </p><p> 1.4借鑒情報(bào)學(xué)評(píng)價(jià)指標(biāo)分析流通數(shù)據(jù) </p><p> 由美國(guó)學(xué)者Hirsh J提出的h指數(shù)最初用于評(píng)價(jià)科學(xué)家個(gè)人的學(xué)術(shù)成就[20],隨后經(jīng)過多位學(xué)者在實(shí)證研究和理論分析基礎(chǔ)上進(jìn)行擴(kuò)展和延伸,h指數(shù)被成功應(yīng)用到學(xué)術(shù)期刊評(píng)價(jià)、學(xué)術(shù)機(jī)構(gòu)評(píng)價(jià)和專利質(zhì)量評(píng)估等方面[21-22],而h指數(shù)的思想與方法在圖書管理中也值得借鑒。國(guó)
10、內(nèi)有學(xué)者利用評(píng)價(jià)指標(biāo)h指數(shù)分析圖書借閱數(shù)據(jù),統(tǒng)計(jì)分析讀者群h指數(shù)與圖書集合h指數(shù),揭示不同讀者群的借閱活躍度、不同圖書集合的核心讀者以及不同讀者群的核心圖書,客觀反應(yīng)圖書利用狀況和讀者借閱情況,體現(xiàn)圖書集合和讀者群的個(gè)性化特點(diǎn)[23];由于h指數(shù)具有測(cè)算時(shí)間區(qū)域的敏感性,還可用于監(jiān)測(cè)圖書集合隨時(shí)間變化其借閱指標(biāo)的波動(dòng)情況[24]。 </p><p> 以上用于流通數(shù)據(jù)分析的方法各有利弊:基于統(tǒng)計(jì)學(xué)的頻次排序法雖
11、然能夠揭示最熱門圖書和讀者信息,但圖書副本數(shù)、新舊程度、排架位置、讀者借閱權(quán)限等因素都會(huì)干擾統(tǒng)計(jì)結(jié)果,且無法在圖書集合或讀者群之間進(jìn)行客觀比較;利用數(shù)據(jù)挖掘技術(shù)、聚類算法和關(guān)聯(lián)分析挖掘讀者借閱模式、不同學(xué)科圖書間關(guān)聯(lián)以及細(xì)分讀者類型等,對(duì)于圖書館員的技術(shù)背景、操作規(guī)范上有較高要求,結(jié)果受人為參數(shù)設(shè)定影響較大,且不夠直觀;而借鑒h指數(shù)對(duì)圖書借閱數(shù)據(jù)進(jìn)行分析,將圖書集合和讀者群視為評(píng)價(jià)對(duì)象,客觀比較圖書集合和讀者群之間差異,且對(duì)特定時(shí)間段的
12、波動(dòng)較為敏感,但其在館藏老化進(jìn)度、剔舊選擇、排架優(yōu)化等管理方面難以提供建設(shè)性意見,所以希望找出操作簡(jiǎn)便、通用性強(qiáng),同時(shí)具有直觀性與客觀性的分析方法。 </p><p> 2情報(bào)學(xué)基本定律橫向移植的可行性分析 </p><p> 筆者認(rèn)為,圖書與期刊文獻(xiàn)作為信息和知識(shí)的載體,在利用與傳播的過程中具有相似的特征:隨著新知識(shí)的涌現(xiàn),期刊文獻(xiàn)與圖書普遍存在老化現(xiàn)象,文獻(xiàn)的老化可以根據(jù)利用率和被
13、引頻次來測(cè)算,圖書的老化則可以通過借閱頻次和趨勢(shì)來反映,此外,同被引聚類分析是把若干文獻(xiàn)看作是具有相同屬性的集合,中圖分類法也是將主題相似的圖書歸為一類;讀者與文獻(xiàn)同樣也具有相似特征,讀者每次借閱的圖書可以反映出借閱傾向,則圖書可看作是讀者借閱行為的基本元素,而文章所提供的關(guān)鍵詞能夠體現(xiàn)文章主體思想,則關(guān)鍵詞可看作是文章的基本知識(shí)單元[25],關(guān)鍵詞具有詞耦合與詞共現(xiàn)現(xiàn)象,那么可以假設(shè)圖書借閱也有對(duì)應(yīng)的圖書耦合與圖書共現(xiàn)情況,所以我們認(rèn)
14、為適用于文獻(xiàn)信息的相關(guān)定律在圖書借閱中也可參照借鑒,甚至可以建立適用于圖書的老化定律、學(xué)科圖書半衰期和圖書普賴斯指數(shù)、館藏圖書滯架指數(shù)、圖書集合h指數(shù)、讀者群h指數(shù)、圖書借閱耦合/共現(xiàn)模型等分析方法和評(píng)價(jià)指標(biāo),為館藏圖書管理、讀者需求分析與服務(wù)提供新的解決思路。 3基于圖書被借的指標(biāo)研究 </p><p> 3.1圖書老化規(guī)律研究 </p><p> 圖書館大部分館藏文獻(xiàn)是在逐漸
15、老化的,其利用率極低,這主要是圖書館文獻(xiàn)對(duì)讀者而言缺乏新穎性、針對(duì)性和實(shí)用性造成的,老化圖書不僅占據(jù)了圖書館有限的閱覽空間,加大了管理成本,而且給讀者查找圖書帶來不便,甚至影響到了圖書館的工作效率與窗口形象,所以及時(shí)剔除老化文獻(xiàn)、吐故納新是保持圖書館旺盛生命力的重要環(huán)節(jié)。圖書文獻(xiàn)的老化可以利用絕對(duì)流通量、平均利用率等指標(biāo)來測(cè)度,但以單本圖書為研究對(duì)象或把所有圖書均一化看待的方法容易造成唯新是從的現(xiàn)象,而根據(jù)文獻(xiàn)26的研究結(jié)果[26],每
16、種館藏圖書從入藏至完全失去使用價(jià)值時(shí)的平均借閱次數(shù)S=K/b,K表示抽樣當(dāng)年每種圖書的利用次數(shù),b為一常數(shù),可見館藏圖書利用率與統(tǒng)計(jì)當(dāng)年每種圖書的利用次數(shù)正相關(guān),所以頻繁采購(gòu)?fù)愋?、相似?nèi)容圖書是促進(jìn)圖書老化的重要因素之一。筆者認(rèn)為只有研究不同類型圖書的老化趨勢(shì)與特點(diǎn),優(yōu)化采購(gòu)配置,才能真正提高高校圖書館的文獻(xiàn)利用率。 </p><p> 3.2學(xué)科圖書半衰期 </p><p> 19
17、60年,巴爾頓和開普勒提出了文獻(xiàn)情報(bào)的半衰期概念[27]:某學(xué)科或?qū)I(yè)現(xiàn)今仍在利用的全部文獻(xiàn)中較新的一半是在多長(zhǎng)一段時(shí)間內(nèi)發(fā)表的(共時(shí)半衰期),與該學(xué)科一半文獻(xiàn)失效所經(jīng)歷時(shí)間相當(dāng)(歷時(shí)半衰期)。也可借鑒文獻(xiàn)半衰期的概念定義學(xué)科圖書半衰期:特定統(tǒng)計(jì)時(shí)間段內(nèi),某學(xué)科或主題圖書集合仍在流通(包括借閱與歸還)的全部圖書中教新的一半是在多長(zhǎng)時(shí)間內(nèi)出版的(共時(shí)半衰期);某學(xué)科或主題圖書集合一半圖書失去使用價(jià)值,即不再流通所經(jīng)歷的時(shí)間(歷時(shí)半衰期)。
18、并且可以利用作圖法(所有測(cè)試數(shù)據(jù)均取自于北京大學(xué)醫(yī)學(xué)圖書館Unicorn系統(tǒng)),以某學(xué)科圖書出版年為橫坐標(biāo),統(tǒng)計(jì)時(shí)間段內(nèi)被借閱累積頻次或累積百分比為縱坐標(biāo),繪制學(xué)科圖書共時(shí)半衰期圖(圖1);以圖書被借閱年代為橫坐標(biāo),統(tǒng)計(jì)截止時(shí)間之前被借閱累積頻次或累積百分比為縱坐標(biāo),繪制學(xué)科圖書歷時(shí)半衰期圖(圖2),其中累積百分比達(dá)到50%的點(diǎn)所對(duì)應(yīng)橫坐標(biāo),即為半衰期觀測(cè)點(diǎn),從圖1和圖2可以大致估算出R36病理學(xué)類圖書的半衰期為8年。1圖1R36類圖書
19、共時(shí)半衰期圖1 </p><p> 1圖2R36類圖書歷時(shí)半衰期圖1 </p><p> 3.3圖書普賴斯指數(shù) </p><p> 普賴斯指數(shù)是度量文獻(xiàn)老化速度與程度的指標(biāo),在文獻(xiàn)計(jì)量學(xué)研究中,普賴斯將被引文獻(xiàn)分成有現(xiàn)時(shí)作用的文獻(xiàn)和檔案性文獻(xiàn),前者是指文獻(xiàn)在其出版的5年內(nèi)被引用,后者則是指出版5年后仍被引用,現(xiàn)時(shí)作用的文獻(xiàn)在總文獻(xiàn)中的比值即為普賴斯指數(shù),可見普
20、賴斯指數(shù)越大,該學(xué)科文獻(xiàn)老化越快。借鑒普賴斯指數(shù)的機(jī)理,定義學(xué)科圖書普賴斯指數(shù):某統(tǒng)計(jì)時(shí)間段內(nèi)某類被借閱的圖書(如R4類圖書)中出版不超過X年的圖書數(shù)量占全部被借閱圖書的比例。其中X的確定,應(yīng)以特定圖書館某統(tǒng)計(jì)時(shí)間段內(nèi)所有流通的圖書為大樣本,統(tǒng)計(jì)較新的一半圖書的最早出版年代,則當(dāng)前統(tǒng)計(jì)時(shí)間與其差值為X。該指標(biāo)還適用于其他圖書集合,如特定出版社的圖書、特定作者出版的圖書等。 </p><p> 3.4館藏圖書滯架
21、時(shí)限 </p><p> 隨著館藏圖書老化,圖書的利用率和借閱量降低,這不僅占據(jù)了有限的借閱空間,而且增加了管理成本和難度,故大部分高校圖書館都會(huì)定期進(jìn)行剔舊工作,但剔舊并不完全等同于剔除陳舊或破損的圖書。美國(guó)圖書館專家特魯斯威爾提出了藏書利用的二八法則:在圖書館的全部藏書中大約有20%的圖書能夠滿足近80%讀者的需求,而其余80%的圖書僅能夠滿足20%讀者的需求。因此,剔除利用率低的圖書才是館藏剔舊的重點(diǎn),而
22、研究表明,滯架時(shí)限是衡量館藏利用率和剔舊數(shù)量的最佳指標(biāo)[28]。滯架時(shí)限指的是單本圖書最后流通時(shí)間(借閱日期或還書日期)與統(tǒng)計(jì)截止日期之間的差值,默認(rèn)圖書借閱時(shí)限為30天,并不可續(xù)借,滯架時(shí)限的統(tǒng)計(jì)區(qū)間為0~11個(gè)月(如表1)。 </p><p> 3.5學(xué)科圖書h指數(shù) </p><p> h指數(shù)是J.E.Hirsh于2005年提出的一項(xiàng)旨在評(píng)價(jià)科學(xué)家個(gè)人績(jī)效的指標(biāo),其定義為[20]:
23、將科學(xué)家S發(fā)表的論文按照被引次數(shù)從高到低的順序排列,相同被引次數(shù)的論文具有不同的序列號(hào),當(dāng)且僅當(dāng)前h篇論文每篇論文的被引次數(shù)至少為h,同時(shí)第h+1篇論文的被引次數(shù)小于h+1時(shí),則科學(xué)家S的h指數(shù)值為h。通過上文的可行性分析,我們認(rèn)為特定類型的圖書集合也可以有“h指數(shù)”:將某時(shí)間段內(nèi)某主題圖書(如中圖法R322)按照借閱頻次進(jìn)行排序(多副本圖書采用借閱頻次/副本數(shù)的值作為的相對(duì)借閱頻次),相同借閱次數(shù)的圖書具有不同序號(hào)(按照出版時(shí)間倒序排
24、列),形成圖書數(shù)量與借閱頻次的數(shù)據(jù)序列,參照h指數(shù)原定義,當(dāng)且僅當(dāng)前h本圖書每本借閱頻次至少為h,同時(shí)第h+1本書借閱頻次小于h+1時(shí),該主題圖書的h指數(shù)為h。如表2所示,統(tǒng)計(jì)時(shí)間段內(nèi),某類圖書至少有4本被至少借閱4次,則該類圖書的h指數(shù)為4,那么可以確定該類圖書中借閱頻次大于等于4的為核心圖書。此外,時(shí)間段可以設(shè)定為年度、學(xué)期、月份,從而揭示特定時(shí)期的借閱需求特征,甚至可以制定圖書與時(shí)間的關(guān)聯(lián)規(guī)則,在圖書管理系統(tǒng)中進(jìn)行薦閱與提示。&l
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 高校圖書館管理的創(chuàng)新思路初探
- 信息時(shí)代圖書館發(fā)展的新思路
- 圖書館系統(tǒng)數(shù)據(jù)挖掘
- 圖書館辦公室的創(chuàng)新管理新思路
- 圖書館辦公室的創(chuàng)新管理新思路
- 高校圖書館數(shù)據(jù)挖掘系統(tǒng)的設(shè)計(jì)與開發(fā)
- 數(shù)據(jù)挖掘技術(shù)在高校圖書館中的應(yīng)用.pdf
- 探尋公共圖書館現(xiàn)代科普工作新思路
- 基于數(shù)據(jù)挖掘的j高校圖書館圖書管理創(chuàng)新研究
- 高校圖書館圖書流通服務(wù)問題分析與對(duì)策
- 淺談圖書館流通圖書的保護(hù)
- 基于借閱流通數(shù)據(jù)的高校圖書館紙質(zhì)館藏資源利用研究.pdf
- 大流通環(huán)境下高校圖書館管理研究
- 基于數(shù)據(jù)挖掘的高校圖書館借閱數(shù)據(jù)特性分析與應(yīng)用.pdf
- 公共圖書館外文讀者服務(wù)活動(dòng)新思路探究
- 數(shù)據(jù)挖掘在高校圖書館服務(wù)中的應(yīng)用研究.pdf
- 淺議圖書館大流通
- 圖書館在中職教學(xué)中的作用及發(fā)展新思路
- 數(shù)據(jù)挖掘在數(shù)字圖書館的應(yīng)用.pdf
- 基于數(shù)據(jù)挖掘的高校圖書館館藏推薦系統(tǒng)模型研究.pdf
評(píng)論
0/150
提交評(píng)論