版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、,提 問(wèn) 1 試解釋信息檢索系統(tǒng)的內(nèi)涵。 2 什么是”評(píng)價(jià)”?,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.1 評(píng)價(jià)研究概述,一、意義評(píng)價(jià)(Evaluation):發(fā)現(xiàn)和收集關(guān)于某種活動(dòng)的數(shù)據(jù),從中判斷該項(xiàng)活動(dòng)的質(zhì)量及達(dá)到預(yù)期目標(biāo)程度的行為。 簡(jiǎn)單地說(shuō),評(píng)價(jià)就是對(duì)系統(tǒng)的價(jià)值和效率進(jìn)行測(cè)評(píng)。信息檢索系統(tǒng)評(píng)價(jià):根據(jù)給定的指標(biāo)體系,采用一定的方法和程序,對(duì)信息檢索系統(tǒng)的功能、特性和運(yùn)營(yíng)狀況進(jìn)行評(píng)測(cè),或?qū)?/p>
2、有關(guān)假設(shè)、預(yù)期效益、性能值進(jìn)行驗(yàn)證,以確定系統(tǒng)達(dá)到了何種水平、投入成本是否值得、是否可以改進(jìn)和如何改進(jìn),乃至系統(tǒng)是否應(yīng)生存下去。,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.1 評(píng)價(jià)研究概述,一、意義 信息檢索系統(tǒng)的評(píng)價(jià)研究,一直是信息檢索領(lǐng)域的一項(xiàng)重要研究?jī)?nèi)容。多年來(lái)人們進(jìn)行了大量的評(píng)價(jià)試驗(yàn)和多角度的探索。 原因在于,檢索系統(tǒng)評(píng)價(jià)工作在為研究者驗(yàn)證檢索系統(tǒng)效益、比較各種檢索技術(shù)的優(yōu)劣、改進(jìn)現(xiàn)有檢索系
3、統(tǒng)、開(kāi)發(fā)新的應(yīng)用領(lǐng)域等方面,都具有不可替代的作用。,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.1 評(píng)價(jià)研究概述,一、意義主要意義:了解已有檢索系統(tǒng)的功能,找出缺陷并改進(jìn);比較各種檢索系統(tǒng)的優(yōu)劣;提高提高效率和效益;有助于新的檢索系統(tǒng)的設(shè)計(jì);豐富信息檢索的理論。,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.1 評(píng)價(jià)研究概述,二、評(píng)價(jià)范圍與類(lèi)型 信息檢索系統(tǒng)是一個(gè)有眾多功能模塊組成的集合體。 評(píng)價(jià)可以從
4、不同角度、基于不同目的和方法來(lái)進(jìn)行。? 評(píng)價(jià)范圍:各種類(lèi)型的檢索系統(tǒng)及組成要素。? 評(píng)價(jià)類(lèi)型: ? 宏觀評(píng)價(jià):著眼于檢索系統(tǒng)的宏觀方面,如情報(bào)源類(lèi)型、系統(tǒng)結(jié)構(gòu)、收錄范圍、利用率等。 ? 個(gè)別評(píng)價(jià):僅對(duì)系統(tǒng)的某一性能、功能進(jìn)行評(píng)價(jià)。 ? 性能評(píng)價(jià)(performance evaluation):面向用戶(hù)的評(píng)價(jià),測(cè)定檢索系統(tǒng)的質(zhì)量或服務(wù)效果。也稱(chēng)為檢索效果評(píng)價(jià)(effectiveness evaluation)。,第十一章
5、 信息檢索系統(tǒng)評(píng)價(jià) 11.1 評(píng)價(jià)研究概述,二、評(píng)價(jià)范圍與類(lèi)型評(píng)價(jià)類(lèi)型: ? 效益評(píng)價(jià)(benefits evaluation):測(cè)定系統(tǒng)或用戶(hù)獲得的的經(jīng)濟(jì)效益和社會(huì)效益。 (有直接的、潛在的;難以直接計(jì)量) ? 費(fèi)用/效果評(píng)價(jià)(cost effectiveness evaluation):考察系統(tǒng)達(dá)到的性能與費(fèi)用消耗之間的關(guān)系。(用戶(hù)、系統(tǒng)兩方面) ? 費(fèi)用/效益評(píng)價(jià)(cost benefits evalua
6、tion):考察系統(tǒng)的服務(wù)效益與費(fèi)用消耗間的關(guān)系。(計(jì)量難度較大) (詳見(jiàn)P207的解釋),第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),一、評(píng)價(jià)指標(biāo)體系 要評(píng)價(jià)一個(gè)檢索系統(tǒng),必須有一套科學(xué)的評(píng)價(jià)標(biāo)準(zhǔn)。 建立檢索系統(tǒng)評(píng)價(jià)指標(biāo)體系應(yīng)遵循的原則:各指標(biāo)應(yīng)定義單一、明確,具有可操作性。評(píng)價(jià)指標(biāo)最好能夠量化或計(jì)量。指標(biāo)要完善、細(xì)致、全面。 下面給出傳統(tǒng)檢索系統(tǒng)評(píng)價(jià)指標(biāo)體系模型:(供參考),第十一章
7、 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),,逐一評(píng)價(jià)這些指標(biāo),可以判定檢索系統(tǒng)的優(yōu)劣。 其中,比較重要的是檢索性能指標(biāo)。,11.2 評(píng)價(jià)指標(biāo),問(wèn) 題:什么是查全率、查準(zhǔn)率?,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析1.查全率和查準(zhǔn)率查全率(Recall ratio,R):衡量一次檢索中與提問(wèn)相關(guān)的文獻(xiàn)有多少篇被檢出。(衡量檢出相關(guān)文獻(xiàn)的能力),第十一章 信息檢索系統(tǒng)評(píng)價(jià) 1
8、1.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析1.查全率和查準(zhǔn)率查準(zhǔn)率(Precision ratio,P):衡量被檢出的文獻(xiàn)中有多少篇與提問(wèn)相關(guān)。 (衡量檢索的精確度),第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析 例: 設(shè)某檢索系統(tǒng)的數(shù)據(jù)庫(kù)中共有相關(guān)文獻(xiàn)20篇。針對(duì)某一個(gè)提問(wèn),檢出文獻(xiàn)總數(shù)為30篇,其中相關(guān)文獻(xiàn)數(shù)為15篇。求查全率R、查準(zhǔn)率P。,,,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 1
9、1.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析 為便于分析,我們給出數(shù)學(xué)語(yǔ)言描述:設(shè)某文獻(xiàn)庫(kù)所存儲(chǔ)的文獻(xiàn)總量為L(zhǎng)。對(duì)某一給定提問(wèn), a—表示被檢出的與提問(wèn)相關(guān)的文獻(xiàn)數(shù);(前例 a=15) b—表示被檢出的與提問(wèn)無(wú)關(guān)的文獻(xiàn)數(shù);(誤檢,前例 b=15) c—表示與提問(wèn)相關(guān),但未被檢出的文獻(xiàn)數(shù)(漏檢,前例 c=5),,,,,,,顯然,Q=1-R,E=1-p,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.
10、2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析1.查全率和查準(zhǔn)率 下面討論與查全率、查準(zhǔn)率有關(guān)的幾個(gè)問(wèn)題。(1)查全率和查準(zhǔn)率的相互關(guān)系一個(gè)理想的檢索系統(tǒng),應(yīng)是R=1、P=1。 但實(shí)際上是不可能的。一般說(shuō)來(lái),二者之間存在著反變關(guān)系,即: 若要提高查全率,查準(zhǔn)率往往就會(huì)下降; 若要提高查準(zhǔn)率,查全率又就會(huì)下降。 (二者相互制約),,,,,,,第十一章 信
11、息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析(1)查全率和查準(zhǔn)率的相互關(guān)系R與P的關(guān)系可由下圖描述:(稱(chēng)為R—P圖),,,,,,,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析1.查全率和查準(zhǔn)率(2)影響查全率、查準(zhǔn)率的相關(guān)因素 ①文獻(xiàn)庫(kù)編制質(zhì)量 文獻(xiàn)收集是否齊全,索引體系是否完善,檢索途徑的多少,都會(huì)影響到查全率。 ②對(duì)情報(bào)需求的理解
12、要達(dá)到較高的查全率R和查準(zhǔn)率P,應(yīng)較好地理解情報(bào)需求,制定好檢索策略。,,,,,,,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析(2)影響查全率、查準(zhǔn)率的相關(guān)因素 ③檢索語(yǔ)言的一致性 檢索的實(shí)質(zhì)就是提問(wèn)標(biāo)識(shí)與文獻(xiàn)標(biāo)識(shí)的異同比較。 為此,需要不同人員表達(dá)文獻(xiàn)主題的語(yǔ)言一致,更需要標(biāo)識(shí)提問(wèn)與標(biāo)識(shí)文獻(xiàn)的語(yǔ)言一致。即,標(biāo)引語(yǔ)言和檢索語(yǔ)言的一致性,對(duì)查全和查準(zhǔn)起著支配作用。
13、 ④標(biāo)引的網(wǎng)羅性 對(duì)文獻(xiàn)主題分析得越透徹,抽出的檢索詞越多,檢索時(shí)可檢出的相關(guān)文獻(xiàn)就越多,即查全率越高。但檢出的文獻(xiàn)并非全部適用,因而查準(zhǔn)率降低。 反之,如果標(biāo)引時(shí)只標(biāo)出中心主題,檢出的文獻(xiàn)必然比較適用,即查準(zhǔn)率較高。但漏檢會(huì)增多,從而降低查全率。,,,,,,,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析(2)影響查全率、查準(zhǔn)率的相關(guān)因素 ⑤ 檢索詞的專(zhuān)指性
14、 檢索詞選得詞意越狹窄、越具體、越專(zhuān)深,檢出的文獻(xiàn)就會(huì)越對(duì)口,查準(zhǔn)率就越高。但命中文獻(xiàn)就越少,查全率就會(huì)降低。 相反,如果檢索詞定得較籠統(tǒng)、較寬泛,檢出的文獻(xiàn)就會(huì)增多,查全率會(huì)提高。但不相關(guān)的文獻(xiàn)也會(huì)增多,查準(zhǔn)率會(huì)降低。 ⑥ 檢索策略和提問(wèn)構(gòu)造 對(duì)檢索詞的選取,需恰當(dāng)?shù)卮_定網(wǎng)羅度和專(zhuān)指度。 當(dāng)采用布爾組配時(shí),若使用AND較多,即限制嚴(yán),則R下降,而P上升;反之,若使用OR較多,則R上
15、升,而P下降。,,,,,,,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析(2)影響查全率、查準(zhǔn)率的相關(guān)因素 ⑦ 檢索軟件的功能 檢索軟件功能是否完善,結(jié)構(gòu)是否合理,影響到是否會(huì)漏檢和誤檢。 ⑧ 檢索者的熟練程度 檢索人員的專(zhuān)業(yè)知識(shí)水平、使用系統(tǒng)的熟練程度,對(duì)R和P影響很大。往往是系統(tǒng)一方的檢索者自擬定檢索式時(shí)查準(zhǔn)率高,而檢索用戶(hù)編制檢索式時(shí),因不熟悉系統(tǒng)和不善于使
16、用系統(tǒng),就容易造成誤檢、漏檢。,,,,,,,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析 1.查全率和查準(zhǔn)率(3)對(duì)查全率和查準(zhǔn)率的要求 作為一個(gè)檢索系統(tǒng),應(yīng)同時(shí)具備較強(qiáng)的查全能力和查準(zhǔn)能力。但并不是每個(gè)用戶(hù)在任何時(shí)候都需要高查全率和高查準(zhǔn)率,不同用戶(hù)有不同要求。 通常,根據(jù)不同的情報(bào)需求,可分為四種要求: a.要求查全率R=1 如申請(qǐng)專(zhuān)利、發(fā)明或評(píng)定
17、某項(xiàng)成果,需要對(duì)世界范圍的有關(guān)情報(bào)作全面了解,才能作出客觀的評(píng)價(jià)。此時(shí)往往要求R=1的檢索。,,,,,,,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析(3)對(duì)查全率和查準(zhǔn)率的要求 b.要求較高查全率 例如編寫(xiě)教材、綜述某學(xué)科或技術(shù)領(lǐng)域的發(fā)展,往往需要較全面地獲得有關(guān)文獻(xiàn)或情報(bào)。此時(shí)對(duì)查全率有較高要求,但不一定要求R=1。 c.要求較高查準(zhǔn)率 例如要了
18、解某種具體產(chǎn)品的有關(guān)信息,解決某一具體問(wèn)題或查新等,往往只需了解某一方面或某一時(shí)期的有關(guān)情報(bào)。此時(shí)要求查準(zhǔn)率較高。,,,,,,,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析(3)對(duì)查全率和查準(zhǔn)率的要求 d.對(duì)查全率、查準(zhǔn)率無(wú)具體要求 有些情報(bào)需求,用戶(hù)本身不能作出確切表達(dá)。因此,用戶(hù)對(duì)查全率和查準(zhǔn)率也無(wú)法提出具體要求。 從上面的討論可以看出,在分析和評(píng)價(jià)某一檢索
19、的檢索質(zhì)量時(shí),不能千篇一律地追求查全率和查準(zhǔn)率,而應(yīng)具體問(wèn)題具體分析。,,,,,,,,二、主要性能指標(biāo)及分析2.響應(yīng)時(shí)間(response time) 對(duì)任何計(jì)算機(jī)應(yīng)用系統(tǒng),響應(yīng)時(shí)間都是一個(gè)重要指標(biāo)。 信息檢索的響應(yīng)時(shí)間可分為兩種情形: (1)委托檢索,表示從用戶(hù)送交提問(wèn)到收到檢索結(jié)果所花的時(shí)間; (2)非委托檢索,表示用戶(hù)實(shí)際的檢索時(shí)間。計(jì)算響應(yīng)時(shí)間一般都是針對(duì)某一個(gè)提問(wèn)而言,不同的提問(wèn)對(duì)應(yīng)的響應(yīng)時(shí)間
20、不同。(因提問(wèn)式長(zhǎng)短、復(fù)雜程度而不同) 有時(shí)給出平均響應(yīng)時(shí)間T。ti表示對(duì)第i個(gè)提問(wèn)的響應(yīng)時(shí)間,k為提問(wèn)個(gè)數(shù),,,,,,,,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),問(wèn) 題:檢索響應(yīng)時(shí)間與哪些因素有關(guān)?,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析 2.響應(yīng)時(shí)間 通過(guò)對(duì)檢索響應(yīng)時(shí)間的分析,我們可歸納出影響該指標(biāo)的因素: (1)文獻(xiàn)庫(kù)規(guī)模 規(guī)模
21、越大,檢索時(shí)間越長(zhǎng),響應(yīng)時(shí)間值也就越大。 (2)機(jī)器速度 主機(jī)運(yùn)行速度越快,響應(yīng)時(shí)間越短。 (3)檢索軟件 檢索軟件是關(guān)鍵,其性能越好,檢索時(shí)間就越短。,,,,,,,,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析2.響應(yīng)時(shí)間(4)存儲(chǔ)設(shè)備類(lèi)型和數(shù)據(jù)的存貯結(jié)構(gòu) 存儲(chǔ)設(shè)備的訪問(wèn)速度越快,數(shù)據(jù)的存貯結(jié)構(gòu)(外存貯)越合理,檢索越容易,響應(yīng)時(shí)間也就越短
22、。(5)提問(wèn)組配形式 檢索式的構(gòu)造需要有一定的專(zhuān)業(yè)技能和檢索經(jīng)驗(yàn),是一個(gè)不斷修改和完善的過(guò)程。(6)信息中心與檢索者的距離 通信傳輸時(shí)間與距離有關(guān)。,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析 3.存貯空間開(kāi)銷(xiāo) 包括系統(tǒng)所占用的內(nèi)存空間和外存空間。對(duì)內(nèi)存空間,當(dāng)檢索系統(tǒng)采用大、中型計(jì)算機(jī)時(shí),一般不必考慮;而當(dāng)系統(tǒng)采用小型、微型機(jī)時(shí),因內(nèi)存空間有限,就需合理分配。
23、對(duì)外存空間,不同的文檔結(jié)構(gòu)所需存儲(chǔ)空間差別很大。例如,順排文檔檢索和倒排文檔檢索所需空間不同;而對(duì)倒排檢索,系統(tǒng)僅提供布爾檢索功能與提供正文檢索功能相比,所需的空間也大不一樣。,,,,,,,,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析 4.其它指標(biāo) (1)新穎率(Novelty ratio,N):指一次檢索中檢出的相關(guān)文獻(xiàn)有多少篇是新文獻(xiàn)。(反映文獻(xiàn)庫(kù)更新程度)
24、 檢出的新的相關(guān)文獻(xiàn)量 N = ———————————— 檢出的相關(guān)文獻(xiàn)總量,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析4.其它指標(biāo)(2)信息收錄完備性(Coverage,C):也稱(chēng)收錄范圍,是指文獻(xiàn)庫(kù)復(fù)蓋的學(xué)科范圍、信息類(lèi)型、數(shù)量和時(shí)間跨度。 給定時(shí)間內(nèi)系統(tǒng)收錄的文獻(xiàn)總量 C =
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《信息檢索系統(tǒng)》方案
- 信息檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 信息檢索系統(tǒng)的算法庫(kù)研究.pdf
- 基于web的信息檢索系統(tǒng)的研究
- 基于ONTOLOGY的信息檢索系統(tǒng)的研究.pdf
- 專(zhuān)利信息檢索系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 基于分類(lèi)語(yǔ)義的Web信息檢索系統(tǒng).pdf
- 黃頁(yè)信息檢索系統(tǒng)的研究及實(shí)現(xiàn).pdf
- 基于本體的信息檢索系統(tǒng)模型研究.pdf
- 基于概念的企業(yè)信息檢索系統(tǒng).pdf
- 基于本體的信息檢索系統(tǒng)研究.pdf
- 智能信息檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于本體的消防信息檢索系統(tǒng)的研究.pdf
- 基于Ontology的智能信息檢索系統(tǒng)研究.pdf
- 基于詞關(guān)聯(lián)度的信息檢索系統(tǒng).pdf
- 基于本體的智能信息檢索系統(tǒng)的研究.pdf
- 基于GSM短消息平臺(tái)信息檢索系統(tǒng).pdf
- 基于最優(yōu)搜索理論的信息檢索系統(tǒng)的研究.pdf
- 基于分類(lèi)語(yǔ)義的Web信息檢索系統(tǒng)的研究.pdf
- Context-aware信息檢索系統(tǒng)的比較研究.pdf
評(píng)論
0/150
提交評(píng)論