版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、■收藏本站■聯(lián)系我們■域名主機(jī)網(wǎng)站首頁┊程序下載┊編程文檔┊電腦教程┊網(wǎng)站設(shè)計┊網(wǎng)址導(dǎo)航┊網(wǎng)絡(luò)文學(xué)┊游戲天地┊幽默笑話┊生活休閑┊月光論壇┊月光博客認(rèn)識搜索引擎認(rèn)識搜索引擎第一部分:搜索引擎發(fā)展史第二部分:搜索引擎原理第三部分:常用中英文搜索引擎指南第一部分:搜索引擎發(fā)展史第一部分:搜索引擎發(fā)展史1990年以前,沒有任何人能搜索互聯(lián)網(wǎng)。所有搜索引擎的祖先,是1990年由Montreal的McGillUniversity學(xué)生AlanEmt
2、age、PeterDeutsch、BillWheelan發(fā)明的Archie(ArchieFAQ)。雖然當(dāng)時WldWideWeb還未出現(xiàn),但網(wǎng)絡(luò)中文件傳輸還是相當(dāng)頻繁的,由于大量的文件散布在各個分散的FTP主機(jī)中,查詢起來非常不便,因此AlanEmtage等想到了開發(fā)一個可以用文件名查找文件的系統(tǒng),于是便有了Archie。Archie是第一個自動索引搜索。因?yàn)閅ahoo!的數(shù)據(jù)是手工輸入的,所以不能真正被歸為搜索引擎,事實(shí)上只是一個可搜索
3、的目錄。Werer只抓取URL,但URL信息含量太小,很多信息難以單靠URL說清楚,搜索效率很低。Yahoo!中收錄的網(wǎng)站,因?yàn)槎几接泻喗樾畔?,所以搜索效率明顯提高。(注:Yahoo以后陸續(xù)使用Altavista、Inktomi、Google提供搜索引擎服務(wù);2002年10月9日,Yahoo放棄自己的網(wǎng)站目錄默認(rèn)搜索,改為默認(rèn)Google的搜索結(jié)果,成為一個真正的搜索引擎。)1994年初,Washington大學(xué)CS學(xué)生BrianPin
4、kerton開始了他的小項(xiàng)目WebCrawler(BrianPinkertonAnnouncestheAvailabilityofWebcrawler)。1994年4月20日,WebCrawler正式亮相時僅包含來自6000個服務(wù)器的內(nèi)容。WebCrawler是互聯(lián)網(wǎng)上第一個支持搜索文件全部文字的全文搜索引擎,在它之前,用戶只能通過URL和摘要搜索,摘要一般來自人工評論或程序自動取正文的前100個字。(注:后來webcrawler陸續(xù)被
5、AOL和Excite收購,現(xiàn)在和excite一樣改用元搜索引擎Dogpile)Lycos(CarnegieMellonUniversityCenterfMachineTranslationAnnouncesLycos)是搜索引擎史上又一個重要的進(jìn)步。CarnegieMellonUniversity的MichaelMauldin將JohnLeavitt的spider程序接入到其索引程序中,創(chuàng)建了Lycos。1994年7月20日,數(shù)據(jù)量為5
6、4000的Lycos正式發(fā)布。除了相關(guān)性排序外,Lycos還提供了前綴匹配和字符相近限制,Lycos第一個在搜索結(jié)果中使用了網(wǎng)頁自動摘要,而最大的優(yōu)勢還是它遠(yuǎn)勝過其它搜索引擎的數(shù)據(jù)量:1994年8月--394000documents;1995年1月--1.5milliondocuments;1996年11月--over60milliondocuments。(注:1999年4月,Lycos停止自己的Spider,改由Fast提供搜索引擎服
7、務(wù))Infoseek(SteveKirschAnnouncesFreeDemosOftheInfoseekSearchEngine)是另一個重要的搜索引擎,雖然公司聲稱1994年1月已創(chuàng)立,但直到年底它的搜索引擎才與公眾見面。起初,Infoseek只是一個不起眼的搜索引擎,它沿襲Yahoo!和Lycos的概念,并沒有什么獨(dú)特的革新。但是它的發(fā)展史和后來受到的眾口稱贊證明,起初是否第一個登臺并不總是很重要。Infoseek的友善用戶界面、
8、大量附加服務(wù)(suchasUPStrackingNewsadirectythelike)使它聲望日隆。而1995年12月與scape的戰(zhàn)略性協(xié)議,使它成為一個強(qiáng)勢搜索引擎:當(dāng)用戶點(diǎn)擊scape瀏覽器上的搜索按鈕時,彈出Infoseek的搜索服務(wù),而此前由Yahoo!提供該服務(wù)。(注:Infoseek后來曾以相關(guān)性聞名,2001年2月,Infoseek停止了自己的搜索引擎,開始改用Overture的搜索結(jié)果)1995年,一種新的搜索引擎形
9、式出現(xiàn)了——元搜索引擎(AMetaSearchEngineRoundup)。用戶只需提交一次搜索請求,由元搜索引擎負(fù)責(zé)轉(zhuǎn)換處理后提交給多個預(yù)先選定的獨(dú)立搜索引擎,并將從各獨(dú)立搜索引擎返回的所有查詢結(jié)果,集中起來處理后再返回給用戶。第一個元搜索引擎,是Washington大學(xué)碩士生EricSelberg和enEtzioni的Metacrawler。(注:元搜索引擎概念上好聽,但搜索效果始終不理想,所以沒有哪個元搜索引擎有過強(qiáng)勢地位。)DE
10、C的AltaVista(2001年夏季起部分網(wǎng)友需通過proxy訪問,無proxy可用qbseach單選altavista搜索,只能顯示第一頁搜索結(jié)果)是一個遲到者,1995年12月才登場亮相(AltaVistaPublicBetaPressRelease)。但是,大量的創(chuàng)新功能使它迅速到達(dá)當(dāng)時搜索引擎的頂峰。Altavista最突出的優(yōu)勢是它的速度(比較搞笑,設(shè)計altavista的目的,據(jù)說只是為了展示DECAlpha芯片的強(qiáng)大運(yùn)算
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論