博客搜索引擎與排名技術研究.pdf_第1頁
已閱讀1頁,還剩48頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、目前,博客作為Web2.0中的代表,引起了大眾傳播方式的一種變革。自其出現(xiàn)以后,持續(xù)影響和改變著互聯(lián)網的交流模式?;ヂ?lián)網中博客的數(shù)量成指數(shù)級的增加,從九十年代的數(shù)千個增長到2005年的過億,這樣龐大的信息量,就需要一個有效的搜索方法對博客進行搜索。現(xiàn)在已經有很多博客的搜索工具了:Blogdigger, Blogpulse,還有Technorati,而像Google,Yahool和AskJeeves這樣的搜索引擎也已經提供了專門的博客搜索

2、。博客搜索正處于一個發(fā)展的初級階段,其蘊含著極大的研究潛力。本研究主要包括以下方面。
   ⑴基礎理論研究:介紹了Web挖掘基礎理論(包括Web挖掘的定義和Web挖掘的分類)、網絡爬蟲的系統(tǒng)結構和相關折爬蟲算法、中文分詞的幾種方法。
   ⑵博客搜索引擎技術:介紹了傳統(tǒng)搜索引擎的定義及基本構成、搜索引擎的分類,介紹了幾種特色的搜索引擎,針對博客的特點,分析了幾種博客搜索技術。給出了博客搜索與排名的系統(tǒng)框架和三個功能模塊的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論