版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、我國林業(yè)是國民經(jīng)濟的基礎產(chǎn)業(yè),擔負著生態(tài)環(huán)境建設和促進社會可持續(xù)發(fā)展的重大使命,人類是林業(yè)產(chǎn)業(yè)建設中的主要受益群體,當林業(yè)產(chǎn)業(yè)結構形成時,人們就在其中發(fā)揮其各自不同的作用。近年來,林業(yè)信息化推進,促進了林業(yè)信息資源的共享,為公眾提供了便利,促進了林業(yè)產(chǎn)業(yè)的發(fā)展。但是,林業(yè)信息化的發(fā)展還有其必要性,如何更好地利用林業(yè)信息資源,為我國林業(yè)科學領域廣大科研人員、教學工作者以及林農(nóng)服務,就迫切需要對林業(yè)信息實現(xiàn)快速搜索與集成。
如
2、何從海量信息中快速查找到用戶所需要的信息,已經(jīng)成為公眾對特定領域信息的查找所面臨的主要問題?;ヂ?lián)網(wǎng)上林業(yè)信息越來越龐雜且無序,普通的搜索引擎已經(jīng)不能滿足大眾對個性化信息的需求。針對用戶在進行林業(yè)主題信息查詢時,通用搜索引擎需要花費大量時間及精力去查找所需要的信息,且主題信息的召回率和精確率都比較低,不能滿足用戶的需求,因此公眾急需一個分類精確、數(shù)據(jù)全面、更新及時的林業(yè)主題搜索引擎。
本論文的研究內(nèi)容來自導師主持的湖南省科技
3、計劃重點項目(2010nk2004)。本文以系統(tǒng)科學、林學、信息學和統(tǒng)計學等理論為指導,對林業(yè)動態(tài)信息搜索與集成進行了全面的研究。研究過程中,對國內(nèi)外林業(yè)動態(tài)信息搜索與集成等方面的研究進行了綜述。主要從林業(yè)動態(tài)信息的需求分析與分類、主題爬蟲搜索器以及文本識別分類器等三個方面進行了研究,主要研究工作如下:
(1)綜合分析了國內(nèi)外對于搜索引擎的既有理論和實踐成果,表明了目前建立一個林業(yè)主題搜索引擎的重要性和必要性,并對其中的關
4、鍵技術進行了深入研究。本研究將林業(yè)主題搜索引擎分為數(shù)據(jù)收集層、數(shù)據(jù)存儲層以及數(shù)據(jù)表示層三個層次,并對這三個層次中涉及的相關方法進行了探討和總結。
(2)利用網(wǎng)頁上公布的信息,結合各部門及公眾對林業(yè)動態(tài)信息的需求,明確對各部門及公眾真正有實際意義的林業(yè)動態(tài)信息類別,并對所需林業(yè)動態(tài)信息進行分類、分塊,使各種林業(yè)動態(tài)信息具體化,主要分為以下七類:林業(yè)科技信息、林業(yè)生產(chǎn)資料、林產(chǎn)品市場供求信息、花卉信息、林業(yè)政策法規(guī)、林業(yè)勞務信
5、息、氣象與環(huán)境信息。
(3)根據(jù)已構建的林業(yè)動態(tài)信息類別體系,搜集與之相關的林業(yè)專業(yè)網(wǎng)站,明確信息采集的網(wǎng)站來源。采集我們所需要的數(shù)據(jù)所提供的網(wǎng)站域名,并采集域名后的內(nèi)容,同時辨別所采集的網(wǎng)站類別,實現(xiàn)對林業(yè)動態(tài)信息源的搜集及分類。
(4)運用基于內(nèi)容分析與基于鏈接結構分析相結合的一種新型搜索策略,通過綜合分析評價,對候選URL所指向的頁面進行主題相關度判斷以及對候選URL進行排序,實現(xiàn)最優(yōu)的林業(yè)主題爬蟲搜索
6、器,從而使所下載的網(wǎng)頁按與林業(yè)主題相關且重要性突出遞減的順序排列。
(5)采用計算機智能的SVM自動文本分類技術,對樣本數(shù)據(jù)進行機器訓練,實現(xiàn)對主題爬蟲搜索器所采集到的林業(yè)動態(tài)信息進行分類存儲,達到對林業(yè)主題搜索引擎的數(shù)據(jù)收集層的構建進行優(yōu)化的目的。
林業(yè)動態(tài)信息搜索與集成是在對現(xiàn)有的搜索與集成技術進行研究和優(yōu)化的基礎上,融合了公眾對林業(yè)動態(tài)信息的需求,使得公眾在獲取林業(yè)動態(tài)信息時的準確率、全面率和成功率都得
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于JADE平臺的網(wǎng)絡信息搜索與集成系統(tǒng).pdf
- 信息集成中的動態(tài)信息源結合問題研究.pdf
- 企業(yè)集成中的組織集成與信息集成.pdf
- 加強林業(yè)資源保護 重視林業(yè)快速發(fā)展
- 動態(tài)信息與動態(tài)信息規(guī)律特征研究.pdf
- 基于語義的知識資源搜索與集成研究.pdf
- 基于動態(tài)電流信息的集成電路測試研究.pdf
- 動態(tài)搜索煙花算法的研究與應用.pdf
- Deep Web動態(tài)搜索的研究——基于圖書網(wǎng)站的動態(tài)搜索.pdf
- 輸電斷面快速搜索與過載緊急控制策略研究.pdf
- 基于中介器-包裝器的動態(tài)信息集成研究.pdf
- 中斷與搜索作業(yè)類型對網(wǎng)絡信息搜索作業(yè)的影響.pdf
- 運動估計快速搜索算法的研究與改進.pdf
- 多視點編碼快速搜索策略研究.pdf
- 快速OCT集成控制系統(tǒng)設計與開發(fā).pdf
- 基于ERP集成平臺的人的集成與信息集成的研究.pdf
- 基于動態(tài)信息集成鐵路調(diào)度指揮系統(tǒng)研究.pdf
- 面向移動視覺的快速搜索方法.pdf
- 專業(yè)信息定向采集與多維搜索系統(tǒng).pdf
- WiFi動態(tài)認證與快速切換的研究與實現(xiàn).pdf
評論
0/150
提交評論