版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、大量的農(nóng)業(yè)技術(shù)、供求信息、市場信息、政策法規(guī)和農(nóng)業(yè)新聞等信息資源分布在互聯(lián)網(wǎng)上農(nóng)業(yè)網(wǎng)站中。然而由于互聯(lián)網(wǎng)信息資源具有信息異質(zhì)、異構(gòu)、分散、重復(fù)現(xiàn)象嚴(yán)重的特點(diǎn),缺少統(tǒng)一的形式化表達(dá),形成各種各樣的“信息孤島”,很難對(duì)農(nóng)業(yè)信息資源進(jìn)行整合和利用。針對(duì)這個(gè)問題,在國家自然基金(“農(nóng)業(yè)復(fù)雜自適應(yīng)搜索模型研究”)的支持下,面向農(nóng)業(yè)的搜索模型—搜農(nóng)應(yīng)運(yùn)而生。然而該模型還是基于文本關(guān)鍵字匹配的數(shù)據(jù)處理方式,不能充分理解信息包含的語義信息,在準(zhǔn)確率和召
2、回率這兩大信息檢索系統(tǒng)性能指標(biāo)上還有很大提升空間。
針對(duì)這個(gè)問題,本文根據(jù)網(wǎng)絡(luò)農(nóng)業(yè)資源的特點(diǎn),在農(nóng)業(yè)領(lǐng)域本體構(gòu)建的基礎(chǔ)上,將本體作為領(lǐng)域知識(shí)庫應(yīng)用于垂直搜索引擎的數(shù)據(jù)預(yù)處理、數(shù)據(jù)索引和用戶檢索三個(gè)環(huán)節(jié),將本體的語義添加到搜索引擎的數(shù)據(jù)處理過程中。
相對(duì)于原有模型,數(shù)據(jù)預(yù)處理環(huán)節(jié)的語義改進(jìn)主要包括:信息的空間屬性的抽取、信息地理名稱的實(shí)體解析和價(jià)格動(dòng)態(tài)變化的關(guān)系抽?。凰饕h(huán)節(jié)的語義改進(jìn)主要包括:文檔的語義標(biāo)注和
3、語義擴(kuò)展;用戶檢索環(huán)節(jié)的改進(jìn)包括:在語義標(biāo)注環(huán)境下普通用戶的檢索策略和基于用戶模型的語義擴(kuò)展方法。
論文的主要研究內(nèi)容總結(jié)如下:
1.針對(duì)網(wǎng)絡(luò)上農(nóng)業(yè)資源空間屬性表達(dá)的多樣性、顯性表達(dá)的缺失等問題,本文提出一種借助領(lǐng)域本體和WEB搜索引擎構(gòu)建知識(shí)庫抽取并判別信息的空間屬性的方法,將語義添加到信息的空間屬性抽取過程中。
2.針對(duì)農(nóng)業(yè)地理名稱實(shí)體解析的問題,本文提出一種將空間屬性抽取算法和Markov
4、邏輯網(wǎng)絡(luò)進(jìn)行結(jié)合進(jìn)行地理名稱實(shí)體解析的方法,將空間屬性抽取中的語義信息帶入到地理名稱的實(shí)體解析過程中。
3.針對(duì)從大量非結(jié)構(gòu)化的文本中抽取價(jià)格變化關(guān)系的問題,本文設(shè)計(jì)了一種基于條件隨機(jī)場進(jìn)行關(guān)系抽取,并用領(lǐng)域本體對(duì)抽取的結(jié)果進(jìn)行語義上的統(tǒng)計(jì)合并的農(nóng)產(chǎn)品價(jià)格變化關(guān)系抽取方法。
4.針對(duì)農(nóng)業(yè)領(lǐng)域資源的特點(diǎn),本文提出一種結(jié)合領(lǐng)域本體和句法分析相結(jié)合的核心詞匯抽取方法,并依據(jù)本體對(duì)文檔主題進(jìn)行推斷,與本體中的概念進(jìn)行
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 垂直搜索引擎若干問題研究.pdf
- 基于nutch的農(nóng)業(yè)垂直搜索引擎研究與實(shí)現(xiàn)
- 搜索引擎中若干問題的研究與應(yīng)用.pdf
- 搜索引擎中爬蟲的若干問題研究.pdf
- 農(nóng)業(yè)垂直搜索引擎的研究與設(shè)計(jì).pdf
- 搜索引擎語義排序的研究與實(shí)現(xiàn)
- 垂直搜索引擎設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于本體的語義垂直搜索引擎研究.pdf
- 事件垂直搜索引擎的研究與實(shí)現(xiàn).pdf
- 垂直搜索引擎的架構(gòu)與實(shí)現(xiàn).pdf
- 政策信息垂直搜索引擎研究與實(shí)現(xiàn).pdf
- 垂直搜索引擎的研究.pdf
- 基于語義本體的垂直搜索引擎模型研究.pdf
- 可定制的垂直搜索引擎研究與實(shí)現(xiàn).pdf
- 垂直搜索引擎爬蟲系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 招聘信息垂直搜索引擎的研究與實(shí)現(xiàn).pdf
- 基于Lucene垂直搜索引擎的研究與實(shí)現(xiàn).pdf
- 面向能源的垂直搜索引擎研究與實(shí)現(xiàn).pdf
- 基于Nutch的垂直搜索引擎研究與實(shí)現(xiàn).pdf
- web垂直搜索引擎實(shí)現(xiàn)過程的研究
評(píng)論
0/150
提交評(píng)論