

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、基于NoSQL存儲(chǔ)的海量文檔全文檢索系統(tǒng)是一種結(jié)合了分布式全文檢索和分布式存儲(chǔ)的新型文檔管理系統(tǒng)。它提供了文檔管理系統(tǒng)升級(jí)的一種方案,使文檔存儲(chǔ)滿足海量存儲(chǔ)要求,使文檔檢索更加準(zhǔn)確高效。
傳統(tǒng)的文檔管理系統(tǒng)大多使用文檔外部特征作為文檔查詢關(guān)鍵字,通過這些關(guān)鍵字和文檔內(nèi)容建立關(guān)聯(lián)并保存到關(guān)系型數(shù)據(jù)庫,文檔內(nèi)容直接保存到操作系統(tǒng)文件系統(tǒng)中。這種方式一般會(huì)造成兩個(gè)問題,一個(gè)是文檔都保存在一臺(tái)服務(wù)器上,造成系統(tǒng)存儲(chǔ)容量有限,擴(kuò)展性不好
2、。另一個(gè)是使用外部特征搜索文檔內(nèi)容,搜索的準(zhǔn)確性很低。為解決這兩個(gè)問題,本文把業(yè)界兩種新興技術(shù)NoSQL和分布式全文檢索引擎引入到文檔管理系統(tǒng)中。
MongoDB在NoSQL領(lǐng)域非常有名,在DB Engines的排行榜中已進(jìn)入前5,在行業(yè)中的應(yīng)用非常普遍。本文分析了MongoDB的特點(diǎn)、功能和適合場(chǎng)景,并重點(diǎn)研究了MongoDB實(shí)現(xiàn)分片和復(fù)制的原理,為學(xué)習(xí)分布式存儲(chǔ)提供了很好的案例。
ElasticSearch是一個(gè)
3、基于Lucene構(gòu)建的開源引擎,包涵有分布式、RESTful等功能。雖然是一個(gè)新興的分布式搜索引擎,但在性能、擴(kuò)展性、成熟度多方面都表現(xiàn)很優(yōu)秀。本文重點(diǎn)深入ElasticSearch源碼,分析了其實(shí)現(xiàn)分布式搜索的原理。
本文主要研究工作是基于NoSQL存儲(chǔ)的海量文檔全文檢索系統(tǒng)的研究與實(shí)現(xiàn)。根據(jù)功能需要,本文設(shè)計(jì)了基于OSGi的模塊化插件結(jié)構(gòu)的系統(tǒng)架構(gòu),并把業(yè)務(wù)功能分為文件處理、文本提取、全文索引和查詢四個(gè)主要模塊。系統(tǒng)應(yīng)用插
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于全文檢索系統(tǒng)的文檔關(guān)聯(lián)研究與實(shí)現(xiàn).pdf
- 海量數(shù)據(jù)加密存儲(chǔ)與檢索系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 基于HBase的海量小視頻存儲(chǔ)與檢索系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 面向文檔的全文檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 異構(gòu)文檔庫全文檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于Lucene的多文檔全文檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 分布式海量數(shù)據(jù)存儲(chǔ)檢索系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 多源文檔全文檢索系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 海量數(shù)據(jù)存儲(chǔ)與全文檢索.pdf
- 基于lucene中文全文檢索系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 基于NoSQL的海量交通視頻監(jiān)控?cái)?shù)據(jù)存儲(chǔ)與檢索技術(shù)研究.pdf
- 基于NoSQL的海量文檔分享平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 海量圖像檢索系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于MapReduce的全文檢索系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于Lucene的全文檢索系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于SolrCloud的文檔檢索系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 面向公安領(lǐng)域的海量數(shù)據(jù)存儲(chǔ)檢索系統(tǒng)的開發(fā).pdf
- 面向海量郵件的檢索系統(tǒng)研究與實(shí)現(xiàn).pdf
- 基于內(nèi)容的文檔圖像檢索系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- Web全文信息檢索系統(tǒng)的研究與實(shí)現(xiàn).pdf
評(píng)論
0/150
提交評(píng)論