

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、針對傳統(tǒng)檢索模型在檢索上存在的數(shù)據(jù)冗余、模糊匹配、檢索結果差等缺點,結合當前研究熱點,論述異構數(shù)據(jù)集成、冗余數(shù)據(jù)排除、高效數(shù)據(jù)分類、關鍵字檢索等模型與方法,旨在大數(shù)據(jù)環(huán)境下,充分利用傳統(tǒng)技術與虛擬化技術、Map-Reduce并行框架模型、改進向量空間檢索模型等技術相結合優(yōu)化存儲模型、改進分類算法以及優(yōu)化檢索算法,進而提高算法運算效率,為用戶提供一套集數(shù)據(jù)存儲、數(shù)據(jù)分類、數(shù)據(jù)檢索于一體的大數(shù)據(jù)檢索基礎平臺。
以關鍵字檢索算法作為
2、研究對象,主要研究內容為:
首先,為了更好地對數(shù)據(jù)檢索提供良好的數(shù)據(jù)存儲基礎,研究數(shù)據(jù)模型的設計與優(yōu)化,并在云計算環(huán)境下研討設計數(shù)據(jù)存儲模型,文件塊的數(shù)據(jù)更新算法設計,以及云存儲的故障恢復機制等。
第二,為了達到準確地對不同數(shù)據(jù)的檢索要求,在原有分類算法的基礎上提出了并行分類混合算法(PCHA算法),該算法利用鄰近分類算法適合處理屬性多、數(shù)據(jù)大的分類問題的優(yōu)勢,引入 Map-Reduce并行框架與其融合設計,優(yōu)化并提
3、升原有分類算法的建模預測能力和分類識別率。
第三,研討傳統(tǒng)檢索算法并提出無序關鍵字檢索算法(DKRA算法),該算法利用向量檢索模型計算方便、復雜度低等優(yōu)點,引入 K-D矩陣構造及相似度等計算方法設計檢索算法,并與計算關鍵字序列權重得到相關數(shù)據(jù)相似度的計算方法做比較,從而體現(xiàn)DKRA算法在計算效率上的優(yōu)勢。
最后,在 DKRA算法的基礎上提出了有序關鍵字檢索算法(OKRA算法),該算法利用檢索關鍵字的有序性,給出了關鍵
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于語義的Linked Data大數(shù)據(jù)關鍵字檢索研究.pdf
- 基于語義的數(shù)據(jù)庫關鍵字檢索優(yōu)化技術研究.pdf
- 無線數(shù)據(jù)廣播環(huán)境下的關鍵字檢索方法研究.pdf
- 基于關鍵字檢索的XML數(shù)據(jù)源選擇.pdf
- 基于模式圖的數(shù)據(jù)庫關鍵字檢索的研究.pdf
- 概率XML文檔Top-k關鍵字檢索算法研究.pdf
- 不確定數(shù)據(jù)的ToP-K關鍵字檢索.pdf
- 基于知網(wǎng)的多關鍵字檢索研究.pdf
- 面向關系數(shù)據(jù)庫的語義關鍵字搜索研究.pdf
- 關系數(shù)據(jù)庫的關鍵字查詢優(yōu)化研究.pdf
- 關鍵字查詢性能優(yōu)化研究.pdf
- 基于關鍵字特征的加密云數(shù)據(jù)檢索技術研究.pdf
- 面向關系數(shù)據(jù)庫的語義關鍵字查詢研究.pdf
- 面向云數(shù)據(jù)的多關鍵字可搜索加密機制研究.pdf
- 基于雙關鍵字的圖像檢索模型及系統(tǒng).pdf
- 面向分析處理的關鍵字查詢性能優(yōu)化技術研究.pdf
- 基于XML的關鍵字查詢算法研究.pdf
- 基于地理位置的模糊關鍵字檢索.pdf
- 基于安全訪問控制的XML關鍵字檢索.pdf
- 基于Lucene的關系數(shù)據(jù)庫關鍵字檢索技術研究.pdf
評論
0/150
提交評論