版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、在當(dāng)前的互聯(lián)網(wǎng)時(shí)代,存在著數(shù)據(jù)增長(zhǎng)迅速,然而信息龐雜,用戶(hù)想要從海量數(shù)據(jù)中搜索有用的信息費(fèi)時(shí)費(fèi)力的問(wèn)題。用戶(hù)需要的是更詳細(xì)、細(xì)分的信息,針對(duì)這種情況,本文提出了一種基于主題的數(shù)據(jù)API檢索平臺(tái)。
本文設(shè)計(jì)的分布式、可擴(kuò)展的基于主題的數(shù)據(jù)API檢索平臺(tái),首先將海量的互聯(lián)網(wǎng)信息采集到子系統(tǒng)中,然后對(duì)數(shù)據(jù)進(jìn)行分類(lèi),對(duì)每一類(lèi)的數(shù)據(jù)通過(guò)檢索的方式提供給用戶(hù),用戶(hù)通過(guò)選取自己感興趣的信息來(lái)消費(fèi)平臺(tái)中的數(shù)據(jù)。為了提供這樣一個(gè)數(shù)據(jù)API檢索平
2、臺(tái),首先是能夠?qū)⒋罅康木W(wǎng)頁(yè)抓取下來(lái),并且需要此功能支持水平擴(kuò)展和穩(wěn)定性。此外為了減少人工成本,又能有效的提取網(wǎng)頁(yè)中的信息,本文提出了半自動(dòng)化的基于模板的網(wǎng)頁(yè)信息提取方法。
面對(duì)海量的互聯(lián)網(wǎng)文檔數(shù)據(jù),需要提供一種合理的方式對(duì)數(shù)據(jù)進(jìn)行分類(lèi),以便用戶(hù)有針對(duì)性的選擇對(duì)自己有用的數(shù)據(jù)。為此,本文設(shè)計(jì)了基于主題的數(shù)據(jù)分類(lèi)和檢索系統(tǒng)。通過(guò)基于LDA主題模型來(lái)推斷文檔中的主題分布,然后根據(jù)主題分布建立相應(yīng)的API主題和相應(yīng)的API-Key???/p>
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于JAIN API的智能網(wǎng)關(guān)鍵技術(shù)研究與實(shí)現(xiàn).pdf
- 數(shù)據(jù)交換平臺(tái)關(guān)鍵技術(shù)的研究與實(shí)現(xiàn).pdf
- 基于語(yǔ)義信息檢索關(guān)鍵技術(shù)的研究與實(shí)現(xiàn).pdf
- 基于內(nèi)容的醫(yī)學(xué)圖像檢索關(guān)鍵技術(shù)研究與實(shí)現(xiàn).pdf
- 音樂(lè)數(shù)據(jù)管理與檢索關(guān)鍵技術(shù)的研究.pdf
- Web信息檢索與主題提取的關(guān)鍵技術(shù)研究.pdf
- 基于實(shí)體的海量數(shù)據(jù)在線檢索關(guān)鍵技術(shù)研究.pdf
- 基于Hadoop平臺(tái)的大數(shù)據(jù)預(yù)處理關(guān)鍵技術(shù)研究與實(shí)現(xiàn).pdf
- 基于安全云的私有信息檢索關(guān)鍵技術(shù)研究與實(shí)現(xiàn).pdf
- 基于語(yǔ)義的遙感影像數(shù)據(jù)檢索關(guān)鍵技術(shù)研究.pdf
- 基于云推送的數(shù)據(jù)物流服務(wù)平臺(tái)若干關(guān)鍵技術(shù)研究與實(shí)現(xiàn).pdf
- 智能商標(biāo)檢索系統(tǒng)關(guān)鍵技術(shù)的研究與實(shí)現(xiàn).pdf
- 基于內(nèi)容的視頻檢索關(guān)鍵技術(shù)的研究.pdf
- 基于內(nèi)容的視頻檢索與關(guān)鍵技術(shù)簡(jiǎn)述
- 運(yùn)動(dòng)捕獲數(shù)據(jù)重構(gòu)及檢索關(guān)鍵技術(shù)的研究.pdf
- 基于Hadoop平臺(tái)構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)關(guān)鍵技術(shù)的研究.pdf
- 基于內(nèi)容圖像數(shù)據(jù)庫(kù)檢索中的關(guān)鍵技術(shù)研究.pdf
- 基于本體的圖像檢索數(shù)據(jù)庫(kù)的關(guān)鍵技術(shù)研究.pdf
- 基于內(nèi)容的圖像數(shù)據(jù)庫(kù)檢索中關(guān)鍵技術(shù)的研究.pdf
- 基于數(shù)據(jù)的人體運(yùn)動(dòng)編輯關(guān)鍵技術(shù)研究與系統(tǒng)平臺(tái)實(shí)現(xiàn).pdf
評(píng)論
0/150
提交評(píng)論