已閱讀1頁,還剩58頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、互聯(lián)網(wǎng)將各種信息提供給人們的同時,海量的信息又使人們很難迅速而準確地獲取自己最需要的信息。這是因為計算機不能理解目前網(wǎng)頁內(nèi)容的語義且各種信息缺乏組織。語義網(wǎng)技術通過語義標注的方法將現(xiàn)有的互聯(lián)網(wǎng)資源通過統(tǒng)一的語義將其組織起來,成為可以被機器所理解的信息。
維基百科是一個基于Wiki技術由全世界的人們共同協(xié)作編輯完成的多語言百科全書,常被認為是一個含有豐富語義關系且具有固定模板的語料庫。利用中文維基百科中詞條之間的語義鏈接,結合T
2、F-IDF和Google距離的方法從鏈接權重和共現(xiàn)兩個角度可以提取出較為準確的語義知識。文檔中詞語之間的語義聯(lián)系不僅僅是在其相鄰的詞語之間,在不同段落的詞語同樣也會有關聯(lián)。因而,忽略掉文檔原有的結構,文檔可以看作是每個詞都相互關聯(lián)的詞的集合?;跅l件隨機場模型設計出符合全文語義標注的點特征函數(shù)和邊特征函數(shù)以及模型推理方法,在中文維基百科中獲取的語義知識的基礎上,完成中文文檔的全文語義標注。
實驗表明,結合TF-IDF和Goog
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于維基百科的語義比較.pdf
- 基于中文維基百科的語義知識挖掘相關研究.pdf
- 基于中文維基百科的文本擴充.pdf
- 維基百科上的語義搜索.pdf
- 基于維基百科的語義相關度計算研究.pdf
- 中文維基百科類別推薦的研究.pdf
- 基于中文維基百科的知識庫構建.pdf
- 基于維基百科的語義Web搜索技術研究.pdf
- 基于中文維基百科的信息檢索技術研究.pdf
- 基于中文維基百科的概念相關詞群研究.pdf
- 基于維基百科的微博文本語義概念擴展研究.pdf
- 自動抽取維基百科文本中的語義關系.pdf
- 基于維基百科的中文跨文本指代消解的研究.pdf
- 維基百科下協(xié)同式語義摘要獲取的研究.pdf
- 基于維基百科結構信息的語義關聯(lián)度計算研究.pdf
- 中文網(wǎng)絡百科全書的知識傳播研究——以維基百科與互動百科為例.pdf
- 基于維基百科的搜索結果挖掘.pdf
- 基于中文維基百科的命名實體消歧方法研究.pdf
- 基于維基百科的知識抽取和重用.pdf
- 水楊酸維基百科
評論
0/150
提交評論