

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、漢語分詞是信息檢索、機器翻譯、文本校對等中文信息處理重要領域的基礎。由于漢語中存在詞語規(guī)范、歧義和未登錄詞等問題,漢語分詞一直困擾著中文信息技術的發(fā)展。因此,研究漢語分詞具有十分重要的意義。同時,在分詞應用方面,基于網絡的在線測試分詞系統(tǒng)僅提供測試功能,存在只能處理少量文本、用戶使用不方便、程序無法直接調用等缺點。 網格是近年來繼Internet、WWW技術后興起的一種新技術,能為復雜應用提供分布式并行環(huán)境。網格服務可以以不同的
2、方式聚集起來滿足應用的需要,提高代碼重用率。所以,開發(fā)一個基于網格的面向用戶和程序的分詞服務系統(tǒng),以服務形式為中文信息處理的基礎研究提供支撐環(huán)境,有一定的意義。 本文首先研究了漢語分詞應用需求的多樣性,結合網格的特點設計了七個服務算法。為盡量減少代碼移植的工作量,本文研究了GT4的CWSCore,分析用C語言實現網格服務的原理和方法,然后將上述七種算法封裝成服務,在網格平臺上發(fā)布。根據這些算法生成的網格服務,可以以不同的方式組合
3、起來,形成多種類型的分詞服務,從而滿足不同的分詞應用需求。基于GT4的網格服務多采用Java語言實現,而現有平臺下的大量的應用程序使用C語言開發(fā)。因此本文的方法對C語言應用程序的網格移植有一定的參考意義。 同時,本文還研究了Olobus的作業(yè)管理機制、Condor系統(tǒng)和PVM并行虛擬機系統(tǒng),提出了Condor-PVM與Globus結合的并行計算機制,解決了網格環(huán)境中用C語言編程實現分布式并行計算的問題。實驗證明該機制在處理大規(guī)模
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于語法的分詞系統(tǒng)的設計與實現.pdf
- 基于OGSA的網格數據庫服務系統(tǒng)的研究與實現.pdf
- 基于WSRF的多媒體網格信息服務系統(tǒng)的研究與實現.pdf
- 基于網格的VOD信息服務系統(tǒng)的設計與實現.pdf
- 基于實例的中文分詞系統(tǒng)設計與實現.pdf
- 基于SegTree的漢語分詞系統(tǒng)的設計與實現.pdf
- 基于網格信息服務的網格監(jiān)控系統(tǒng)的研究與設計.pdf
- 中文自動分詞系統(tǒng)的研究與實現.pdf
- 基于字的分詞方法的研究與實現.pdf
- 基于OGSA的網格記賬系統(tǒng)的研究與實現.pdf
- 基于Web的網格系統(tǒng)的研究與實現.pdf
- 基于并行計算的中文分詞系統(tǒng)的研究與實現.pdf
- 基于Globus存儲網格傳輸服務的研究與實現.pdf
- 基于SOA的網格服務平臺安全服務的研究與實現.pdf
- 基于globus存儲網格傳輸服務的研究與實現
- 基于CRF的中文分詞研究與實現.pdf
- 基于Globus Toolkit的網格信息服務的研究與實現.pdf
- 基于Jetspeed的服務網格門戶技術的研究與實現.pdf
- 基于雙數組的分詞詞典研究與實現.pdf
- 基于CRFs的中文分詞算法研究與實現.pdf
評論
0/150
提交評論