基于GATE的貨物動態(tài)郵件信息抽取方法與應用研究.pdf_第1頁
已閱讀1頁,還剩87頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、長期以來,電子郵件作為當下常用的通訊手段,已經成為航運業(yè)業(yè)務往來的重要載體之一。但是,目前航運業(yè)內主要還是通過人工讀取郵件的方式來獲取信息。通過調查,中小規(guī)模的遠洋運輸企業(yè)業(yè)務員日均郵件處理量可以達到300-400封,大型的遠洋運輸企業(yè)業(yè)務員的工作負擔就更難以想象。面對如此龐大的郵件數量,人工處理方式不但效率低下,而且容易出現(xiàn)遺漏、錯看等失誤,因此,需要利用信息抽取技術,將同類業(yè)務郵件中的核心信息抽取出來,自動化地形成業(yè)務數據表,這樣不

2、僅可以在很大程度上降低手工工作量,還可以在抽取的信息上添加約束條件,以便根據企業(yè)業(yè)務的要求來過濾郵件。此外,航運業(yè)務郵件的類別包括報還盤郵件、合同郵件、船舶跟蹤郵件、貨物動態(tài)郵件、航次郵件等等。其中,貨物動態(tài)郵件,即供貨方提供給遠洋運輸公司的關于運貨信息的業(yè)務郵件,它數量較大,內容也較復雜,因此本文選擇貨物動態(tài)郵件作為研究對象。
  針對這一研究背景,本文提出了基于GATE的貨物動態(tài)郵件信息抽取方法與應用研究,即采用基于規(guī)則的信息

3、抽取技術,以及GATE文本工程通用體系框架作為論文研究的技術依據和開發(fā)平臺。論文首先針對與研究命題相關的國內外研究現(xiàn)狀進行研究,包括基于規(guī)則的信息抽取技術的研究現(xiàn)狀、信息抽取系統(tǒng)的研究現(xiàn)狀、信息抽取技術的應用現(xiàn)狀以及抽取規(guī)則評價方法的研究現(xiàn)狀等;接著,對相關基礎理論進行概述,包括GATE平臺介紹、規(guī)則學習算法設計以及JAPE規(guī)則定義語言的介紹。然后,基于GATE平臺提供的開發(fā)組件,重點研究了抽取規(guī)則的機器學習算法和規(guī)則評價的改進方法。最

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論