2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩61頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著互聯(lián)網(wǎng)的加速擴張,人們的日常生活也越來越離不開網(wǎng)絡提供的各種服務,電子郵件(E-mail)即是其中應用最為廣泛的一種。作為應用最早的互聯(lián)網(wǎng)服務之一,電子郵件的出現(xiàn)大大改變了人們交換信息的方式,使人們之間的交流變得前所未有的迅捷。但隨之而來的垃圾郵件問題也給企業(yè)和個人帶來了巨大的損失和無盡的煩惱。垃圾郵件在我國雖然起步較晚,但發(fā)展迅速,目前我國已經(jīng)成為世界第三大垃圾郵件來源國。目前,國內針對中文垃圾郵件過濾的研究也在如火如荼的展開,本

2、文即是對基于貝葉斯模型的中文垃圾郵件過濾方法的研究。貝葉斯垃圾郵件過濾技術是目前使用最廣泛,取得效果最好的垃圾郵件過濾技術。本文針對中文貝葉斯垃圾郵件過濾系統(tǒng)的特點,研究了中文貝葉斯垃圾郵件過濾系統(tǒng)所涉及的三項主要技術:中文分詞技術、文本特征選取技術、貝葉斯文本分類技術,并在此基礎上設計完成了一個多層整合的垃圾郵件過濾系統(tǒng),對該系統(tǒng)的大量測試結果顯示本文設計的系統(tǒng)比傳統(tǒng)的基于樸素貝葉斯模型的系統(tǒng),無論是垃圾郵件識別的準確率,還是垃圾郵件

3、的查全率都有不同程度的提高。 本文對貝葉斯垃圾郵件過濾模型三個關鍵步驟進行了改進。首先在貝葉斯決策過程中使用了兩步?jīng)Q策過程,這也是本文所實現(xiàn)的系統(tǒng)在結構上和傳統(tǒng)基于樸素貝葉斯模型的系統(tǒng)的最大區(qū)別所在,由于引進了二次決策過程,并在二次覺得的過程中使用了不同的郵件特征項,本系統(tǒng)避免了一次決策可能產(chǎn)生的很多錯誤,大大提高了系統(tǒng)的準確率和查全率。其次,在二次決策過程中使用了兩種互補的特征選取方法,即充分利用了初次特征選取的結果,又使系統(tǒng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論