版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、互聯(lián)網(wǎng)信息監(jiān)管是當(dāng)代世界各國(guó)都在重點(diǎn)研究解決的問(wèn)題之一,文字信息是互聯(lián)網(wǎng)信息傳播的最主要形式,如何有效地把互聯(lián)網(wǎng)文字信息管理起來(lái),也就成為當(dāng)前熱門(mén)的一個(gè)研究方向。本文在互聯(lián)網(wǎng)文字過(guò)濾方面設(shè)計(jì)了一種基于中文分詞技術(shù)的文字過(guò)濾系統(tǒng)(The Word Filtration System Based on Chinese Word Segmentation),并成功應(yīng)用于某企業(yè)網(wǎng)站,取得了良好的效果。
這種方法與傳統(tǒng)單純基于關(guān)鍵詞
2、過(guò)濾的文字過(guò)濾系統(tǒng)不同,充分考慮了文章的整體性,從全文角度出發(fā),有效避免了傳統(tǒng)過(guò)濾器的幾個(gè)主要缺陷:一是傳統(tǒng)方法識(shí)別關(guān)鍵詞時(shí)存在較大的片面性,因?yàn)槲床捎梅衷~而是簡(jiǎn)單的識(shí)別字符串,導(dǎo)致大量誤判發(fā)生,而全文分詞的方式有效地解決了這一問(wèn)題;二是基于全文分析對(duì)文字進(jìn)行識(shí)別過(guò)濾,改變傳統(tǒng)“不合格不通過(guò)”機(jī)制為“合格通過(guò)”,使常見(jiàn)用于逃避過(guò)濾的變形詞、錯(cuò)別字的問(wèn)題得以有效解決;三是傳統(tǒng)關(guān)鍵字過(guò)濾器從根源上的弊端是脫離上下文環(huán)境進(jìn)行判斷,審核結(jié)果是絕
3、對(duì)化的,這與現(xiàn)實(shí)中文字表達(dá)并不一致,應(yīng)用分詞技術(shù)后我們可以對(duì)文章進(jìn)行全文分詞處理,然后根據(jù)在文章中詞的褒貶性、敏感性等特征判斷文章是否合格,使審核過(guò)濾增加了一定的“彈性”能力,具有更強(qiáng)的實(shí)用性。
另外,本文提出的通過(guò)互聯(lián)網(wǎng)學(xué)習(xí)新詞,也為解決中文分詞技術(shù)中新詞識(shí)別問(wèn)題提供了一個(gè)有效方案和研究思路。
本文創(chuàng)新工作如下:
1.針對(duì)當(dāng)前互聯(lián)網(wǎng)文字過(guò)濾的業(yè)務(wù)特點(diǎn),提出一個(gè)基于中文分詞的通用領(lǐng)域模型。以互聯(lián)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 互聯(lián)網(wǎng)網(wǎng)站備案表
- 互聯(lián)網(wǎng)網(wǎng)站的商業(yè)模式分析.pdf
- 互聯(lián)網(wǎng)網(wǎng)站會(huì)員注冊(cè)協(xié)議書(shū)
- ??品謺?huì)互聯(lián)網(wǎng)網(wǎng)站調(diào)查表
- 非法互聯(lián)網(wǎng)網(wǎng)站及服務(wù)掃描監(jiān)管系統(tǒng).pdf
- 中國(guó)互聯(lián)網(wǎng)網(wǎng)站行政許可制度探析.pdf
- IT企業(yè)互聯(lián)網(wǎng)站支持研究.pdf
- 互聯(lián)網(wǎng)網(wǎng)間互聯(lián)質(zhì)量研究.pdf
- 移動(dòng)互聯(lián)網(wǎng)網(wǎng)管的研究和應(yīng)用
- 機(jī)關(guān)、單位互聯(lián)網(wǎng)網(wǎng)站信息發(fā)布保密審查表
- 移動(dòng)互聯(lián)網(wǎng)網(wǎng)管的研究與應(yīng)用.pdf
- 移動(dòng)互聯(lián)網(wǎng)在企業(yè)中的應(yīng)用
- 互聯(lián)網(wǎng)噪鏈的識(shí)別過(guò)濾及其在Web Spam研究上的應(yīng)用.pdf
- 非法互聯(lián)網(wǎng)網(wǎng)站及服務(wù)實(shí)時(shí)監(jiān)管取證系統(tǒng).pdf
- 互聯(lián)網(wǎng)基礎(chǔ)應(yīng)用——網(wǎng)站建設(shè)合同
- 互聯(lián)網(wǎng) 在企業(yè)招聘中的應(yīng)用思考
- 互聯(lián)網(wǎng)網(wǎng)站用戶數(shù)據(jù)智能挖掘系統(tǒng)WTIAS研究.pdf
- 事業(yè)單位和國(guó)有企業(yè)互聯(lián)網(wǎng)網(wǎng)站安全專項(xiàng)整治行動(dòng)方案
- 互聯(lián)網(wǎng)網(wǎng)際性能的態(tài)勢(shì)感知研究.pdf
- 互聯(lián)網(wǎng)網(wǎng)絡(luò)流量統(tǒng)計(jì)系統(tǒng).pdf
評(píng)論
0/150
提交評(píng)論