

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、當前社會,信息技術、計算機技術與語言學(統(tǒng)計語言學與語料庫語言學的興起與發(fā)展)處于一個高速發(fā)展時期,這為相似度研究打下了堅實的基礎。與此同時,各個高校中也發(fā)生少量的學術不端行為,主要表現(xiàn)在抄襲、剽竊、侵吞他人學術成果,給整個學術界的聲譽以及高校的學術質量造成了極壞的影響,因此急需論文檢測系統(tǒng)來提高論文的質量,為防止其不端行為的發(fā)生,目前的各種論文檢測系統(tǒng)在高校被廣泛應用,在一定程度上遏制了學術不端行為的發(fā)生,但是目前的論文檢測系統(tǒng)主要側
2、重于字面上的重復度檢測,而對語法結構的調整、圖像、公式等非結構化的檢測相對欠缺。結合其檢測系統(tǒng)的不足與相似度研究的現(xiàn)狀,以相似度研究在論文檢測中的應用為方向展開研究,希望有助于相似度研究在應用方面取得成績。
本文先從相似度的概念、相似度計算的原則、應考慮的因素以及具體的相似度算法等方面來分析文本相似度與語義相似度,通過對其算法的分析,考慮到各種算法的優(yōu)缺點,最后選擇了以《知網(wǎng)》為基礎的詞語相似度算法,并在原有算法的基礎上對原有
3、算法進行了改進,在詞語相似度的計算過程中引入了本體相似度算法中的語義密度因子,并且將此算法延伸到句子相似度、段落相似度與論文相似度的計算;通過詞語相似度、句子相似度、段落相似度與論文相似度四個層次的算法分析,把語義理解應用到論文檢測中,根據(jù)其各個層次的計算給出了在論文檢測中其相對應的模塊及流程;最后根據(jù)本文涉及到的相似度算法,通過相應的實驗驗證了其算法的有效性與實用性,實現(xiàn)了其相似度計算在論文檢測領域的部分應用,其主要是指在詞語相似度、
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 向量空間模型與語義理解相結合的論文相似度算法研究.pdf
- 語義理解中的相似性認知探微.pdf
- 基于語義理解的圖像檢索研究.pdf
- 基于深度學習的圖像語義理解研究.pdf
- 基于意象圖式的語義理解模型研究.pdf
- 基于CRF的圖像語義理解算法研究.pdf
- 基于本體的語義相似度研究.pdf
- 基于語義距離的概念語義相似度研究.pdf
- 基于深層語義相似的隱喻理解研究.pdf
- 基于語義理解的觀點評論挖掘研究.pdf
- 基于語義理解的語音控制技術研究.pdf
- 基于語義理解的稅務稽查輔助系統(tǒng).pdf
- 基于本體的概念語義相似度研究.pdf
- 基于多層語義理解的流媒體調度算法研究.pdf
- 基于相似語義的文本相似度的判別研究.pdf
- 基于本體技術的語義檢索及其語義相似度研究.pdf
- 基于語義相似度的中文文本相似度算法研究.pdf
- 路面車輛運動的語義理解.pdf
- 基于深度學習的圖像語義理解和分類研究.pdf
- 基于語義理解與PLSA的文本情感分類研究.pdf
評論
0/150
提交評論