版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、專利是人類的知識(shí)成果,最大程度的開發(fā)利用專利知識(shí),可以為國家和企業(yè)縮短時(shí)間,節(jié)省費(fèi)用。專利知識(shí)抽取,作為深層次理解專利內(nèi)容的重要基礎(chǔ),日益成為專利研究的熱點(diǎn),直接影響著專利檢索、專利翻譯、專利分析等多方面應(yīng)用的性能。有效的利用專利知識(shí),可以揭示專利中隱藏的重要信息,為企業(yè)的發(fā)展以及重大決策的制定提供重要參考和指導(dǎo)作用。本文從專利術(shù)語、專利技術(shù)主題以及專利功效短語三方面對(duì)專利知識(shí)進(jìn)行識(shí)別,以及對(duì)部分知識(shí)進(jìn)行規(guī)范化研究,主要研究工作如下:<
2、br> 專利術(shù)語作為專利文獻(xiàn)核心內(nèi)容的主要表現(xiàn)形式,其抽取任務(wù)是專利多方面研究的基礎(chǔ)工作。本文提出一種基于層次過濾方法抽取專利術(shù)語。該方法基于后綴數(shù)組獲取的重復(fù)字串作為候選詞,根據(jù)候選詞集合中無效詞串的特點(diǎn)將其分為破碎字串、冗余字串和通用詞,通過識(shí)別和過濾三類無效字串來獲得專利術(shù)語。分別提出一種獨(dú)立性計(jì)算法過濾破碎字串,相對(duì)活躍度計(jì)算方法和分詞糾錯(cuò)法過濾冗余字串。實(shí)驗(yàn)結(jié)果表明,識(shí)別的術(shù)語平均正確率為90.87%,平均召回率為84.68
3、%,該方法對(duì)中文專利術(shù)語抽取取得了較好的效果。
利用文本挖掘技術(shù)進(jìn)行技術(shù)主題抽取和主題規(guī)范化工作。根據(jù)技術(shù)主題在專利摘要中的分布特點(diǎn)以及技術(shù)主題的粒度特征,提出一種主題度計(jì)算方法,將主題度較大的詞作為主題詞;通過計(jì)算相似度獲得主題詞的同義詞對(duì),借助詞頻統(tǒng)計(jì)特征對(duì)主題詞規(guī)范化表示。實(shí)驗(yàn)結(jié)果表明,提出的主題詞抽取方法是有效的,實(shí)驗(yàn)準(zhǔn)確率為95.5%,召回率為95.5%;同時(shí)提出的主題規(guī)范化方法具有較大的意義。
功效信息作
4、為專利功效分析的關(guān)鍵和基礎(chǔ),其完整性和準(zhǔn)確性對(duì)分析結(jié)果的有效性和準(zhǔn)確性具有決定性意義。為了提高功效信息抽取的效果,提出一種功效短語識(shí)別方法。功效短語進(jìn)行高度概括化,將功效短語分為功效主題、功效屬性和功效值三部分。短語的識(shí)別即三個(gè)組成部分的詞語識(shí)別。綜合利用功效短語所在句子特征和構(gòu)詞特征,包括句子位置信息、線索詞等有效特征。同時(shí),采用條件隨機(jī)場(chǎng)模型及其復(fù)合模板,對(duì)專利摘要文件進(jìn)行功效短語識(shí)別。實(shí)驗(yàn)結(jié)果表明,準(zhǔn)確率為79.25%,召回率為5
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 專利知識(shí)獲取及其支持概念創(chuàng)新設(shè)計(jì)的方法研究.pdf
- 產(chǎn)品專利知識(shí)獲取及其輔助產(chǎn)品創(chuàng)新的方法研究.pdf
- 中文領(lǐng)域術(shù)語自動(dòng)獲取方法的研究.pdf
- 基于文本的中文本體知識(shí)獲取的研究.pdf
- 基于概念格的知識(shí)獲取方法研究.pdf
- 基于Rough Set的知識(shí)獲取方法研究.pdf
- 基于粒計(jì)算的知識(shí)獲取方法研究.pdf
- 基于詞向量的中文詞匯蘊(yùn)涵知識(shí)獲取研究.pdf
- 建筑施工隱性安全知識(shí)獲取方法研究.pdf
- 粗糙集的知識(shí)獲取方法研究.pdf
- 飾品設(shè)計(jì)知識(shí)獲取方法研究及其應(yīng)用.pdf
- 林業(yè)機(jī)械專利知識(shí)獲取及輔助創(chuàng)新平臺(tái)研究.pdf
- 基于語義分類的常識(shí)知識(shí)獲取方法研究.pdf
- 粒度概念格集成與知識(shí)獲取方法研究.pdf
- 基于粗集的知識(shí)獲取方法的研究.pdf
- 數(shù)學(xué)概念的知識(shí)獲取與分析方法研究.pdf
- 不完備數(shù)據(jù)的動(dòng)態(tài)知識(shí)獲取方法研究.pdf
- 兼語句的知識(shí)分析與獲取方法研究.pdf
- 中文詞典中詞匯屬性知識(shí)的獲取.pdf
- 兼語句的知識(shí)分析與獲取方法研究
評(píng)論
0/150
提交評(píng)論