版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、隨著基于構(gòu)件的軟件開發(fā)技術(shù)的推廣和深入發(fā)展,構(gòu)件庫已經(jīng)在軟件研究領(lǐng)域得到越來越多的關(guān)注。構(gòu)件的查詢是構(gòu)件庫的基本功能,利用聚類分析技術(shù)對構(gòu)件進行聚類,可以實現(xiàn)構(gòu)件的自動分類,有效地提高構(gòu)件的查詢效率。兇為構(gòu)件可以采用XML文檔描述,而描述文檔可以作為構(gòu)件的標識,所以對構(gòu)件的聚類可以轉(zhuǎn)換為對其XML描述文檔的聚類。因此對XML文檔相似性和軟件構(gòu)件聚類進行研究具有非常重要的意義。 XML文檔是結(jié)構(gòu)信息和語義信息的綜合體,因此XML文
2、檔相似性的研究需要將結(jié)構(gòu)信息和語義信息兩者相結(jié)合。首先,XML文檔中非葉子節(jié)點重復(fù)出現(xiàn)使得相似性計算復(fù)雜化,通過重復(fù)約簡和嵌套約簡消除非葉子節(jié)點的重復(fù),使得XML文檔結(jié)構(gòu)簡化;然后,分析XML文檔特征,對前人提出的結(jié)構(gòu)化遞歸模型作了擴展,利用元素間的有序嵌套來體現(xiàn)XML文檔的結(jié)構(gòu)信息,充分考慮標簽、標簽的權(quán)重以及葉子節(jié)點值及其權(quán)重,使用WordNet和自定義的相似字典SD來計算XML文檔標簽的語義信息,通過給出的公式計算葉子節(jié)點的相似性
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- XML文檔相似性的研究及其在文檔聚類中的應(yīng)用.pdf
- XML文檔結(jié)構(gòu)相似度研究及在文檔聚類中應(yīng)用.pdf
- XML文檔語義相似性研究綜述.pdf
- XML文檔圖結(jié)構(gòu)相似性計算.pdf
- 遺傳算法在XML文檔聚類中的研究.pdf
- KNN分類和FCM聚類中相似性度量的研究.pdf
- XML文檔的聚類研究.pdf
- XML文檔聚類研究與應(yīng)用.pdf
- 時間序列相似性聚類算法研究.pdf
- Web挖掘中的XML文檔聚類研究.pdf
- 面向相似性的時間序列聚類方法研究.pdf
- 音樂相似性研究及其在檢索系統(tǒng)中的應(yīng)用.pdf
- PolInSAR圖像相似性參數(shù)及其在地物分類中應(yīng)用的研究.pdf
- 風速相似性形態(tài)研究及其在短期風速預(yù)測中的應(yīng)用.pdf
- 極化相似性度量及其在變化檢測中的應(yīng)用.pdf
- 語義相似性度量及其在設(shè)計管理系統(tǒng)中的應(yīng)用.pdf
- 基于XML文檔相似度與聚類相結(jié)合的代碼抄襲檢測研究.pdf
- 時間序列的相似性挖掘及其在股票時間序列中的應(yīng)用.pdf
- 基于密度方法的XML文檔聚類研究.pdf
- 基于遺傳算法的XML文檔聚類的研究與應(yīng)用.pdf
評論
0/150
提交評論