基于程序切片的軟件缺陷預測.pdf_第1頁
已閱讀1頁,還剩94頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、軟件缺陷的多少直接反映了整個軟件質(zhì)量的好壞,每一個軟件中的缺陷都必須得到妥善的處理,可靠的基于軟件倉庫的缺陷預測則在軟件缺陷的發(fā)現(xiàn)和移除中起著至關(guān)重要的作用。首先,它能夠指導軟件開發(fā)人員將有限的資源投入到更容易產(chǎn)生缺陷的模塊中,從而提高軟件質(zhì)量。而在關(guān)鍵軟件的評估中,基于軟件倉庫的缺陷預測在決定軟件是否可以投入使用時起著決定性的作用。雖然研究者們使用數(shù)據(jù)挖掘和機器學習的方法已經(jīng)得出了比較滿意的預測準確度,但是直接將機器學習的模型用于缺陷

2、預測會產(chǎn)生很多和軟件缺陷經(jīng)驗相矛盾的問題。而這些問題會影響到預測的準確性。
  本文首先提出了一套軟件缺陷預測的方法,使用該方法對已有的三個預測算法CART、樸素貝葉斯、C4.5,進行了預測預測的比較,隨后,在C4.5決策樹算法的基礎(chǔ)上,針對軟件倉庫計算出來的指標的特點對算法進行了改進,改進算法引入了Spearman等級相關(guān)度,使得其決策樹在選取屬性作為根結(jié)點更為符合開源軟件缺陷的實際情況。同時,本文還提出了一種新的預測粒度—切片

3、粒度,該粒度是通過對程序中的函數(shù)按照其在函數(shù)調(diào)用圖中的距離進行聚類得到的。
  為了驗證改進算法以及新預測粒度的有效性,本文提出了一個缺陷預測方法,該預測方法是由預測指標以及預測算法組成,整個預測過程分為三個主要步驟:一、挖掘指標,從軟件倉庫中挖掘出用于預測的指標,包括源代碼指標、變更指標、缺陷指標、切片指標等;二、預測,將挖掘出的指標輸入預測算法中,得出該算法對挖掘出的指標做出的預測;三、預測算法改進,針對指標數(shù)據(jù)特點和指標跟缺

4、陷的關(guān)聯(lián)度來改進算法,使用第一步挖掘出的指標做出預測。
  最后,本文將改進預測算法與已有算法用到預測方法中做了缺陷預測的比較,實驗表明,改進后的缺陷預測算法大大地降低了決策樹的規(guī)模,并且在兩個模塊的缺陷預測準確率上分別提高了4.5802和4.8656個百分點。另外,本文還做了切片粒度和文件粒度的對比實驗,實驗表明,在不包含零缺陷函數(shù)的情況下,無論是訓練集還是測試集,切片粒度的準確率要明顯高于文件粒度的準確率,在訓練集和測試集上分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論