基于非平衡數(shù)據(jù)集聚類案例推理的企業(yè)失敗預(yù)警.pdf_第1頁(yè)
已閱讀1頁(yè),還剩59頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、案例推理(Case-Based Reasoning,CBR)是商業(yè)預(yù)測(cè)領(lǐng)域的預(yù)測(cè)方法之一,它在保持較好預(yù)測(cè)性能的同時(shí)可對(duì)預(yù)測(cè)結(jié)果做出解釋。企業(yè)經(jīng)營(yíng)中,失敗企業(yè)比例小,正常企業(yè)比例大,但一個(gè)企業(yè)的失敗所造成的損失不可小覷,故構(gòu)造一個(gè)對(duì)少數(shù)類有較高預(yù)測(cè)準(zhǔn)確率的方法是非常有意義的。對(duì)于由少數(shù)類和多數(shù)類組成的商業(yè)預(yù)警問(wèn)題,構(gòu)建的方法往往是基于平衡數(shù)據(jù)集的假設(shè),因此在解決非平衡數(shù)據(jù)集問(wèn)題時(shí)對(duì)少數(shù)類的預(yù)警不理想。對(duì)此問(wèn)題,本文集成聚類算法到案例推理

2、中,設(shè)計(jì)了聚類案例推理方法CCBR(Clustering CBR)。CCBR方法首先將案例庫(kù)中案例通過(guò)層次聚類算法形成若干個(gè)案例類,并計(jì)算得到每個(gè)案例類的聚類中心;在案例檢索時(shí),將目標(biāo)案例與這些聚類中心進(jìn)行最近鄰案例類檢索,找到最相似的案例類后,再在該類內(nèi)檢索出若干個(gè)近鄰作為匹配案例對(duì)目標(biāo)案例進(jìn)行預(yù)測(cè)?;谒膫€(gè)非平衡數(shù)據(jù)集,本文將CCBR方法與傳統(tǒng)案例推理方法CBR、SVM方法、LOGIT方法和MDA方法做了對(duì)比。實(shí)驗(yàn)結(jié)果表明,CCBR

3、方法可顯著提高CBR預(yù)測(cè)非平衡數(shù)據(jù)集中少數(shù)類案例的召回率。
   鑒于非平衡數(shù)據(jù)集中的少數(shù)類的重要地位,正確識(shí)別少數(shù)類反映了所構(gòu)建方法的預(yù)警性能及其應(yīng)用價(jià)值。傳統(tǒng)消除數(shù)據(jù)集非平衡性的方法有過(guò)學(xué)習(xí)或信息丟失等缺陷,同時(shí)失去了對(duì)現(xiàn)實(shí)數(shù)據(jù)分布的真正模擬。相比較而言,通過(guò)算法的改進(jìn)來(lái)處理非平衡數(shù)據(jù)集具有更好的問(wèn)題針對(duì)性,CCBR正是通過(guò)算法的改進(jìn)來(lái)直接處理非平衡數(shù)據(jù)集的方法。通過(guò)實(shí)驗(yàn)結(jié)果的對(duì)比分析可看出CCBR的優(yōu)勢(shì):對(duì)于非平衡數(shù)據(jù)集,

4、CCBR可一直保持相對(duì)較高的召回率,即對(duì)案例數(shù)目較少的類有較高的檢對(duì)率。本研究中t-1和t-2數(shù)據(jù)集是企業(yè)失敗前一年數(shù)據(jù)和前兩年非平衡數(shù)據(jù)集,通過(guò)應(yīng)用CCBR方法,這兩個(gè)數(shù)據(jù)集可以及時(shí)地在前一年或前兩年對(duì)企業(yè)危機(jī)做出預(yù)警,積極地防患于未然。
   在文章結(jié)構(gòu)安排上,本文首先指出了選題背景和研究意義,對(duì)有關(guān)非平衡數(shù)據(jù)集的分類預(yù)警、案例推理的性能研究、聚類算法在案例推理中的應(yīng)用和企業(yè)失敗預(yù)警方法的研究狀況作了回顧,并結(jié)合本文的研究實(shí)

5、際,說(shuō)明了文中用到的研究領(lǐng)域和方向。其次,對(duì)案例集中指標(biāo)屬性的選取和屬性規(guī)范化方法做了研究。然后對(duì)聚類案例推理的基本原理做以介紹,說(shuō)明聚類案例推理算法中案例類的生成、聚類數(shù)目的確定、案例類和案例的檢索以及預(yù)警。最后,對(duì)初始案例庫(kù)做以簡(jiǎn)單介紹,進(jìn)一步說(shuō)明了實(shí)驗(yàn)中所使用的屬性規(guī)范化方法及性能評(píng)估指標(biāo),并給出了CCBR方法與CBR、SVM、LOGIT和MDA方法的性能對(duì)比試驗(yàn)結(jié)果和分析說(shuō)明。通過(guò)20個(gè)目標(biāo)案例,初步考察了CCBR方法的實(shí)用價(jià)值

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論