個(gè)人信用評分組合模型研究與應(yīng)用.pdf_第1頁
已閱讀1頁,還剩145頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、個(gè)人信用不僅是國家建設(shè)道德文化和市場倫理的基礎(chǔ),還是一個(gè)推動(dòng)國家經(jīng)濟(jì)發(fā)展的巨大資源。充分開發(fā)和利用個(gè)人信用資源,能夠有效地優(yōu)化資源配置、拉動(dòng)消費(fèi)并最終促進(jìn)經(jīng)濟(jì)發(fā)展。一些西方國家早在一百多年前就建立了個(gè)人信用制度,為其市場經(jīng)濟(jì)的正常運(yùn)行打下了堅(jiān)實(shí)基礎(chǔ)。而在我國,個(gè)人信用制度的建立在2000年才開始起步,研究和應(yīng)用水平遠(yuǎn)遠(yuǎn)落后與發(fā)達(dá)國家。個(gè)人信用評分是個(gè)人信用制度的核心,科學(xué)地對個(gè)人信用狀況進(jìn)行評估有助于促進(jìn)個(gè)人信貸業(yè)務(wù)的發(fā)展,降低個(gè)人信貸

2、風(fēng)險(xiǎn)。
   本文在分析國內(nèi)外個(gè)人信用評分發(fā)展歷史及其方法應(yīng)用現(xiàn)狀的基礎(chǔ)上,指出目前個(gè)人信用評分是一個(gè)集缺失數(shù)據(jù)填補(bǔ)、異常值檢測和處理、連續(xù)數(shù)據(jù)離散化、樣本結(jié)構(gòu)優(yōu)化、指標(biāo)體系選擇、模型設(shè)計(jì)、評價(jià)和應(yīng)用為一體的評估系統(tǒng)。針對缺失數(shù)據(jù)問題,將多種填補(bǔ)方法的應(yīng)用效果進(jìn)行了比較。得出在數(shù)據(jù)缺失率在10%以內(nèi)時(shí)采用刪除法是最佳選擇,在20%~40%之間時(shí)多重填補(bǔ)是最有效的處理方法。對異常值和異常實(shí)例的檢測及處理進(jìn)行了分析,提出了異常實(shí)例檢

3、測的組合方法,結(jié)果表明異常值的處理有助于提高個(gè)人信用評分模型的分類精度。采用等距區(qū)間、等頻區(qū)間以及基于熵的方法對連續(xù)屬性進(jìn)行了離散化,結(jié)果表明離散化能夠減小異常值對個(gè)人信用評分模型的影響、提高評分模型的預(yù)測精度,有利于個(gè)人隱私的保護(hù)。在數(shù)據(jù)層面和算法層面對信用數(shù)據(jù)中的結(jié)構(gòu)不平衡問題進(jìn)行了研究,實(shí)驗(yàn)結(jié)果表明兩個(gè)層面上的處理方法都能有效地提高對壞客戶的識別正確率。其中基于最近鄰的SMOTE過抽樣方法簡單易行,在處理不平衡數(shù)據(jù)問題時(shí)有最好的應(yīng)

4、用效果。在對各種指標(biāo)重要程度排序方法進(jìn)行比較的基礎(chǔ)上,提出采用組合方法能夠綜合考慮各種排序信息,獲得更為穩(wěn)健的指標(biāo)重要性排序結(jié)果。測試了機(jī)器學(xué)習(xí)中的最優(yōu)特征子集選擇方法在個(gè)人信用評分指標(biāo)體系構(gòu)建中的應(yīng)用效果,為構(gòu)建個(gè)人信用評分指標(biāo)體系提供了新的思路。
   對五種最常見的個(gè)人信用評分單一模型進(jìn)行了應(yīng)用和比較,實(shí)驗(yàn)結(jié)果表明:Logistic回歸對數(shù)據(jù)沒有嚴(yán)格假設(shè)條件、穩(wěn)健性好、可解釋性強(qiáng)、建模過程簡單易操作,但分類精度略低于人工智

5、能模型。C4.5決策樹模型對數(shù)據(jù)沒有嚴(yán)格假設(shè)條件、模型分類精度較高、可解釋性較強(qiáng),能輸出簡單直觀的評分規(guī)則,但缺點(diǎn)是模型穩(wěn)健性不夠,容易出現(xiàn)過擬合,且建模過程比較依賴專家知識和經(jīng)驗(yàn)。貝葉斯網(wǎng)絡(luò)的穩(wěn)定性好、可解釋性較強(qiáng),能輸出網(wǎng)絡(luò)圖,直觀地揭示屬性和違約概率之間的關(guān)系、建模過程簡單易行,但主要缺點(diǎn)是模型分類精度較低。BP神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)沒有假設(shè)條件、分類精度高,能模擬數(shù)據(jù)間復(fù)雜的非線性關(guān)系,但缺乏穩(wěn)健性和可解釋性,而且建模過程嚴(yán)重依賴專家知

6、識和經(jīng)驗(yàn)。支持向量機(jī)對數(shù)據(jù)也沒有假設(shè)條件、分類精度高。但缺點(diǎn)是缺乏可解釋性和穩(wěn)定性,建模過程依賴專家知識和經(jīng)驗(yàn)??傊?,目前存在的多種個(gè)人信用評分統(tǒng)計(jì)模型和非統(tǒng)計(jì)模型都各有特點(diǎn),沒有一種能夠達(dá)到分類精度和穩(wěn)健性的統(tǒng)一。
   針對精確度與穩(wěn)健性無法兼顧問題,本文利用組合思想構(gòu)建了多種結(jié)構(gòu)的組合模型并進(jìn)行了應(yīng)用。實(shí)驗(yàn)結(jié)果表明,把神經(jīng)網(wǎng)絡(luò)或支持向量機(jī)和Logistic回歸按照串行結(jié)構(gòu)結(jié)合在一起構(gòu)成組合模型有助于提高信用評分的分類精度和

7、穩(wěn)健性。但由于多重共線性的存在,使模型丟失了可解釋性。異態(tài)并行結(jié)構(gòu)組合模型能顯著提高分類精度和穩(wěn)健性,但是模型構(gòu)造復(fù)雜,依賴于專家知識和經(jīng)驗(yàn),不利于推廣應(yīng)用。Bagging、boosting集成模型在分類精度和穩(wěn)健性上也都有很好的表現(xiàn),而且構(gòu)造相對簡單,較少依賴專家知識和經(jīng)驗(yàn),有利于在個(gè)人信用評分領(lǐng)域的推廣。Rsm集成模型能在高維度的數(shù)據(jù)集上取得了和bagging、boosting集成模型相當(dāng)?shù)姆诸愋阅?,但不適合處理特征變量過少的個(gè)人信

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論