基于套索的小微企業(yè)貸款審批_第1頁
已閱讀1頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、<p>  基于套索的小微企業(yè)貸款審批</p><p>  [提要] 小微企業(yè)是民生銀行三大核心客戶群體之一,根據(jù)民生銀行天津分行商貸通申請材料,整理出24個指標。以授信額度為因變量,其他變量為自變量。采用最小角回歸、廣義線性模型彈性網(wǎng)和分組group lasso三種方法計算。結(jié)果發(fā)現(xiàn)lasso變量選擇功能最強,彈性網(wǎng)次之,而分組group lasso較弱。綜合幾種方法結(jié)果,企業(yè)從事行業(yè)對于銀行貸款授信

2、額度影響最大,一般建筑、交通運輸設(shè)備容易獲得貸款,而從事金屬、日用品的企業(yè)較難獲得更多貸款。 </p><p>  關(guān)鍵詞:小微金融;lasso;最小角回歸 </p><p>  中圖分類號:F83 文獻標識碼:A </p><p>  收錄日期:2013年4月20日 </p><p>  小微企業(yè)貸款是民生銀行的重要特色之一,截至2011年

3、末,中國民生銀行的小微企業(yè)貸款余額已經(jīng)超過2,300億元人民幣(約合360億美元),不良貸款率只有千分之一點五左右,民生銀行已經(jīng)成為全球最大的小微企業(yè)金融服務(wù)提供商。小微企業(yè)客戶具有戶數(shù)眾多、客戶分散等特征。在中國銀行業(yè),小微企業(yè)貸款一直被認為是“高信用風(fēng)險、高人工成本”的業(yè)務(wù),20世紀八十年代中國各大國有銀行都有過給小商戶貸款遭遇巨額不良貸款的慘痛經(jīng)歷。如何篩選優(yōu)質(zhì)可靠小微企業(yè),降低信用風(fēng)險是進軍小微企業(yè)貸款領(lǐng)域首先需要思考的問題。本

4、文結(jié)合天津民生支行實際情況,從貸款小微企業(yè)申請表格中整理出一套指標體系,利用lasso篩選出重要影響指標,方便操作,對于風(fēng)險評估、確定授信額度等提供借鑒和幫助。 </p><p>  一、小微企業(yè)貸款分析指標 </p><p>  小微企業(yè)客戶具有戶數(shù)眾多,客戶分散等特征?!吧藤J通”目標市場選擇的基本原則在于運用“大數(shù)法則”測算出特定行業(yè)的風(fēng)險概率,甄選“商貸通”業(yè)務(wù)進入的行業(yè),迅速地找到

5、有效客戶群體,并對其進行批量營銷。 </p><p>  最后整理指標體系包括24個指標,有姓名、性別、年齡、婚姻狀況、有無子女、最高學(xué)歷、已有額度、我行余額、資產(chǎn)合計、負債余額、月供支出、信用記錄、從事行業(yè)I、從事行業(yè)II、從業(yè)年限、經(jīng)營模式、員工人數(shù)、年經(jīng)營收入、半年流水、年利潤、公司信用、行業(yè)利潤額、擔保方式、授信額度。其中,一類行業(yè):批發(fā)和零售業(yè),制造業(yè),住宿和餐飲業(yè),交通運輸、倉儲郵政業(yè),信息傳輸、計算

6、機服務(wù)和軟件業(yè),租賃和商務(wù)服務(wù)業(yè),居民服務(wù)和其他服務(wù)業(yè),建筑業(yè),房地產(chǎn)業(yè),教育,文化、體育、娛樂業(yè),其他。二類行業(yè):食品,飲料,煙草,紡織,服裝,日用品,文化體育用品,器材,醫(yī)藥、醫(yī)療設(shè)備,家具,建材,工藝品,五金交電,機械設(shè)備,通信設(shè)備、計算機、電子,皮革毛皮,造紙,塑料,橡膠,非金屬,金屬,金屬制品,交通運輸設(shè)備,化學(xué)制品,儀器儀表,專用設(shè)備,通用設(shè)備,廢棄資源和廢舊材料回收加工業(yè),代理。 </p><p>

7、  指標體系中有數(shù)值型和分類指標,數(shù)值型指標可以直接分析,而分類指標需要編碼之后才能分析。該指標體系按照申請人在民生貸款時所填表格整理得到,主要包括個人基本情況、家庭資產(chǎn)及負債狀況和公司情況三個方面。由于指標太多,希望從中找出授信額度的最重要影響指標,方便以后貸款審批和分析。 </p><p>  二、lasso方法 </p><p>  所謂lasso,也有翻譯成套索,其全稱是least

8、 absolute shrinkage and selection operator。最早提出lasso的是Tibshirani在1996年Journal of the Royal Statistical Society:Series B 上的一篇文章Regression shrinkage and selection via lasso。對于線性回歸,在普通最小二乘的基礎(chǔ)上加入L1范數(shù)懲罰。其想法是在限制了系數(shù)總和的情況下,求使得殘差

9、平方和達到最小的回歸系數(shù)的估值。 </p><p>  min(y-xβ) </p><p><b>  s.t. </b></p><p><b>  β≤s </b></p><p>  其中,y是第i個樣本的輸出值,總共N個樣本。x是第i個樣本的第j個輸入變量,β是第j個輸入變量,總共p個輸入

10、變量。 </p><p>  但是,lasso提出之后沒有受到太多關(guān)注,直到2002年Efrn提出最小角回歸之后,才變成熱點。Tibshirani自己分析可能是如下原因: </p><p>  (1)1996年提出的lasso算法相比于今天太慢; </p><p> ?。?)當時lasso算法是個“黑箱子”,沒有顯著的解釋; </p><p>

11、; ?。?)稀疏性(sparsity)的重要性并沒有被人們認識; </p><p> ?。?)海量數(shù)據(jù)問題較少; </p><p> ?。?)當時R語言沒有流行,幾年之后R語言可以輕松分享最新算法軟件。 </p><p>  三、lasso分析結(jié)果 </p><p>  由于所選指標中有數(shù)值類型和分類變量,數(shù)值變量可以直接處理,分類變量回歸之

12、前需要編碼。本文采用虛擬編碼,涉及到性別、婚姻狀況、有無子女、從事行業(yè)I、從事行業(yè)II、經(jīng)營模式、公司信用、擔保方式8個分類變量,編碼之后總共38個變量,增加了15個變量。 </p><p>  R語言中有多個宏包附帶lasso算法,最有名的就是Efron的最小角回歸lars包,該包的lars函數(shù)提供了lasso四種算法:凸二次規(guī)劃的“l(fā)asso”,最小角回歸“l(fā)ar”、前向逐步回歸“forward.stagew

13、ise”和階梯式算法“stepwise”。擬合之前需要將每個自變量和因變量標準化,減去均值,除以標準差,使得每個變量均值為零,方差為1。將授信額度為因變量,其他所有變量為自變量。挑選出對授信額度影響最大的變量指標。系數(shù)路徑如圖1所示,圖形橫坐標表示不同取值下,38個變量系數(shù)向量的L1范數(shù)與最大向量L1范數(shù)比值??v坐標表示不同情況下,38個系數(shù)取值。當限制系數(shù)向量L1范數(shù)不同值時,所估計系數(shù)不盡相同。到底限制多少時,所得系數(shù)估計最優(yōu)。一般

14、采用十折交叉證實計算均方誤差,取最小均方誤差對應(yīng)的系數(shù)向量L1范數(shù)限制。(圖1) </p><p>  最后選擇結(jié)果表明,從事行業(yè)II對貸款授信額度影響最大,其次為婚姻狀況,最后為已有額度。按照銀行業(yè)務(wù)員的經(jīng)驗,行業(yè)對于授信額度審批至關(guān)重要。利潤率高的行業(yè)獲批授信額度更多。系數(shù)最大的是從事行業(yè)II交通運輸設(shè)備0.43,表明交通運輸設(shè)備行業(yè)備受銀行青睞,從事建材的企業(yè)也容易獲批貸款。從事行業(yè)II金屬、從事行業(yè)II日

15、用品、從事行業(yè)II醫(yī)藥、醫(yī)療設(shè)備和從事行業(yè)II儀器儀表系數(shù)為負,表明與基準代理行業(yè)相比,這些行業(yè)獲批貸款更難一些。 </p><p>  已婚和離異的申請人對于授信額度的影響差別不大,但是相比于未婚申請人,已婚和離異申請人申請的授信額度要大得多。一般未婚申請人比較年輕,事業(yè)剛剛起步,獲得的授信額度較小。但是,已婚和離異的申請人年齡較大,都是事業(yè)有成的成功人士,獲批的額度較大。在民生銀行已有貸款額度系數(shù)很小,前兩位

16、小數(shù)為零。由于該指標強調(diào)的是在民生銀行本行的貸款額度,沒有考慮申請人在其他銀行的貸款,不能完全反映申請人貸款情況,所以其系數(shù)較小,但是認為已有貸款額度對于授信額度具有較大影響。 </p><p><b>  四、總結(jié) </b></p><p>  本文從民生銀行小微企業(yè)貸款申請表格中提取24個指標,以授信額度為因變量,其他變量為自變量。利用lasso的變量選擇功能,從

17、中挑選出對于貸款影響的一些變量,方便銀行人員審核和批復(fù)。結(jié)果表明:企業(yè)所在的行業(yè)對于貸款的影響最大,銀行可以根據(jù)不同行業(yè)進行專業(yè)分析。 </p><p><b>  主要參考文獻: </b></p><p>  [1]Tibshirani R.Regression shrinkage and selection via the lasso[J].Journal of

18、the Royal Statistical Society.Series B(Methodological),1996. </p><p>  [2]Efron B,Hastie T,Johnstone I,et al.Least angle regression[J].The Annals of statistics,2004.32.2. </p><p>  [3]王占鋒,吳耀華,趙林

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論