銀行機構(gòu)不良資產(chǎn)分類研究

時間:2022-07-10 10:04:43

導(dǎo)語:銀行機構(gòu)不良資產(chǎn)分類研究一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

銀行機構(gòu)不良資產(chǎn)分類研究

【摘要】商業(yè)銀行信用風(fēng)險管理一直是全面風(fēng)險管理(ERM)的重要組成部分,對于地方法人銀行機構(gòu)而言,不良資產(chǎn)的識別和分類是信用風(fēng)險管理的重點和難點。針對我國中小法人銀行面臨的不良貸款信用風(fēng)險問題,引入一種基于數(shù)據(jù)挖掘技術(shù)的KNN分類算法進行建模,對不良資產(chǎn)信用風(fēng)險進行識別分類,并選取湖南S農(nóng)商行和B農(nóng)商行2017年末全部信貸數(shù)據(jù)進行實證。

【關(guān)鍵詞】KNN算法;風(fēng)險管理;不良資產(chǎn)

一、引言

金融是現(xiàn)代經(jīng)濟的核心,銀行市現(xiàn)代金融的核心,現(xiàn)代商業(yè)銀行在經(jīng)營和發(fā)展過程中,因為籌集融通資金,中間環(huán)節(jié)會積累大量不良資產(chǎn)。由于歷史上和現(xiàn)實上的原因,我國農(nóng)信系統(tǒng)的地方法人金融機構(gòu)累積了大量的不良資產(chǎn),雖然經(jīng)過央行票據(jù)置換和農(nóng)商行改革已經(jīng)置換、清收了大量的不良資產(chǎn),但是由于地方法人銀行機構(gòu)信用風(fēng)險管理能力較差,人才隊伍培養(yǎng)滯后,故對不良資產(chǎn)的事前識別能力極弱[1]。目前國內(nèi)銀行業(yè)對不良資產(chǎn)信用風(fēng)險評估方法主要是采用古典分析法和多元統(tǒng)計法。古典分析法是指銀行經(jīng)營者依賴一批訓(xùn)練有素的專家主觀判斷,對信貸項目進行判斷打分,審貸會以此決策。多元統(tǒng)計分析的基本思路是根據(jù)歷史積累的樣本建立統(tǒng)計模型,對新樣本發(fā)生的某種事件的可能性進行預(yù)測的方法,包括線性概率和判別分析法等[2]。以上所述方法雖然被廣泛應(yīng)用,但是他們只是針對某一方面如財務(wù)進行分析和統(tǒng)計,不能充分利用銀行搜集的全面信息,尤其是一些邊緣信息。大量的數(shù)據(jù)挖掘研究結(jié)果表明,很多邊緣信息和側(cè)面指標可以很好地補充單一財務(wù)指標的缺陷,使借款項目的特征更加鮮明,故本文引入K近鄰算法建模,試圖用新辦法解決信用風(fēng)險識別、評估的舊問題[3]。

二、模型設(shè)計

K近鄰(K-NearestNeighbors,KNN)算法是一種基于實例的數(shù)據(jù)挖掘分類算法,最初是由Cover和Hart于1968年提出,是一種非參數(shù)的分類技術(shù)。通過計算每個訓(xùn)練樣例到待分類樣品的距離,取和待分類樣品距離最近的K個訓(xùn)練樣例,K個樣品中哪個類別的訓(xùn)練樣例占多數(shù),則待分類元組就屬于哪個類別。KNN算法具體步驟如下:(1)初始化距離為最大值,包涵全部樣本。(2)計算每個位置樣本和每個訓(xùn)練樣本的距離dist。(3)得到目前K個近鄰樣本中的最大距離MD。(4)如果dist小于MD,則將該訓(xùn)練樣本作為K近鄰樣本。(5)重復(fù)步驟(2)、(3)、(4),掃描樣本庫,直到未知樣本和所有訓(xùn)練樣本的距離都計算完。(6)統(tǒng)計K個近鄰樣本中每個類別出現(xiàn)的次數(shù)。(7)選擇出現(xiàn)頻率最大的類別作為未知樣本的類別。(8)利用前7步訓(xùn)練得出的模型進行預(yù)測。KNN方法在類別決策時,只與極少數(shù)的相鄰樣本相關(guān),因此采用該種方法可以較好地樣本的不平衡的問題。由此可見,KNN算法對K值即近鄰種類的數(shù)量依賴較大,如果K值較小,預(yù)測目標容易產(chǎn)生變動性,K值太大,模型的預(yù)測誤差可能會過大。為防止樣本密度差異過大,故K值選取須反復(fù)驗證,根據(jù)前人研究經(jīng)驗推定K值的有效途徑是通過有效參數(shù)數(shù)目這個概念,有效參數(shù)數(shù)目是與K值相關(guān)的,約等于n/K,其中n是這個訓(xùn)練數(shù)據(jù)集中實例的數(shù)目[4]。

三、實證分析

本文選取湖南永州境內(nèi)S農(nóng)商行和B農(nóng)商行全部信貸數(shù)據(jù)作為實證樣本。首先對數(shù)據(jù)進行處理,對缺損數(shù)據(jù)和重復(fù)數(shù)據(jù)進行了清洗,選取12450個樣本,13個特征值作為有效數(shù)據(jù)。將數(shù)據(jù)庫的英文字符和中文字符全部轉(zhuǎn)化為雙精度浮點型數(shù)據(jù),然后利用虛擬變量函數(shù)對雙精度浮點型數(shù)據(jù)全部進行編碼,樣本屬性標簽正常貸款和不良貸款分別用0和1表示。在實證環(huán)節(jié),隨機選取40%的樣本作為測試樣本,共進行40次交叉驗證。在交叉驗證環(huán)節(jié)K值選取6時,預(yù)測和訓(xùn)練效果最佳。40次交叉驗證預(yù)測標簽為1的不良貸款結(jié)果如下表。K值為4時,準確率為0.732;K值為5時,準確率為0.772;K值為6時,準確率為0.862;K值為7時,準確率為0.753;K值為8時,準確率為0.604。全部40次隨機交叉驗證的準確率均值為0.745,標準誤差為0.116。透過該模型的實證結(jié)果,我們還可以看到B農(nóng)商行和S農(nóng)商行存在如下幾個現(xiàn)象:一是個別信貸經(jīng)理不良貸款筆數(shù)奇高,占到全部不良貸款的15.63%,而貸款“三查”制度執(zhí)行未見差錯,內(nèi)部審計也未發(fā)現(xiàn)嚴重問題,當是與該信貸經(jīng)理能力和素質(zhì)有關(guān)。二是存在不良貸款在某些區(qū)域集中分布的情況,普遍存在居委會的不良貸款筆數(shù)超過以村為名的行政聚居區(qū),經(jīng)過實地調(diào)查發(fā)現(xiàn)是純農(nóng)業(yè)地區(qū)(村)授信筆數(shù)少于工商業(yè)為主的聚居區(qū)(居委會)。分屬同一支行,有別個行政聚居區(qū)(村、居委會)不良貸款筆數(shù)明顯超過其他行政聚居區(qū),該個別居委會民風(fēng)較為拖沓,習(xí)慣性欠息[5]。三是貸款投向劃分不準確,導(dǎo)致該項聚類出現(xiàn)偏差,在農(nóng)商行的樣本中,95.4%的貸款投向均是農(nóng)林牧漁業(yè),原因是為了獲得再貸款、再貼現(xiàn)支持,人民銀行信貸考核需要涉農(nóng)貸款比例達標,實際導(dǎo)致信用風(fēng)險識別不準確[6]。

四、結(jié)論和建議

利用KNN算法構(gòu)建的不良資產(chǎn)分類模型的準確率較高,穩(wěn)定性較強,在多次交叉驗證后,可以選擇合適的K值,獲得較好的預(yù)測效果,故模型實用價值很高。但法人銀行機構(gòu)的關(guān)聯(lián)交易和流動性狀況是該模型不能識別的,股東的高額關(guān)聯(lián)貸款給法人銀行帶來的信用風(fēng)險是極大的,極端情況的流動性短缺會讓法人銀行機構(gòu)經(jīng)營困難,結(jié)合聲譽風(fēng)險,可能會被處置當局警告、早糾甚至接管[7]。

作者:劉翔鵬 單位:中國人民銀行永州市中心支行