商業銀行個人信貸信用評分模型分析論文
時間:2022-02-01 04:30:00
導語:商業銀行個人信貸信用評分模型分析論文一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
一、文獻回顧
從歷史的視角來看,我國銀行業最初是以對公業務為主,其特點是機構客戶數量較少、資金規模大、參與的銀行業務人員也較少。然而,面對經濟全球化和金融國際化的激烈競爭,特別是隨著外資銀行的不斷進人,極大地加劇了銀行產品和服務競爭的白熱化。因此,對私業務,即個人信貸業務這一發達國家銀行的重要基礎業務和利潤支柱將成為我國商業銀行今后發展的重點領域。個人信貸業務,例如房貸、車貸、信用卡消費及其他個人消費貸款,其特點是單筆業務的資金規模小、業務復雜且數量大,因此如繼續沿用傳統的人工審批方法,則必將占用銀行大量的業務人員,增加成本,降低效率,從而影響銀行競爭力,同時也不符合全球銀行業的發展趨勢。
在國外已經發展了50年的信用評分是以計算機技術為核心的,以取代人力為特征的大規模自動化處理方法,是發達國家普遍采用的能夠有效控制風險、降低業務人員數量、極大提高審批效率的商業銀行革命性措施之一。因此,構建個人信貸信用評分模型對銀行開展個人消費信貸業務有重要作用。
最初的信用評分是由評級人員依個人經驗進行主觀評價,之后發展到3C評價(品德、能力、擔保)和5C評價(品行、能力、資金、條件和抵押擔保)。這些多數是主觀、定性的評價方法。為了降低信用評分中的主觀因素,越來越多的定量評估方法被采用。這些方法主要包括:判別分析、Logistic回歸模型、線性規劃法、神經網絡法和分類決策樹法。
銀行常常采用某種統計方法建立個人信用評分模型,至于具體采用何種方法則取決于不同方法對不同問題的預測精度以及建模人員的知識及偏好。線性判別分析是第一個用于信用評分模型的簡單參數回歸模型,而Logistic回歸方法則是信用評分的一種常用方法,在預測二分性結果上,Logistic是一種準確性最高的技術。此外,其他的一些學者將一些非參數統計模型,如K—近鄰判別、分類樹應用于信用評分。
近年來在信用評分領域也開始嘗試引入神經網絡方法,Desai等和West等人都使用神經網絡技術來構造個人信用評分模型。通過實證分析,他們驗證了在各種變量間呈現復雜的非線性關系的情況下,神經網絡技術所具有的明顯優勢(Desai,1996;West,2000)。
分類樹是一種由計算機實現,基于統計理論的非參數識別方法。分類樹把貸款申請者進行不斷的分類,盡量使每一類申請者都具有相似的違約風險,并且與其他類別貸款申請者的違約風險明顯不同(石慶焱,2004),分類樹方法充分利用先驗信息處理數據間的非同質關系,可有效地對數據進行分類。該方法雖簡單,但具有很高的分類精確度和分類效率,適合于樣本數據量較大的情況。
盡管許多銀行通常會采用不同的技術方法來建立個人信用評分模型,但是在實際信貸決策中將不同的模型結合起來使用也是一種常用的方法,這樣做的目的往往是為了節省成本。例如,信貸機構利用貸款人申請表中的數據建立個人信用評分模型,若這一模型有助于對申請人做出批準與否的貸款決定,就可以僅利用該模型;反之,則還需使用外部信用評分機構的評分結果對其進行評價(Thomas,2002)。
在個人住房貸款的決策中,許多銀行都按“貸款—收入比”事先對客戶進行分類而過濾掉一批申請人,然后在此基礎上再利用信用評分模型進行評分。摩根大通在個人住房貸款行為評分模型中,則將外部信用評分機構的評分作為Logistic回歸模型的解釋變量之一,以提高模型的預測精度(Mogern,2002)。
關于將不同的評分模型綜合起來使用,目前在學術文獻中積累的資料還不多,其中較有影響的是:Zhu,Belling和Overstreet(1999)考察了一組汽車貸款樣本的組合評分問題,他們利用這組樣本的申請信息建立了一個評分模型,并從外部信用評分機構取得了這些客戶的外部信用評分,然后構造了一個組合評分模型,研究結果表明,如果組合系數設置得好,組合模型的評分就有可能優于單個模型的評分。Tian等(2002)則提出了一種“兩階段混合神經網絡判別方法”,其做法是先利用線性判別分析方法挑選出對區分“好”“壞”客戶有顯著影響的特征變量,建立評分模型,將這些顯著性特征變量作為神經網絡模型的輸入單元,并將判別分析所得到的對各樣本的評分也作為輸入單元之一,然后建立神經網絡模型。他們認為,這樣的模型克服了單純使用神經網絡模型的一些缺陷,如可以挑選出有顯著意義的特征變量,從而簡化了模型的結構;可以更好地給出神經網絡的初始解從而縮短神經網絡訓練時間;還可以提高預測的精度等。
從我國銀行業的實踐來看,信用評分模型的應用還處于初級階段。由于缺乏有效的歷史數據的緣故(某些銀行通過其所建立的數據庫收集了部分歷史數據,但數據的質量較差),我國商業銀行普遍沒有建立起定量信用評分的模型,大多數銀行只是根據自身情況建立了基于專家判斷法的信用評分模型,但由于此模型的預測能力沒有經過系統的驗證,導致這些模型在實際業務中的應用實效大打折扣。目前,各商業銀行對個人信貸信用風險的評估主要還是依據客戶經理和專家的經驗判斷,因此迫切需要構建適當的信用評分模型。
二、信用評分模型整體框架的構建及其對個人住房貸款的應用
建立一套信用評分模型的整體分析框架有以下兩個方面的重要作用:首先,該框架的建立使得評分模型中所考慮的要素合理化、條理化和清晰化,從而可以以一個全局性的視角來進行模型的具體構建工作;其次,由這一框架所確定的完整備選變量集合也可以為銀行有針對性地收集和存儲個人信貸數據信息提供有益的指導和幫助。
考慮到信用評分模型的評估對象有客戶、產品(住房、汽車貸款等)和賬戶三類,從我國商業銀行的實際需要出發,本文選擇了產品水平的信用評分模型作為建模目標,構建了信用評分模型的整體框架(見圖1)。信用評分模型在整體框架上綜合考慮了借款人和債項兩方面因素,其中債項又被劃分成貸款方案、貸款投向和風險緩釋三個要素,借款人與這三個要素一起構成了整體框架中所考慮的四方面總體要素。對于不同的產品來說,借款人要素保持不變,而貸款方案、貸款投向和風險緩釋三要素的具體內容會有所不同,在圖l中我們以個人住房貸款為例給出了這三方面要素的具體內容。如果我們將該框架應用于其他信貸產品,如個人汽車貸款和個人消費貸款等,則只需在保持整體框架相對穩定的情況下將這三方面要素的具體內容做相應的修改即可。
在借款人要素中我們考慮了借款人還款能力和還款意愿兩方面內容,其中對于前者,以收入充足性和穩定性來度量借款人短期和長期還款能力;對于后者,以名譽度(代表違約的機會成本)和誠信度(代表歷史信用記錄)來進一步加以度量。在貸款方案中我們考慮了貸款本金、期限及還款方式等一些關鍵要素。由于對于個人住房貸款來說,作為貸款投向的房產(圖1虛線方框中的內容)和用于風險緩釋的抵押房產是同一個對象,因此我們沒有對此時的貸款投向要素做單獨考慮,而是將其合并到風險緩釋中統一考慮。在風險緩釋要素中我們考慮了房產抵押和其他緩釋方式,主要為住房擔保公司提供的擔保,而對于前者又以保值性(代表抵押的充足性)和必要性來進一步加以度量。
(一)信用評分模型的具體指標。根據圖1中信用評分模型的總體要素和細化要素,我們進一步設計了各細化要素中所包含的具體指標,并對各具體指標的取值范圍進行了匯總,以便在后面具體構建模型時使用(如表1所示)。
金融,銀行-[飛諾網]
(二)個人住房貸款信用評分模型的構建。與公司業務評級模型相同,個人信貸信用評分模型所使用的評分方法也可以分為三類:專家判斷法、定量模型法、專家判斷法和定量模型法相結合的方法。專家判斷法采用的是一種“自上而下”的建模方法,主要在沒有足夠歷史數據的情形下使用,這些情形包括:沒有建立數據庫來系統地存儲已有信貸業務的歷史數據、對于新的信貸產品或處于信貸產品的早期等,該方法的優點是考慮的評估因素比較全,靈活性較高,缺點是在沒有得到量化驗證的情況下難以確定模型的預測能力;定量模型法則采用的是一種“自下而上”的建模方法,主要是在有足夠歷史數據的情形下使用,類型上可分為Logistic回歸模型、多元線形回歸模型、決策樹模型以及神經網絡模型等,該方法的優缺點則剛好與前一方法相反;而專家判斷法和定量模型法相結合的方法(我們簡稱混合模型)則是綜合了上述兩方法的優點,因此本文選擇這一評級方法,并構建了以下兩個模型:基于專家判斷法的評分卡模型和基于定量模型法的Logistic回歸模型。
1.評分卡模型。該模型可以通過數學表達式來加以表達,其中:Xi為第i個評估變量的取值,wi為對應的權重,N為評估變量的總個數,Score為最終的得分值(越高越好)。進一步可依據最終的得分值對個人信貸的風險水平進行等級劃分,在該模型中Xi,wi都是基于個人信貸專家的經驗和主觀判斷來加以確定的。根據前文所構建的個人住房貸款信用評分模型的分析框架(參見圖1),并通過與個人信貸專家的廣泛交流,我們最終確定了如圖2所示的打分卡權重,其中:以100分為滿分,作為第一還款來源的借款人要素占有了最高的權重,為50分;包括住房抵押和擔保在內的風險緩釋要素作為第二還款來源占有次之的權重,為30分;貸款方案的權重占有剩余的20分,結合表1給出的收入充足性和穩定性、借款名譽度和誠信度等各細化要素的具體指標及其取值,我們就可以基于該評分卡來對個人住房貸款做出信用評分。
2.定量模型
(1)定量模型的構建方法。個人住房貸款信用評分定量模型的整個構建流程可以分為以下幾個步驟:
①建立指標體系。即給出個人住房貸款信用評分定量模型的使用指標范圍,類似于表1的內容。
②數據收集。即根據“正常貸款”和“不良貸款”的定義,收集包含所有指標在內的個人住房貸款數據樣本,此時要考慮到模型的觀察期、表現期的要求,其中:觀察期是指在建立信用評分模型時,解釋變量的歷史觀測時段;表現期是指建立信用評分模型時,被解釋變量或違約紀錄的觀測時段。對于我們所建立的個人住房貸款信用批準模型來說,其觀察期可選為12個月,表現期可選為10~15個月。
③數據清洗。數據清洗是保證模型分析效果的關鍵性步驟。不同來源的數據對同一個概念有不同的表示方法,在集成多個數據來源時,需要消除數據結構上的這種差異。此外,對于相似或重復記錄,需要檢測并且合并這些記錄,解決這些問題的過程稱為數據清洗過程。數據清洗的目的是檢測數據中存在的錯誤和不一致并加以修正,由此提高數據的完整性、正確性和一致性。
④變量篩選。變量篩選的目的是從整個指標體系中選擇出最終量化模型所需要使用的一組解釋變量,其過程大致為:用所有變量對違約記錄進行單變量回歸;找出對違約解釋能力最強的單個變量,將該變量與每單個剩余變量組合后進行雙因素回歸;找出對違約解釋能力最強的兩個變量,將這兩個變量再與每單個剩余變量進行三因素回歸;找出對違約解釋能力最強的三個變量,然后再進行四變量回歸,直到所選擇的變量個數達到預定的違約解釋能力為止,一般來說,最后使用的解釋變量個數不超過15個。
⑤模型估計。對于個人住房貸款信用評分模型而言,目前應用最廣泛的統計模型是Logistic回歸模型,在已知模型解釋變量的基礎上,應用收集的樣本數據對所選擇的模型進行參數估計,獲得各解釋變量的權重系數。
⑥模型驗證。模型驗證可分為定性和定量兩個方面,其中:定性驗證主要對模型的解釋變量及其權重在經濟意義等方面的合理性進行評估;而定量驗證則是通過使用ROC曲線、CAP曲線及其度量指標線下面積AUC、準確率比率AR等,來對個人住房貸款信用評分模型的違約區分能力進行統計檢驗。
⑦模型使用。利用以上建立的模型對個人住房貸款進行信用評分,進一步可依據計算的信用評分值對個人住房貸款進行等級劃分,如優、良、中、差和違約五個等級,并在此基礎上設定不同的風險限額和貸款定價策略。
⑧持續監控。在量化信用評分模型的使用過程中,應該不斷地對模型的評估績效進行持續監控以分析模型是否需要進行調整和優化,例如,在銀行客戶群發生變化的情況下,我們就應該對所建立的模型進行適當調整。此外,由于所建立的信用批準模型一般是預測貸款批準后10—15個月的違約表現,那么可以將實際情況與預測情況進行對比,計算實際的違約率。通常在國外先進銀行中,它們會批準一些信用評分低于最佳截止點的客戶得到貸款,以檢驗在10—15個月內這些客戶是否會如預測的那樣發生違約。對信用評級量化模型的監控和維護是非常重要的,因為它直接關系到前臺營銷和后臺審批工作,通常每12~18個月會調整一次。
(2)定量模型的現實選擇。對于個人住房貸款信用評分模型而言,目前應用最廣泛的統計模型是Logistic回歸模型,該模型可以通過以下的數學表達式來加以表達:其中,Xi為第i個解釋變量的取值,βi為對應的權重,N為解釋變量的總個數。這里的Score為最終得分值,代表了貸款的風險水平,因此該值越低越好,當然我們也可以通過簡單的線形變換來將該值轉化為貸款的信用得分,此時的信用得分是越高越好,符合使用上的習慣。從理論上講,對此式所給出的個人住房貸款信用評分Logistic模型的完整估計需要在大量歷史數據的基礎上,通過執行解釋變量篩選、模型參數估計以及模型驗證三個步驟來獲得,很顯然目前不具備這樣的數據基礎,因此這里我們通過借鑒一些國外銀行在東南亞國家所使用的定量化模型,并結合我國的實際情況,確定了該模型的Xi和wi,如表2所示,其中各變量的具體含義可以參見表1。從表2可以看出,與所建立的評分卡模型相比,該模型只用了為數不多的幾個關鍵解釋變量來評估個人住房貸款的信用狀況。
根據上面構建的個人住房貸款信用評分卡模型和定量的Logistic回歸模型這兩個模型,我們可以最終設定所要得到的混合模型(見圖3)。在圖3中,根據評分卡模型和定量模型的結果劃分了四個區域,其中:右上角是兩個模型都接受的區域,此時可依據模型的結果直接接受貸款的申請;左下角是兩個模型都拒絕的區域,此時可依據模型的結果直接拒絕貸款的申請;左上角和右下角是兩個模型結果互相沖突的區域,此時需要審批人員的干預并運用業務規則來做出接受或拒絕貸款申請的決策。從這里的分析可以看出,所構建的混合模型實質上是利用打分卡模型和定量模型兩種模型的結果進行相互校驗的模型,因而也就同時具備了這兩種模型的優點。
三、混合型個人住房貸款信用評分模型的驗證
前文我們基于專家判斷法和定量模型法建立了個人住房貸款的混合型信用評分模型,接下來的工作是要對該評分模型的預測能力進行驗證,以便在實際中得到應用。從理論上看,模型驗證方法可分為定性和定量方法兩大類,其中:定性方法主要是從理論和經驗依據出發,對模型開發中的過程、所使用的方法和所使用數據的質量等方面的正確性和合理性做出定性判斷;而定量方法則是基于各種數據、運用統計方法來對模型的預測能力做出定量判斷,按照所使用數據來源的不同,定量方法又可分為返回測試和基準測試,前者是將模型預測結果與自身內部得到的實際結果進行比較,后者是在缺乏內部數據的情形下將模型預測結果和相關模型利用外部數據所得到的結果進行比較。
由于歷史數據和相關外部數據的缺乏,難以對所構建的信用評分模型做出完整的定量驗證,因此,我們在此設計了另一種形式的定性驗證方法,即將所構建的信用評分模型應用于已有的個人住房貸款,通過觀察已有個人住房貸款信用得分的分布特征來判斷該模型結果的合理性。
為此,我們從某股份制商業銀行收集了544筆有效的個人住房貸款數據,然后用所構建的個人住房貸款信用評分卡模型和定量模型對這些貸款分別進行評估,最后以直方圖的形式來表達所有貸款信用得分的分布(見圖4和圖5)。從圖4和圖5可以看出兩個模型的評估結果都呈現出一種近似正態的分布,這符合我們的期望,反映了兩個模型能夠對貸款的風險水平做出明顯的區分。
在設定評分卡模型和定量模型的接受臨界值為40的情況下(實際使用時要根據各模型的實際表現和銀行信用政策來加以具體確定),混合模型對樣本貸款的評估結果顯示在圖6中,對照示意圖3可以看出,在大多數情況下評分卡模型和定量模型的評估結果是一致的,此時可直接做出接受或拒絕的信貸決策,只在少數情況下評分卡模型和定量模型的評估結果產生差異,此時需要人工干預來做出決策。
四、總結與下一步的研究方向
個人信貸信用評分模型的構建是我國銀行業緊迫的一項工作,對此本文首先從借款人、貸款方案、貸款投向和風險緩釋四個要素出發構建了產品水平的信用評分模型的整體分析框架,并將該分析框架具體應用于個人住房貸款產品,詳細分析了該產品信用評分模型應考慮的細化要素和指標;隨后,在考慮構建個人住房貸款信用評分模型時,本文結合目前我國商業銀行業的發展現狀與所構建模型的可實施性,構建了一個基于專家判斷法的評分卡模型和一個基于定量模型法的Logistic回歸模型,將這兩個模型相結合就構成了我們所設計的個人住房貸款信用評分混合模型;最后,本文還基于某股份制商業銀行的樣本貸款數據對所建立的模型進行了部分驗證工作,該工作顯示模型的評估結果是合理的。為更進一步驗證本文所構建混合型模型的有效性,我們下一步的研究方向是準備通過加強數據收集工作來對模型的實際預測能力執行量化的返回測試工作。
摘要:面對全球經濟、金融一體化的現實背景以及隨之而來的白熱化競爭態勢,個人信貸業務將是我國銀行業目前及未來發展的關鍵領域。為此,文章首先從借款人、貸款方案、貸款投向和風險緩釋四個要素出發,構建了一套產品水平的信用評分模型的整體分析框架,并將該框架具體應用于個人住房貸款產品;在此基礎上,考慮到我國銀行業的發展現狀與評分模型的可實施性,設計了一個根據專家判斷法的評分結果和定量模型法的評分結果進行相互校驗的混合型個人住房貸款信用評分模型,并基于所收集的某股份制商業銀行的樣本貸款數據進行了部分驗證工作,同時指出下一步的研究方向。
關鍵詞:住房貸款信用評分模型;專家判斷法;定量模型法