趙 暉,朱子言
(1.江蘇銀行,江蘇 南京210001;2.東南大學,江蘇 南京211189)
當前,隨著內(nèi)外部環(huán)境的深刻變化,商業(yè)銀行信貸風險管理面臨多重挑戰(zhàn)。一是各個經(jīng)濟主體之間的聯(lián)動性越來越緊密,企業(yè)之間的股權(quán)、債權(quán)和資金往來關系錯綜交錯,授信風險傳染路徑更為復雜,事前防控風險的難度加大。二是客戶利用信息不對稱,通過欺詐等手段套取銀行貸款現(xiàn)象增多。三是銀行客戶內(nèi)部業(yè)務信息管理分散,風控應用價值受限。四是可用于交叉驗證的外部信息質(zhì)量不高。同時傳統(tǒng)的評分卡和評級模型也已無法滿足日益復雜的風險環(huán)境。對此,隨著大數(shù)據(jù)技術(shù)的逐步成熟,金融機構(gòu)開始嘗試運用大數(shù)據(jù)和復雜網(wǎng)絡技術(shù)來構(gòu)建便捷、直觀的企業(yè)信息挖掘應用模式,以揚長避短,提高風控質(zhì)效。文章探討當下商業(yè)銀行信貸業(yè)務風險管理面臨的主要問題,介紹基于復雜網(wǎng)絡的企業(yè)信息特征挖掘概念和方法,并提出銀行應對挑戰(zhàn)的舉措及展望。
市場經(jīng)濟環(huán)境下投資主體逐漸多元化,跨地區(qū)、跨行業(yè)和集團化經(jīng)營的企業(yè)越來越多,納入集團合并報表范圍內(nèi)的母子公司或子子公司僅為關聯(lián)客戶類型之一,除此以外關聯(lián)客戶類型還有總分公司、家族式、合營聯(lián)營、擔保關聯(lián)、產(chǎn)品關聯(lián)、市場關聯(lián)客戶等,企業(yè)之間的關系錯綜復雜,也使得授信風險傳染路徑更為復雜。該類客戶,尤其是關聯(lián)度高的團系企業(yè)(如集團客戶、實際控制團系企業(yè)、資金關聯(lián)度高的企業(yè)、擔保圈企業(yè)),一旦其中某一客戶暴露風險,極易形成多米諾骨牌效應,無疑會給銀行信貸資產(chǎn)安全造成重大威脅。針對該類風險防控,目前,商業(yè)銀行可以通過查詢企業(yè)工商信息、征信報告等手段掌握存在股權(quán)關聯(lián)、擔保關聯(lián)的企業(yè)基本情況,但上述手段受制于查詢不便捷,同時無法獲取企業(yè)資金來往等信息,以致應用價值大大受限。部分銀行則專門開發(fā)了企業(yè)關聯(lián)圖譜,通過整合工商數(shù)據(jù)、征信數(shù)據(jù)以及線下調(diào)查信息項下企業(yè)對外對內(nèi)擔保、投資和實際控制情況等客戶信息逐戶展現(xiàn)企業(yè)關聯(lián)關系,但仍存在展示維度不足、風險揭示不充分的問題。
信貸業(yè)務真實性是銀行信貸決策的前提條件,銀行信貸申報人員往往通過現(xiàn)場走訪了解客戶實際經(jīng)營情況、盈利模式、結(jié)算方式、往來交易等信息。信貸審批和風險管理人員在進行信貸業(yè)務審核或風險排查時通過企業(yè)提供的信貸業(yè)務申請資料和銀行內(nèi)部掌握的企業(yè)存取款信息、交易信息及基本信用評級等來判斷企業(yè)貸款需求真實與否。然而受制于信息不對稱,特別是在宏觀經(jīng)濟探底期,企業(yè)通過提供虛假信息及材料套取銀行貸款的現(xiàn)象在增多,主要涉及以下幾方面:一是通過沒有實質(zhì)現(xiàn)金流的關聯(lián)交易增加業(yè)務往來記錄,美化財務報表相關數(shù)據(jù),調(diào)整和控制企業(yè)的資產(chǎn)負債結(jié)構(gòu)和經(jīng)營成果,使各項財務指標符合機構(gòu)借貸條件;二是通過企業(yè)間相互投資參股,虛增資本,營造公司資本雄厚的假象;三是私下互保;四是虛構(gòu)貿(mào)易背景和貸款項目,使商業(yè)銀行無法通過現(xiàn)場調(diào)查、第三方數(shù)據(jù)交叉驗證以及邏輯推導等方式核實企業(yè)的真實狀況,致使不法企業(yè)套取或挪用銀行貸款成為可能。
在商業(yè)銀行風險管理中,內(nèi)部數(shù)據(jù)對風控發(fā)揮著重要的作用。國內(nèi)商業(yè)銀行數(shù)據(jù)建設普遍為業(yè)務驅(qū)動型,即根據(jù)業(yè)務單元進行劃分管理,以最先滿足業(yè)務單元需求,這產(chǎn)生了客戶業(yè)務信息分散化、口徑差異化的問題,以致相關數(shù)據(jù)價值難以被充分挖掘。特別是在當前銀行理財、公司類基金、信用債承銷及投資等業(yè)務規(guī)模迅速膨脹的大背景下,銀行除需加快相關數(shù)據(jù)互聯(lián)互通外,還應探索其他數(shù)據(jù)應用模式,以克服條線數(shù)據(jù)不完整、不共享的缺陷。
在信貸風險類型多樣化、復雜化的大背景下,銀行內(nèi)部數(shù)據(jù)已遠遠不能支撐銀行信貸風險管理工作,大部分商業(yè)銀行已普遍開始布局涉及授信客戶的外部數(shù)據(jù)挖掘和分析工作。但可利用的外部數(shù)據(jù)普遍存在硬數(shù)據(jù)少、質(zhì)量不高的現(xiàn)象。結(jié)合部分銀行的實際情況看,工商數(shù)據(jù)、金融市場數(shù)據(jù)、手機驗證、個人戶籍、學籍學歷等數(shù)據(jù)獲取相對容易,但稅務、水電等“硬數(shù)據(jù)”獲取難度較大。同時從不同渠道獲取的同類外部數(shù)據(jù),或多或少存在重復、缺失等問題,這也給數(shù)據(jù)風控應用增加了難度。
復雜網(wǎng)絡技術(shù)是以企業(yè)為核心,利用信貸客戶授信基本情況、財務指標、行為信息以及商業(yè)銀行引入的征信、失信人等信息為數(shù)據(jù)源,運用復雜網(wǎng)絡建模挖掘結(jié)構(gòu)特征,建立起企業(yè)授信要素之間的聯(lián)系,結(jié)合行為信息計算行為特征,研究企業(yè)與企業(yè)之間、個人與企業(yè)之間以及個人與個人之間的投資、擔保、實際控制人、高管等復雜關聯(lián)關系,并以直觀的圖譜形式展示,以供授信管理人員識別和防控信貸風險。該技術(shù)因運用了復雜網(wǎng)絡建模,一定程度上能克服內(nèi)外部數(shù)據(jù)缺陷對風險識別造成的負面影響。
以文章研究的企業(yè)網(wǎng)絡圖譜為例,圖1 表示的是企業(yè)之間的網(wǎng)絡關系,每個節(jié)點代表的是一個信貸企業(yè)客戶,節(jié)點之間存在的連線若為實線則表示企業(yè)之間存在擔保關系;節(jié)點之間存在的連線為虛線則表示企業(yè)之間存在資金往來,在圖中分別表示為關聯(lián)1 和關聯(lián)2。如圖中A 與C 之間有連線且為實線,因此說明A 企業(yè)為C 客戶的貸款擔?;蛘逤 企業(yè)為A 企業(yè)的貸款擔保;A 與B 之間有連線且為虛線,因此說明A 企業(yè)貸款客戶與B 企業(yè)貸款客戶之間存在一定的資金往來。并且,若與一個企業(yè)存在擔保關聯(lián)或資金往來關系的企業(yè)越多,則代表該企業(yè)的節(jié)點越大。因此,通過網(wǎng)絡圖譜可挖掘出企業(yè)在整個信貸網(wǎng)絡之中的關系特征以及地位。
圖1 企業(yè)之間的網(wǎng)絡關系圖
一是刻畫企業(yè)網(wǎng)絡結(jié)構(gòu)以及風險特征。復雜網(wǎng)絡能夠較為完整地刻畫企業(yè)擔保圈結(jié)構(gòu)、資金往來關系、派系特征等,通過模型算法將授信企業(yè)劃分成團,進行團伙性分析,根據(jù)圖論上的屬性,如團的密集程度和某些路徑的關鍵程度、圖直徑等角度來估計風險。二是彌補有限的內(nèi)外部數(shù)據(jù)缺陷,弱化數(shù)據(jù)真實性影響等問題。一方面,利用復雜網(wǎng)絡可以提取企業(yè)行為特征,傳統(tǒng)企業(yè)行為特征大部分來源于外部數(shù)據(jù)但相對稀疏,復雜網(wǎng)絡可以一定程度地解決外部數(shù)據(jù)稀缺和有效性欠佳的問題,作為預測信貸風險的有力補充。另一方面,復雜網(wǎng)絡通過對涉及授信企業(yè)基本信息和授信特征的深入挖掘,計算出大量的有效關聯(lián)信息,可以提升風險預測精度。三是解決中小企業(yè)風險評價成本高、手段少的問題。通過復雜網(wǎng)絡建模挖掘,能較快地形成企業(yè)特征圖譜,并能識別涉及包括集團關系、擔保關系、資金關系等風險,除能應用于大企業(yè)風控外,同樣也可以適用于中小企業(yè)貸款的風險管理,如結(jié)合中小企業(yè)授信流程優(yōu)化,可大幅降低中小企業(yè)風險管理成本。同時隨著可利用數(shù)據(jù)的多元化,如加入企業(yè)供應鏈、外部投資等信息數(shù)據(jù),銀行對企業(yè)風險的評價范圍和尺度也將更加全面和有效。
1.根據(jù)業(yè)務流程定位模型數(shù)據(jù)
文中復雜網(wǎng)絡建模主要針對對公授信客戶,數(shù)據(jù)主要包括兩大類,分別是某城商行內(nèi)部數(shù)據(jù)和外部征信數(shù)據(jù)。數(shù)據(jù)直接描述企業(yè)在整個業(yè)務流程中的行為以及關聯(lián)關系的形成,并從內(nèi)部業(yè)務系統(tǒng)獲取客戶業(yè)務、預警等相關數(shù)據(jù),按主題進行匯總。
2.特征提取
基于處理好的數(shù)據(jù),論文從以下維度提取特征:一是企業(yè)基本信息特征。定性地反映企業(yè)的基本情況、信用及還款能力等,如企業(yè)規(guī)模、所有權(quán)性質(zhì)、所屬行業(yè)、是否集團客戶等。二是結(jié)構(gòu)特征。描述客戶所在網(wǎng)絡關系中的結(jié)構(gòu)特征,企業(yè)在圖中所處的位置對其他節(jié)點產(chǎn)生的影響,比如客戶在圖中的影響程度值。文中結(jié)構(gòu)特征涉及擔保關聯(lián)、資金往來、集團關聯(lián)和派系關聯(lián)等。
我們利用Python 的Networkx 庫構(gòu)建數(shù)據(jù)結(jié)構(gòu)。每個網(wǎng)絡圖譜均可轉(zhuǎn)化為鄰接矩陣的形式,其中網(wǎng)絡圖譜的每條邊均可對應于矩陣中的一個元素。又由于文中網(wǎng)絡圖譜均為無向圖,因此所有邊均可對應為鄰接矩陣中的兩個對稱元素,且鄰接矩陣為對稱陣。
如圖2 所示,根據(jù)復雜網(wǎng)絡理論,關聯(lián)網(wǎng)絡可由鄰接矩陣A={aij}的形式唯一給出。其中aij=1 表示i企業(yè)與j企業(yè)之間存在關聯(lián),值為0 則表示不存在關聯(lián)。假設i企業(yè)的特征為wj,則j企業(yè)受i企業(yè)行為傳染的結(jié)果為aij×wj。即若i企業(yè)與j企業(yè)之間存在關聯(lián),則i企業(yè)對j企業(yè)的特征的貢獻為wj。因此,對于一個已知網(wǎng)絡關聯(lián)關系或鄰接矩陣,根據(jù)所有企業(yè)的特征向量W=[w1,w2,…,wj]可以計算出j企業(yè)受傳染的特征為∑n i aij×wj。根據(jù)高等代數(shù)知識,我們定義行為特征為經(jīng)過傳染的特征,可具體用線性代數(shù)中的內(nèi)積表示如下:ω=A×w=[ω1,ω2,…,ωn]。其中,j企業(yè)的特征為ωj=因此,依據(jù)企業(yè)關聯(lián)關系挖掘,可以分別輸出企業(yè)特征。進一步通過聚類分析即可挖掘特征與潛在風險標識之間的關聯(lián)。如果將所有特征通過降維得到唯一的風險特征因子,結(jié)合關聯(lián)圖譜可以得到如圖3 所示效果。
圖2 關聯(lián)網(wǎng)絡創(chuàng)建
圖3 關聯(lián)效果
由此,風險特征因子與潛在風險標識之間的關聯(lián)可以分割為兩個層面。一方面,風險特征越大的集團派系會具有越大的潛在風險標識發(fā)生概率。另一方面,同一集團或派系的企業(yè)具有相近的風險特征的同時,也會具有相似的潛在風險標識情況。這一結(jié)果將進一步表明網(wǎng)絡圖譜對于風險特征挖掘和風險預測的作用,同時給風險管理提供有力建議,即對集團或派系風險進行有針對性的提前預防和監(jiān)控。
3.模型效果
論文所涉及的圖譜呈現(xiàn)明顯的無標度特征,即網(wǎng)絡中少數(shù)稱之為Hub 點的節(jié)點擁有極其多的連接,而大多數(shù)節(jié)點只有很少量的連接。從復雜網(wǎng)絡理論來看,無標度網(wǎng)絡的整體結(jié)構(gòu)對抗風險的穩(wěn)定性較強,而個別節(jié)點的風險傳染效應較為明顯。這一特征可由雙對數(shù)坐標軸下的度累積分布圖佐證。
根據(jù)復雜網(wǎng)絡理論,無標度網(wǎng)絡十分符合現(xiàn)實社會網(wǎng)絡結(jié)構(gòu)的形式,其中重要節(jié)點產(chǎn)生變化,將對整個網(wǎng)絡產(chǎn)生巨大影響。而從風險管理角度來看,如果重要節(jié)點產(chǎn)生風險,將迅速傳染至其關聯(lián)節(jié)點。一方面,重要節(jié)點關聯(lián)企業(yè)較多,被高風險企業(yè)牽連的可能性較大;另一方面,重要節(jié)點由于其自身關聯(lián)企業(yè)較多,控制風險和解決短期流動性問題的能力較強。總的來說,節(jié)點的重要性與其自身風險之間存在一定關聯(lián)關系。
由此,我們定義結(jié)構(gòu)特征為節(jié)點重要性,可以用節(jié)點度來表征。節(jié)點度即與該節(jié)點關聯(lián)節(jié)點的個數(shù),對于有向圖則分為入度和出度。節(jié)點度可以根據(jù)網(wǎng)絡結(jié)構(gòu)計算得出,若網(wǎng)絡圖以節(jié)點度作為節(jié)點大小,則可以清晰看出重要節(jié)點的位置。
一是持續(xù)優(yōu)化圖譜展示功能。利用文章所述的復雜網(wǎng)絡技術(shù)可以將銀行掌握的企業(yè)信息結(jié)構(gòu)化,銀行可以把企業(yè)基本情況、授信情況、內(nèi)部數(shù)據(jù)和外部信息等多維度信息整合到一張圖譜中,并可結(jié)合內(nèi)部數(shù)據(jù)整合和外部數(shù)據(jù)引入,持續(xù)優(yōu)化圖譜展示功能,從而不斷提升信貸風險識別和防控能力。二是加強圖譜在信貸“三查”中的應用。結(jié)合圖譜展示的風險狀況,客戶經(jīng)理可根據(jù)風險揭示信息開展針對性的現(xiàn)場核查,審查審批人員可判斷企業(yè)是否存在關聯(lián)關系風險、擔保圈風險、供應鏈風險、貸款被挪用等風險,并可根據(jù)潛在風險狀況采取針對性的授信方案。
銀行可進一步搜集企業(yè)風險數(shù)據(jù)并進行挖掘處理,通過關聯(lián)業(yè)務分析和數(shù)據(jù)可視化建設,探索并實踐大數(shù)據(jù)分析方法。對海量客戶信息開展多維度挖掘,并根據(jù)業(yè)務風險排查結(jié)果總結(jié)經(jīng)驗,梳理客戶風險圖譜多維度展現(xiàn)客戶基本信息、風險信息、銀行業(yè)務與往期風險處置信息,將客戶全方位風險要素可視化,提升風險信息挖掘處理和關聯(lián)業(yè)務分析能力。將風險客戶的資產(chǎn)情況、社會關系、行為軌跡等信息橫向關聯(lián)、縱向發(fā)掘,可以支持風險信息的交叉分析驗證和風險評估,提升風險客戶評價的可靠性和準確率。內(nèi)部風險信息在銀行各業(yè)務條線的自動調(diào)用與實時展現(xiàn),可以豐富業(yè)務風險防控的預警模式與參考要素,為客戶風險分析與處置提供保障,為銀行業(yè)務穩(wěn)健安全發(fā)展提供支持。
對于很多中小型銀行,因業(yè)務規(guī)模及信息系統(tǒng)建設滯后等原因,不良授信的案例庫要么缺失、要么案例較少,尤其是對于結(jié)構(gòu)化融資、投資基金等類信貸業(yè)務,不良案例庫更是少之又少。由于案例庫的缺少,目前風頭正勁的機器學習等新的風控技術(shù)難有用武之地,大數(shù)據(jù)風控技術(shù)、模型的效果難以得到充分的驗證,基本只能通過對傳統(tǒng)業(yè)務客戶的歷史違約情況進行分析,以此來評價風控模型效果。為此,中小銀行應持續(xù)構(gòu)建不良授信案例庫,并通過模型校驗,持續(xù)完善本行的風控技術(shù)。
隨著國內(nèi)“雙創(chuàng)”政策的推動和對人工智能產(chǎn)業(yè)的投資拉動,人工智能技術(shù)已廣泛運用于各行各業(yè),國內(nèi)金融行業(yè)已經(jīng)逐步開始應用人工智能技術(shù),比如平安集團下設平安科技人工智能實驗室研發(fā)人工智能金融應用等。在授信決策方面,人工智能技術(shù)可以將不同來源的數(shù)據(jù)整合到一起,分析企業(yè)的信貸特征,將不同的企業(yè)進行分類。比如將已進入訴訟流程的出險客戶直接標記為“司法訴訟”,并提醒相關人員及時開展處置工作。通過提取企業(yè)或法人在網(wǎng)絡或社交媒體等領域的信息,比如觀測企業(yè)或其產(chǎn)品在搜索網(wǎng)站的搜索數(shù)量、在微博中被提及的次數(shù)或獲得的評價來判斷貸款企業(yè)綜合實力。在反欺詐方面,人工智能技術(shù)中的機器學習可以利用信貸企業(yè)的交易特征和正常貸款數(shù)據(jù),學習什么是好的貸款,什么是壞的貸款,推測信貸業(yè)務風險點,提升銀行風險識別能力,推動銀行信貸評價體系向更科學的方向發(fā)展。