林自立 (廣東省農村信用社聯(lián)合社 廣東廣州 515000)
信貸審計是商業(yè)銀行審計的重要內容,目前,隨著大數據技術廣泛應用于商業(yè)銀行個人客戶信息搜集、貸款資格核準、授信額度審批等,個人信用貸款業(yè)務也逐漸向線上申請、線上審批、線上放款等方式轉變,且隨著信貸數據的量級增長,信貸審計方式也逐漸由現場審計為主向非現場審計為主轉變。商業(yè)銀行如果能夠依托大數據分析技術,結合客戶歷史信用數據,構建審計分析模型,提高對個人信用評級異常數據的甄別分析能力,將有助于商業(yè)銀行在信貸審計中識別挖掘潛在的關鍵變量和關聯(lián)規(guī)則,進而快速鎖定疑點客戶、提前預判客戶違約情況、發(fā)現信貸流程漏洞等,從而達到提高審計效率、加強信用風險預警、完善信貸工作規(guī)范的目的。
關聯(lián)規(guī)則是一個基于規(guī)則的機器學習算法,可以通過設置支持度和置信度進行關聯(lián)規(guī)則的篩選,從大量數據中挖掘出潛在的關聯(lián)關系,廣泛應用于購物模式分析、推薦系統(tǒng)設計、交通事故因素探究、銀行客戶風險分析、網絡入侵檢測技術等領域中。在銀行個人信貸分析中,若分析得知40%的信貸客戶以往具有違約記錄(用“X”標記),這些客戶中的85%也在本次信貸中違約(用“Y”標記),該規(guī)則可表示為“X→Y”的蘊含式,其中X為前項,Y為后項。關聯(lián)規(guī)則的強度可以用支持度和置信度衡量。支持度表示關聯(lián)規(guī)則的前項在所有項集中出現的比例,用于衡量關聯(lián)規(guī)則的重要性,最小支持度用于衡量規(guī)則需要滿足的最低重要性;置信度表示在前項出現的情況下,后項同時出現的百分比,代表這條規(guī)則成立的概率,最小置信度表示關聯(lián)規(guī)則需要滿足的最低可靠性。在上述例子中,“X→Y”的規(guī)則支持度為40%,置信度為85%,如最小支持度為30%,最小置信度為60%,則上述規(guī)則為強關聯(lián)規(guī)則。
Apriori算法是最常見的關聯(lián)規(guī)則算法之一,于1993年由Agrawal和Srikant提出,為布爾關聯(lián)規(guī)則挖掘頻繁項集的原創(chuàng)性算法。使用頻繁項集的先驗知識,通過逐層搜索的迭代方法,運用k項集來生成k+1項集,不斷重復直至不再有新的頻繁項集產生為止,每找到一個k+1項集都需要掃描數據庫一次。
關聯(lián)規(guī)則挖掘過程,記錄的全體構成了數據庫D,或稱記錄集D。交易集D中包含交易的個數記為|D|。支持度和置信度相關計算公式如下:
運用關聯(lián)規(guī)則挖掘方法,將商業(yè)銀行個人信貸客戶信用情況(是否違約)作為后項,將個人信貸客戶的眾多變量因素作為前項,可以挖掘潛藏在商業(yè)銀行個人客戶信貸行為模式中的關聯(lián)規(guī)則,一方面,有助于商業(yè)銀行內部審計透過商業(yè)銀行個人客戶的基本信息,把握影響信貸違約的關鍵因素,從而有效判別可疑客戶,聚焦重點調查對象;另一方面,根據分析得出的關鍵因素,對照該銀行的個人信貸客戶評級方法,揭示個人信貸客戶評級系統(tǒng)存在的漏洞和不足,為進一步完善個人信貸客戶評級提供建議。
本文用于進行關聯(lián)分析的銀行個人信用數據來源于機器學習數據網站。該數據集包括某國某銀行信用數據庫中的1 000多條客戶信用記錄,涉及個人信貸客戶定性及定量指標,根據能夠按時還款涉及的風險狀況的大小,將客戶信用情況分為“好”和“壞”(分別對應信用情況編碼為1和2),而“好”和“壞”客戶的數據記錄分別約占總體數量的70%和30%。
由于關聯(lián)規(guī)則Apriori算法無法處理連續(xù)型數據,結合各指標的實際意義及數據特征,對部分指標進行統(tǒng)計學變換,最終選取其中16項指標,如表1所示。
表1 Apriori算法指標分類說明
商業(yè)銀行一般在審核個人客戶申貸資料時,會綜合對該客戶多方面信息,包括基本身份信息、職業(yè)信息、財產信息、擔保信息等,通過個人客戶信用評級的方法,全面地評估該個人客戶信用狀況,從而為是否對該客戶授信提供決策依據。而從審計人員的角度來看,立足已發(fā)放貸款的客戶是否違約的結果,將該客戶的其他信息與該客戶違約傾向進行關聯(lián)分析,有助于深入分析個人貸款客戶的行為特征。
在進行關聯(lián)分析之前,運用Clementines軟件對因素進行網絡圖分析,從而直觀地展現各因素之間的關聯(lián)程度,形成整體的感性認識。根據軟件運行結果,通過設置顯示400、500、600條鏈接數量的范圍,從而直觀地理解不同因素鏈接程度的強弱。如下頁圖1所示。
圖1 網絡圖分析
從三種不同設置情況下的網絡圖可以看出,對個人客戶信用結果產生影響的因素存在強弱差異,梳理后如表2所示。由表2可知,對客戶信用情況影響程度最強的兩個因素為:是否有其他擔保人及是否國外工作者,其次是贍養(yǎng)人數及房屋情況,再次是工作情況、個人狀況及手機號碼狀況。
表2 對客戶信用情況影響的關鍵因素表
1.守約客戶的Apriori結果分析。在網絡圖分析的基礎上,運用Clementines軟件對數據進行Apriori模型分析,選取數據庫中的個人客戶為“G”(信用“好”)的數據來建模,根據數據實際情況以及參考統(tǒng)計學原理,為了確保不會產生大量的無用關聯(lián)規(guī)則,也不遺漏重要關聯(lián)規(guī)則,經過多次分析實踐,最終將最小支持度設置為min sup=10%,最小置信度設置為min conf=90%,其中部分關聯(lián)規(guī)則如表3所示。
表3 貸款客戶信用評估為“好”的Apriori結果參數表
下面對表3反映的相關規(guī)則進行解釋:(1)當貸款客戶的貸款用途是購置電視,沒有支票賬戶及沒有其他共同申請人的情況下,那么該客戶有 95% 的可能性會守約按時足額償還貸款;(2)當貸款客戶的貸款用途是購置電視,沒有支票賬戶且贍養(yǎng)人數僅為1人時,那么該客戶有94.5% 的可能性會守約按時足額償還貸款;……(6)當貸款客戶現有的其他信用不在這家銀行,沒有支票賬戶且工作職務是技術熟練的雇員時,那么該客戶有 94.12%的可能性會守約按時足額償還貸款;(7)當貸款客戶沒有支票賬戶,本人為單身男性且工作職務是技術熟練的雇員時,那么該客戶有 92.05% 的可能性會守約按時足額償還貸款。
根據以上分析結果可知,客戶的貸款用途、是否有支票賬戶、信用歷史、工作職務、贍養(yǎng)人數、房產狀態(tài)、是否外國人、個人狀況與該客戶能否守約存在關聯(lián)關系,仔細分析各因素對客戶信用的影響,大致可以推斷:當客戶貸款用途較為明確且金額較為可控(如購置電視等大型家用電器),客戶守約的概率較高。同理可知,當客戶贍養(yǎng)人數較少,財務負擔相對較輕,客戶傾向于履約還款;當客戶職務為技術熟練的雇員,勞動收入相對較高,也有利于客戶履約還款;當客戶自己擁有房產時,財產擔保更有保障,有助于客戶兌現還款承諾等。
2.違約客戶的Apriori結果分析。在網絡圖分析的基礎上,運用Clementines軟件對數據進行Apriori模型分析,選取數據庫中的個人客戶為“B”(信用“壞”)的數據來建模,根據數據實際情況以及參考統(tǒng)計學原理,為了確保不會產生大量的無用關聯(lián)規(guī)則,也不遺漏重要關聯(lián)規(guī)則,經過多次分析實踐,最終將最小支持度設置為min sup=0.9%,最小置信度設置為min conf=80%,其中部分關聯(lián)規(guī)則如下頁表4所示。
表4 貸款客戶信用評估為“壞”的Apriori結果參數表
下面對表4反映的相關規(guī)則進行解釋:(1)當貸款客戶存在延遲還清記錄,支票賬戶小于100元且工作職務是技術熟練的雇員時,那么該客戶有 88.89% 的可能性會違約;(2)當貸款客戶的貸款用途是經商,住房狀態(tài)是租賃且存款余額小于100元時,那么該客戶有 88.89% 的可能性會違約;……(5)當貸款客戶的貸款用途是經商,從事當前職業(yè)的時間大于4年且存款余額小于100元時,那么該客戶有 81.82%的可能性會違約。
根據對違約客戶分析結果可知,客戶的信用歷史、支票賬戶狀況、貸款用途、房產狀態(tài)、存款狀況、工作職務、工作年限與該客戶違約存在關聯(lián)關系,仔細分析各因素對客戶信用的影響,大致可以推斷:當客戶存在違約記錄時,可以推測該客戶的守約意識不強,因此該客戶再次違約的概率也相對更大;當客戶支票賬戶余額較小時,也可能意味著該客戶所能得到銀行的授信額度比較少,因此該客戶資信可能較為一般,違約的概率也可能更大;當客戶貸款用途為經商時,可能意味著該筆貸款投放之后能否收回將面臨更大的不確定性,也會導致客戶產生違約的概率較高;該客戶住房狀態(tài)是租賃,可以推測該客戶缺乏房產等財產保障,因此貸款后違約的概率可能更大等。
1.商業(yè)銀行內部審計可以通過關聯(lián)分析,把握影響個人客戶違約的關鍵因素和關聯(lián)規(guī)則,有效鎖定疑點客戶。研究發(fā)現,在個人貸款客戶的各種特征因素中,某些特征因素與客戶信用情況具有緊密的關聯(lián)關系,且存在著影響客戶信用狀況的重要關聯(lián)規(guī)則。商業(yè)銀行內部審計在開展信貸審計時,面對眾多的個人客戶和龐雜的個人客戶信息,往往因為信息過度繁雜難以發(fā)現疑點所在,而通過關聯(lián)分析找到影響個人客戶信用的關鍵因素和重要關聯(lián)規(guī)則,可以有效把握住重點,遵照分析得出的關聯(lián)規(guī)則,將按照關聯(lián)規(guī)則評估后信用為“差”但仍獲得授信的客戶列為疑點客戶,進行重點審計,有助于提高信貸審計效率。
2.商業(yè)銀行內部審計可以通過關聯(lián)分析,評估驗證該行個人信貸客戶評級方法的科學性。研究發(fā)現,通過關聯(lián)分析找到與客戶守約、客戶違約存在緊密聯(lián)系的重要關鍵因素和關聯(lián)規(guī)則,商業(yè)銀行內部審計人員能夠從整體去把握各個客戶的信用情況,從另一個角度驗證商業(yè)銀行個人信貸客戶評級系統(tǒng)是否準確和科學,如發(fā)現某些關鍵因素未納入個人信貸客戶評級系統(tǒng),或者該行個人信用客戶評級規(guī)則與研究得出的關聯(lián)規(guī)則存在沖突時,須進行重點關注和辨析,從審計角度進行研判。
3.商業(yè)銀行內部審計可以對照發(fā)現的關聯(lián)規(guī)則,持續(xù)完善信貸流程和制度。研究發(fā)現,通過關聯(lián)分析,商業(yè)銀行內部審計人員可以找到影響個人信貸客戶違約的關鍵因素以及關聯(lián)規(guī)則,將分析得出的結論與該行信貸調查及審批流程和制度進行比對,評估該行在落實信貸調查和審批中,貸前調查是否囊括了對客戶關鍵因素的分析,貸中審查是否符合關聯(lián)規(guī)則所揭示的規(guī)律,評估商業(yè)銀行的貸款調查及審批流程是否嚴謹、貸款調查及審批制度是否完善和科學,從而驗證銀行信貸調查和審批的有效性和科學性,并為銀行持續(xù)完善信貸流程和制度提供方向。
1.積極運用大數據分析技術,有效提升審計能力、審計效率和審計精度。商業(yè)銀行內部審計人員應當廣泛運用關聯(lián)規(guī)則等大數據分析技術,如,運用聚類分析判別銀行財務疑點數據,解決成本費用審計問題;運用層次分析法對銀行績效數據進行綜合評價,解決銀行績效審計問題;運用空間地理數據分析,解決網點效益與布局審計問題等,熟練掌握多種數據分析方法,提高處理不同審計問題的數據分析能力,全面提升審計效能。
2.加強對數據的挖掘分析與規(guī)律總結,發(fā)揮審計的參謀作用,助力經營管理提升。商業(yè)銀行內部審計人員不僅要從防風險的角度,在數據分析中關注風險客戶如何判別、風險行為如何避免、風險苗頭如何干預等,而且要從促發(fā)展的角度,在數據分析中思考優(yōu)質客戶具有什么特征、經營效率如何提高、如何把控風險與效益的平衡點等問題,將數據挖掘得出的規(guī)律進行總結歸納,并與商業(yè)銀行的經營理念、內部管理運行的普遍規(guī)則、公司制度的整體設計進行比對,從而起到啟發(fā)經營思路、堵塞管理漏洞、促進健康發(fā)展的作用。