馬振
摘要:進入21世紀以來,我國商業(yè)銀行之間的競爭日趨激烈,銀行數(shù)據(jù)信息化要求銀行對經(jīng)營數(shù)據(jù)要進行更加科學細致的分析和挖掘,數(shù)據(jù)挖掘能夠從根本上解決銀行亟待解決的問題。該文介紹了數(shù)據(jù)挖掘的相關(guān)知識,并介紹了該技術(shù)在銀行中應用,為銀行信息化發(fā)展提供了新的思路。
關(guān)鍵詞:數(shù)據(jù)挖掘;銀行;應用;信貸風險;客戶細分
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2016)15-0017-03
目前,國內(nèi)金融市場中地方商業(yè)銀行和外資銀行的擴張與增長速度越來越快,來自銀行間的競爭越來越大。銀行擁有海量的經(jīng)營數(shù)據(jù),借助數(shù)據(jù)挖掘技術(shù)可以為銀行提供切實有效的方法來實現(xiàn)效益最大化,從而使銀行在激烈的競爭中占據(jù)優(yōu)勢。
1數(shù)據(jù)挖掘理論介紹
1.1數(shù)據(jù)挖掘定義
數(shù)據(jù)挖掘是指對數(shù)據(jù)進行提取和加工,找出隱含的信息。數(shù)據(jù)挖掘借助統(tǒng)計算法、檢索情報、機器學習、在線分析和模式識別等一些專業(yè)手段以達成預期目標,而且一般涉及的都是計算機科學方面。數(shù)據(jù)挖掘的過程包括理解挖掘的數(shù)據(jù)、獲取相關(guān)知識和技術(shù)、整合與檢查數(shù)據(jù)、去掉錯誤的數(shù)據(jù)、建立模型、數(shù)據(jù)挖掘工作、測試和驗證挖掘結(jié)果、解釋和實施挖掘結(jié)果。
1.2數(shù)據(jù)挖掘主要方法
1.2.1聚類分析
聚類是指根據(jù)數(shù)據(jù)的相似性把數(shù)據(jù)集劃分為多個類別,使同類的相似度較大,而不同類的數(shù)據(jù)相似度較小。常用的聚類算法有k-means聚類算法、層次聚類算法、SOM聚類算法、FCM聚類算法。
1.2.2決策樹
決策樹又稱為判斷樹,是一種歸納分類方法,它借助歸納算法對數(shù)據(jù)進行分析歸納,以樹型結(jié)構(gòu)表示分類或決策集合,進而產(chǎn)生規(guī)則和發(fā)現(xiàn)規(guī)律,最后再用決策對數(shù)據(jù)進行分析。
1.2.3統(tǒng)計學
統(tǒng)計學是應用數(shù)學中最重要的學科之一,它通過搜索、整理、分析、描述數(shù)據(jù)等手段,從數(shù)據(jù)中找出相應隨機變量的分布規(guī)律或數(shù)字特征,從而推斷所測對象的本質(zhì),甚至預測對象。
1.2.4關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則能夠從數(shù)據(jù)集中發(fā)現(xiàn)頻繁出現(xiàn)的項集。它可以理解為用來發(fā)現(xiàn)在同一事件中的不同項之間的相關(guān)性,即找出事務中頻繁發(fā)生的項或?qū)傩缘乃凶蛹晚椫g的關(guān)聯(lián)性。關(guān)聯(lián)規(guī)則最為經(jīng)典的算法是Apriori算法。
1.2.5粗糙集
粗糙集能夠從各種不完備信息中找出隱含的信息,并揭示潛在的規(guī)律。在分類機制建立的基礎(chǔ)上,粗糙集理論把知識與等價關(guān)系對空間的劃分視為同等。由于形成等價類的所有數(shù)據(jù)樣本的描述屬性是等價的,所以無法由屬性進行區(qū)別的類集由粗糙集來進行粗略地定義。
1.2.6神經(jīng)網(wǎng)絡
神經(jīng)網(wǎng)絡是基于生物學中動物大腦發(fā)出和接收的信號通過大量神經(jīng)構(gòu)建成的網(wǎng)絡傳遞的原理提出的。神經(jīng)網(wǎng)絡無需將反映映射關(guān)系的數(shù)學方程編寫出來,它本身就能夠自主的記錄和學習大量的輸入—輸出模式映射關(guān)系。
2數(shù)據(jù)挖掘在銀行中的應用
2.1數(shù)據(jù)挖掘技術(shù)在銀行信貸風險管理中的應用
貸款業(yè)務是銀行最重要的業(yè)務之一,銀行通過賺取存取款利率之間的差價從中獲取利潤,所以銀行信貸風險的管控極為重要。銀行信貸風險包括正常、關(guān)注、次級、可疑和損失風險。正常貸款和關(guān)注貸款對銀行信貸風險影響很小,一般借款人會在合同約定的期限內(nèi)按時償還本金和利息,貸款損失的概率很小。如果由于借款人個人的原因而導致嚴重的還款能力問題,對于損失貸款、可疑貸款、次級貸款這三項銀行貸款,銀行就需要擔負很大的風險。銀行使用數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)的各種屬性如借款人年齡、借款人收入和職業(yè)、貸款擔保人信用情況、借款用途、借款人及其家庭還貸能力、借款金額和借款期限進行分類和篩選,把錯誤、缺省或無參考價值的數(shù)據(jù)屬性進行預處理,使用決策樹的ID3算法構(gòu)建分類模型,建立信貸風險決策樹并對該樹進行剪枝,提取分類規(guī)則并確定重要的決策屬性,選取最優(yōu)信貸風險評估模型對客戶信用風險進行分析、評估和預測,把信貸風險降到最低。
2.2數(shù)據(jù)挖掘在銀行客戶細分中的應用
銀行客戶細分的目的是對所有客戶實行分類營銷,達到精確營銷的目的。銀行客戶在銀行存款中凈現(xiàn)金流的多少稱為客戶價值,包括客戶潛在價值和當前價值兩種價值??蛻魸撛趦r值是指經(jīng)過一段時間的發(fā)展,將來銀行有很大可能從客戶身上獲得盈利??蛻舢斍皟r值是指銀行當前能從一個客戶身上所獲得的盈利。銀行依據(jù)客戶給銀行帶來價值的高低把客戶分為潛在價值、低價值、中等價值、高價值四種類型。
對客戶細分首先要建立數(shù)據(jù)倉庫,然后對數(shù)據(jù)進行抽取以及對屬性進行選擇,規(guī)約復雜的客戶信息,再使用K-Means算法計算并建立客戶分類模型,對潛在價值及當前價值在客戶維度上展開聚類,最終完成客戶價值的細分,實現(xiàn)銀行更有針對性的營銷。
3結(jié)束語
21世紀以來,數(shù)據(jù)挖掘技術(shù)在銀行中的應用使銀行經(jīng)營的效益得到了大幅度的提高。銀行通過運用數(shù)據(jù)挖掘技術(shù),從大量的、無規(guī)律的經(jīng)營數(shù)據(jù)中挖掘出對銀行有價值的信息,指導銀行制定營銷策略、規(guī)避信貸風險、提高經(jīng)營利潤。
參考文獻:
[1] 王雅軒,頊聰.數(shù)據(jù)挖掘技術(shù)的綜述[J].電子技術(shù)與軟件工程,2015(8):204-205.
[2] 王夢雪.數(shù)據(jù)挖掘綜述[J].軟件導刊,2013(10):135-137.
[3] 王扶東,馬玉芳.基于數(shù)據(jù)挖掘的客戶細分方法的研究[J].計算機工程與應用,2011(4).
[4] 夏春梅.數(shù)據(jù)挖掘技術(shù)在銀行信貸風險管理中的應用[J].現(xiàn)代電子技術(shù),2014(4).
[5] 傅俊.數(shù)據(jù)挖掘技術(shù)及其在商業(yè)銀行中的應用[J].軟件導刊,2014(2):118-121.