王娟
【摘 要】現(xiàn)如今,大數(shù)據(jù)概念及產(chǎn)業(yè)業(yè)已在人們生活和工作工作中不斷產(chǎn)生越來越多的影響,銀行業(yè)作為信息密集型的服務(wù)產(chǎn)業(yè),它所產(chǎn)生的交易數(shù)據(jù)、客戶活動信息等都是重要的大數(shù)據(jù)來源.如何有效將大數(shù)據(jù)和銀行業(yè)進(jìn)行結(jié)合,并通過大數(shù)據(jù)技術(shù)驅(qū)動銀行業(yè)務(wù)實現(xiàn)更好發(fā)展,是當(dāng)前銀行業(yè)急需解決的問題.本文闡述了大數(shù)據(jù)的起源、定義、特征,并在此基礎(chǔ)上,對銀行業(yè)大數(shù)據(jù)應(yīng)用進(jìn)行了進(jìn)一步探討和分析。
【關(guān)鍵詞】大數(shù)據(jù);銀行業(yè);應(yīng)用
一、大數(shù)據(jù)的起源及特點
“大數(shù)據(jù)”概念最早由維克托·邁爾·舍恩伯格和肯尼斯·庫克耶在編寫《大數(shù)據(jù)時代》中提出,指不用隨機分析法(抽樣調(diào)查)的捷徑,而是采用所有數(shù)據(jù)進(jìn)行分析處理。大數(shù)據(jù)有4V特點,即Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。
二、大數(shù)據(jù)在銀行業(yè)的應(yīng)用
(一)業(yè)務(wù)驅(qū)動
大數(shù)據(jù)在銀行業(yè)的應(yīng)用主要是由其業(yè)務(wù)驅(qū)動的。應(yīng)用大數(shù)據(jù)的業(yè)務(wù)驅(qū)動主要由精準(zhǔn)營銷、風(fēng)險控制、改善經(jīng)營和服務(wù)創(chuàng)新四個方面組成。
1.精準(zhǔn)營銷:互聯(lián)網(wǎng)時代的銀行在互聯(lián)網(wǎng)金融的沖擊下,迫切的需要掌握更多用戶信息,繼而構(gòu)建用戶360度立體畫像,即可對細(xì)分的客戶進(jìn)行精準(zhǔn)營銷、實時營銷等個性化智慧營銷。
2.風(fēng)險控制: 應(yīng)用大數(shù)據(jù)技術(shù),可以統(tǒng)一管理銀行內(nèi)部多源異構(gòu)數(shù)據(jù)與外部征信數(shù)據(jù),可以更好的完善風(fēng)控體系。內(nèi)部可保障數(shù)據(jù)的完整性與安全性,外部可控制用戶風(fēng)險。
3.改善經(jīng)營:通過大數(shù)據(jù)分析方法改善經(jīng)營決策,為管理層提供可靠的數(shù)據(jù)支撐,使經(jīng)營決策更加高效、敏捷,精確性更高。
4.服務(wù)創(chuàng)新:通過對大數(shù)據(jù)的應(yīng)用,改善與客戶之間的交互、增加用戶粘性,為個人與政府提供增值服務(wù),不斷增強銀行業(yè)務(wù)核心競爭力。
除以上四點之外,銀行等金融機構(gòu)應(yīng)用大數(shù)據(jù)也有政府政策的原因。在十二五規(guī)劃中,大數(shù)據(jù)已不再是只是專有名詞,大數(shù)據(jù)已然上升為國家戰(zhàn)略。隨著國家對數(shù)據(jù)的重視、對國產(chǎn)化的支持以及對開源架構(gòu)的呼聲越來越高,使得銀行等金融機構(gòu)對大數(shù)據(jù)技術(shù)的選擇成了必然趨勢。
(二)數(shù)據(jù)類型
銀行多源異構(gòu)的數(shù)據(jù)類型是首先需要被考慮的。只有將多源異構(gòu)的數(shù)據(jù)處理好,為應(yīng)用建設(shè)打好基礎(chǔ),銀行建設(shè)的大數(shù)據(jù)項目才有意義。銀行的數(shù)據(jù)類型可分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)三大類型。
1.結(jié)構(gòu)化數(shù)據(jù):結(jié)構(gòu)化的數(shù)據(jù)來源自銀行運營數(shù)據(jù)倉儲(ODS)和數(shù)據(jù)倉庫(EDW)。EDW為企業(yè)提供分析決策服務(wù),ODS主要實現(xiàn)企業(yè)數(shù)據(jù)整合、共享和準(zhǔn)實時運營監(jiān)控等功能。
2.半結(jié)構(gòu)化數(shù)據(jù):半結(jié)構(gòu)化數(shù)據(jù)的整合在數(shù)據(jù)整合中是最為復(fù)雜的。銀行可對接來源于銀聯(lián)數(shù)據(jù)和其他的金融機構(gòu)所提供的不同類型數(shù)據(jù)庫或Excel等的數(shù)據(jù)?!按蛲ā倍嘣串悩?gòu)的數(shù)據(jù)是項目中遇到的最困難的部分,數(shù)據(jù)整合完畢可快速進(jìn)行建模分析。
3.非結(jié)構(gòu)化數(shù)據(jù): 銀行對于非結(jié)構(gòu)化的處理的方法還是比較原始的。非結(jié)構(gòu)化數(shù)據(jù)涵蓋的范圍比較廣泛,有新聞,視頻,圖片以及社交網(wǎng)絡(luò)等數(shù)據(jù),此類數(shù)據(jù)的數(shù)據(jù)量相當(dāng)巨大,但以后對銀行的增值會難以估量。
三、數(shù)據(jù)流向架構(gòu)圖
1.大數(shù)據(jù)基礎(chǔ)平臺:國外廠商的產(chǎn)品CDH、HDP等,國內(nèi)廠商的產(chǎn)品TDH、ADH等,以上產(chǎn)品均可為企業(yè)用戶提供大數(shù)據(jù)基礎(chǔ)的存儲與計算服務(wù)。
2.數(shù)據(jù)處理加工平臺:主要對大數(shù)據(jù)基礎(chǔ)平臺提供數(shù)據(jù),進(jìn)行建模分析。一可遷移銀行已有的主題模型,比如銷售主題、財務(wù)主題、風(fēng)控主題等一系列主題遷移至大數(shù)據(jù)平臺上。二可對接服務(wù)機構(gòu)創(chuàng)新性模型,比如半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)等的模型進(jìn)行遷移。
3.數(shù)據(jù)服務(wù)共享平臺:目前銀行應(yīng)用的較少??傂袘?yīng)用共享平臺,可為支行與分行提供服務(wù),比如支行與分行的客戶經(jīng)理在上班之前可用手機接收總行的推送信息,推送信息包括預(yù)測客戶經(jīng)理的顧客貸款、購買理財產(chǎn)品等的概率,提升服務(wù)質(zhì)量,提高服務(wù)精度,增加成單量。
目前接觸的銀行中,做到第二層級數(shù)據(jù)處理加工的比較多。銀行會做好用戶畫像,做一些簡單的客戶分析。至于第三層級數(shù)據(jù)服務(wù)共享平臺,做的銀行較少,而且總行應(yīng)用共享平臺,怎樣提供服務(wù)給支行,支行怎樣提供給分行,還需要理好思路進(jìn)行探討??傮w來講,數(shù)據(jù)流向的大致思路是通過數(shù)據(jù)源的接入獲取更加全面的數(shù)據(jù),通過構(gòu)建或遷移相關(guān)模型,為共享平臺提供服務(wù)。流程如下: 數(shù)據(jù)源接入——模型構(gòu)建——服務(wù)共享
四、大數(shù)據(jù)應(yīng)用
大數(shù)據(jù)應(yīng)用中,可依照非實時到實時為時間軸,分為離線分析、實時分析、流處理與數(shù)據(jù)服務(wù)接口服務(wù)。
1.離線分析: 銀行系統(tǒng)中,總行在離線分析應(yīng)用的較好。離線分析在銀行中的應(yīng)用比較落后陳舊,且多數(shù)利用海量歷史數(shù)據(jù)進(jìn)行離線分析,分析現(xiàn)有客戶,刻畫用戶畫像,對客戶細(xì)分。并且大部分分行還在跑批的階段。銀行如果過度依賴離線分析,會錯過客戶購買時機,在搶占市場時失去先機。
2.實時分析:相對于離線服務(wù),實時服務(wù)的總體投入量更多。實時分析階段主要提升計算能力,分析結(jié)果提升至分鐘級,及時提供服務(wù)支持,客戶經(jīng)理可以及時的跟蹤。
3.流處理:在流處理階段,銀行與客戶的交流會更直接。比如當(dāng)客戶消費時,消費記錄便會記錄在銀行的消息隊列,通過大數(shù)據(jù)平臺run出用戶符合某項活動的活動規(guī)則,1s內(nèi)反饋結(jié)果,活動與人會自定義匹配,在用戶操作刷卡動作時,實時減免相關(guān)用戶等級的費用,而且此活動會比提供優(yōu)惠券更能吸引客戶。
4.數(shù)據(jù)服務(wù)接口:可以增強銀行模式轉(zhuǎn)型競爭力。銀行的體制決定銀行本身具有大體量數(shù)據(jù)等資源,通過數(shù)據(jù)整合、模型分析等流程加工數(shù)據(jù),以數(shù)據(jù)服務(wù)商的角色為政府等部門提供數(shù)據(jù)、在線服務(wù)等,還可與之交換數(shù)據(jù)。