任蕙蘭
一個物流咨詢公司的老板說,你知道誰最關(guān)心大數(shù)據(jù)么?你肯定想不到,是跑運輸?shù)目ㄜ囁緳C。因為他們需要貸款付買路錢、付油錢,但車上的貨不是他們的,車也是租的,沒東西能抵押,銀行不會借錢給他們。有了大數(shù)據(jù)就不同了,貸款公司征信門檻會降低,因為它能實時收集你地理位置數(shù)據(jù)、行車路線數(shù)據(jù),甚至是你去哪個服務區(qū)上了個廁所。不怕你跑了,大家就肯借錢給你了。
這也許只是個例,但大數(shù)據(jù)對金融的影響卻是真實地在發(fā)生。不管你腦洞有多大,它都能補上。
借錢?請?zhí)峤荒愕奈⑿刨~戶
大數(shù)據(jù)在改變金融——誰都知道。但怎么改變?有人舉了一個例子,過去你去銀行貸款,要提供你的行駛證來證明你有一輛車,你的經(jīng)濟情況還不錯。以后信貸公司會直接調(diào)取你的社交記錄和網(wǎng)購記錄,發(fā)現(xiàn)你有一輛車,甚至知道你常去哪些4S店,用什么檔次的機油。
某一天,你去貸款或辦信用卡時不用再帶上厚厚一摞收入證明、資產(chǎn)證明,只要提交一個微信或淘寶賬戶,對方就能衡量你的信用資質(zhì),告訴你可以借到多少錢。
這個“某一天”其實已經(jīng)在發(fā)生。范雙文是麥子金服的風控總監(jiān),他曾在美國征信機構(gòu)益百利、信用卡公司Discover等企業(yè)工作過。在他負責風控的學生借貸平臺“名校貸”,除了要求客戶提供本人的學籍信息、聯(lián)系人電話等傳統(tǒng)信息,還要授權(quán)平臺調(diào)查其通話詳單和電商行為。
通話記錄和你的信用之間有什么關(guān)聯(lián)?專做電信數(shù)據(jù)分析的征信公司會給出答案。比如看你有沒有經(jīng)常打給聯(lián)系人,如果沒有,那這個聯(lián)系人可能是假的,你的誠信就有問題。另外,你有沒有經(jīng)常打給銀行信用卡熱線或其他信貸機構(gòu),如果有就說明你最近經(jīng)常借錢,財務狀況可能有問題。如果你的電話對象經(jīng)常是律師,那么肯定是訴訟纏身。
而你的電商行為更能說明一些情況,你有沒有淘寶或京東賬戶、有多久的歷史、買過些什么、每月平均消費多少錢、最近有沒有變化等等,這些都會成為平臺衡量你信用資質(zhì)的依據(jù)。當然,你的收貨地址如果和提供的家庭地址、學校地址不一致,這也會引起懷疑。
過去信貸機構(gòu)對客戶的評判依賴于人行報告,如果能找到客戶之前的貸款記錄當然最好,他的信用水平一目了然,但目前央行征信體系覆蓋8億人,真正具備信貸記錄的只有3億人,缺口相當大。也就是說,很多人特別是學生連張信用卡也沒辦過,一張白紙怎么去判斷?互聯(lián)網(wǎng)大數(shù)據(jù)就成為傳統(tǒng)征信手段的補充。
傳統(tǒng)征信數(shù)據(jù)主要來源于借貸領(lǐng)域,與之相比,互聯(lián)網(wǎng)征信數(shù)據(jù)來源更廣,種類更豐富,時效性更強,涵蓋了信用卡還款、網(wǎng)購、轉(zhuǎn)賬、理財、水電煤繳費、租房信息以及社交關(guān)系。通過大數(shù)據(jù)和云計算,互聯(lián)網(wǎng)征信能多維度勾勒出一個用戶的信用狀況。
范雙文在實踐中發(fā)現(xiàn),大數(shù)據(jù)可以告訴你一些東西,是你憑傳統(tǒng)的征信經(jīng)驗看不到的,它有時會糾正信貸公司的刻板觀念。
他做過一個嘗試,把985/211重點高校和普通高校本科學生的信用數(shù)據(jù)放進系統(tǒng)進行比對,一般人會以為重點大學學生的還款情況更好,但經(jīng)過云計算分析,兩者的逾期率差不多。“我們根據(jù)這個結(jié)果,倒推做了一些分析,可能是因為現(xiàn)在大學生普遍對自己的信用記錄都很重視,所以普通本科院校的學生也不會輕易賴賬?!?/p>
他還比對過博士生、碩士生和本科生的信用數(shù)據(jù),結(jié)果也出乎意料,博士生信用的確比碩士生和本科生好很多,但碩士生和本科生之間差別并不像想象的那么大。
以地域作為變量,對數(shù)據(jù)進行比對分析的結(jié)果也讓人頗感意外,還款情況最好的是內(nèi)蒙古籍貫的學生,而不是傳統(tǒng)印象中經(jīng)濟條件更好的“北上廣深”?!懊YJ”的風控團隊特地到內(nèi)蒙古考察過好幾次,發(fā)現(xiàn)內(nèi)蒙古人有個特點,非常耿直,看重自己的名譽,“如果欠錢不還的消息在親友圈傳播開來,他們會覺得很沒面子”。
美國征信機構(gòu)對大數(shù)據(jù)的應用領(lǐng)域則更加廣泛,比如客戶的郵箱域名也會影響個人信用評級。在過去的某一段時間,使用American Online郵箱域名的客戶,其綜合資質(zhì)會高于使用Yahoo、Gmail等郵箱域名的客戶。
“名校貸”也引進過這個做法,但從目前平臺的比對結(jié)果來看,學生用什么郵箱域名和他的信用資質(zhì)關(guān)聯(lián)不明顯。不過根據(jù)范雙文的判斷,如果客戶群體是已經(jīng)工作的人可能效果會更顯著。如果有足夠的數(shù)據(jù)去分析,也許QQ特性也會和一個人的信用資質(zhì)有關(guān)。
吃川菜和信用有關(guān)?
你一周喝幾杯咖啡真的和信用有關(guān)么?也許有,但你可以放心,目前還不會有公司因為你減少咖啡量就拒絕貸款給你。
大到衣食住行,小到交友約炮,互聯(lián)網(wǎng)沉淀了大量用戶的碎片化數(shù)據(jù),哪些和客戶信用有關(guān),哪些只是過眼云煙,沒有哪家征信機構(gòu)或信貸公司可以斷言,對數(shù)據(jù)的使用很多還在探索中。
不管離題萬里的信息還是立竿見影的信息,誰都知道大數(shù)據(jù)是個寶庫,信貸公司和征信機構(gòu)忙著從海量數(shù)據(jù)中挖掘出有用的那部分。頭腦風暴一下也不壞。
范雙文嘗試過比對不同星座學生的還款記錄。他用10萬多條數(shù)據(jù)做了個測試,結(jié)果發(fā)現(xiàn)客戶的星座和信用資質(zhì)從數(shù)據(jù)上看真的有點關(guān)系。貸款信用最差的是白羊座,而公認做事認真、追求完美的處女座,信用排名也不是很靠前?!斑@樣的比對結(jié)果我們還沒辦法用邏輯去解釋,有可能是我們還沒找到原因,也有可能是數(shù)據(jù)量太小,這個結(jié)果不是很準確?!彼运€沒把星座添加進授信政策,作為一個貸款標準,這更像是個有趣的試驗。
想法再大膽一些。一個人每周吃五次川菜還是每周吃五次粵菜,對他的信用資質(zhì)有影響么?這個問題聽上去很無厘頭,但大數(shù)據(jù)分析真有可能告訴你答案。
“比方說,一個愛吃川菜的人有70%的可能是四川人,如果正好四川人的還款情況比廣東人差,那很可能比對下來的結(jié)果就是,川菜愛好者壞賬率比粵菜愛好者高。另外,一般來說窮人口味重,富人口味淡,那愛吃川菜的人經(jīng)濟情況就有可能比愛吃粵菜的人差,從而影響還款能力。當然,這些只是揣測,也有可能數(shù)據(jù)比對下來的結(jié)果和我們想象的截然不同。”目前還沒有哪一家信貸機構(gòu)去和餐飲點評網(wǎng)站合作,研究客戶的餐飲數(shù)據(jù),但未來這些數(shù)據(jù)都有可能被分析。
有些數(shù)據(jù)和信用之間的邏輯關(guān)系,可能一步就可以推過去,有些要分幾步推過去。也有些,或許你想破腦袋也不能解釋?!皵?shù)據(jù)永遠不嫌多,機構(gòu)總有辦法去消化?!?/p>
海量的數(shù)據(jù)必然會帶來海量的玩法。你的腦洞可以再開大一點,說不定以后會有人用測顏值的App分析一下每個客戶的頭像,再比對顏值高客戶和顏值低客戶的信用記錄,也許會發(fā)現(xiàn)越美貌的人還錢越積極,或者是相反。當然,必須是素顏照才行。
不過,如果這些看著很BT的數(shù)據(jù)真的被納入授信政策,會不會太武斷?比如一個人明明誠實靠譜,他的籍貫地正好爆發(fā)一輪壞賬,運氣有點糟糕,他因為地域問題被拒絕貸款。被大數(shù)據(jù)“錯殺”的客戶,那得有多冤枉。
“一個完整的模型包含起碼20多個維度,比如學歷、地域、工作、性別、收入、歷史交易信息等等,能不能通過審批是一個綜合的評判過程。當然,不排除上述情況客戶的地域打分會低一些。”范雙文解釋。
在美國,信貸公司在拒絕客戶貸款申請時,會被要求提供合理的理由,比如客戶的經(jīng)濟實力不夠、信貸記錄不良或有訴訟糾紛。有些理由是合法的,有些是非法的,監(jiān)管部門對此有詳細的規(guī)定。比如種族、性別等類型的理由就是不允許的,會牽涉到歧視。
“雖然信貸公司沒有把拒絕你的理由寫到紙面上,但不表示公司不會在內(nèi)部嚴格控制?!?/p>
兵家必爭之地
“互聯(lián)網(wǎng)金融的核心依然是風控,最開始你的營銷比別人做得好,可以比別人跑得快一點,但拼到最后還是靠風控,如果你的風控能保證壞賬比別人低,哪怕低1%,就能比別人跑得更遠?!狈峨p文說。
征信是互聯(lián)網(wǎng)金融的命脈,大數(shù)據(jù)就是征信的命門,誰都想掌握這個命門。
數(shù)據(jù)掌握在誰的手里?
傳統(tǒng)擁有者是人民銀行,出具的個人信用報告為商業(yè)銀行零售部門所重。社會征信機構(gòu)也日漸崛起,上海資信、深圳鵬元、國政通等幾家成為不少小貸公司的合作對象。深圳鵬元側(cè)重深圳地區(qū)的個人社保信息,國政通覆蓋全國范圍個人學籍信息。
中國超6億網(wǎng)民的大數(shù)據(jù)紅利沉淀在社交網(wǎng)絡(luò)、電商網(wǎng)絡(luò)、網(wǎng)貸平臺?;ヂ?lián)網(wǎng)平臺積累的巨量數(shù)據(jù)精準到個人用戶習慣以及資信水平。手握大數(shù)據(jù)的機構(gòu)通過云計算的模型分析,在征信上將大有可為。
美國互聯(lián)網(wǎng)信用評級機構(gòu)Zestfinance就成為傳統(tǒng)征信業(yè)的攪局者。美國征信巨頭Fico掌握70%人的信用記錄,但有30%左右的人沒有貸款記錄,既沒辦過信用卡,也沒有過房貸。益百利、Fico等大公司對個人信貸歷史過于依賴,不具備豐富金融借貸的個人就被排斥,而互聯(lián)網(wǎng)數(shù)據(jù)廣泛,幾乎可以無死角覆蓋,所以Zestfinance就有了存在價值。
Zestfinance數(shù)據(jù)包括,第一類是第三方數(shù)據(jù),既包含銀行信用卡數(shù)據(jù),也包括法律記錄、搬家次數(shù)等非傳統(tǒng)數(shù)據(jù)。第二類是網(wǎng)絡(luò)數(shù)據(jù),如IP地址、瀏覽器版本甚至電腦的屏幕分辨率,這類數(shù)據(jù)可以挖掘出用戶的位置信息、性格和行為特征。第三類是社交網(wǎng)絡(luò)數(shù)據(jù)。
國內(nèi)的BAT三家都在打數(shù)據(jù)的主意。首批八家商業(yè)征信機構(gòu)中,阿里和騰訊都入圍。和Zestfinance比較接近的是阿里芝麻信用評分,靠的是支付寶積累。很多人習慣用支付寶還信用卡賬、付水電煤、訂酒店機票、打車。阿里除了掌握信用卡還款記錄這樣直接的信貸數(shù)據(jù),也有個人網(wǎng)購記錄、商旅消費記錄、打車記錄等間接證明個人經(jīng)濟狀況的數(shù)據(jù)。接下來和信貸公司的合作是水到渠成的事。
騰訊掌握的個人社交數(shù)據(jù)則會是阿里的有效補充,但這些數(shù)據(jù)要怎么去挖掘,提煉成有用的征信標準,騰訊也在絞盡腦汁。
大公司在玩大數(shù)據(jù),小公司也在找“長尾”。小公司只要尋找到一個合適的細分消費場景,就可以把風控模型嵌入進去。比如二手車市場,很少有銀行會為買二手車的客戶單獨建個風控模型,決定他們的貸款額度。但如果有小公司切入這個市場,收集客戶數(shù)據(jù)分析比對,研究客戶特性,為這些客戶量身定做一個風控模型,那它就有存在價值。同樣的方式在裝修、留學等細分市場也會奏效?!L尾可以喂飽很多參與者。
“征信不可能是一家獨大的局面。在美國,即使是益百利、Fico等巨頭也不可能壟斷整個市場,還有幾千家小的征信機構(gòu),在細分市場占據(jù)優(yōu)勢,小機構(gòu)向大機構(gòu)提供數(shù)據(jù)。國內(nèi)以后也會是這個局面,BAT也不會獨大,小的互聯(lián)網(wǎng)征信公司也會有生存空間?!?/p>
當然,小公司的風控模型要對接信貸機構(gòu)的需求,還有很長的路要走。對動輒幾百萬條數(shù)據(jù)的傳統(tǒng)金融機構(gòu)來說,小征信公司依靠幾萬條數(shù)據(jù)建立的風控模型,未必精準契合。而用自己的數(shù)據(jù)驗算這個模型,本身就有不小的成本。