數據智能時代是大數據與人工智能有機結合的新時代。人工智能與大數據的關系就像蒸汽與蒸汽機。大數據就像蒸汽,人工智能就像蒸汽機,把蒸汽轉化為先進生產力。
—金電聯行(北京)信息技術有限公司董事長范曉忻
數據智能曾被看做是各個行業(yè)的催化劑,不屬于基礎建設領域。但現在,數據智能領域已經成為了一個重要的基礎建設領域。我們對大數據的理解最初來源于4個“V”,即真實性(Veracity)、大量化(Volume)、速度化(Velocity)、多樣化(Variety)?,F在大家對4個“V”這個概念的理解已經不盡相同。我們把真實性換成了價值密度(Value density)這種特性,因為我們認為只有價值密度低的數據才是大數據。如果價值密度較高,數據就不能被稱作是大數據,而應該被叫做結果數據,因為這些數據無法進行進一步地多維分析。只有對價值密度非常低的數據進行多維分析,才有可能產生有影響力的結果。
下面我們談一談數據約束力,數據約束力改變了合同履約率低的現狀,如在交通方面,強大的攝像頭形成了數據的約束力。國家相繼出臺的政策旨在通過打通各個委辦局的數據,形成事實上的數據約束,提升整個社會和經濟活動的效率,其中包括金融活動的信用水平。
我們建立了五層架構來支撐信用建設實現飛躍式進展,這五層架構包括:其一,大數據基礎平臺和大數據IO控制器。以計算機為例,大數據基礎平臺類似于主板,IO控制器類似于南橋。其二,大數據管理器,即數據關系管理平臺,類似于北橋。其三,大數據中央處理器類似于CPU。其四,大數據的建模平臺幾乎應用在所有的模型生產、調整、投產領域。其五,數據應用AI處理器,包括我們的方法論、知識圖譜等,相當于計算機的可編程控制器。這五層架構實現了數據從接入到管控、數據的標準化、數據之間關系的標準化、原數據管理,再到數據在整個體系內的生產調動、模型的生產調度,構成了數據生產的閉環(huán)。
我們的平臺需要有自主可控能力、產品封裝能力,在數據生產、處理、交付的過程中要盡量排除人的影響。人工智能平臺需要有實時計算的能力,只有在不需要人力的情況下,我們才能實現從數據處理到應用的全流程自動化和人工智能的普適化。
我們的核心技術是“星簇”和“方舟”,“星簇”可以理解為大數據時代的CPU。如果我們把大數據與汽車生產車間進行比較,“星簇”就類似于整條生產線,其中包括設計、施工、交付、運行、監(jiān)控和粗加工等環(huán)節(jié)。每一個汽車廠都有零部件加工的系統(tǒng),一些大的零部件加工環(huán)節(jié)也可以在“星簇”平臺里體現。如今,“星簇”平臺已經擁有2500多個組件,可以支持用戶對數據的實時處理。
“方舟”平臺可以理解為大數據時代的GPU,它與市場上比較流行的建模平臺有一些區(qū)別。建模平臺的作用是將人從模型的建構中解脫出來,通過將經驗與模型的構建相結合尋找合適的模型,本質上是通過算法尋找算法,而不是人為地尋找算法?!胺街邸焙推渌F脚_的區(qū)別在于“方舟”能夠基于因果推論進行機器學習。我們的人工智能算力不足,只有算力足夠,人工智能才有機會接近人的思維模式,但很多規(guī)律我們已經獲得了經驗,這些經驗在社會經濟生活中已經有所體現。因此,我們結合經驗和算法進行了深入的研究,并開發(fā)了基于因果推論的機器學習模式。機器學習的過程包括三個階段:使用案例找原算法、使用原算法找算法、使用算法找模型。
下面我來談談數據遷移。數據遷移作為一個新概念,引起了非常大的關注,原因有以下三點:第一,分布式計算已經成為現今相對熱門的體系,同時也是未來的主流體系。在這種情況下,傳統(tǒng)的架構面臨巨大的挑戰(zhàn)。第二,隨著互聯網金融的發(fā)展放緩,大量的數據轉入傳統(tǒng)金融機構。在這種情況下,傳統(tǒng)的數據倉庫難以承載來自移動端的壓力,金融機構要從傳統(tǒng)的數據倉庫向新的架構轉移。第三,從源頭到流通端再到應用端,隱私數據作為結果數據受到了重重保護,這些數據的使用受到了極大的限制,企業(yè)對大數據的需求變得非常迫切。
為了支持實體經濟,破解中小企業(yè)融資難的困境,我們提出了兩個模式:嘉定模式和蕪湖模式。嘉定模式是一個比較成熟的,適合在相對發(fā)達的、優(yōu)質中小企業(yè)相對集中的地區(qū)發(fā)展的模式。嘉定模式通過征信機構和政府的合作,把合適的金融產品推送給企業(yè),再將合適的企業(yè)推送給金融機構,以此來做到精準匹配。而蕪湖模式是一個四方參與、四方受益,最終實現最大杠桿效率的模式。這個模式是由政府主導建立產融平臺或融資平臺,在這個平臺上促成金融機構和企業(yè)的合作。蕪湖模式與嘉定模式最大的區(qū)別在于政府為蕪湖模式提供后備資金或風險準備金等,政府可以將小微企業(yè)推送給金融機構,政府的后備資金還可以為金融機構提供保障。征信機構在這里面起到非常關鍵的作用,征信機構通過測算數據,并與政府溝通,確定支持企業(yè)融資的比例和要擴大多大的規(guī)模才能使雙方的信息對稱。因此在風險可以得到有效控制的情況下,金融機構幫助優(yōu)質企業(yè)融資的速度將大大提升。
數據智能、人工智能和大數據之間互為因果,沒有數據支撐的模型也不可能獲得成功,因此,數據智能是未來極為重要的發(fā)展方向。
(根據演講內容整理,未經本人審核)