◆ 叔 平/ 文
質(zhì)量時評
“多算勝,少算不勝”
——從百度發(fā)布大數(shù)據(jù)引擎說起
◆ 叔 平/ 文
4月24日,“百度大數(shù)據(jù)引擎”發(fā)布,引發(fā)關(guān)注。
“大數(shù)據(jù)引擎”指的是對大規(guī)模的數(shù)據(jù)進行收集、存儲、計算、挖掘和管理的一套系統(tǒng)。包括“開放云、數(shù)據(jù)工廠、百度大腦”三層核心平臺。
其中,“開放云”相當于存儲記憶的“腦容量”,解決的是數(shù)據(jù)存儲和計算瓶頸。“數(shù)據(jù)工廠”相當于人腦中的記憶關(guān)聯(lián)過程,是用百度提供的“大數(shù)據(jù)挖掘機”把大數(shù)據(jù)關(guān)聯(lián)起來,并從中挖掘出價值,TB級甚至更大的數(shù)據(jù)的查詢和掃描工作,是其生產(chǎn)任務(wù)?!鞍俣却竽X”,是做決策的能力,如同人腦,不過目前的智慧還只相當于兩到三歲的孩子。盡管如此,但這可能是世界上最復(fù)雜的可以模擬人腦思維的系統(tǒng)。再過十年二十年,百度大腦很有可能比人腦還要聰明。
值得關(guān)注的是,“百度大數(shù)據(jù)引擎”采取邀請和免費模式,把一整套核心能力通過平臺化、接口化的方式對外開放。政府、NGO、制造、醫(yī)療、金融、零售、娛樂、教育等傳統(tǒng)領(lǐng)域,將率先與之合作。擁有海量數(shù)據(jù)的傳統(tǒng)企業(yè),可以利用“百度大數(shù)據(jù)引擎”,在線使用其提供的種種技術(shù)便利,一舉進入大數(shù)據(jù)、云計算、平臺經(jīng)濟等移動互聯(lián)網(wǎng)技術(shù)觸發(fā)的新一輪工業(yè)革命。
隨著信息化發(fā)展進入移動互聯(lián)網(wǎng)和大數(shù)據(jù)時代,企業(yè)管理、產(chǎn)品服務(wù)設(shè)計、乃至商業(yè)模式,不僅改造、優(yōu)化、甚至顛覆。企業(yè)競爭力將極大增強,生產(chǎn)效率將不斷提升。正所謂“創(chuàng)新驅(qū)動、轉(zhuǎn)型發(fā)展”,是也。
事實上,最早提出“大數(shù)據(jù)時代到來”的是麥肯錫公司。2011年6月,麥肯錫全球研究院發(fā)布了題為《大數(shù)據(jù):下一個創(chuàng)新、競爭和生產(chǎn)力的前沿》研究報告。該報告指出:大數(shù)據(jù)時代已經(jīng)到來,數(shù)據(jù)正成為與物質(zhì)資產(chǎn)和人力資本相提并論的重要生產(chǎn)要素,大數(shù)據(jù)的使用將成為未來提高競爭力的關(guān)鍵要素。
開大數(shù)據(jù)研究著作先河的《大數(shù)據(jù)時代》作者維克托·邁爾·舍恩伯格,提出了“大數(shù)據(jù)時代最大的轉(zhuǎn)變就是,放棄對因果關(guān)系的渴求,取而代之關(guān)注相關(guān)關(guān)系”的觀點。該書指出,大數(shù)據(jù)的核心就是預(yù)測。這正是大數(shù)據(jù)應(yīng)用的最迷人之處。
“大數(shù)據(jù)”的重要性,可以從聯(lián)合國“數(shù)據(jù)脈動”計劃、美國“大數(shù)據(jù)”戰(zhàn)略、英國“數(shù)據(jù)權(quán)”運動、日本“面向2020年的ICT綜合戰(zhàn)略”、韓國“大數(shù)據(jù)中心戰(zhàn)略”的提出和實施中窺見。
2012年3月29日奧巴馬政府發(fā)布的《大數(shù)據(jù)研究和發(fā)展計劃》明確,要從國家戰(zhàn)略層面收集龐大而復(fù)雜的數(shù)字資料,并從中獲得知識和洞見,以提升能力。奧巴馬團隊更是身體力行,將大數(shù)據(jù)分析運用到競選,通過對近兩年搜集、存儲的海量數(shù)據(jù)進行分析挖掘,尋找和鎖定潛在的己方選民,運用數(shù)字化策略定位拉攏中間派選民及籌集選舉資金。在數(shù)據(jù)挖掘支持下的決策,為奧巴馬的連任立下了汗馬功勞。
“大數(shù)據(jù)是與自然資源、人力資源一樣重要的戰(zhàn)略資源”,這一點正在全球形成共識。大數(shù)據(jù)猶如亟待挖掘的金礦,挖掘金子的應(yīng)用越來越多。本刊上期“質(zhì)量譯叢”《掌握大數(shù)據(jù)的組織將超越對手》一文中,便提到了20種應(yīng)用。包括:抵押價值評估,車輛故障預(yù)測,自動識別促銷活動商品,非醫(yī)療檢測健康風(fēng)險識別,診斷輔助,顧客維系,目標營銷,預(yù)測廣告定位,電影與圖書推薦,雇員留任,引導(dǎo)針對性教學(xué),妊娠預(yù)測,犯罪預(yù)測,網(wǎng)絡(luò)入侵檢測,垃圾郵件過濾,開放式問題回答,博客內(nèi)容焦慮檢測等等。
這20種應(yīng)用,都已經(jīng)有了經(jīng)典故事。如“自動識別促銷活動商品”,故事是:一位收到廣告的父親很憤怒地對商場說:“我女兒還在高中,你們現(xiàn)在天天給她寄嬰兒尿布、奶粉的廣告,什么意思?”商場說:“對不起,我們搞錯了!”過了一個星期,這個老爸又回來,說:“對不起,我搞錯了,我女兒已經(jīng)向我坦白了,她真的懷孕了?!?/p>
尿布和啤酒相關(guān)的經(jīng)典故事,也膾炙人口。沃爾瑪通過挖掘顧客消費數(shù)據(jù)發(fā)現(xiàn),尿布、啤酒,兩者關(guān)聯(lián)。原來,當家里有小孩后,買尿布的任務(wù)多半由新爸爸去完成。新爸爸在買完尿布時,往往會順便買一瓶啤酒犒勞自己??此啤帮L(fēng)馬牛不相及”的兩者,不僅相關(guān)并存在因果關(guān)系。后來沃爾瑪就把啤酒和尿布放在一塊兒,啤酒的銷售量一下子就增加了。
當然,“阿里小微金融”這個顛覆了傳統(tǒng)銀行做法的大數(shù)據(jù)應(yīng)用經(jīng)典故事,最為震撼。阿里金融發(fā)放微貸,其實是利用了客戶的兩類數(shù)據(jù),一是網(wǎng)上客戶信用數(shù)據(jù),二是客戶的行為數(shù)據(jù)。據(jù)此,阿里金融建立起了一個網(wǎng)絡(luò)數(shù)據(jù)模型和一套信用體系。這個網(wǎng)絡(luò)模型和信用體系,會給每一個商鋪,每一個店家做信用等級的評分。這個評分,就是阿里金融發(fā)放微貸的依據(jù),從500元錢到100萬元不等。從而拋棄了銀行貸款必須抵押、必須擔保的傳統(tǒng)做法。阿里“平臺+金融+數(shù)據(jù)銀行”的做法,也讓傳統(tǒng)銀行深受啟發(fā),開始重視大數(shù)據(jù),重視線上渠道。
于是,你用大數(shù)據(jù),我也用大數(shù)據(jù),一場以大數(shù)據(jù)為重要生產(chǎn)要素驅(qū)動的革命,即將出現(xiàn)。正如百度CEO李彥宏表示的:“技術(shù)創(chuàng)新是一個從量變到質(zhì)變的過程。并行計算能力不斷提升和云存儲等技術(shù)產(chǎn)品成本的不斷降低,使大數(shù)據(jù)真正走到了技術(shù)變革的臨界點。百度開放自己的大數(shù)據(jù)核心能力,將更好地幫助傳統(tǒng)行業(yè)挖掘數(shù)據(jù)價值,加快傳統(tǒng)行業(yè)轉(zhuǎn)型升級,進而發(fā)揮出對整體社會經(jīng)濟的革命性影響?!?/p>
中國的人口和經(jīng)濟規(guī)模決定了中國大數(shù)據(jù)規(guī)模為全球最大,同時也意味著中國大數(shù)據(jù)的分析方法、解決方案將適用于其他國家。這將為“中國制造”向“中國創(chuàng)造”轉(zhuǎn)變提供難得的機遇。為此,上海已經(jīng)率先向社會開放了政府數(shù)據(jù)資源,上海市經(jīng)委正在研究籌備大數(shù)據(jù)局,為中國企業(yè)和社會更好地應(yīng)用大數(shù)據(jù)創(chuàng)造條件。
顯然,百度大數(shù)據(jù)引擎的發(fā)布,以及上海率先開放政府數(shù)據(jù)資源,上海市經(jīng)委研究籌備大數(shù)據(jù)局等等跡象,是大數(shù)據(jù)應(yīng)用走到了技術(shù)變革前夜的標志。企業(yè)要善加利用,極早將傳統(tǒng)企業(yè)轉(zhuǎn)型為“大數(shù)據(jù)說話”的智慧企業(yè),提升大數(shù)據(jù)時代的企業(yè)競爭力。在這方面,企業(yè)一方面可以與大數(shù)據(jù)專業(yè)公司合作;另一方面本身也須做好幾件事。
首先,要從小數(shù)據(jù)思維轉(zhuǎn)變?yōu)榇髷?shù)據(jù)思維。
1931年,美國安全工程師海因里希通過分析55萬起工傷事故的發(fā)生概率,提出了著名的海因里?!笆鹿式鹱炙崩碚?,論證了加強日常安全管理、細節(jié)管理對消除不安全行為和不安全狀態(tài)的重大作用。
在今天看來,55萬起工傷事故的數(shù)據(jù),就是個小數(shù)據(jù)。因為全世界互聯(lián)網(wǎng)流量累計達到1EB所需要的時間,2001年需要一年,2004年需要一個月,而現(xiàn)在只需要一天。大數(shù)據(jù)時代,沒有最大,只有更大。量變會引起質(zhì)變,于是大數(shù)據(jù)時代就出現(xiàn)了不可思議的事情:似乎不需要邏輯思考,大數(shù)據(jù)會直接導(dǎo)出答案,而且更準確。
因此,今天我們可以放寬對概率精度的嚴苛要求,也不要過分追求相互關(guān)聯(lián)中的因果關(guān)系,不如“讓大數(shù)據(jù)說話”。但我們也須明白,大數(shù)據(jù)可以驅(qū)動精確的預(yù)測,但不能代替判斷,也不能代替理論,畢竟,我們要“知其然”,也要“知其所以然”。
其次,建立以大數(shù)據(jù)為基礎(chǔ)的客戶為中心的經(jīng)營管理模式。
我們一直在強調(diào),要建立以客戶為中心的經(jīng)營管理模式。今天看來,沒有線上、線下全方位的客戶大數(shù)據(jù),就不可能建立真正的以客戶為中心的經(jīng)營管理模式。只有從傳統(tǒng)的業(yè)務(wù)數(shù)據(jù)拓展到網(wǎng)絡(luò)數(shù)據(jù),把網(wǎng)絡(luò)數(shù)據(jù)與客戶數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)結(jié)合起來,才有可能真正建立起以客戶為中心的管理模式。只有重視客戶體驗,把線上線下客戶行為的各種數(shù)據(jù)綜合聯(lián)系起來,再把這些聯(lián)系還原成一個個活生生的客戶體驗偏好,才能引導(dǎo)我們“精準營銷”,這樣的經(jīng)營管理模式,才會對客戶提供更好的服務(wù),才會有更高的投資效率,才會有更強的競爭力。
第三,要以高度的社會責(zé)任感處理大數(shù)據(jù)資源。
大數(shù)據(jù)的挖掘,最大的挑戰(zhàn)莫過于破除復(fù)雜性,所謂的“數(shù)據(jù)除塵”,以找出數(shù)據(jù)間的關(guān)聯(lián)。就是說,要在大海里撈“針”,發(fā)現(xiàn)規(guī)律,這才是一件最重要的事情。此外,數(shù)據(jù)是流動的,海量的數(shù)據(jù)每時每刻在增長,如飛機引擎般每時每刻在流出數(shù)據(jù),我們需要所謂的流計算,這又是一門專業(yè)的挑戰(zhàn)。
不管如何,企業(yè)要把基于大數(shù)據(jù)的質(zhì)量管理過程建立起來,包括建立PDCA循環(huán)互動的質(zhì)量數(shù)據(jù)池,配備既懂得數(shù)據(jù)分析技術(shù),又諳熟企業(yè)各項業(yè)務(wù),還善于右腦思考的新型復(fù)合型人才。
大數(shù)據(jù)時代,千萬不能忘記的是“禍兮福所倚,福兮禍所伏”這句老話。因為海量的數(shù)據(jù)有四宗罪:它的質(zhì)量可能很差;它可能不客觀;它可能存在分析錯誤或誤導(dǎo)性;更糟糕的是,數(shù)據(jù)可能根本達不到量化它的目的。
噪音大、波動大的大數(shù)據(jù)時代,更令人擔憂的是它尚未建立起來的行為規(guī)范?!巴顺睍r,可以發(fā)現(xiàn)誰在裸泳”,這是在過去。現(xiàn)在,“不用退潮,就可以看見誰在裸泳”了。放肆地公開數(shù)據(jù)信息或刻意地壟斷數(shù)據(jù)信息,都有著不可推卸的責(zé)任。
“多算勝,少算不勝”?!秾O子兵法》如此說。這種實事求是的大數(shù)據(jù)精確管理體系,是未來中國發(fā)展實現(xiàn)有質(zhì)量增長所不可或缺的基礎(chǔ)條件。我們相信,大數(shù)據(jù)時代,無論挑戰(zhàn)有多么大,中國的機遇一定會更大。