張敏翀
今天我們看到大量與行業(yè)相關(guān)的數(shù)據(jù),當(dāng)全球流量經(jīng)濟陷入停滯的時候,數(shù)據(jù)仍在以每兩年翻一番的速度增長,給我們非常大的想象空間。這么多跟數(shù)據(jù)相關(guān)的行業(yè)以及這么大的存儲量,應(yīng)該怎樣合理利用?今天,數(shù)據(jù)流通是新的方向,在絕大部分的行業(yè)里實際上沒有形成完全壟斷的格局,數(shù)據(jù)是呈分布式存在的,數(shù)據(jù)不僅是在本行業(yè)進行流通,而且大量的行業(yè)數(shù)據(jù)正在跨越應(yīng)用。
Teradata調(diào)查顯示,很多公司僅存儲了15%與其業(yè)務(wù)相關(guān)的數(shù)據(jù),其他85%的數(shù)據(jù)駐留在其他公司或網(wǎng)站上。Gartner預(yù)測,到2017年,約2/3的大數(shù)據(jù)整合項目將是企業(yè)防火墻之外(外部數(shù)據(jù))的整合。
今天全球數(shù)據(jù)第三方數(shù)據(jù)交易的市場規(guī)模不斷擴大,得益于較完備的法規(guī)和市場信用體系,國外涌現(xiàn)了諸如Experian、Equifax、Trans Union、Dun&Bradstreet、Acxiom、Twitter Gnip、LinkedIn Fliptop、Oracle BlueKai等一大批數(shù)據(jù)交易市場。其中Acxiom是新秀,其他絕大部分都是基于傳統(tǒng)數(shù)據(jù)庫建立的數(shù)據(jù)交易市場。
在美國,數(shù)據(jù)資源有它的特殊性,既是價值也包含了隱私,數(shù)據(jù)公司在轉(zhuǎn)型,用應(yīng)用和服務(wù)來包裹安全和隱私。去年,美國第三方數(shù)據(jù)資源市場規(guī)模大概是60億美元,中國的第三方數(shù)據(jù)資源市場大概在30億元到40億元之間。
上海數(shù)據(jù)交易中心是由上海市人民政府常務(wù)會議批準(zhǔn),在2016年4月份成立的。上海數(shù)據(jù)交易中心是國家大數(shù)據(jù)交易標(biāo)準(zhǔn)的試點基地。其實,整個數(shù)據(jù)產(chǎn)品的應(yīng)用大致分為四個階段:第一階段,成為業(yè)務(wù)系統(tǒng)的附屬產(chǎn)品;第二階段,成為整個業(yè)務(wù)的重要驅(qū)動;第三階段,數(shù)據(jù)本身成為產(chǎn)品,第四階段,應(yīng)用和服務(wù)成為數(shù)據(jù)的外殼。上海數(shù)據(jù)交易中心定位為一個公開合法的數(shù)據(jù)交易平臺,我們要遵循兩個基本原則:第一叫目的先進原則,數(shù)據(jù)價值是跟應(yīng)用相關(guān)聯(lián),一方面要降低數(shù)據(jù)的成本,另一方面要比較好地控制數(shù)據(jù)風(fēng)險;第二叫目的圍繞應(yīng)用,一方面要符合安全合規(guī)要求,數(shù)據(jù)里面關(guān)聯(lián)的主體不能被流通,另一方面,生命周期比較短的數(shù)據(jù)要經(jīng)過透明處理。
我們主要的角色是數(shù)據(jù)供方和數(shù)據(jù)需方的組織者,包括市場交易機制的設(shè)計以及數(shù)據(jù)安全流通。我們的業(yè)務(wù)流程跟普通的交易基本上一致,但是里面有很多不一樣的細節(jié)。我們的關(guān)注要點在于效率、留存、安全、質(zhì)量和價格。大數(shù)據(jù)是一個早期市場,它的需求是非標(biāo)的,是跨越式的。所以我們今天做數(shù)據(jù)交易的時候發(fā)現(xiàn),供方根據(jù)自己理解所做的標(biāo)簽化產(chǎn)品和服務(wù)化產(chǎn)品跟需方是對不上的,是兩個不同的標(biāo)準(zhǔn)體系。供方數(shù)據(jù)和需方需求呈碎片化,他們之間需要一個組織去實現(xiàn)轉(zhuǎn)換。怎樣保持數(shù)據(jù)的一致性?怎樣規(guī)范靜態(tài)數(shù)據(jù)留存問題?這是我們關(guān)注的問題。此外,我們也比較關(guān)心數(shù)據(jù)的安全和質(zhì)量。
整個數(shù)據(jù)結(jié)構(gòu)是技術(shù)+規(guī)則的體系,上海數(shù)據(jù)交易中心成立一年的時間里,我們陸續(xù)制定了大量的數(shù)據(jù)交易業(yè)務(wù)規(guī)則、技術(shù)標(biāo)準(zhǔn)。我們在技術(shù)上也采取了相關(guān)措施,包括數(shù)據(jù)傳輸和交換,既需要使交換雙方識別數(shù)據(jù)之間的關(guān)系,又要保護關(guān)聯(lián)關(guān)系本身的不可識別性。
ex-ID是以一套約定的算法,對所需關(guān)聯(lián)的ID進行加密轉(zhuǎn)換后的流通專用ID。既可以保持識別原有數(shù)據(jù)關(guān)聯(lián)性的能力,又能保護ID本身的隱私。
目前交易市場面臨一些問題和挑戰(zhàn),第一,互聯(lián)網(wǎng)數(shù)據(jù)匯聚格局基本形成,互聯(lián)網(wǎng)數(shù)據(jù)資源日漸向以騰訊為代表的社交入口、以百度為代表的搜索入口、以阿里巴巴為代表的電商入口集中。第二,行業(yè)應(yīng)用創(chuàng)新能力不足,我國數(shù)據(jù)應(yīng)用局限在電子商務(wù)、精準(zhǔn)營銷等有限的領(lǐng)域,且大多以初級資源產(chǎn)品為主,數(shù)據(jù)產(chǎn)品和服務(wù)創(chuàng)新能力不足。第三,市場信用體系缺失,市場缺乏信任機制,技術(shù)服務(wù)方、數(shù)據(jù)分發(fā)商、數(shù)據(jù)查詢節(jié)點等私下緩存并對外共享、交易數(shù)據(jù),數(shù)據(jù)使用企業(yè)不按協(xié)議要求私自留存、復(fù)制甚至轉(zhuǎn)賣數(shù)據(jù)的現(xiàn)象普遍存在。
長遠來看,對數(shù)據(jù)隱私和數(shù)據(jù)權(quán)利的尊重是保障大數(shù)據(jù)企業(yè)可持續(xù)發(fā)展的關(guān)鍵因素。目前所有的數(shù)據(jù)對供給方是有機制的,商業(yè)主體卻沒有很好的機制來保護。從交易模式來看,主要有中介服務(wù)模式、數(shù)據(jù)集市模式、C2B個人數(shù)據(jù)交易模式。2026年,基于云的數(shù)據(jù)服務(wù)將是一個方向。從整個數(shù)據(jù)資源總量來看,中國的公共數(shù)據(jù)資源占到全國數(shù)據(jù)總量的2/3以上。未來整個數(shù)據(jù)的格局由互聯(lián)網(wǎng)平臺轉(zhuǎn)向多網(wǎng)融合,從而使得整個競爭焦點轉(zhuǎn)向開發(fā)和利用而不是數(shù)據(jù)資源。
今天,全球數(shù)據(jù)交易的三個模式里,個人數(shù)據(jù)是一直無法得到保障的,未來如果能把PIMS(個人信息管理體系)標(biāo)準(zhǔn)強制推廣的話,個人對數(shù)據(jù)的控制權(quán),對數(shù)據(jù)的經(jīng)濟價值收獲會比較大,但這個過程會比較漫長。
最后談?wù)剛€人對數(shù)據(jù)流通的發(fā)展建議:首先,可通過建立“刑事追責(zé)、行政監(jiān)管與民事救濟”相結(jié)合等方式保障數(shù)據(jù)流通生態(tài)體系;第二,要加強行業(yè)應(yīng)用創(chuàng)新,提升企業(yè)核心競爭能力;第三,要妥善處理跨境數(shù)據(jù)流動問題。(根據(jù)演講內(nèi)容整理,未經(jīng)本人審核)endprint