賓建偉,相里朋,歐翔翔
(工業(yè)和信息化部電子第五研究所,廣東 廣州 511370)
數(shù)據(jù)作為一種新型的生產(chǎn)要素,已經(jīng)成為重要的、非消耗性的,能夠起到洞察、優(yōu)化和支配作用的綠色人造戰(zhàn)略資源。同樣的數(shù)據(jù)在不同場(chǎng)景下可以發(fā)揮不同的價(jià)值,不同的但相互關(guān)聯(lián)的數(shù)據(jù)放在一起又能夠碰撞出異樣的火花,這些價(jià)值在廣泛的傳播和持續(xù)的積累中被逐漸地放大并加以利用,創(chuàng)造出更多的社會(huì)價(jià)值和財(cái)富,成為推動(dòng)經(jīng)濟(jì)高質(zhì)量發(fā)展的重要?jiǎng)幽躘1]。隨著區(qū)塊鏈[2]等新一代信息技術(shù)加速融合發(fā)展,并與各行各業(yè)廣泛融通,使得數(shù)據(jù)爆發(fā)式增長(zhǎng)和匯聚,信息流增速遠(yuǎn)超商品流、貿(mào)易流和資金流,新技術(shù)、新產(chǎn)業(yè)、新業(yè)態(tài)、新模式競(jìng)相涌現(xiàn)。海量數(shù)據(jù)收集匯聚的過程中,也帶來了數(shù)據(jù)濫用、隱私泄漏等問題,并呈現(xiàn)出數(shù)據(jù)壟斷困境,進(jìn)而阻礙市場(chǎng)競(jìng)爭(zhēng)和行業(yè)技術(shù)創(chuàng)新,直接影響到數(shù)據(jù)合理分配與使用,對(duì)傳統(tǒng)的數(shù)據(jù)治理提出了新的挑戰(zhàn)[3]。尤其是數(shù)據(jù)所有權(quán)與使用權(quán)如何界定,數(shù)據(jù)價(jià)值如何評(píng)估,數(shù)據(jù)隱私如何保護(hù),數(shù)據(jù)交易如何可信,數(shù)據(jù)共享如何安全,數(shù)據(jù)濫用如何監(jiān)管等問題,推動(dòng)數(shù)據(jù)治理進(jìn)入深度變革調(diào)整期,也是當(dāng)前數(shù)據(jù)治理迫切地需要解決的問題。
數(shù)據(jù)作為一種可變現(xiàn)交易的資產(chǎn),因可復(fù)制、可重用的特性,又不同于傳統(tǒng)財(cái)務(wù)資產(chǎn)。相較于土地、勞動(dòng)力、資本和技術(shù)等傳統(tǒng)要素,數(shù)據(jù)的采集、存儲(chǔ)、處理和使用都具有一定特殊性,還涉及隱私保護(hù)、定價(jià)模型、價(jià)值評(píng)估和交易安全等問題。根據(jù)國際數(shù)據(jù)管理協(xié)會(huì)的定義,數(shù)據(jù)治理是對(duì)數(shù)據(jù)資產(chǎn)管理行使權(quán)力和控制的活動(dòng)集合,即通過具體的機(jī)制對(duì)數(shù)據(jù)的全生命周期進(jìn)行管理,使得數(shù)據(jù)價(jià)值最大化[4]。簡(jiǎn)單來說,其是通過分析和依賴數(shù)據(jù)來驅(qū)動(dòng)業(yè)務(wù)實(shí)現(xiàn)增值的。所有為提高數(shù)據(jù)質(zhì)量而開展的業(yè)務(wù)、技術(shù)和管理活動(dòng)都屬于數(shù)據(jù)治理范疇,合理地開展數(shù)據(jù)治理評(píng)價(jià)、指導(dǎo)和控制,有助于進(jìn)一步地提升數(shù)據(jù)治理質(zhì)量[5]。
數(shù)據(jù)治理的關(guān)鍵環(huán)節(jié)如圖1所示,數(shù)據(jù)治理的關(guān)鍵內(nèi)容如下所述。
圖1 數(shù)據(jù)治理的關(guān)鍵環(huán)節(jié)
數(shù)據(jù)是決策的基本依據(jù),數(shù)據(jù)價(jià)值的實(shí)現(xiàn)依賴于多源異構(gòu)數(shù)據(jù)的有效融合,但因數(shù)據(jù)來源廣泛且涉及主體眾多、數(shù)據(jù)源的標(biāo)準(zhǔn)和類型不盡相同、數(shù)據(jù)采集的真實(shí)性難以保障、數(shù)據(jù)存在被篡改的可能性等問題,都會(huì)直接影響到數(shù)據(jù)質(zhì)量,進(jìn)而影響到數(shù)據(jù)使用者[6]。因此,數(shù)據(jù)治理需要在數(shù)據(jù)全生命周期加強(qiáng)質(zhì)量管理,制定一套數(shù)據(jù)質(zhì)量的評(píng)價(jià)模型,從數(shù)據(jù)準(zhǔn)確性、完整性、及時(shí)性、唯一性和有效性等方面,協(xié)助提升數(shù)據(jù)服務(wù)決策能力。
實(shí)現(xiàn)數(shù)據(jù)作為生產(chǎn)要素的價(jià)值最大化的前提,在于促進(jìn)數(shù)據(jù)的有序流動(dòng)、開放共享和安全可信,但由于多方參與者并非完全信任彼此,為了滿足合作關(guān)系的穩(wěn)定、隨機(jī)密集交互和業(yè)務(wù)流程銜接緊密等數(shù)據(jù)共享需求,數(shù)據(jù)共享需實(shí)現(xiàn)“內(nèi)部可控”的數(shù)據(jù)“價(jià)值共享” (是數(shù)據(jù)價(jià)值共享,不涉及數(shù)據(jù)相互提供),又能滿足外部“數(shù)據(jù)合規(guī)”要求的安全多方計(jì)算技術(shù)和相應(yīng)的系統(tǒng)[7]。因此,數(shù)據(jù)治理需要兼顧隱私、壟斷與公平,在權(quán)衡各方參與主體利益的前提下,促進(jìn)數(shù)據(jù)安全共享,實(shí)現(xiàn)數(shù)據(jù)價(jià)值最大化。
數(shù)據(jù)作為新型生產(chǎn)要素,充分發(fā)揮價(jià)值的關(guān)鍵在于數(shù)據(jù)流通,即通過社會(huì)化的數(shù)據(jù)交易來實(shí)現(xiàn)大規(guī)模的數(shù)據(jù)共享,使數(shù)據(jù)這一邊際效益遞增的重要生產(chǎn)要素發(fā)揮更大的作用。然而,數(shù)據(jù)的流通性和知情權(quán)的缺失,使得數(shù)據(jù)生產(chǎn)方無法獲知哪些數(shù)據(jù)最終流向哪里,以及如何使用。因壟斷性所形成的一個(gè)個(gè)數(shù)據(jù)孤島,面臨著不受監(jiān)管的數(shù)據(jù)濫用和嚴(yán)峻的隱私泄露風(fēng)險(xiǎn)。隱私數(shù)據(jù)不能僅作為少數(shù)擁有者攫取高額壟斷利潤的武器,或者被束之高閣,塵封在不得不嚴(yán)加看守的“寶庫”中,而更應(yīng)成為提高社會(huì)生活品質(zhì),提高社會(huì)創(chuàng)造財(cái)富整體效率的公共資源。因此,數(shù)據(jù)治理需要面向隱私數(shù)據(jù)使用的評(píng)估與監(jiān)督,在數(shù)據(jù)開放和數(shù)據(jù)安全之間尋找平衡。
數(shù)據(jù)治理是一個(gè)過程,是逐步實(shí)現(xiàn)數(shù)據(jù)價(jià)值的過程,是一種持續(xù)性服務(wù)。數(shù)據(jù)的價(jià)值也只有在數(shù)據(jù)治理得到良好改善的時(shí)候才會(huì)發(fā)揮出來,評(píng)估數(shù)據(jù)資產(chǎn)的運(yùn)營和應(yīng)用能力,支持?jǐn)?shù)據(jù)價(jià)值轉(zhuǎn)化實(shí)現(xiàn),指導(dǎo)數(shù)據(jù)價(jià)值體系治理方案的實(shí)施,滿足數(shù)據(jù)資產(chǎn)的運(yùn)營和應(yīng)用要求,監(jiān)督數(shù)據(jù)價(jià)值實(shí)現(xiàn)績(jī)效的符合性,并持續(xù)地改進(jìn)和優(yōu)化[8]。以地理位置數(shù)據(jù)為例,通過數(shù)據(jù)采集形成數(shù)據(jù)沉淀,這時(shí)候的數(shù)據(jù)質(zhì)量要做到一致統(tǒng)一,并經(jīng)過分析處理的地理數(shù)據(jù)才能成為數(shù)據(jù)資產(chǎn);這時(shí)候的數(shù)據(jù)資產(chǎn)要進(jìn)行確權(quán)存證才能保障其資產(chǎn)權(quán)利,然后再對(duì)數(shù)據(jù)資產(chǎn)進(jìn)行分析提取,成為測(cè)繪分析的服務(wù);這時(shí)候的服務(wù)就可以構(gòu)建信任模式共享給其他參與方,服務(wù)再經(jīng)過價(jià)值提取成為具體的地圖業(yè)務(wù);這時(shí)候就要考慮如何做好流動(dòng)的數(shù)據(jù)價(jià)值的監(jiān)管。
除上述關(guān)鍵內(nèi)容外,需認(rèn)知到數(shù)據(jù)治理將會(huì)是一個(gè)持續(xù)且長(zhǎng)久的服務(wù),是逐步實(shí)現(xiàn)數(shù)據(jù)價(jià)值的過程,涉及多個(gè)關(guān)鍵技術(shù)領(lǐng)域。要做好數(shù)據(jù)治理實(shí)現(xiàn)數(shù)據(jù)價(jià)值,不僅要從一開始介入頂層規(guī)劃,還要盡早設(shè)定統(tǒng)一標(biāo)準(zhǔn)、統(tǒng)一流程、統(tǒng)一管理體系,以及解決好數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)對(duì)接和應(yīng)用集成等問題[9]。只有在數(shù)據(jù)治理得到良好改善的時(shí)候,進(jìn)一步地做好數(shù)據(jù)價(jià)值評(píng)估和監(jiān)管,數(shù)據(jù)的變現(xiàn)能力才會(huì)逐漸地增強(qiáng),真正地成為與勞動(dòng)力、土地和資本并駕齊驅(qū)的新型生產(chǎn)要素和驅(qū)動(dòng)經(jīng)濟(jì)社會(huì)發(fā)展的戰(zhàn)略資源。然而,國內(nèi)外對(duì)數(shù)據(jù)價(jià)值的評(píng)估模型仍處于探索階段,主要有3類方法:1)市場(chǎng)法,即通過衡量數(shù)據(jù)企業(yè)或市場(chǎng)交易價(jià)格的市場(chǎng)溢價(jià);2)收益法,即評(píng)估因數(shù)據(jù)資產(chǎn)所產(chǎn)生的增量收益;3)成本法,即實(shí)現(xiàn)數(shù)據(jù)價(jià)值所需的成本。國內(nèi)外對(duì)數(shù)據(jù)價(jià)值的評(píng)估問題并沒有達(dá)成統(tǒng)一的認(rèn)識(shí),但無論采用何種方法,都需要考慮用戶隱私保護(hù)和數(shù)據(jù)安全共享來綜合地衡量數(shù)據(jù)的社會(huì)價(jià)值。數(shù)據(jù)價(jià)值評(píng)估模型如圖2所示。
圖2 數(shù)據(jù)價(jià)值評(píng)估模型
基于區(qū)塊鏈的可信數(shù)據(jù)是高質(zhì)量數(shù)字化轉(zhuǎn)型的關(guān)鍵,要牽住區(qū)塊鏈“數(shù)據(jù)治理”的牛鼻子,應(yīng)從以下幾個(gè)方面持續(xù)地推進(jìn),嚴(yán)把區(qū)塊鏈入口,防止大量的垃圾數(shù)據(jù)和低價(jià)值數(shù)據(jù)上鏈,加強(qiáng)鏈上和鏈下的數(shù)據(jù)治理,建立有效的區(qū)塊鏈“數(shù)據(jù)治理”體系。
利用區(qū)塊鏈的智能合約技術(shù),制定多源異構(gòu)數(shù)據(jù)的類型和標(biāo)準(zhǔn)規(guī)則,自動(dòng)地驗(yàn)證并執(zhí)行數(shù)據(jù)存儲(chǔ)與處理智能合約,規(guī)范數(shù)據(jù)采集、存儲(chǔ)與處理流程,將數(shù)據(jù)存儲(chǔ)及使用記錄通過共識(shí)網(wǎng)絡(luò)傳播至所有的利益主體。由于智能合約公開透明,共識(shí)過程多方參與,使其過程和結(jié)果可審計(jì),防止數(shù)據(jù)在存儲(chǔ)與流通中被偽造篡改,保證數(shù)據(jù)共享流通的真實(shí)性。同時(shí),設(shè)立超級(jí)權(quán)限節(jié)點(diǎn),及時(shí)地監(jiān)管和記錄網(wǎng)絡(luò)交易和賬目信息,錄入的審計(jì)數(shù)據(jù)無法被篡改,修改則需通過多數(shù)節(jié)點(diǎn)確認(rèn)方能實(shí)現(xiàn),使得審計(jì)數(shù)據(jù)造假和欺詐變得極為困難,進(jìn)一步地保障了數(shù)據(jù)存儲(chǔ)和處理的真實(shí)性。
利用區(qū)塊鏈的對(duì)稱加密、非對(duì)稱加密和哈希散列等密碼學(xué)技術(shù),保證數(shù)據(jù)的保密性、完整性、可用性和不可否認(rèn)性,實(shí)現(xiàn)數(shù)據(jù)的安全共享和流通,也對(duì)數(shù)據(jù)隱私具有一定的保護(hù)作用,但還不足以應(yīng)對(duì)日趨嚴(yán)峻的隱私泄漏風(fēng)險(xiǎn),滿足安全合規(guī)要求。面對(duì)數(shù)據(jù)治理的敏感數(shù)據(jù)保護(hù)、用戶隱私保護(hù)和數(shù)字身份認(rèn)證等需求,在區(qū)塊鏈系統(tǒng)中,綜合地采用匿名隱式證書、標(biāo)識(shí)密碼、數(shù)字簽名和標(biāo)識(shí)廣播加密等多種前沿密碼技術(shù),實(shí)現(xiàn)基于國產(chǎn)密碼的區(qū)塊鏈隱私保護(hù),既滿足數(shù)據(jù)治理的隱私數(shù)據(jù)保護(hù)、身份匿名和安全監(jiān)管等要求,又能有效地保障數(shù)據(jù)安全可信[10]。
數(shù)據(jù)治理是一個(gè)持續(xù)且長(zhǎng)久的服務(wù),分布式協(xié)作作為數(shù)據(jù)治理的未來方向,其基礎(chǔ)是分布式業(yè)務(wù)共識(shí),即在共識(shí)算法的支配下借助分布式智能系統(tǒng)來完成每個(gè)節(jié)點(diǎn)的特定任務(wù),可以通過借助基于區(qū)塊鏈實(shí)現(xiàn)的分布式機(jī)器學(xué)習(xí),參與者包括數(shù)據(jù)生產(chǎn)方、數(shù)據(jù)中間方、數(shù)據(jù)使用方和算力節(jié)點(diǎn)集群,以及驗(yàn)證節(jié)點(diǎn)集群等,借助云計(jì)算、大數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)等技術(shù)作為支撐,以逐步地實(shí)現(xiàn)數(shù)據(jù)價(jià)值。數(shù)據(jù)生產(chǎn)方提供多方數(shù)據(jù)源,數(shù)據(jù)中間方保障數(shù)據(jù)安全共享,數(shù)據(jù)使用方完成數(shù)據(jù)應(yīng)用,算力節(jié)點(diǎn)集群執(zhí)行加密數(shù)據(jù)計(jì)算,驗(yàn)證節(jié)點(diǎn)集群對(duì)算力節(jié)點(diǎn)的計(jì)算結(jié)果進(jìn)行驗(yàn)證。在結(jié)合通證經(jīng)濟(jì)、密碼學(xué)承諾與零知識(shí)證明,激勵(lì)數(shù)據(jù)治理的各個(gè)參與方,對(duì)惡意參與者進(jìn)行懲罰,保障數(shù)據(jù)治理分布式協(xié)助機(jī)制的穩(wěn)定運(yùn)行[11]。
數(shù)據(jù)權(quán)屬問題一直是橫亙?cè)跀?shù)據(jù)流通中的一座危險(xiǎn)的大山,也是一個(gè)極具技術(shù)性和政策性的問題。由于區(qū)塊鏈的不可抵賴特性,使已確定的侵權(quán)行為不敢在該體系內(nèi)“僥幸實(shí)施”,在一定程度上解決了數(shù)據(jù)確權(quán)問題,推動(dòng)了數(shù)據(jù)資產(chǎn)的交易和數(shù)據(jù)價(jià)值的實(shí)現(xiàn)。通過區(qū)塊鏈的多方參與共識(shí)網(wǎng)絡(luò),建立相對(duì)完善的數(shù)據(jù)要素交易市場(chǎng),對(duì)數(shù)據(jù)資產(chǎn)進(jìn)行確權(quán)并達(dá)成共識(shí)。基于智能合約形成復(fù)雜的數(shù)據(jù)定價(jià)模型,在多方撮合交易下完成數(shù)據(jù)資產(chǎn)交易,記錄和驗(yàn)證交易數(shù)據(jù),實(shí)現(xiàn)安全高效的多方利益分配機(jī)制。并支持?jǐn)?shù)據(jù)按次數(shù)或授權(quán)計(jì)費(fèi)使用,約束數(shù)據(jù)共享的有限范圍,規(guī)避數(shù)據(jù)盜用、濫用及挪作他用,促進(jìn)數(shù)據(jù)治理后的數(shù)據(jù)實(shí)現(xiàn)價(jià)值最大化。
行業(yè)發(fā)展推動(dòng)著傳統(tǒng)數(shù)據(jù)治理需進(jìn)入深度變革調(diào)整期,區(qū)塊鏈為此帶來了新的發(fā)展思路,但具體的實(shí)現(xiàn)過程也將面臨諸多問題和挑戰(zhàn),尤其是面對(duì)現(xiàn)有的監(jiān)管機(jī)制和業(yè)務(wù)模式變化,都提出了新的挑戰(zhàn)。
一方面,嚴(yán)把區(qū)塊鏈入口,防止大量的垃圾數(shù)據(jù)和低價(jià)值數(shù)據(jù)上鏈,加強(qiáng)鏈上和鏈下的數(shù)據(jù)治理,雖可在一定程度上防止數(shù)據(jù)被篡改,對(duì)數(shù)據(jù)進(jìn)行有效的追蹤溯源,但如何保證數(shù)據(jù)上鏈前的準(zhǔn)確性、完整性、及時(shí)性、唯一性和有效性,如何厘清數(shù)據(jù)的所有權(quán)、使用權(quán)和收益權(quán),仍需要多方參與共同探索[12]。另一方面,依托大數(shù)據(jù)、人工智能和機(jī)器學(xué)習(xí)等技術(shù),對(duì)數(shù)據(jù)主體、數(shù)據(jù)行為分析日趨成熟,雖有助于對(duì)數(shù)據(jù)共享流通開展溯源問責(zé),但也帶來了嚴(yán)峻的隱私泄漏問題,如何在隱私保護(hù)的基礎(chǔ)上實(shí)現(xiàn)跨平臺(tái)、跨領(lǐng)域的溯源問責(zé),仍存在諸多技術(shù)性和政策性的挑戰(zhàn)。
當(dāng)前區(qū)塊鏈技術(shù)仍處在高速發(fā)展期,其可擴(kuò)展性、可靠性、互操作性、性能效率、隱私與安全等方面還存在不少的質(zhì)量問題,市場(chǎng)上現(xiàn)有的區(qū)塊鏈產(chǎn)品所提供的功能諸多,并不是最適宜數(shù)據(jù)治理的需要。有必要根據(jù)數(shù)據(jù)治理的需要,對(duì)現(xiàn)有的區(qū)塊鏈技術(shù)進(jìn)行裁剪并結(jié)合其他技術(shù),在數(shù)據(jù)開放和數(shù)據(jù)安全之間尋找平衡,設(shè)計(jì)出滿足實(shí)際需要的、最適宜的“數(shù)據(jù)治理”區(qū)塊鏈,以及評(píng)價(jià)標(biāo)準(zhǔn)規(guī)范與評(píng)估工具,保障“數(shù)據(jù)治理”區(qū)塊鏈的建設(shè)質(zhì)量。
隨著新一代信息技術(shù)的飛速發(fā)展,企業(yè)的生產(chǎn)和經(jīng)營模式都在發(fā)生變化, “數(shù)據(jù)治理”區(qū)塊鏈雖有助于多方參與,共同保障數(shù)據(jù)安全和保密,但也無法清晰地厘清和界定責(zé)任。尤其是面對(duì)現(xiàn)有的監(jiān)管機(jī)制和業(yè)務(wù)模式變化,對(duì)現(xiàn)行的企業(yè)數(shù)據(jù)管理模式、行業(yè)監(jiān)管制度和手段、法律法規(guī)和政策都提出了新的要求。
數(shù)據(jù)治理已成為社會(huì)治理現(xiàn)代化的重要內(nèi)容和客觀要求,以及經(jīng)濟(jì)高質(zhì)量發(fā)展的引擎和數(shù)字經(jīng)濟(jì)社會(huì)發(fā)展的重要因素。隨著數(shù)據(jù)作為一種新型生產(chǎn)要素,數(shù)據(jù)源源不斷地產(chǎn)生并開放共享,數(shù)據(jù)治理對(duì)數(shù)據(jù)確權(quán)、數(shù)據(jù)共享、隱私保護(hù)、安全交易和監(jiān)管審計(jì)等方面提出了更高的要求。然而,受法規(guī)、市場(chǎng)機(jī)制、技術(shù)和能力失配等諸多因素的影響,傳統(tǒng)的數(shù)據(jù)治理機(jī)制已不能滿足要求。尤其是數(shù)據(jù)所有權(quán)與使用權(quán)、數(shù)據(jù)價(jià)值評(píng)估、數(shù)據(jù)隱私保護(hù)、數(shù)據(jù)可信交易與安全共享、數(shù)據(jù)濫用等問題,對(duì)傳統(tǒng)的數(shù)據(jù)治理提出了新的挑戰(zhàn),推動(dòng)數(shù)據(jù)治理進(jìn)入深度變革調(diào)整期。本文從數(shù)據(jù)治理的關(guān)鍵內(nèi)容及挑戰(zhàn)出發(fā),結(jié)合區(qū)塊鏈技術(shù)優(yōu)勢(shì),探索數(shù)據(jù)治理+區(qū)塊鏈的應(yīng)用研究,對(duì)于推動(dòng)數(shù)據(jù)開放共享、提升社會(huì)數(shù)據(jù)資源價(jià)值、加強(qiáng)數(shù)據(jù)資源整合和安全保護(hù)、培育數(shù)據(jù)要素市場(chǎng)具有一定的積極意義。