• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于區(qū)塊鏈的數(shù)據(jù)治理協(xié)同方法

      2018-10-16 08:23:50宋俊典戴炳榮蔣麗雯王曉強
      計算機應(yīng)用 2018年9期
      關(guān)鍵詞:用詞行業(yè)標(biāo)準(zhǔn)區(qū)塊

      宋俊典,戴炳榮,2,蔣麗雯,趙 堯,李 超,王曉強

      (1.上海計算機軟件技術(shù)開發(fā)中心,上海 201112; 2.上海海事大學(xué) 信息工程學(xué)院,上海 201306;3.南京航空航天大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,南京 210016; 4.綠地金融投資控股集團有限公司 運營技術(shù)部,上海 200023)

      業(yè)務(wù)的數(shù)據(jù)化和數(shù)據(jù)的業(yè)務(wù)化,是當(dāng)前各行業(yè)、各領(lǐng)域數(shù)據(jù)應(yīng)用創(chuàng)新的重點和趨勢。在當(dāng)前大數(shù)據(jù)環(huán)境下,數(shù)據(jù)日益成為企業(yè)基礎(chǔ)設(shè)施的一部分,成為了戰(zhàn)略資源,如何更好地把數(shù)據(jù)資源進行變現(xiàn),產(chǎn)生更大的價值是企業(yè)共同的關(guān)注點。數(shù)據(jù)治理的概念應(yīng)運而生,通過數(shù)據(jù)治理,建立數(shù)據(jù)應(yīng)用策略、挖掘未被滿足的需求以及解決潛在安全問題等,使數(shù)據(jù)的采集、管護、存儲、訪問以及使用策略均實現(xiàn)標(biāo)準(zhǔn)化,滿足各個部門和崗位的不同需求。另一方面,數(shù)據(jù)治理能平衡不同部門之間存在沖突的需求,在安全性與訪問需求之間進行協(xié)調(diào),確保高效安全的數(shù)據(jù)管理策略,從而為企業(yè)帶來更大的數(shù)據(jù)變現(xiàn)價值。數(shù)據(jù)治理已廣泛應(yīng)用于證券、銀行、國資等行業(yè),并體現(xiàn)了良好的應(yīng)用效果。

      在大數(shù)據(jù)環(huán)境下,在尋求新技術(shù)來支撐大數(shù)據(jù)的應(yīng)用、獲取更大應(yīng)用價值的同時,數(shù)據(jù)開放與隱私保護、數(shù)據(jù)應(yīng)用創(chuàng)新與風(fēng)險合規(guī)等已成為當(dāng)前數(shù)據(jù)治理領(lǐng)域面臨的巨大挑戰(zhàn),有效的數(shù)據(jù)治理模型構(gòu)建和治理方法流程成為研究者關(guān)注的熱點和重點[1]。更加深入的分析可知,業(yè)務(wù)流程交互及數(shù)據(jù)融合的迫切需求統(tǒng)一底層數(shù)據(jù)的標(biāo)準(zhǔn)規(guī)范、實現(xiàn)數(shù)據(jù)的安全可信和可控,底層數(shù)據(jù)源復(fù)雜分散,數(shù)據(jù)海量且缺乏統(tǒng)一標(biāo)準(zhǔn)等問題逐漸凸顯。技術(shù)和實現(xiàn)層面,數(shù)據(jù)治理及數(shù)據(jù)標(biāo)準(zhǔn)化都是基于傳統(tǒng)的元數(shù)據(jù)管理理念,聚焦從源頭解決“數(shù)據(jù)孤島”的問題,然而在實際應(yīng)用過程中,不同應(yīng)用系統(tǒng)數(shù)據(jù)源的差異、業(yè)務(wù)應(yīng)用的需求不同,使得研發(fā)有效高效的數(shù)據(jù)標(biāo)準(zhǔn)管理工具,可信的數(shù)據(jù)共享發(fā)布規(guī)則變得十分困難[2]。

      近年來,區(qū)塊鏈技術(shù)以其去中心化、去信任、不可篡改以及可追溯特性在多方協(xié)作、多主體等行業(yè)領(lǐng)域具有天然的應(yīng)用場景,通過一系列技術(shù)的組合和模式的創(chuàng)新,為相關(guān)行業(yè)及領(lǐng)域的業(yè)務(wù)流程優(yōu)化、數(shù)據(jù)交換共享等提供了良好的解決方案[3]。針對數(shù)據(jù)治理領(lǐng)域中涉及的多部門協(xié)作、流程的復(fù)雜多樣、追溯成本高等問題,區(qū)塊鏈可在其中發(fā)揮重要的作用。

      本文結(jié)合區(qū)塊鏈去中心化、鏈?zhǔn)酱鎯椭悄芎霞s等技術(shù)的研究,提出基于區(qū)塊鏈的數(shù)據(jù)治理協(xié)同方法,為數(shù)據(jù)標(biāo)準(zhǔn)的制定管理、監(jiān)督維護提供了可行的解決方案。結(jié)合去中心化的思想,將數(shù)據(jù)標(biāo)準(zhǔn)的構(gòu)建過程開放給各個參與者;通過鏈?zhǔn)酱鎯Φ臋C制實現(xiàn)數(shù)據(jù)的可追溯性,保證數(shù)據(jù)的安全可信。在具體實現(xiàn)過程中,使用智能合約技術(shù)代替?zhèn)鹘y(tǒng)的人工審核機制,按既定的協(xié)同規(guī)則,觸發(fā)自動化腳本代碼,高效地實現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)管理維護的高效性。

      1 相關(guān)背景

      1.1 數(shù)據(jù)治理

      在數(shù)據(jù)戰(zhàn)略、組織和架構(gòu)的保障下,數(shù)據(jù)治理應(yīng)用的基礎(chǔ)是數(shù)據(jù)的標(biāo)準(zhǔn)化。數(shù)據(jù)標(biāo)準(zhǔn)化指的是對分散在各系統(tǒng)中的數(shù)據(jù)作出數(shù)據(jù)命名、數(shù)據(jù)定義、數(shù)據(jù)類型、賦值規(guī)則、科學(xué)流程等方面的統(tǒng)一。通過開展數(shù)據(jù)治理應(yīng)用,進行數(shù)據(jù)標(biāo)準(zhǔn)共建,可以確保數(shù)據(jù)的優(yōu)質(zhì)性,維持?jǐn)?shù)據(jù)模型的一致性,提高實際應(yīng)用場景下數(shù)據(jù)管理的高效性,保障數(shù)據(jù)的開放、共享和安全,從而提升行業(yè)的數(shù)據(jù)應(yīng)用水平。

      數(shù)據(jù)治理的目標(biāo)主要有四點:戰(zhàn)略一致、風(fēng)險可控、運營合規(guī)和價值實現(xiàn)。治理保障分為內(nèi)外部環(huán)境和促成因素兩大部分。治理域主要包括戰(zhàn)略、組織、架構(gòu)、元數(shù)據(jù)管理、主數(shù)據(jù)管理、數(shù)據(jù)生命周期管理、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)安全與合規(guī)、數(shù)據(jù)應(yīng)用與服務(wù)創(chuàng)新。

      當(dāng)前在數(shù)據(jù)治理過程中,數(shù)據(jù)標(biāo)準(zhǔn)的制定大多都基于元數(shù)據(jù)管理,利用中心化的方法實現(xiàn)其開發(fā)、候選、批準(zhǔn)、駁回、歸檔等構(gòu)建工作,數(shù)據(jù)標(biāo)準(zhǔn)的制定過程相對封閉和壟斷,維護工作量巨大,且建設(shè)周期長,缺乏有效的多方參與機制。文獻[4]引入行動者網(wǎng)絡(luò)理論分析數(shù)據(jù)治理框架中的人與非人因素及其關(guān)系,構(gòu)建了大數(shù)據(jù)治理行動者網(wǎng)絡(luò),并利用Petri網(wǎng)對數(shù)據(jù)治理實施過程進行抽象建模,從而能夠推動數(shù)據(jù)標(biāo)準(zhǔn)化的實施。文獻[5]通過大數(shù)據(jù)平臺和信息架構(gòu)來實現(xiàn)大數(shù)據(jù)與企業(yè)數(shù)據(jù)的靈活集成,結(jié)合企業(yè)數(shù)據(jù)的獲取、存儲、組織和分析作出科學(xué)決策,以實現(xiàn)企業(yè)大數(shù)據(jù)治理。文獻[6]從利益相關(guān)者視角分析了大數(shù)據(jù)環(huán)境中個人隱私治理問題,提出多元主體協(xié)同治理機制,為平衡數(shù)據(jù)挖掘和隱私保護提供參考。以上的數(shù)據(jù)治理模型及框架雖然提到了數(shù)據(jù)標(biāo)準(zhǔn)化的構(gòu)建方法,但基本上還是在相對封閉和固定的流程中實現(xiàn)開發(fā)、候選、批準(zhǔn)等構(gòu)建工作,構(gòu)建周期較長,交互工作繁瑣,不能很好地高效、安全完成數(shù)據(jù)標(biāo)準(zhǔn)制定開發(fā)。如何在多方參與、多方協(xié)作的環(huán)境下,高效安全地完成數(shù)據(jù)標(biāo)準(zhǔn)的制定、開發(fā)及共享應(yīng)用等成為數(shù)據(jù)標(biāo)準(zhǔn)化工作的重點,也是實施數(shù)據(jù)治理應(yīng)用的基礎(chǔ)。

      圖1 大數(shù)據(jù)環(huán)境下數(shù)據(jù)治理框架

      1.2 區(qū)塊鏈

      區(qū)塊鏈技術(shù)是利用塊鏈?zhǔn)綌?shù)據(jù)結(jié)構(gòu)來驗證與存儲數(shù)據(jù)、利用分布式節(jié)點共識算法來生成和更新數(shù)據(jù)、利用密碼學(xué)的方式保證數(shù)據(jù)傳輸和訪問安全、利用自動化腳本代碼組成的智能合約來編程和操作數(shù)據(jù)的一種全新的分布式基礎(chǔ)架構(gòu)與計算范式[7]。區(qū)塊鏈核心技術(shù)包括分布式賬本、加密算法、共識機制等,作為一個獨立的技術(shù)解決方案,其應(yīng)用已經(jīng)從單一的數(shù)字貨幣延伸到經(jīng)濟社會的各個領(lǐng)域,具有顯著的應(yīng)用優(yōu)勢:去中心化的分布式結(jié)構(gòu)應(yīng)用于現(xiàn)實中可節(jié)省大量的中介成本,不可篡改的時間戳特征可解決數(shù)據(jù)追蹤與信息防偽問題,安全的可信機制可解決當(dāng)前信任成本問題,靈活的可編程特性可幫助快速達(dá)成業(yè)務(wù)結(jié)果[8]。

      區(qū)塊的結(jié)構(gòu)如圖2所示,主要包含兩個部分:區(qū)塊頭和存在區(qū)塊中交易。區(qū)塊頭包括了版本號、前個區(qū)塊哈希值、默克爾根、時間戳、難度值和隨機數(shù)[9]。

      圖2 區(qū)塊結(jié)構(gòu)

      版本號 存儲區(qū)塊鏈系統(tǒng)和協(xié)議的相關(guān)版本號。

      前個區(qū)塊哈希值 記錄前一個區(qū)塊的哈希值。根據(jù)父區(qū)塊哈希值,所有的區(qū)塊可以連接在一起形成區(qū)塊鏈。

      默克爾根 區(qū)塊鏈中默克爾樹根的哈希值能夠用于快速檢查當(dāng)前區(qū)塊中所有存儲事務(wù)的正確性。

      時間戳 以年月日小時和秒記錄區(qū)塊生產(chǎn)時間。

      難度值 工作量證明算法要解決的目標(biāo)難度值。

      隨機數(shù) 記錄當(dāng)前的工作量證明算法的解決方案。

      另一部分為存儲在當(dāng)前區(qū)塊中的所有交易信息,這一塊的設(shè)計可根據(jù)不同的應(yīng)用場景和目的進行調(diào)整和改變。

      以太坊的出現(xiàn)標(biāo)志著區(qū)塊鏈發(fā)展到了新的階段,使區(qū)塊鏈真正具有了圖靈完備的特性,為智能合約的實現(xiàn)提供了良好的載體,衍生出了多領(lǐng)域的應(yīng)用[10]。

      如圖3所示為以太坊的交易示意圖,其中交易中每一塊的含義如下所示。

      From 來自用戶控制的賬戶的簽名,從而授權(quán)交易;

      To 交易的接受者,可以是用戶的地址或合約的地址;

      Data 包括創(chuàng)建新合約的合約代碼或合約的執(zhí)行說明;

      Gas Price 當(dāng)前使用以太幣購買燃料的轉(zhuǎn)換率;

      Total Price 交易可消耗的最大燃料;

      Nonce 記錄賬戶交易次數(shù)的一個計數(shù)器。

      以太坊中大約每15 s便會創(chuàng)建一個區(qū)塊,能夠更好地為開發(fā)者提供區(qū)塊鏈應(yīng)用的各種部署和測試,方便開發(fā)者進行系統(tǒng)驗證和實現(xiàn)。

      圖3 以太坊交易結(jié)構(gòu)

      區(qū)塊鏈技術(shù)為數(shù)據(jù)治理模型及數(shù)據(jù)標(biāo)準(zhǔn)的構(gòu)建提供了新的思路和方法。區(qū)塊鏈技術(shù)能讓參與者以多中心化的方式參與數(shù)據(jù)標(biāo)準(zhǔn)的制定和維護[11]。在區(qū)塊鏈社區(qū)的對等網(wǎng)絡(luò)中,是一個分布式集體運作的端對端自組織網(wǎng)絡(luò),利用密碼學(xué)原理讓所有參與節(jié)點集體維護一套能記錄時間先后的、可信任的數(shù)據(jù)庫。通過共識機制,區(qū)塊鏈能保持完整性、連續(xù)性和一致性,即使部分參與節(jié)點作惡也無法篡改區(qū)塊鏈中已形成的標(biāo)準(zhǔn)數(shù)據(jù)[12]。因此,本文基于區(qū)塊鏈技術(shù)研究,從數(shù)據(jù)標(biāo)準(zhǔn)模型結(jié)構(gòu)及流程、數(shù)據(jù)標(biāo)準(zhǔn)共享和訪問控制、數(shù)據(jù)更新和智能合約方面論述數(shù)據(jù)治理協(xié)同模型的形成和應(yīng)用。首先,數(shù)據(jù)共享程度越高,則數(shù)據(jù)標(biāo)準(zhǔn)發(fā)展水平越高。訪問控制指將所有數(shù)據(jù)信息標(biāo)識出來、劃分起來、組織起來、托管起來的一套方法,有助于促進數(shù)據(jù)標(biāo)準(zhǔn)共享的可持續(xù)發(fā)展[12]。其次,智能合約作為區(qū)塊鏈數(shù)據(jù)庫上的一個觸發(fā)器,能夠高效地進行數(shù)據(jù)讀取和更新。最后通過區(qū)塊鏈權(quán)限管理的激勵制度,增強數(shù)據(jù)治理落地的積極性,增加各部門及用戶黏性,解決“數(shù)據(jù)孤島”問題,實現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)互聯(lián)、互通、互信。

      2 基于區(qū)塊鏈的數(shù)據(jù)治理協(xié)同方法

      2.1 基于區(qū)塊鏈的數(shù)據(jù)質(zhì)量協(xié)同模型

      通過對大數(shù)據(jù)環(huán)境下的數(shù)據(jù)治理需求分析可知,數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)安全與合規(guī)等問題是數(shù)據(jù)治理面臨的首要挑戰(zhàn)。數(shù)據(jù)標(biāo)準(zhǔn)化層面包括元數(shù)據(jù)管理和主數(shù)據(jù)管理,從基礎(chǔ)上保障數(shù)據(jù)的一致性、規(guī)范性和完整性,提升數(shù)據(jù)質(zhì)量。區(qū)塊鏈的分布式賬本特性能夠保障數(shù)據(jù)安全和共享,加密機制保證了參與方及用戶的隱私,共識機制能夠保證多方協(xié)作環(huán)境下的高效意見達(dá)成。基于區(qū)塊鏈的數(shù)據(jù)治理協(xié)同模型如圖4所示。

      圖4 基于區(qū)塊鏈的治理協(xié)同模型

      數(shù)據(jù)治理主要包括數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)安全合規(guī)等方面,通過三者的協(xié)同治理,最終達(dá)到戰(zhàn)略一致、風(fēng)險可控、運營合規(guī)、價值實現(xiàn)的治理目標(biāo)。在大數(shù)據(jù)治理過程中,戰(zhàn)略一致應(yīng)滿足組織持續(xù)發(fā)展的需要,大數(shù)據(jù)既是組織的價值來源,也是風(fēng)險來源,有效的大數(shù)據(jù)治理能夠避免決策失敗和經(jīng)濟損失,降低合規(guī)風(fēng)險;同時組織的運營應(yīng)符合國內(nèi)外法律法規(guī)和行業(yè)相關(guān)規(guī)范,運營合規(guī)可以幫助組織有效地提升自身信譽,增強在不同監(jiān)管環(huán)境下的生存能力和競爭力,最終通過大數(shù)據(jù)與業(yè)務(wù)的融合實現(xiàn)保證數(shù)據(jù)價值實現(xiàn)。

      治理目標(biāo)的實現(xiàn)主要基于區(qū)塊鏈分布式賬本、加密算法、共識機制特性,通過治理模型結(jié)構(gòu)和方法流程、數(shù)據(jù)共享和訪問控制、數(shù)據(jù)更新和智能合約三個方面來實現(xiàn)。本文提出基于區(qū)塊鏈的數(shù)據(jù)標(biāo)準(zhǔn)構(gòu)建模型,利用區(qū)塊鏈技術(shù)數(shù)據(jù)公開透明、可追溯的思想,實現(xiàn)行業(yè)標(biāo)準(zhǔn)庫鏈每條記錄從后向前有序鏈接,具有安全穩(wěn)定、無法篡改以及可追溯的特點。行業(yè)標(biāo)準(zhǔn)庫鏈網(wǎng)絡(luò)是由加入的各個節(jié)點(即注冊用戶)共同構(gòu)建的端到端分布式網(wǎng)絡(luò),需要全部節(jié)點共同維護,通過建立基于規(guī)則的數(shù)據(jù)和標(biāo)準(zhǔn)化智能合約,能夠利用互聯(lián)網(wǎng)獲取的外部數(shù)據(jù)以及讀取區(qū)塊鏈自身存儲的內(nèi)部數(shù)據(jù),實現(xiàn)復(fù)雜的業(yè)務(wù)邏輯,最終構(gòu)建形成數(shù)據(jù)標(biāo)準(zhǔn)化的應(yīng)用方案,實現(xiàn)數(shù)據(jù)治理的重要目標(biāo)。

      2.2 多方協(xié)作的標(biāo)準(zhǔn)構(gòu)建

      區(qū)塊鏈作為比特幣等加密貨幣存儲數(shù)據(jù)的一種獨特方式,是一種自引用的數(shù)據(jù)結(jié)構(gòu),常用來存儲大量交易信息。本文在綜合考慮數(shù)據(jù)標(biāo)準(zhǔn)管理模型的基礎(chǔ)上提出基于區(qū)塊鏈的數(shù)據(jù)標(biāo)準(zhǔn)管理方法,利用區(qū)塊鏈技術(shù)其數(shù)據(jù)公開透明、可追溯的產(chǎn)品架構(gòu)設(shè)計思想,實現(xiàn)了每條記錄從后向前的有序鏈接,具有安全穩(wěn)定、無法篡改、方便溯源的特點。具體結(jié)構(gòu)模型如圖5所示。

      圖5 基于區(qū)塊鏈的多方協(xié)作數(shù)據(jù)標(biāo)準(zhǔn)共建

      整個模型分兩個階段:第一階段在鏈外,主要由身份認(rèn)證模塊、權(quán)限管理模塊、監(jiān)督管理模塊組成,主要負(fù)責(zé)驗證用戶狀態(tài),給予用戶獎勵以及監(jiān)管用戶行為;第二階段在鏈內(nèi),主要由行業(yè)標(biāo)準(zhǔn)庫鏈組成,其中包括各個行業(yè)標(biāo)準(zhǔn)庫鏈,此模塊負(fù)責(zé)存儲和讀取行業(yè)標(biāo)準(zhǔn)庫鏈的數(shù)據(jù)信息。用戶通過身份認(rèn)證模塊驗證成為注冊用戶,注冊用戶通過調(diào)用智能合約進行階段一和階段二之間的交互,涉及的用戶行為及功能模塊解釋如下。

      身份認(rèn)證模塊 用戶必須調(diào)用身份認(rèn)證模塊的注冊功能檢驗其是否成功注冊成為注冊用戶,通過返回狀態(tài)確定用戶身份。返回狀態(tài)包括“注冊成功”和“注冊失敗”?!白猿晒Α北砻髟撚脩舫晒ψ詾樽杂脩?,可見其相關(guān)的注冊信息、積分信息和監(jiān)管信息等。用戶提交的注冊信息不完整或信息已有重復(fù),則表明“注冊失敗”。

      權(quán)限管理模塊 在用戶成為注冊用戶后,調(diào)用權(quán)限管理模塊為其反饋該注冊用戶的積分擁有情況。積分信息是注冊用戶用來交換整個行業(yè)標(biāo)準(zhǔn)庫鏈開放情況的數(shù)字媒介,積分決定了注冊用戶對行業(yè)標(biāo)準(zhǔn)庫鏈內(nèi)數(shù)據(jù)信息的使用范圍。

      監(jiān)督管理模塊 監(jiān)督管理模塊主要有安全維護和行為監(jiān)察的作用。安全維護指的是實時防止黑客攻擊,保證整個網(wǎng)絡(luò)中所有節(jié)點(即注冊用戶)及各個功能模塊安全、穩(wěn)定、有序運行。行為監(jiān)察指的是對注冊用戶的行為進行檢測,并且能及時將監(jiān)督信息反饋給注冊用戶從而防止注冊用戶作惡,保證行業(yè)標(biāo)準(zhǔn)庫鏈中的數(shù)據(jù)質(zhì)量。監(jiān)督信息是注冊用戶行為監(jiān)察的具體反饋信息,即通知注冊用戶當(dāng)前違規(guī)行為和警告情況,并幫助權(quán)限管理模塊決定注冊用戶的權(quán)限。

      行業(yè)標(biāo)準(zhǔn)庫鏈 各個行業(yè)標(biāo)準(zhǔn)庫鏈(如圖5所示的行業(yè)標(biāo)準(zhǔn)庫鏈1~n)分別對應(yīng)存儲該行業(yè)的數(shù)據(jù)標(biāo)準(zhǔn)庫,數(shù)據(jù)標(biāo)準(zhǔn)庫具體指的是標(biāo)準(zhǔn)用詞(即利用命名規(guī)則生成的所有標(biāo)準(zhǔn)項目名,如實體名、實體的屬性名、表名、列名、域名等)。每個行業(yè)標(biāo)準(zhǔn)庫鏈都由眾多區(qū)塊從后向前有序連接而成。新的區(qū)塊經(jīng)過共識算法驗證,通過后鏈接至標(biāo)準(zhǔn)庫鏈,標(biāo)準(zhǔn)庫鏈高度加一。這種方式保證了每個區(qū)塊指向前一個區(qū)塊,形成一個巨大的穩(wěn)定的行業(yè)標(biāo)準(zhǔn)庫鏈,同時也保證了整個流程的公開透明,讓數(shù)據(jù)標(biāo)準(zhǔn)庫的信息更加權(quán)威。

      基于區(qū)塊鏈的行業(yè)數(shù)據(jù)標(biāo)準(zhǔn)共建管理算法和過程如下。

      步驟1 用戶提交注冊申請,通過身份認(rèn)證模塊,驗證其身份可獲得相應(yīng)的返回狀態(tài)?!白猿晒Α眲t成為注冊用戶,反之則“注冊失敗”。

      步驟2 注冊用戶通過權(quán)限管理模塊擁有相應(yīng)的積分信息。

      步驟3 注冊用戶通過監(jiān)督管理模塊擁有相應(yīng)的監(jiān)管信息。

      步驟5 數(shù)據(jù)標(biāo)準(zhǔn)庫鏈借助智能合約自動完成相應(yīng)操作。

      數(shù)據(jù)標(biāo)準(zhǔn)化需要遵循一定的標(biāo)準(zhǔn)化原則,標(biāo)準(zhǔn)化原則可以最大限度改善數(shù)據(jù)質(zhì)量、保證標(biāo)準(zhǔn)化實現(xiàn)、形成數(shù)據(jù)共享機制?;趨^(qū)塊鏈的行業(yè)數(shù)據(jù)標(biāo)準(zhǔn)共建方法,統(tǒng)一了數(shù)據(jù)標(biāo)準(zhǔn)的規(guī)則,統(tǒng)一了數(shù)據(jù)查詢接口,可以實時數(shù)據(jù)共享。通過權(quán)限管理的激勵制度,增強用戶黏性,消除“數(shù)據(jù)孤島”問題,實現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)互聯(lián)、互通、互信。

      2.3 安全可靠的數(shù)據(jù)共享和訪問控制

      數(shù)據(jù)共享指在不同地方,使用不同計算機、不同系統(tǒng)的用戶能夠讀取他人數(shù)據(jù)并進行各種操作運算和分析。行業(yè)標(biāo)準(zhǔn)庫鏈集實現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)庫的共享,充分使用已有數(shù)據(jù)資源,減少資料收集、數(shù)據(jù)采集的重復(fù)勞動,而把精力重點放在數(shù)據(jù)標(biāo)準(zhǔn)完善或有針對性的個性化使用中。訪問控制指將所有數(shù)據(jù)信息標(biāo)識出來、劃分起來、組織起來、托管起來的一套方法,只需提供一個簡單的、唯一的接口,便可決定參與者是否擁有對數(shù)據(jù)信息的讀取或?qū)懭氲臋?quán)限。訪問控制有助于促進數(shù)據(jù)標(biāo)準(zhǔn)共享的可持續(xù)發(fā)展。數(shù)據(jù)標(biāo)準(zhǔn)共享模型如圖6所示。

      行業(yè)標(biāo)準(zhǔn)庫鏈集由若干個行業(yè)標(biāo)準(zhǔn)庫鏈(如圖6所示的行業(yè)標(biāo)準(zhǔn)庫鏈1~n)組成。所有注冊用戶即注冊用戶集(如圖6所示的注冊用戶1~m)通過調(diào)用智能合約可對行業(yè)標(biāo)準(zhǔn)庫鏈集進行寫入和讀取操作,并由智能合約返回給注冊用戶相關(guān)反饋信息。寫入操作指的是注冊用戶從選擇行業(yè)、提交申請,到成功驗證“合法”備選用詞的過程。讀取操作指的是注冊用戶查看行業(yè)標(biāo)準(zhǔn)庫鏈集中各個行業(yè)標(biāo)準(zhǔn)庫的操作。查看標(biāo)準(zhǔn)用詞數(shù)量的多少取決于注冊用戶擁有的積分情況。用戶注冊成功后可以查看通用標(biāo)準(zhǔn)庫。通用標(biāo)準(zhǔn)庫通過調(diào)用智能合約的計數(shù)模塊形成,其中包含統(tǒng)計頻率較高的標(biāo)準(zhǔn)用詞。

      圖6 行業(yè)數(shù)據(jù)標(biāo)準(zhǔn)共享示意圖

      每個注冊用戶都有查看通用標(biāo)準(zhǔn)庫的權(quán)限,但查看具體行業(yè)的數(shù)據(jù)標(biāo)準(zhǔn)庫則需要通過扣除積分的行為來實現(xiàn)。積分的獲取通過該注冊用戶上傳excel文件,并為標(biāo)準(zhǔn)庫的完善所作出的貢獻而定,積分的獎懲規(guī)則如表1所示。

      整理完整的excel文件指的是經(jīng)過轉(zhuǎn)換管理過程數(shù)據(jù)有效性較高的文件,注冊用戶上傳數(shù)據(jù)有效性較高的文件可獲得積分獎勵;上傳數(shù)據(jù)有效性較低的文件(即質(zhì)量較差的excel文件)將被扣除積分作為警告。上傳的excel文件中,通過調(diào)用智能合約驗證判定其中備選用詞的質(zhì)量。驗證反饋信息為“合法”的備選用詞,則予以積分獎勵肯定該用戶對擴展行業(yè)標(biāo)準(zhǔn)庫的貢獻;為 “同義”的備選用詞,也予以積分獎勵肯定該用戶對提煉通用標(biāo)準(zhǔn)庫的貢獻;為杜絕注冊用戶反復(fù)上傳相同excel文件,對“重復(fù)”的備選用詞不進行積分上的獎懲;為“缺損”“無效”的備選用詞,將進行積分扣除警告該用戶改善上傳文件中數(shù)據(jù)的質(zhì)量。

      數(shù)據(jù)共享程度越高,則數(shù)據(jù)標(biāo)準(zhǔn)發(fā)展水平越高。訪問控制管理,旨在于助力形成數(shù)據(jù)共享的氛圍。通過用戶管理以及注冊用戶的獎懲機制,既能激勵用戶主動分享所屬行業(yè)的相關(guān)數(shù)據(jù)信息,又能防止注冊用戶通過大量上傳低質(zhì)量或重復(fù)文件惡意賺取積分,從而降低行業(yè)標(biāo)準(zhǔn)庫的權(quán)威性。

      2.4 高效準(zhǔn)確的數(shù)據(jù)更新

      行業(yè)標(biāo)準(zhǔn)庫鏈網(wǎng)絡(luò)是由加入的各個節(jié)點(即注冊用戶)共同構(gòu)建的端到端分布式網(wǎng)絡(luò),需要全部節(jié)點共同維護。區(qū)塊鏈?zhǔn)且粋€不可更改的分布式數(shù)據(jù)庫,智能合約是數(shù)據(jù)庫上的一個觸發(fā)器。通過建立基于規(guī)則的數(shù)據(jù)和標(biāo)準(zhǔn)化智能合約,能夠利用互聯(lián)網(wǎng)獲取的外部數(shù)據(jù)以及讀取區(qū)塊鏈自身存儲的內(nèi)部數(shù)據(jù),實現(xiàn)復(fù)雜的業(yè)務(wù)邏輯。每個注冊用戶節(jié)點提交更新數(shù)據(jù)以及調(diào)用智能合約自動化驗證模型如圖7所示。

      圖7 基于區(qū)塊鏈的自動化驗證流程

      注冊用戶進行數(shù)據(jù)標(biāo)準(zhǔn)申請時,先預(yù)選待更新信息的所屬行業(yè)。再將整理完整的excel文件上傳,經(jīng)過轉(zhuǎn)換管理成為統(tǒng)一標(biāo)準(zhǔn)格式的備選用語。依次通過智能合約的驗證模塊,判斷其中的備選用詞是否已經(jīng)在行業(yè)標(biāo)準(zhǔn)庫鏈上的行業(yè)標(biāo)準(zhǔn)庫中存在,是否有同義,是否有缺損,是否無效以及是否驗證通過為合法。驗證后自動將驗證反饋信息填入備注欄中,用戶可以在申請頁面刷新查看。驗證反饋信息為“合法”的備選用詞,則可記載于區(qū)塊上,為“重復(fù)”“缺損”“同義”或“無效”則不被記載于區(qū)塊上。計數(shù)模塊調(diào)用讀取模塊,再對“合法”“重復(fù)”和“同義”的備選用詞進行比對,執(zhí)行計數(shù)后調(diào)用寫入模塊,最后將“合法”的備用詞寫入行業(yè)標(biāo)準(zhǔn)庫鏈中。涉及的用戶行為及功能模塊解釋如下。

      創(chuàng)新是企業(yè)發(fā)展的關(guān)鍵,是企業(yè)的第一驅(qū)動力。而核心能力是一種與眾不同的能力,它不是企業(yè)中某一種具體的能力或優(yōu)勢,而是一種將多種優(yōu)勢進行整合后形成的能力,它為企業(yè)帶來長期持續(xù)的競爭優(yōu)勢并使其獲取超額利潤,且一旦形成,便具有相對穩(wěn)定性,不易失去。企業(yè)核心能力是指在企業(yè)發(fā)展過程中整合能力已經(jīng)達(dá)成重要共識的能力,唯有如此才能培育出屬于本企業(yè)的持續(xù)競爭力,也才能提高企業(yè)的綜合能力,從而奠定企業(yè)更堅實的技術(shù)和管理基礎(chǔ)。

      Excel文件 注冊用戶選擇需要申請成為標(biāo)準(zhǔn)用語的數(shù)據(jù)表(僅包含表頭,不需要具體的值),整理完善至excel文件中。

      選擇行業(yè) 由于行業(yè)標(biāo)準(zhǔn)庫是根據(jù)不同行業(yè)作細(xì)分采集,因此注冊用戶在上傳之前,必須預(yù)先選擇待提交的excel文件所屬的行業(yè),才能較好地對該行業(yè)數(shù)據(jù)標(biāo)準(zhǔn)的完善作貢獻,增加注冊用戶申請的標(biāo)準(zhǔn)用語驗證通過率。

      轉(zhuǎn)換管理 excel文件的數(shù)據(jù)內(nèi)容可能會有重復(fù)項、規(guī)格不統(tǒng)一、空值、需要丟棄的亂碼等問題。轉(zhuǎn)換管理旨在于ETL(Extract Transform Load)的過程,即將數(shù)據(jù)從來源端經(jīng)過抽取(extract)、轉(zhuǎn)換(transform)、加載(load),形成統(tǒng)一格式的備選用詞。

      驗證模塊 驗證模塊是指對統(tǒng)一格式后的備選用詞依次調(diào)用智能合約進行比對和驗證,即將備選用詞和行業(yè)標(biāo)準(zhǔn)庫鏈中的標(biāo)準(zhǔn)用語進行文本分析和比對,驗證該備選用詞是否能夠?qū)懭霕?biāo)準(zhǔn)庫中。如果在已存標(biāo)準(zhǔn)用語中有一模一樣的備選用詞則判定“重復(fù)”;有意思相近的備選用詞則判定“相近”;語義不完備的備選用詞則被判定“缺損”;毫無意義的備選用詞則被判定為“無效”。只有語義完備且對比已存標(biāo)準(zhǔn)用語,無重復(fù)、非近義、有意義的備選用詞才能通過驗證判定“合法”,成為標(biāo)準(zhǔn)用語寫入行業(yè)標(biāo)準(zhǔn)庫鏈中。

      計數(shù)模塊 在驗證模塊中,通過驗證的“合法”備選用詞計數(shù)加一。被判定“重復(fù)”和“同義”的備選用詞,都將對該行業(yè)標(biāo)準(zhǔn)庫鏈中已存標(biāo)準(zhǔn)用詞(即被“重復(fù)”/“同義”的標(biāo)準(zhǔn)用詞)計數(shù)加一。通過計數(shù)模塊可以高效完整地統(tǒng)計適用于全行業(yè)的通用標(biāo)準(zhǔn)用詞,為后期權(quán)限管理和訪問控制提供依據(jù)。

      讀取模塊 執(zhí)行讀取行業(yè)標(biāo)準(zhǔn)庫鏈中標(biāo)準(zhǔn)用詞信息的操作,協(xié)助計數(shù)模塊進行比對操作。

      寫入模塊 執(zhí)行將“合法”的備選用詞寫入行業(yè)標(biāo)準(zhǔn)庫鏈的操作。

      行業(yè)標(biāo)準(zhǔn)庫鏈 細(xì)分領(lǐng)域下,某一行業(yè)的標(biāo)準(zhǔn)用詞集。

      智能合約程序代替?zhèn)鹘y(tǒng)的人工審核機制,是一個可自動執(zhí)行的計算機程序,同時也是一個系統(tǒng)的具體參與者。本文提出的方法旨在減少數(shù)據(jù)標(biāo)準(zhǔn)化過程中不必要的人工干預(yù),保證系統(tǒng)按照事先商定好的規(guī)則絕對可信地執(zhí)行審核操作,實現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)維護的高效性和客觀性。

      3 實驗及分析

      本文基于某證券公司大數(shù)據(jù)風(fēng)控管理平臺作了實驗對比和分析,該平臺包含四個應(yīng)用系統(tǒng),分別為信用風(fēng)險、市場風(fēng)險、操作風(fēng)險、非現(xiàn)場監(jiān)控等風(fēng)控系統(tǒng),四個風(fēng)控系統(tǒng)共計3 073張數(shù)據(jù)庫表,經(jīng)數(shù)據(jù)標(biāo)準(zhǔn)化后共計10 281個數(shù)據(jù)字段。本實驗通過傳統(tǒng)數(shù)據(jù)標(biāo)準(zhǔn)管理系統(tǒng)與基于區(qū)塊鏈的數(shù)據(jù)標(biāo)準(zhǔn)管理系統(tǒng)進行了標(biāo)準(zhǔn)用語申請的比對和分析,區(qū)塊鏈環(huán)境采用以太坊平臺搭建,部署了4個節(jié)點,設(shè)定區(qū)塊難度值,使得區(qū)塊出塊時間與以太坊公鏈大致相同,均為13.55 s。實驗結(jié)果表明,本文提出的模型和方法能夠高效、安全地對數(shù)據(jù)標(biāo)準(zhǔn)進行管理,減少過度的人為干預(yù),提高行業(yè)數(shù)據(jù)標(biāo)準(zhǔn)制定、監(jiān)督維護的效率。

      3.1 高效性分析

      傳統(tǒng)模型和方法中備選用詞申請成為標(biāo)準(zhǔn)用語的時間如式(1)所示:

      (1)

      T為備選用詞申請成為標(biāo)準(zhǔn)用語所用的時間。傳統(tǒng)模型中,用戶逐個提交備選用詞申請標(biāo)準(zhǔn)用詞,需人工審核(即人工檢閱通過后反饋是否通過)。在這個過程中,用戶提交后得到反饋的時間主要取決于參與審核人員的工作時間。因此可分兩種情況,情況一(最短用時):用戶提交申請,審核人員立即查看,此時審核人員審查所用時間為t1,提交后馬上被人工審核的備選用詞數(shù)量為n1;情況二(較長用時),審核人員非即刻查看,此種情況備選用詞梳理為n2,此時審核所費時間為t2(t2呈指數(shù)分布),根據(jù)公司對審核人員的要求,標(biāo)準(zhǔn)用語申請?zhí)峤缓笕齻€小時內(nèi)內(nèi)基本會得到處理,因此本文得出t2的概率密度函數(shù)為:f(t)=e-(0.08t-0.08)。

      本文提出的模型中備選用詞申請成為標(biāo)準(zhǔn)用語的時間如式(2)所示:

      T=(n3+n4)×t3+n3×t3+(?n3/(tx×t4)+1」)×t4

      (2)

      T為備選用詞申請成為標(biāo)準(zhǔn)用語所用的時間。區(qū)塊鏈模型中,注冊用戶可通過上傳excel文件的方式批量提交備選用詞申請標(biāo)準(zhǔn)用詞,通過調(diào)用智能合約進行備選用詞的驗證。在這個過程中,注冊用戶提交后得到驗證反饋信息的時間主要取決于讀取智能合約以及寫入?yún)^(qū)塊鏈的時間。根據(jù)驗證反饋信息,注冊用戶提交的備選用詞可被分為兩類:可被存入?yún)^(qū)塊鏈的備選用詞(即驗證反饋信息為“合法”的備選用詞)和不被存入?yún)^(qū)塊鏈的備選用詞(即驗證反饋信息為“無效”、“同義”和“重復(fù)”和“缺損”的備選用詞),其數(shù)量分別用n3、n4表示。首先所有被提交的備選用詞(即n3+n4)需要依次調(diào)用智能合約進行驗證對比,然后符合要求的n3數(shù)量的標(biāo)準(zhǔn)用語需要再次調(diào)研智能合約寫入?yún)^(qū)塊鏈中,設(shè)調(diào)用一次智能合約所用時間為t3。考慮到以太坊的每秒并發(fā)數(shù)為tx,區(qū)塊的生成時間為t4。綜合以上條件,備選用詞申請成為標(biāo)準(zhǔn)用語的時間如式(2)所示。

      根據(jù)市面上已有的數(shù)據(jù)標(biāo)準(zhǔn)管理系統(tǒng),經(jīng)實際操作估算,兩種模型n1和n2以及n3和n4的數(shù)量均占總審核備選用詞數(shù)量的50%。傳統(tǒng)模型中t1為1 min(根據(jù)實驗監(jiān)測得到),t2取時間指數(shù)函數(shù)的積分;本文以太坊區(qū)塊鏈環(huán)境智能合約調(diào)用平均時間t3為0.012 s(根據(jù)實驗監(jiān)測得到),t4為13.55 s(當(dāng)前以太坊一個區(qū)塊生成的平均時間)。經(jīng)過實驗測算得到兩種模型所用的審核時間對比如圖8所示。

      圖8 備選用語審核時間對比

      由圖8所示,用戶申請相同數(shù)量備選用詞,區(qū)塊鏈模型所用的審核時間明顯比傳統(tǒng)模型所用時間短,且申請的備選用詞數(shù)量越多,兩者耗時差距越明顯。區(qū)塊鏈模型在申請驗證過程中時間效率顯然優(yōu)于傳統(tǒng)模型。

      從商業(yè)角度來看,不同于區(qū)塊鏈模型的機器驗證方式,傳統(tǒng)模型的人工審核模式不僅放大了審查人員的權(quán)威性,更在系統(tǒng)維護、數(shù)據(jù)維護和數(shù)據(jù)擴展等方面存在巨大劣勢。兩者進一步對比如表2所示。

      表2 傳統(tǒng)模型與區(qū)塊鏈模型對比

      3.2 安全性分析

      人為作惡是指黑客破壞整個網(wǎng)絡(luò)、篡改數(shù)據(jù)或用戶通過不良行為自己牟利,直接或間接地對現(xiàn)有數(shù)據(jù)標(biāo)準(zhǔn)體系進行破壞和影響。本文所提出的基于區(qū)塊鏈的行業(yè)數(shù)據(jù)標(biāo)準(zhǔn)共建模型,在抵御人為作惡保障網(wǎng)絡(luò)及信息安全方面具有以下3個方面的優(yōu)勢。

      1)利用分布式數(shù)據(jù)存儲和數(shù)據(jù)共享模式,有效防止單點攻擊。

      本模型不同于由大型企業(yè)、銀行機構(gòu)、政府部門等第三方實體主導(dǎo)的,用中心化服務(wù)器存儲數(shù)據(jù)的信息化系統(tǒng),基于區(qū)塊鏈的數(shù)據(jù)存儲本質(zhì)上是一種多中心、分布式結(jié)構(gòu)。在區(qū)塊鏈社區(qū)的對等網(wǎng)絡(luò)中,區(qū)塊鏈技術(shù)利用節(jié)點間端到端的通信方式,不僅解決了分布式數(shù)據(jù)存儲問題,也解決了存儲時的分布式一致性問題。

      模式對比圖如圖9所示,區(qū)塊鏈的數(shù)據(jù)共享模式可取代傳統(tǒng)模式下中心化服務(wù)器,形成一個特有的、多中心、分布式數(shù)據(jù)庫。每個節(jié)點的數(shù)據(jù)都相同,這意味著攻擊者攻擊任意單個節(jié)點都不會影響整個系統(tǒng)的數(shù)據(jù)安全,不會形成單點故障。

      2)利用密碼學(xué)的相關(guān)原理進行數(shù)據(jù)驗證,數(shù)據(jù)可靠不能篡改。

      本文提出的模型利用數(shù)字簽名技術(shù)保證用戶在注冊成功后無法被惡意實體假冒,有效杜絕惡意實體擾亂注冊用戶秩序的潛在危險。寫入?yún)^(qū)塊鏈的數(shù)據(jù)經(jīng)過共識機制已被全部節(jié)點驗證通過,惡意實體無法通過攻破所有節(jié)點掌控整個區(qū)塊鏈網(wǎng)絡(luò),更無法篡改鏈上數(shù)據(jù)。

      3)通過業(yè)務(wù)方法平衡鏈上和鏈下的數(shù)據(jù),用戶行為可被審計。

      在真實業(yè)務(wù)場景下,用戶登記體系不完備,導(dǎo)致了數(shù)據(jù)的來源、流轉(zhuǎn)過程不透明,數(shù)據(jù)采集質(zhì)量不可控,也使得數(shù)據(jù)標(biāo)準(zhǔn)化的制定混亂。本文通過業(yè)務(wù)方法來平衡并保證兩者的數(shù)據(jù)一致性以確保信息安全。區(qū)塊鏈上的數(shù)據(jù),即行業(yè)標(biāo)準(zhǔn)庫鏈內(nèi)數(shù)據(jù)信息在計算以及結(jié)果輸出的每一步記錄都會被留存在區(qū)塊鏈上,因此具有可追溯特性;區(qū)塊鏈下的數(shù)據(jù),即用戶的注冊信息是監(jiān)管模塊對其進行監(jiān)管的追責(zé)依據(jù)。通過業(yè)務(wù)方法結(jié)合鏈上鏈下數(shù)據(jù),可實現(xiàn)對不良數(shù)據(jù)和不良用戶行為的雙重審計。

      圖9 單點攻擊下傳統(tǒng)模式與區(qū)塊鏈模式對比

      4 結(jié)語

      本文提出的基于區(qū)塊鏈的數(shù)據(jù)治理協(xié)同模型以及多方協(xié)作行業(yè)數(shù)據(jù)標(biāo)準(zhǔn)共建方法,解決了當(dāng)前數(shù)據(jù)標(biāo)準(zhǔn)的產(chǎn)生和利用只能停留在封閉環(huán)境之內(nèi)的兩難境地,為數(shù)據(jù)治理模型的應(yīng)用及多方協(xié)作的數(shù)據(jù)標(biāo)準(zhǔn)共建提供了可行的路徑。該模型的價值在于利用區(qū)塊鏈技術(shù)和智能合約技術(shù)充分匯聚行業(yè)多方資源,實現(xiàn)數(shù)據(jù)治理價值以及高效安全的數(shù)據(jù)標(biāo)準(zhǔn)加載、融合及開放。仿真實驗也表明本文提出的方法的高效性和安全性。在未來工作中,本研究將開展進一步實驗,從而幫助完善基于區(qū)塊鏈的數(shù)據(jù)治理協(xié)同方法實施細(xì)則,并開展多方協(xié)作行業(yè)數(shù)據(jù)標(biāo)準(zhǔn)共建模型的深入應(yīng)用。

      猜你喜歡
      用詞行業(yè)標(biāo)準(zhǔn)區(qū)塊
      需注意的規(guī)范醫(yī)學(xué)用詞
      強化詩詞用詞的時代性
      中華詩詞(2022年2期)2022-12-31 05:57:58
      蒼涼又喧囂:《我與地壇》中的用詞
      區(qū)塊鏈:一個改變未來的幽靈
      科學(xué)(2020年5期)2020-11-26 08:19:12
      區(qū)塊鏈:主要角色和衍生應(yīng)用
      科學(xué)(2020年6期)2020-02-06 08:59:56
      近期發(fā)布的相關(guān)行業(yè)標(biāo)準(zhǔn)(2020年3月01日)摘選
      區(qū)塊鏈+媒體業(yè)的N種可能
      傳媒評論(2018年4期)2018-06-27 08:20:12
      讀懂區(qū)塊鏈
      寫話妙計之用詞準(zhǔn)確
      關(guān)于《腹腔鏡用穿刺器》行業(yè)標(biāo)準(zhǔn)的若干思考
      阜康市| 望都县| 天祝| 四子王旗| 龙岩市| 通辽市| 轮台县| 永顺县| 梅州市| 应城市| 饶河县| 毕节市| 阜新市| 安宁市| 大城县| 资兴市| 敦煌市| 德清县| 平江县| 晋州市| 吉林省| 和硕县| 阳高县| 河西区| 修武县| 水城县| 卢湾区| 延庆县| 习水县| 缙云县| 乐业县| 宕昌县| 云南省| 巍山| 贡山| 蒙城县| 桂东县| 弥渡县| 日照市| 天台县| 长沙市|