• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      面向聯(lián)邦學(xué)習(xí)的共享數(shù)據(jù)湖建設(shè)探討

      2020-09-19 08:02:38
      網(wǎng)絡(luò)安全和信息化 2020年9期
      關(guān)鍵詞:數(shù)據(jù)保護(hù)原始數(shù)據(jù)聯(lián)邦

      編者按:本文分析了聯(lián)邦學(xué)習(xí)與數(shù)據(jù)湖的不兼容性和融合契機(jī),梳理了適用于實(shí)現(xiàn)聯(lián)邦學(xué)習(xí)和數(shù)據(jù)湖技術(shù)融合的數(shù)據(jù)保護(hù)技術(shù),探討構(gòu)建了基于數(shù)據(jù)保護(hù)和價(jià)值共享的隱私數(shù)據(jù)使用矩陣,提出了面向聯(lián)邦學(xué)習(xí)的共享數(shù)據(jù)湖建設(shè)策略,為解決不同數(shù)據(jù)所有方在數(shù)據(jù)湖中共同安全、合規(guī)的使用數(shù)據(jù)資源等提供了具體的技術(shù)建議。

      隨著各國(guó)的數(shù)據(jù)保護(hù)法律、政策陸續(xù)出臺(tái),如何在合規(guī)使用數(shù)字資產(chǎn)的前提下,共享數(shù)據(jù)價(jià)值、保障經(jīng)濟(jì)效益正在影響新基建所帶來(lái)的技術(shù)范式演進(jìn)。從目前的技術(shù)發(fā)展歷程來(lái)看,聯(lián)邦學(xué)習(xí)和數(shù)據(jù)湖在之前各自的技術(shù)演進(jìn)中是甚少交集的。兩者的不兼容性主要在以下兩方面:

      一是用戶需求差異較大。聯(lián)邦學(xué)習(xí)在已有的商業(yè)實(shí)踐中,主要為海量的終端用戶服務(wù)。而數(shù)據(jù)湖的用戶群體源于數(shù)據(jù)倉(cāng)庫(kù)的使用者,屬于企業(yè)級(jí)用戶。不同的用戶群體的需求存在較大差異。

      二是聯(lián)邦學(xué)習(xí)的網(wǎng)絡(luò)開(kāi)銷(xiāo)較高。聯(lián)邦學(xué)習(xí)關(guān)注數(shù)據(jù)的去中心化,但其模型更新過(guò)程中始終需要中央服務(wù)器參與。不同的終端用戶在連接中央服務(wù)器時(shí)的網(wǎng)絡(luò)環(huán)境充滿不確定性,因此海量終端用戶在進(jìn)行聯(lián)邦學(xué)習(xí)時(shí)的網(wǎng)絡(luò)開(kāi)銷(xiāo)較高。而數(shù)據(jù)湖在保證性能與效率的前提下,正在致力于通過(guò)分布式架構(gòu)等途徑防止網(wǎng)絡(luò)開(kāi)銷(xiāo)過(guò)高。

      聯(lián)邦學(xué)習(xí)與數(shù)據(jù)湖的融合契機(jī)

      隨著聯(lián)邦學(xué)習(xí)的商業(yè)化進(jìn)程加快,企業(yè)級(jí)用戶正在成為聯(lián)邦學(xué)習(xí)的目標(biāo)用戶。這為聯(lián)邦學(xué)習(xí)與數(shù)據(jù)湖解決不兼容性問(wèn)題,實(shí)現(xiàn)技術(shù)融合帶來(lái)了可行的應(yīng)用場(chǎng)景——同類(lèi)型用戶群體、較小的用戶規(guī)模和相對(duì)穩(wěn)定的網(wǎng)絡(luò)環(huán)境。在這一應(yīng)用場(chǎng)景下,聯(lián)邦學(xué)習(xí)與數(shù)據(jù)湖具有以下三方面的融合契機(jī):

      一是數(shù)據(jù)湖可以成為聯(lián)邦學(xué)習(xí)所需的可信第三方節(jié)點(diǎn)。理論上,聯(lián)邦學(xué)習(xí)不需要第三方節(jié)點(diǎn)可信,但需要滿足不同數(shù)據(jù)所有方彼此誠(chéng)實(shí)且好奇,嚴(yán)格符合安全多方計(jì)算(MPC)等條件。而這些條件目前尚難以同時(shí)滿足。此外,在聯(lián)邦學(xué)習(xí)的訓(xùn)練過(guò)程中,模型更新需要向第三方節(jié)點(diǎn)顯示敏感信息。雖然可以通過(guò)安全多方計(jì)算、差分隱私等保護(hù)隱私,但是采用可信第三方節(jié)點(diǎn)可以有效保障模型性能和系統(tǒng)效率,在經(jīng)濟(jì)效益上更為可取。

      二是數(shù)據(jù)湖天然適合成為聯(lián)邦學(xué)習(xí)的商業(yè)化載體。數(shù)據(jù)湖的元數(shù)據(jù)可以為聯(lián)邦學(xué)習(xí)在商業(yè)化進(jìn)程中拓展新的數(shù)據(jù)價(jià)值共享模式。數(shù)據(jù)湖的元數(shù)據(jù)可映射為聯(lián)邦學(xué)習(xí)中的所需的標(biāo)簽Y,實(shí)現(xiàn)數(shù)據(jù)與標(biāo)簽Y的分離。這種分離使得擁有海量數(shù)據(jù)但不清楚如何使用的用戶免去協(xié)議制定的困擾,讓聯(lián)邦學(xué)習(xí)的數(shù)據(jù)價(jià)值共享模式不再拘泥于由標(biāo)簽Y的提供方制定協(xié)議。

      同時(shí),目前聯(lián)邦學(xué)習(xí)正在探索商業(yè)化推進(jìn)的平臺(tái)和激勵(lì)機(jī)制,考慮通過(guò)區(qū)塊鏈等技術(shù)記錄聯(lián)邦學(xué)習(xí)參與者的貢獻(xiàn)評(píng)價(jià)和數(shù)據(jù)價(jià)值分配。而數(shù)據(jù)湖已有一定的商業(yè)實(shí)踐,并且其海量的存儲(chǔ)能力天然適合作為區(qū)塊鏈等技術(shù)的載體。因此,可以通過(guò)激勵(lì)機(jī)制在聯(lián)邦學(xué)習(xí)的協(xié)議制定中加入央行數(shù)字貨幣DC/EP,進(jìn)一步推動(dòng)數(shù)據(jù)價(jià)值共享的模式創(chuàng)新。

      圖1 基于數(shù)據(jù)保護(hù)和價(jià)值共享的隱私數(shù)據(jù)使用矩陣

      三是聯(lián)邦學(xué)習(xí)可以幫助數(shù)據(jù)湖解決安全性質(zhì)疑。通過(guò)聯(lián)邦學(xué)習(xí),數(shù)據(jù)湖可由直接存儲(chǔ)含有用戶隱私的原始數(shù)據(jù)轉(zhuǎn)為存儲(chǔ)加密的模型相關(guān)參數(shù)等原始數(shù)據(jù)。這樣既可以保留存儲(chǔ)原始數(shù)據(jù)的根本特征,又可以解決人們一直以來(lái)對(duì)于數(shù)據(jù)湖中原始數(shù)據(jù)安全的質(zhì)疑。解決安全性質(zhì)疑對(duì)數(shù)據(jù)湖實(shí)現(xiàn)從用戶內(nèi)部的信息基礎(chǔ)設(shè)施走向用戶間共建共享的信息基礎(chǔ)設(shè)施的技術(shù)演進(jìn)尤為重要。

      適用于實(shí)現(xiàn)聯(lián)邦學(xué)習(xí)和數(shù)據(jù)湖技術(shù)融合的數(shù)據(jù)保護(hù)技術(shù)

      要實(shí)現(xiàn)聯(lián)邦學(xué)習(xí)和數(shù)據(jù)湖的技術(shù)融合,數(shù)據(jù)安全是融合的前提。因此,需要按照等級(jí)保護(hù)的相關(guān)要求配備數(shù)據(jù)保護(hù)技術(shù),具備數(shù)據(jù)保護(hù)能力。根據(jù)數(shù)據(jù)保護(hù)能力的來(lái)源,適用的數(shù)據(jù)保護(hù)技術(shù)可以分為兩大類(lèi):

      第一類(lèi)是內(nèi)生的安全保護(hù),即聯(lián)邦學(xué)習(xí)本身包含的數(shù)據(jù)保護(hù)技術(shù)。這類(lèi)技術(shù)包括基于隱私保護(hù)的數(shù)據(jù)建模、不經(jīng)意傳輸、差分隱私以及同態(tài)加密等。

      第二類(lèi)是外部的安全保護(hù),即其他可在數(shù)據(jù)湖中配備的數(shù)據(jù)保護(hù)技術(shù)。包括入侵防護(hù)、追蹤溯源、訪問(wèn)控制和區(qū)塊鏈等。這些技術(shù)還可以進(jìn)一步的細(xì)分,一種是直接參與聯(lián)邦學(xué)習(xí)的技術(shù),例如,記錄聯(lián)邦學(xué)習(xí)全過(guò)程的區(qū)塊鏈;另一種是防止數(shù)據(jù)湖內(nèi)存儲(chǔ)數(shù)據(jù)被惡意獲取、使用等的技術(shù),包括入侵防護(hù)、追蹤溯源和訪問(wèn)控制等。

      面向聯(lián)邦學(xué)習(xí)的共享數(shù)據(jù)湖建設(shè)策略

      綜合數(shù)據(jù)保護(hù)的對(duì)象和聯(lián)邦學(xué)習(xí)的價(jià)值共享過(guò)程,可以對(duì)直接參與聯(lián)邦學(xué)習(xí)的數(shù)據(jù)保護(hù)技術(shù)從數(shù)據(jù)保護(hù)和價(jià)值共享兩個(gè)維度進(jìn)一步細(xì)分,構(gòu)建基于數(shù)據(jù)保護(hù)和價(jià)值共享的隱私數(shù)據(jù)使用矩陣,如圖1 所示。

      在數(shù)據(jù)保護(hù)維度,主要考慮需要保護(hù)的數(shù)據(jù)是本體還是附屬(關(guān)于數(shù)據(jù)本體與附屬的概念,可參看筆者拙作《大數(shù)據(jù)監(jiān)管系統(tǒng)建設(shè)研究》)。其中數(shù)據(jù)本體包括標(biāo)簽Y、模型更新的參數(shù)等,數(shù)據(jù)附屬包含聯(lián)邦學(xué)習(xí)的協(xié)議制定、參與用戶及其貢獻(xiàn)等。

      在價(jià)值共享維度,通過(guò)聯(lián)邦學(xué)習(xí)進(jìn)行價(jià)值共享的過(guò)程一般可以分為兩個(gè)階段:第一階段是準(zhǔn)備階段,其中包括確定參與聯(lián)邦學(xué)習(xí)的用戶,制定協(xié)議,建立模型;第二階段是實(shí)現(xiàn)階段,由參與用戶共同訓(xùn)練模型、完成聯(lián)邦學(xué)習(xí)并進(jìn)行價(jià)值共享。

      從圖中可以看到,對(duì)于數(shù)據(jù)附屬,主要通過(guò)區(qū)塊鏈所使用的零知識(shí)證明、智能合約等在保護(hù)隱私數(shù)據(jù)的同時(shí)如實(shí)記錄聯(lián)邦學(xué)習(xí)的全過(guò)程;對(duì)于數(shù)據(jù)本體,在準(zhǔn)備階段采用基于隱私保護(hù)的數(shù)據(jù)建模,防止由于原始數(shù)據(jù)參與參數(shù)傳遞導(dǎo)致的潛在數(shù)據(jù)泄露的情況,在實(shí)現(xiàn)階段采用不經(jīng)意傳輸、差分隱私、同態(tài)加密等,防止在進(jìn)行聯(lián)邦學(xué)習(xí)時(shí)的中間數(shù)據(jù)等被惡意獲取、使用等。

      在面向聯(lián)邦學(xué)習(xí)的共享數(shù)據(jù)湖建設(shè)中,首先需要按照矩陣中的劃分對(duì)數(shù)據(jù)湖進(jìn)行相應(yīng)的配置,從而為聯(lián)邦學(xué)習(xí)的全過(guò)程中產(chǎn)生的各類(lèi)數(shù)據(jù)提供針對(duì)性的保護(hù)。

      同時(shí),數(shù)據(jù)湖還需要將入侵防護(hù)、追蹤溯源、訪問(wèn)控制等技術(shù)作為構(gòu)建數(shù)據(jù)保護(hù)能力的基礎(chǔ),使其成為數(shù)據(jù)湖作為用戶間共建共享的信息基礎(chǔ)設(shè)施的標(biāo)準(zhǔn)配置。

      此外,面向聯(lián)邦學(xué)習(xí)的共享數(shù)據(jù)湖建設(shè)中還需要考慮兩類(lèi)可預(yù)見(jiàn)的風(fēng)險(xiǎn):

      第一類(lèi)是安全性衰減風(fēng)險(xiǎn)。從技術(shù)發(fā)展的歷程看,不論是直接參與聯(lián)邦學(xué)習(xí)的數(shù)據(jù)保護(hù)技術(shù)如不經(jīng)意傳輸、差分隱私等,還是構(gòu)建共享數(shù)據(jù)湖基礎(chǔ)數(shù)據(jù)保護(hù)能力的入侵防護(hù)、追蹤溯源等技術(shù),都面臨著安全性因技術(shù)進(jìn)步而不斷下降的現(xiàn)實(shí)風(fēng)險(xiǎn)。

      第二類(lèi)是超范圍使用風(fēng)險(xiǎn)。目前聯(lián)邦學(xué)習(xí)的應(yīng)用研究中,正在探索采用聯(lián)邦學(xué)習(xí)進(jìn)行融合金融、醫(yī)療、用戶行為等多方數(shù)據(jù)源的商業(yè)實(shí)踐。在這類(lèi)商業(yè)實(shí)踐中,用戶隱私有可能隨著關(guān)聯(lián)數(shù)據(jù)超出預(yù)計(jì)范圍而出現(xiàn)意想不到的數(shù)據(jù)泄露風(fēng)險(xiǎn)。

      因此,出于合規(guī)與安全的共同需要,面向聯(lián)邦學(xué)習(xí)的共享數(shù)據(jù)湖建設(shè)還應(yīng)當(dāng)考慮與大數(shù)據(jù)監(jiān)管系統(tǒng)建設(shè)的適配,讓監(jiān)管部門(mén)可以實(shí)時(shí)掌握第一手情況,從而最大限度的規(guī)避技術(shù)創(chuàng)新過(guò)程中的各類(lèi)風(fēng)險(xiǎn)。

      總結(jié)

      本文分析了聯(lián)邦學(xué)習(xí)與數(shù)據(jù)湖的不兼容性和融合契機(jī),梳理了適用于實(shí)現(xiàn)聯(lián)邦學(xué)習(xí)和數(shù)據(jù)湖技術(shù)融合的數(shù)據(jù)保護(hù)技術(shù),探討構(gòu)建了基于數(shù)據(jù)保護(hù)和價(jià)值共享的隱私數(shù)據(jù)使用矩陣,提出了面向聯(lián)邦學(xué)習(xí)的共享數(shù)據(jù)湖建設(shè)策略,為解決不同數(shù)據(jù)所有方在數(shù)據(jù)湖中共同安全、合規(guī)的使用數(shù)據(jù)資源等提供了具體的技術(shù)建議。

      猜你喜歡
      數(shù)據(jù)保護(hù)原始數(shù)據(jù)聯(lián)邦
      GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
      受特定變化趨勢(shì)限制的傳感器數(shù)據(jù)處理方法研究
      一“炮”而紅 音聯(lián)邦SVSound 2000 Pro品鑒會(huì)完滿舉行
      303A深圳市音聯(lián)邦電氣有限公司
      全新Mentor DRS360 平臺(tái)借助集中式原始數(shù)據(jù)融合及直接實(shí)時(shí)傳感技術(shù)實(shí)現(xiàn)5 級(jí)自動(dòng)駕駛
      TPP生物藥品數(shù)據(jù)保護(hù)條款研究
      歐盟數(shù)據(jù)保護(hù)立法改革之發(fā)展趨勢(shì)分析
      歐盟《一般數(shù)據(jù)保護(hù)條例》新規(guī)則評(píng)析
      藥品試驗(yàn)數(shù)據(jù)保護(hù)對(duì)完善中藥品種保護(hù)制度的啟示
      世界經(jīng)濟(jì)趨勢(shì)
      兴海县| 崇明县| 两当县| 遂溪县| 水富县| 长沙县| 钟山县| 阿巴嘎旗| 金阳县| 巩义市| 新龙县| 娱乐| 宣化县| 尤溪县| 常宁市| 张家界市| 武邑县| 古田县| 林州市| 巴林左旗| 桑植县| 兰考县| 墨江| 旅游| 项城市| 都匀市| 英山县| 赣榆县| 会东县| 连城县| 海伦市| 库尔勒市| 宜宾市| 射阳县| 呈贡县| 弥渡县| 梁河县| 潮州市| 台湾省| 宜兴市| 德令哈市|