• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      全密文計算時代即將到來

      2020-09-02 06:45:23劉哲理
      中國信息化周報 2020年29期
      關(guān)鍵詞:明文廣告主密文

      在未來很長一段時間或者很多特殊應(yīng)用場景里,仍然需要以明文方式使用和共享數(shù)據(jù)。

      隱私保護(hù)的數(shù)據(jù)發(fā)布就是針對此的一類解決方法。像醫(yī)院、大型互聯(lián)網(wǎng)企業(yè)、電信企業(yè)這樣的數(shù)據(jù)發(fā)布者,都有海量的用戶信息和各種維度的數(shù)據(jù),但他們是不敢輕易地把數(shù)據(jù)發(fā)布給外部單位的,因?yàn)樵诎l(fā)布的過程中會泄露用戶敏感的隱私。一種直觀的做法是刪掉敏感信息再發(fā)布。

      這種做法一般來說是沒有問題的,但是對于專業(yè)的信息安全攻防人員而言,這就是大問題,為什么?舉例來說,如果某大學(xué)醫(yī)院的這種數(shù)據(jù)泄露了,而攻擊者可以通過一些渠道購買或者通過黑客手段拿到某大學(xué)的數(shù)據(jù)庫,得到該大學(xué)的具體老師名單。僅僅把名字等敏感信息去掉是不夠的,因?yàn)橥ㄟ^準(zhǔn)標(biāo)識符,仍然是可以確定用戶身份的。

      為了抵御類似的攻擊,進(jìn)一步的匿名方法提出來,比如泛化—將所有屬性變成上一級的、更廣泛的屬性。例如, 把計算機(jī)學(xué)院泛化成工學(xué)院,40—45歲的統(tǒng)一變成45歲。一個準(zhǔn)標(biāo)識符泛化后可能關(guān)聯(lián)K條數(shù)據(jù),就叫做K匿名。通過這樣的方法,做數(shù)據(jù)分析的時候,雖然不那么精確,但一定程度上還能滿足需求。但是這仍然存在問題。如果相同泛化的結(jié)果(即K個準(zhǔn)標(biāo)識符)只能對應(yīng)一種疾病,那么攻擊者也能猜出你得的是什么病。這種情況下,就需要L樣化。L樣化是指相同泛化后的準(zhǔn)標(biāo)識符擁有L種疾病。此時,攻擊者只能知道你有L種疾病可能,很難精確推測你的疾病了。K匿名和L樣化是不是就安全了呢?也不一定,因?yàn)檫€可能存在表關(guān)聯(lián)攻擊等。

      差分隱私 保護(hù)隱私和產(chǎn)生價值的重要手段

      抵御差分攻擊的方法就是差分隱私。差分隱私是通過增加特定分布的噪音保護(hù)個體的差異,使得整體數(shù)據(jù)特征不變的一種技術(shù),在現(xiàn)階段非常有用。它可以用在面向終端用戶的數(shù)據(jù)采集,比如輸入法里,通過增加噪音后無法讓服務(wù)器知道特定用戶的隱私信息,但可以利用帶噪音的數(shù)據(jù)去推測,類似用戶輸入了“LZL”就會選擇“劉哲理”這一種詞語的行為習(xí)慣。

      因?yàn)?,一旦“劉哲理”成為了網(wǎng)紅,一些用戶可能會大量的搜索,這個時候可以利用采集的部分用戶數(shù)據(jù)產(chǎn)生的價值,服務(wù)于其它第一次輸入“LZL”的用戶。

      再看一個典型的例子,在線廣告?;ヂ?lián)網(wǎng)巨頭企業(yè)的一個主要營收渠道就是廣告,它們在廣告領(lǐng)域存在競爭,需要開放一個統(tǒng)計查詢的業(yè)務(wù)。廣告主可以把想投放廣告的條件提供給廣告平臺,廣告平臺將滿足要求的用戶數(shù)量反饋給廣告主。這其實(shí)就是一個統(tǒng)計查詢,統(tǒng)計查詢返回的是數(shù)字,但是有一種攻擊有可能會把整個平臺所有的數(shù)據(jù)偷走。如何做到?方法是差分攻擊。因?yàn)閺V告主可以構(gòu)造特定的輸入,使得兩次輸入擁有個體的差異,返回的結(jié)構(gòu)可以返回個體“是與不是”或者“在與不在”的答復(fù),差分攻擊是能做到這種事情的。那么通過“是與不是”這樣一個接口,就可以構(gòu)造更多的查詢、更多的條件,甚至完成對整個數(shù)據(jù)庫脫庫的工作。差分攻擊非常致命,SQL盲注可以看做一個特殊的例子,于是差分隱私的概念就提出來了。

      差分隱私就是在查詢結(jié)果上加噪音,讓構(gòu)造的相似的數(shù)據(jù)集的返回結(jié)果變得不確定,讓差分攻擊失去了本質(zhì)依賴條件,即對于個體“是與不是”或者“在與不在”的回答不確定了,所以無法奏效。然而,差分隱私并非是萬能藥,因?yàn)榧拥脑胍舳际菄@真值的特定分布的數(shù)據(jù),如果能多次查詢,取平均值就能得到真正結(jié)果,這種重復(fù)攻擊就又奏效了。因此,現(xiàn)在基于差分隱私的攻擊和滿足特定業(yè)務(wù)需求的構(gòu)造方法,是當(dāng)前的研究熱點(diǎn)。

      信息孤島數(shù)據(jù)價值挖掘與數(shù)據(jù)安全

      數(shù)據(jù)是機(jī)器學(xué)習(xí)的基礎(chǔ) 。而在大多數(shù)行業(yè)中,由于行業(yè)競爭、隱私安全、行政手續(xù)復(fù)雜等問題,數(shù)據(jù)常常是以孤島的形式存在的。一個企業(yè),它有上海分中心、天津分中心、北京分中心,內(nèi)部都有大量數(shù)據(jù),明文存儲的數(shù)據(jù)并不一定能夠很輕易地共享出去。不同的企業(yè),例如騰訊、京東、阿里等,他們既存在競爭關(guān)系,又存在合作關(guān)系,他們都有大量的數(shù)據(jù)庫,在很多時候需要使數(shù)據(jù)聯(lián)合起來產(chǎn)生價值。這種情況就要求明文存儲、密文使用。

      一個典型案例就是精準(zhǔn)廣告推薦。現(xiàn)在,廣告主投放廣告的要求越來越高,并不只是要求覆蓋一個用戶范圍就行了,而是要求精準(zhǔn)覆蓋。以游戲設(shè)備廠商為例,騰訊有用戶玩游戲的記錄,而京東有用戶買游戲設(shè)備的記錄,游戲設(shè)備商就希望把廣告投放給既玩某一款游戲、又買某一款設(shè)備的用戶,這樣廣告的轉(zhuǎn)化率才更高,廣告主才愿意花更多的錢。那么對兩個數(shù)據(jù)孤島,怎樣去求交集,怎樣把共性的元素提煉出來,這些問題都是安全業(yè)務(wù)的擴(kuò)展帶來的新問題。數(shù)據(jù)安全是企業(yè)拓展業(yè)務(wù)需要解決的首要問題。剛才所說的問題怎么來解決呢?用安全多方計算去解決。我們不去共享數(shù)據(jù),但是我們通過密文上的數(shù)據(jù)計算的方式,來把任務(wù)完成。剛才說的兩方精準(zhǔn)推送廣告,其實(shí)就是密文集合求交,是安全多方計算的典型例子。

      另一種情況是,需要利用分布在不同地點(diǎn)的相同維度的數(shù)據(jù),例如上海、北京、天津分中心的大量數(shù)據(jù),去共同訓(xùn)練一個模型。把數(shù)據(jù)集中在一起再去訓(xùn)練機(jī)器學(xué)習(xí)模型,對數(shù)據(jù)存儲帶來很高要求,而且訓(xùn)練效率可能也不夠高。而且考慮到安全性,有些數(shù)據(jù)根本就不允許分享出去。在這種情況下,使用不同孤島里存儲的相同維度數(shù)據(jù)共同訓(xùn)練一個任務(wù)模型,就是橫向聯(lián)邦機(jī)器學(xué)習(xí),這個過程是基于密文參數(shù)交換共享、特定服務(wù)器安全聚合的方式來完成的。安全聚合的聯(lián)邦機(jī)器學(xué)習(xí)已經(jīng)成為信息孤島數(shù)據(jù)價值挖掘、保護(hù)用戶隱私的重要數(shù)據(jù)安全手段。

      全密文計算是未來的趨勢

      從明文存儲、明文使用到明文存儲、密文使用,最終我們希望存的就是密文,用的時候也是密文,這將是一個理想狀態(tài)?,F(xiàn)在在一些機(jī)密的環(huán)境里已經(jīng)開始使用了,例如密態(tài)數(shù)據(jù)庫。大量的信息泄露的根本原因,就是數(shù)據(jù)庫里面存的是明文,但如果要把數(shù)據(jù)加了密存入數(shù)據(jù)庫,那數(shù)據(jù)可能就沒法用了,增、刪、改、查可能都沒有辦法執(zhí)行了。

      密文查詢和密文計算有助于解決這個問題,包括可搜索加密、保留順序加密和同態(tài)加密等??伤阉骷用芙鉀Q的其實(shí)是關(guān)鍵詞檢索的問題。在數(shù)據(jù)庫里輸入一個訂單號查找一條記錄,或者輸入一本書名查找類似書籍信息的多條記錄,都是關(guān)鍵詞檢索的問題。在Windows系統(tǒng)打開“我的電腦”,去找一個文件存在哪兒,這也是關(guān)鍵詞檢索的問題。打開郵箱,輸入一個關(guān)鍵詞,搜索過去的某一封郵件,同樣是一個關(guān)鍵詞檢索的問題。這些信息存在文件或者數(shù)據(jù)庫里,如果加了密,那么可搜索加密就可以替你完成這些事情,即檢索密文里是否包含一個加密的關(guān)鍵詞,這種手段是用密碼技術(shù)來解決用戶隱私保護(hù)的問題。數(shù)據(jù)庫里經(jīng)常要做范圍查詢,大于或小于多少、在哪個區(qū)間的范圍查詢。范圍查詢就需要在密文上保留順序,這就是保留順序加密能做到的事情。同態(tài)加密可以用于統(tǒng)計分析、求和與平均等常見數(shù)據(jù)庫統(tǒng)計任務(wù)。上述的這些密碼機(jī)制,在NoSQL數(shù)據(jù)庫、分布式文件存儲系統(tǒng)、云存儲里都是可以工作的。

      純密文的狀態(tài)是未來的必然趨勢,現(xiàn)在核心關(guān)鍵的地方也應(yīng)該率先采用這樣的技術(shù)。密碼應(yīng)用現(xiàn)在面臨很多挑戰(zhàn),比如可搜索加密面臨注入攻擊,同態(tài)加密面臨密文擴(kuò)充、復(fù)雜計算效率太低等問題;再比如,現(xiàn)在國產(chǎn)數(shù)據(jù)庫還不是全部基于密碼、還做不到全密態(tài),它們很多都是用加密卡來做的,只是在硬盤存儲的時候加密。要完全解決這些問題,還需要走很長的路。

      猜你喜歡
      明文廣告主密文
      一種針對格基后量子密碼的能量側(cè)信道分析框架
      創(chuàng)新營銷新模式愛創(chuàng)榮獲第十四屆廣告主金遠(yuǎn)獎金獎
      一種支持動態(tài)更新的可排名密文搜索方案
      基于模糊數(shù)學(xué)的通信網(wǎng)絡(luò)密文信息差錯恢復(fù)
      考慮廣告主投資競爭的關(guān)鍵詞拍賣研究
      奇怪的處罰
      奇怪的處罰
      四部委明文反對垃圾焚燒低價競爭
      云存儲中支持詞頻和用戶喜好的密文模糊檢索
      鹤岗市| 兴文县| 古交市| 象山县| 隆回县| 嘉鱼县| 沙河市| 无锡市| 普格县| 安平县| 易门县| 沙洋县| 长宁县| 恭城| 星座| 内乡县| 曲松县| 庄河市| 松江区| 石柱| 蛟河市| 合阳县| 博白县| 丹棱县| 绥阳县| 津市市| 泰兴市| 宾阳县| 汤阴县| 密山市| 筠连县| 潼关县| 安泽县| 丰县| 临海市| 南康市| 呼图壁县| 巧家县| 牙克石市| 宝坻区| 北海市|