• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      大數(shù)據(jù)環(huán)境下的隱私保護(hù)問(wèn)題評(píng)估分析

      2017-11-20 21:46:17白萍夏輝杜慶東
      電腦知識(shí)與技術(shù) 2017年27期
      關(guān)鍵詞:隱私保護(hù)大數(shù)據(jù)評(píng)估

      白萍+夏輝+杜慶東

      摘要:人類已步入大數(shù)據(jù)時(shí)代,大數(shù)據(jù)時(shí)代下的商業(yè)價(jià)值較高,通過(guò)實(shí)現(xiàn)對(duì)大數(shù)據(jù)的挖掘及分析,能夠得到具有較高經(jīng)濟(jì)利益及價(jià)值的數(shù)據(jù)。在大數(shù)據(jù)技術(shù)不斷進(jìn)步的過(guò)程中,企業(yè)能夠在個(gè)人不知情或者無(wú)法控制的情況下對(duì)個(gè)人數(shù)據(jù)進(jìn)行收集及分析并且使用。在沒(méi)有通過(guò)用戶允許的情況下獲得個(gè)人數(shù)據(jù)的行為對(duì)個(gè)人隱私進(jìn)行了侵犯,所以目前人們?cè)诖髷?shù)據(jù)環(huán)境下對(duì)于個(gè)人的隱私保護(hù)問(wèn)題越來(lái)越擔(dān)心,隱私問(wèn)題也得到了人們的廣泛關(guān)注,國(guó)內(nèi)外的企業(yè)及政府在隱私保護(hù)方面也進(jìn)行了全新的研究及嘗試。在此背景下,該文就對(duì)大數(shù)據(jù)中的隱私保護(hù)問(wèn)題進(jìn)行全面的研究。

      關(guān)鍵詞:大數(shù)據(jù);隱私保護(hù);評(píng)估

      中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2017)27-0001-02

      在網(wǎng)絡(luò)技術(shù)和通信技術(shù)不斷成熟,并且網(wǎng)絡(luò)通信帶寬不斷增加的過(guò)程中,大量的客戶信息、醫(yī)療信息、交易信息等和個(gè)人隱私相關(guān)的信息都通過(guò)電子化的方式進(jìn)行存儲(chǔ)及管理,以此成為了大數(shù)據(jù)系統(tǒng),現(xiàn)代相應(yīng)學(xué)術(shù)界對(duì)于大數(shù)據(jù)的分析使用及深入挖掘的研究,并且得到了一定的研究成果。但是因?yàn)榇髷?shù)據(jù)分析及整合使用的研究使大數(shù)據(jù)問(wèn)題被人們所重視,尤其是個(gè)人數(shù)據(jù)隱私保護(hù)問(wèn)題,其是大數(shù)據(jù)研究過(guò)程中的重點(diǎn)內(nèi)容。比如數(shù)據(jù)庫(kù)服務(wù)層的安全隱私保護(hù)與數(shù)據(jù)完整性、機(jī)密性方面問(wèn)題,隱私保護(hù)查詢和訪問(wèn)控制問(wèn)題等。在此背景下,隱私保護(hù)數(shù)據(jù)挖掘也成了全新的研究方向,人們也逐漸提出了全新的隱私保護(hù)數(shù)據(jù)挖掘的方法?,F(xiàn)代大部分的隱私保護(hù)數(shù)據(jù)挖掘都是在分布式環(huán)境中使用,但是還是存在保護(hù)程度較低、計(jì)算量較大及通信造價(jià)較高的問(wèn)題。那么本文就面向分布式情況下,研究隱私數(shù)據(jù)的挖掘及保護(hù)。

      1 隱私保護(hù)數(shù)據(jù)挖掘的方法

      在數(shù)據(jù)挖掘技術(shù)不斷發(fā)展的過(guò)程中,其中的隱私問(wèn)題也備受人們的關(guān)注,隱私泄露會(huì)導(dǎo)致個(gè)人人身及財(cái)產(chǎn)安全出現(xiàn)威脅,那么如何保證數(shù)據(jù)挖掘的精準(zhǔn)度,并且對(duì)數(shù)據(jù)敏感信息進(jìn)行有效保護(hù)是現(xiàn)代研究人員需要考慮的問(wèn)題,其主要目的是使用某項(xiàng)技術(shù)對(duì)原始數(shù)據(jù)進(jìn)行修改和加密,導(dǎo)致數(shù)據(jù)在通過(guò)挖掘之后不會(huì)被泄露[1],其主要方式包括:

      其一,數(shù)據(jù)分布。根據(jù)數(shù)據(jù)分布的方式將隱私數(shù)據(jù)保護(hù)技術(shù)分為集中式及分布式兩種,集中式數(shù)據(jù)是指所有的數(shù)據(jù)都在一個(gè)站點(diǎn)中集中。分布式又分為水平及垂直兩種劃分方式,水平劃分指的是數(shù)據(jù)在多站點(diǎn)中,不同站點(diǎn)包括部分屬性的記錄。垂直劃分指的是數(shù)據(jù)在多站點(diǎn)中,不同站點(diǎn)記錄所有屬性。

      其二,數(shù)據(jù)修改。數(shù)據(jù)修改指的是將原來(lái)的原始數(shù)據(jù)的值進(jìn)行修改,主要包括擾動(dòng)、取樣、阻塞、聚合及交換。

      其三,數(shù)據(jù)挖掘算法。主要包括分類、聚類、關(guān)聯(lián)規(guī)則挖掘及決策樹,是通過(guò)不同數(shù)據(jù)挖掘算法進(jìn)行分類。

      其四,隱私保護(hù)。主要包括基于重建、基于加密及基于啟發(fā)式三種技術(shù)。

      其五,隱私保護(hù)對(duì)象。即對(duì)敏感的規(guī)則及數(shù)據(jù)進(jìn)行隱藏[2]。

      圖1為敏感數(shù)據(jù)的隱藏模型。目前使用較多的技術(shù)為敏感數(shù)據(jù)隱藏、數(shù)據(jù)擾動(dòng)技術(shù)和安全計(jì)算等,數(shù)據(jù)擾動(dòng)技術(shù)是在數(shù)據(jù)公布之前對(duì)其進(jìn)行改變,從而使其偽裝成敏感數(shù)據(jù),并且將其中的屬性進(jìn)行部分保留,其主要目的是攻擊人員無(wú)法得到敏感信息,從而有效提高數(shù)據(jù)挖掘結(jié)果和原始數(shù)據(jù)結(jié)果的精準(zhǔn)度[3]。

      2 分布式數(shù)據(jù)挖掘

      在計(jì)算技術(shù)及通信技術(shù)不斷發(fā)展及進(jìn)步的過(guò)程中,數(shù)據(jù)的數(shù)量也在不斷地增長(zhǎng),但是大部分?jǐn)?shù)據(jù)都是在不同場(chǎng)所進(jìn)行存儲(chǔ),以此提高了分布式存儲(chǔ)數(shù)據(jù)對(duì)數(shù)據(jù)模型尋找的需求,分布式數(shù)據(jù)挖掘指的是對(duì)不同場(chǎng)所的數(shù)據(jù)進(jìn)行挖掘。在分布式數(shù)據(jù)挖掘中,各方都貢獻(xiàn)自己的數(shù)據(jù),從而能夠通過(guò)合并數(shù)據(jù)對(duì)模型進(jìn)行完善。為了能夠得到全面的數(shù)據(jù)模型,那么要求分布式數(shù)據(jù)挖掘?qū)Σ煌瑓^(qū)域中的問(wèn)題進(jìn)行解決[4]。

      在數(shù)據(jù)挖掘中,能夠根據(jù)數(shù)據(jù)分布將其分為集中式和分布式,分布式數(shù)據(jù)挖掘就是在分布式數(shù)據(jù)環(huán)境中使用的技術(shù),是數(shù)據(jù)挖掘方面的主要內(nèi)容,分為水平及垂直兩種分布方式,其中的數(shù)據(jù)表集合為全局?jǐn)?shù)據(jù)表。參與方在分布式數(shù)據(jù)挖掘中要求自身數(shù)據(jù)不被共享,因?yàn)楸┞稊?shù)據(jù)就表示隱私被暴露,自身利益會(huì)受到威脅。所以傳統(tǒng)集中式的隱私保護(hù)挖掘在分布式環(huán)境中已經(jīng)不使用,被現(xiàn)代面向分布式的數(shù)據(jù)挖掘隱私保護(hù)替代,其主要優(yōu)點(diǎn)為:其數(shù)據(jù)擁有者較多,能夠通過(guò)消息實(shí)現(xiàn)信息傳遞;站點(diǎn)資源受到限制;數(shù)據(jù)存在敏感信息。在分布式數(shù)據(jù)挖掘中的衡量指標(biāo)為通信量,部分面向分布式的隱私保護(hù)都要降低通信次數(shù),在分布式環(huán)境中將站點(diǎn)信息傳送到其他站點(diǎn),比如直接傳輸、網(wǎng)絡(luò)傳輸?shù)萚5]。

      3 面向Hadoop的數(shù)據(jù)挖掘平臺(tái)

      3.1 數(shù)據(jù)挖掘的步驟

      數(shù)據(jù)挖掘會(huì)在不同領(lǐng)域中展現(xiàn)出不同的流程,不同數(shù)據(jù)挖掘技術(shù)的特性及使用步驟都各不相同,從而導(dǎo)致數(shù)據(jù)挖掘存在一定的差異。所以,數(shù)據(jù)挖掘過(guò)程中的形式化、標(biāo)準(zhǔn)化及系統(tǒng)化具有重要的作用,圖2為一般數(shù)據(jù)挖掘步驟。

      3.2 數(shù)據(jù)挖掘模型

      面向Hadoop數(shù)據(jù)挖掘平臺(tái)是在傳統(tǒng)數(shù)據(jù)挖掘基礎(chǔ)上使用云計(jì)算平臺(tái)實(shí)現(xiàn)算法,以此進(jìn)行并行化的數(shù)據(jù)挖掘算法,其主要優(yōu)點(diǎn)為提高了數(shù)據(jù)處理的規(guī)模;具有良好的擴(kuò)展性;具有較強(qiáng)的容錯(cuò)計(jì)算性等[6]。

      3.2.1 平臺(tái)結(jié)構(gòu)

      平臺(tái)是以Hadoop為基礎(chǔ),使用自頂向下的方式實(shí)現(xiàn),頂層是業(yè)務(wù)應(yīng)用平臺(tái),其主要目的為用戶和系統(tǒng)的相互交互,中間層是數(shù)據(jù)挖掘平臺(tái),包括數(shù)據(jù)挖掘及預(yù)處理模塊。圖3為基于Hadoop的數(shù)據(jù)平臺(tái)。

      3.2.2 平臺(tái)模塊

      底層:分布式計(jì)算層,主要包括并行編程環(huán)境、HDFS及分布式系統(tǒng)管理。并行編程環(huán)境中包括編程環(huán)境,其能夠根據(jù)需求實(shí)現(xiàn)程序的開發(fā),并且還具有任務(wù)執(zhí)行及調(diào)試的功能;HDFS可存儲(chǔ)分布式文件,并且具有較高的可靠性及穩(wěn)定性;分布式管理系統(tǒng)能夠?qū)ζ脚_(tái)的系統(tǒng)進(jìn)行管理。

      中間層:數(shù)據(jù)挖掘平臺(tái)層,主要對(duì)數(shù)據(jù)挖掘的進(jìn)度進(jìn)行調(diào)度;處理源數(shù)據(jù),對(duì)噪聲進(jìn)行清除,從而得到合法的挖掘數(shù)據(jù);在對(duì)平臺(tái)提交任務(wù)之后就能夠進(jìn)行計(jì)算,然后得到結(jié)果,并且對(duì)計(jì)算結(jié)果進(jìn)行反饋。endprint

      頂層:業(yè)務(wù)應(yīng)用層,其主要目的就是實(shí)現(xiàn)應(yīng)用程序的編寫。

      3.3 數(shù)據(jù)項(xiàng)訪問(wèn)控制模型

      3.3.1 大數(shù)據(jù)中的數(shù)據(jù)訪問(wèn)控制

      在實(shí)際應(yīng)用過(guò)程中,系統(tǒng)訪問(wèn)控制主要包括業(yè)務(wù)邏輯層和功能性的訪問(wèn)控制,如果業(yè)務(wù)系統(tǒng)中的用戶具備查詢的權(quán)限,就能夠通過(guò)功能訪問(wèn)控制實(shí)現(xiàn)授權(quán),但是只是能夠?qū)芾碛脩粜畔⑦M(jìn)行查詢,此種訪問(wèn)控制通過(guò)業(yè)務(wù)邏輯實(shí)現(xiàn)。如果業(yè)務(wù)允許用戶能夠從管理用戶信息進(jìn)行權(quán)限的修改,那么就能夠通過(guò)數(shù)據(jù)項(xiàng)訪問(wèn)控制模型進(jìn)行實(shí)現(xiàn)。數(shù)據(jù)項(xiàng)的操作屬性為:讀取權(quán)限,也就是用戶是否具有數(shù)據(jù)項(xiàng)的讀取權(quán)限;修改權(quán)限,對(duì)記錄中的數(shù)據(jù)項(xiàng)是否存在權(quán)限修改,比如數(shù)據(jù)值及數(shù)據(jù)項(xiàng);輸入約束,在用戶有權(quán)修改的時(shí)候,其范圍級(jí)別要受到政府的約束,但是對(duì)于特殊人員并沒(méi)有此突破,也是需要特殊權(quán)限人員進(jìn)行操作;修改實(shí)效,也就是數(shù)據(jù)項(xiàng)記錄修改需要滿足某時(shí)間需求,比如社保中業(yè)務(wù)需要變更的時(shí)候要在固定時(shí)間段實(shí)現(xiàn),其他時(shí)間不能夠進(jìn)行修改[7]。

      3.3.2 訪問(wèn)控制模型

      訪問(wèn)控制模型主要包括數(shù)據(jù)項(xiàng)、權(quán)限、角色及用戶四種模型,詳見圖4。

      4 大數(shù)據(jù)信息系統(tǒng)數(shù)據(jù)的挖掘保護(hù)應(yīng)用

      以社保數(shù)據(jù)為例,社保系統(tǒng)是我國(guó)政府中最主要的大數(shù)據(jù)業(yè)務(wù)之一,其具有大數(shù)據(jù)的特點(diǎn),并且涉及的范圍較廣,具有較為復(fù)雜的業(yè)務(wù)邏輯,并且其中的數(shù)據(jù)量也較多,根據(jù)法律法規(guī)數(shù)據(jù)保存的周期較長(zhǎng)。社保業(yè)務(wù)涉及個(gè)人及企業(yè)的收入和支出等一系列的生產(chǎn)活動(dòng)數(shù)據(jù),不管是對(duì)于個(gè)人還是企業(yè),都具有隱私保護(hù)及機(jī)密的職責(zé),要在業(yè)務(wù)管理及操作過(guò)程中進(jìn)行嚴(yán)格保護(hù)及控制。比如某社保系統(tǒng)具有三千多張基表、上百個(gè)存儲(chǔ)過(guò)程、三年數(shù)據(jù)量超過(guò)5TB,每分鐘業(yè)務(wù)交易量為兩萬(wàn)。在大數(shù)據(jù)環(huán)境中是否增加業(yè)務(wù)系統(tǒng)功能需要全面考慮性能及工作量維護(hù)方面的問(wèn)題。數(shù)據(jù)挖掘平臺(tái)在對(duì)系統(tǒng)效率不影響的基礎(chǔ)上對(duì)數(shù)據(jù)項(xiàng)保護(hù)有了全新的方法,比如在權(quán)限模型中,如果為小型約束控制,將date類型修改成char,從而能夠有效提高系統(tǒng)的性能。在某業(yè)務(wù)邏輯根據(jù)功能空間角色得到數(shù)據(jù)之后,再通過(guò)此用戶數(shù)據(jù)訪問(wèn)控制內(nèi)容過(guò)濾服務(wù)器數(shù)據(jù)之后,應(yīng)用界面功能根據(jù)返回值控制界面。在此系統(tǒng)中使用統(tǒng)一類調(diào)用的方法控制數(shù)據(jù)項(xiàng)訪問(wèn)[8],圖5為數(shù)據(jù)處理流程。

      5 結(jié)束語(yǔ)

      本文提出的大數(shù)據(jù)環(huán)境下隱私保護(hù)平臺(tái)能夠?qū)崿F(xiàn)業(yè)務(wù)操作的精細(xì)管理,保證數(shù)據(jù)訪問(wèn)的安全性,使信息復(fù)雜度有了進(jìn)一步的降低。在某社保系統(tǒng)中使用表示,其不會(huì)影響系統(tǒng)性能,并且具有較高的維護(hù)性。但是因?yàn)閿?shù)據(jù)較多,用戶復(fù)雜,此種系統(tǒng)在使用平臺(tái)過(guò)程中的過(guò)濾效率及認(rèn)證權(quán)限是接下來(lái)研究的重點(diǎn)內(nèi)容 。

      參考文獻(xiàn):

      [1] 趙慧瓊, 姜強(qiáng), 趙蔚. 大數(shù)據(jù)學(xué)習(xí)分析的安全與隱私保護(hù)研究[J]. 現(xiàn)代教育技術(shù), 2016, 26(3):5-11.

      [2] 王冬, 李文, 徐高升等. 一種大數(shù)據(jù)環(huán)境下的數(shù)據(jù)隱私保護(hù)策略及其實(shí)踐[J]. 微型電腦應(yīng)用, 2013, 30(6):6-8.

      [3] 柯臻軒, 余露蕓, 郭志勇. 大數(shù)據(jù)時(shí)代下個(gè)人隱私保護(hù)的調(diào)研分析[J]. 經(jīng)濟(jì)研究導(dǎo)刊, 2015(2):299-301.

      [4] 陳鶴群. 大數(shù)據(jù)環(huán)境下醫(yī)療數(shù)據(jù)隱私保護(hù)面臨的挑戰(zhàn)及相關(guān)技術(shù)梳理[J]. 電子技術(shù)與軟件工程, 2014(16):51-53.

      [5] 廖辰剛, 張莉娜, LiaoChengang,等. 大數(shù)據(jù)條件下圖書館用戶情景敏感服務(wù)隱私保護(hù)問(wèn)題探析[J]. 圖書館工作與研究, 2016, 1(2):41-43.

      [6] 劉洪偉, 劉智慧, 朱慧,等. 大數(shù)據(jù)環(huán)境下跨組織間協(xié)同優(yōu)化決策的隱私保護(hù)算法[J]. 廣東工業(yè)大學(xué)學(xué)報(bào), 2014(3):21-26.

      [7] 黃尤江, 賀蓮,蘇煥群,等. 醫(yī)療大數(shù)據(jù)的應(yīng)用及其隱私保護(hù)[J]. 中華醫(yī)學(xué)圖書情報(bào)雜志, 2015, 24(9):43-45.

      [8] 仝偉,毛云龍,陳慶軍,等. 抗大數(shù)據(jù)分析的隱私保護(hù):研究現(xiàn)狀與進(jìn)展[J]. 網(wǎng)絡(luò)與信息安全學(xué)報(bào), 2016, 2(4):44-55.endprint

      猜你喜歡
      隱私保護(hù)大數(shù)據(jù)評(píng)估
      大數(shù)據(jù)環(huán)境下用戶信息隱私泄露成因分析和保護(hù)對(duì)策
      大數(shù)據(jù)安全與隱私保護(hù)的必要性及措施
      社交網(wǎng)絡(luò)中的隱私關(guān)注及隱私保護(hù)研究綜述
      大數(shù)據(jù)時(shí)代的隱私保護(hù)關(guān)鍵技術(shù)研究
      基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
      科技視界(2016年20期)2016-09-29 10:53:22
      評(píng)估依據(jù)
      立法后評(píng)估:且行且盡善
      浙江人大(2014年5期)2014-03-20 16:20:25
      最終評(píng)估
      EMA完成對(duì)尼美舒利的評(píng)估
      县级市| 鄂尔多斯市| 眉山市| 金坛市| 衡阳县| 阳东县| 通州区| 建瓯市| 淅川县| 平昌县| 西贡区| 达州市| 团风县| 健康| 五指山市| 鸡西市| 大新县| 平潭县| 博爱县| 宁国市| 准格尔旗| 赤壁市| 阆中市| 健康| 蕲春县| 安塞县| 高邑县| 唐河县| 潜山县| 昌都县| 纳雍县| 恭城| 黄大仙区| 永登县| 石棉县| 抚顺市| 沙坪坝区| 华坪县| 乌拉特前旗| 德州市| 涿州市|