賈若飛
(中海油東方石化有限責(zé)任公司,海南 東方 572600)
現(xiàn)階段,大數(shù)據(jù)領(lǐng)域內(nèi)的數(shù)據(jù)分析與存儲能力顯著強(qiáng)化,且數(shù)據(jù)的使用價(jià)值不斷提升,保證數(shù)據(jù)安全,實(shí)施對數(shù)據(jù)的安全治理,不僅是保護(hù)數(shù)據(jù)自身安全以及使用期間的安全,同時(shí),也是保護(hù)應(yīng)用數(shù)據(jù)的實(shí)體安全。大數(shù)據(jù)在各個(gè)領(lǐng)域內(nèi)的逐漸滲透,使其商業(yè)價(jià)值日益顯現(xiàn),信息安全技術(shù)面臨著發(fā)展機(jī)遇,基于大數(shù)據(jù)生命周期展開各類安全治理技術(shù),轉(zhuǎn)變安全思維模式,實(shí)現(xiàn)數(shù)據(jù)安全治理。
從某種程度來講,數(shù)據(jù)的生命周期可以反映出數(shù)據(jù)在不同階段的變化以及發(fā)展規(guī)律,因使用目的不同,數(shù)據(jù)生命周期也會(huì)不一樣,比如,云數(shù)據(jù)生命周期。數(shù)據(jù)生命周期一般以“全過程監(jiān)管”為主,將接下來的數(shù)據(jù)流轉(zhuǎn)階段詳細(xì)劃分為準(zhǔn)備、存儲、使用以及銷毀幾個(gè)不同的階段。
數(shù)據(jù)的準(zhǔn)備階段,這是數(shù)據(jù)應(yīng)用的重要前提,其中主要涵蓋了數(shù)據(jù)的生成、篩選以及匯集等部分,該階段可有效解決數(shù)據(jù)來源過于分散的問題,滿足數(shù)據(jù)使用的多樣化要求。數(shù)據(jù)生成主要是指新數(shù)據(jù)的生產(chǎn),不管是以軟件服務(wù)為基礎(chǔ)生成了原始數(shù)據(jù),還是以現(xiàn)有數(shù)據(jù)為基礎(chǔ)生成了新數(shù)據(jù),都可以作為數(shù)據(jù)的生成過程;關(guān)于數(shù)據(jù)的篩選,主要是對數(shù)據(jù)進(jìn)行可用性選擇,未通過篩選的數(shù)據(jù)就是無用數(shù)據(jù),需要進(jìn)一步被銷毀;數(shù)據(jù)的匯集指的是更換數(shù)據(jù)存儲位置,比如,個(gè)體用戶將計(jì)算機(jī)內(nèi)的本地?cái)?shù)據(jù)上傳至云端。
在數(shù)據(jù)的使用階段,其中主要包含數(shù)據(jù)分析、數(shù)據(jù)大規(guī)模計(jì)算以及數(shù)據(jù)合作等部分,這是發(fā)揮數(shù)據(jù)使用價(jià)值的重要時(shí)期。數(shù)據(jù)的分析旨在掌握數(shù)據(jù)信息,挖掘其中價(jià)值,采取自動(dòng)化分析方法,依靠大數(shù)據(jù)模型完成分析;數(shù)據(jù)大規(guī)模計(jì)算主要是對數(shù)據(jù)的分析成果進(jìn)行部署;數(shù)據(jù)合作就是利用不同主體進(jìn)行單獨(dú)的數(shù)據(jù)任務(wù)。
在數(shù)據(jù)的存儲階段,需要將數(shù)據(jù)保存在一定存儲容器內(nèi),做好數(shù)據(jù)的隨時(shí)調(diào)用準(zhǔn)備,該時(shí)期應(yīng)加大對數(shù)據(jù)的安全保護(hù),謹(jǐn)防數(shù)據(jù)泄露。
在數(shù)據(jù)的銷毀階段,任何階段的數(shù)據(jù)都有可能被銷毀,銷毀后的數(shù)據(jù)無法再使用,如果擁有者想使用銷毀數(shù)據(jù),使用者就要給出已經(jīng)銷毀的證明。
大數(shù)據(jù)不僅數(shù)據(jù)量大且數(shù)據(jù)源眾多,且涉及的用戶和系統(tǒng)接口較多,所以大數(shù)據(jù)在應(yīng)用期間會(huì)存在較多安全問題,具體體現(xiàn)在以下幾方面:(1)敏感信息和個(gè)人隱私發(fā)生泄漏問題。由于信息管理不善,或者對數(shù)據(jù)的技術(shù)防護(hù)能力不足,系統(tǒng)受到網(wǎng)絡(luò)攻擊,導(dǎo)致信息被不法分子以非正式渠道對外披露。(2)非授權(quán)訪問與數(shù)據(jù)濫用,高級別的數(shù)據(jù)被沒有相應(yīng)訪問權(quán)限的用戶獲取。(3)數(shù)據(jù)篡改與偽造,導(dǎo)致數(shù)據(jù)的完整性遭到破壞,內(nèi)容與格式被改變,數(shù)據(jù)原有價(jià)值受到影響,甚至被用來制造虛假數(shù)據(jù),從而引發(fā)系統(tǒng)運(yùn)行異常問題。(4)數(shù)據(jù)污染,高質(zhì)量與低質(zhì)量數(shù)據(jù)被混合甚至其中混入了垃圾數(shù)據(jù),數(shù)據(jù)分析結(jié)果受到影響,特別是在人工智能與機(jī)器學(xué)習(xí)等領(lǐng)域內(nèi),數(shù)據(jù)污染將會(huì)引發(fā)系統(tǒng)形成極端分析結(jié)果。
基于大數(shù)據(jù)的數(shù)據(jù)安全治理本身就是一項(xiàng)長期且復(fù)雜的項(xiàng)目,為保證數(shù)據(jù)安全治理技術(shù)的高效落實(shí),在高效應(yīng)用相應(yīng)技術(shù)的同時(shí),有必要遵循以下基本原則:(1)合規(guī)性治理原則,即充分考慮法律法規(guī)對于數(shù)據(jù)安全保護(hù)提出的要求,開展數(shù)據(jù)安全治理活動(dòng)時(shí)必須依法合規(guī)。(2)經(jīng)濟(jì)性治理原則,安全治理雖然以確保數(shù)據(jù)使用安全為目標(biāo),所采取的措施必須考慮到業(yè)務(wù)實(shí)際情況,以最經(jīng)濟(jì)的手段達(dá)到預(yù)期防護(hù)效果。(3)完備性治理原則,數(shù)據(jù)系統(tǒng)、系統(tǒng)用戶與權(quán)限、安全事件都有著一定的生命周期,數(shù)據(jù)安全治理可以形成閉環(huán)。(4)可追溯性治理原則,依靠技術(shù)手段完成數(shù)據(jù)追溯,其中有人員操作的追溯行為和數(shù)據(jù)流轉(zhuǎn)的追溯行為,同時(shí),也包含對安全事件的追溯行為。
遵循上述治理原則,梳理其中要點(diǎn),得知數(shù)據(jù)安全治理技術(shù)的應(yīng)用涵蓋了數(shù)據(jù)、人員以及事件等各個(gè)環(huán)節(jié),各環(huán)節(jié)都要采取必要的管控措施。大數(shù)據(jù)應(yīng)用下的數(shù)據(jù)安全治理技術(shù)整體架構(gòu)如下:
(1)人員安全管控。這部分主要針對用戶即人員展開統(tǒng)一授權(quán)認(rèn)證處理,對用戶可以訪問的系統(tǒng)文件與數(shù)據(jù)庫提供安全級別,完成訪問關(guān)系映射,再對用戶的操作行為做好記錄審計(jì),對其中存在的任何異地登錄或者非授權(quán)訪問等行為予以告警。
(2)數(shù)據(jù)全生命周期安全治理。根據(jù)上文對數(shù)據(jù)生命周期的研究,其中涵蓋數(shù)據(jù)采集、傳輸、存儲、處理、使用以及銷毀等環(huán)節(jié),各環(huán)節(jié)采取的措施各不相同。在數(shù)據(jù)采集環(huán)節(jié),有必要加強(qiáng)對數(shù)據(jù)來源的驗(yàn)證,判斷數(shù)據(jù)的合法性,核對數(shù)據(jù)質(zhì)量問題,分析數(shù)據(jù)是否合規(guī),對于采集到的數(shù)據(jù)項(xiàng)完成級別判定與標(biāo)簽設(shè)置等工作;數(shù)據(jù)傳輸環(huán)節(jié),應(yīng)保證所有數(shù)據(jù)不會(huì)被惡意篡改或者被不法分子竊取,一般會(huì)使用SFTP以及Https等合理的加密協(xié)議,避免信息被泄露,或者應(yīng)用摘要算法保證數(shù)據(jù)在傳輸期間的完整。如果數(shù)據(jù)需要進(jìn)行導(dǎo)入或者導(dǎo)出操作,此時(shí),還應(yīng)對數(shù)據(jù)的提供與接收者、數(shù)據(jù)來源與去向做好溯源管理;數(shù)據(jù)存儲環(huán)節(jié),有必要做好數(shù)據(jù)的分離存儲,特別是對于敏感與非敏感性數(shù)據(jù),以及不同等級的數(shù)據(jù),需要及時(shí)被存儲于不同的區(qū)域,再使用類似SM4的密碼技術(shù)完成數(shù)據(jù)加密存儲,最后,定期對數(shù)據(jù)進(jìn)行備份測試即可;數(shù)據(jù)處理環(huán)節(jié),應(yīng)對于數(shù)據(jù)加工等操作合理授權(quán),只允許特定人員完成以上操作,處理時(shí)保證所有數(shù)據(jù)都能完成脫敏與去標(biāo)識化處理,防止信息被泄露。如果處理后的數(shù)據(jù)存在敏感性變化,此時(shí)應(yīng)重置標(biāo)簽;數(shù)據(jù)使用環(huán)節(jié),對于數(shù)據(jù)的使用需提前完成授權(quán)管理,只有符合要求的用戶進(jìn)行數(shù)據(jù)訪問操作,數(shù)據(jù)共享或者數(shù)據(jù)開放前應(yīng)完成脫敏處理,或者依靠隱私計(jì)算技術(shù)對數(shù)據(jù)完成不可見的共享;數(shù)據(jù)銷毀環(huán)節(jié),如果數(shù)據(jù)不再使用,此時(shí)應(yīng)及時(shí)銷毀,但必須要用正規(guī)的銷毀工具將數(shù)據(jù)和副本全部銷毀,最大程度上保證數(shù)據(jù)的安全。
(3)系統(tǒng)安全防護(hù)。依據(jù)網(wǎng)絡(luò)安全等級提出的保護(hù)要求,對用戶身份加以鑒別,再完成訪問控制,隨后利用接口工具進(jìn)行外聯(lián)接口的統(tǒng)一管理。依靠集中審計(jì)平臺對所有日志加以審計(jì),最后實(shí)施對安全漏洞的專項(xiàng)治理。
(4)事件分析和處置。按照事件的具體分析規(guī)則,確立預(yù)警機(jī)制,創(chuàng)建監(jiān)測預(yù)警平臺,負(fù)責(zé)對網(wǎng)絡(luò)流量、訪問與操作日志進(jìn)行監(jiān)測預(yù)警分析。與此同時(shí),還應(yīng)創(chuàng)建統(tǒng)一風(fēng)險(xiǎn)管控與安全態(tài)勢分析平臺,以便及時(shí)做好應(yīng)急處置工作。
(1)全過程監(jiān)管安全技術(shù)。這一技術(shù)的應(yīng)用主要是對數(shù)據(jù)生命周期內(nèi)的各個(gè)過程加以監(jiān)控和管理,再完成數(shù)據(jù)流轉(zhuǎn)過程的高效溯源,驗(yàn)證參與者的行為,及時(shí)做好數(shù)據(jù)安全治理形式的全局管理。在數(shù)據(jù)溯源過程中,不僅要對系統(tǒng)與應(yīng)用層的數(shù)據(jù)操作歷史全面掌握,還要了解數(shù)據(jù)的演變過程,經(jīng)過零知識證明向監(jiān)管方證明系統(tǒng)已獲得用戶許可擁有數(shù)據(jù)保護(hù)等操作,謹(jǐn)防數(shù)據(jù)隱私泄露。采用區(qū)塊鏈技術(shù),以此作為去中心化特征下的分布式賬本,完成數(shù)據(jù)存儲與傳輸,發(fā)揮區(qū)塊鏈技術(shù)的防篡改性特征,確保所有記錄內(nèi)容的可信度,再依靠態(tài)勢感知分析數(shù)據(jù)流動(dòng)的實(shí)際情況,完成數(shù)據(jù)預(yù)警,判斷在接下來一段時(shí)間內(nèi)的數(shù)據(jù)使用安全大致情況。
(2)數(shù)據(jù)使用安全技術(shù)。在數(shù)據(jù)的使用階段,此時(shí)是數(shù)據(jù)安全的最薄弱環(huán)節(jié),為發(fā)揮數(shù)據(jù)價(jià)值,需采取有效的方法,如聯(lián)邦學(xué)習(xí)與同態(tài)加密方法,使用者不會(huì)與原始數(shù)據(jù)產(chǎn)生直接接觸即可使用數(shù)據(jù),聯(lián)邦學(xué)習(xí)方法能夠解決數(shù)據(jù)孤島的問題,在節(jié)點(diǎn)不用上傳數(shù)據(jù)的情況下學(xué)習(xí)節(jié)點(diǎn)數(shù)據(jù);同態(tài)加密就是基于密文的基礎(chǔ)上完成加法與乘法運(yùn)算,解密后直接在原文處計(jì)算結(jié)果即可。采用數(shù)據(jù)分類分級操作,完成數(shù)據(jù)類別與密級的有效劃分,以便高效采取差異化操作。
(3)數(shù)據(jù)存儲與銷毀安全技術(shù)。首先,數(shù)據(jù)存儲技術(shù)的應(yīng)用旨在保護(hù)數(shù)據(jù)不被篡改與竊取,一般會(huì)防止非常規(guī)訪問,同時(shí),通過密態(tài)操作方法與存儲過程審計(jì)來強(qiáng)化數(shù)據(jù)的安全性。其次,數(shù)據(jù)分類分級與安全隔離、訪問控制等技術(shù),可指導(dǎo)數(shù)據(jù)完成差異化存儲,提高數(shù)據(jù)訪問門檻。最后,密態(tài)操作,即采用密文的形式存儲數(shù)據(jù),避免越權(quán)訪問,保證明文數(shù)據(jù)使用安全。
(1)用于隱私保護(hù)的數(shù)據(jù)安全治理。隱私保護(hù)是數(shù)據(jù)使用期間的重點(diǎn)要求,應(yīng)根據(jù)法律要求進(jìn)行數(shù)據(jù)安全治理,及時(shí)去除隱私信息,基于數(shù)據(jù)生命周期應(yīng)用數(shù)據(jù)安全技術(shù)。從去除隱私信息角度入手,通過數(shù)據(jù)匿名化與數(shù)據(jù)脫敏等操作,應(yīng)用數(shù)據(jù)掩蔽工具的脫敏模塊達(dá)到脫敏需要,國內(nèi)可使用SIMP-SDM進(jìn)行脫敏處理。
(2)用于數(shù)據(jù)采集與存儲環(huán)節(jié)的數(shù)據(jù)安全治理。使用VPN技術(shù)解決數(shù)據(jù)在傳輸方面的安全問題,確保數(shù)據(jù)的機(jī)密性與真實(shí)性,聯(lián)合密碼技術(shù)與隧道技術(shù),從源頭端與目的端入手,以虛擬化數(shù)據(jù)傳輸專用通道,對源頭數(shù)據(jù)加密封裝,再將其嵌入另一協(xié)議數(shù)據(jù)報(bào)文內(nèi),使其被偽裝為普通的數(shù)據(jù)報(bào)文。目前市場上常見的VPN技術(shù)使用的協(xié)議主要有Ipsec協(xié)議與SSL協(xié)議兩種。利用VPN通道將數(shù)據(jù)傳輸?shù)侥康亩?,相?yīng)的存儲系統(tǒng)先解密數(shù)據(jù)才能存儲數(shù)據(jù),采用明文的存儲形式時(shí)容易受到攻擊,因此,這部分?jǐn)?shù)據(jù)也要做好加密處理,如應(yīng)用存儲加密技術(shù),按照數(shù)據(jù)的類型和加密機(jī)制,選擇靜態(tài)或動(dòng)態(tài)加密方式。為避免遇到事故,數(shù)據(jù)存儲系統(tǒng)應(yīng)做好備份和恢復(fù)工作,對存儲好的數(shù)據(jù)建立備份機(jī)制,避免數(shù)據(jù)意外丟失,啟用恢復(fù)裝置即可完善數(shù)據(jù)。支持異地備份、數(shù)據(jù)鏡像以及Raid備份等措施,可使用Hadoop下的HDFS備份與恢復(fù)工作機(jī)制,為數(shù)據(jù)確立容災(zāi)備份。
(3)用于數(shù)據(jù)分析的數(shù)據(jù)安全治理。做好身份認(rèn)證,及時(shí)確認(rèn)用戶身份,辨別其真實(shí)身份,再根據(jù)用戶認(rèn)證信息完成機(jī)密數(shù)據(jù)、特定信息以及人體生物特征信息的認(rèn)證。完成訪問控制,這是數(shù)據(jù)安全保護(hù)的關(guān)鍵,對不同的用戶指定特定的控制策略,為用戶授予相應(yīng)的訪問級別,在訪問重要資源時(shí),必須制定嚴(yán)格的訪問控制策略,同時(shí)綜合自主訪問、強(qiáng)制訪問、基于角色的訪問控制等方式。
(4)用于數(shù)據(jù)發(fā)布的數(shù)據(jù)安全治理。大數(shù)據(jù)在經(jīng)過數(shù)據(jù)分析與處理后將會(huì)進(jìn)入發(fā)布環(huán)節(jié),這是指數(shù)據(jù)公開使用的階段,數(shù)據(jù)的安全性至關(guān)重要,有必要在數(shù)據(jù)正式發(fā)布前做好數(shù)據(jù)的審核分析,保證所有輸出數(shù)據(jù)的保密性。整個(gè)數(shù)據(jù)發(fā)布環(huán)節(jié),需要采取以下數(shù)據(jù)安全治理工作:①數(shù)據(jù)安全審計(jì),這是指按照采集的安全大數(shù)據(jù),經(jīng)過評估與審查后尋找其中的安全隱患,再通過審核稽查,找出事故發(fā)生的原因,以此做出有效處理。數(shù)據(jù)發(fā)布時(shí),應(yīng)選擇相應(yīng)的安全審計(jì)方案,比如,采用日志審計(jì)技術(shù)、網(wǎng)絡(luò)監(jiān)聽審計(jì)技術(shù)或者網(wǎng)關(guān)審計(jì)技術(shù),確保數(shù)據(jù)發(fā)布的安全性。②數(shù)據(jù)溯源,即對大數(shù)據(jù)的應(yīng)用周期做出標(biāo)記定位,一旦遇到數(shù)據(jù)故障問題,應(yīng)及時(shí)定位責(zé)任人員,采取標(biāo)注法或者反向查詢法進(jìn)行數(shù)據(jù)溯源。③防范APT攻擊,這種數(shù)據(jù)攻擊主要是攻擊者采用物聯(lián)網(wǎng)等途徑實(shí)施攻擊行為,從而竊取目標(biāo)信息,或者選擇駐留在內(nèi)部網(wǎng)絡(luò)后尋找進(jìn)一步的攻擊機(jī)會(huì)。在APT攻擊檢測時(shí),可選擇沙箱方案完成異常檢測,再經(jīng)過全流量審計(jì),基于深層協(xié)議進(jìn)行異常情況的有效識別,為接下來的攻擊溯源創(chuàng)造有利條件。
總而言之,現(xiàn)階段各個(gè)領(lǐng)域加大了對大數(shù)據(jù)應(yīng)用的重視程度,大數(shù)據(jù)的使用與安全治理問題日益突出。根據(jù)數(shù)據(jù)的生命周期情況,了解數(shù)據(jù)質(zhì)量現(xiàn)狀,遵循相應(yīng)治理原則,完善數(shù)據(jù)安全治理技術(shù)架構(gòu),加強(qiáng)隱私保護(hù),實(shí)現(xiàn)用戶身份認(rèn)證,對不同的數(shù)據(jù)采取適當(dāng)?shù)拇鎯εc備份、恢復(fù)方式,全方位保護(hù)數(shù)據(jù)應(yīng)用安全。