嚴(yán) 敏 何 慶
(中國(guó)移動(dòng)通信集團(tuán)南方基地IT支撐中心運(yùn)營(yíng)分析室 廣州 510640)
在當(dāng)今的信息時(shí)代,信息具有越來越大的價(jià)值,移動(dòng)互聯(lián)網(wǎng)的到來促進(jìn)了信息交流溝通的靈活便捷,同時(shí),也帶來了敏感信息、隱私信息泄露的風(fēng)險(xiǎn).面對(duì)較高價(jià)值的數(shù)據(jù)、較多的信息獲取通道而相對(duì)較低的獲取成本,非法活動(dòng)無孔不入.調(diào)査數(shù)據(jù)反映內(nèi)部是泄露敏感信息的短板,除了財(cái)務(wù)上的損失,更嚴(yán)重的是一些數(shù)據(jù)泄密事件給企業(yè)造成了惡劣的聲譽(yù)和社會(huì)影響.
這樣的背景之下,運(yùn)營(yíng)商對(duì)客戶敏感信息的管控得到前所未有的關(guān)注,這關(guān)系到運(yùn)營(yíng)商的業(yè)務(wù)是否可以順利的開展,能否留住優(yōu)質(zhì)用戶,新興增值業(yè)務(wù)是否有安全保障,也關(guān)系到廣大用戶的隱私安全[1].雖然三大運(yùn)營(yíng)商近幾年來都持續(xù)地開展了許多網(wǎng)絡(luò)安全建設(shè),投資了大量的網(wǎng)絡(luò)安全設(shè)備,但是針對(duì)客戶敏感信息保護(hù)這一視點(diǎn)的管理思路和安全辦法仍需要不斷提高.我國(guó)運(yùn)營(yíng)商的發(fā)展和建設(shè)迫切需要一套完善的客戶敏感信息管控體系來保駕護(hù)航.
通信運(yùn)營(yíng)商因?yàn)橥ㄐ胚\(yùn)營(yíng)的責(zé)任和使命決定了其業(yè)務(wù)支撐應(yīng)用系統(tǒng)(IT支撐系統(tǒng))承載了大量的客戶信息、生產(chǎn)數(shù)據(jù)和運(yùn)營(yíng)決策數(shù)據(jù)等企業(yè)敏感信息.其中與客戶相關(guān)的敏感信息指用戶向運(yùn)營(yíng)商各級(jí)公司提供的用戶相關(guān)的各種信息,以及用戶在使用運(yùn)營(yíng)商通信服務(wù)的過程中產(chǎn)生的各種通信記錄和消費(fèi)記錄等非通信內(nèi)容.這些信息被竊取或纂改會(huì)對(duì)客戶隱私、公司利益、公司聲譽(yù)帶來安全隱患.
國(guó)內(nèi)運(yùn)營(yíng)商敏感信息作為運(yùn)營(yíng)商核心的無形資產(chǎn),不但關(guān)系著運(yùn)營(yíng)商的業(yè)務(wù)推廣、市場(chǎng)開拓、客戶滿意度,一旦遭到泄露和公開還會(huì)導(dǎo)致企業(yè)信譽(yù)品牌受到重創(chuàng).目前國(guó)內(nèi)運(yùn)營(yíng)商的客戶敏感信息現(xiàn)狀令人堪憂.
敏感信息的存儲(chǔ)位置多,流轉(zhuǎn)鏈條長(zhǎng),涉及眾多系統(tǒng),雖然己經(jīng)意識(shí)到敏感信息泄露的嚴(yán)重現(xiàn)狀,但保護(hù)企業(yè)客戶信息和敏感數(shù)據(jù)的安全,一直以來也是安全業(yè)界的難點(diǎn).近年來,國(guó)內(nèi)電信運(yùn)營(yíng)商在安全建設(shè)方面做了很多工作,但針對(duì)敏感信息防護(hù)的安全手段局部,敏感信息安全仍然存在諸多問題亟待解決.例如敏感信息的存儲(chǔ)地點(diǎn)、訪問途徑、風(fēng)險(xiǎn)點(diǎn)梳理起來工作量巨大,面臨大數(shù)據(jù)分析的難題和瓶頸.能夠接觸到敏感信息的人眾多,有內(nèi)部人員、代維人員、系統(tǒng)開發(fā)廠家等,信息安全的管理觸及人員多,推進(jìn)難度大.隨著時(shí)間的推移,運(yùn)營(yíng)商IT系統(tǒng)有意無意地被很多人了解,這里面不乏心懷不軌者,而IT系統(tǒng)面臨的黑客安全攻擊則更隱蔽、更趨利、手段更多.
1.3.1結(jié)合運(yùn)營(yíng)商大數(shù)據(jù)平臺(tái)分層架構(gòu),識(shí)別信息生命周期的安全風(fēng)險(xiǎn)[2]
大數(shù)據(jù)平臺(tái)的分層架構(gòu),反映了信息的生命周期階段特征[3],如圖1所示:
圖1 敏感數(shù)據(jù)生命周期
1) 數(shù)據(jù)采集層對(duì)應(yīng)于信息的收集和傳輸,需重點(diǎn)關(guān)注數(shù)據(jù)的可靠性保證和數(shù)據(jù)通信安全;
2) 數(shù)據(jù)存儲(chǔ)處理層對(duì)應(yīng)于信息的存儲(chǔ)、挖掘和歸檔,側(cè)重于數(shù)據(jù)的保密性和完整性保證;
3) 數(shù)據(jù)服務(wù)層對(duì)應(yīng)于信息的使用和共享,強(qiáng)調(diào)數(shù)據(jù)的保密性和可用性保證;
4) 數(shù)據(jù)應(yīng)用層對(duì)應(yīng)于信息的銷毀,重點(diǎn)是數(shù)據(jù)訪問安全.
1.3.2基于運(yùn)營(yíng)商大數(shù)據(jù)平臺(tái)分層架構(gòu),實(shí)現(xiàn)對(duì)敏感信息的保護(hù)[4]
針對(duì)每種敏感信息保護(hù)技術(shù)的特點(diǎn)和適用場(chǎng)景,本文設(shè)計(jì)了一種基于運(yùn)營(yíng)商大數(shù)據(jù)平臺(tái)架構(gòu)的敏感數(shù)據(jù)保護(hù)方式,如圖2所示.
圖2 大數(shù)據(jù)平臺(tái)敏感數(shù)據(jù)架構(gòu)
1) 數(shù)據(jù)采集層的傳輸數(shù)據(jù)加密/解密;
2) 數(shù)據(jù)存儲(chǔ)處理層的數(shù)據(jù)失真處理;
3) 數(shù)據(jù)服務(wù)層的數(shù)據(jù)匿名化限制發(fā)布;
4) 數(shù)據(jù)應(yīng)用層的數(shù)據(jù)審計(jì)監(jiān)控;
5) 貫穿各層的敏感信息元數(shù)據(jù)管理.
敏感數(shù)據(jù)分布范圍廣、訪問操作頻繁,通過多種視圖綜合呈現(xiàn)敏感數(shù)據(jù)在大數(shù)據(jù)平臺(tái)中的存儲(chǔ)、流轉(zhuǎn)、操作,訪問等情況,形成可定制的管控視圖,展現(xiàn)大數(shù)據(jù)全生命周期管控過程.
圖3 大數(shù)據(jù)平臺(tái)敏感數(shù)據(jù)監(jiān)控應(yīng)用
1.4.1敏感信息資產(chǎn)分布監(jiān)控試圖
在咨詢和信息收集過程中,已經(jīng)基本上把包含敏感信息的主機(jī)、數(shù)據(jù)庫(kù)等資產(chǎn)情況摸清.但是,資產(chǎn)信息并不是一成不變的,隨著業(yè)務(wù)的變化和業(yè)務(wù)系統(tǒng)的變更,存儲(chǔ)敏感信息的資產(chǎn)會(huì)動(dòng)態(tài)變化.為了更好地監(jiān)控敏感信息資產(chǎn)的變動(dòng)情況,我們需要建設(shè)一套敏感信息資產(chǎn)監(jiān)控系統(tǒng),用于主動(dòng)探測(cè)敏感信息資產(chǎn)的動(dòng)態(tài)更新情況,以保證在敏感信息分級(jí)和監(jiān)控中的準(zhǔn)確性和有效性.系統(tǒng)界面如圖3所示.
該系統(tǒng)是為了監(jiān)控敏感數(shù)據(jù)在其生命周期中的使用、存儲(chǔ)環(huán)節(jié),對(duì)敏感數(shù)據(jù)在使用、存儲(chǔ)過程中不斷發(fā)生的變化進(jìn)行防護(hù),防止敏感數(shù)據(jù)在存儲(chǔ)載體中被泄露的可能[5].主要包含以下幾個(gè)步驟:
1) 數(shù)據(jù)資產(chǎn)搜集;
2) 資產(chǎn)主動(dòng)掃描、被動(dòng)發(fā)現(xiàn);
3) 資產(chǎn)人工導(dǎo)入.
1.4.2數(shù)據(jù)安全合規(guī)性檢查
為了更好地保護(hù)敏感信息,在敏感信息創(chuàng)建過程中必須進(jìn)行安全管控.敏感數(shù)據(jù)安全合規(guī)性檢查,是在各業(yè)務(wù)支撐系統(tǒng)的敏感數(shù)據(jù)創(chuàng)建、導(dǎo)出等過程中的防護(hù),對(duì)創(chuàng)建和導(dǎo)出轉(zhuǎn)移的數(shù)據(jù)進(jìn)行模糊化處理.
1) 數(shù)據(jù)安全合規(guī)管理;
2) 數(shù)據(jù)取樣規(guī)則管理;
3) 模糊化規(guī)則管理;
4) 模糊化核查策略管理;
5) 數(shù)據(jù)安全合規(guī)檢查.
1.4.3敏感數(shù)據(jù)等級(jí)分布詳請(qǐng)
為了解決包含敏感信息的敏感數(shù)據(jù)在存儲(chǔ)、使用、流轉(zhuǎn)過程中的泄密途徑,需要對(duì)敏感數(shù)據(jù)的詳細(xì)分布情況進(jìn)行記錄和查詢監(jiān)控,系統(tǒng)界面如圖4所示.保證數(shù)據(jù)在創(chuàng)建之后的存儲(chǔ)、使用、歸檔直至銷毀都是處于加密的狀態(tài)下進(jìn)行的.
圖4 大數(shù)據(jù)平臺(tái)敏感數(shù)據(jù)展示
1.4.4敏感數(shù)據(jù)操作日志分析
需要分析出不同數(shù)據(jù)庫(kù)產(chǎn)生的敏感數(shù)據(jù)操作類標(biāo)準(zhǔn)日志,通過對(duì)日志相關(guān)屬性如日志類型、操作對(duì)象、操作命令、時(shí)間、源IP、目的IP等進(jìn)行多維、綜合關(guān)聯(lián)分析,輸出敏感數(shù)據(jù)[6].
收集敏感數(shù)據(jù)源信息,確認(rèn)敏感數(shù)據(jù)傳播擴(kuò)散起始點(diǎn),收集的數(shù)據(jù)源信息包括敏感數(shù)據(jù)源設(shè)備類型、數(shù)據(jù)源IP、訪問方式、解密腳本等.
獲取所有敏感數(shù)據(jù)對(duì)象,保存至敏感數(shù)據(jù)對(duì)象列表SL中.敏感數(shù)據(jù)對(duì)象信息包括敏感數(shù)據(jù)源IP、敏感數(shù)據(jù)名稱、敏感數(shù)據(jù)操作語句、敏感數(shù)據(jù)生成時(shí)間等.
遍歷敏感數(shù)據(jù)日志的對(duì)象,以對(duì)象屬性敏感數(shù)據(jù)源IP、對(duì)象名稱、數(shù)據(jù)形態(tài)、存儲(chǔ)路徑為條件,與有敏感數(shù)據(jù)操作標(biāo)識(shí)的標(biāo)準(zhǔn)化日志相關(guān)屬性(如:源IP、操作對(duì)象名稱、操作內(nèi)容)進(jìn)行匹配,匹配成功,則根據(jù)標(biāo)準(zhǔn)化日志相關(guān)屬性信息生成過程敏感數(shù)據(jù)對(duì)象操作,并存儲(chǔ)在過程敏感數(shù)據(jù)對(duì)象列表PL中,同時(shí)生成敏感數(shù)據(jù)訪問或操作路徑節(jié)點(diǎn)對(duì)象,存儲(chǔ)在操作路徑節(jié)點(diǎn)對(duì)象列表TL中.重復(fù)以上步驟直至遍歷完SL中的所有對(duì)象.操作路徑對(duì)象信息包括上一級(jí)節(jié)點(diǎn)IP、當(dāng)前節(jié)點(diǎn)IP、流轉(zhuǎn)方式、流轉(zhuǎn)時(shí)間、敏感數(shù)據(jù)名稱、賬號(hào).
查詢過程敏感數(shù)據(jù)對(duì)象列表PL中的對(duì)象,找出該敏感數(shù)據(jù)對(duì)象訪問、操作的節(jié)點(diǎn).以該過程敏感對(duì)象屬性如敏感數(shù)據(jù)源IP、對(duì)象名稱、存儲(chǔ)路徑為條件,與有敏感數(shù)據(jù)操作標(biāo)識(shí)的標(biāo)準(zhǔn)化日志相關(guān)屬性進(jìn)行匹配,若匹配成功則將該對(duì)象移除PL列表,根據(jù)匹配的標(biāo)準(zhǔn)化日志相關(guān)屬性信息生成過程敏感數(shù)據(jù)對(duì)象,并存儲(chǔ)在過程敏感數(shù)據(jù)對(duì)象列表PL中,同時(shí)生成敏感數(shù)據(jù)訪問路徑對(duì)象,存儲(chǔ)在流轉(zhuǎn)路徑對(duì)象列表TL中.如果匹配失敗則將該對(duì)象移除PL列表.重復(fù)以上步驟直至遍歷完P(guān)L中的所有對(duì)象.
運(yùn)營(yíng)商大數(shù)據(jù)應(yīng)用方興未艾[7],為積極穩(wěn)妥地推進(jìn)大數(shù)據(jù)平臺(tái)的服務(wù)能力提升,避免探索創(chuàng)新過程中可能遇到的輿論和法律風(fēng)險(xiǎn),需要高度重視大數(shù)據(jù)平臺(tái)的敏感信息保護(hù)問題.
本文探討了運(yùn)營(yíng)商大數(shù)據(jù)平臺(tái)的敏感信息范圍,給出了敏感信息保護(hù)的方法步驟,總結(jié)了該研究領(lǐng)域內(nèi)的關(guān)鍵技術(shù)及每類技術(shù)的主流技術(shù)方法,并針對(duì)實(shí)際的運(yùn)營(yíng)商大數(shù)據(jù)平臺(tái)的分層架構(gòu),設(shè)計(jì)了不同敏感信息保護(hù)技術(shù)的技術(shù)實(shí)現(xiàn)方案.
需要指出,學(xué)術(shù)界所研究的敏感信息保護(hù)技術(shù),一般是基于單一靜態(tài)數(shù)據(jù)集的環(huán)境給出的理想模型.而實(shí)際的運(yùn)營(yíng)商大數(shù)據(jù)生產(chǎn)環(huán)境要復(fù)雜得多,數(shù)據(jù)集是無時(shí)無刻不在變化的,而且這種變化一般都不是完全隨機(jī)、獨(dú)立的,而是相互關(guān)聯(lián)的.如何在實(shí)際的復(fù)雜環(huán)境下同時(shí)實(shí)現(xiàn)對(duì)動(dòng)態(tài)數(shù)據(jù)的利用和敏感信息保護(hù), 還有待于更深入的理論研究和實(shí)踐探索.
[1]周水庚, 李豐, 陶宇飛, 等. 面向數(shù)據(jù)庫(kù)應(yīng)用的隱私保護(hù)研究綜述[J]. 計(jì)算機(jī)學(xué)報(bào), 2009, 32(5): 847-861
[2]馮登國(guó), 張敏, 李昊. 大數(shù)據(jù)安全與隱私保護(hù)[J]. 計(jì)算機(jī)學(xué)報(bào), 2014, 37(1): 246-258
[3]電信和互聯(lián)網(wǎng)用戶個(gè)人信息保護(hù)規(guī)定[OL]. 2014 [2017-12-15]. http://www.miit.gov.cn/n11293472/n11294912/n11296542/15514014.html
[4]王博. 大數(shù)據(jù)發(fā)展背景下網(wǎng)絡(luò)安全與隱私保護(hù)研究[J]. 軟件導(dǎo)刊, 2016, 15(8): 171-172
[5]劉雅輝, 張鐵贏, 靳小龍, 等. 大數(shù)據(jù)時(shí)代的個(gè)人隱私保護(hù)[J]. 計(jì)算機(jī)研究與發(fā)展, 2015, 52(1): 229-247
[6]張文科, 劉桂芬. 云計(jì)算數(shù)據(jù)安全和隱私保護(hù)研究[J]. 信息安全與通信保密, 2012 (11): 38-40
[7]華汪明, 張新躍, 汪飛. 電信運(yùn)營(yíng)商敏感信息保護(hù)體系研究與設(shè)計(jì)[J]. 現(xiàn)代電信科技, 2011, 11(11): 229-247