□ 文馮 昀
大數(shù)據(jù)的安全風(fēng)險(xiǎn)及防范策略分析
□ 文馮 昀
近年來,隨著信息技術(shù)的迅速發(fā)展,以互聯(lián)網(wǎng)為主體的信息網(wǎng)絡(luò)日益普及,“大數(shù)據(jù)”已在悄然間融入人們的工作、學(xué)習(xí)和生活之中,成為不可或缺的組成部分。比如,用大數(shù)據(jù)預(yù)測(cè)疾病,用大數(shù)據(jù)預(yù)測(cè)獎(jiǎng)項(xiàng),用大數(shù)據(jù)支撐智能交通,用大數(shù)據(jù)助力企業(yè)商業(yè)決策,用大數(shù)據(jù)分析客戶心理等。大數(shù)據(jù)平臺(tái)存儲(chǔ)了大量的用戶數(shù)據(jù),包含個(gè)人隱私、財(cái)務(wù)等敏感信息。近年來,大數(shù)據(jù)平臺(tái)安全事件不斷發(fā)生,隱私數(shù)據(jù)或敏感信息的泄露、服務(wù)中斷等安全問題嚴(yán)重阻礙了大數(shù)據(jù)業(yè)務(wù)的健康發(fā)展。深入研究大數(shù)據(jù)平臺(tái)存在的安全風(fēng)險(xiǎn),切實(shí)保障大數(shù)據(jù)平臺(tái)的信息安全是我們需要研究的課題。
大數(shù)據(jù),即一個(gè)體量特別大、數(shù)據(jù)類別特別大的數(shù)據(jù)集,并且這樣的數(shù)據(jù)集無法用傳統(tǒng)數(shù)據(jù)庫工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理。簡(jiǎn)單地說大數(shù)據(jù)的“大”是形容這些數(shù)據(jù)“管理成本高昂”且“難以創(chuàng)造價(jià)值”。大數(shù)據(jù)具有體量大、結(jié)構(gòu)多樣、時(shí)效強(qiáng)等特征,處理大數(shù)據(jù)需采用新型計(jì)算架構(gòu)和智能算法等新技術(shù)。大數(shù)據(jù)的應(yīng)用強(qiáng)調(diào)以新的理念應(yīng)用于輔助決策、發(fā)現(xiàn)新的知識(shí),更強(qiáng)調(diào)在線業(yè)務(wù)流程優(yōu)化。大數(shù)據(jù)不能只強(qiáng)調(diào)“大”,應(yīng)從資源、技術(shù)、應(yīng)用和理念多個(gè)角度全面認(rèn)識(shí)。大數(shù)據(jù)更重要的意義是啟發(fā)全社會(huì)重新審視數(shù)據(jù)的價(jià)值。
(一)數(shù)據(jù)體量大
截至目前,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量大概是200 PB(1 PB=1000 TB),而人類所說過的話的數(shù)據(jù)量大概是5 EB(1 EB=1000 PB)。當(dāng)前,普通個(gè)人電腦的硬盤容量為TB量級(jí),而一些大公司的存儲(chǔ)數(shù)據(jù)量已經(jīng)接近EB量級(jí)。
(二)數(shù)據(jù)類型多樣
大數(shù)據(jù)存儲(chǔ)的數(shù)據(jù)類型多樣,總體上可分為結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)是可用二維表格結(jié)構(gòu)表示的數(shù)據(jù),表中任何一列的數(shù)據(jù)都有相同的數(shù)據(jù)類型。非結(jié)構(gòu)化數(shù)據(jù)是不能用固定結(jié)構(gòu)表示的數(shù)據(jù)。半結(jié)構(gòu)化數(shù)據(jù)是介于結(jié)構(gòu)化和無結(jié)構(gòu)數(shù)據(jù)之間,用二維表之外其他結(jié)構(gòu)表示的數(shù)據(jù)。相對(duì)于以往便于存儲(chǔ)的以文本為主的結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)越來越多,包括音視頻、圖片、網(wǎng)絡(luò)日志、地理位置信息等。多類型的數(shù)據(jù)對(duì)數(shù)據(jù)的處理能力提出了很高的要求。
(三)價(jià)值密度低
價(jià)值密度的高低與數(shù)據(jù)總量的大小成反比。我們以視頻監(jiān)控為例,一天24小時(shí)連續(xù)監(jiān)控的過程中,真正有用的數(shù)據(jù)可能只有幾十分鐘。如何通過機(jī)器算法更快地提煉出有價(jià)值的數(shù)據(jù)是目前急需研究解決的難題。
(四)處理速度快
大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)挖掘最大的區(qū)別就是處理速度快。據(jù)統(tǒng)計(jì),到2020年,全球數(shù)據(jù)的使用量預(yù)計(jì)會(huì)達(dá)到35.2 ZB。在海量數(shù)據(jù)面前,處理數(shù)據(jù)的效率關(guān)系到企業(yè)能否長(zhǎng)久生存下去。
圖1 大數(shù)據(jù)技術(shù)框架
大數(shù)據(jù)來源于互聯(lián)網(wǎng)、企業(yè)系統(tǒng)和物聯(lián)網(wǎng)等信息系統(tǒng)。經(jīng)過大數(shù)據(jù)處理系統(tǒng)的分析挖掘,產(chǎn)生新的知識(shí)用以支撐決策或業(yè)務(wù)的自動(dòng)智能化運(yùn)轉(zhuǎn)。從數(shù)據(jù)在信息系統(tǒng)中的生命周期看,大數(shù)據(jù)從數(shù)據(jù)源經(jīng)過分析挖掘到最終獲得價(jià)值一般需要經(jīng)過 5個(gè)主要環(huán)節(jié),包括數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)存儲(chǔ)與管理、計(jì)算處理、數(shù)據(jù)分析和知識(shí)展現(xiàn),技術(shù)體系如圖1所示。每個(gè)環(huán)節(jié)都面臨不同程度的技術(shù)上的挑戰(zhàn)。
(一)數(shù)據(jù)準(zhǔn)備環(huán)節(jié)
在進(jìn)行存儲(chǔ)數(shù)據(jù)之前,需要先對(duì)數(shù)據(jù)進(jìn)行清洗、整理,傳統(tǒng)數(shù)據(jù)處理體系中稱為 ETL(Extracting,Transforming,Loading)過程。與以往數(shù)據(jù)分析相比,大數(shù)據(jù)的來源渠道多樣,包括企業(yè)內(nèi)部數(shù)據(jù)庫、互聯(lián)網(wǎng)數(shù)據(jù)和物聯(lián)網(wǎng)數(shù)據(jù),不僅數(shù)量巨大、格式多樣,質(zhì)量也參差不齊。這就要求數(shù)據(jù)準(zhǔn)備環(huán)節(jié)首先要規(guī)范格式,便于后續(xù)存儲(chǔ)管理,其次還要在盡可能保留原有語義的情況下去粗取精、消除噪聲。
(二)數(shù)據(jù)存儲(chǔ)與管理環(huán)節(jié)
當(dāng)前全球數(shù)據(jù)量正以每年超過50%的速度增長(zhǎng),存儲(chǔ)技術(shù)的性能和成本面臨巨大的壓力。大數(shù)據(jù)存儲(chǔ)系統(tǒng)需要以最低的成本來存儲(chǔ)海量數(shù)據(jù),同時(shí)還要適應(yīng)種類繁多的非結(jié)構(gòu)化數(shù)據(jù)管理需求,具有數(shù)據(jù)格式上的可擴(kuò)展性。
(三)計(jì)算處理環(huán)節(jié)
根據(jù)需要處理的數(shù)據(jù)類型,選取適合的算法快速處理數(shù)據(jù)。海量數(shù)據(jù)處理往往要耗費(fèi)大量的計(jì)算資源,對(duì)于傳統(tǒng)單機(jī)或并行計(jì)算技術(shù)來說,速度、可擴(kuò)展性和成本上都難以適應(yīng)大數(shù)據(jù)計(jì)算分析的新需求。所以,分布式計(jì)算逐步成為大數(shù)據(jù)的主要計(jì)算架構(gòu)。
(四)數(shù)據(jù)分析環(huán)節(jié)
數(shù)據(jù)分析環(huán)節(jié)需要從異常復(fù)雜的數(shù)據(jù)中發(fā)現(xiàn)規(guī)律并提取新的知識(shí)。傳統(tǒng)數(shù)據(jù)挖掘?qū)ο蠖嗍墙Y(jié)構(gòu)化、單一對(duì)象的小數(shù)據(jù)集,挖掘更側(cè)重根據(jù)先驗(yàn)知識(shí)預(yù)先人工建立模型,然后依據(jù)既定模型進(jìn)行分析。對(duì)于非結(jié)構(gòu)化、多源異構(gòu)的大數(shù)據(jù)集的分析,往往缺乏先驗(yàn)知識(shí),很難建立顯式的數(shù)學(xué)模型,這就需要發(fā)展更加智能的數(shù)據(jù)挖掘技術(shù)。
(五) 知識(shí)展現(xiàn)環(huán)節(jié)
在大數(shù)據(jù)服務(wù)于決策支撐場(chǎng)景下,以直觀的方式將分析結(jié)果呈現(xiàn)給用戶,是大數(shù)據(jù)分析的重要環(huán)節(jié)。如何讓復(fù)雜的分析結(jié)果易于理解是主要挑戰(zhàn)。在嵌入多業(yè)務(wù)中的閉環(huán)大數(shù)據(jù)應(yīng)用中,一般是由機(jī)器根據(jù)算法直接應(yīng)用分析結(jié)果而無需人工干預(yù),這種場(chǎng)景下知識(shí)展現(xiàn)環(huán)節(jié)則不是必需的。
總而言之,大數(shù)據(jù)對(duì)數(shù)據(jù)準(zhǔn)備環(huán)節(jié)和知識(shí)展現(xiàn)環(huán)節(jié)來說只是量的變化,并不需要根本性的變革。但大數(shù)據(jù)對(duì)數(shù)據(jù)分析、計(jì)算和存儲(chǔ)三個(gè)環(huán)節(jié)影響較大,需要對(duì)技術(shù)架構(gòu)和算法進(jìn)行重構(gòu),是當(dāng)前和未來一段時(shí)間大數(shù)據(jù)技術(shù)創(chuàng)新的焦點(diǎn)。
世界經(jīng)濟(jì)論壇報(bào)告指出:“大數(shù)據(jù)是一項(xiàng)具有幫助全球經(jīng)濟(jì)復(fù)蘇的巨大潛力的新資產(chǎn)”、“大數(shù)據(jù)將在取得包容性增長(zhǎng)目標(biāo)方面扮演重要角色”。大數(shù)據(jù)被國際社會(huì)普遍視為驅(qū)動(dòng)經(jīng)濟(jì)社會(huì)創(chuàng)新發(fā)展和改善效率的新動(dòng)力,可廣泛應(yīng)用于經(jīng)濟(jì)社會(huì)各領(lǐng)域。
(一)政府應(yīng)用
國內(nèi)地方政府部門應(yīng)用大數(shù)據(jù)提升機(jī)構(gòu)治理和政府監(jiān)管能力的行動(dòng)已經(jīng)開始出現(xiàn)。一是打擊老鼠倉。滬深兩大交易所對(duì)“老鼠倉”等交易行為建立了專項(xiàng)核查和定期報(bào)告制度,目前已建立實(shí)時(shí)監(jiān)控機(jī)制、專項(xiàng)核查機(jī)制、聯(lián)動(dòng)監(jiān)控機(jī)制、智能化監(jiān)控機(jī)制四位一體的監(jiān)控體系,成功打壓了多起老鼠倉交易。二是稅務(wù)稽查。江蘇省無錫市國稅局稽查局利用購物網(wǎng)站的軟件查詢分析功能,發(fā)現(xiàn)并成功查處了全市首起網(wǎng)絡(luò)交易偷稅案,補(bǔ)征稅款及罰款合計(jì)12余萬元。三是征信體系建設(shè)。浙江省信用中心成立超過10年,匯集了工商、法院、稅務(wù)和中國人民銀行杭州中心支行等39個(gè)省級(jí)部門和單位提供的信用信息,目前向全社會(huì)無償提供企業(yè)和個(gè)人的信用信息查詢服務(wù)。四是食品藥品監(jiān)管。河北省食品藥品監(jiān)管局利用大數(shù)據(jù)推進(jìn)大藥品監(jiān)管,通過綜合藥品生產(chǎn)、流通、使用等各環(huán)節(jié)的監(jiān)管情況,對(duì)檢查、檢驗(yàn)、監(jiān)測(cè)中的各種數(shù)據(jù)深度分析和利用,找到問題并對(duì)癥下藥。五是反腐倡廉。江蘇省昆山市引入大數(shù)據(jù)理念,將黨風(fēng)廉政建設(shè)和反腐敗工作任務(wù)盡可能量化為客觀指標(biāo),并應(yīng)用信息管理系統(tǒng)對(duì)不間斷的數(shù)字信息流實(shí)現(xiàn)實(shí)時(shí)監(jiān)測(cè),啟動(dòng)大數(shù)據(jù)反腐創(chuàng)新模式。六是犯罪預(yù)防。北京市懷柔區(qū)警方也運(yùn)用大數(shù)據(jù)整合歷年案件信息,建立犯罪數(shù)據(jù)分析和趨勢(shì)預(yù)測(cè)系統(tǒng),助力APEC期間的安保工作。
(二)互聯(lián)網(wǎng)行業(yè)應(yīng)用
互聯(lián)網(wǎng)行業(yè)是大數(shù)據(jù)應(yīng)用的領(lǐng)跑者。阿里巴巴作為全球最大的零售體,支撐它快速成長(zhǎng)的是大數(shù)據(jù)、云計(jì)算等新技術(shù)的運(yùn)用,該公司2015年零售平臺(tái)交易額突破3萬億元,每天有超過30億的瀏覽量、數(shù)千萬交易。騰訊在大數(shù)據(jù)方面的應(yīng)用主要有精準(zhǔn)推薦、信用體系、數(shù)據(jù)云等。騰訊分布式數(shù)據(jù)倉庫TDW服務(wù)覆蓋了騰訊絕大部分業(yè)務(wù)產(chǎn)品,單集群規(guī)模達(dá)到4400臺(tái),CPU總核數(shù)達(dá)到10萬左右,存儲(chǔ)容量達(dá)到100 PB;每日作業(yè)數(shù)100多萬,每日計(jì)算量4 PB,作業(yè)并發(fā)數(shù)2000左右;實(shí)際存儲(chǔ)數(shù)據(jù)量80 PB,文件數(shù)和塊數(shù)達(dá)到6億多。百度擁有全球最大的神經(jīng)網(wǎng)絡(luò),支持萬億級(jí)別的傳輸,單集群規(guī)模超過數(shù)萬臺(tái)服務(wù)器,數(shù)據(jù)管理能力1000 PB,每天處理100 PB。相繼推出百度云、百度大腦、數(shù)據(jù)工廠、司南(營銷平臺(tái))等大數(shù)據(jù)服務(wù)。
(三)其它應(yīng)用
文化娛樂大數(shù)據(jù):根據(jù)3000萬次觀影行為、400萬個(gè)評(píng)分、300萬次搜索請(qǐng)求,美國最大付費(fèi)視頻網(wǎng)站通過大數(shù)據(jù)決策自制劇生產(chǎn),大獲成功??蒲写髷?shù)據(jù):大數(shù)據(jù)開創(chuàng)科研“第四范式”??蒲惺且垣@取數(shù)據(jù)和分析數(shù)據(jù)為核心的工作;科研結(jié)果可重現(xiàn)要求從結(jié)果回溯到數(shù)據(jù)與分析;采用不同的分析方法可能會(huì)得到新的科學(xué)發(fā)現(xiàn)。電信運(yùn)營商:Verizon于2012年推出Precision Market Insights,聚合移動(dòng)用戶使用模式和地理位置數(shù)據(jù),向媒體、零售商、體育場(chǎng)館等提供數(shù)據(jù)分析服務(wù)。France Telecom已有基于用戶消費(fèi)數(shù)據(jù)的分析,以幫助法國電信改善服務(wù)質(zhì)量,并通過承建公共項(xiàng)目向交通等部門提供數(shù)據(jù)服務(wù)。金融、貿(mào)易、物流等“廣義信息產(chǎn)業(yè)”是大數(shù)據(jù)最有潛力的領(lǐng)域。
隨著網(wǎng)絡(luò)化社會(huì)的不斷發(fā)展和技術(shù)水平的不斷提升,大數(shù)據(jù)安全風(fēng)險(xiǎn)也與日俱增。首先,各式各樣的智能終端、互動(dòng)頻繁的社交網(wǎng)絡(luò)和超大容量的數(shù)字化存儲(chǔ),為獲取和存儲(chǔ)大數(shù)據(jù)提供了一個(gè)開放、互聯(lián)的平臺(tái)?;谠朴?jì)算的網(wǎng)絡(luò)化社會(huì),使分布在不同地區(qū)的資源可以快速整合、動(dòng)態(tài)配置,實(shí)現(xiàn)數(shù)據(jù)集合的共建共享。但這一平臺(tái)的開放性,也使得蘊(yùn)含海量信息和潛在價(jià)值的大數(shù)據(jù)更容易吸引黑客的攻擊。對(duì)于攻擊者而言,由于這些信息的相互關(guān)聯(lián),用相對(duì)低的成本便可獲得巨大的收益。其次,技術(shù)的發(fā)展也增加了安全風(fēng)險(xiǎn)。計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)和人工智能的發(fā)展,服務(wù)器、防火墻、無線路由等網(wǎng)絡(luò)設(shè)備和數(shù)據(jù)挖掘應(yīng)用系統(tǒng)的廣泛應(yīng)用,為大數(shù)據(jù)自動(dòng)收集和智能動(dòng)態(tài)分析提供了方便,但也增加了大數(shù)據(jù)的安全風(fēng)險(xiǎn)。一方面,由于對(duì)大數(shù)據(jù)的安全控制力度不夠,應(yīng)用程序編程接口的訪問權(quán)限控制以及密鑰生成、存儲(chǔ)和管理方面的不足都可能造成數(shù)據(jù)泄露;另一方面,攻擊技術(shù)不斷提高,大數(shù)據(jù)本身可能成為一個(gè)可被持續(xù)攻擊的載體,隱藏其中的惡意軟件和病毒代碼很難被發(fā)現(xiàn)。
(一)重要業(yè)務(wù)面臨安全威脅
大數(shù)據(jù)平臺(tái)多用來承載電子政務(wù)、電子商務(wù)、數(shù)據(jù)存儲(chǔ)等重要業(yè)務(wù),接連發(fā)生的安全事件嚴(yán)重威脅著平臺(tái)業(yè)務(wù)安全。一方面,不法分子借助泄露的賬號(hào)、密碼等敏感信息,能夠直接入侵平臺(tái),竊取敏感信息,發(fā)布虛假消息,擾亂平臺(tái)業(yè)務(wù)正常秩序;另一方面,不法分子通過DDOS等手段能夠直接對(duì)大數(shù)據(jù)平臺(tái)進(jìn)行網(wǎng)絡(luò)攻擊,造成平臺(tái)癱瘓、業(yè)務(wù)中斷等嚴(yán)重后果。當(dāng)前,大數(shù)據(jù)平臺(tái)承載的業(yè)務(wù)已經(jīng)成為商務(wù)、政務(wù)以及金融等重點(diǎn)行業(yè)在網(wǎng)絡(luò)空間的延伸,平臺(tái)業(yè)務(wù)受損將直接殃及現(xiàn)實(shí)世界。
(二)信息泄露事件接連發(fā)生
近幾年,大量的信息泄露事件接踵而至。如酒店開房信息泄露事件,中國2000萬顧客酒店開房信息泄露并被19萬次下載;圓通速遞近百萬條快遞單個(gè)人信息不僅網(wǎng)上有售,且單號(hào)數(shù)據(jù)信息還能24小時(shí)更新;12306數(shù)據(jù)泄露事件,多達(dá)13萬用戶的賬號(hào)、明文密碼、身份證、手機(jī)號(hào)等敏感信息在網(wǎng)絡(luò)上瘋狂傳播。接連發(fā)生的信息泄露事件極大制約著大數(shù)據(jù)平臺(tái)的健康發(fā)展。
(三)潛在后果難以預(yù)估
作為海量數(shù)據(jù)的載體,大數(shù)據(jù)平臺(tái)出現(xiàn)安全問題,有可能會(huì)產(chǎn)生一系列連帶后果。一是泄露的居民身份證、銀行卡等敏感信息被放到網(wǎng)上非法買賣,可能被不法分子用于洗錢、逃稅、詐騙、送禮和開店刷信用等行為,擾亂了正常的社會(huì)秩序。二是不法分子可借助大數(shù)據(jù)平臺(tái)泄露的數(shù)據(jù)對(duì)其他平臺(tái)進(jìn)行“撞庫”攻擊?;ヂ?lián)網(wǎng)用戶往往習(xí)慣于在不同的平臺(tái)使用相同的賬號(hào)和口令,但平臺(tái)的安全防護(hù)能力各不相同,一旦其中一個(gè)漏洞較多的平臺(tái)發(fā)生數(shù)據(jù)泄露,其他平臺(tái)也將遭殃。三是頻繁發(fā)生的安全事件不只帶來經(jīng)濟(jì)損失,還會(huì)降低互聯(lián)網(wǎng)用戶對(duì)大數(shù)據(jù)平臺(tái)的信心,嚴(yán)重阻礙大數(shù)據(jù)平臺(tái)的健康、快速發(fā)展。
2014年8月,中國互聯(lián)網(wǎng)協(xié)會(huì)發(fā)布的《中國網(wǎng)民權(quán)益保護(hù)調(diào)查報(bào)告(2014)》顯示,2013年7月至2014年7月,中國網(wǎng)民因各類侵權(quán)遭受的損失合計(jì)約1434億元,其中直接經(jīng)濟(jì)損失約為1093億元。大量事實(shí)表明,如果不能妥善處理大數(shù)據(jù)安全問題,將會(huì)造成不可估量的損失。
大數(shù)據(jù)安全保障可以從物理安全、存儲(chǔ)安全、系統(tǒng)安全、訪問安全、網(wǎng)絡(luò)安全、運(yùn)營安全、審計(jì)安全等角度進(jìn)行研究。圍繞大數(shù)據(jù)整個(gè)生命周期,即數(shù)據(jù)產(chǎn)生、傳輸、采集、處理、存儲(chǔ)、分析、展示、發(fā)布和應(yīng)用、產(chǎn)生新數(shù)據(jù)這些階段進(jìn)行安全防護(hù)。其目標(biāo)是盡可能地保護(hù)大數(shù)據(jù)自身安全。防止越權(quán)訪問、數(shù)據(jù)泄露、密鑰泄露、數(shù)據(jù)篡改、數(shù)據(jù)丟失、侵犯用戶隱私等問題的出現(xiàn)。
(一)大數(shù)據(jù)應(yīng)用安全策略
大數(shù)據(jù)應(yīng)用安全策略應(yīng)從以下幾方面著手:一是防止APT(Advanced Persistent Threat,高級(jí)持續(xù)性威脅)攻擊。依靠大數(shù)據(jù)處理技術(shù),針對(duì)APT安全攻擊潛伏時(shí)間長(zhǎng)、隱蔽能力強(qiáng)、攻擊渠道和路徑不確定等特點(diǎn),構(gòu)思具備事后回溯能力與實(shí)時(shí)檢測(cè)能力的全流量審計(jì)方案,提示隱藏有病毒的應(yīng)用程序。二是整合工具和流程。利用整合工具和流程,保障大數(shù)據(jù)應(yīng)用安全處在大數(shù)據(jù)系統(tǒng)的頂端。同時(shí),通過設(shè)計(jì)一個(gè)通用的數(shù)據(jù)格式簡(jiǎn)化整合過程,可以改善分析算法的持續(xù)驗(yàn)證。三是用戶訪問控制。大數(shù)據(jù)的跨平臺(tái)傳輸應(yīng)用會(huì)帶來內(nèi)在風(fēng)險(xiǎn),可以根據(jù)大數(shù)據(jù)的用戶需求和密級(jí)程度的不同,對(duì)應(yīng)設(shè)定不同的權(quán)限等級(jí),同時(shí)嚴(yán)格控制訪問權(quán)限。四是數(shù)據(jù)實(shí)時(shí)分析引擎。數(shù)據(jù)實(shí)時(shí)分析引擎融合了機(jī)器學(xué)習(xí)、云計(jì)算、統(tǒng)計(jì)學(xué)、語義分析等多個(gè)領(lǐng)域,采用數(shù)據(jù)實(shí)時(shí)分析引擎,從大數(shù)據(jù)中迅速挖掘出潛在威脅、非法操作、黑客攻擊等各類安全事件,及時(shí)發(fā)出警告響應(yīng)。
(二)大數(shù)據(jù)存儲(chǔ)安全策略
大數(shù)據(jù)的安全存儲(chǔ)問題可以從以下幾個(gè)方面來考慮解決:一是數(shù)據(jù)加密。在大數(shù)據(jù)安全服務(wù)的設(shè)計(jì)中,大數(shù)據(jù)平臺(tái)的數(shù)據(jù)可以被存儲(chǔ)在數(shù)據(jù)集的任意存儲(chǔ)空間,采用SSL(Secure Sockets Layer,安全套接層)加密方式對(duì)這些數(shù)據(jù)進(jìn)行加密,以達(dá)到數(shù)據(jù)集的節(jié)點(diǎn)和應(yīng)用程序之間移動(dòng)保護(hù)大數(shù)據(jù)的目的。在大數(shù)據(jù)的傳輸服務(wù)過程中,通過加密數(shù)據(jù),數(shù)據(jù)流的上傳與下載得到了有效的保護(hù)。目前,具有強(qiáng)大加密功能的程序有PGP(Pretty Good Privacy,基于公鑰加密體系的郵件加密軟件)和TrueCrypt。二是采用過濾器。通過過濾器的監(jiān)控,只要發(fā)現(xiàn)數(shù)據(jù)離開了用戶的網(wǎng)絡(luò),立即自動(dòng)阻止數(shù)據(jù)的再次傳輸。三是分離密鑰和加密數(shù)據(jù)。使用加密把數(shù)據(jù)使用與數(shù)據(jù)保管分離,把密鑰與要保護(hù)的數(shù)據(jù)隔離開。同時(shí),定義產(chǎn)生、存儲(chǔ)、備份、恢復(fù)等密鑰管理生命周期。四是數(shù)據(jù)備份。通過數(shù)據(jù)管理、敏感信息集中管控、系統(tǒng)容災(zāi)等產(chǎn)品,實(shí)現(xiàn)點(diǎn)對(duì)點(diǎn)的數(shù)據(jù)保護(hù),保證大數(shù)據(jù)損壞情況下能夠及時(shí)恢復(fù)。
(三)大數(shù)據(jù)管理安全策略
通過技術(shù)來保護(hù)大數(shù)據(jù)的安全必然重要,但管理也很關(guān)鍵。大數(shù)據(jù)的管理安全策略主要有:一是規(guī)范建設(shè)。大數(shù)據(jù)建設(shè)是一項(xiàng)有序的、動(dòng)態(tài)的、可持續(xù)發(fā)展的系統(tǒng)工程,一套規(guī)范的運(yùn)行機(jī)制、建設(shè)標(biāo)準(zhǔn)和共享平臺(tái)建設(shè)至關(guān)重要。規(guī)范化建設(shè)可以促進(jìn)大數(shù)據(jù)管理過程的正規(guī)有序,實(shí)現(xiàn)各級(jí)各類信息系統(tǒng)的網(wǎng)絡(luò)互連、數(shù)據(jù)集成、資源共享,在統(tǒng)一的安全規(guī)范框架下運(yùn)行。二是建立以數(shù)據(jù)為中心的安全系統(tǒng)?;谠朴?jì)算的大數(shù)據(jù)存儲(chǔ)在云共享環(huán)境中,為了大數(shù)據(jù)的所有者可以對(duì)大數(shù)據(jù)使用進(jìn)行控制,可以通過建設(shè)一個(gè)基于異構(gòu)數(shù)據(jù)為中心的安全方法,從系統(tǒng)管理上保證大數(shù)據(jù)的安全。三是融合創(chuàng)新。大數(shù)據(jù)是在云計(jì)算的基礎(chǔ)上提出的新概念,大數(shù)據(jù)時(shí)代應(yīng)以智慧創(chuàng)新理念融合大數(shù)據(jù)與云計(jì)算,以智能管道與聚合平臺(tái)為基礎(chǔ),提升數(shù)據(jù)流量規(guī)模、層次及內(nèi)涵,在大數(shù)據(jù)流中提升知識(shí)價(jià)值洞察力。
大數(shù)據(jù)雖然蘊(yùn)藏著巨大的價(jià)值,給各行各業(yè)的發(fā)展提供了重大的機(jī)遇,但是隨之而來的挑戰(zhàn)也異常艱巨,尤其是大數(shù)據(jù)安全問題,它是我們?cè)谙硎艽髷?shù)據(jù)時(shí)代所帶來的便利的同時(shí)所無法忽視和回避的難題。保障大數(shù)據(jù)安全需對(duì)癥下藥,需從國家、制度、管理、法律等層面進(jìn)行更多的投入,使大數(shù)據(jù)平臺(tái)良性發(fā)展,以發(fā)揮最大效用。
(作者單位:廣西壯族自治區(qū)通信管理局)
[1]工業(yè)和信息化部信息通信研究院.大數(shù)據(jù)白皮書[EB/OL].(2014-05-12)[2015-06-18] . http://www.miit.gov.cn/n11293472/n11293832/n15214847/ n15218338/16046426.html.
[2]趙明亮,劉茁卉,李芮,南婷,孫洪磊,李驚亞,韋慧,馬意翀. 大數(shù)據(jù)安全面臨系列挑戰(zhàn)[EB/OL].(2015-01-21)[2015-06-18] . http://www.lwgcw.com/ NewsShow.aspx? newsId=37178.
[3]馮偉.大數(shù)據(jù)平臺(tái)安全問題不容小覷[N]. 賽迪智庫專報(bào),2015-3-11.
[4]郭三強(qiáng),郭燕錦.大數(shù)據(jù)環(huán)境下的數(shù)據(jù)安全分析[EB/OL].(2013-07-08)[2015-06-18] . http://www.ciotimes. com/bi/sjck/81674.html.
[5]栗蔚,魏凱.大數(shù)據(jù)的技術(shù)、應(yīng)用和價(jià)值變革[J].電信網(wǎng)技術(shù),2013(7):6-10.
[6]李紀(jì)舟,葉小新,丁云峰,朱黨明.大數(shù)據(jù)關(guān)鍵技術(shù)、主要特點(diǎn)及發(fā)展趨勢(shì)[J].電信技術(shù)研究,2013(3):58-64.
[7]鄔賀銓.大數(shù)據(jù)時(shí)代的機(jī)遇與挑戰(zhàn)[J].信息化參考,2013(2):1-6.
[8]魏凱.大數(shù)據(jù)產(chǎn)業(yè)發(fā)展?fàn)顩r及政策思考[J].電信網(wǎng)技術(shù),2014(4):1-4.
[9]張亞勤.大數(shù)據(jù)催生顛覆式創(chuàng)新[J].信息化參考,2013(2):15-17.