柴高
摘 要 近年來,國家十分關(guān)注網(wǎng)絡(luò)安全在穩(wěn)定人員思想、保持思想先進方面所發(fā)揮的正面作用,積極開展網(wǎng)上斗爭,不斷提高網(wǎng)絡(luò)安全工作水平。網(wǎng)絡(luò)數(shù)據(jù)是指通過計算網(wǎng)絡(luò)產(chǎn)生的數(shù)據(jù),特別是在大數(shù)據(jù)的背景下,數(shù)據(jù)數(shù)量、形式和數(shù)據(jù)內(nèi)涵等與以往相比發(fā)生了深刻變化,網(wǎng)絡(luò)數(shù)據(jù)安全問題日益出新,網(wǎng)絡(luò)數(shù)據(jù)安全保衛(wèi)工作也面臨新的問題,需要從數(shù)據(jù)的存儲策略、管理方式、政策規(guī)范等多方面加以完善。
關(guān)鍵詞 大數(shù)據(jù) 網(wǎng)絡(luò)數(shù)據(jù) 安全
中圖分類號:TP309 文獻標識碼:A DOI:10.16400/j.cnki.kjdkx.2018.06.026
Abstract In recent years, the state has paid close attention to the positive role that cybersecurity plays in stabilizing the thinking of the people and maintaining advanced ideas, actively conducting online struggles, and continuously improving the level of network security work. Network data refers to the data generated by the computing network. Especially in the context of big data, the number, form, and data content of the data have undergone profound changes compared with the past. The problem of network data security has become increasingly new, and the security of network data has been improved. It also faces new problems and needs to be improved from many aspects such as data storage strategies, management methods, and policy specifications.
Keywords big data; network data; security
1 大數(shù)據(jù)條件下網(wǎng)絡(luò)數(shù)據(jù)發(fā)展現(xiàn)狀
1.1 數(shù)據(jù)規(guī)模龐大
大數(shù)據(jù)時代的首要特點就是海量數(shù)據(jù),這主要依賴于三點:一是人類認知能力的進步。各項發(fā)明的誕生離不開人類對知識的渴望,人們測量、記錄各項數(shù)據(jù),期望通過對數(shù)據(jù)的分析來認識和掌握事物發(fā)展變化的規(guī)律。將抽象的事物數(shù)據(jù)化、模型化,為今后的工作提供決策依據(jù)。
二是得益于海量數(shù)據(jù)的不斷產(chǎn)生。20世紀末互聯(lián)網(wǎng)的普及為數(shù)據(jù)的積累提供了平臺,隨著互聯(lián)網(wǎng)、信息技術(shù)的發(fā)展,人們的工作、生活空間不斷向虛擬世界延伸,特別是隨著Web2.0時代的到來,社交網(wǎng)絡(luò)、電子商務(wù)平臺、自媒體以及智能手機的興起,人們在網(wǎng)絡(luò)上留下了大量的數(shù)據(jù)痕跡,數(shù)據(jù)呈現(xiàn)幾何式爆發(fā)增長。據(jù)統(tǒng)計,2012年全球數(shù)據(jù)總量已達到2.8ZB,相當于28億個1TB移動硬盤的存儲量,專家預(yù)測到2020年,全球數(shù)據(jù)總量的22%將來自于中國。這些數(shù)據(jù)的積累就成為我們最原始的生產(chǎn)資料。
三是數(shù)據(jù)存儲和數(shù)據(jù)處理技術(shù)的快速發(fā)展。近年來,電子設(shè)備的存儲容量迅速增加,存儲速率大大提升。尤其是云技術(shù)的興起,讓計算機的計算和存儲能力大大增強,大數(shù)據(jù)的存儲和計算問題得以解決。
1.2 數(shù)據(jù)形式多樣
一是來源渠道多樣。大數(shù)據(jù)時代,數(shù)據(jù)的來源不僅局限于人們有目的性的主動收集來的數(shù)據(jù),物聯(lián)網(wǎng)利用局部網(wǎng)絡(luò)或互聯(lián)網(wǎng)等通信技術(shù)把傳感器、控制器、機器人、人員和物等通過新的方式聯(lián)系在一起,形成人與物、物與物相連,實現(xiàn)信息化,我們不僅可以了解一個人的靜態(tài)數(shù)據(jù)如基本信息、健康狀況、銀行交易情況,還可以掌握他的實時情況,如通過利用傳感設(shè)備獲取行為信息,可以說數(shù)據(jù)來源渠道十分廣泛。
二是數(shù)據(jù)形式多樣。因為數(shù)據(jù)來源的廣泛,導(dǎo)致了數(shù)據(jù)形式上的多樣性。數(shù)據(jù)從過去簡單的結(jié)構(gòu)化數(shù)據(jù)形式向非結(jié)構(gòu)化數(shù)據(jù)形式發(fā)展,并且大量數(shù)據(jù)都以非結(jié)構(gòu)化數(shù)據(jù)的形式存在,如日志文件、點擊流、文本文檔、多媒體等等。
三是處理技術(shù)多樣。正因為大量數(shù)據(jù)以非結(jié)構(gòu)化的形式存在,不能用統(tǒng)一的格式表達,所以針對每一類型的數(shù)據(jù)都有相應(yīng)的技術(shù),數(shù)據(jù)分析處理技術(shù)也更加復(fù)雜。
1.3 數(shù)據(jù)價值隱藏
數(shù)據(jù)長期以來都是有價值的。以前,因為存儲技術(shù)和處理能力有限,我們期望通過對這些少量的最優(yōu)樣本的分析得到普適的、大量的有用信息。而這些數(shù)據(jù)被使用后,得到結(jié)果后要么丟棄、要么沉睡,因為我們對數(shù)據(jù)價值的認識僅限于表層。
大數(shù)據(jù)時代,數(shù)據(jù)的來源不僅局限于主動獲取,物聯(lián)網(wǎng)連接的各種終端都成為數(shù)據(jù)取得的重要渠道,據(jù)統(tǒng)計世界上90%的數(shù)據(jù)都是近幾年各種終端設(shè)備產(chǎn)生的?!皹颖?總體”是大數(shù)據(jù)的經(jīng)典概念,數(shù)據(jù)在使用后不會被丟棄,大數(shù)據(jù)要求人們?nèi)ネ诰螂[藏在數(shù)據(jù)后面的規(guī)律,用規(guī)律來預(yù)測事情發(fā)生的可能性,因為樣本的完整性,這樣得到的預(yù)測結(jié)果更接近于事實真相。從互聯(lián)網(wǎng)領(lǐng)域到電信、金融、地產(chǎn)、醫(yī)療、貿(mào)易,各行各業(yè)都認識到其中隱藏價值的重要性,大數(shù)據(jù)的影響力在不斷擴大。
2 大數(shù)據(jù)條件下的計算機網(wǎng)絡(luò)數(shù)據(jù)安全問題
2.1 數(shù)據(jù)采集存儲技術(shù)落后
第一,數(shù)據(jù)采集技術(shù)滯后。一是數(shù)據(jù)采集環(huán)境不佳,會導(dǎo)致數(shù)據(jù)偏差。大數(shù)據(jù)強調(diào)的全數(shù)據(jù)能克服抽樣調(diào)查中的不全面帶來的缺陷。但由于不同地區(qū)、不同年齡段人群的信息化程度不同,在大數(shù)據(jù)的采集過程中這種偏差會給以后的數(shù)據(jù)分析帶來后患,即存在數(shù)據(jù)盲點。二是數(shù)據(jù)采集技術(shù)的不發(fā)達還會導(dǎo)致安全隱患。首先,對用戶行為信息進行分析時,不論選用何種分析工具或分析系統(tǒng),通常都會選擇通過客戶端(安卓、ios等)采集用戶行為信息,然后經(jīng)過打包、壓縮等一系列步驟,發(fā)送給服務(wù)器,再進行存儲和分析。由于客戶端是在網(wǎng)絡(luò)環(huán)境下運行的,因此會對數(shù)據(jù)的完整性和隱私性造成威脅。數(shù)據(jù)的傳輸過程中會有3%~7%的數(shù)據(jù)丟失不可避免,與小數(shù)據(jù)相比,在大數(shù)據(jù)時代即使數(shù)據(jù)丟失占總數(shù)據(jù)量的比重很小,它所蘊含的數(shù)據(jù)總量也是龐大的,其中丟失的有用信息價值也是不能忽略的。
第二,數(shù)據(jù)存儲技術(shù)欠缺。龐大數(shù)據(jù)群數(shù)據(jù)混雜在一起,形式多樣、內(nèi)容多樣,雖然NoSQL的數(shù)據(jù)存儲具有擴展性和可用性,能解決大數(shù)據(jù)存儲的初步方案,但NoSQL數(shù)據(jù)存儲依然存在發(fā)展不成熟、漏洞較多、內(nèi)置安全不足等問題。特別是大量數(shù)據(jù)存在于網(wǎng)絡(luò)中,用戶可以通過主機、交換機等不同設(shè)備訪問網(wǎng)絡(luò)存儲系統(tǒng),這也給數(shù)據(jù)安全帶來極大隱患。
2.2 數(shù)據(jù)管理難度增強
一是數(shù)據(jù)傳輸環(huán)境安全性低。全世界13個根服務(wù)器10個在美國,2個在歐洲位于英國、瑞典,1個在亞洲位于日本,互聯(lián)網(wǎng)管理的主目錄都不在我國的掌控中。目前我國在全世界還沒有一條完整的通訊光纜,數(shù)據(jù)的傳輸必須要借助他國的通道,在傳輸過程中數(shù)據(jù)安全很難保障。
二是數(shù)據(jù)使用范圍受到制約。隨著網(wǎng)絡(luò)數(shù)據(jù)價值的不斷增加,針對網(wǎng)絡(luò)數(shù)據(jù)的安全威脅也與日俱增,很多國家對計算機網(wǎng)絡(luò)數(shù)據(jù)的使用態(tài)度逐步嚴謹。“棱鏡”事件前, “數(shù)據(jù)開放”成為國際網(wǎng)絡(luò)空間數(shù)據(jù)使用的主流態(tài)度;而“棱鏡”事件后,各國對網(wǎng)絡(luò)數(shù)據(jù)的使用態(tài)度更為嚴謹,并不斷強化網(wǎng)絡(luò)數(shù)據(jù)的管理和保護。
三是網(wǎng)絡(luò)漏洞威脅性放大。隨著“互聯(lián)網(wǎng)+”時代的變化,局域網(wǎng)中微不足道的安全漏洞會被無限放大,風險的不確定性、不可預(yù)知性增強,安全管理措施跟進不及時,增加了黑客攻擊和惡意軟件侵入的幾率,安全局勢愈加嚴峻。
2.3 隱私泄露的風險擴大
網(wǎng)絡(luò)空間中的數(shù)據(jù)來源廣泛,如傳感器、社交日志、電子郵件等,大量數(shù)據(jù)的集合不可避免的增加了泄漏用戶隱私的風險。一方面,大量的數(shù)據(jù)集合包含了大量的企業(yè)運行數(shù)據(jù)、用戶信息、個人隱私等細節(jié)信息,這都涉及到企業(yè)的核心機密和個人隱私。
另一方面,大量數(shù)據(jù)中包含了許多敏感數(shù)據(jù),這些數(shù)據(jù)的使用權(quán)限和范圍并沒有嚴格的界限,會導(dǎo)致隱私的泄露。由于數(shù)據(jù)價值的發(fā)現(xiàn)導(dǎo)致組織犯罪盛行,大數(shù)據(jù)因其隱藏的巨大價值,善用的同時也被惡用,隱私保護問題迫在眉睫。
3 大數(shù)據(jù)條件下的網(wǎng)絡(luò)數(shù)據(jù)安全對策
3.1 完善數(shù)據(jù)采集存儲策略
在數(shù)據(jù)采集時,我們可以使用HTTPS傳輸協(xié)議、傳輸內(nèi)容加密。在大數(shù)據(jù)計算機網(wǎng)絡(luò)數(shù)據(jù)安全系統(tǒng)里,必須要消除內(nèi)部數(shù)據(jù)死角,網(wǎng)絡(luò)收集技術(shù)一定要全面,保證從終端服務(wù)器到網(wǎng)絡(luò)上的數(shù)據(jù)收集全,形成安全的大數(shù)據(jù)。
同時,利用云技術(shù)解決數(shù)據(jù)存儲和計算問題。大數(shù)據(jù)和云就像是一個問題的兩個方面,大數(shù)據(jù)是問題,云是用來解決問題的方法。海量的數(shù)據(jù)存儲在云端,數(shù)據(jù)的搜集、存儲、訪問、傳輸都通過云端,這也成為黑客的攻擊目標,這也要求必須制定更高級別的云計算采購策略。
3.2 優(yōu)化數(shù)據(jù)安全管理體系
建立計算機網(wǎng)絡(luò)數(shù)據(jù)安全保護措施的目的是確保經(jīng)過網(wǎng)絡(luò)傳輸和交換的數(shù)據(jù)不會發(fā)生增加、修改、丟失和泄密。數(shù)據(jù)安全包括數(shù)據(jù)處理安全和數(shù)據(jù)存儲安全兩個方面。大數(shù)據(jù)的安全性是確定的、可衡量的,而確定性的訪問可以更加有效地主動防御來完成數(shù)據(jù)安全保障。為了保障數(shù)據(jù)安全,我們可以實施數(shù)據(jù)庫準入系統(tǒng)、數(shù)據(jù)庫透明加密系統(tǒng)、數(shù)據(jù)脫敏系統(tǒng)。
3.3 加大挖掘隱私保護力度
大量數(shù)據(jù)在其帶來巨大價值的背后,隱私問題不容忽視。隨著生產(chǎn)、收集、存儲數(shù)據(jù)量的增加,隱私問題尤為凸顯。目前,各社交網(wǎng)站都不同程度地開放部分數(shù)據(jù),這些數(shù)據(jù)容易被惡意收集利用,所以要加強數(shù)據(jù)保護立法,相關(guān)數(shù)據(jù)收集部門和使用部門應(yīng)加強個人隱私的保護措施。對于泄露隱私的個人或組織,要嚴肅查處、懲治,加大打擊力度。
3.4 提高抗網(wǎng)絡(luò)攻擊能力
在大數(shù)據(jù)條件下,黑客、間諜活動也比以往更猛烈更猖獗。他們的組織性更強、更加專業(yè),作案手段更先進、手段更高明。美國等發(fā)達國家,網(wǎng)絡(luò)威脅情報服務(wù)和漏洞服務(wù)已非常發(fā)達,購買威脅情報服務(wù)和安全服務(wù)非常流行,幾乎各個企業(yè)都會購買其他企業(yè)的漏洞服務(wù)。因為攻擊事件所用的手法并不是唯一的,它還可能被用來攻擊其他網(wǎng)絡(luò),如果我們能及時獲取攻擊數(shù)據(jù)做好安全防范工作可避免遭受損失。
3.5 及時出臺相關(guān)法規(guī)政策
大數(shù)據(jù)已上升到國家戰(zhàn)略的角度,但關(guān)于大數(shù)據(jù)的政策支持還只停留在國家層面上的總體框架,缺少細節(jié)的、具體的一些執(zhí)行措施。我們需要根據(jù)世界的發(fā)展形勢和國家的總體策略,制定出細節(jié)性的大數(shù)據(jù)實施行動計劃。
法律法規(guī)方面,在大數(shù)據(jù)背景下,首先明確數(shù)據(jù)怎么收集,從法律上規(guī)范數(shù)據(jù)的搜集,哪些信息能收集,哪些部門能收集,都需要加以明確;其次明確怎么用。因為大數(shù)據(jù)的價值是在挖掘中不斷發(fā)現(xiàn)的,數(shù)據(jù)的價值很大一部分體現(xiàn)在二級用途上,如何根據(jù)需要對數(shù)據(jù)進行利用,哪些人能用,哪些事能用。我們需要建立一個不一樣的數(shù)據(jù)保護模式,這個模式應(yīng)該更著重于數(shù)據(jù)使用者為其行為承擔責任,而不是將重心放在數(shù)據(jù)收集上。還要明確怎么管,特別就我們軍隊內(nèi)部而言,保密是大事,要是我們搜集來的信息被敵特分子獲得或在隱私和預(yù)測方面對大數(shù)據(jù)管理不當,后果不堪設(shè)想。所以說在信息高度化集中后,怎么保證信息安全就顯得尤為重要。
參考文獻
[1] 維克托·邁爾-舍恩伯格,肯尼斯·庫克耶.大數(shù)據(jù)時代[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2013.
[2] 涂子沛.數(shù)據(jù)之巔[M].北京:中信出版社,2014.
[3] 艾伯特-拉斯洛·巴拉巴西.爆發(fā):大數(shù)據(jù)時代預(yù)見未來的新思維[M].馬慧,譯.北京:中國人民大學出版社,2012.
[4] 王燃.大數(shù)據(jù)偵查[M].北京:清華大學出版社,2017.