徐培德
摘 要:大數(shù)據(jù)是國(guó)家重要的戰(zhàn)略資源,其應(yīng)用前景極其廣闊,已滲透進(jìn)各行各業(yè)當(dāng)中,為社會(huì)各領(lǐng)域的發(fā)展帶來(lái)前所未有的機(jī)遇。大數(shù)據(jù)及其應(yīng)用價(jià)值日漸凸顯,其帶來(lái)的數(shù)據(jù)安全問(wèn)題已成為影響其應(yīng)用發(fā)展的一個(gè)重要因素。如何實(shí)現(xiàn)對(duì)大數(shù)據(jù)的安全應(yīng)用,發(fā)揮其重要的戰(zhàn)略作用,是當(dāng)前國(guó)內(nèi)外學(xué)者高度關(guān)注的重要課題之一。
關(guān)鍵詞:大數(shù)據(jù);應(yīng)用;安全
一、大數(shù)據(jù)的內(nèi)涵及其應(yīng)用特點(diǎn)
全球知名咨詢公司麥肯錫指出,大數(shù)據(jù)是時(shí)代創(chuàng)新和生產(chǎn)力發(fā)展的前沿力量,大數(shù)據(jù)的數(shù)量呈現(xiàn)出不斷增長(zhǎng)的狀態(tài),且不同機(jī)構(gòu)所需的數(shù)據(jù)集存在差異,這也意味著其本身具備的數(shù)據(jù)集不同,因而大數(shù)據(jù)具有不斷增長(zhǎng)、日益龐大,且具有時(shí)效性、以多樣化形式存在等新的特質(zhì),這是基于數(shù)量、速度、種類這三個(gè)方面維度的闡述,而對(duì)大數(shù)據(jù)的控制同樣也基于三個(gè)方面維度。盡管當(dāng)前學(xué)界對(duì)大數(shù)據(jù)的定義各執(zhí)一詞,但對(duì)其基本要素的界定卻是一致的,即包括數(shù)據(jù)的生成、采集、存儲(chǔ)和處理。結(jié)合大數(shù)據(jù)的內(nèi)涵,可以將其應(yīng)用特點(diǎn)概括為幾點(diǎn):其一是大數(shù)據(jù)的數(shù)量極為龐大,且增長(zhǎng)速度通常呈現(xiàn)出幾何級(jí)數(shù)的發(fā)展態(tài)勢(shì);其二,大數(shù)據(jù)種類多樣、類別繁多,可分為原始類數(shù)據(jù)、函數(shù)數(shù)據(jù)、多元型數(shù)據(jù)等;其三,當(dāng)前數(shù)據(jù)的處理速度日益加快,且分析處理的能力日益增強(qiáng),能更持久、廣泛地服務(wù)于用戶,為用戶提供大量有價(jià)值的信息參考依據(jù)。
二、大數(shù)據(jù)的應(yīng)用及安全隱患
最早的大數(shù)據(jù)應(yīng)用是從互聯(lián)網(wǎng)搜索平臺(tái)中檢索海量數(shù)據(jù)。首先是在商業(yè)領(lǐng)域中,通過(guò)構(gòu)建關(guān)系型數(shù)據(jù)庫(kù)系統(tǒng),用以收集并存儲(chǔ)企業(yè)的數(shù)據(jù),利于查詢、分析及處理。其次,在互聯(lián)網(wǎng)應(yīng)用領(lǐng)域中,隨著網(wǎng)絡(luò)在線社交的普及應(yīng)用,各種結(jié)構(gòu)類型的數(shù)據(jù)(諸如圖片、視頻、音頻等)不斷涌現(xiàn),互聯(lián)網(wǎng)的功能日益豐富,非結(jié)構(gòu)化的數(shù)據(jù)技術(shù)日趨成熟。再次,科學(xué)研究領(lǐng)域需進(jìn)行大量數(shù)據(jù)的收集,并研究數(shù)據(jù)分析、共享的平臺(tái),為大數(shù)據(jù)的廣泛應(yīng)用創(chuàng)造條件。當(dāng)前,大數(shù)據(jù)在諸多領(lǐng)域中得以廣泛應(yīng)用,并形成相應(yīng)的數(shù)據(jù)應(yīng)用模式,表現(xiàn)出極為廣闊的發(fā)展前景。譬如在商業(yè)領(lǐng)域中的應(yīng)用實(shí)現(xiàn)了商業(yè)智能,通過(guò)對(duì)用戶資料、產(chǎn)品、服務(wù)等用戶行為綜合分析,挖掘用戶的行為習(xí)慣和喜好,得出精確、細(xì)化的結(jié)果,從而有針對(duì)性地調(diào)整、優(yōu)化營(yíng)銷策略、產(chǎn)品、服務(wù),制定個(gè)性化的用戶策略,這在商業(yè)營(yíng)銷中的占比越來(lái)越高。
三、大數(shù)據(jù)的安全應(yīng)用路徑探討
(一)保持?jǐn)?shù)據(jù)隱私的安全性
數(shù)據(jù)隱私主要是敏感的數(shù)據(jù)信息,包括個(gè)人的隱私,也包括未經(jīng)許可的信息。大數(shù)據(jù)存在非常多的數(shù)據(jù)存貯需求,在分布計(jì)算的信息傳輸與數(shù)據(jù)交換時(shí),對(duì)保存點(diǎn)中的使用者隱私數(shù)據(jù)不被非法泄露與應(yīng)用是關(guān)鍵問(wèn)題。但是大數(shù)據(jù)的數(shù)據(jù)比傳統(tǒng)數(shù)據(jù)更為復(fù)雜,在數(shù)據(jù)隱私保護(hù)方面,傳統(tǒng)數(shù)據(jù)是靜態(tài)數(shù)據(jù),而大數(shù)據(jù)是動(dòng)態(tài)數(shù)據(jù)屬性,因此對(duì)于使用者隱私數(shù)據(jù)的保護(hù)需要做到這幾個(gè)方面:一是運(yùn)用替換、置換、混合等對(duì)數(shù)據(jù)加密,增強(qiáng)數(shù)據(jù)庫(kù)的安全度;二是做好隱私保護(hù)的宣傳工作,提高公民網(wǎng)絡(luò)安全防范意識(shí),養(yǎng)成良好的上網(wǎng)習(xí)慣,如上網(wǎng)過(guò)程中,電話號(hào)碼,興趣愛(ài)好、身份證號(hào)、家庭住址等個(gè)人信息更是不能輕易泄露;三是完善我國(guó)網(wǎng)絡(luò)立法制度。
(二)保證大數(shù)據(jù)的質(zhì)量
數(shù)據(jù)的質(zhì)量認(rèn)定是通過(guò)數(shù)據(jù)的精準(zhǔn)性、數(shù)據(jù)可用性、數(shù)據(jù)真實(shí)性、數(shù)據(jù)的時(shí)效性、數(shù)據(jù)的冗余度、數(shù)據(jù)的一致性、數(shù)據(jù)的完整性、數(shù)據(jù)的易于理解性等方面體現(xiàn)的,影響數(shù)據(jù)質(zhì)量的因素包括數(shù)據(jù)的生成、數(shù)據(jù)的搜集、數(shù)據(jù)的輸送與保存等方面。當(dāng)前在大數(shù)據(jù)質(zhì)量方面的構(gòu)建措施有以下幾個(gè)方面:一是在數(shù)據(jù)的搜集過(guò)程中加強(qiáng)對(duì)數(shù)據(jù)的保護(hù)和甄別驗(yàn)證,確保數(shù)據(jù)的真實(shí)性與有效性;二是大數(shù)據(jù)保存過(guò)程中,為了確保數(shù)據(jù)的可用性、完整性、私密性,還需要加強(qiáng)一定的技術(shù)保障措施,如利用校驗(yàn)措施確保數(shù)據(jù)的完整性,運(yùn)用訪問(wèn)控制、安全審計(jì)作用確保數(shù)據(jù)的安全性,以及利用冗余方式確保數(shù)據(jù)的可用性;三是加強(qiáng)對(duì)大數(shù)據(jù)的分析處理來(lái)提升數(shù)據(jù)的質(zhì)量,可以采用讀寫(xiě)操作的權(quán)限設(shè)置完成安全性管理,采用各種分析辦法所形成的結(jié)果,來(lái)彼此驗(yàn)證,以確保數(shù)據(jù)分析獲得結(jié)果的準(zhǔn)確無(wú)誤性和可使用性;四是采用設(shè)置訪問(wèn)控制、認(rèn)證授權(quán)等措施對(duì)獲得的結(jié)果進(jìn)行安全保護(hù);五是強(qiáng)化大數(shù)據(jù)處理流程的整體管理,如在數(shù)據(jù)的保存形式中,所選擇的方式,需要由所搜集的大數(shù)據(jù)類型而定。
(三) 完善大數(shù)據(jù)的安全機(jī)制
大數(shù)據(jù)應(yīng)用的過(guò)程中,網(wǎng)絡(luò)共享平臺(tái)開(kāi)放,給數(shù)據(jù)的安全帶來(lái)非常大的風(fēng)險(xiǎn),計(jì)算機(jī)病毒、黑客時(shí)有入侵,對(duì)商業(yè)機(jī)密和個(gè)人隱私等形成了巨大威脅,經(jīng)?!耙粋€(gè)數(shù)據(jù)造成的損失可能會(huì)導(dǎo)致154美元損失,數(shù)據(jù)攻擊者幾個(gè)小時(shí)就可以獲得數(shù)據(jù),一旦進(jìn)入數(shù)據(jù)庫(kù),便可以悄無(wú)聲息地把數(shù)據(jù)拿走……”過(guò)去采取小規(guī)模加密的措施已經(jīng)無(wú)法有效地在大數(shù)據(jù)環(huán)境下運(yùn)用。為了有效確保數(shù)據(jù)的安全,必須對(duì)大數(shù)據(jù)的安全機(jī)制進(jìn)行完善,根據(jù)數(shù)據(jù)結(jié)構(gòu)與非結(jié)構(gòu)數(shù)據(jù)的差別,應(yīng)用不同的數(shù)據(jù)加密措施。隨著大數(shù)據(jù)應(yīng)用增強(qiáng),還要加強(qiáng)對(duì)數(shù)據(jù)的隔離辦法的研究,以及構(gòu)建數(shù)據(jù)可追溯機(jī)制,讓數(shù)據(jù)在高效使用時(shí)能夠獲得具有可用性、可控性和完整性。
(四)發(fā)展大數(shù)據(jù)備份和恢復(fù)技術(shù)
為了避免數(shù)據(jù)在輸入輸出中發(fā)生損失等安全問(wèn)題,大數(shù)據(jù)備份和恢復(fù)技術(shù)也是計(jì)算數(shù)據(jù)庫(kù)技術(shù)所探究的一個(gè)熱門(mén)話題。在大數(shù)據(jù)備份過(guò)程中可以采取定期備份與不定期備份的方式。在采取不定期備份時(shí),要構(gòu)建備份日志的建立工作,目的是當(dāng)計(jì)算機(jī)發(fā)生故障時(shí),數(shù)據(jù)可以及時(shí)恢復(fù),這樣可以杜絕滯后狀況出現(xiàn)。在數(shù)據(jù)備份中,我們還可以采取數(shù)據(jù)遠(yuǎn)程復(fù)制備份措施,該方法是利用軟件數(shù)據(jù)復(fù)制和硬件數(shù)據(jù)復(fù)制技術(shù)完成的,當(dāng)出現(xiàn)人為的誤刪、修改、軟硬件的故障與黑客入侵、病毒植入,以及數(shù)據(jù)的完整性與可用性遭到破壞時(shí),能夠確保本地?cái)?shù)據(jù)中心和遠(yuǎn)程備份數(shù)據(jù)中心的數(shù)據(jù)一致性。
其次是數(shù)據(jù)庫(kù)恢復(fù)技術(shù)。在數(shù)據(jù)庫(kù)恢復(fù)的過(guò)程中,按照實(shí)際的不同需求采取不同程度的恢復(fù)措施,如全盤(pán)恢復(fù)、指定文件恢復(fù)和重定向恢復(fù)等。全盤(pán)恢復(fù)是發(fā)生火災(zāi)等不可抵抗因素時(shí),將所有的信息都恢復(fù)到以前的某一個(gè)狀態(tài),這類恢復(fù)會(huì)使得一部分?jǐn)?shù)據(jù)丟失,所以很少使用。指定文件恢復(fù)用于對(duì)單一文件的恢復(fù),主要是對(duì)已經(jīng)完成的文件備份,就可以實(shí)現(xiàn)單個(gè)文件的恢復(fù)。重定向恢復(fù)是用類似克隆的方式,在新的境況中建立起與當(dāng)前數(shù)據(jù)庫(kù)一樣的一個(gè)新數(shù)據(jù),重定向恢復(fù)與定向恢復(fù)原理一樣,但是更具便捷性和適應(yīng)性,可以適應(yīng)不同的需求。
(五) 優(yōu)化信息安全技術(shù)
大數(shù)據(jù)時(shí)代下,以往的信息體系架構(gòu)已經(jīng)完全改變,數(shù)據(jù)倉(cāng)庫(kù)已經(jīng)變成流動(dòng)的、連接與信息共享的數(shù)據(jù)池,可使用的信息增多,許多以往不能使用的數(shù)據(jù)類型也被大家所利用。但是隨著數(shù)據(jù)的信息量增加、處理形式的變化,信息安全的問(wèn)題也更加突出,有必要針對(duì)大數(shù)據(jù)信息安全保護(hù)采取一定的優(yōu)化措施,例如,針對(duì)入侵日志情況,通過(guò)分析可以找到里面隱藏的安全漏洞,這樣能夠?qū)崿F(xiàn)對(duì)更高級(jí)別的安全威脅處理。又如,對(duì)于計(jì)算機(jī)病毒和漏洞,可以掌握計(jì)算機(jī)病毒或者漏洞存在的某些類型特征,以更好地應(yīng)對(duì)這類存在的威脅。
四、結(jié)語(yǔ)
大數(shù)據(jù)在社會(huì)經(jīng)濟(jì)各個(gè)領(lǐng)域中發(fā)揮著重大作用,同時(shí),在數(shù)據(jù)驅(qū)動(dòng)的環(huán)境下,一些存儲(chǔ)著重要敏感信息的系統(tǒng)更是頻繁遭受網(wǎng)絡(luò)攻擊,其安全性直接影響著國(guó)家的科技、經(jīng)濟(jì)發(fā)展等,因而做好對(duì)大數(shù)據(jù)的開(kāi)發(fā)及應(yīng)用,保障其安全性,是當(dāng)前亟待解決的重要問(wèn)題。
參考文獻(xiàn)
[1]安暉.大數(shù)據(jù)競(jìng)爭(zhēng)前沿動(dòng)態(tài)[J].人民論壇,2013(14).
[2]維克托·邁爾·舍恩伯格,盛楊燕,周濤,譯.大數(shù)據(jù)時(shí)代[M].杭州:浙江人民出版社,2013.
[3]周錦昌,孟昭莉.大數(shù)據(jù)應(yīng)用的轉(zhuǎn)變:邏輯判斷到系統(tǒng)思考[J].通信世界,2013(22).
[4]汪為,張雅雅.大數(shù)據(jù)環(huán)境革新官方統(tǒng)計(jì)[J].浙江經(jīng)濟(jì),2013(21).
[5]馮永強(qiáng),張良,馮怡,等.大數(shù)據(jù)應(yīng)用的現(xiàn)狀與展望[J].信息化建設(shè),2015(12).