吳遠(yuǎn)棟 雷敬祥
摘 要:隨著云計(jì)算和網(wǎng)絡(luò)技術(shù)的快速發(fā)展,越來越多的數(shù)據(jù)將被存放在云端,云計(jì)算的數(shù)據(jù)檢索已成為了熱門的話題。本文基于國(guó)內(nèi)外的最新研究成果,提出了云計(jì)算的數(shù)據(jù)檢索方案,以及未來的發(fā)展趨勢(shì)。
關(guān)鍵詞:云計(jì)算;網(wǎng)絡(luò)技術(shù);數(shù)據(jù)檢索
0 前言
在當(dāng)今信息技術(shù)高度發(fā)達(dá)的時(shí)代,云計(jì)算無疑是學(xué)術(shù)界、互聯(lián)網(wǎng)企業(yè)、通信運(yùn)營(yíng)商、政府等關(guān)注的寵兒。云計(jì)算主要是基于網(wǎng)絡(luò)就是計(jì)算機(jī)的重要思想,通過將大量的存儲(chǔ)資源和計(jì)算資源用網(wǎng)絡(luò)連接起來進(jìn)行統(tǒng)一的管理,構(gòu)成一個(gè)龐大的虛擬IT資源池向用戶提供按需服務(wù)。在 IT 產(chǎn)業(yè)界[1],云計(jì)算被普遍認(rèn)為是繼互聯(lián)網(wǎng)經(jīng)濟(jì)繁榮以來的又一個(gè)重要 IT 產(chǎn)業(yè)增長(zhǎng)點(diǎn),具有巨大的市場(chǎng)增長(zhǎng)前景;由于云計(jì)算的發(fā)展理念符合當(dāng)前低碳經(jīng)濟(jì)與綠色計(jì)算的總體趨勢(shì),并極有可能發(fā)展成為未來網(wǎng)絡(luò)空間的神經(jīng)系統(tǒng)。不可否認(rèn),云計(jì)算在信息領(lǐng)域引起了一場(chǎng)新的工業(yè)化革命,其帶動(dòng)了整個(gè)互聯(lián)網(wǎng)、傳統(tǒng)電信產(chǎn)業(yè)乃至真?zhèn)€社會(huì)產(chǎn)業(yè)的變革,但當(dāng)前,隨著云端數(shù)據(jù)的膨脹,要從云端海量的數(shù)據(jù)中快速高效地檢索出想要的數(shù)據(jù),已經(jīng)成為一個(gè)急需解決的問題,因此數(shù)據(jù)檢索技術(shù)越來越成為制約云計(jì)算發(fā)展的主要因素。
1 云計(jì)算下的大數(shù)據(jù)加密檢索技術(shù)
(一)云計(jì)算的定義
云計(jì)算的定義有許多種,其中得到業(yè)界最廣泛認(rèn)可的是2011年由美國(guó)國(guó)家標(biāo)準(zhǔn)和技術(shù)研究院(NIST)組織云計(jì)算產(chǎn)業(yè)界的主要廠商經(jīng)過多次討論研究后提出的[2]:云計(jì)算是一種通過網(wǎng)絡(luò)以便捷、按需的形式從共享的可配置計(jì)算資源池(這些資源包括網(wǎng)絡(luò)、服務(wù)器、存儲(chǔ)、應(yīng)用和服務(wù))中獲取服務(wù)的業(yè)務(wù)模式,云計(jì)算業(yè)務(wù)資源應(yīng)該支持通過簡(jiǎn)潔的管理或交互過程快速地部署和釋放。
(二)云計(jì)算下大數(shù)據(jù)的加密檢索技術(shù)
這里的加密檢索其實(shí)是對(duì)密文進(jìn)行檢索,由于用戶的數(shù)據(jù)存放在云端,那么就失去了保密性,這對(duì)用戶而言是致命的,這也是阻礙云計(jì)算發(fā)展的一個(gè)關(guān)鍵因素,故用戶在將數(shù)據(jù)存放在云端之前,先對(duì)要上傳的數(shù)據(jù)進(jìn)行加密,由于云服務(wù)提供商不知道加密算法和加密密鑰,所以用戶的數(shù)據(jù)對(duì)云服務(wù)提供商而言是完全保密的。但是為了用戶以后檢索文件的便利與高效率,就需要在將數(shù)據(jù)密文上傳云端之前在密文數(shù)據(jù)的后面添加一個(gè)MAC函數(shù)值,以后用戶需要檢索想要的數(shù)據(jù)時(shí)就可以直接通過計(jì)算MAC函數(shù)值,然后與云端密文數(shù)據(jù)后面的MAC函數(shù)值進(jìn)行對(duì)比,如果相等,則該數(shù)據(jù)就是所檢索的,否則不是。其中該MAC函數(shù)值是這樣得到的:提取數(shù)據(jù)明文的關(guān)鍵詞組合或者文章標(biāo)題或者某幾個(gè)句子的組合,進(jìn)行MAC函數(shù)計(jì)算而得到的。其中提取數(shù)據(jù)明文的關(guān)鍵詞組合或者文章標(biāo)題或者某幾個(gè)句子的組合的優(yōu)點(diǎn)是,計(jì)算代價(jià)小,它突破了之前用整個(gè)明文數(shù)據(jù)進(jìn)行MAC計(jì)算的思想,從而大大降低了計(jì)算量,提高了用戶檢索所需文件數(shù)據(jù)的速度。
當(dāng)我們需要檢索某個(gè)文件數(shù)據(jù)時(shí),首先通過計(jì)算組合的關(guān)鍵詞或者文章標(biāo)題或者某一個(gè)句子的MAC函數(shù),結(jié)果為M位,然后將計(jì)算后的結(jié)果給云服務(wù)提供商,云服務(wù)提供商只需檢驗(yàn)文件數(shù)據(jù)的后M位,找到M位相同的數(shù)據(jù)則說明其是要查找的數(shù)據(jù)。然后就可以將搜索到的數(shù)據(jù)傳給搜索者。在上述技術(shù)中,由于原始數(shù)據(jù)以及檢索數(shù)據(jù)都是加密的,故對(duì)云服務(wù)提供商而言都是保密的,從而達(dá)到了加密檢索的目的。
通過以上分析,基于云計(jì)算的大數(shù)據(jù)加密檢索技術(shù)如圖1所示:
3 加密檢索技術(shù)未來發(fā)展趨勢(shì)
通過云計(jì)算的加密檢索技術(shù),既達(dá)到了用戶數(shù)據(jù)保密的目標(biāo),又由于該技術(shù)方便簡(jiǎn)潔,計(jì)算量小,搜索效率高,因此有很大的應(yīng)用前景。同時(shí)此技術(shù)巧妙地運(yùn)用了消息認(rèn)證碼,故即使不同文件重疊率很高,只要所選關(guān)鍵詞或關(guān)鍵句組合不同,那么它們計(jì)算出的MAC值也會(huì)不同,這就更加證明了此技術(shù)的精確性。但是該技術(shù)的一個(gè)缺陷在于,如果在重疊率很高的文件中所選的關(guān)鍵字或關(guān)鍵詞一樣,那么就不能保證最終檢索出來的文件數(shù)據(jù)是之前想要的。故在保證方便簡(jiǎn)潔高效的同時(shí),如何提高加密檢索的精度是未來急需解決的問題。
4 結(jié)束語(yǔ)
隨著云計(jì)算與大數(shù)據(jù)的膨脹,加密檢索技術(shù)日益凸顯出其重要作用。本文通過研究云計(jì)算的加密檢索技術(shù),歸納出了該技術(shù)的優(yōu)點(diǎn),然而無論從理論上還是從技術(shù)上,該技術(shù)還有待優(yōu)化。而要真正優(yōu)化云計(jì)算加密檢索技術(shù),還需要學(xué)術(shù)界、產(chǎn)業(yè)界以及政府相關(guān)部門的共同努力才能實(shí)現(xiàn)。
參考文獻(xiàn):
[1]馮登國(guó)等.云計(jì)算安全研究[J].軟件學(xué)報(bào),2011,20(1):71-83.
[2]MELL P, GRANCE T. NIST SD 800-145,The NIST definition of cloud computing [S]. Gaithersburg, MD: NIST Special Publication,2011.
科技經(jīng)濟(jì)市場(chǎng)2015年3期