王惠峰 李戰(zhàn)懷 張 曉 孫 鑒 趙曉南
(西北工業(yè)大學(xué)計(jì)算機(jī)學(xué)院 西安 710129)(wanghuifeng12@163.com)
云存儲(chǔ)中數(shù)據(jù)完整性自適應(yīng)審計(jì)方法
王惠峰 李戰(zhàn)懷 張 曉 孫 鑒 趙曉南
(西北工業(yè)大學(xué)計(jì)算機(jī)學(xué)院 西安 710129)(wanghuifeng12@163.com)
作為云存儲(chǔ)安全的重要問(wèn)題,數(shù)據(jù)完整性驗(yàn)證技術(shù)受到學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注.為了驗(yàn)證云端數(shù)據(jù)完整性,研究者提出了多個(gè)數(shù)據(jù)完整性公開(kāi)審計(jì)模型.然而,現(xiàn)有的數(shù)據(jù)完整性審計(jì)模型采用固定參數(shù)審計(jì)所有文件,浪費(fèi)了大量計(jì)算資源,導(dǎo)致系統(tǒng)審計(jì)效率不高.為了提高系統(tǒng)的審計(jì)效率,提出了一種自適應(yīng)數(shù)據(jù)持有性證明方法(self-adaptive provable data possession, SA-PDP),該方法基于文件屬性和用戶需求動(dòng)態(tài)調(diào)整文件的審計(jì)方案,使得文件的審計(jì)需求和審計(jì)方案的執(zhí)行強(qiáng)度高度匹配.為了增強(qiáng)審計(jì)方案更新的靈活性,依據(jù)不同的審計(jì)需求發(fā)起者,設(shè)計(jì)了2種審計(jì)方案動(dòng)態(tài)更新算法.主動(dòng)更新算法保證了審計(jì)系統(tǒng)的覆蓋率,而被動(dòng)更新算法能夠及時(shí)滿足文件的審計(jì)需求.實(shí)驗(yàn)結(jié)果表明:相較于傳統(tǒng)方法,SA-PDP的審計(jì)總執(zhí)行時(shí)間至少減少了50%,有效增加了系統(tǒng)審計(jì)文件的數(shù)量.此外,SA-PDP方法生成的審計(jì)方案的達(dá)標(biāo)率比傳統(tǒng)審計(jì)方法提高了30%.
數(shù)據(jù)安全;云存儲(chǔ);數(shù)據(jù)完整性驗(yàn)證;數(shù)據(jù)可持有性證明;自適應(yīng)審計(jì)
云存儲(chǔ)服務(wù)以其高性?xún)r(jià)比、良好的擴(kuò)展性和按需付費(fèi)等特點(diǎn)受到用戶的普遍歡迎.同時(shí),云存儲(chǔ)服務(wù)面臨許多安全威脅,云端文件的數(shù)據(jù)完整性容易遭受破壞.例如2011年3月谷歌Gmail郵箱出現(xiàn)故障,導(dǎo)致大約15萬(wàn)用戶的數(shù)據(jù)丟失;2012年8月盛大云因物理服務(wù)器磁盤(pán)損壞造成用戶數(shù)據(jù)丟失[1].EMC公司指出,64%的受調(diào)查企業(yè)在過(guò)去12個(gè)月中經(jīng)歷過(guò)數(shù)據(jù)丟失或宕機(jī)事故.數(shù)據(jù)完整性驗(yàn)證[1-2]作為云存儲(chǔ)安全的重要問(wèn)題,受到學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注.數(shù)據(jù)完整性驗(yàn)證能夠及時(shí)發(fā)現(xiàn)數(shù)據(jù)損壞,為數(shù)據(jù)恢復(fù)贏得寶貴時(shí)間.但云存儲(chǔ)中文件數(shù)量龐大,數(shù)據(jù)完整性驗(yàn)證面臨沉重的審計(jì)負(fù)擔(dān),不合理的審計(jì)方案將嚴(yán)重影響系統(tǒng)的審計(jì)效率.因此,如何有效降低大規(guī)模文件的審計(jì)成本、提高系統(tǒng)的審計(jì)效率是一個(gè)亟需解決的重要問(wèn)題.
近年來(lái),研究人員針對(duì)數(shù)據(jù)完整性驗(yàn)證問(wèn)題提出了多種解決方案[3-20].Juels等人[3]提出了一種可檢索數(shù)據(jù)證明模型(proofs of retrievability, POR),要求返回指定位置的“哨兵”來(lái)檢查文件損壞.但是“哨兵”數(shù)量固定,該模型只支持有限次數(shù)的審計(jì),而重新布置“哨兵”代價(jià)高昂.Ateniese等人[4]提出一種數(shù)據(jù)持有性證明模型(provable data possession, PDP),采用隨機(jī)抽樣方式驗(yàn)證文件,使審計(jì)次數(shù)不受限制,并且PDP將認(rèn)證信息與原始數(shù)據(jù)分離,保持了原始文件的獨(dú)立性.PDP已經(jīng)成為驗(yàn)證云存儲(chǔ)數(shù)據(jù)完整性審計(jì)的主要方法.
針對(duì)PDP方法的數(shù)據(jù)動(dòng)態(tài)更新、公開(kāi)審計(jì)和協(xié)同存儲(chǔ)等問(wèn)題,研究人員進(jìn)行了深入研究.Erway等人[6]利用等級(jí)數(shù)據(jù)跳表實(shí)現(xiàn)了支持?jǐn)?shù)據(jù)動(dòng)態(tài)更新的PDP模型,但中間節(jié)點(diǎn)計(jì)算復(fù)雜.王聰?shù)热薣9]利用merkle hash tree結(jié)構(gòu)簡(jiǎn)化了中間節(jié)點(diǎn)計(jì)算過(guò)程.朱巖和王博洋等人[11-12]利用index-hash table二維表結(jié)構(gòu)實(shí)現(xiàn)了數(shù)據(jù)的動(dòng)態(tài)更新,該結(jié)構(gòu)適合更新請(qǐng)求較少的情景.禹勇等人[13]指出了數(shù)據(jù)更新時(shí)面臨的偽造攻擊和重放攻擊的問(wèn)題,通過(guò)改進(jìn)審計(jì)協(xié)議增強(qiáng)了系統(tǒng)的安全性.為了減輕用戶的計(jì)算負(fù)擔(dān),基于代理的審計(jì)模型[9,14-15]將文件審計(jì)任務(wù)委托給第三方執(zhí)行,并利用隨機(jī)隱碼技術(shù)實(shí)現(xiàn)了認(rèn)證過(guò)程的隱私保護(hù).此外,朱巖等人[16]提出了多云協(xié)同存儲(chǔ)環(huán)境下的PDP方案,王化群等人[17]增強(qiáng)了該方案的安全性.賈小華等人[15]實(shí)現(xiàn)了多云環(huán)境下文件的批量審計(jì).王博洋等人[12]提出了支持文件共享的PDP方案,實(shí)現(xiàn)了低成本的用戶共享權(quán)限的授予與回收.付艷艷等人[20]提出了面向云存儲(chǔ)的多副本數(shù)據(jù)完整性審計(jì)方案.
以上方案為解決云存儲(chǔ)數(shù)據(jù)完整性審計(jì)問(wèn)題提供了可行思路,為進(jìn)一步研究數(shù)據(jù)完整性審計(jì)模型及算法奠定了良好的基礎(chǔ).然而,現(xiàn)有方案僅考慮了單個(gè)文件的審計(jì)問(wèn)題,未考慮大規(guī)模文件的協(xié)調(diào)審計(jì)問(wèn)題,統(tǒng)稱(chēng)為B-PDP(basic PDP)模型[15].在云存儲(chǔ)環(huán)境下,面對(duì)大數(shù)據(jù)量和多樣性的審計(jì)需求,現(xiàn)有方案存在的問(wèn)題是:1)文件數(shù)量龐大,完成全域文件審計(jì)成本高;2)文件活躍程度不同,活躍文件不能及時(shí)得到審計(jì),導(dǎo)致用戶體驗(yàn)下降,不活躍文件可能被頻繁審計(jì)帶來(lái)了不必要的審計(jì)開(kāi)銷(xiāo);3)文件被損壞概率不同,高強(qiáng)度審計(jì)所有文件將導(dǎo)致審計(jì)負(fù)載過(guò)重,在現(xiàn)實(shí)中不可行;4)采用單一審計(jì)策略容易造成某些文件長(zhǎng)時(shí)間得不到審計(jì),導(dǎo)致審計(jì)系統(tǒng)覆蓋率不足.
為了解決以上問(wèn)題,本文提出了一種綜合考慮文件審計(jì)需求、審計(jì)效率和審計(jì)覆蓋率的數(shù)據(jù)完整性自適應(yīng)審計(jì)方法SA-PDP(self-adaptive provable data possession).該方法依據(jù)文件屬性制定滿足其安全需求的審計(jì)方案,協(xié)調(diào)完成全域文件的審計(jì),具有低成本、高效率等特點(diǎn),既能滿足用戶的審計(jì)需求,又能有效減少文件審計(jì)成本,提高系統(tǒng)的審計(jì)效率.
本文的主要工作及貢獻(xiàn)如下:
1) 設(shè)計(jì)并實(shí)現(xiàn)了SA-PDP方法,該方法能夠基于文件屬性自適應(yīng)調(diào)節(jié)數(shù)據(jù)完整性審計(jì)方案,使審計(jì)方案的執(zhí)行強(qiáng)度與文件的審計(jì)需求高度匹配;
2) 提出了2種審計(jì)方案的動(dòng)態(tài)更新算法,主動(dòng)更新算法保證了審計(jì)系統(tǒng)的覆蓋率,被動(dòng)更新算法能夠及時(shí)滿足文件的審計(jì)需求;
3) 提出了文件審計(jì)方案的評(píng)價(jià)標(biāo)準(zhǔn),通過(guò)計(jì)算審計(jì)方案的執(zhí)行強(qiáng)度和文件的審計(jì)需求,動(dòng)態(tài)描述了二者的匹配程度;
4) 實(shí)現(xiàn)了原型系統(tǒng)SA-PDP和B-PDP,分析了系統(tǒng)的存儲(chǔ)開(kāi)銷(xiāo)和通信開(kāi)銷(xiāo),并從審計(jì)效率和審計(jì)方案的匹配度方面進(jìn)行了多組對(duì)比實(shí)驗(yàn);相較于B-PDP方法,SA-PDP的審計(jì)總執(zhí)行時(shí)間減少了50%,并且SA-PDP審計(jì)方案的達(dá)標(biāo)率提高了30%.
本節(jié)首先對(duì)數(shù)據(jù)完整性審計(jì)的系統(tǒng)模型和相關(guān)概念進(jìn)行了描述與定義,然后介紹預(yù)備知識(shí).
1.1 數(shù)據(jù)完整性審計(jì)的系統(tǒng)模型
數(shù)據(jù)完整性審計(jì)系統(tǒng)由云存儲(chǔ)用戶、云存儲(chǔ)服務(wù)器、第三方審計(jì)者組成,如圖1所示.用戶是云存儲(chǔ)服務(wù)的使用者;云存儲(chǔ)服務(wù)器為用戶提供計(jì)算和存儲(chǔ)服務(wù);第三方審計(jì)者代替用戶執(zhí)行具體的審計(jì)任務(wù),以減輕用戶的審計(jì)負(fù)擔(dān).
Fig. 1 System model for data integrity checking圖1 數(shù)據(jù)完整性審計(jì)的系統(tǒng)模型
數(shù)據(jù)完整性審計(jì)[15]包含5個(gè)基本算法,分別是密鑰生成算法KeyGen、數(shù)據(jù)塊(data block)認(rèn)證標(biāo)簽生成算法TagGen、挑戰(zhàn)信息生成算法ChalGen、數(shù)據(jù)持有性證據(jù)生成算法ProofGen和證據(jù)驗(yàn)證算法Verify.
數(shù)據(jù)完整性審計(jì)過(guò)程分為3個(gè)階段:
階段1. 初始化階段
用戶使用KeyGen生成數(shù)據(jù)塊認(rèn)證標(biāo)簽的密鑰對(duì)(sktag,pktag)和文件信息加密密鑰skHash,使用TagGen生成文件數(shù)據(jù)塊的認(rèn)證標(biāo)簽集合Φ={φi|i∈[1,n]}和文件的摘要信息Minfo.用戶發(fā)送(Minfo,skHash,pktag)給審計(jì)者,發(fā)送(M,Φ)給云存儲(chǔ)服務(wù)器.
階段2. 確認(rèn)審計(jì)階段
審計(jì)者使用ChalGen生成挑戰(zhàn)信息C并發(fā)送給云存儲(chǔ)服務(wù)器.云存儲(chǔ)服務(wù)器使用ProofGen生成數(shù)據(jù)持有性證據(jù)信息P并返回給審計(jì)者.審計(jì)者使用Verify驗(yàn)證證據(jù)信息,若通過(guò)審計(jì)表明文件完好存儲(chǔ)到云服務(wù)器,刪除本地副本.
階段3. 抽樣審計(jì)階段
定期執(zhí)行階段2,抽樣檢測(cè)云端數(shù)據(jù)的完整性.
1.2 審計(jì)系統(tǒng)的基本概念
審計(jì)系統(tǒng)通過(guò)制定文件的審計(jì)方案協(xié)調(diào)完成所有文件的審計(jì)任務(wù),審計(jì)方案規(guī)定了文件的審計(jì)周期和識(shí)別率.
定義1. 審計(jì)周期T.指連續(xù)2次審計(jì)過(guò)程的間隔時(shí)間.審計(jì)周期越小,審計(jì)文件越頻繁,同時(shí)意味著審計(jì)成本隨之增大.
定義2. 識(shí)別率RR(recognition rate).指審計(jì)系統(tǒng)能夠識(shí)別出文件損壞的概率.假設(shè)文件的數(shù)據(jù)塊總數(shù)為n,數(shù)據(jù)塊損壞個(gè)數(shù)為x且相互獨(dú)立,被挑戰(zhàn)數(shù)據(jù)塊個(gè)數(shù)為c,則RR計(jì)算如下[4]:
(1)
文件的識(shí)別率不同,被查詢(xún)數(shù)據(jù)塊個(gè)數(shù)差異明顯,如圖2所示.例如,數(shù)據(jù)塊總數(shù)為10 000的文件,當(dāng)RR≥99%時(shí),c≥450;當(dāng)RR≥90%時(shí),c≥228.
Fig. 2 The number of queried blocks under different RR圖2 不同識(shí)別率下的查詢(xún)數(shù)據(jù)塊塊數(shù)
定義3. 審計(jì)方案AP(audit plan).指執(zhí)行文件審計(jì)的具體計(jì)劃,AP由形如〈T,RR〉的二元序偶組成,T是文件的審計(jì)周期,RR是識(shí)別率.文件Mk的審計(jì)方案表示為APk.
文件M作為系統(tǒng)的審計(jì)對(duì)象,由n個(gè)數(shù)據(jù)塊組成,每個(gè)數(shù)據(jù)塊包含s個(gè)數(shù)據(jù)扇(data sector),表示為M={mij|i∈[1,n],j∈[1,s]}.數(shù)據(jù)塊是驗(yàn)證文件完整性的基本單位,數(shù)據(jù)扇是文件讀寫(xiě)的基本單位.文件的屬性信息反映了文件審計(jì)需求,并據(jù)此確定文件的審計(jì)方案.
定義4. 文件屬性.描述了文件狀態(tài)和特征,由形式為〈d,h〉的二元序偶組成,d為文件的損壞概率,h為文件的訪問(wèn)熱度.文件損壞概率預(yù)測(cè)文件遭到損壞的可能性大??;文件訪問(wèn)熱度反映了文件在當(dāng)前時(shí)間區(qū)間的活躍程度.文件Mk的屬性記為Attrk(d,h).
Fig. 3 Audit queue for storing the audit projects圖3 審計(jì)方案隊(duì)列
1.3 預(yù)備知識(shí)
雙線性對(duì)映射是執(zhí)行數(shù)據(jù)完整性驗(yàn)證的基礎(chǔ)函數(shù),定義如下:存在2個(gè)階數(shù)為p(p為大素?cái)?shù))的乘法循環(huán)群G1和G2,g是群G1的生成元.如果映射e:G1×G1→G2滿足如下性質(zhì),則稱(chēng)e為雙線性對(duì)映射:
1) 可計(jì)算性.存在一個(gè)高效的算法可以計(jì)算出映射e.
2) 雙線性.對(duì)于所有u,v∈G1和a,b∈p,e(ua,vb)=e(u,v)ab均成立.
3) 非退化性.e(g,g)≠1G2,其中1G2表示群G2的單位元.
本節(jié)首先介紹SA-PDP模型的審計(jì)流程,然后提出文件審計(jì)方案的生成和自適應(yīng)更新方法,最后給出文件審計(jì)方案的評(píng)價(jià)標(biāo)準(zhǔn).
2.1 自適應(yīng)審計(jì)模型的審計(jì)流程
定義5. SA-PDP模型由5個(gè)基本算法組成:
1)PrePDP(ζM,1λ)→(keys,ζΦ,ζMinfo,ζ(0|1)).輸入文件列表ζM和安全參數(shù)k,輸出密鑰、數(shù)據(jù)塊認(rèn)證標(biāo)簽列表ζΦ、文件的摘要信息列表ζMinfo、預(yù)處理結(jié)果列表ζ(0|1).
PrePDP算法循環(huán)執(zhí)行文件的數(shù)據(jù)完整性審計(jì)過(guò)程[15]的初始化階段和確認(rèn)階段完成文件的預(yù)處理.keys包括密鑰對(duì)(sktag,pktag)和散列函數(shù)私鑰skHash.輸入安全參數(shù)λ,選擇sktag,skHash∈G1作為標(biāo)簽私鑰和散列函數(shù)私鑰,計(jì)算pktag=gs ktag作為標(biāo)簽公鑰.循環(huán)執(zhí)行TagGen處理文件列表ζM,生成文件的認(rèn)證標(biāo)簽集合.以文件Mk為例,生成數(shù)據(jù)塊認(rèn)證標(biāo)簽集合Φk.隨機(jī)選取x1,k,x2,k,…,xs,k∈p,計(jì)算uj,k=gxj,k,j∈[1,s].計(jì)算數(shù)據(jù)塊mi,k的認(rèn)證標(biāo)簽φi,k如下:
(2)
2)AuditProGen(ζM)→ζAP.輸入文件列表ζM,輸出文件審計(jì)方案列表ζAP.以文件Mk為例,依據(jù)文件屬性Attrk(d,h)生成文件的審計(jì)方案APk.
3)InsertQueue(ζAP)→ζQ.輸入文件審計(jì)方案列表ζAP,輸出審計(jì)隊(duì)列ζQ.
生成文件審計(jì)方案列表后,依據(jù)審計(jì)周期構(gòu)建多個(gè)審計(jì)方案隊(duì)列,如圖3所示.隊(duì)列中每個(gè)節(jié)點(diǎn)由形如〈FIDk,Tk,rrk〉的三元組構(gòu)成,F(xiàn)IDk是文件描述符,Tk是文件的審計(jì)周期,rrk是識(shí)別率.由InsertQueue算法將文件審計(jì)方案插入到相應(yīng)的審計(jì)隊(duì)列.
4)DeQueue(ζQ)→BufQueue.輸入審計(jì)隊(duì)列ζQ,輸出審計(jì)緩存區(qū)BufQueue.
DeQueue算法定期從審計(jì)隊(duì)列取出文件審計(jì)方案并放入審計(jì)緩存區(qū)BufQueue,成為待審計(jì)文件.
5)RunPDP(BufQueue)→{0|1}.輸入審計(jì)緩沖區(qū)BufQueue,輸出審計(jì)結(jié)果{0|1}.
RunPDP算法依次取出審計(jì)緩存區(qū)中文件審計(jì)方案〈FIDk,Tk,rrk〉,執(zhí)行數(shù)據(jù)完整性審計(jì),并輸出審計(jì)結(jié)果.根據(jù)FIDk獲得文件的摘要信息Minfo,k,運(yùn)行ChalGen生成挑戰(zhàn)信息Ck.依據(jù)識(shí)別率rrk計(jì)算被挑戰(zhàn)數(shù)據(jù)塊數(shù)量并隨機(jī)挑選相應(yīng)數(shù)量的數(shù)據(jù)塊組成挑戰(zhàn)集合Ik,為每個(gè)被挑戰(zhàn)數(shù)據(jù)塊生成一個(gè)隨機(jī)值vi∈*p.選取隨機(jī)值yk∈*p計(jì)算挑戰(zhàn)戳Yk=(pktag)yk.發(fā)送Ck=({i,vi}i∈Ik,Yk)給云存儲(chǔ)服務(wù)器.云存儲(chǔ)服務(wù)器運(yùn)行ProofGen生成數(shù)據(jù)持有性證據(jù)Pk.證據(jù)信息Pk由標(biāo)簽擁有證據(jù)TPk和數(shù)據(jù)塊擁有證據(jù)DPk組成,計(jì)算如下:
(3)
其中,MPj是數(shù)據(jù)扇的線性集合,計(jì)算如下:
(4)
云服務(wù)器將數(shù)據(jù)持有性證據(jù)Pk發(fā)送給審計(jì)者.審計(jì)者運(yùn)行Verify算法驗(yàn)證數(shù)據(jù)持有性證據(jù)Pk.首先計(jì)算挑戰(zhàn)散列值的連乘積Hchal,k,計(jì)算如下:
(5)
然后,驗(yàn)證Pk是否滿足下式:
DPk×e(Hchal,k,pktag)=e(TPk,gyk).
(6)
若滿足式(6),輸出1,表示文件完好;反之,輸出0,表示文件被損壞.
SA-PDP審計(jì)過(guò)程由3個(gè)階段組成:初始化階段、審計(jì)方案生成階段和定期審計(jì)階段,如圖4所示.1)初始化階段進(jìn)行PDP方案的預(yù)處理,生成數(shù)據(jù)塊認(rèn)證信息并確保數(shù)據(jù)及相應(yīng)信息正確存儲(chǔ)到云端;2)審計(jì)方案生成階段,審計(jì)者依據(jù)文件的屬性信息生成審計(jì)方案并創(chuàng)建文件審計(jì)隊(duì)列;3)定期審計(jì)階段,審計(jì)者定期從文件審計(jì)隊(duì)列獲取文件審計(jì)方案并執(zhí)行數(shù)據(jù)完整性審計(jì).
Fig. 4 Audit process of SA-PDP圖4 SA-PDP的審計(jì)流程
2.2 文件審計(jì)方案的生成
文件審計(jì)方案規(guī)定了文件的審計(jì)周期和執(zhí)行強(qiáng)度.審計(jì)方案由文件的審計(jì)需求決定,而文件屬性信息是文件審計(jì)需求的集中體現(xiàn).在文件審計(jì)方案生成時(shí),首先記錄文件的屬性信息;然后,依據(jù)屬性信息生成文件的審計(jì)方案.
文件屬性記錄了文件損壞概率和文件訪問(wèn)熱度信息,由損壞概率級(jí)別dk、損壞次數(shù)、訪問(wèn)熱度級(jí)別hk、訪問(wèn)次數(shù)組成,如圖5所示.初始化階段設(shè)置文件屬性為0,在固定時(shí)間段內(nèi)記錄文件屬性值.例如,在審計(jì)周期T0~T1之間,文件Mk屬性值變動(dòng)被及時(shí)記錄到文件屬性結(jié)構(gòu).為減少成本,此過(guò)程只記錄屬性變動(dòng)的文件.記錄時(shí)間段內(nèi)損壞次數(shù)和訪問(wèn)次數(shù)是決定屬性級(jí)別的依據(jù),在時(shí)間段結(jié)束時(shí)進(jìn)行屬性級(jí)別更改,并重置損壞次數(shù)和訪問(wèn)次數(shù)值,進(jìn)入下一個(gè)時(shí)間段執(zhí)行.
Fig. 5 Process of updating file attributes圖5 文件屬性的更新過(guò)程
在記錄時(shí)間段結(jié)束時(shí),依據(jù)文件損壞次數(shù)和訪問(wèn)次數(shù)設(shè)置文件損壞概率級(jí)別和文件訪問(wèn)熱度級(jí)別,如表1、表2所示.設(shè)定損壞概率級(jí)別總數(shù)為dmax,訪問(wèn)熱度級(jí)別總數(shù)為hmax,由表1可得dmax=3,由表2可得hmax=5.屬性級(jí)別更新分為降級(jí)操作和升級(jí)操作.降級(jí)操作針對(duì)前一個(gè)審計(jì)周期屬性中級(jí)別變動(dòng)文件,檢驗(yàn)當(dāng)前審計(jì)周期內(nèi)該文件屬性,如果屬性值低于當(dāng)前屬性級(jí)別的最低閾值則執(zhí)行屬性降級(jí)操作;反之,保持屬性級(jí)別不變.升級(jí)操作針對(duì)當(dāng)前審計(jì)周期屬性變動(dòng)的文件,依據(jù)文件屬性映射表設(shè)定文件屬性級(jí)別.當(dāng)前審計(jì)周期結(jié)束時(shí),重置屬性級(jí)別變動(dòng)文件的損壞次數(shù)和訪問(wèn)次數(shù)值.
Table 1 Mapping Table of Levels of Damage Probability
Table 2 Mapping Table of Levels of Access Popularity
審計(jì)方案由審計(jì)周期和識(shí)別率組成,依據(jù)服務(wù)等級(jí)協(xié)議設(shè)定審計(jì)周期級(jí)別LT和識(shí)別率級(jí)別LRR,如表3、表4所示.設(shè)定審計(jì)周期的級(jí)別總數(shù)為L(zhǎng)Tmax,識(shí)別率的級(jí)別總數(shù)為L(zhǎng)RRmax,表3中LTmax=5,表4中LRRmax=3.
Table 3 Mapping Table of Levels of Audit Period
Table 4 Mapping Table of Levels of Recognition Rate
確立文件審計(jì)周期級(jí)別LTk時(shí),首先依據(jù)文件屬性值〈dk,hk〉,分別計(jì)算由文件損壞概率確立的審計(jì)周期級(jí)別LTdk和由文件訪問(wèn)熱度確立的審計(jì)周期級(jí)別LThk,然后取二者的最小值,計(jì)算如下:
LTk=min{LTdk,LThk}=
(7)
確立文件識(shí)別率級(jí)別LRRk時(shí),首先依據(jù)文件屬性值〈dk,hk〉,分別計(jì)算由文件損壞概率確立的識(shí)別率級(jí)別LRRdk和由文件訪問(wèn)熱度確立的識(shí)別率級(jí)別LRRhk,然后取二者的最大值,計(jì)算如下:
LRRk=max{LRRdk,LRRhk}=
(8)
獲得審計(jì)周期級(jí)別LTk和識(shí)別率的級(jí)別LRRk后,由表3、表4可得到文件的審計(jì)周期Tk和識(shí)別率rrk.
2.3 審計(jì)方案的自適應(yīng)更新過(guò)程
定義6. SA-PDP審計(jì)方案自適應(yīng)更新過(guò)程由2個(gè)算法組成:
1)UPGen(ζM)→ζAPU.輸入屬性值變動(dòng)的文件列表ζMU,輸出待更新的審計(jì)方案列表ζAPU.
在執(zhí)行DeQueue(ζQ)后,檢測(cè)文件的屬性變化.如果文件屬性變化不符合當(dāng)前審計(jì)方案的閾值,執(zhí)行審計(jì)方案更新操作.以Mk為例,根據(jù)變動(dòng)的文件屬性值A(chǔ)ttrk,生成更新的文件審計(jì)方案APU,k.所有待更新的審計(jì)方案組成審計(jì)方案更新列表ζAPU.
依據(jù)方案更新請(qǐng)求的發(fā)起者不同,審計(jì)方案更新算法分為主動(dòng)更新算法(active audit plan self-adaptive update, AASU)和被動(dòng)更新算法(lazy audit plan self-adaptive update, LASU).由審計(jì)者主動(dòng)檢測(cè)文件審計(jì)方案變更需求的算法,稱(chēng)為主動(dòng)更新算法;由被審計(jì)文件發(fā)起的審計(jì)方案更新請(qǐng)求的算法,稱(chēng)為被動(dòng)更新算法.主動(dòng)更新算法保證審計(jì)系統(tǒng)具有高覆蓋率,而被動(dòng)更新算法能夠及時(shí)滿足文件的審計(jì)需求.為了便于描述,定義相關(guān)符號(hào),如表5所示:
Table 5 Definition of Symbols of Update Algorithm
主動(dòng)更新算法AASU在文件審計(jì)完成后,獲取文件最新的屬性值進(jìn)行更新需求判斷,如果原始方案的執(zhí)行強(qiáng)度與審計(jì)需求不符,重新生成新方案并插入到新隊(duì)列;否則,保持原有審計(jì)方案不變,插入到原始隊(duì)列.AASU算法不僅能保證審計(jì)方案匹配度,并且覆蓋了所有文件,具有通用性.AASU算法的不足在于無(wú)論文件屬性變化與否,都需要進(jìn)行方案更新檢查,造成系統(tǒng)資源的浪費(fèi),并且AASU更新方案具有滯后性,對(duì)于屬性發(fā)生變化的文件只有等到審計(jì)完成后才能執(zhí)行審計(jì)方案的變更.
算法1. 審計(jì)方案的主動(dòng)更新算法AASU.
輸入:ζQ,Θ;
輸出:ζQU.
① 在最大審計(jì)周期Tmax內(nèi):
② for (i=1;i≤LTmax;i++) {
③ for (j=1;j≤η;j++){
④ 獲取并執(zhí)行審計(jì)隊(duì)列Qi中第j個(gè)審計(jì)方案APj;
⑤ 獲取文件屬性值〈dk,hk〉;
⑥ 計(jì)算審計(jì)方案的執(zhí)行強(qiáng)度與文件審 計(jì)需求差χj;
⑦ if (χj>Θ)生成新審計(jì)方案并插入相應(yīng)審計(jì)隊(duì)列;
⑧ else 保持原始審計(jì)方案APj不變,插 入到原始隊(duì)列;
⑨ }
⑩ }
與主動(dòng)更新算法不同,被動(dòng)更新算法LASU由屬性變化的文件向?qū)徲?jì)方案隊(duì)列發(fā)起審計(jì)方案更新請(qǐng)求,避免了大量審計(jì)方案的更新需求判斷,并且提高了方案更新的時(shí)效性.
被動(dòng)更新算法LASU增加了文件屬性的更新?tīng)顟B(tài)位,以空間換時(shí)間,避免了完成審計(jì)后更新閾值的判斷,并且文件屬性變動(dòng)后可以即刻修改文件的更新方案,解決了更新審計(jì)方案滯后的問(wèn)題.
算法2. 審計(jì)方案的被動(dòng)更新算法LASU.
輸入:ζQ,Θ;
輸出:ζQU.
① 在最大審計(jì)周期Tmax內(nèi):
② if (文件屬性改變) {
③ 根據(jù)文件屬性變化計(jì)算文件的審計(jì)需求差值χ;
④ if (χ>Θ){
⑤ 生成新審計(jì)方案并插入相應(yīng)隊(duì)列;
⑥ 設(shè)置S=1(默認(rèn)為0);
⑦ }
⑧ }
⑨ for (i=1;i≤LTmax;i++) {
⑩ for (j=1;j≤η;j++){
2.4 文件審計(jì)方案的評(píng)價(jià)標(biāo)準(zhǔn)
審計(jì)方案的好壞由文件審計(jì)的執(zhí)行總時(shí)間、系統(tǒng)可審計(jì)文件數(shù)量、審計(jì)方案的匹配度進(jìn)行評(píng)價(jià).為了論述方便,定義審計(jì)方案相關(guān)符號(hào),如表6所示:
Table 6 Definition of Symbols of Audit Plan
定義7. 文件審計(jì)的執(zhí)行總時(shí)間E.指審計(jì)期間內(nèi),所有被審計(jì)文件的執(zhí)行時(shí)間總和.假設(shè)文件列表為{M1,M2,…,MN},對(duì)文件Mi共執(zhí)行numi次審計(jì),第j次的執(zhí)行時(shí)間為εi,j,則E計(jì)算為
(9)
文件審計(jì)的執(zhí)行總時(shí)間反映了系統(tǒng)的審計(jì)開(kāi)銷(xiāo),執(zhí)行總時(shí)間越大,審計(jì)代價(jià)越高.審計(jì)系統(tǒng)設(shè)計(jì)的目標(biāo)是在滿足審計(jì)需求的前提下,盡可能減少文件的總執(zhí)行時(shí)間.
定義8. 系統(tǒng)可審計(jì)文件數(shù)量NUM.指在審計(jì)期間內(nèi),系統(tǒng)已經(jīng)審計(jì)的文件總數(shù).設(shè)定文件的審計(jì)周期從小到大排列為{T1,T2,…,TD},審計(jì)周期Ti中文件的平均執(zhí)行時(shí)間為τi,則NUM的理論值為
(10)
其中,T0=0,表示開(kāi)始時(shí)刻.由于在審計(jì)周期Ti內(nèi)存在系統(tǒng)空閑情況,故系統(tǒng)可審計(jì)文件數(shù)量小于理論值.特別地,當(dāng)系統(tǒng)以固定周期Ti審計(jì)文件,系統(tǒng)可審計(jì)文件數(shù)量計(jì)算為
(11)
當(dāng)審計(jì)周期Ti過(guò)小,導(dǎo)致系統(tǒng)審計(jì)能力迅速達(dá)到最大值;當(dāng)審計(jì)周期Ti過(guò)大,雖然增加了審計(jì)文件數(shù)量,但將出現(xiàn)文件長(zhǎng)時(shí)間不能審計(jì)而系統(tǒng)處于空閑的情況,不僅造成系統(tǒng)資源浪費(fèi),并導(dǎo)致用戶體驗(yàn)下降.因此,應(yīng)當(dāng)將文件審計(jì)任務(wù)有序分布在多個(gè)審計(jì)周期內(nèi),既能充分利用系統(tǒng)計(jì)算資源,提高文件審計(jì)數(shù)量,又能及時(shí)滿足文件的審計(jì)需求.
審計(jì)方案的匹配度反映了審計(jì)方案的執(zhí)行強(qiáng)度是否適當(dāng),量化文件審計(jì)需求和審計(jì)方案的執(zhí)行強(qiáng)度予以評(píng)價(jià).
定義9. 審計(jì)需求R(audit requirement).指文件執(zhí)行數(shù)據(jù)完整性審計(jì)的迫切程度,R∈(0,100].文件審計(jì)需求最大值表示為Rmax(默認(rèn)值100).
文件審計(jì)需求和文件屬性〈dk,hk〉密切相關(guān),通過(guò)歸一化方法將單個(gè)因素的影響映射到文件審計(jì)需求R的值域,并依據(jù)影響因素的權(quán)重值計(jì)算文件審計(jì)需求:
(12)
其中,α1和α2分別是損壞概率和訪問(wèn)熱度的權(quán)重值,且α1+α2=1.假定dmax=10,hmax=10,α1=α2=0.5,文件屬性Attr〈2,5〉,文件的安全需求Rk=35.
定義10. 審計(jì)方案執(zhí)行強(qiáng)度(execution strength,ES).ES反映了審計(jì)方案檢錯(cuò)能力和力度,它的最大值表示為ESmax(默認(rèn)值100).
在文件審計(jì)方案〈tk,rrk〉中,文件審計(jì)周期分為L(zhǎng)Tmax個(gè)級(jí)別,識(shí)別率分為L(zhǎng)RRmax個(gè)級(jí)別.審計(jì)方案的執(zhí)行強(qiáng)度計(jì)算為
(13)其中,β1和β2分別是審計(jì)周期和識(shí)別率的權(quán)重值,且β1+β2=1.假定LTmax=10,LRRmax=10,β1=β2=0.5,對(duì)于審計(jì)方案AP〈2,5〉的執(zhí)行強(qiáng)度ES=35.
定義11. 期望強(qiáng)度(EES).EES表示與文件審計(jì)需求相匹配的審計(jì)方案所需的最小執(zhí)行強(qiáng)度,其計(jì)算為
(14)
定義12. 匹配度(match degree,MD).MD表示期望強(qiáng)度與文件實(shí)際執(zhí)行強(qiáng)度的匹配程度,其計(jì)算為
(15)
MD的大小反映了文件審計(jì)方案與最優(yōu)化審計(jì)方案的偏離程度,MD數(shù)值為正表示審計(jì)方案的執(zhí)行強(qiáng)度高于文件的審計(jì)需求;MD數(shù)值為負(fù)表示審計(jì)方案的執(zhí)行強(qiáng)度弱于文件的審計(jì)需求;MD數(shù)值為0表示實(shí)際審計(jì)方案與文件審計(jì)需求正相符.MD過(guò)高浪費(fèi)系統(tǒng)的計(jì)算資源,MD過(guò)低不能滿足文件的審計(jì)需求.
3.1 實(shí)驗(yàn)環(huán)境
本文利用PBC庫(kù)(pbc-0.5.14)實(shí)現(xiàn)了自適應(yīng)審計(jì)的原型系統(tǒng)SA-PDP及對(duì)比系統(tǒng)B-PDP,采用C語(yǔ)言開(kāi)發(fā),系統(tǒng)參數(shù)為Ubuntu 12.04.3 LTS,Linux 3.8.0-29(x86_64),4x Intel?Xeon?CPU E5502 @ 1.87 GHz,內(nèi)存16 GB,硬盤(pán)ATA Hitachi HTS54501 150 GB.在每個(gè)審計(jì)周期,按照二八定律生成不同熱度的文件并隨機(jī)損壞文件,測(cè)試文件大小1 MB.
3.2 存儲(chǔ)開(kāi)銷(xiāo)和通信開(kāi)銷(xiāo)分析
為了完成文件自適應(yīng)審計(jì),云存儲(chǔ)服務(wù)器首先記錄文件的屬性信息〈dk,hk〉,然后在文件審計(jì)時(shí)將其隨證據(jù)信息一起返回給審計(jì)者,最后審計(jì)者依據(jù)文件屬性〈dk,hk〉更新文件的審計(jì)方案〈FIDk,tk,rrk〉.本文方案額外增加的存儲(chǔ)開(kāi)銷(xiāo)(單位為B)和通信開(kāi)銷(xiāo)分別為3|int|+|FID|+|float|和2|int|,其中|int|是整型變量的大小,|float|是浮點(diǎn)型變量的大小,|FID|是文件標(biāo)識(shí)的大小.在原型系統(tǒng)SA-PDP中,|int|=4 B,|float|=4 B,|FID|=216 B.每個(gè)文件額外增加的存儲(chǔ)開(kāi)銷(xiāo)和通信開(kāi)銷(xiāo)分別為232 B和8 B,在可接受的范圍之內(nèi).
3.3 審計(jì)效率測(cè)試
Fig. 6 Comparison of the total audit time at different numbers of files圖6 不同文件數(shù)目下審計(jì)總執(zhí)行時(shí)間對(duì)比
設(shè)定測(cè)試時(shí)間為72 h,文件數(shù)量為500~1 500,統(tǒng)計(jì)審計(jì)過(guò)程文件的總執(zhí)行時(shí)間,如圖6所示.相較于B-PDP,SA-PDP的文件總執(zhí)行時(shí)間至少減少了50%,并且SA-PDP審計(jì)時(shí)間增長(zhǎng)趨勢(shì)平緩.這是因?yàn)?,B-PDP按照固定頻率審計(jì)文件造成文件被頻繁審計(jì),而SA-PDP按照文件審計(jì)需求把文件審計(jì)任務(wù)分布在多個(gè)時(shí)間周期內(nèi),消除了不必要的審計(jì).SA-PDP節(jié)省時(shí)間越多,可以審計(jì)的文件數(shù)量越多.SA-PDP模型中LASU方法的審計(jì)執(zhí)行時(shí)間略高于AASU方法.這是因?yàn)?,采用LASU時(shí),文件要求系統(tǒng)響應(yīng)其審計(jì)請(qǐng)求,造成文件審計(jì)次數(shù)增多;LASU犧牲部分審計(jì)效率而增加了文件的審計(jì)強(qiáng)度.
設(shè)定測(cè)試時(shí)間為72 h,每小時(shí)向?qū)徲?jì)系統(tǒng)增加4 000個(gè)文件,測(cè)試系統(tǒng)可審計(jì)文件數(shù)量,如圖7所示.審計(jì)初期,B-PDP審計(jì)文件數(shù)量多于SA-PDP,LASU方法審計(jì)文件多于AASU方法;而SA-PDP可審計(jì)文件最大能力明顯高于B-PDP.SA-PDP方法將審計(jì)任務(wù)分布于多個(gè)周期,審計(jì)初期,部分文件不在審計(jì)周期內(nèi)而不被審計(jì).由于LASU方法主動(dòng)提交審計(jì)請(qǐng)求使其初期審計(jì)文件次數(shù)多于AASU方法.審計(jì)后期,由于B-PDP頻繁審計(jì)浪費(fèi)大量計(jì)算資源,使系統(tǒng)過(guò)早達(dá)到審計(jì)極限.而LASU方法積極的審計(jì)特性犧牲了部分計(jì)算資源,使審計(jì)文件數(shù)量低于AASU方法.
Fig. 7 Comparison of the number of audit files at different audit time圖7 不同審計(jì)時(shí)間內(nèi)可審計(jì)文件數(shù)量對(duì)比
3.4 審計(jì)方案的匹配度比較
首先,依據(jù)一個(gè)測(cè)試實(shí)例,計(jì)算并比較不同模型審計(jì)方案的匹配度;然后,在實(shí)際運(yùn)行環(huán)境中測(cè)試審計(jì)方案的動(dòng)態(tài)匹配程度.
測(cè)試實(shí)例設(shè)計(jì)如下:按照二八定律劃分不同熱度、不同損壞概率的文件數(shù)量,計(jì)算采用不同模型生成的文件審計(jì)方案的匹配度.設(shè)定參數(shù)α1=α2=0.5,β1=β2=0.5,dmax=3,hmax=5,LTmax=5,LRRmax=3.由式(12)求得不同屬性文件的審計(jì)需求.以屬性〈1,1〉為例,該類(lèi)型文件的審計(jì)需求R〈1,1〉=26.7.
表7顯示了采用不同模型生成審計(jì)方案的匹配度.B-PDP模型針對(duì)所有文件統(tǒng)一采用適中執(zhí)行強(qiáng)度的審計(jì)方案,即AP=〈72 h,95%〉.SA-PDP模型首先依據(jù)文件屬性計(jì)算審計(jì)需求,然后由式(7)(8)生成與之對(duì)應(yīng)的審計(jì)方案.根據(jù)文件的審計(jì)需求和生成的審計(jì)方案,結(jié)合式(14)(15)計(jì)算B-PDP模型和SA-PDP模型生成審計(jì)方案的匹配度.
可以看出,采用SA-PDP模型生成的審計(jì)方案匹配度為0,即文件審計(jì)方案執(zhí)行強(qiáng)度與文件審計(jì)需求正相符;采用B-PDP模型針對(duì)所有文件采用固定審計(jì)方案,匹配度圍繞0波動(dòng),表現(xiàn)為審計(jì)方案強(qiáng)于或者弱于文件的審計(jì)需求.因此,SA-PDP模型可以在滿足文件審計(jì)需求的前提下執(zhí)行適當(dāng)強(qiáng)度的審計(jì)方案,克服了B-PDP模型采用過(guò)強(qiáng)或者過(guò)弱審計(jì)方案的問(wèn)題,并將釋放出的資源用于審計(jì)更多文件.
在實(shí)際運(yùn)行環(huán)境中,當(dāng)審計(jì)方案執(zhí)行完畢后,計(jì)算審計(jì)方案的匹配度,圖8顯示了所有文件的審計(jì)方案在不同匹配度的分布.可以看到,B-PDP模型的審計(jì)方案較為平均地分布在不同匹配度;而SA-PDP模型的審計(jì)方案集中分布于匹配度0周?chē)?在SA-PDP模型中,與文件審計(jì)請(qǐng)求匹配的審計(jì)方案比例達(dá)到53%,而在B-PDP模型中僅達(dá)到了20%.這就表明,相較于B-PDP,SA-PDP更能滿足文件的審計(jì)需求,審計(jì)方案的匹配率提高了30%以上.此外,結(jié)合圖6和圖8可以看出,SA-PDP不僅滿足了文件的審計(jì)請(qǐng)求,并有效減輕了系統(tǒng)的審計(jì)負(fù)擔(dān).
Fig. 9 The audit number of audit plans at different match degrees圖9 審計(jì)次數(shù)在不同匹配度下的分布
圖9比較了審計(jì)方案的主動(dòng)更新算法AASU和被動(dòng)更新算法LASU的文件審計(jì)次數(shù).2種算法匹配度分布基本相同,表明2種審計(jì)方案更新算法在滿足文件審計(jì)需求的效果基本一致.相較于主動(dòng)更新算法AASU,被動(dòng)更新算法LASU算法執(zhí)行了更多次的審計(jì).這是因?yàn)椋粍?dòng)更新算法LASU為了及時(shí)響應(yīng)文件的審計(jì)請(qǐng)求,接收了更多熱點(diǎn)文件的審計(jì)請(qǐng)求.這就表明,LASU算法在滿足文件審計(jì)請(qǐng)求的同時(shí),比AASU算法具有更強(qiáng)的審計(jì)強(qiáng)度.
本文設(shè)計(jì)并實(shí)現(xiàn)了一種云存儲(chǔ)環(huán)境下數(shù)據(jù)完整性自適應(yīng)審計(jì)方法SA-PDP.該方法能夠基于文件的屬性信息動(dòng)態(tài)調(diào)整文件的審計(jì)方案,協(xié)調(diào)完成全域文件的審計(jì),不僅能夠滿足文件的審計(jì)需求,還能有效減少了系統(tǒng)的審計(jì)成本,提高系統(tǒng)的審計(jì)效率.后續(xù)工作將針對(duì)審計(jì)代理的可擴(kuò)展性和可用性問(wèn)題進(jìn)行深入研究.
[1]Tan Shuang, Jia Yan, Han Weihong. Research and development of provable data integrity in cloud storage[J]. Chinese Journal of Computers, 2015, 38(1): 164-177 (in Chinese)(譚霜, 賈焰, 韓偉紅. 云存儲(chǔ)中的數(shù)據(jù)完整性證明研究及進(jìn)展[J]. 計(jì)算機(jī)學(xué)報(bào), 2015, 38(1): 164-177)
[2]Li Hui, Sun Wenhai, Li Fenghua, et al. Secure and privacy-preserving data storage service in public cloud[J]. Journal of Computer Research and Development, 2014, 51(7): 1397-1409 (in Chinese)(李暉, 孫文海, 李鳳華, 等. 公共云存儲(chǔ)服務(wù)數(shù)據(jù)安全及隱私保護(hù)技術(shù)綜述[J]. 計(jì)算機(jī)研究與發(fā)展, 2014, 51(7): 1397-1409)
[3]Juels A, Kaliski Jr B S. PORs: Proofs of retrievability for large files[C]Proc of the 14th ACM Conf on Computer and Communications Security. New York: ACM, 2007: 584-597
[4]Ateniese G, Burns R, Curtmola R, et al. Provable data possession at untrusted stores[C]Proc of the 14th ACM Conf on Computer and Communications Security. New York: ACM, 2007: 598-609
[5]Shacham H, Waters B. Compact proofs of retrievability[C]Proc of the 14th Int Conf on Theory and Application of Cryptology and Information Security. Berlin: Springer, 2008: 90-107
[6]Erway C, Küp?ü A, Papamanthou C, et al. Dynamic provable data possession[C]Proc of the 16th ACM Conf on Computer and Communications Security. New York: ACM, 2009: 213-222
[7]Wang Qian, Wang Cong, Li Jin, et al. Enabling public verifiability and data dynamics for storage security in cloud computing[C]Proc of the 14th European Symp on Research in Computer Security. Berlin: Springer, 2009: 355-370
[8]Qin Zhiguang, Wang Shiyu, Zhao Yang, et al. An auditing protocol for data storage in cloud computing with data dynamics[J]. Journal of Computer Research and Development, 2015, 52(10): 2192-2199 (in Chinese)(秦志光, 王士雨, 趙洋, 等. 云存儲(chǔ)服務(wù)的動(dòng)態(tài)數(shù)據(jù)完整性審計(jì)方[J]. 計(jì)算機(jī)研究與發(fā)展, 2015, 52(10): 2192-2199)
[9]Wang Cong, Chow S S M, Wang Qian, et al. Privacy-preserving public auditing for secure cloud storage[J]. IEEE Trans on Computers, 2013, 62(2): 362-375
[10]Zhu Yan, Wang Huaixi, Hu Zexing, et al. Efficient provable data possession for hybrid clouds[C]Proc of the 17th ACM Conf on Computer and Communications Security. New York: ACM, 2010: 756-758
[11]Zhu Yan, Ahn G J, Hu Hongxin, et al. Dynamic audit services for outsourced storages in clouds[J]. IEEE Trans on Services Computing, 2013, 6(2): 227-238
[12]Wang Boyang, Li Baochun, Li Hui. Oruta: Privacy-preserving public auditing for shared data in the cloud[J]. IEEE Trans on Cloud Computing, 2014, 2(1): 43-56
[13]Yu Yong, Ni Jianbing, Au M H, et al. Improved security of a dynamic remote data possession checking protocol for cloud storage[J]. Expert Systems with Applications, 2014, 41(17): 7789-7796
[14]Wang Boyang, Li Baochun, Li Hui. Knox: Privacy-preserving auditing for shared data with large groups in the cloud[C]Proc of the 10th Int Conf on Applied Cryptography and Network Security. Berlin: Springer, 2012: 507-525
[15]Yang Kan, Jia Xiaohua. An efficient and secure dynamic auditing protocol for data storage in cloud computing[J]. IEEE Trans on Parallel and Distributed Systems, 2013, 24(9): 1717-1726
[16]Zhu Yan, Hu Hongxin, Ahn G J, et al. Cooperative provable data possession for integrity verification in multicloud storage[J]. IEEE Trans on Parallel and Distributed Systems, 2012, 23(12): 2231-2244
[17]Wang Huaqun, Zhang Yuqing. On the knowledge soundness of a cooperative provable data possession scheme in multicloud storage[J]. IEEE Trans on Parallel and Distributed Systems, 2014, 25(1): 264-267
[18]Wang Huaqun. Proxy provable data possession in public clouds[J]. IEEE Trans on Services Computing, 2013, 6(4): 551-559
[19]Wang Huaqun. Identity-based distributed provable data possession in multicloud storage[J]. IEEE Trans on Services Computing, 2015, 8(2): 328-340
[20]Fu Yanyan, Zhang Min, Chen Kaiqu, et al. Proofs of data possession of multiple copies[J]. Journal of Computer Research and Development, 2014, 51(7): 1410-1416 (in Chinese)(付艷艷, 張敏, 陳開(kāi)渠, 等. 面向云存儲(chǔ)的多副本文件完整性驗(yàn)證方案[J]. 計(jì)算機(jī)研究與發(fā)展, 2014, 51(7): 1410-1416)
Wang Huifeng, born in 1986. PhD candidate in Northwestern Polytechnical University. His main research interests include cloud computing, data security, and massive data storage.
Li Zhanhuai, born in 1961. Professor and PhD supervisor. His main research interests include database theory and massive data storage (lizhh@nwpu.edu.cn).
Zhang Xiao, born in 1978. PhD and associate professor. His main research interestes include green storage and massive data storage (zhangxiao@nwpu.edu.cn).
Sun Jian, born in 1982. PhD candidate. His main research interestes include cloud storage and green storage (qwert3277@163.com).
Zhao Xiaonan, born in 1979. Lecturer and PhD. Her main research interestes include hierarchical storage and cloud storage (zhaoxn@nwpu.edu.cn).
A Self-Adaptive Audit Method of Data Integrity in the Cloud Storage
Wang Huifeng, Li Zhanhuai, Zhang Xiao, Sun Jian, and Zhao Xiaonan
(SchoolofComputerScience,NorthwesternPolytechnicalUniversity,Xi’an710129)
As an important issue of cloud storage security, data integrity checking has attracted a lot of attention from academia and industry. In order to verify data integrity in the cloud, the researchers have proposed many public audit schemes for data integrity. However, most of the existing schemes are inefficient and waste much computing resource because they adopt fixed parameters for auditing all the files. In other words, they have not considered the issue of coordinating and auditing the large-scale files. In order to improve the audit efficiency of the system, we propose a self-adaptive provable data possession (SA-PDP), which uses a self-adaptive algorithm to adjust the audit tasks for different files and manage the tasks by the audit queues. By the quantitative analysis of the audit requirements of files, it can dynamically adjust the audit plans, which guarantees the dynamic matching between the audit requirements of files and the execution strength of audit plans. In order to enhance the flexibility of updating audit plans, SA-PDP designs two different update algorithms of audit plans on the basis of different initiators. The active update algorithm ensures that the audit system has high coverage rate while the lazy update algorithm can make the audit system timely meet the audit requirements of files. Experimental results show that SA-PDP can reduce more than 50% of the total audit time than the traditional method. And SA-PDP effectively increases the number of audit files in the audit system. Compared with the traditional audit method, SA-PDP can improve the standard-reaching rate of audit plans by more than 30%.
data security; cloud storage; data integrity checking; provable data possession; self-adaptive audit
2015-10-12;
2016-02-16
國(guó)家“八六三”高技術(shù)研究發(fā)展計(jì)劃基金項(xiàng)目(2013AA01A215);國(guó)家自然科學(xué)基金項(xiàng)目(61472323,61502392);中央高?;究蒲袠I(yè)務(wù)費(fèi)專(zhuān)項(xiàng)資金項(xiàng)目(3102015JSJ0009);華為創(chuàng)新基金項(xiàng)目(YB2014040023) This work was supported by the National High Technology Research and Development Program of China (863 Program) (2013AA01A215), the National Natural Science Foundation of China (61472323, 61502392), the Fundamental Research Funds for the Central Universities (3102015JSJ0009), and the Huawei Innovation Fund (YB2014040023).
張曉(zhangxiao@nwpu.edu.cn)
TP309.2
k是
符和數(shù)據(jù)塊索引的連接,Wi,k=FID‖i,mij,k是文件Mk的數(shù)據(jù)塊mi,k的第j個(gè)數(shù)據(jù)扇.文件Mk的認(rèn)證標(biāo)簽集合為Φk={φi,k|i∈[1,n]}.循環(huán)生成各個(gè)文件列表的認(rèn)證標(biāo)簽集合ζΦ={Φk|k∈[1,N]},N為文件總數(shù).循環(huán)執(zhí)行確認(rèn)審計(jì)階段操作,保證文件正確存儲(chǔ)到云端.