• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于數(shù)據(jù)標簽的云存儲用戶數(shù)據(jù)存在感知方法研究?

    2018-09-28 02:30:30吳邱涵魏國珩
    計算機與數(shù)字工程 2018年9期
    關(guān)鍵詞:副本可用性標簽

    胡 衛(wèi) 吳邱涵 魏國珩

    (1.武漢大學計算機學院 武漢 430072)(2.海軍工程大學信息安全系 武漢 430033)

    1 引言

    隨著云計算技術(shù)的迅速發(fā)展和普及,隨之帶來了大量數(shù)據(jù)的存儲問題,云存儲(Cloud Storage)的概念應運而生,云存儲是在云計算(Cloud Computing)概念上延伸和發(fā)展出來的一個新的概念,它是指通過服務(wù)器集群應用、網(wǎng)格或分布式文件系統(tǒng)和虛擬化技術(shù)等,將網(wǎng)絡(luò)中不同類型的海量存儲設(shè)備通過網(wǎng)絡(luò)和應用軟件集合起來協(xié)同工作,共同對外提供數(shù)據(jù)存儲和業(yè)務(wù)訪問功能的一個系統(tǒng)[1~2]。與傳統(tǒng)數(shù)據(jù)管理技術(shù)相比,云存儲具有海量性、異構(gòu)性、外包性和混雜性等特點,使得傳統(tǒng)數(shù)據(jù)管理技術(shù)不再適用[3]。

    云存儲技術(shù)在展現(xiàn)資源共享、便捷高效、快速可伸縮等優(yōu)勢的同時,也面臨許多關(guān)鍵性問題,其安全性、可靠性及服務(wù)水平等眾多問題仍亟待解決[4]。云存儲服務(wù)提供商的信譽往往受到質(zhì)疑,因為出于利益的考慮,云存儲服務(wù)提供商有時會刻意隱瞞數(shù)據(jù)的失效,不讓用戶掌握數(shù)據(jù)真實的可用性信息。即數(shù)據(jù)實際上丟失了,或者某個時段不可用,或者當前數(shù)據(jù)副本有效的數(shù)量達不到事先協(xié)定的數(shù)量,但是服務(wù)商卻不讓用戶知曉,或者欺騙用戶該數(shù)據(jù)有效。當前還沒有較適用的技術(shù)能夠完全解決這一欺騙行為。

    當用戶將數(shù)據(jù)存放在云服務(wù)器中,他們突然感覺對數(shù)據(jù)失去了掌控能力,他們無法掌握數(shù)據(jù)是否真實存在、是否完整可用、是否安全可靠、刪除的數(shù)據(jù)是否真正消失,用戶完全失去了對數(shù)據(jù)的感知。目前對云存儲數(shù)據(jù)感知方面的研究還處于起步階段,數(shù)據(jù)存在感知是數(shù)據(jù)感知的最基本的要求,通常的做法是通過數(shù)據(jù)持有性證明來達到感知數(shù)據(jù)存在效果[5]。本文即針對云存儲中用戶數(shù)據(jù)存在感知方法進行研究。

    2 相關(guān)工作

    目前數(shù)據(jù)存在感知方面,研究工作主要集中在可證明數(shù)據(jù)持有(Provable Data Possession,PDP)方案[5~8]和可恢復證明(Proof of Retrievability,POR)方案[9]。其主要過程如下:證實者Verifier(例如客戶端)將某個大文件F以分片的方式保存在驗證者Prover(例如云服務(wù)提供商)一方,并插入一些驗證元數(shù)據(jù);在Verifier需要驗證F可用性時,Prover根據(jù)存儲的數(shù)據(jù)和元數(shù)據(jù)計算獲得一個高度壓縮的證據(jù)并提供給Verifier,Verifier通過開銷很小的計算就可以相信F是完整可用的。此外,Yun等在分析傳統(tǒng)Merkle hash tree的基礎(chǔ)上,提出一種基于Nonce的MAC Tree方案,將文件塊加密后組織為樹形結(jié)構(gòu),以保證數(shù)據(jù)的保密性和完整性[10]。Wang等提出一種基于BLS同態(tài)簽名和RS糾錯碼方法[11]。但是這些技術(shù)處理對象的規(guī)模有限,處理海量云數(shù)據(jù)時會帶來嚴重的效率問題。另外,這些技術(shù)本身并不具有容錯和恢復數(shù)據(jù)的功能。即使其中只有一個文件分片被修改或者損壞,則整個F將不可獲取,從而導致Prover丟失該數(shù)據(jù)。

    與他們的工作相比,本文將存在性驗證與數(shù)據(jù)完整性、冗余可用性[12]結(jié)合起來考慮,采用密碼學中的知識證明方法,研究計算開銷小、置信度高并且?guī)哂鄠浞莨δ艿拇嬖谛则炞C技術(shù)。

    3 云存儲數(shù)據(jù)存在與可用性驗證方案

    3.1 密碼學符號列表

    本文所使用的基本密碼學符號及描述如表1所示。

    表1 密碼學符號列表

    3.2 單文件存在性驗證

    對于單文件主要是驗證其存在性與數(shù)據(jù)完整性。驗證過程主要由4個階段組成:文件預處理階段、數(shù)據(jù)標簽生成階段、挑戰(zhàn)應答階段和證據(jù)驗證階段。其中挑戰(zhàn)應答階段由用戶向云存儲服務(wù)器發(fā)出挑戰(zhàn),請求返回持有某些數(shù)據(jù)塊的證據(jù),服務(wù)器響應用戶生成持有文件的證據(jù)[13]。

    3.2.1 文件預處理過程

    在文件上傳到云存儲服務(wù)器之前,需要進行一些預處理操作,包括數(shù)據(jù)分塊、加密處理和數(shù)據(jù)標簽的生成。首先將文件F分割為m個長度相等的部 分 f1,f2,…,fm,每 部 分 的 長 度 為 Lbit,即利用密鑰K對源文件 F進行加密處理形成密態(tài)的文件,其中bi=EK(fi),1≤i≤m。

    3.2.2 數(shù)據(jù)標簽的生成

    文件預處理完畢后,利用密態(tài)的文件塊計算其對應的數(shù)據(jù)標簽,第i塊數(shù)據(jù)的標簽計算公式為Ti=(h(Wi)?gbi)dmodN。其中Wi={v||i},i為文件塊的索引,v為隨機安全素數(shù),將v與文件塊索引i相加,是為了增加Wi的不可預測性。h(?)為哈希函數(shù),這里采用MD5哈希摘要算法。g為安全素數(shù),滿足 gmodN=1,,(e,d)是以N為模數(shù)RSA算法的公私鑰。標簽的計算公式中bi和d都是大數(shù)模冪運算的指數(shù),其值的大小直接決定了系統(tǒng)的計算開銷。數(shù)據(jù)標簽生成后將密態(tài)的文件塊及對應的數(shù)據(jù)標簽一并上傳至云存儲服務(wù)器。

    3.2.3 挑戰(zhàn)應答過程

    當客戶需要驗證云服務(wù)器上所存儲的數(shù)據(jù)是否存在和完整時,可以向服務(wù)器發(fā)起安全詢問。安全詢問的信息Q由三個參數(shù)組成(c,k,s),現(xiàn)對這三個參數(shù)的使用作出具體說明:

    參數(shù)c:客戶詢問的文件塊的數(shù)量。

    參數(shù)k:k是偽隨機置換σ的密鑰,用來隨機選擇文件塊,ji=σk(i),ji與…,bm中的 i有對應關(guān)系,且1≤i≤c<m。

    參數(shù)s:定義gs=gsmodN,其中 gs用于隨后的驗證計算。

    安全詢問信息Q=(c,k,s)生成后,傳輸給云服務(wù)端,云服務(wù)端在收到詢問信息之后,取出相應的數(shù)據(jù)塊和數(shù)據(jù)標簽進行數(shù)據(jù)存在性證據(jù)V=(T,ρ)的計算:

    最后生成驗證信息V=(T,ρ),并傳送給客戶端。

    3.2.4 數(shù)據(jù)標簽的驗證

    客戶端在收到驗證信息后,計算:

    3.2.5 方案的效用分析

    根據(jù)驗證的過程可以看出:

    1)驗證信息的生成無需讀取所有的文件塊,也不需要傳輸文件。

    2)驗證信息ν=(T,ρ)相比文件本身而言要小的多,因此極大地節(jié)省了網(wǎng)絡(luò)傳輸開銷,提高了驗證的效率。

    3)由于不是所有數(shù)據(jù)塊及其標簽都參與計算,因此不能保證100%的置信度,詢問文件塊的數(shù)量c越大,其置信度越高,計算開銷越大。具體的c的取值是由文件塊的數(shù)量和用戶所要求的置信度,以及考慮計算開銷的情況下綜合選定,一般要求置信度不低于99%。

    3.3 多副本文件驗證方法

    對于文件的多個副本,不僅需要考慮文件的存在性和完整性,還要考慮多個副本的冗余可用性。

    3.3.1 多副本冗余可用性

    為了提高數(shù)據(jù)的可用性,現(xiàn)有云存儲平臺多采用副本技術(shù),即將數(shù)據(jù)的多個拷貝同時分散存儲于系統(tǒng)的不同物理位置,它們可以同時提供數(shù)據(jù)的訪問服務(wù)。通過這種部署方式可以有效應對可能出現(xiàn)的宕機、斷電、網(wǎng)絡(luò)錯誤等故障,從而提高數(shù)據(jù)可用性[14]。

    用戶將數(shù)據(jù)存入云存儲平臺,云服務(wù)商承諾為用戶的每份數(shù)據(jù)保留若干數(shù)量的副本。對于用戶而言,這些副本的存在對于提高數(shù)據(jù)的可用性,保證數(shù)據(jù)的高效、快速訪問具有重要的意義。但是在信任受限的數(shù)據(jù)環(huán)境中,存儲平臺在某些時候出于一些原因不愿意或者不能維持多個副本的同時存在。以云存儲應用背景為例,出于對公司聲譽的影響,或者對經(jīng)濟因素的考慮,云存儲服務(wù)提供商不會主動公布自己不能夠按照預先承諾維持足夠數(shù)量的副本。

    3.3.2 多副本存在性驗證方案

    對于用戶而言,目前缺乏對多副本存在性驗證的方法。本文3.2節(jié)中針對單一文件的存在性驗證技術(shù)并不適用于多副本的存在性驗證問題。簡單地采用單個數(shù)據(jù)存在性驗證方案分別對每個副本進行驗證是不可行的,因為各個副本內(nèi)容相同,服務(wù)提供方的多個服務(wù)器可以通過“合謀”的方式,以單一副本的存在偽造生成多個副本存在的證據(jù)。多副本驗證時若每個副本不做處理,服務(wù)商出于成本考慮可能用一個文件多次引用造成多副本的假象。原始方法采用每個副本分別加密作為不同文件,這樣每個副本都要生成一次同態(tài)標簽,副本數(shù)目較多時會造成極大的運算開銷。

    本文首先將數(shù)據(jù)加密,然后將加密數(shù)據(jù)與t個不同的隨機掩碼異或生成多個副本,在驗證時使用同一組同態(tài)標簽進行模指運算,一次性驗證所有副本,從而提高驗證的效率。

    1)多副本數(shù)據(jù)生成

    2)多副本數(shù)據(jù)標簽的生成

    文件的多個副本均共用一組標簽{Tj},。標簽生成后,將標簽 {T1,T2,…,Tm} 上傳至每個云存儲服務(wù)器。

    3)多副本數(shù)據(jù)存在性驗證

    云存儲服務(wù)器將數(shù)據(jù)存在性證據(jù)V=(T,ρ)傳送給客戶端,客戶端在收到驗證信息后,計算:

    4 方案安全性和性能分析

    4.1 安全性分析

    本文所提出的數(shù)據(jù)存在性驗證方案中數(shù)據(jù)標簽的計算是基于有限域上的離散對數(shù)難解性問題設(shè)計的,從數(shù)據(jù)標簽的計算公式可以看出,通過合理的選取兩個安全素數(shù)v和g,可以防止非法用戶或云存儲服務(wù)端的篡改和偽造。同時采用了RSA公鑰密碼算法的私鑰d進行簽名,進一步增強了標簽的防偽造性,RSA公鑰密碼算法是以大合數(shù)因子分解困難性為前提,本文方案中選擇了模數(shù)為2048位的RSA算法,在當前的計算能力下,能夠保證算法的安全性。

    4.2 性能分析

    在對數(shù)據(jù)存在性驗證過程中的各個階段的性能開銷進行分析時,我們將所有指數(shù)運算轉(zhuǎn)化為乘法運算,將中的乘法運算開銷記作MultCost(N),對于計算 yx,轉(zhuǎn)換為乘法運算需要|x|次乘法,即時間開銷約為 |x|MultCost(N)[15],如果采用快速模冪運算的方式計算,則實際的時間開銷會更小。

    在數(shù)據(jù)標簽的生成過程,由標簽的計算公式Ti=(h(Wi)?gbi)dmodN,其主要的開銷為模乘運算的開銷,每塊數(shù)據(jù)的長度為Lbit,m塊數(shù)據(jù)的標簽計算總開銷為mdLMultCost(N)。

    挑戰(zhàn)應答過程中,有c次偽隨機置換操作和c次模N乘操作,模乘運算開銷較大,為c(dL+s)MultCost(N)。標簽驗證階段運算開銷為esMultCost(N)。單文件存在性驗證方案挑戰(zhàn)應答和驗證階段總的計算開銷主要為(cdL+cs+es)MultCost(N)。

    在實際的云存儲應用時,由于受到網(wǎng)絡(luò)帶寬的限制,時間開銷會稍微多一點。我們選用配置為Intel Core i5 CPU 2.2GHz,4GB RAM的計算機上進行測試,得到 MultCost(N)≈4.2μs,則對于一個1MB的文件,分塊設(shè)為8KB的塊,則m=128,設(shè)RSA算法的密鑰選用2048位,抽取的數(shù)據(jù)塊數(shù)量c為20,參數(shù)s為32位,則標簽建立階段的計算開銷約為4.3s,標簽挑戰(zhàn)應答和驗證階段總的計算開銷約為0.16s,這里標簽建立階段計算開銷相對大點,但是標簽只計算一次,以后主要是挑戰(zhàn)應答和驗證,一次驗證過程0.31s的時間開銷是可以接受的。

    5 結(jié)語

    本文所提出的數(shù)據(jù)存在感知方案,可以讓用戶無限次地驗證數(shù)據(jù)是否被正確持有,并且在提供數(shù)據(jù)存在感知的同時,還可以對數(shù)據(jù)進行完整性驗證。在驗證文件的多個副本的存在性和完整性時,還將多個副本的冗余可用性一并考慮。但是方案中采用數(shù)據(jù)塊參與運算,如果數(shù)據(jù)塊選取較大則很可能影響效率,下一步將研究利用數(shù)據(jù)塊的同態(tài)hash值代替數(shù)據(jù)塊本身參與標簽的生成和證據(jù)的運算,進一步提高方案的效率。

    猜你喜歡
    副本可用性標簽
    基于文獻計量學的界面設(shè)計可用性中外對比研究
    包裝工程(2023年24期)2023-12-27 09:18:26
    基于輻射傳輸模型的GOCI晨昏時段數(shù)據(jù)的可用性分析
    面向流媒體基于蟻群的副本選擇算法①
    無懼標簽 Alfa Romeo Giulia 200HP
    車迷(2018年11期)2018-08-30 03:20:32
    不害怕撕掉標簽的人,都活出了真正的漂亮
    海峽姐妹(2018年3期)2018-05-09 08:21:02
    副本放置中的更新策略及算法*
    標簽化傷害了誰
    基于多進制查詢樹的多標簽識別方法
    計算機工程(2015年8期)2015-07-03 12:20:27
    樹形網(wǎng)絡(luò)中的副本更新策略及算法*
    空客A320模擬機FD1+2可用性的討論
    河南科技(2015年7期)2015-03-11 16:23:13
    望谟县| 明水县| 绍兴县| 曲松县| 天峻县| 绥宁县| 龙江县| 固镇县| 高阳县| 延安市| 汪清县| 新兴县| 临武县| 常宁市| 兖州市| 双流县| 八宿县| 措勤县| 博湖县| 墨江| 天津市| 大余县| 五莲县| 苏尼特右旗| 丹棱县| 南开区| 武义县| 兴山县| 宽城| 咸阳市| 越西县| 广东省| 彩票| 毕节市| 宜丰县| 余庆县| 光泽县| 屯门区| 曲阜市| 余江县| 界首市|