徐冰
摘? ?要:文章主要對(duì)計(jì)算機(jī)數(shù)據(jù)存儲(chǔ)虛擬化空間的穩(wěn)定性進(jìn)行優(yōu)化,該優(yōu)化方法基于預(yù)分塊和滑動(dòng)窗,以當(dāng)前和歷史數(shù)據(jù)的交界區(qū)域?yàn)橐罁?jù)完成存儲(chǔ)空間穩(wěn)定性優(yōu)化闌值的獲取,在完成數(shù)據(jù)變動(dòng)及非變動(dòng)區(qū)域劃分的基礎(chǔ)上實(shí)現(xiàn)其中冗余元素的提取以及重復(fù)數(shù)據(jù)存儲(chǔ)率的計(jì)算,通過滑動(dòng)窗口獲取上限值同實(shí)際值間的差值,最后根據(jù)數(shù)據(jù)的交界區(qū)域獲取穩(wěn)定性優(yōu)化闌值,從而完成對(duì)數(shù)據(jù)存儲(chǔ)虛擬空間的優(yōu)化。
關(guān)鍵詞:計(jì)算機(jī)數(shù)據(jù)存儲(chǔ)空間;虛擬化技術(shù);虛擬存儲(chǔ)形式
傳統(tǒng)固定分配資源模式存在利用率不高、數(shù)據(jù)遷移成本高且管理效率低等問題,隨著虛擬化技術(shù)的發(fā)展和完善,在數(shù)據(jù)存儲(chǔ)上運(yùn)用存儲(chǔ)虛擬化技術(shù)成為解決計(jì)算機(jī)數(shù)據(jù)存儲(chǔ)的有效方法,為大數(shù)據(jù)時(shí)代海量信息存儲(chǔ)提供了空間。本文提出了一種優(yōu)化存儲(chǔ)空間穩(wěn)定性的方法,根據(jù)絕對(duì)偏移量獲取穩(wěn)定性優(yōu)化闌值,據(jù)此完成存儲(chǔ)空間穩(wěn)定性的優(yōu)化過程。
1? ? 存儲(chǔ)空間穩(wěn)定性優(yōu)化原理
本文主要以實(shí)驗(yàn)室中的虛擬計(jì)算機(jī)作為研究對(duì)象,在具體對(duì)數(shù)據(jù)存儲(chǔ)空間穩(wěn)定性進(jìn)行優(yōu)化時(shí),先以內(nèi)容為依據(jù)對(duì)實(shí)驗(yàn)室全部數(shù)據(jù)進(jìn)行預(yù)分塊處理完成變動(dòng)區(qū)域和非變動(dòng)區(qū)域的劃分,在此基礎(chǔ)上完成分塊數(shù)據(jù)存儲(chǔ)地址的計(jì)算,進(jìn)而實(shí)現(xiàn)歷史與目前數(shù)據(jù)交界區(qū)域以及所需存儲(chǔ)數(shù)據(jù)關(guān)聯(lián)副本的獲取,據(jù)此對(duì)數(shù)據(jù)存儲(chǔ)空間完成穩(wěn)定性優(yōu)化過程,具體的操作流程如下。
首先在進(jìn)行預(yù)分塊過程中,假設(shè),連續(xù)數(shù)據(jù)由SSY表示,字節(jié)串由Si表示,一次性數(shù)據(jù)操作由Ti表示,經(jīng)過Ti對(duì)Si進(jìn)行操作后所獲取的字節(jié)串由Si+1(Ti)表示,數(shù)據(jù)發(fā)生變化的后標(biāo)志由Rem(Si,p)表示,針對(duì)數(shù)據(jù)類型的邊界開銷由HA(D,O)表示,系統(tǒng)中存在的介質(zhì)數(shù)據(jù)由HA表示,數(shù)據(jù)的初始長度信息由(D,O)表示,數(shù)據(jù)壓縮后最長相同前綴由HA(si)表示,則以內(nèi)容為依據(jù)對(duì)實(shí)驗(yàn)室全部數(shù)據(jù)進(jìn)行預(yù)分塊處理的表達(dá)式如下:
假設(shè),對(duì)重復(fù)數(shù)據(jù)進(jìn)行自動(dòng)搜索時(shí)的操作由μA(Si)表示,α表示重復(fù)文件的哈希值,字節(jié)的散列程度由βi表示,由λ*表示散列函數(shù),相同數(shù)據(jù)塊的原始存儲(chǔ)位置由y(g)表示,則對(duì)所有實(shí)驗(yàn)室數(shù)據(jù)按照如下表達(dá)式進(jìn)行劃分:
各組備份集由E表示,數(shù)據(jù)分組長度由(r)表示,數(shù)據(jù)庫中的元數(shù)據(jù)由A*表示,文件種類由f(x)表示,元數(shù)據(jù)間的關(guān)聯(lián)性由ξ表示,則按照如下表達(dá)式完成分塊數(shù)據(jù)存儲(chǔ)地址的計(jì)算:
數(shù)據(jù)的管理權(quán)由B(o)表示,貢獻(xiàn)因子由v表示,數(shù)據(jù)關(guān)聯(lián)性由ι表示,存儲(chǔ)介質(zhì)由c(z)表示,數(shù)據(jù)的時(shí)間戳信息由(y)表示,訪問數(shù)據(jù)文件的時(shí)間范圍由P(ij)表示,則不同時(shí)期數(shù)據(jù)的交界區(qū)域按照如下表達(dá)式給出[3]:
字節(jié)級(jí)別由P(e)表示,μ°表示存儲(chǔ)容量的需求程度,對(duì)于新數(shù)據(jù)由φ表示其存儲(chǔ)區(qū)域的邊界范圍,報(bào)文分組的劃分闌值由φ(l)表示,按照如下表達(dá)式完成所需存儲(chǔ)數(shù)據(jù)關(guān)聯(lián)副本的獲?。?/p>
根據(jù)上式的計(jì)算結(jié)果,利用如下表達(dá)式最終完成存儲(chǔ)空間穩(wěn)定性的優(yōu)化過程:
2? ? 數(shù)據(jù)存儲(chǔ)空間穩(wěn)定性優(yōu)化的實(shí)現(xiàn)
2.1? 構(gòu)建數(shù)據(jù)流映射空間
先融合于動(dòng)態(tài)指針方法對(duì)數(shù)據(jù)存儲(chǔ)空間穩(wěn)定性進(jìn)行優(yōu)化,對(duì)于所有的實(shí)驗(yàn)室系統(tǒng)中的數(shù)據(jù)流,以時(shí)間信息為依據(jù)完成若干段的劃分及數(shù)據(jù)流無窮序列的獲取,在此基礎(chǔ)上完成數(shù)據(jù)流老化計(jì)數(shù)值的計(jì)算及BF數(shù)據(jù)結(jié)構(gòu)體(2個(gè))的定義,以映射不同區(qū)間的數(shù)據(jù)流,具體操作及運(yùn)算流程如下:
段內(nèi)全部元素具有相同的到期時(shí)間,在不同段內(nèi)對(duì)于所需維護(hù)的數(shù)據(jù)元素由N表示具體數(shù)量,時(shí)間戳由w表示,滑動(dòng)窗口的數(shù)量及概率因子分別由α"及φ"表示,連續(xù)值的數(shù)量由c表示,當(dāng)前窗口由bit表示,額外存儲(chǔ)空間由m表示,數(shù)據(jù)單元素插入系統(tǒng)時(shí)由BF表示對(duì)應(yīng)的時(shí)間復(fù)雜度,則將系統(tǒng)中所有的數(shù)據(jù)流按照如下表達(dá)式完成若干段的劃分:
數(shù)據(jù)流元素的數(shù)量由K表示,最近元素在窗口中的保存數(shù)量由v(p)表示,Sk表示任意數(shù)據(jù)流(Sk=x1,x2,…,xk),針對(duì)已出現(xiàn)的x1,x1的重復(fù)元素即為出現(xiàn)于一定計(jì)數(shù)范圍內(nèi)的元素,true表示當(dāng)前的計(jì)數(shù)標(biāo)記符,則按照如下表達(dá)式完成數(shù)據(jù)流老化計(jì)數(shù)值的計(jì)算:
在對(duì)Sk歷史元素進(jìn)行保存時(shí),整數(shù)組成的數(shù)組由F(Y)表示,最大散列函數(shù)由h'k表示,數(shù)據(jù)中所有冗余元素?cái)?shù)量由P表示,由Ap表示數(shù)據(jù)流老化計(jì)數(shù)錯(cuò)誤概率,由B表示其計(jì)數(shù)序號(hào)的結(jié)構(gòu)體,計(jì)數(shù)映射由X表示(當(dāng)前區(qū)域范圍內(nèi)),計(jì)算公式如下:
在數(shù)據(jù)流中由φ(x)表示各元素輸出映射,特定因子由I(f)表示,散列函數(shù)的數(shù)量由ρ表示,映射情況(不同計(jì)數(shù)范圍內(nèi))由or表示,對(duì)于當(dāng)前數(shù)據(jù)及歷史數(shù)據(jù)存儲(chǔ)區(qū)域由decay和deeay表示對(duì)應(yīng)的BF數(shù)據(jù)長度,對(duì)應(yīng)指針計(jì)數(shù)器由I(d)表示,存儲(chǔ)空間消耗(BF數(shù)據(jù)結(jié)構(gòu)體)由(E)表示,則按照如下公式完成對(duì)不同區(qū)間數(shù)據(jù)流的映射過程[1]:
2.2? 存儲(chǔ)空間穩(wěn)定性優(yōu)化
本文基于數(shù)據(jù)存儲(chǔ)閾值完成計(jì)算機(jī)數(shù)據(jù)存儲(chǔ)空間穩(wěn)定性的優(yōu)化過程,在具體優(yōu)化實(shí)現(xiàn)過程中根據(jù)上文所獲取的數(shù)據(jù)流映射deeayBF和decayBF(對(duì)應(yīng)不同區(qū)間),完成對(duì)重復(fù)數(shù)據(jù)消除率的定義及數(shù)據(jù)存儲(chǔ)實(shí)際值同下限值間差值的獲取,新舊數(shù)據(jù)通過使用絕對(duì)偏移量完成交界區(qū)域的劃分及數(shù)據(jù)存儲(chǔ)閩值的獲取,最終完成穩(wěn)定性優(yōu)化過程,具體操作流程如下:
分塊數(shù)據(jù)存儲(chǔ)的地址由∫*表示,組成滑動(dòng)窗口的數(shù)量由H(γ)表示,時(shí)間開銷中由I(f)表示主要因素,字符的最長相同前綴由|DO|hs表示,γ表示分塊預(yù)期大小,在數(shù)據(jù)流映射deeayBF及decayBF的基礎(chǔ)上,按照如下公式完成重復(fù)數(shù)據(jù)消除率的定義:
在散列映射中由Δd表示沖突概率,對(duì)于前半計(jì)數(shù)區(qū)間由Eij表示對(duì)應(yīng)的有效計(jì)數(shù)元素,被訪問過的數(shù)據(jù)概率由Z(P)*表示,元數(shù)據(jù)開銷由ι表示,消除過期元素的數(shù)量由(i)表示,更新范圍限制(指每次插入新數(shù)據(jù)時(shí))由ι(χ)表示,結(jié)構(gòu)體的單元最大值由I(s)表示,則存儲(chǔ)的下限值和實(shí)際值按照如下表達(dá)式獲取二者間的差值[2]:
計(jì)數(shù)最大范圍由φ(P)表示,過期數(shù)據(jù)元素導(dǎo)致的性能開銷由(p)表示,標(biāo)志性闌值由μ(Q)表示(用于區(qū)分歷史和當(dāng)前數(shù)據(jù)),則按照如下表達(dá)式完成新舊數(shù)據(jù)交界區(qū)域的劃分(根據(jù)絕對(duì)偏移量):
對(duì)于當(dāng)前有效的工作區(qū)間,由θ*j表示其所存儲(chǔ)的數(shù)據(jù)元素?cái)?shù)量,則按照如下表達(dá)式獲取數(shù)據(jù)存儲(chǔ)闌值:
根據(jù)上式的計(jì)算結(jié)果實(shí)現(xiàn)對(duì)計(jì)算機(jī)數(shù)據(jù)存儲(chǔ)空間的優(yōu)化過程,使其穩(wěn)定性和安全性得到進(jìn)一步提升,以有效滿足不斷增長的數(shù)據(jù)存儲(chǔ)需求[3]。
3? ? 結(jié)語
對(duì)于虛擬計(jì)算機(jī)數(shù)據(jù)存儲(chǔ)空間穩(wěn)定性的優(yōu)化,傳統(tǒng)方法大多普遍存在歷史和當(dāng)前數(shù)據(jù),難以有效區(qū)分且數(shù)據(jù)存儲(chǔ)安全度低等不足。為此本文根據(jù)現(xiàn)有優(yōu)化方法提出了一種優(yōu)化數(shù)據(jù)存儲(chǔ)空間穩(wěn)定性的方法,先融合于動(dòng)態(tài)指針方法,以預(yù)分塊和滑動(dòng)窗口為依據(jù),完成數(shù)據(jù)變動(dòng)及非變動(dòng)區(qū)域的有效劃分,在獲取實(shí)驗(yàn)室系統(tǒng)數(shù)據(jù)流無窮序列的基礎(chǔ)上,完成數(shù)據(jù)流老化計(jì)數(shù)值的獲取及冗余元素的去除,從而使對(duì)存儲(chǔ)空間穩(wěn)定性優(yōu)化過程得以有效實(shí)現(xiàn),在有效拓展了計(jì)算機(jī)存儲(chǔ)空間的同時(shí),提高了數(shù)據(jù)存儲(chǔ)安全性和穩(wěn)定性,具有較高的實(shí)際應(yīng)用價(jià)值。
[參考文獻(xiàn)]
[1]吳迎鴿.計(jì)算機(jī)硬盤存儲(chǔ)結(jié)構(gòu)及硬件故障數(shù)據(jù)恢復(fù)技術(shù)研究[J].自動(dòng)化與儀器儀表,2018(11):47-49.
[2]葛微,羅圣美,周文輝,等.HiBase:一種基于分層式索引的高效HBase查詢技術(shù)與系統(tǒng)[J].計(jì)算機(jī)學(xué)報(bào),2016(1):140-153.
[3]吳章玲,金培權(quán),岳麗華,等.基于PCM的大數(shù)據(jù)存儲(chǔ)與管理研究綜述[J].計(jì)算機(jī)研究與發(fā)展,2018(2):343-361.
Research on computer data storage virtualization technology optimization
Xu Bing
(Shenyang Polytechnic College, Shenyang 110045, China)
Abstract:This paper mainly optimizes the stability of computer data storage virtualization space, which is based on pre-blocking and sliding windows. Based on the junction area of current and historical data, the acquisition of storage space stability optimization value is completed, the extraction of redundant elements and the calculation of the duplicate data storage rate are realized on the basis of the completion of data change and non-variable division, and the difference between the upper value and the actual value is obtained by sliding window. Finally, according to the junction area of the data, the stability optimization value is obtained, so as to complete the optimization of the virtual space of data storage.
Key words:computer data storage space; virtualization technology; virtual storage form