寧凌 周振宇
摘要:現(xiàn)有PDM系統(tǒng)數(shù)據(jù)的存儲方式難以滿足數(shù)據(jù)可靠性的要求,云存儲將企業(yè)分散的數(shù)據(jù)存儲節(jié)點整合起來,一方面提升企業(yè)PDM系統(tǒng)的敏捷性和高效性,降低企業(yè)投入的成本,簡化其運營和基礎(chǔ)設(shè)施;另一方面將云存儲與數(shù)據(jù)備份相結(jié)合,提高PDM系統(tǒng)的可靠性。與傳統(tǒng)數(shù)據(jù)備份不同,提出了以PDM用戶客戶端作為云存儲節(jié)點的架構(gòu)思路,設(shè)計了通過該架構(gòu)對數(shù)據(jù)進行存儲、備份及恢復(fù)過程的工作流程,為不斷增長的PDM系統(tǒng)數(shù)據(jù)提供了一種備份存儲方法。
關(guān)鍵詞:PDM系統(tǒng);云備份;數(shù)據(jù)安全
中圖分類號:TP393文獻標志碼:A文章編號:1008-1739(2018)03-64-3
A Cloud Backup Architecture Based on PDM System
NING Ling1,ZHOU Zhenyu2
(1. The 54th Research Institute of CETC, Shijiazhuang 050081, China; 2. Military Representative Office of PLA Unit 61195 in Tianjin, Tianjin 300211, China)
0引言
當今社會,網(wǎng)絡(luò)信息化程度持續(xù)提高,社會各行各業(yè)愈來愈依賴于信息系統(tǒng),PDM系統(tǒng)得到了廣泛地應(yīng)用。通過PDM系統(tǒng)積累的海量數(shù)據(jù)[1]已經(jīng)逐漸成為企業(yè)重要的數(shù)據(jù)資產(chǎn),是保證企業(yè)經(jīng)濟利益及后續(xù)發(fā)展的核心,人們對數(shù)據(jù)存儲安全的擔憂逐漸顯現(xiàn),而災(zāi)備服務(wù)成為災(zāi)難發(fā)生時確保業(yè)務(wù)連續(xù)性和數(shù)據(jù)可用性的重要手段。
災(zāi)難備份是信息系統(tǒng)應(yīng)用中為預(yù)防出現(xiàn)各類災(zāi)難損毀系統(tǒng)而進行的備份[2],出現(xiàn)系統(tǒng)損毀后,運用備份的設(shè)備迅速恢復(fù)系統(tǒng)運行,這對于信息系統(tǒng)安全具有重要的意義。傳統(tǒng)的數(shù)據(jù)備份大多采用單一的存儲服務(wù)器,在安全性和可擴展性方面都存在明顯的缺陷,比如在安全性方面,如果備份服務(wù)器由于遭受攻擊或者其他原因而損壞,則服務(wù)器中的備份數(shù)據(jù)就會遭到破壞,不能進行數(shù)據(jù)恢復(fù),容災(zāi)容錯的目的就無法達到。而且傳統(tǒng)災(zāi)備主要是異地容災(zāi),就是在不同的地域,構(gòu)建一套或者多套相同的應(yīng)用或者數(shù)據(jù)庫,起到災(zāi)難后立刻接管的作用,這種異地災(zāi)備建設(shè)的缺點是成本大、建設(shè)周期長、技術(shù)要求高和運營成本高。
本文擬采用云技術(shù)將企業(yè)分散的數(shù)據(jù)存儲節(jié)點整合起來,一方面提升企業(yè)PDM系統(tǒng)的敏捷性和高效性,降低企業(yè)投入的成本,簡化其運營和基礎(chǔ)設(shè)施;另一方面將云存儲與數(shù)據(jù)備份相結(jié)合[3],提高PDM系統(tǒng)的可靠性。
1以PDM用戶節(jié)點作為云存儲節(jié)點的架構(gòu)
1.1基本思路
產(chǎn)品數(shù)據(jù)是PDM系統(tǒng)的核心,而數(shù)據(jù)備份作為一種數(shù)據(jù)安全策略,確保了原始數(shù)據(jù)的一致性和安全性,在災(zāi)難和故障發(fā)生時能有效恢復(fù)原有數(shù)據(jù),是避免數(shù)據(jù)丟失和保證數(shù)據(jù)安全的基本保障。
對于PDM系統(tǒng)而言,系統(tǒng)數(shù)據(jù)是不斷擴展的,對此類系統(tǒng)進行數(shù)據(jù)備份所需要的容量往往是難以預(yù)計的,若采用傳統(tǒng)數(shù)據(jù)備份方式,則需要隨著數(shù)據(jù)量的不斷擴展進行設(shè)備的更新,就提升了數(shù)據(jù)備份的成本。針對傳統(tǒng)備份系統(tǒng)不足,基于現(xiàn)有PDM系統(tǒng)數(shù)據(jù)存儲方式的基本現(xiàn)實,結(jié)合云存儲采用廉價的設(shè)備構(gòu)建集群,實現(xiàn)數(shù)據(jù)的分布式存儲,降低數(shù)據(jù)備份的成本,實現(xiàn)集群的無縫擴展的特點,設(shè)計了PDM數(shù)據(jù)存儲系統(tǒng),如圖1所示。
1.2基于云存儲的PDM數(shù)據(jù)存儲系統(tǒng)架構(gòu)
基于云存儲的PDM數(shù)據(jù)存儲系統(tǒng)由客戶端、服務(wù)器和集中存儲設(shè)備3個部分組成。
①客戶端:既作為數(shù)據(jù)的使用客戶端,也作為用戶數(shù)據(jù)備份的云存儲端,是進行數(shù)據(jù)產(chǎn)生、使用、備份和恢復(fù)的計算機節(jié)點,實現(xiàn)PDM數(shù)據(jù)的產(chǎn)生、上傳、備份與恢復(fù);同時,客戶端節(jié)點分享自己的空余空間,基于HDFS分布式文件系統(tǒng),作為數(shù)據(jù)節(jié)點接收服務(wù)器端分配的任務(wù),組成用于備份數(shù)據(jù)的云存儲。
②服務(wù)器端是數(shù)據(jù)存儲系統(tǒng)的中心,當收到客戶端的請求后,服務(wù)器端根據(jù)用戶操作類型及用戶類型等分別進行處理。若為上傳或備份類操作則先緩存數(shù)據(jù),再進行壓縮操作,之后轉(zhuǎn)存到集群上;若為下載或恢復(fù)類操作,則先從集群讀取相關(guān)數(shù)據(jù)將其緩存在服務(wù)器上,再進行解壓縮操作,之后由客戶端下載需要的數(shù)據(jù)。另外,服務(wù)器端也負責(zé)響應(yīng)操作的信息記錄以及數(shù)據(jù)庫操作,基于HDFS分布式文件系統(tǒng)[4]作為云存儲的管理節(jié)點。
③集中存儲設(shè)備:用于實現(xiàn)PDM系統(tǒng)各類數(shù)據(jù)的存儲,是PDM系統(tǒng)現(xiàn)存的數(shù)據(jù)存儲中心,實現(xiàn)PDM系統(tǒng)數(shù)據(jù)的高速存儲和訪問。
2云存儲工作流程
2.1基于HDFS云存儲集群的存儲
本系統(tǒng)基于HDFS構(gòu)建云存儲集群,利用一臺服務(wù)器作為管理節(jié)點,另一臺服務(wù)器作為備用管理節(jié)點,使用若干客戶端主機作為數(shù)據(jù)節(jié)點來搭建分布式集群[5],分布式集群中的客戶端主機分享部分剩余空間用于備份數(shù)據(jù)的存儲。數(shù)據(jù)節(jié)點每隔一段時間向管理節(jié)點發(fā)送心跳信息,報告存儲的所有數(shù)據(jù)塊的信息,管理節(jié)點則可以根據(jù)心跳信息驗證塊映射和其他文件系統(tǒng)的元數(shù)據(jù)。如果管理節(jié)點沒有收到心跳信息并且重新嘗試失敗后,則說明此數(shù)據(jù)節(jié)點失效,將采取修復(fù)措施,重新復(fù)制在該節(jié)點上的數(shù)據(jù)塊。
在HDFS內(nèi)部,一個文件分成一個或多個“數(shù)據(jù)塊”,這些“數(shù)據(jù)塊”存儲在數(shù)據(jù)節(jié)點,管理節(jié)點負責(zé)保存和管理所有的HDFS元數(shù)據(jù)。數(shù)據(jù)節(jié)點在管理節(jié)點的指揮下進行“數(shù)據(jù)塊”的創(chuàng)建、刪除和復(fù)制。為實現(xiàn)數(shù)據(jù)備份[6]的高可靠性,本系統(tǒng)采用HDFS的副本策略,將數(shù)據(jù)備份的副本存放在不同的客戶端主機上,保證某一客戶端主機發(fā)生故障時數(shù)據(jù)的完整性,其存儲過程如圖2所示。
2.2數(shù)據(jù)備份過程設(shè)計
客戶端根據(jù)業(yè)務(wù)需求進行數(shù)據(jù)備份操作,指定備份策略,當確定當前沒有進行數(shù)據(jù)操作時,將備份范圍內(nèi)的備份文件目錄信息提供給服務(wù)器子系統(tǒng),等待服務(wù)器子系統(tǒng)進行處理,服務(wù)器接收到客戶端的備份請求后,根據(jù)客戶端提供的文件信息從集中存儲設(shè)備讀取相關(guān)文件,并將文件上傳至HDFS集群,并根據(jù)備份策略進行相應(yīng)的操作,并對備份結(jié)果進行記錄,將備份結(jié)果返回客戶端,數(shù)據(jù)備份流程設(shè)計如圖3所示。
2.3數(shù)據(jù)恢復(fù)過程設(shè)計
客戶端在確定無數(shù)據(jù)操作的情況下根據(jù)業(yè)務(wù)需求進行數(shù)據(jù)的恢復(fù)操作,請求服務(wù)器準備恢復(fù)數(shù)據(jù),根據(jù)服務(wù)器提供的恢復(fù)數(shù)據(jù)目錄選擇要恢復(fù)的數(shù)據(jù)文件。服務(wù)器子系統(tǒng)收到客戶端恢復(fù)數(shù)據(jù)的請求后,根據(jù)恢復(fù)數(shù)據(jù)文件信息讀取HDFS集群中管理節(jié)點的元數(shù)據(jù)信息,得到待恢復(fù)數(shù)據(jù)文件的存儲地址,對其進行讀取,當讀取成功時將數(shù)據(jù)緩存在服務(wù)器上,并返回客戶端,等待客戶端進行數(shù)據(jù)下載,數(shù)據(jù)恢復(fù)過程的流程設(shè)計如圖4所示。
3結(jié)束語
現(xiàn)有PDM系統(tǒng)文件單副本集中式的存儲方式,難以滿足可靠性的要求。為提高PDM系統(tǒng)的服務(wù)質(zhì)量,提出的云備份數(shù)據(jù)存儲將企業(yè)分散的數(shù)據(jù)存儲節(jié)點整合起來,建立系統(tǒng)化的數(shù)據(jù)應(yīng)急方式,以保證數(shù)據(jù)安全性,是確保企業(yè)業(yè)務(wù)連續(xù)性和數(shù)據(jù)可用性的重要手段。
參考文獻
[1]侯建,帥仁俊,侯文.基于云計算的海量數(shù)據(jù)存儲模型[J].通信技術(shù),2011,44(5):163-165.
[2]楊虹.基于云災(zāi)備的數(shù)據(jù)安全存儲現(xiàn)狀研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2014(7):175-176.
[3]叒黃.云災(zāi)備的現(xiàn)狀、應(yīng)用與發(fā)展趨勢[J].數(shù)字技術(shù)與應(yīng)用, 2015(11):194-195.
[4]楊涌,陳永源,劉磊鋒.一種基于DHT的分布式云災(zāi)備模型研究[J].通信技術(shù),2014,47(6):647-650.
[5]丘強.云計算環(huán)境下的分布存儲的關(guān)鍵技術(shù)研究[J].數(shù)字技術(shù)與應(yīng)用,2015(11):194-195.
[6]戚斌.淺談計算機數(shù)據(jù)備份和數(shù)據(jù)恢復(fù)技術(shù)分析[J].電子技術(shù)與軟件工程,2017(1):221.