◆湯桂清 孫玲玲 陳艷輝
網(wǎng)絡(luò)環(huán)境下的檔案數(shù)據(jù)儲存安全管理及其構(gòu)建分析
◆湯桂清1孫玲玲2陳艷輝3
(1.承德廣通信息網(wǎng)絡(luò)有限公司灤平分公司 河北 068250;2.河北民族師范學(xué)院 河北 050000;3.灤平縣國土資源局灤平鎮(zhèn)國土資源所 河北 068250)
隨著社會經(jīng)濟的持續(xù)發(fā)展及技術(shù)的不斷更新,檔案數(shù)據(jù)庫在此浪潮中已被認定為檔案信息資源共享、管理與組織的最優(yōu)方案與方法,管理檔案數(shù)據(jù)庫需要有一個系統(tǒng)化平臺與有效工具,而構(gòu)建一個統(tǒng)一化的檔案數(shù)據(jù)存儲管理平臺,則恰好能滿足此需求。至此,本文對此平臺的構(gòu)建內(nèi)容、所面臨問題及主要功能進行適當性論述,探討統(tǒng)一數(shù)據(jù)管理平臺內(nèi)在特性及所持有優(yōu)勢,以期為相關(guān)應(yīng)用研究提供理論參考。
檔案數(shù)據(jù)存儲;安全管理;構(gòu)建
伴隨當今社會信息化程度的日漸加深與彼此融合,社會各級別檔案館也正在趨向于海量化、系統(tǒng)化的檔案信息存儲中心。建設(shè)安全可靠而又實用的數(shù)字化檔案信息存儲管理平臺,已然成為當前檔案館需要積極落實的關(guān)鍵內(nèi)容。當前,對于日漸規(guī)?;?、數(shù)字化的檔案信息存儲體系而言,其主要包含四方面內(nèi)容,即歸檔、備份、容災(zāi)與存儲。
1.1 存儲
存儲架構(gòu)有3種類型劃分,即網(wǎng)絡(luò)區(qū)域存儲(SAN)、網(wǎng)絡(luò)附加存儲(NAS)及直連存儲(DAS)。在檔案系統(tǒng)運用時,選用SAN或者NAS架構(gòu),最具合理性:NAS結(jié)構(gòu),其將文件系統(tǒng)作為其內(nèi)在基礎(chǔ),所以在檔案文件存放當中運用NAS架構(gòu),能夠高效化且相對經(jīng)濟性的落實檔案的電子化;而SAN結(jié)構(gòu),其主要是將數(shù)據(jù)塊作為其基礎(chǔ),所以其對于檔案數(shù)據(jù)庫的構(gòu)建,更加具有適用性,能夠以更高的速度與效率,查詢與管理檔案數(shù)據(jù)。另外,存儲產(chǎn)品可靠性,比如存儲構(gòu)造是否合理及存儲控制器有無冗余狀況等。對于一個較為可靠的存儲系統(tǒng)來講,需要同時設(shè)置2個甚至更多的高性能控制器,以此為核心控制的安全性與可靠性提供充足保障;還需具有N+1設(shè)備冗余,如通道卡、風(fēng)扇及電源等;對于存儲構(gòu)造,需要選用點對點模式或者是交換模式,以此來獲取更加的數(shù)據(jù)傳輸性能;對自身數(shù)據(jù)存儲進行安全保護,需考慮遠程數(shù)據(jù)的復(fù)制支持、故障監(jiān)測、硬盤raid級別及數(shù)據(jù)快照支持等。
1.2 容災(zāi)
容災(zāi)實際就是為應(yīng)對可能出現(xiàn)的災(zāi)難,實現(xiàn)準備好的各項預(yù)防應(yīng)急措施。在遠程容災(zāi)系統(tǒng)方案實際規(guī)劃過程中,需要結(jié)合相關(guān)要求,就方案各項細致化內(nèi)容及所需達成目標予以明確。由于災(zāi)難在恢復(fù)目標方面存有差異,因此,可運用與災(zāi)難類型相適應(yīng)的恢復(fù)技術(shù),至此,無論是在運行成本上,還是在投資規(guī)模方面,均會存有差別。依據(jù)信息中心實況,檔案館在容災(zāi)系統(tǒng)方案實際選擇時,需酌情考慮如下內(nèi)容:(1)目標1:應(yīng)對災(zāi)難的實際種類。計算機所在環(huán)境及系統(tǒng)內(nèi)當中所存在的各種潛藏性因素,可能會導(dǎo)致數(shù)據(jù)大范圍丟失。相關(guān)數(shù)據(jù)統(tǒng)計顯示,在導(dǎo)致數(shù)據(jù)丟失的各類型事件當中,網(wǎng)絡(luò)故障及軟硬件所占比例達11%,而電源故障及斷電所占比例為50%,雷電、爆炸、火災(zāi)、地震等為18%,人為占17%,其它4%。為了能夠采取有效措施,對各種突發(fā)災(zāi)難予以應(yīng)對,對于主中心的選址而言,其與災(zāi)備中心的選址存在差突出不同。比如針對地震災(zāi)害,為施加應(yīng)對,災(zāi)備中心與主中心需要選址于不同城市,不可同城;為了應(yīng)對長時間停電,在災(zāi)備中心與主中心的選址上,需選擇不同的電廠覆蓋區(qū)域。只需將災(zāi)害類型予以明確,方能更加合理、高效的選出災(zāi)備中心與主中心的適宜位置。(2)目標-2:恢復(fù)時間目標。所謂恢復(fù)時間目標實際就是當發(fā)生災(zāi)難之后,業(yè)務(wù)能夠接受或者最大忍耐的停頓時間,還可理解為:當災(zāi)難出現(xiàn)后,業(yè)務(wù)在運行恢復(fù)方面所需時間,通常情況下,當具有越短的恢復(fù)時間時,則會具有相對較高的災(zāi)難恢復(fù)方案的成本,但由此而導(dǎo)致的業(yè)務(wù)損失量也就隨之而變??;相反,當具有越長的恢復(fù)時間時,則會具有越低的災(zāi)難恢復(fù)方案成本,但會具有越大的業(yè)務(wù)損失。其中最為恰當而又合宜的恢復(fù)時間,需為方案成本曲線,與業(yè)務(wù)影響曲線相交點,即對應(yīng)的時間。若短于最佳,則會導(dǎo)致較大的投資浪費;若長于最佳恢復(fù)時間的目標,當發(fā)生災(zāi)難之后,所產(chǎn)生的損失會超過方案投資成本,因此,具有較大的災(zāi)難損失風(fēng)險。(3)目標-3:恢復(fù)數(shù)據(jù)目標。所謂恢復(fù)數(shù)據(jù)目標,實際就是發(fā)生災(zāi)難之后,業(yè)務(wù)可接受的數(shù)據(jù)丟失量,還可理解為有災(zāi)難所導(dǎo)致的最大數(shù)據(jù)丟失量。通常情況下,當恢復(fù)數(shù)據(jù)目標越高,則具有越高的方案成本,但會具有越小的因災(zāi)難所致業(yè)務(wù)損失;相反,當具有越低的恢復(fù)數(shù)據(jù)目標,則會具有越低的方案成本,但由災(zāi)難所導(dǎo)致的業(yè)務(wù) 也會隨之而增大。
1.3 備份
備份乃是為數(shù)據(jù)安全最后屏障,不管是容災(zāi),還是還是后續(xù)的存儲環(huán)節(jié),均為在線儲存。針對以備份方式而存在的數(shù)據(jù),除了可在線存放外,還可利用硬盤等分方式而實現(xiàn)離線保存,對于那些在線保存的數(shù)據(jù)而言,可實現(xiàn)快速恢復(fù)。而對于那些離線保存下來的數(shù)據(jù)而言,則相比于其它數(shù)據(jù),具有更加安全的存放環(huán)境。當一個嚴重性災(zāi)難發(fā)生,導(dǎo)致容災(zāi)系統(tǒng)當中的數(shù)據(jù)不可用,或者是本地系統(tǒng)當中的數(shù)據(jù)不可用時,利用備份,便可最大程度的恢復(fù)可用數(shù)據(jù)。便能最大程度、最大限量的實現(xiàn)損失量的減少。如果數(shù)據(jù)丟失因素乃因人為,則可利用磁盤等介質(zhì),以在線的方式,進行數(shù)據(jù)備份,便可以較快的方式。所以在條件許可狀況下,可選擇磁帶備份與磁盤備份相結(jié)合的方式,以此為數(shù)據(jù)安全提供保障。當前所開發(fā)出的各種類型的備份軟件,能夠為災(zāi)難時數(shù)據(jù)提供可靠備份,還能運用各種介質(zhì),恢復(fù)所丟失的數(shù)據(jù),進而以較快速度、較短的時間,實現(xiàn)業(yè)務(wù)系統(tǒng)的恢復(fù)。
1.4 歸檔
備份就是為了恢復(fù),以此在出現(xiàn)以往故障時,能夠確保業(yè)務(wù)持續(xù)與連貫。尤其是在線備份,在速度方面通常會有比其它內(nèi)容更高的要求,但在容量方面,卻要求較低。實施歸檔的最終目的而言,其與備份相比,存有較大差別,由于檔案館內(nèi)數(shù)據(jù)龐大,且其中多數(shù)今后較少用到,但這些數(shù)據(jù)還需要認真保存,以備用時能夠及時查詢到。實際上,進行歸檔,就是保障數(shù)據(jù)始終保持完整性。在歸檔系統(tǒng)選擇時,可遵循如下原則。(1)需長久保留數(shù)據(jù)。不管是備份還是歸檔,均需要切實有效的保證數(shù)據(jù)的完整性,需在制定時間內(nèi),使數(shù)據(jù)能夠安全的得以儲存。(2)數(shù)據(jù)需便于讀取。盡管諸多數(shù)據(jù)日后所用范圍不大,但歸檔系統(tǒng)仍然是一個大倉庫,需要確保在實際使用時,能夠便于讀取,此乃歸檔系統(tǒng)的基礎(chǔ)原則。(3)法規(guī)運用。當前對于國內(nèi)而言,在此方面的法規(guī),仍然處于不斷完善階段,而在國外,已經(jīng)頒布實施了薩班斯-奧克斯萊法案及SEC法案等,并明確了電子記錄的可存取性、保密性與完整性。(4)數(shù)據(jù)具有可擴展性。數(shù)據(jù)始終處于不斷擴展之中,對于歸檔系統(tǒng),需時刻提升自身所持有的可擴展性,滿足今后需求。
當前,各級檔案館均在大力度建設(shè)數(shù)字化檔案信息存儲系統(tǒng),構(gòu)建包含有諸多功能的儲存系統(tǒng),如歸檔、備份、容災(zāi)及存儲等。但因各廠家所生產(chǎn)出的產(chǎn)品缺乏兼容性,不能有效管理數(shù)據(jù)的有效性與完整性。數(shù)據(jù)管理人員未能深入了解所儲存數(shù)字檔案信息的重要性,通常是只知道有此數(shù)據(jù),而卻不知道其準確位置。對于數(shù)據(jù)是否為有效儲存不太了解,難以結(jié)合各儲存系統(tǒng)實際運行情況,及時制定并提出切實有效的數(shù)據(jù)遷移計劃。為了將數(shù)據(jù)備份工作盡量做好,當前,許多檔案館選用了各種備份模式,如局部集中備份等,造成在運用數(shù)據(jù)備份方面,一些系統(tǒng)存在不充分狀況,完成備份的時間也相對較長,難以系統(tǒng)化、全面性保存數(shù)據(jù)。這些問題的實際存在,往往會促使數(shù)據(jù)保護風(fēng)險的增加,管理成本也會保持高位。數(shù)字化檔案信息,需將其所保管信息資源的價值最大化挖掘出來。而為實現(xiàn)此功能,網(wǎng)絡(luò)、服務(wù)器及存儲設(shè)備為其提供了基礎(chǔ)結(jié)構(gòu)與工具,但要想構(gòu)建一個完備的數(shù)字化檔案信息的存儲中心,需在適當?shù)牡攸c及適當?shù)臅r間,提供真實所需的信息能力上。要想實現(xiàn)此目標,需做到各環(huán)節(jié)的有機整合,構(gòu)建統(tǒng)一化、完善的檔案存儲管理平臺。
對于檔案管理平臺,其由多模塊構(gòu)成,如資源管理及恢復(fù)等,運用相同源代碼緊密融合在一起。此些功能功能強大,在起初的軟件架構(gòu)設(shè)計階段,便立足于此些功能模塊能夠?qū)ο嗤姆?wù)功能實現(xiàn)共享,還可利用單一的控制臺,對全部數(shù)據(jù)管理功能,可靠、簡單而又迅速的執(zhí)行,能夠以一種較為有效的方式,幫助客戶將基礎(chǔ)架構(gòu)階段所存在的成本問題予以消除,還可實現(xiàn)數(shù)據(jù)管理效率的大幅提升。針對統(tǒng)一數(shù)據(jù)管理平臺而言,需選用一個統(tǒng)一視圖,以此來提供如下功能:(1)數(shù)據(jù)恢復(fù)與備份。不僅能夠?qū)︵]件系統(tǒng)及數(shù)據(jù)庫實施備份,而且還能對文件系統(tǒng)及種操作系統(tǒng)進行備份。備份時,可結(jié)合實際,自動完成此操作。(2)快照恢復(fù)與管理。可運用軟硬件引擎,基于存儲設(shè)備,建立存在時間點的各類恢復(fù)卷,在較短時間內(nèi),便可實現(xiàn)硬軟件的快速恢復(fù),以此為業(yè)務(wù)的連續(xù)性提供保證。(3)復(fù)制遠程連續(xù)數(shù)據(jù)。可運用有限寬帶,來運用軟件數(shù)據(jù),并對文件進行復(fù)制,建立恢復(fù)點,保證數(shù)據(jù)一致性。可運用此功能,把原來儲存在中心處的各種數(shù)據(jù),以復(fù)制的方式向異地復(fù)制,實現(xiàn)容災(zāi);另外,還可將各個地方數(shù)據(jù),向中心區(qū)域復(fù)制,實施集中保護。(4)服務(wù)管理和報告。運用此工具軟件,管理者能夠以一種較為輕松的方式管理存儲資源,并對數(shù)據(jù)管理的全部操作進行跟蹤,提供對應(yīng)報告,保證服務(wù)質(zhì)量。
總而言之,構(gòu)建統(tǒng)一檔案數(shù)據(jù)存儲管理平臺,乃是有效管理檔案的重要內(nèi)容,同時也是隨著當前檔案管理工作發(fā)展的實際需求。至此,通過運用此平臺,保證檔案資源的可靠性與完整性,為社會提供更為豐富、全面的檔案信息資源,推動資源的融合與共享。
[1]孫志強,高旭,官澤.健康檔案管理模型構(gòu)建與系統(tǒng)開發(fā)[J].軟件工程師,2013.
[2]王振興,楊敏華,吳勰等.檔案掃描入庫管理系統(tǒng)設(shè)計與實現(xiàn)[J].測繪科學(xué),2008.
[3]王玉涵,黃茂海,劉飛飛.SVOM數(shù)據(jù)檔案庫軟件原型系統(tǒng)的設(shè)計與實現(xiàn)[J].天文研究與技術(shù),2015.
[4]胡銳.基于Hadoop的高校檔案管理存儲系統(tǒng)研究[J].無線互聯(lián)科技,2016.
[5]朱曉鐘,李鑫.能源行業(yè)檔案管理系統(tǒng)存儲架構(gòu)設(shè)計分析[J].信息系統(tǒng)工程,2012.
本文為承德市科學(xué)技術(shù)研究與發(fā)展計劃項目“京津冀一體化環(huán)境下基于‘互聯(lián)網(wǎng)+’的檔案管理數(shù)據(jù)庫平臺建設(shè)與服務(wù)研究”(編號:201606A133)的研究成果之一。