李迎春,李 建,王飛艷
(云南省煙草煙葉公司,云南 昆明 650000)
云計算是計算機發(fā)展衍生的一種新型分布式技術(shù),是一個基于服務(wù)的架構(gòu)系統(tǒng),其中云存儲是云計算的服務(wù)架構(gòu)核心。目前,大多數(shù)云計算應(yīng)用服務(wù)都能滿足信息時代發(fā)展的需要,并且具有強大的數(shù)據(jù)保存與管理能力。信息時代,只有利用好云存儲服務(wù),靈活處理各種數(shù)據(jù),才能更好地滿足用戶的需求,因此對云計算數(shù)據(jù)存儲技術(shù)的研究與分析具有重要意義[1]。文章闡述了云計算技術(shù)與云計算數(shù)據(jù)存儲技術(shù)的概念,分析了云計算數(shù)據(jù)存儲技術(shù)的類型,并深入研究了云計算數(shù)據(jù)存儲技術(shù)的工作原理、系統(tǒng)構(gòu)成及其他技術(shù)的實踐應(yīng)用。
從狹義角度分析,云計算技術(shù)是一種分布式計算應(yīng)用程序,主要處理和計算各類數(shù)據(jù),將處理程序分解成許多小程序,最終匯總和分析各個小程序并返回分析結(jié)果。從廣義角度分析,云計算是一種服務(wù),主要提供基礎(chǔ)設(shè)施即服務(wù)、平臺即服務(wù)、軟件即服務(wù)3種服務(wù)。通過3種不同的服務(wù)模式,可以滿足各種用戶的不同需求。大多數(shù)用戶使用的是基礎(chǔ)設(shè)施即服務(wù)。通過該服務(wù)可獲取相關(guān)的計算處理和數(shù)據(jù)存儲等資源,且不受空間和時間的限制。
云計算數(shù)據(jù)存儲技術(shù)是云計算技術(shù)的核心構(gòu)成部分,是一種新型數(shù)據(jù)存儲及管理方式。云計算數(shù)據(jù)儲存技術(shù)與傳統(tǒng)的存儲技術(shù)有著較大差別。首先,云計算數(shù)據(jù)儲存技術(shù)能夠提供無限制的存儲容量,打破存儲空間限制的瓶頸。其次,該技術(shù)能夠?qū)?shù)據(jù)存儲在云端,打破存儲空間限制的瓶頸。最后,云計算數(shù)據(jù)存儲技術(shù)能夠利用集群應(yīng)用和網(wǎng)絡(luò)技術(shù)等功能,使不同類型的數(shù)據(jù)存儲設(shè)備協(xié)同工作,并對外提供服務(wù)。
云計算數(shù)據(jù)存儲技術(shù)提供的對外服務(wù)具有簡便、高效等特點,用戶可以在任何時間及地點調(diào)用數(shù)據(jù)相關(guān)服務(wù)。雖然云計算數(shù)據(jù)儲存技術(shù)在發(fā)展過程中深受現(xiàn)代信息科學(xué)技術(shù)的影響,且具備一定的先進性,但是仍然需要不斷進行創(chuàng)新及優(yōu)化。特別是在數(shù)據(jù)存儲算法和存儲安全方面需要持續(xù)革新,從而更好地承擔(dān)云計算數(shù)據(jù)存儲的職責(zé),使其更好地服務(wù)社會。
云計算數(shù)據(jù)存儲技術(shù)主要分為3種類型,分別是分布式存儲、集中式存儲和虛擬化存儲。分布式存儲是指通過分布式技術(shù)協(xié)調(diào)組織存儲資源,為非虛擬化的上層應(yīng)用或虛擬機提供工業(yè)標(biāo)準(zhǔn)的接口。集中式存儲是以傳統(tǒng)的磁盤陣列方式進行存儲,其中主機采用映射方式運行。虛擬化存儲則是在硬件資源上添加一層文件系統(tǒng),使其可劃分出虛擬主機使用的虛擬磁盤。當(dāng)前,主流云計算數(shù)據(jù)存儲技術(shù)主要采用虛擬化存儲的方式。
云計算數(shù)據(jù)存儲技術(shù)通過網(wǎng)絡(luò)整合存儲設(shè)備,并采用集成應(yīng)用、分布式文件系統(tǒng)、存儲虛擬化以及底層資源對象化等技術(shù)整合物理存儲設(shè)備資源,使其構(gòu)成能夠?qū)ν馓峁┙y(tǒng)一服務(wù)的邏輯資源池,并對外提供數(shù)據(jù)存儲和業(yè)務(wù)訪問等功能,同時保證數(shù)據(jù)安全。云計算數(shù)據(jù)存儲技術(shù)由多種技術(shù)構(gòu)成,是一門綜合性集成技術(shù)。虛擬化技術(shù)是云計算數(shù)據(jù)存儲技術(shù)的核心技術(shù),能夠?qū)⒏鞣N存儲設(shè)備連接并映射成統(tǒng)一的存儲資源池。除了虛擬化技術(shù),云計算數(shù)據(jù)存儲技術(shù)還采用了如分布式存儲技術(shù)、重復(fù)數(shù)據(jù)刪除技術(shù)、內(nèi)容分發(fā)網(wǎng)絡(luò)技術(shù)、存儲加密技術(shù)以及數(shù)據(jù)備份技術(shù)等其他技術(shù)。其中:分布式存儲技術(shù)主要是整合分散的存儲設(shè)備,構(gòu)成一個虛擬的存儲設(shè)備;重復(fù)數(shù)據(jù)刪除技術(shù)主要是消除重復(fù)的數(shù)據(jù),減少數(shù)據(jù)冗余和存儲空間的占用;內(nèi)容分發(fā)網(wǎng)絡(luò)技術(shù)主要是在現(xiàn)有的網(wǎng)絡(luò)基礎(chǔ)上構(gòu)建一層虛擬網(wǎng)絡(luò),從而實時監(jiān)控網(wǎng)絡(luò)的運行狀況,使數(shù)據(jù)傳輸更加便捷、快速以及穩(wěn)定;存儲加密技術(shù)主要是為數(shù)據(jù)傳輸和數(shù)據(jù)本身安全提供保障;數(shù)據(jù)備份技術(shù)主要是備份并恢復(fù)數(shù)據(jù),若存在操作錯誤、數(shù)據(jù)丟失以及數(shù)據(jù)惡意加密等情況,則可以通過該技術(shù)備份和恢復(fù)數(shù)據(jù)。
云計算數(shù)據(jù)存儲技術(shù)系統(tǒng)是以云計算數(shù)據(jù)存儲技術(shù)為基礎(chǔ)的一種系統(tǒng)管理程序,主要包括數(shù)據(jù)存儲層、基礎(chǔ)管理層、應(yīng)用接口層以及數(shù)據(jù)訪問層。其中:數(shù)據(jù)存儲層是整個云計算數(shù)據(jù)存儲的基本控制器,支持分布式存儲,能夠?qū)崿F(xiàn)存儲設(shè)備的邏輯管理和多鏈路管理;基礎(chǔ)管理層是云存儲中最核心的部分,能夠協(xié)調(diào)各個存儲設(shè)備的工作,使各存儲設(shè)備提供統(tǒng)一的服務(wù);應(yīng)用接口層是提供數(shù)據(jù)連接的接口,可為相關(guān)業(yè)務(wù)數(shù)據(jù)模塊提供需要的數(shù)據(jù);數(shù)據(jù)訪問層主要提供授權(quán)及權(quán)限驗證等通用訪問接入模式。云計算數(shù)據(jù)存儲技術(shù)的系統(tǒng)結(jié)構(gòu)如圖1所示。
圖1 云計算數(shù)據(jù)存儲技術(shù)系統(tǒng)結(jié)構(gòu)
目前,云計算數(shù)據(jù)存儲技術(shù)應(yīng)用廣泛,其中應(yīng)用體量最大的當(dāng)屬谷歌文件系統(tǒng)(Google File System,GFS)數(shù)據(jù)存儲技術(shù)與Hadoop團隊開發(fā)的分布式文件系統(tǒng)(Hadoop Distributed File System,HDFS)數(shù)據(jù)存儲技術(shù)。它們都具有高傳輸率、高吞吐率等特點。
GFS數(shù)據(jù)存儲技術(shù)是一種支持分布式訪問的開源擴展存儲技術(shù)。GFS能夠兼容各種存儲設(shè)備,甚至能夠兼容普通個人計算機(Personal Computer,PC)。雖然硬件價格十分低廉,但是能夠提供相關(guān)的容錯功能。GFS以主從架構(gòu)為基礎(chǔ),由單個主節(jié)點和多個從節(jié)點構(gòu)成。其中:主節(jié)點主要管理所有的元數(shù)據(jù)信息,并負(fù)責(zé)文件分塊、定期給從節(jié)點發(fā)送通信信號等;從節(jié)點主要進行數(shù)據(jù)存儲和處理分析。每個從節(jié)點都有自己的文件系統(tǒng),會存儲主節(jié)點分配的文件塊,并定期給主節(jié)點發(fā)送通信信號等。通過的讀寫都是基于文件塊,文件塊的大小一般為64 MB。通過采用冗余技術(shù),能夠?qū)蝹€文件塊復(fù)制到多個從節(jié)點進行存儲,因此具有高可靠、可擴展、高性能以及易于管理等特點。GFS的工作原理如圖2所示。
圖2 GFS工作原理
與GFS數(shù)據(jù)存儲技術(shù)相比,HDFS數(shù)據(jù)存儲技術(shù)同樣采用分布式存儲,利用類似的技術(shù)架構(gòu)以及文件塊和數(shù)據(jù)冗余等設(shè)計理念。因此,HDFS也具有高可靠、可擴展、高性能以及易于管理等特點。但是,從技術(shù)實現(xiàn)細(xì)節(jié)和應(yīng)用場景偏向角度分析,HDFS數(shù)據(jù)存儲技術(shù)與GFS數(shù)據(jù)存儲技術(shù)又有不同,如文件塊采用的存儲策略、客戶讀寫操作策略、數(shù)據(jù)備份策略等方面。其中,要特別注意客戶讀寫策略的不同。GFS能夠支持多個客戶同時寫入文件,而HDFS只支持單個客戶寫入文件,且GFS能夠支持實時寫入數(shù)據(jù),而HDFS不支持實時寫入,需要等到數(shù)據(jù)量積累到一定程度才進行數(shù)據(jù)持久化操作。在應(yīng)用場景偏向方面,GFS大多用于大規(guī)模數(shù)據(jù)集存儲及處理分析,而HDFS適用于海量數(shù)據(jù)的訪問與存儲,且HDFS能夠輕松集成Hadoop的其他組件。目前,由于GFS已經(jīng)停止了維護更新,HDFS成為大多數(shù)用戶的選擇[2,3]。
云計算數(shù)據(jù)存儲技術(shù)可以利用數(shù)據(jù)加密技術(shù),提高數(shù)據(jù)信息存儲的安全性。通常客戶沒有特別關(guān)注數(shù)據(jù)安全,在利用云計算數(shù)據(jù)存儲技術(shù)獲取相關(guān)信息時,如果沒有對發(fā)送的信息采取保護措施,在獲取信息時就會面臨諸多安全問題,從而對數(shù)據(jù)存儲造成一定威脅。數(shù)據(jù)加密技術(shù)能夠提高數(shù)據(jù)本身的安全,使黑客不能輕易獲取相關(guān)數(shù)據(jù)。即使黑客獲取了相關(guān)信息,應(yīng)用數(shù)據(jù)加密技術(shù)也將使其無法獲取真實的數(shù)據(jù)。同時,利用數(shù)據(jù)加密技術(shù)可以有效提高數(shù)據(jù)存儲及傳輸?shù)陌踩浴_\用特殊算法的數(shù)據(jù)加密技術(shù),能夠使算法與云計算數(shù)據(jù)存儲技術(shù)有效結(jié)合,進一步保證數(shù)據(jù)的信息安全,有利于避開黑客的惡意攻擊或者外界不良因素的影響??梢?,數(shù)據(jù)加密技術(shù)在云計算數(shù)據(jù)存儲技術(shù)中的應(yīng)用具有重要意義,已成為云計算數(shù)據(jù)存儲技術(shù)不可或缺的一環(huán)。數(shù)據(jù)加密技術(shù)模型如圖3所示。
圖3 數(shù)據(jù)加密技術(shù)模型
云計算數(shù)據(jù)存儲技術(shù)能夠通過身份驗證技術(shù)進一步增強云計算數(shù)據(jù)存儲的整體安全性?;谏矸蒡炞C技術(shù)可以識別各種用戶,有效控制各種業(yè)務(wù)功能權(quán)限,并采用多元化的驗證方式,使得整個數(shù)據(jù)存儲業(yè)務(wù)更加安全穩(wěn)定。第一,基于集成電路(Integrated Circuit,IC)卡,允許客戶在智能設(shè)備上填寫真實信息識別用戶身份。第二,可以利用用戶設(shè)定的密碼進行身份驗證,通過輸入賬號和密碼進行驗證,使系統(tǒng)自動判斷用戶身份,從而確保整個系統(tǒng)登錄的安全合法性。第三,可以運用關(guān)鍵績效指標(biāo)(Key Performance Indicator,KPI)驗證用戶的身份,保證云計算數(shù)據(jù)存儲安全的使用。第四,通過認(rèn)證技術(shù)采集個人信息,配備相應(yīng)的密鑰,保障數(shù)據(jù)存儲技術(shù)的應(yīng)用安全性。第五,可以利用第三方協(xié)議保障數(shù)據(jù)存儲的穩(wěn)定安全。因此,身份驗證技術(shù)在云計算數(shù)據(jù)存儲技術(shù)中的應(yīng)用能夠有效保障云計算數(shù)據(jù)存儲相關(guān)業(yè)務(wù)的安全性,有效控制系統(tǒng)功能權(quán)限的分配。
當(dāng)云計算數(shù)據(jù)存儲業(yè)務(wù)處于調(diào)用狀態(tài)時,用戶會遇到信息存儲不穩(wěn)定、系統(tǒng)不穩(wěn)定、效率過低等一系列錯誤代碼信息,此時可以采用云計算數(shù)據(jù)存儲技術(shù)中的數(shù)據(jù)存儲算法糾正并分析錯誤代碼。當(dāng)信息數(shù)據(jù)受到損壞時,若信息數(shù)據(jù)的損壞程度處于控制范圍時,可以利用數(shù)據(jù)存儲算法恢復(fù)數(shù)據(jù),通過改寫編碼恢復(fù)信息數(shù)據(jù)的內(nèi)容。當(dāng)出現(xiàn)錯誤信息時,可以通過數(shù)據(jù)存儲算法定位存儲錯誤信息的位置,確保整個業(yè)務(wù)信息數(shù)據(jù)的安全性與完整性。此外,數(shù)據(jù)的備份存儲可以通過數(shù)據(jù)存儲算法進行調(diào)度。因此,數(shù)據(jù)存儲算法在云計算數(shù)據(jù)存儲技術(shù)中的應(yīng)用是保障存儲數(shù)據(jù)安全完整必不可少的手段,也是云計算數(shù)據(jù)存儲系統(tǒng)穩(wěn)定運行的基石[4]。
隨著時代的不斷進步與技術(shù)的不斷發(fā)展,云計算數(shù)據(jù)存儲技術(shù)將面臨各種機遇與挑戰(zhàn)。從技術(shù)層面分析,隨著物聯(lián)網(wǎng)技術(shù)和人工智能技術(shù)等新型技術(shù)的不斷發(fā)展,云計算數(shù)據(jù)存儲技術(shù)可能會更加關(guān)注智能設(shè)備及智能場景中的數(shù)據(jù)。云計算數(shù)據(jù)存儲技術(shù)將來可能會與物聯(lián)網(wǎng)和人工智能等技術(shù)結(jié)合,促使云計算數(shù)據(jù)存儲技術(shù)對數(shù)據(jù)的存儲與處理分析更加自動化和智能化。從市場層面分析,未來各行各業(yè)的核心競爭力就是海量數(shù)據(jù)產(chǎn)生的效益。各領(lǐng)域?qū)π畔?shù)據(jù)的存儲要求與日俱增,將有更多企業(yè)用戶使用云計算數(shù)據(jù)存儲系統(tǒng)。因此,推動云計算數(shù)據(jù)存儲技術(shù)的創(chuàng)新優(yōu)化,提升服務(wù)質(zhì)量與提高用戶體驗,成為各企業(yè)用戶的重點任務(wù)。從用戶需求層面分析,企業(yè)用戶與個人用戶的數(shù)據(jù)隱私性要求日益增長,使得安全、可控、具備差異性的云計算數(shù)據(jù)存儲系統(tǒng)愈發(fā)重要。因此,云計算數(shù)據(jù)存儲技術(shù)作為云存儲的核心技術(shù),需要通過不斷創(chuàng)新優(yōu)化,為用戶提供多樣化的數(shù)據(jù)管理服務(wù)[5]。
當(dāng)前,云計算數(shù)據(jù)存儲技術(shù)已經(jīng)在各行各業(yè)中得到了廣泛應(yīng)用,如金融、教育、醫(yī)療、文化娛樂、電商以及供應(yīng)鏈等領(lǐng)域,已經(jīng)成為云計算發(fā)展史中的重要組成部分。雖然我國能夠靈活地應(yīng)用相關(guān)云計算數(shù)據(jù)存儲系統(tǒng),但是我國的云計算數(shù)據(jù)存儲技術(shù)仍然處于發(fā)展探索階段。只有在全面分析云計算數(shù)據(jù)存儲技術(shù)的基礎(chǔ)上,通過不斷創(chuàng)新優(yōu)化,才能夠從根本上推動云計算數(shù)據(jù)存儲技術(shù)的發(fā)展與變革。