朱 祺,朱偉暐
(中國電力工程顧問集團華東電力設(shè)計院有限公司,上海 200001)
隨著近年來“互聯(lián)網(wǎng)+”的不斷推進和數(shù)字經(jīng)濟的不斷發(fā)展,各類企業(yè)都在積極推進自身信息系統(tǒng)建設(shè)并在此過程中廣泛應(yīng)用云計算和大數(shù)據(jù)技術(shù)以確保建成的系統(tǒng)符合主流信息技術(shù)水平并為后續(xù)的擴建和改造留有充足的空間和接口。能源企業(yè)的信息、業(yè)務(wù)和數(shù)據(jù)與以面向商業(yè)服務(wù)為主的互聯(lián)網(wǎng)公司相比具有明顯的差異,如業(yè)務(wù)較為集中、服務(wù)要求有更高的可靠性、數(shù)據(jù)有更高的保密性要求等。因此在進行信息系統(tǒng)架構(gòu)設(shè)計時無法完全參照大型互聯(lián)網(wǎng)公司所采用的主流系統(tǒng)架構(gòu)方式,需要在主流架構(gòu)的基礎(chǔ)上根據(jù)自身的業(yè)務(wù)特點和期望實現(xiàn)的目標進行取舍或改造。信息系統(tǒng)架構(gòu)經(jīng)歷了數(shù)次比較大的模式、理念和技術(shù)升級,從而進步到了目前能夠成功應(yīng)對大規(guī)模流量的分布式服務(wù)化系統(tǒng)架構(gòu),因此各類大型企業(yè)目前在信息系統(tǒng)建設(shè)架構(gòu)方案設(shè)計時自然而然地會優(yōu)先考慮采用分布式服務(wù)化框架。能源企業(yè)往往體量大但是業(yè)務(wù)卻相對集中,因此在信息系統(tǒng)總體架構(gòu)設(shè)計過程中對于分布式服務(wù)化框架在能源數(shù)據(jù)中心信息系統(tǒng)的適用性方面進行研究具有實際意義。
隨著數(shù)據(jù)時代的到來,數(shù)據(jù)的井噴使信息系統(tǒng)的總體架構(gòu)經(jīng)歷了單機架構(gòu)、集群架構(gòu)、分布式架構(gòu)、分布式多活數(shù)據(jù)中心架構(gòu)四個階段[2]。伴隨著總體架構(gòu)一同演變和升級的還有各種中間件、存儲系統(tǒng)和外圍系統(tǒng),比如對關(guān)系型數(shù)據(jù)庫進一步進行分庫分表改造、流量和數(shù)據(jù)的處理從本地緩存過渡到分布式緩存等。信息系統(tǒng)從上線初期開始就是在不停的迭代升級過程中通過自身架構(gòu)的發(fā)展和演變滿足其自身業(yè)務(wù)的發(fā)展,因此業(yè)務(wù)需求是信息系統(tǒng)總體架構(gòu)設(shè)計的核心[1]。在業(yè)務(wù)需求相對簡單的早期,如圖1所示的單機架構(gòu)即可滿足要求。
圖1 典型單機架構(gòu)方案[2]
隨著企業(yè)各類業(yè)務(wù)的發(fā)展和并發(fā)流量的增加,單機系統(tǒng)架構(gòu)因為單體應(yīng)用過為龐大而造成信息系統(tǒng)在開發(fā)的效率、部署的靈活性和運維的效率方面產(chǎn)生了諸多問題,通過調(diào)整和優(yōu)化架構(gòu)設(shè)計模式來解決這些問題的核心是提升業(yè)務(wù)系統(tǒng)并行處理能力的同時降低單機系統(tǒng)負載,確保增量業(yè)務(wù)的部署和存量業(yè)務(wù)的升級。因此,信息系統(tǒng)的總體架構(gòu)發(fā)展為通過將多臺獨立的服務(wù)器通過網(wǎng)絡(luò)相互連接從而形成一個有效的整體對外提供服務(wù)的分布式集群架構(gòu)如圖2所示。
圖2 典型分布式集群架構(gòu)方案[2]
云計算和虛擬化技術(shù)是支撐分布式集群架構(gòu)落地實施的基礎(chǔ),這樣當(dāng)單臺服務(wù)器的處理能力接近或已超出其容量上限時不用更換性能更高的服務(wù)器,而是采用云計算來通過增加新的虛擬服務(wù)器來分散并發(fā)訪問流量,只要上層業(yè)務(wù)系統(tǒng)的設(shè)計能夠支持虛擬服務(wù)器的橫向彈性伸縮,那么從理論上來說就能在服務(wù)器集群總的計算力范圍內(nèi)實現(xiàn)可伸縮性和高可用性。雖然虛擬化的過程中因為對虛擬服務(wù)器進行調(diào)度和控制的控制節(jié)點會分走一部分計算力而造成性能損耗,但是使用集群架構(gòu)的目標收益仍然遠高于所付出的損耗代價。
隨著企業(yè)體量的逐漸龐大,業(yè)務(wù)需求隨之變得復(fù)雜,通過以業(yè)務(wù)功能為維度拆分出多個子系統(tǒng)以能夠更清晰地規(guī)劃和體現(xiàn)出每個子系統(tǒng)的職責(zé)、降低業(yè)務(wù)耦合以及提升容錯性為目標使信息系統(tǒng)架構(gòu)在分布式集群架構(gòu)的基礎(chǔ)上衍生出了服務(wù)化架構(gòu)。以往在各種不同類型的業(yè)務(wù)需求下系統(tǒng)中往往會存在數(shù)個會被頻繁調(diào)用并且完全可以共享的業(yè)務(wù),而且業(yè)務(wù)系統(tǒng)中諸如數(shù)據(jù)庫連接限制之類的底層資源必然會限制業(yè)務(wù)系統(tǒng)所允許橫向擴展的節(jié)點數(shù)量。服務(wù)化架構(gòu)通過將原本耦合在單一節(jié)點中的共享業(yè)務(wù)邏輯進一步剝離,使各類共享業(yè)務(wù)的邏輯處理由獨立部署的節(jié)點負責(zé),從而使其他以單一服務(wù)為主的業(yè)務(wù)應(yīng)用無須再處理共享業(yè)務(wù)邏輯,因此整個系統(tǒng)的計算資源利用率會得到提升,如圖3所示。
圖3 典型分布式服務(wù)化架構(gòu)方案[2]
之后提出的微服務(wù)架構(gòu)理念從本質(zhì)上來說和服務(wù)化是一個概念,因為從系統(tǒng)全局上進行分析,微服務(wù)無非就是更進一步細化服務(wù)拆分過程中的粒度,當(dāng)粒度越細時業(yè)務(wù)的耦合就越小,整個系統(tǒng)的容錯性就越好,并且在云平臺上進行彈性擴展也會越容易。但是,粒度過細不僅會增加維護成本,影響排查問題時的效率,還會讓后續(xù)業(yè)務(wù)開發(fā)人員很難梳理清楚諸多服務(wù)之間的依賴關(guān)系,這也是采用服務(wù)化架構(gòu)特別是微服務(wù)架構(gòu)中需要避免的問題。
面向服務(wù)的設(shè)計理念結(jié)合了集群架構(gòu)分布式的特點最終使分布式服務(wù)化架構(gòu)呈現(xiàn)以下幾個特點:
1)信息系統(tǒng)成為了一個以各類應(yīng)用服務(wù)來滿足業(yè)務(wù)需求的生態(tài);
2)各類應(yīng)用中的業(yè)務(wù)邏輯不存在緊密耦合關(guān)系;
3)存在會被各類其他業(yè)務(wù)頻繁調(diào)用且業(yè)務(wù)邏輯相對獨立的共享業(yè)務(wù);
4)能夠很好的利用云平臺彈性伸縮的特點對業(yè)務(wù)所需計算力進行合理分配和部署調(diào)整;
5)業(yè)務(wù)的細粒度結(jié)合云平臺的彈性特征使整個系統(tǒng)的容錯性較好,不會因為單一節(jié)點故障影響整個業(yè)務(wù)模塊從而無法提供服務(wù);
6)信息系統(tǒng)規(guī)模一般較大,不然既無法發(fā)揮業(yè)務(wù)細粒度的優(yōu)勢也無法發(fā)揮云計算的彈性優(yōu)勢。
信息系統(tǒng)總體架構(gòu)模式演變和升級至分布式服務(wù)化架構(gòu)的驅(qū)動力是業(yè)務(wù)在不斷的發(fā)展過程中帶來的需求,而各類業(yè)務(wù)之間交互的本質(zhì)就是一個數(shù)據(jù)和信息的交互過程。隨著信息基礎(chǔ)設(shè)施技術(shù)的發(fā)展,海量數(shù)據(jù)的接入成為可能,而如何最大化地發(fā)揮出信息基礎(chǔ)設(shè)施的性能以確保能從這些數(shù)據(jù)中提煉出更多有價值的信息使整個信息系統(tǒng)的架構(gòu)設(shè)計模式必須隨之改變,更多的信息和數(shù)據(jù)又為各類業(yè)務(wù)的發(fā)展提供了資源支撐[3]。因此,數(shù)據(jù)時代下信息系統(tǒng)架構(gòu)的適用性分析過程中可以以承載業(yè)務(wù)所需要的數(shù)據(jù)能否被有效接入和高效處理作為判斷標準。
樣品取自于涉縣東南部嶺底村附近,寒武系張夏組上部。該巨鮞灰?guī)r最大厚度約2m,EW向延伸數(shù)千米。上覆泥質(zhì)條帶灰?guī)r,下伏灰色中厚層鮞狀灰?guī)r。該組地層的形成起因于中朝準地臺在寒武紀的第一次沉降,形成了大規(guī)模海侵,在張夏階形成廣泛的潮間瀉湖相、局限海和水下淺海相沉積[7]。
本文參考大數(shù)據(jù)的4V特征來進行大規(guī)模分布式服務(wù)化架構(gòu)在能源數(shù)據(jù)中心信息系統(tǒng)的適用性分析,即:規(guī)模性(Volume)、高速性(Velocity)、 多 樣 性 (Variety)、 價 值 性 (Value),4個特征的具體表現(xiàn)見表1所列。
表1 大數(shù)據(jù)的4V特征及表現(xiàn)
能源數(shù)據(jù)的與大數(shù)據(jù)4V特征的匹配結(jié)果如表2所示。
表2 能源數(shù)據(jù)與大數(shù)據(jù)4V特征匹配結(jié)果
從滿足規(guī)模性角度進行分析,根據(jù)不同信息系統(tǒng)總體架構(gòu)模式的特點,分布式集群架構(gòu)和分布式服務(wù)化架構(gòu)都能夠滿足能源數(shù)據(jù)的龐大規(guī)模,由于面向服務(wù)的主要理念是滿足業(yè)務(wù)需求的發(fā)展,因此如果信息系統(tǒng)的業(yè)務(wù)較為集中但是單一業(yè)務(wù)的數(shù)據(jù)量龐大,分布式集群架構(gòu)即可滿足要求而非必須采用分布式服務(wù)化架構(gòu)。
從多樣性角度進行分析,能源企業(yè)各類對內(nèi)業(yè)務(wù)和對外業(yè)務(wù)都較為復(fù)雜并且數(shù)據(jù)之間的關(guān)聯(lián)性極強,因此能源數(shù)據(jù)中心的信息系統(tǒng)必然能夠拆分出一些共享業(yè)務(wù),在這個基礎(chǔ)上采用分布式服務(wù)化架構(gòu)完全能夠適應(yīng)復(fù)雜業(yè)務(wù)生態(tài)之間的相互調(diào)用并且為未來新業(yè)務(wù)的部署創(chuàng)造一個具有充分可拓展空間的平臺,明顯優(yōu)于分布式集群架構(gòu)。
從高速性角度進行分析,能源行業(yè)的部分業(yè)務(wù)對于計算的實時性要求極高,其中一些甚至要求系統(tǒng)的時延在數(shù)毫秒內(nèi),在大規(guī)模數(shù)據(jù)接入的同時要做到如此強的實時性只能采用分布式架構(gòu),但是和是否采用服務(wù)化架構(gòu)卻沒有必然關(guān)系,核心的問題在于如何通過整體架構(gòu)的設(shè)計優(yōu)化和采用合適的流計算引擎來最大地發(fā)揮云平臺的彈性計算能力。
從價值性角度進行分析,能源數(shù)據(jù)的價值性非常高,甚至對于行業(yè)外的領(lǐng)域仍然具有很大的影響力,較高的價值代表在對外業(yè)務(wù)的發(fā)展上具有很大的拓展空間,因此信息系統(tǒng)在進行設(shè)計時有必要考慮目前所建設(shè)的平臺對于未來業(yè)務(wù)的拓展是否具有良好的承載力,分布式服務(wù)化架構(gòu)即是在業(yè)務(wù)快速發(fā)展的前提下誕生,能夠承載對外業(yè)務(wù)的快速拓展是其原生使命。
表3 能源數(shù)據(jù)中心信息系統(tǒng)對架構(gòu)的需求
因此,從系統(tǒng)需要處理的數(shù)據(jù)量角度,能源數(shù)據(jù)中心信息系統(tǒng)建設(shè)過程中采用分布式架構(gòu)(包括分布式集群和分布式服務(wù)化)是非常有必要的。在此基礎(chǔ)上進一步采用分布式服務(wù)化架構(gòu)并不是必須的選項,但是隨著能源數(shù)據(jù)的高價值被不斷挖掘,各類業(yè)務(wù)的增多使分布式服務(wù)化架構(gòu)對未來業(yè)務(wù)的拓展需求有更好的適應(yīng)性。
本文通過對信息系統(tǒng)總體架構(gòu)模式的升級路徑、大規(guī)模分布式服務(wù)化架構(gòu)的核心組件的組成和功能進行梳理和研究,在此基礎(chǔ)上根據(jù)能源數(shù)據(jù)的特點對大規(guī)模分布式服務(wù)化架構(gòu)在能源數(shù)據(jù)中心信息系統(tǒng)的適用性進行研究,得出結(jié)論如下:
1)大規(guī)模分布式服務(wù)化架構(gòu)的最大特點是能夠應(yīng)對海量數(shù)據(jù)的接入和處理,核心是能夠滿足業(yè)務(wù)快速拓展的需求。
2)大規(guī)模分布式服務(wù)化架構(gòu)是一個由服務(wù)注冊與發(fā)現(xiàn)、負載均衡和反向代理服務(wù)器、服務(wù)網(wǎng)關(guān)、配置中心和鏈路追蹤等核心組件及其他功能組件所組成的分布式框架。
3)以大數(shù)據(jù)4V特征進行分析,分布式架構(gòu)完全適用于能源數(shù)據(jù)中心信息系統(tǒng)。
4)在分布式架構(gòu)基礎(chǔ)上進一步采用分布式服務(wù)化架構(gòu)有利于能源企業(yè)為因能源數(shù)據(jù)的高價值而預(yù)期可能產(chǎn)生的業(yè)務(wù)快速拓展提前在信息系統(tǒng)層面做好準備,但也并非是當(dāng)前必須的選項。