王凱
(北京清控人居光電研究院有限公司)
隨著物聯(lián)網(wǎng)、5G網(wǎng)絡(luò)、智慧城市等新興技術(shù)的發(fā)展,數(shù)據(jù)中心做為大數(shù)據(jù)和云計(jì)算的核心載體,其“城市大腦”的重要性也日益提高。其中,UPS(Uninterruptible Power System)配電系統(tǒng)作為數(shù)據(jù)中心的重要組成系統(tǒng),其配置類型和供電模式的可用性、適應(yīng)性、擴(kuò)展性、可維護(hù)性及建設(shè)成本,受到越來(lái)越多設(shè)計(jì)師和運(yùn)維人員的關(guān)注。
根據(jù)《工業(yè)與民用供配電設(shè)計(jì)手冊(cè)》第四版第2.6節(jié),UPS的配置類型大致分為單臺(tái)、并聯(lián)和冗余等三個(gè)大類[1];按照供電方式又可細(xì)分為后備式(離線式)、互動(dòng)式、雙變換(在線式)、串聯(lián)冗余、備用冗余和并聯(lián)冗余等類型。
對(duì)于后來(lái)衍生出來(lái)的雙總線供電模式,可保證每一套電源的獨(dú)立性,這種UPS配置也被稱為2N或2(N+1)模式。
在工業(yè)產(chǎn)品領(lǐng)域的“可靠”與“可信”,并不是人們通常認(rèn)為的可以依靠、真實(shí)可信,而是有一套完整的定義和度量方法。
GB/T 2900.99-2016《電工術(shù)語(yǔ) 可信性》中規(guī)定,可靠性(Reliability)是在給定的條件和給定的時(shí)間區(qū)間,能無(wú)失效地執(zhí)行要求的能力;可用性(Availability)是處于按要求執(zhí)行狀態(tài)的能力。
下面引入幾個(gè)常用的度量指標(biāo)和公式:平均故障間隔時(shí)間(MTBF)、平均故障修復(fù)時(shí)間(MTTR)、可用性(A)、可靠性(R)、失效率(λ)。
關(guān)于式(1)的可用性公式,很容易理解,通常大家習(xí)慣用N個(gè)9來(lái)表征系統(tǒng)的可用性,比如99.9%、99.99%等。假設(shè)一個(gè)系統(tǒng)的宕機(jī)時(shí)間(Downtime)等于MTTR,其余時(shí)間均為正常運(yùn)行(Uptime),系統(tǒng)可用性想要達(dá)到5個(gè)9,需要宕機(jī)時(shí)間不大于5min/a;可用性想要達(dá)到6個(gè)9,需要宕機(jī)時(shí)間不大于31s/a[2]。
其實(shí)一般情況下,數(shù)據(jù)中心的系統(tǒng)可用性指標(biāo)不需要設(shè)置的過(guò)高,依照相應(yīng)的規(guī)范要求設(shè)計(jì)即可;比如城市照明控制系統(tǒng)的可用性,依據(jù)CJJ/T 227-2014《城市照明自動(dòng)控制系統(tǒng)技術(shù)規(guī)程》第4.2.11條,“中心級(jí)系統(tǒng)故障恢復(fù)時(shí)間應(yīng)小于2h,平均故障間隔時(shí)間(MTBF)應(yīng)大于 30000h”,按式(1)計(jì)算,其可用性約為99.9933%。
上節(jié)描述的是一個(gè)組件的可用性計(jì)算,當(dāng)系統(tǒng)中具有多個(gè)組件時(shí),根據(jù)現(xiàn)代控制理論和概率學(xué)公式,串聯(lián)與并聯(lián)的可用性如下[3]:
串聯(lián)冗余的可用性
比如有兩個(gè)一模一樣的產(chǎn)品組件構(gòu)造的系統(tǒng),每個(gè)組件的可用性均為0.9,則根據(jù)式(4)、式(5)可以得出,并聯(lián)時(shí)的可用性為0.99,串聯(lián)時(shí)的可用性為0.81;所以串聯(lián)冗余系統(tǒng)的可用性較低,已經(jīng)很少使用了。
根據(jù)2.1節(jié)給出的定義,可靠性是指從系統(tǒng)開(kāi)始運(yùn)行到某個(gè)時(shí)刻,這個(gè)時(shí)間段內(nèi)正常運(yùn)行的概率;可用性是指系統(tǒng)在執(zhí)行任務(wù)的任意時(shí)刻能正常工作的概率。比如A系統(tǒng)每年因故障中斷十次,每次恢復(fù)平均要20min;B系統(tǒng)每年因故障中斷2次,每次需5h恢復(fù)。
根據(jù)式(1)、式(2)計(jì)算,A系統(tǒng)的可用性為0.999618,可靠性為0.740818;B系統(tǒng)的可用性為0.998858,可靠性為0.904837。
可以看出,雖然A系統(tǒng)的可用性比B系統(tǒng)高,且A系統(tǒng)的總故障修復(fù)時(shí)間較少,但其可靠性比B系統(tǒng)要差很多。
圖1 UPS單路供電系統(tǒng)組件
通過(guò)上節(jié)的計(jì)算,可以看出并聯(lián)系統(tǒng)的可用性較高,依據(jù)GB 50174-2017中對(duì)于“冗余”和“容錯(cuò)”的定義,兩者都是重復(fù)配置,但冗余是針對(duì)系統(tǒng)中的組件、單元、模塊或路徑,而容錯(cuò)是針對(duì)整個(gè)系統(tǒng)的。簡(jiǎn)而言之,兩個(gè)以上的重復(fù)單元可稱為冗余,但兩個(gè)以上的重復(fù)系統(tǒng)才可稱為容錯(cuò);所以,N模式為基本需求,N+1或N+X模式為冗余需求,2N或2(N+1)模式為容錯(cuò)需求。
數(shù)據(jù)中心的供電可靠性,不僅要考慮UPS的冗余,其后端的隔離變壓器、UPS配電柜、機(jī)架負(fù)載電源、轉(zhuǎn)換開(kāi)關(guān)等,也應(yīng)納入分析計(jì)算。
以圖1這個(gè)滿足基本需求的簡(jiǎn)化模型為例,整個(gè)供電系統(tǒng)由4個(gè)組件組成:①UPS;②隔離變壓器;③配電柜;④負(fù)載電源。當(dāng)采用冗余配置時(shí),根據(jù)⑤轉(zhuǎn)換開(kāi)關(guān)的位置,可以把常用的冗余系統(tǒng)分為:僅有UPS冗余、變壓器冗余、配電柜冗余以及完全冗余(即容錯(cuò))等四種模型。
為量化分析不同的UPS冗余模型,以及冗余組件的多少對(duì)于系統(tǒng)供電可用性的影響,以上節(jié)中的5種模型為例,分別進(jìn)行可用性計(jì)算。
為簡(jiǎn)化計(jì)算,冗余模型中采用的幾個(gè)組件,其基礎(chǔ)數(shù)據(jù)MTBF和MTTR如表1:
通過(guò)對(duì)上節(jié)模型的分析,根據(jù)式(4)、式(5)代入表1的數(shù)據(jù),可以計(jì)算得出下表:
可以看出,隨著UPS系統(tǒng)的冗余組件逐漸增加,系統(tǒng)整體可用性也逐漸提高;在使用機(jī)架式ATS的模型中,可用性已達(dá)到6.3個(gè)“9”;在完全冗余配置的模型中,可用性可以達(dá)到7.7個(gè)“9”。
冗余組件的增加,意味著單點(diǎn)故障的減少,同時(shí)系統(tǒng)的可維護(hù)性也隨之提高;年宕機(jī)時(shí)間也從1.2h,最多可減少到0.72s。
提升UPS的系統(tǒng)可用性,不僅是意味著成本的增加,也意味著需要更多的設(shè)備安裝面積和線路敷設(shè)路由;所以在機(jī)房建設(shè)之前,應(yīng)充分了解業(yè)主需求,并根據(jù)使用功能、投資規(guī)模以及建設(shè)周期等,進(jìn)行準(zhǔn)確定級(jí),以確定選擇一個(gè)經(jīng)濟(jì)、合理的解決方案。
數(shù)據(jù)中心的基礎(chǔ)建設(shè),可以分為供電、制冷、消防、監(jiān)控、防雷、接地、布線、裝修等多個(gè)子系統(tǒng),其中任何一個(gè)子系統(tǒng)的分級(jí),都應(yīng)以數(shù)據(jù)中心的整體等級(jí)需求為準(zhǔn)。
表1 組件的基礎(chǔ)數(shù)據(jù)
表2 UPS冗余模型的可用性分析
目前國(guó)內(nèi)外主流的數(shù)據(jù)中心設(shè)計(jì)標(biāo)準(zhǔn)和認(rèn)證體系,主要有國(guó)家標(biāo)準(zhǔn)GB50174-2017《數(shù)據(jù)中心設(shè)計(jì)規(guī)范》、國(guó)家認(rèn)證標(biāo)準(zhǔn)CQC 9218-2015《數(shù)據(jù)中心場(chǎng)地基礎(chǔ)設(shè)施評(píng)價(jià)技術(shù)規(guī)范》、北美標(biāo)準(zhǔn)ANSI/TIA-942B-2017 《數(shù)據(jù)中心電信基礎(chǔ)設(shè)施標(biāo)準(zhǔn)》、Uptime Institute認(rèn)證《Tier Standard for Data Center Design,Construction and Operational Sustainability》。
GB 50174-2017將數(shù)據(jù)中心分為A、B、C三級(jí),分別為容錯(cuò)系統(tǒng)配置、冗余要求配置和基本需求配置。TIA和Uptime Institute,他們都將數(shù)據(jù)中心劃分為4個(gè)等級(jí),兩者對(duì)4個(gè)等級(jí)的定義是一樣的:基本需求、冗余組件、在線維護(hù)和容錯(cuò)[5]。
國(guó)標(biāo)中的C、B、A級(jí)可分別對(duì)應(yīng)Tier I、Tier II、Tier III和 Tier IV。 當(dāng) 然,兩種標(biāo)準(zhǔn)的對(duì)比僅是一個(gè)粗略的、簡(jiǎn)化的對(duì)應(yīng)關(guān)系,在實(shí)際建設(shè)和認(rèn)證中,兩者并沒(méi)有對(duì)等性。Uptime認(rèn)證的Tier分級(jí)標(biāo)準(zhǔn),與國(guó)標(biāo)GB 50174相比,更多的是針對(duì)實(shí)施結(jié)果的考核,而不是基于建設(shè)標(biāo)準(zhǔn)的考核,雖然在全球已經(jīng)得到了很多用戶的認(rèn)可,但是在國(guó)內(nèi)通過(guò)設(shè)計(jì)、建造和運(yùn)維認(rèn)證的項(xiàng)目還比較少,有待進(jìn)一步推廣。
數(shù)據(jù)中心機(jī)房的UPS供電系統(tǒng)配置模式,是項(xiàng)目設(shè)計(jì)和建設(shè)過(guò)程中的一個(gè)重要環(huán)節(jié),供電系統(tǒng)的可用性將直接影響數(shù)據(jù)中心的安全運(yùn)行。本文列舉了幾種不同的UPS配置類型及冗余模式,并分析計(jì)算了每種供電模式的可用性,可以為數(shù)據(jù)中心設(shè)計(jì)及運(yùn)維人員在可用性評(píng)估過(guò)程中提供參考。