吳美希 楊曉彤
(中國信息通信研究院云計算與大數(shù)據(jù)研究所,北京 100191)
數(shù)字經(jīng)濟時代,萬物萬聯(lián)產(chǎn)生各種各樣的大數(shù)據(jù),在數(shù)據(jù)已成為勞動、資本、土地和技術之外的第5個生產(chǎn)要素的背景之下,數(shù)字經(jīng)濟的騰飛離不開算力的支持,算力就是數(shù)字經(jīng)濟時代的生產(chǎn)力。
2020年3月4日,中共中央政治局常務委員會召開會議,首次將數(shù)據(jù)中心納入“新基建”范疇。2020年4月20日,國家發(fā)展和改革委員會明確新型基礎設施的范圍,數(shù)據(jù)中心作為算力基礎設施,成為信息基礎設施的重要組成部分。隨后,在2020—2021年,國家部委相繼出臺《關于加快構建全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系的指導意見》《全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系算力樞紐實施方案》《新型數(shù)據(jù)中心發(fā)展三年行動計劃(2021—2023年)》等政策文件,對數(shù)據(jù)中心對于算力的支撐的地位和作用進行了進一步明確。數(shù)字經(jīng)濟發(fā)展離不開算力,算力發(fā)展離不開數(shù)據(jù)中心。
對于算力如何度量和表示,業(yè)界一直在不斷地探索。從狹義上講,算力是服務器通過對數(shù)據(jù)進行處理后實現(xiàn)結果輸出的一種能力,目前為止使用最廣泛的算力表示方法為 “浮點運算次數(shù)”。每秒浮點運算次數(shù)(Floating-Point Operations Per Second,F(xiàn)LOPS)概念最早由Frank H. McMahon[1]在其報告中提出。國內(nèi)外不少文獻以及服務器產(chǎn)品參數(shù)都采用浮點運算次數(shù)對算力進行描述。例如,Yifan Sun[2]等使用FLOPS作為度量標準,評估CPU和GPU的單精度和雙精度計算能力。從廣義上講,算力是一個包含計算、存儲、傳輸(網(wǎng)絡)等多個內(nèi)涵的綜合概念,是衡量數(shù)據(jù)中心計算能力的一個綜合指標[3],所以目前亟需一個科學的方法來將算力的內(nèi)涵充分表達出來。
多屬性群決策[4-7](Multi-Attribute Group Decision Making,MAGDM)是多屬性決策(Multi-Attribute Decision Making,MADM)和群體決策(Group Decision Making,GDM)交叉的研究方向,是現(xiàn)代決策科學的一個重要研究領域,其理論和方法已廣泛應用于城市規(guī)劃、經(jīng)濟管理、投資風險等領域。當下,對于不同數(shù)據(jù)中心間算力綜合各類指標的評估問題可以歸結為多屬性群決策問題。為了綜合評價算力,本文提出“算力五力模型”,將與數(shù)據(jù)中心計算能力高度相關的通用算力、智能算力、算效能力、存儲能力、網(wǎng)絡能力等不同量綱的指標進行融合比對,利用新的雙向投影法[8]及TOPSIS方法[9-11]計算得到樣本的相對貼近度,進而對不同樣本的算力進行定級,解決了不同量綱變量難以直接比較的困難,提高了評估結果的綜合性和有效性。本文為算力評估體系提供新的模型和方法,更好地指導和建議業(yè)界判斷行業(yè)發(fā)展趨勢,為未來算力規(guī)劃和部署提供思路。
設多屬性決策中,方案集為A={a1,a2,…,as},屬性集為C={c1,c2,…,cm}。記S={1,2,…,s},M={1,2,…,m},用cl(A),l∈M表示方案A在cl屬性下的值,并允許出現(xiàn)不可比較的情況。
定義 1[12]:如果關系{?,,≈,?}滿足下述條件:在多屬性決策問題中,每個屬性下方案間的序數(shù)偏好信息可以由決策者給出,對于屬性cl,l∈M任意兩個方案ai和aj(i≠j)滿足下列偏好關系之一。
方案ai優(yōu)于方案aj(ai?aj);方案ai與方案aj優(yōu)劣相當(ai≈aj)。
方案ai劣于方案aj(aiaj);方案ai與方案aj優(yōu)劣關系不明(ai?aj)。
兩方案ai和aj(滿足i≠j)之間有且僅有{?,,≈,?}中的一個關系成立,則稱{?,,≈,?}構成了一個偏序偏好結構。
R={rt|t=-(n-1),-(n-2),…,-1,0,1,…,n-2,n-1}
(1)
等級比較集滿足以下特征。
(1) 集合R是有序的:若α>β,則rα>rβ。
(2) 存在一個否定算子:neg(rα)=r-α。
(3) 若rα>rβ,則max{rα,rβ}=rα,min{rα,rβ}=rβ。
對于任意的比較等級rα,rβ∈R,存在3種基本算子:rα?rβ=rα+β、rα?rβ=rα-β和λrα=rλα。
下面介紹廣義優(yōu)序數(shù)的概念。
定義3[13]:令
(2)
其中i,j∈S,l∈M。稱aijl為屬性cl下方案Ai相對于方案Aj的廣義優(yōu)序數(shù)。
為了決策結果更加真實、可靠,在此結合向量的概念,通過向量的轉化與相關計算,應用雙向投影法和TOPSIS方法,通過相對貼近度的大小比較得到相關結論。
(3)
令A={a1,a2,…,am}為方案集,C={c1,c2,…,cn}為屬性集,將屬性cl(1≤l≤n)劃分為5個等級,有等級比較集R={ri|i=-4,…,0,…,4,?},其中?表示兩方案優(yōu)劣關系不明的情況,t=4。已知兩個等級變量分別為Xp=[r2,r3],Xq=[r3,r4]。
多屬性群決策問題是決策理論的一個重要分支,在許多領域得到了廣泛的應用。投影法[14]是一種非常適合處理決策問題的方法,因為它不僅可以考慮被評價物體之間的距離,還可以考慮被評價物體之間的夾角。但在某些情況下,如現(xiàn)實問題中備選方案在正、負理想方案垂直平分線上的情況,傳統(tǒng)的投影法將面臨失效的問題。雙向投影法[15]可以避免傳統(tǒng)投影法無法處理的問題,并具有科學合理、簡單易行和區(qū)分度高等特點,在實際決策中得到廣泛推廣。本節(jié)結合雙向投影法與TOPSIS[16]方法,給出雙向投影模型。
對應向量的??梢杂梢韵鹿接嬎愕玫?。
(4)
(5)
(6)
然后,余弦值cos(X-Xi,X-X+),cos(X-Xi,X-X+)可以分別計算為
cos(X-Xi,X-X+)
(7)
cos(X-Xi,X-X+)
(8)
進而向量X-Xi到向量X-X+,向量X-X+到向量XiX+的投影值分別為
prjX-X+(X-Xi)=|X-Xi|·cos(X-Xi,X-X+)
(9)
prjXiX+(X-X+)=|X-X+|·cos(XiX+,X-X+)
(10)
注1:如圖1所示,prjX-X+(X-Xi)的值越大,說明備選方案Xi越接近正理想方案X+;反之相反。同理,prjXiX+(X-X+)越大,說明備選方案Xi越接近負理想方案X-,反之相反。據(jù)此可以對每個備選方案,通過各自投影值的計算進行相對應的優(yōu)劣判斷。
圖1 prjXiX+(X-X+)和prjX-X+(X-Xi)的圖形表示
投影公式通過計算,描述了備選方案與正、負理想方案之間的相似性,同時考慮了備選方案與正、負理想方案的距離(數(shù)值)和方向。為了使結果更加準確合理,需要將備選方案Xi與正、負理性方案X+、X-的投影相結合,用相對貼近度C(Xi)進行表示,通過公式(11)分別進行計算。
(11)
其中,prjX-X+(X-Xi)、prjXiX+(X-X+)分別表示向量X-Xi到向量X-X+,向量X-X+到向量XiX+的投影值。
基于以上方法,等級雙向投影模型的具體步驟如下。
步驟1.2.1:構造具有等級變量的決策矩陣D,并對其進行規(guī)范化處理;
步驟1.2.2:通過以上廣義優(yōu)序數(shù)運算將等級變量進行相關轉換;
步驟1.2.4:分別計算正負理想方案形成的向量X-X+和Xi與正負理想方案形成的向量X-Xi,XiX+;
步驟1.2.5:根據(jù)(9)式和(10)式,分別計算向量X-Xi到向量X-X+和向量X-X+到向量XiX+的投影值prjX-X+(X-Xi),prjXiX+(X-X+);
步驟1.2.6:由(11)式計算方案Xi與理想方案的相對貼近度;
步驟1.2.7:將相對貼近度進行大小排序(由大到小),選取貼近度最大的方案為最優(yōu)方案。
算力是數(shù)據(jù)中心的服務器通過對數(shù)據(jù)進行處理后實現(xiàn)結果輸出的一種能力,是衡量數(shù)據(jù)中心計算能力的一個綜合指標,數(shù)值越大代表綜合計算能力越強[17]。在服務器主板上,數(shù)據(jù)傳輸?shù)捻樞蛞来螢橹醒胩幚砥鱗18](Central Processing Unit,CPU)、內(nèi)存、硬盤和網(wǎng)卡,若針對圖形則需要圖形處理器[19](Graphics Processing Unit,GPU)。所以,從廣義上講,數(shù)據(jù)中心算力是一個包含計算、存儲、傳輸(網(wǎng)絡)等多個內(nèi)涵的綜合概念,是衡量數(shù)據(jù)中心計算能力的一個綜合指標[20]。
數(shù)據(jù)中心算力由數(shù)據(jù)處理能力、數(shù)據(jù)存儲能力和數(shù)據(jù)流通能力三項指標決定。其中,數(shù)據(jù)處理能力,在應對以大數(shù)據(jù)、AI人工智能[21]為代表的新一代數(shù)字化技術產(chǎn)業(yè)趨勢過程中,又可以區(qū)分為以CPU為代表的通用計算能力,和以GPU、AI芯片為代表的智能計算能力。前者主要用作執(zhí)行一般任務,后者主要承擔圖形顯示、大數(shù)據(jù)分析、信號處理、人工智能和物理模擬等計算密集型任務。綜上,本文選取5個指標進行算力評估,分別為:通用算力、智能算力、算效能力、網(wǎng)絡能力、存儲能力。
通用算力:通用算力主要指由CPU為代表的通用計算能力,本次使用平均單機架“每秒浮點運算次數(shù)”來評估數(shù)據(jù)中心的通用算力,單位采用TFLOPS(FP32,單精度浮點算力)。
智能算力:智能算力主要指由GPU、AI芯片為代表的智能計算能力,本文使用平均單機架“每秒浮點運算次數(shù)”來評估數(shù)據(jù)中心的智能算力,單位采用TFLOPS(FP32,單精度浮點算力)。
算效能力:數(shù)據(jù)中心算效(CE)為數(shù)據(jù)中心算力與所有 IT 設備功耗的比值,是同時考慮數(shù)據(jù)中心計算性能與功率的一種效率,即“數(shù)據(jù)中心 IT 設備每瓦功耗所產(chǎn)生的算力”,本文算效的單位采用GFLOPS/W(FP32)。
(12)
其中,CP表示算力,為通用算力與智能算力的加和。
網(wǎng)絡能力:網(wǎng)絡能力有很多衡量指標,本文主要采用網(wǎng)絡帶寬速度來衡量網(wǎng)絡的性能,單位為Mbit/s(兆比特每秒),即每秒傳輸?shù)谋忍匚粩?shù)。
存儲能力:存儲能力主要由存儲容量、存儲性能、存儲安全3方面共同決定,本文采用每秒讀寫次數(shù)(Input/Output Operations Per Second,IOPS)來衡量存儲的性能,即每秒的讀寫次數(shù)。
本節(jié)將數(shù)據(jù)中心測量的信息與雙向投影模型結合,給出利用雙向投影法處理不同數(shù)據(jù)中心算力方面不同指標間信息的決策模型,構建算力五力模型,并通過實例分析,說明該決策模型具有良好的效果。模型具體步驟如下。
步驟2.2.1:根據(jù)數(shù)據(jù)將指標劃分等級。具體將已有的數(shù)據(jù)取最大和最小值,在最大值與最小值的區(qū)間內(nèi)進而劃分等級,一般越理想的一端標記等級數(shù)越高。
步驟2.2.2:將數(shù)據(jù)進行定級,并轉化為優(yōu)序數(shù)(0~1之間的實數(shù))。具體按步驟2.2.1劃分的等級數(shù)表對現(xiàn)有數(shù)據(jù)對號入座,確定相應的等級數(shù),每個指標下,將不同數(shù)據(jù)中心兩兩對比,判斷出一數(shù)據(jù)中心在某指標下優(yōu)于或劣于另一數(shù)據(jù)中心的等級數(shù),并通過優(yōu)序數(shù)計算公式將各等級數(shù)轉變到0~1之間,方便接下來處理。
步驟2.2.3:確定正、負理想解,并根據(jù)定義4,通過計算確定出對應的向量;
步驟2.2.4:據(jù)式(9)(10),分別計算出每個數(shù)據(jù)中心對應的投影值;
步驟2.2.5:由式(11)計算得出每個數(shù)據(jù)中心的相對貼近度;
步驟2.2.6:根據(jù)相對貼近度的值進行大小排序,并據(jù)相對貼近度的值對每個數(shù)據(jù)中心進行星級評定,最終得出結論。
現(xiàn)給出6個數(shù)據(jù)中心對應的5個指標(通用算力、智能算力、算效能力、網(wǎng)絡能力、存儲能力)數(shù)據(jù),如表1所示。
根據(jù)專家的經(jīng)驗和數(shù)據(jù)分布的情況,評估步驟如下。
步驟3.1.1:根據(jù)數(shù)據(jù)將所選的5個指標進行分級,如表2所示。
步驟3.1.2:將表1的數(shù)據(jù)根據(jù)表2數(shù)據(jù)中心算力指標分級表進行定級,在每個指標下,每個數(shù)據(jù)中心的等級數(shù)兩兩進行比較,得到相對等級數(shù)并轉化為優(yōu)序數(shù),如表3—表5所示。
表1 樣本數(shù)據(jù)
表2 數(shù)據(jù)中心算力五力指標分級
表3 數(shù)據(jù)中心算力指標定級
表4 不同數(shù)據(jù)中心不同指標間的兩兩比較
表5 數(shù)據(jù)中心等級比較級經(jīng)優(yōu)序數(shù)轉化表
步驟3.1.3:確定正、負理想解,并計算確定出相應的向量。
A+={[0.57,0,0.67,0.67,0,0.8],[0,0,1,0.57,0,1],[0,0.57,0.67,0,0,0.8],[0.57,0,0.57,0.57,0.8,0.8],[0.57,0,0.67,0,0.67,0.67]};A-={[-0.67,-0.8,-0.57,-0.57,-0.8,0],[-1,-1,0,-0.8,-1,0],[0.8,0.67,-0.57,0.8,0.8,0],[-0.67,-0.8,-0.67,-0.67,0,0],[-0.57,-0.67,0,-0.67,0,0]};A-A+={[0.8,1.24],[1,1.37],[0.8,1.24],[0.8,1.24],[0.67,1.14]}。
A-A1={[0.23,1.14],[1,1.37],[0.8,1.24],[0.23,0.67],[0.10,0.57]}。
A1A+={[0.10,0.57],[0,0],[0,0],[0.13,0.57],[0.10,0.57]};
A-A2={[0.8,1.24],[1,1.37],[0.23,1.14],[0.8,1.24],[0.67,1.14]}。
A2A+={[0,0],[0,0],[0.10,0.57],[0,0],[0,0]}。
A-A3={[0.10,0.57],[0,0],[0.10,0.57],[0.23,0.67],[0,0]}。
A3A+={[0.23,1.14],[1,1.37],[0.23,1.14],[0.13,0.57],[0.67,1.14]}。
A-A4={[0.10,0.57],[0.43,0.8],[0.8,1.24],[0.23,0.67],[0.67,1.14]}。
A4A+={[0.23,1.14],[0.2,0.57],[0,0],[0.13,0.57],[0,0]}。
A-A5={[0.8,1.24],[1,1.37],[0.8,1.24],[0,0],[0,0]}。
A5A+={[0,0],[0,0],[0,0],[0.8,1.24],[0.67,1.14]}。
A-A6={[0,0],[0,0],[0,0],[0,0],[0,0]}。
A6A+={[0.8,1.24],[1,1.37],[0.8,1.24],[0.8,1.24],[0.67,1.14]}。
根據(jù)表5確定出正、負理想解,將每個數(shù)據(jù)中心在每個指標下的測度與正、負理想解距離計算出來,繪出圖2,在下面組圖中,紅色線圈表示每個數(shù)據(jù)中心的每個指標距離相對正理想解的距離。若紅色線圈越小,表示該數(shù)據(jù)中心各指標相對距離正理想解越近,則該數(shù)據(jù)中心越優(yōu);反之相反。藍色線圈表示每個數(shù)據(jù)中心的每個指標距離相對負理想解的距離。藍色線圈越大,表示該數(shù)據(jù)中心的指標距離負理想解越遠,則該數(shù)據(jù)中心越優(yōu);反之相反。在圖2組圖中,我們可以較為直觀地看出DC.6整體情況最不好,DC.1,DC.2整體相對更優(yōu)。
圖2 DC.1—DC.6各指標下到正負理想方案的距離
步驟3.1.4:計算相應的投影值。
得到相對應的模分別為如下。
|A-A+|≈3.3392;|A-A1|≈2.6915;|A1A+|≈1.0077;|A-A2|≈3.2149。
|A2A+|≈0.5793;|A-A3|≈1.0807;|A3A+|≈2.7735;|A-A4|≈2.3621。
|A4A+|≈1.4385;|A-A5|≈2.6882;|A5A+|≈1.9808;|A-A6|≈0。
|A6A+|≈3.3392。
在此,將每個數(shù)據(jù)中心得到的模(整體距離正、負理想解的距離)繪制成圖3,紅色線圈對應的數(shù)據(jù)中心越靠近中心位置,表示該數(shù)據(jù)中心整體距離正理想解越近,整體情況就越好;反之相反。藍色線圈對應的數(shù)據(jù)中心越靠近圖中的外延,表示該數(shù)據(jù)中心整體距離負理想解越遠,整體情況便越好;反之相反。可較為直觀地看出,圖中DC.1,DC.2,DC.4,DC.5相對較好,DC.3,DC.6相對較差,這與最后得出的結論吻合。
圖3 樣本數(shù)據(jù)到正、負理想方案的距離
進而求得投影值如下。
PrjA-A+(A-A1)≈2.5085;PrjA1A+(A-A+)≈2.2966。
PrjA-A+(A-A2)≈3.1669;PrjA2A+(A-A+)≈1.3528。
PrjA-A+(A-A3)≈0.7713;PrjA3A+(A-A+)≈3.1156。
PrjA-A+(A-A4)≈2.1685;PrjA4A+(A-A+)≈2.3606;
PrjA-A+(A-A5)≈2.1642;PrjA5A+(A-A+)≈1.9808;
PrjA-A+(A-A6)=0; PrjA6A+(A-A+)≈3.3391。
步驟3.1.5:根據(jù)公式計算得出各數(shù)據(jù)中心的相對貼近度。
C(A1)≈0.5220;C(A2)≈0.7007;C(A3)≈0.1984;C(A4)≈0.4788;C(A5)≈0.5221;C(A6)=0。
步驟3.1.6:根據(jù)相對貼近度的值進行大小排序,并依據(jù)表6確定各數(shù)據(jù)中心的星級,最終得出結論。對應可得:DC.1★★★★;DC.2 ★★★★★;DC.3 ★★;DC.4★★★;DC.5 ★★★★ ;DC.6 ★。
表6 相對貼近度與星級評定對應表
算力作為數(shù)據(jù)中心的重要能力支撐著人工智能、物聯(lián)網(wǎng)、AR/VR等上層應用場景的發(fā)展,同時這些應用場景的快速普及也對數(shù)據(jù)中心算力水平提出了更高的要求。算力受到計算、網(wǎng)絡、存儲和功耗的共同影響,如果無法綜合測量便無法進行改進,所以對數(shù)據(jù)中心算力進行綜合評價就顯得尤為重要。
本文基于對數(shù)據(jù)中心算力的研究,將通用算力、智能算力、算效能力、網(wǎng)絡能力、存儲能力劃分等級,并應用雙向投影法和TOPSIS方法對各數(shù)據(jù)中心進行評估,提出“算力五力模型”。該模型使得到的結果區(qū)分度更高,更加真實地反映出不同數(shù)據(jù)中心間的優(yōu)劣關系。但本文所提出的方法沒有考慮數(shù)據(jù)測量誤差,不同指標間是否有固定比例搭配使得整體效能更優(yōu)等因素,這將在未來的研究中進行探索。