要說最近最令人震撼的電影,情懷大片《灌籃高手》都得靠邊站,必屬畫面美輪美奐、特效逆天的大片《深?!?。很多觀眾看后感嘆:這絕對是動畫片畫質的“新天花板”。而這部沖擊10億元票房的動畫巨作,僅制作成本就超3億元,制作周期長達7年。它的官方紀錄片,為我們呈現(xiàn)了制作的艱辛。其間還記錄了一個“慘烈細節(jié)”,那就是在制作過程中,因為屋頂漏雨,損失了四十多臺“高配電腦”,而它們中的大部分,其實就是“工作站”。
而提到工作站(Workstation)這種產品,話題就變得非常有趣了!簡單說,它是一種80%的人“完全不懂”,近20%的人“懂一點,但又‘著實看不明白”,真正弄得明白的人不到1%的“神秘產品”。
你就是那80%完全不懂的人?沒關系,請往下看一分鐘,你馬上就能晉升為“懂一點,但又‘著實看不明白”的Level2人群^__^!3、2、1,計時開始!
簡單說,工作站和普通電腦硬件上有什么不同?
從硬件端說,最典型的工作站電腦是由“專用處理器+專用主板+支持ECC(錯誤校驗)的內存+專業(yè)顯卡”構成的。
對比個人電腦(PC),工作站(Workstation)的硬件區(qū)別很明顯,比如英特爾平臺端:
·個人電腦常用處理器是酷睿(Core)品牌,如今基本上每代酷睿處理器都分了i3/i5/i7/i9四個檔次。
·個人電腦常用顯卡是NVIDIA的消費級顯卡GeForce系列,比如GeForceRTX3060/4070/4080/4090等。
·主板也是個人電腦專用的,比如第13代酷睿可用Z790/B760芯片組款型。
·工作站使用的處理器則是至強(Xeon)品牌。至強處理器分為服務器用和工作站用兩大類,而最新的工作站處理器是W-2400和W-3400系列,再細分,就是W3/W5/W7/W9四個檔次。
·工作站通常搭載專業(yè)顯卡,時下比較新的是NVIDIA的RTXA6000/A5500/A5000/A4500/A4000等,還有入門級的T1000、T600;另外還有用于深度學習的GV100等。
·主板也是工作站專用的,比如W790芯片組主板,就對應最新的至強W-2400和W-3400系列處理器。
看到這里,恭喜,你已經從“80%的Level1人群”進階到了“近20%的Level2人群”。
不過為什么又說這Level2是“懂一點,但又‘著實看不明白”呢?因為,只要你看看工作站的價格和奇特的現(xiàn)象,你極有可能“又整不明白了”^__#!
謎一般的工作站(配件及整機)售價,和“奇怪的現(xiàn)狀”
如今大家配臺24核32線程的i9-13900K處理器+RTX4070顯卡高性能臺式機,價格也就萬元起,品牌機1.8萬元左右。若是筆記本,甚至萬元不到就能買到。但處理器核心數(shù)量和顯卡規(guī)格類似的典型工作站產品,價格則是以“萬元”為單位的。下圖中是國內品牌的“DIY工作站”,使用至強W-3400處理器,顯卡還是消費級的而非專業(yè)卡,價格動輒六七萬元!若是搭載多塊專業(yè)顯卡的至強W9-3495X工作站,價格要20萬元以上——注意,這還僅是“DIY品牌”的價格,還不是聯(lián)想戴爾這樣的整機品牌,后者會更貴。
典型的工作站整機,價格緣何這么貴呢?
答案是:因為構成典型工作站產品的各種配件,價格都比個人電腦配件貴很多!有些價格差異甚至是十倍!
處理器端,目前最新的第13代酷睿i9-13900K,建議零售價為589美元;而至強W9-3495X處理器,建議零售價格則是十倍差異,高達5889美元!
顯卡端,當下主流的RTXA6000/A5500/A5000專業(yè)顯卡,價格都在萬元之上;如果是高端的QuadroGV100顯卡,價格更是高達50000元+!相比起來,消費級頂級顯卡RTX4080/4090只要8700元/14000元,“主流強卡”RTX3060甚至只要2500元左右,價格也不在一個檔次上。
主板端,相同品牌情況下,消費級主板(比如最新的Z790芯片組)和工作站用主板(比如W790芯片組)也有數(shù)倍差價。
OK,現(xiàn)在大家知道了一點:典型的工作站電腦超級貴,是因為處理器、專業(yè)顯卡、主板等配件都貴。不過,這有啥“看不明白”呢?那么,請用消費級和工作站的處理器、顯卡,具體對比一下規(guī)格和售價
和消費級處理器進行對比,先按照相同線程比較:
·20線程(14核20線程)的消費級處理器i5-13500建議售價為232美元;而20線程(10核20線程)的W5-2445建議售價為839美元,是前者的3.6倍!
·32線程(24核32線程)的消費級頂級處理器i9-13900K建議售價是589美元;32線程(16核32線程)的W5-2465X/W5-3435X建議售價分別是1389美元和1589美元,是前者的2.3倍和2.7倍!
再按照同物理核心數(shù)比較:
·24核的消費級頂級處理器i9-13900K建議售價是589美元;24核的W7-2495X/W7-3455建議售價是2189美元和2489美元,是前者的3.7倍和4.2倍!
然后看看專業(yè)顯卡和消費級顯卡的對比。按照一般性常識,比較CUDA核心數(shù)相近的款型:
·CUDA核心數(shù)16000+的消費級顯卡RTX4090,零售價人民幣14000元左右;CUDA核心數(shù)18000+的最新款專業(yè)顯卡RTXA6000Ada架構版,零售價人民幣58000元,是前者的4.1倍!
而這,就是大部分“稍懂行的人”看不明白的點:看似相同的規(guī)格,憑什么工作站配件貴那么多?就因為它叫至強或是專業(yè)顯卡?
但,以上還不是真正讓人看不明白和糊涂的,如今,讓人“徹底暈菜”的是:當你在電商平臺搜索“工作站”,會發(fā)現(xiàn)鋪天蓋地而來的并不是我剛才給你看的那些天價產品,而是幾千元,甚至“3999元的工作站”。它們基本都搭載酷睿消費級處理器,內存甚至僅8GB,也不用專業(yè)顯卡,大部分甚至是集顯!所以,前面講的都僅僅是“理論知識”?關于工作站的一切都已經徹底顛覆?那些天價處理器和昂貴的專業(yè)顯卡其實無人問津??
看到這里,恭喜你正式成為一個“迷惑的Level2”!關于工作站的傳統(tǒng)認知突然給打破了。似乎,傳統(tǒng)的工作站產品如今已無人問津了?但,也正是從這里開始,才進入這篇文章的核心。我們將一步一步,把所有關于“工作站”電腦的困惑一一解答。
工作站變遷史
消費級處理器多核爆發(fā),消費級顯卡性能飆升,EasyMoney生意消失
故事要從N年前講起,那時,消費級處理器還長期停留在4核8線程上,所以彼時工作站產品是“EasyMoney”(輕松賺錢的生意)!6核8核的至強處理器工作站,搭載入門級專業(yè)顯卡就能賣幾萬元。
但隨著處理器競爭的加劇,“核戰(zhàn)爭”爆發(fā),消費級處理器的核心數(shù)量在幾年之內狂翻幾倍到現(xiàn)在的16核、24核!同期,消費級顯卡性能也突飛猛進,如今已有CUDA核心數(shù)高達16000個的消費級顯卡了,最大顯存也來到了24GB!
如此一來,之前很大一部分低端工作站干的活兒的確給消費級處理器+消費級顯卡搶了!大家不再需要掏幾萬元去買6核、8核至強+入門級專業(yè)顯卡的入門級工作站了。而恰好,“工作站”產品本來就沒有特別嚴格的配置標準,所以現(xiàn)在大家看到,大量入門級工作站,雖然有“工作站電腦的外殼”,但里面基本就是消費級配件,價格也非常便宜——這,就是時代的變遷。早期的EasyMoney生意,從此消失了!
從至強系統(tǒng)的真正特性說起PART4典型的工作站,活躍在真正的專業(yè)領域
那么,我們是否可以理解為“搭載至強處理器、專業(yè)顯卡、ECC內存”的“典型工作站產品”日漸式微了呢?
不!其實“被取代的”,是相對低端、入門的產品。而“真正典型的工作站產品”,其“獨特賣點”是消費級電腦無法比擬的。而且,它們也在進化,開始以不同的形態(tài),活躍在真正的專業(yè)領域。而且,這種“需要典型工作站產品的專業(yè)領域”,如今越來越多了(后面會解釋)。
Ⅰ.至強處理器和專業(yè)顯卡真正強的特性是什么?
前面的“同規(guī)格比較”,數(shù)倍的價差,讓不少人困惑!但實際上,是因為大家“還不夠真正懂行”。無論是至強處理器,還是專業(yè)顯卡,都有自己“真正強大的、消費級配件難以比擬的特性”。
先從“工作站專用”的至強W-2400和W-3400系列處理器說起:
●至強W系列處理器,CPU內置的PCIe通道數(shù)多得多,W-2400/W-3400系列內置64條/112條PCIe5.0通道!而消費級處理器,如第13代酷睿,CPU內置PCIe5.0通道僅20條。新一代至強W是消費級處理器的3.2倍/5.6倍。
●另外,至強W支持的內存通道數(shù)和內存容量都極大,W-2400支持4通道最大2TB內存,W-3400支持8通道最大4TB內存。而第13代酷睿最大支持的內存通道/容量是2通道/192GB。至強對內存通道的支持是消費級的2倍/4倍;內存容量是消費級的11倍/21倍!
●至強處理器支持ECC錯誤檢驗內存,而消費級處理器并不支持。ECC內存可確保任務不會在半途報錯、宕機——這對于動輒上百、數(shù)百小時的項目運算非常重要。而一些大型工程,往往是由上千個“數(shù)百小時的子項目”構成的,ECC內存的價值可見一斑。
●真正的多核至強處理器,L3級緩存容量也更大一些,某些應用的性能會更好。
●至強W-2400和W-3400系列都支持AVX-512指令集,可用于AI、高性能計算應用加速??犷OM級處理器目前都不再支持AVX-512指令集。
再來說說專業(yè)顯卡的特性。
●以RTXA6000為例(它算是當下較強的工作站用專業(yè)顯卡),其CUDA核心數(shù)10752個,顯存容量高達48GB;而CUDA核心數(shù)類似的GeForceRTX3080Ti/4080消費級顯卡,顯存容量僅12GB/16GB。也就是說,專業(yè)顯卡,尤其是高端專業(yè)顯卡,顯存容量更大,最大可至3~4倍。
●還有個細節(jié)就是對ECC的支持——如今的RTX專業(yè)顯卡,大部分采用了ECC錯誤校驗顯存。而消費級顯卡,再高端都不支持。
●高端的專業(yè)顯卡還支持“NVLink”,可通過橋接實現(xiàn)“火力翻倍”。而新款的GeForceRTX消費級顯卡大部分不再支持NVLink功能了,只能“單兵作戰(zhàn)”。
Ⅱ.體現(xiàn)在產品形態(tài)上,終于明白了“真·工作站”形態(tài)為何能如此豪橫
看完了上面的介紹,現(xiàn)在大家應該明白:至強處理器、專業(yè)顯卡,并非“智商稅”,也不是簡單地“換個名字賺大錢”,而是“有真本事的”!而結合上面這些數(shù)據(jù),大家也就很容易明白,為什么工作站主板、真正的典型工作站產品,看起來總是那么“豪橫”了^___^。
Ⅲ.那么,什么應用需要這些生猛的特性和夸張的配置呢?
了解了典型工作站配件的特性,了解了“真·工作站”產品能達到的夸張配置上限,一個自然而來的問題就是:究竟什么樣的應用,才會需要用到如此豪橫的配置呢?
前面我已說過,在消費級處理器核心數(shù)量暴增、消費級顯卡性能飆升后,的確搶走了傳統(tǒng)工作站產品的很多業(yè)務。且如今,專業(yè)設計軟件領域的幾家大佬(AUTODESK、達索、西門子、Adobe等),它們的大量設計類軟件,只要任務負載不重,其實用消費級平臺就能搞定,而這也是如今游戲電腦(高性能電腦)熱銷的主要原因之一——不少人用它們做相對簡單的CAD、視頻剪輯和簡單的3D建模,以及平面設計。
但,如果涉及真正負載高的活兒,消費級電腦是完全沒辦法搞定的!必須,或者說至少要借助強大配置的工作站產品。
●比如游戲場景設計、電影特效和動畫特效建模等(渲染就更別提了,得靠服務器集群、渲染農場來完成,這是另外的話題了)。
●比如設計汽車發(fā)動機、飛機發(fā)動機,或者一輛汽車、一架飛機。
●另外,即便是一些看起來很常見的應用,當負載程度和精度提升后,消費級電腦也難以搞定,也需要高配置的工作站。比如視頻剪輯,如今用輕薄本都能剪輯FHD級別的手機拍攝視頻,但當你的視頻素材變成高碼率8K時,相信我,消費級電腦是搞不定的!
另外大家還得明白:不同的應用類型,對工作站的性能需求點也是不同的,甚至是截然不同的。
●先說游戲、電影、動畫的三維建模。
而涉及如此大規(guī)模的特效的建模、粗渲染,對處理器和顯卡都有極高的要求,且是屬于“上不封頂?shù)男枨蟆薄幚砥骱诵臄?shù)越多、功率釋放越強、頻率越高,顯卡的CUDA核心數(shù)越多、顯存越大,效率就越高。這也就是我們看到動畫制作公司、影視制作團隊,每個人都使用高性能工作站的緣故。
而且,在這個大的領域內,不同的軟件,不同的項目,需求也有細分的:比如用MAYA做動畫建模和簡單渲染,核心是顯卡要強;但若用AE做粒子特效,那基本是靠處理器硬扛,且內存容量越大越好;但若是Blender建模和簡單渲染,則處理器方案和顯卡方案都可選。
前面提到的這臺插滿了內存和RTX專業(yè)顯卡的頂規(guī)工作站就相對適合電影、動畫、游戲設計領域。
知識加油站:關于工作站產品的“投入產出比”
不少懂點硬件知識的“老鳥”都持有這樣的觀點:至強處理器、專業(yè)顯卡、ECC內存,同等規(guī)格下比消費級電腦貴太多,用消費級的頂規(guī)電腦不行嗎?即便慢點,但能節(jié)約大量開支啊。
但實際上,對于真正需要用到高配置、頂級配置工作站(甚至服務器)的應用來說,這點硬件的錢根本不是個事兒!比如電影《深?!返闹谱髻M用就高達3億元以上,而發(fā)行費用也超過了1億元,工作站的錢其實占比很小。常規(guī)性價比思維中,“效率低一倍,但價格便宜兩三倍”的成本邏輯在這里完全不適用。還有隱性成本問題:工期長一倍,從正常4年(動畫電影正常制作周期為4年,《深海》是遭遇了特殊情況,長達7年)變8年,人工費得增加多少?
而且,人的工齡中,能有幾個8年?
●再說工業(yè)設計領域。比如發(fā)動機設計、汽車設計。這并非單一需求,而是巨大的、復雜的系統(tǒng)工程,需要的工作站產品也有不同。
工業(yè)設計是復雜的“系統(tǒng)工程”,尤其是復雜工業(yè)品的設計,里面可能涉及數(shù)百上千個甚至幾千上萬個零部件,是巨大的協(xié)同工程。也正因如此,工業(yè)設計往往是“不同軟件商的好幾款軟件聯(lián)立使用”,有些是設計單個零部件的,有些是用于全局協(xié)同的,有些是用于仿真計算的。而不同的細分應用,對硬件的需求是不同的。
舉幾個例子:·比如用西門子NX(UG)做一個發(fā)動機的外殼,需要渲染出來看效果。這種渲染是“不斷迭代的”,迭代次數(shù)越多,就越接近真實的視覺效果。而這種渲染,就是吃處理器資源的。處理器核心越多越好,頻率越高越好。
·而在工業(yè)產品設計中,存在大量的“仿真計算”環(huán)節(jié)。比如設計汽車,設計師需要知道車在不同速度的行駛中的空氣阻力情況、周遭氣流分布狀況,還得進行碰撞仿真來優(yōu)化和改進車的框架設計;設計發(fā)動機,設計師要知道空氣流在發(fā)動機內的壓力變化、流向變化、速度變化;設計管道系統(tǒng),設計師得知道管道里的液體流動、相互撞擊的情況……這些東西,不可能“一次又一次地實際做實驗”,那成本和時間都是難以想象的,所以,就要用到計算機仿真計算。
而仿真計算,基本是靠處理器運算。另外不少仿真計算對內存的要求也極高。消費級處理器最高192GB?不好意思,復雜仿真計算恨不得都用TB級的內存——這也就是很多仿真計算用的工作站采用雙路至強處理器,插滿了內存,但顯卡卻是一個入門級T1000顯卡的道理,因為它不太需要顯卡的性能。
●最后舉些大家不容易想到的例子,比如醫(yī)學影像、地質勘探等。
這是臺高端CT機,很多醫(yī)院都在用。病人如果做心肺HRCT,CT機會將人體上腹部“切片成像”數(shù)百張,然后合成為連貫的三維立體影像,這樣醫(yī)生就可以360°無死角地觀察病人的心臟、肺部等各器官的情況,包含血管的細節(jié),甚至是血管各個角度的粗細變化、血流影像等。而這個成像與合成的過程,當然是越快越好,這樣才能提升接診效率,讓醫(yī)院在盡可能短的時間內收回設備投資(高端CT機價格超貴)。因此,每臺這種高端CT機都會配套一臺高端圖形工作站,來強化圖像處理能力。
這是地質勘探應用中的一個環(huán)節(jié),似于CT斷層掃描成像,適用領域如石油、天然氣勘探等。這種勘探是真正的“巨型工程”,并不是發(fā)現(xiàn)地下有油有氣,就伸個鉆頭進去捅那么簡單。就舉一個例子,地下天然氣、石油的貯藏結構是什么樣的得探明。而且,一旦從一個點開始開采,其內部會產生如何的流向,會不會影響進一步的開采,會不會導致地質結構不穩(wěn)定……這些,都需要根據(jù)前期采集到的信息進行仿真分析——這種運算,也是吃處理器和內存資源的。但勘探中的成像和組合環(huán)節(jié),則是吃顯卡算力的。如前所述,不同的細分應用往往需要用到不同的工作站產品。
工作站需求旺盛,產品百花齊放
很多“個人電腦專家”往往抱有這樣的觀點:“多核的消費級電腦搶了部分工作站生意,所以宏觀上,傳統(tǒng)工作站的生意機會變少了?!薄@個觀點是完全錯誤的!
前面我們的確提到了“低端工作站生意被搶,EasyMoney生意消失”,但另一方面,更高的需求在不斷誕生,甚至于,越來越多了。
舉一個應用需求變遷的例子大家就明白了:七八年前,還沒多少人玩得起視頻制作和剪輯——因為相關設備少,專業(yè)性強,價格也高。但現(xiàn)在手機都能輕松拍攝和快速剪輯視頻后,并沒有讓人們做視頻的時間因為效率的提升而減少——相反,因為門檻低了,人人都花費大量時間折騰視頻,我們徹底進入了視頻時代。而在視頻時代中,大家對高清、高質量的視頻需求越來越旺盛,視頻的清晰度和精美程度越來越高,各大影視劇、電影都開始推出高清、超清版,電影的特效也越來越華麗、絢爛……從宏觀上說,對高性能的視頻制作、編輯、渲染硬件(包括工作站、服務器等)的需求反而是暴增的,從業(yè)人數(shù)也在暴增——所以,這個道理很明確了吧。
而需求的暴增,也意味著產品端的百花齊放。前面給大家展示的主要是臺式工作站,也稱桌面工作站,造型就是傳統(tǒng)臺式機的樣子,當然個頭往往更大。但實際上,工作站這種產品形態(tài)可以是千變萬化的??梢允桥_式機造型、可以是筆記本造型,也可以像機架式服務器,甚至可以是柜子或箱子,形態(tài)上并沒有嚴格的限定。
而除了形態(tài)的豐富,工作站的配置也是千變萬化、千差萬別的。在前文中,各位已經看到——消費級個人電腦,廠商也可以定義它是“工作站”。當然,典型的工作站配置還是以至強(或線程撕裂者)處理器、ECC內存、專業(yè)顯卡和專用主板構成的,也只有這種配置的典型工作站產品,才能“拔高配置上限”,真正滿足高負載專業(yè)需求。而具體到不同類型的專業(yè)應用,有些配置強調的是處理器的核心數(shù)量和內存容量,有些強調圖形性能,有些強調存儲,也有要求兼顧的。
最后,工作站產品的“制造商”如今也越來越多。傳統(tǒng)的“三大家”(戴爾、聯(lián)想、惠普)名聲雖響,但其他國際OEM廠商也在奮起直追。而國內也有大量的OEM廠商和行業(yè)廠商制造工作站產品,如曙光、浪潮、紫光等。甚至于國內個別新銳PC品牌如今也推出了工作站產品,如雷神。另一方面,在工作站、服務器領域,還有不少“專精廠商”,如超微(SuperMicro),它不僅為工作站、服務器提供核心配件(如主板、機箱),也參與整機的制造和銷售,甚至可構建行業(yè)整體解決方案。還有大量的系統(tǒng)集成商,也在根據(jù)客戶的需求,組裝對應配置的工作站或服務器產品??傊?,工作站產品的“參與者”越來越多,產品呈現(xiàn)百花齊放態(tài)勢。
至此,你已掌握了關于工作站電腦的絕大部分知識,從典型的硬件構成,到它的發(fā)展變遷,到它的獨特賣點和真正強大所在,以及具體的細分應用,還有相關生態(tài)。恭喜你,你已經成為那“不到1%”的懂行專家!
當然,這篇科普文章也僅僅做了宏觀層面的梳理,工作站無論是產品還是具體的應用,都還有很多很多的細節(jié)和知識點留待大家去發(fā)現(xiàn)和探秘。比如,大家猜猜看,至強W9-3495X(56核112線程)處理器,“火力全開”時的爆發(fā)功率能有多高?而穩(wěn)定輸出的最高功率又能有多高?^___^