張祖強
在進行實測對比之前,我們不妨先通過NVIDIA GeForce RTX 30系列和AMD Radeon RX 6000系列顯卡的規(guī)格參數(shù)來對比它們的“理論戰(zhàn)力值”。NVIDIA GeForce RTX 30系列顯卡(下文簡稱RTX 30系列顯卡)基于目前最新的NVIDIA Ampere架構(gòu),該架構(gòu)采用改進的Streaming Multiprocessor(下文簡稱SM) ,它由不同核心、單元以及內(nèi)存構(gòu)成。NVIDIA Ampere架構(gòu)SM的一大變化是FP32操作的吞吐量變?yōu)閮杀丁閷崿F(xiàn)這一目標,新數(shù)據(jù)路徑設(shè)計是每個SM分區(qū)每時鐘能夠執(zhí)行32個F P32操作,所有四個S M分區(qū)組合在一起,每個時鐘可執(zhí)行128F P32操作。這能帶來什么好處呢?簡單來說,圖形、計算操作和算法、現(xiàn)代著色器工作負載通?;旌鲜褂肍P32算術(shù)指令。FP32加速也有助于光線追蹤降噪著色器。光線追蹤渲染工作負載越大,相對于上一代產(chǎn)品的性能提升越大。
和RTX 20系列顯卡相比,RTX 30系列顯卡的RT Core和Tensor Core均進行了增強。其中,RTX 30系列顯卡搭載的是第二代RT Core。NVIDIA的數(shù)據(jù)表明,第二代RT Core的性能達到上一代的兩倍左右,同時其運動模糊渲染效率更是達到上一代RT Core的8倍。
在GPU上引入Tensor Core(中文名為“張量核心”)是NVI DI A近年來的一大創(chuàng)舉。RTX 30系列顯卡上搭載的是第三代Tensor Core,其主要特點是支持更多的數(shù)據(jù)格式,大幅度加強了在稀疏矩陣計算時的效能。比如在原始矩陣具有稀疏性時,第三代Tensor Core的速度可達到第一代的20倍等。而在實際游戲中,第三代Tensor Core提供的就是玩家熟悉的NVIDIA DLSS功能,其主要作用是在游戲中有效遏制幀率下降,同時還能提供優(yōu)秀的畫質(zhì)表現(xiàn)。目前,NV IDI A DLSS已經(jīng)更新至2.1版本,并在游戲中提供了質(zhì)量、平衡、性能和超性能這4種模式供玩家選擇。
此外,引入光線追蹤動態(tài)模糊加速也是基于NVIDIA Ampere架構(gòu)的第二代RT Core上一個重要的技術(shù)創(chuàng)新。動態(tài)模糊是一種非常流行且重要的計算機圖形效果,它可用于游戲、電影以及許多專業(yè)渲染應(yīng)用程序中。從原理上來講,動態(tài)模糊的本質(zhì)和膠片攝影相關(guān),因為膠片攝影時,圖像不是立即創(chuàng)建的,而是通過將膠片在有限的時間段內(nèi)曝光來創(chuàng)建的。這意味著目標物體在膠片快門時間內(nèi)的高速移動將帶來模糊的曝光效果。如果G P U想要創(chuàng)建類似效果,必須模擬相機和膠片工作流程。動態(tài)模糊對于電影是非常重要的,它能夠避免畫面出現(xiàn)斷續(xù)卡頓的情況,對游戲來說亦是如此。
AMD Radeon RX 6000系列(下文簡稱RX 6000系列)顯卡是AMD第一代支持硬件光線追蹤渲染的產(chǎn)品。該系列顯卡基于AMD最新推出的RDNA 2架構(gòu),并通過引入硬件光線追蹤單元(下文簡稱:RA單元)以實現(xiàn)對硬件光線追蹤渲染的支持。目前的資料顯示,RDNA 2架構(gòu)的每個CU單元配備1個RA單元,同時AMD宣稱RA單元的光線追蹤交叉性能是傳統(tǒng)軟件執(zhí)行的10倍。數(shù)據(jù)顯示,RDNA2架構(gòu)的GPU在微軟DXR SDK的Procedural Geometry的測試中帶來了471fps的成績,在軟件模擬下只有34f p s,因此性能達到了軟件的13.8倍。實際上Procedural Geometry只是整個DXR SDK中的一部分,用于測試地面以上所有對象在光線追蹤上的性能,其圖元信息包括解析幾何、體積幾何和帶符號的距離幾何等多重內(nèi)容。
從技術(shù)層面來看,RTX30系列顯卡和RX6000系列顯卡均在硬件層面支持實時光線追蹤渲染,但考慮到RTX 30系列顯卡還得到第三代Tensor Core的加持,它可以大幅提升游戲幀率,所以我們認為RTX30系列顯卡在光追游戲中開啟DLSS之后的游戲性能應(yīng)該更加出色。那么實際情況如何呢?下面我們就在游戲?qū)崪y中一探究竟。
光追性能對比測試
參與本次測試的顯卡是來自NVIDIA的GeForce RTX 3080、GeForceRTX 3070、GeForce RTX 3060 Ti(下文分別簡稱RT X 3080、RT X 3070、RTX 3060 Ti),以及它們各自的對位顯卡—AMD Radeon RX 6800XT、Radeon RX 6800、Radeon RX 6700XT(下文分別簡稱R X 6 8 0 0 X T、R X6800、R X 6700X T)。同時,我們還為這些參測顯卡搭配了以A M D銳龍9 5950X處理器、ROG CROSSHAIR ⅧDARK HERO主板、DDR4 3200 32GB雙通道內(nèi)存為核心的測試平臺。
測試游戲的選擇上,《賽博朋克2077》這款時下火爆的光追游戲自然不可或缺,同時我們還挑選了包含《堡壘之夜》《我的世界》《控制》等共計8款光追游戲參與測試。考慮到來自NVIDIA的3款RTX 30系列顯卡還支持DLSS技術(shù),所以我們在測試中將分別測試這3款顯卡在“光追:開+DLSS:關(guān)”,以及“光追:開+DLSS:開”設(shè)定下的性能。游戲設(shè)置方面,所有參測游戲的光線追蹤等級將設(shè)為最高,同時部分參測游戲支持多種DLSS模式,我們在本次測試中統(tǒng)一選擇平衡模式。需要說明的是,由于RTX 3080、RTX 3070、RTX 3060 Ti在1080p分辨率下運行《古墓麗影:暗影》和《地鐵:離去》時不支持開啟DLSS,所以在這兩款游戲中,我們不考察這3款顯卡在1080p分辨率下同時開啟光線追蹤和DLSS的性能。
測試成績解析部分,我們將首先對比參測顯卡在開啟光線追蹤,并關(guān)閉DLSS時的游戲性能。隨后我們還會把RTX 3080、RTX 3070、RTX 3060Ti在同時開啟光線追蹤和D L S S之后的游戲性能,分別與R X 6800X T、R X6800、RX 6700XT進行對比。
首先在開啟光線追蹤,并關(guān)閉DLSS時,參測3款RTX 30系列顯卡大獲全勝。例如在2.5K分辨率和最高畫質(zhì)下,RTX 3080運行《控制》的平均幀率達到72fps,而其對位顯卡R X6800XT的平均幀率僅有49fps,后者的測試成績不僅落后RTX 3080約47%,同時還遠低于60fps這一絕對流暢基準線??梢灶A(yù)見的是,在一些光線追蹤環(huán)境較為復(fù)雜,或者玩家與敵人進行激烈對抗的過程中,RX 6800XT在2.5K分辨率和最高畫質(zhì)下很難給玩家提供足夠流暢的光追體驗。不僅如此,分別在1080p、2.5K和4K下運行《我的世界》時,RT X 3080和RT X3060 Ti測得的平均幀率都達到其對位顯卡RX 6800XT和RX 6700XT的兩倍或更高。同時相比RX 6800,RTX 3070在上述3種分辨率下運行《我的世界》的平均幀率也都高出85%以上。
下面我們再來看看開啟DLSS之后,參測3款RT X 30系列顯卡的光追游戲性能。測試成績顯示,相比關(guān)閉DLSS時,這3款RTX 30系列顯卡在開啟DLSS之后的性能提升非常大。例如關(guān)閉DLSS時,RTX 3080在4K分辨率和最高畫質(zhì)下運行《我的世界》的平衡幀率為34fps,而當(dāng)開啟DLSS之后,其平均幀率提升180%,達到95fps。不僅如此,和6800XT、RX 6800、RX 6700XT這3款顯卡相比,參測3款RTX 30系列顯卡開啟D LSS之后的光追性能領(lǐng)先非常多。同樣以《我的世界》為例,RX 6700XT在4K分辨率和最高畫質(zhì)下運行這款游戲的平均幀率為10fps,而其對位顯卡RTX 3060 Ti在相同設(shè)定下運行《我的世界》的平均幀率高達60fps,是前者的6倍。
RTX 30系列顯卡,光追游戲玩家的不二之選
綜合我們的測試成績不難看出,RTX 3080、RTX 3070、RTX 3060 Ti在8款參測游戲中的光追性能完全碾壓各自的對位顯卡。不僅如此,即使RTX 3060Ti的定位比RX 6800XT更低一些,但在開啟DLSS之后,其光追游戲性能也能在不同程度上領(lǐng)先RX 6800XT,可見在DLSS的加持下,RTX 30系列顯卡的光追游戲性能的確更加亮眼。因此我們認為,對于想要享受暢爽光追游戲體驗的玩家來說,RTX 30系列顯卡就是你們的不二之選。