謝列琴
近日,英特爾宣布推出面向筆記本電腦的英特爾銳炫A獨(dú)立顯卡系列。這是英特爾銳炫A系列顯卡產(chǎn)品組合中率先發(fā)布的獨(dú)立顯卡。所有搭載英特爾銳炫A系列獨(dú)立顯卡的產(chǎn)品均基于英特爾全新Xe HPG微架構(gòu)而打造,專(zhuān)為游戲玩家和內(nèi)容創(chuàng)作者量身設(shè)計(jì)。此外,英特爾公司也表示將于今年發(fā)布面向臺(tái)式機(jī)和工作站的產(chǎn)品。
此次推出的英特爾銳炫A系列獨(dú)立顯卡將應(yīng)用于廣泛的移動(dòng)設(shè)備中,其中多款搭載銳炫3系列顯卡的首批機(jī)型還將通過(guò)英特爾Evo平臺(tái)認(rèn)證,并采用英特爾最新第12代酷睿處理器,包括針對(duì)超薄本設(shè)計(jì)的A350M以及為兼顧性能和輕薄而設(shè)計(jì)的A370M,同時(shí)還兼具WiFi 6、即時(shí)響應(yīng)和超長(zhǎng)續(xù)航等特性。
英特爾公司副總裁兼顯卡與游戲團(tuán)隊(duì)總經(jīng)理Roger Chandler表示:“數(shù)十年來(lái),英特爾一直致力于推動(dòng)PC平臺(tái)的創(chuàng)新。通過(guò)推出歷代CPU處理器,我們?yōu)槿驍?shù)十億用戶(hù)提供了強(qiáng)大的計(jì)算能力。我們通過(guò)USB、Thunderbolt和WiFi等特性不斷推動(dòng)連接技術(shù)的演進(jìn),并與PC生態(tài)系統(tǒng)合作開(kāi)發(fā)突破性的PCI架構(gòu)、推出英特爾Evo平臺(tái),不斷拓展移動(dòng)設(shè)備的更多可能性。英特爾在推動(dòng)PC平臺(tái)創(chuàng)新方面擁有得天獨(dú)厚的優(yōu)勢(shì),旨在滿(mǎn)足全球商用用戶(hù)、消費(fèi)者、游戲玩家和內(nèi)容創(chuàng)作者對(duì)于算力日益增長(zhǎng)的需求?!?/p>
據(jù)英特爾表示,此次推出的英特爾銳炫3系列獨(dú)立顯卡能夠提供1 080 p主流游戲和內(nèi)容創(chuàng)作體驗(yàn)。在運(yùn)行多款熱門(mén)游戲時(shí),搭載銳炫A370M的筆記本電腦可以提供1 080 p 60 fps以上的畫(huà)質(zhì)。英特爾銳炫5系列和銳炫7系列均可提供領(lǐng)先的內(nèi)容創(chuàng)建性能,以及更強(qiáng)大的圖形與計(jì)算性能。與銳炫3系列相比,銳炫5系列和銳炫7系列內(nèi)置更多Xe內(nèi)核、更多光線(xiàn)追蹤單元和更高GDDR6顯存。
據(jù)悉,首款搭載英特爾銳炫3系列獨(dú)顯的筆記本電腦———三星Galaxy Book2 Pro已于海外市場(chǎng)上市,搭載銳炫5和銳炫7系列顯卡的筆記本以及面向臺(tái)式機(jī)的英特爾銳炫A系列顯卡的產(chǎn)品,預(yù)計(jì)在2022年夏天上市。
基于Xe HPG微架構(gòu)設(shè)計(jì)
搭載英特爾銳炫A系列獨(dú)立顯卡的產(chǎn)品均基于英特爾全新Xe HPG微架構(gòu)而打造,提供了出色的性能、能效和可擴(kuò)展性。Xe HPG微架構(gòu)包括了強(qiáng)大的AI引擎和支持下一代編解碼器標(biāo)準(zhǔn)的增強(qiáng)媒體引擎。除此以外,還有下一代Xe顯示引擎和新的圖形管線(xiàn),用來(lái)處理各種不同的顯示任務(wù)。
在Xe HPG微架構(gòu)里,每4個(gè)Xe內(nèi)核組成了一個(gè)渲染切片(Rendering Slice)。每一個(gè)Xe內(nèi)核中都配備了數(shù)量可觀的運(yùn)算單元,比如矢量引擎XVE,矩陣引擎XMX。此外Xe HPG也集成了其他主流的圖形技術(shù),比如網(wǎng)格著色,采樣器反饋等。Xe HPG架構(gòu)最大的特點(diǎn)就是靈活性,通過(guò)疊加渲染切片來(lái)構(gòu)建不同的SoC,最小兩個(gè),最大八個(gè)。這樣的結(jié)構(gòu)最主要的特點(diǎn)就是可擴(kuò)展性很強(qiáng),根據(jù)渲染切片數(shù)量的不同,可以打造更豐富的產(chǎn)品線(xiàn),為用戶(hù)提供更多選擇。
與上一代的Xe LP微架構(gòu)相比,Xe HPG微架構(gòu)的每瓦性能提升了1.5倍。此外,渲染切片還支持DX12 Ultimate,其中包括對(duì)所有圖形固定功能塊的改進(jìn),當(dāng)然還有支持微軟DXR和Vulkan RT的專(zhuān)用硬件光追單元。每個(gè)切片還配備了4個(gè)硬件光追加速器,用來(lái)支持實(shí)時(shí)的光線(xiàn)追蹤技術(shù),能夠顯著提升3A大作的游戲畫(huà)面和光影效果。
Xe Core核心方面,現(xiàn)在Xe內(nèi)核已經(jīng)取代了此前集成顯卡架構(gòu)中EU的概念,成為Xe HPG架構(gòu)中最基礎(chǔ)的執(zhí)行單元。它包括16個(gè)256位寬的SIMD矢量引擎,并為傳統(tǒng)圖形著色器執(zhí)行大部分的運(yùn)算。矢量引擎主要負(fù)責(zé)傳統(tǒng)圖像處理的計(jì)算任務(wù)。由于AI的算法核心幾乎完全圍繞著一系列大型的矩陣乘法和累加算法,在每個(gè)Xe內(nèi)核中構(gòu)建了專(zhuān)用的矩陣引擎,來(lái)進(jìn)行硬件加速。Xe內(nèi)核包含16個(gè)矩陣引擎,每個(gè)引擎都是1 024位寬。矩陣引擎就是為了加速AI運(yùn)算用的。為了滿(mǎn)足矩陣、矢量和光線(xiàn)追蹤單元的高帶寬需求,在每個(gè)Xe內(nèi)核中構(gòu)建了一個(gè)192 KB的大型本地內(nèi)存,它可以根據(jù)每個(gè)工作負(fù)載的需要在L1緩存和共享本地內(nèi)存(SLM)之間動(dòng)態(tài)分配。
其中矩陣引擎的一個(gè)主要應(yīng)用是在實(shí)時(shí)渲染過(guò)程中使用AI。這一算法稱(chēng)為XeSS,它是一種超級(jí)采樣技術(shù),與傳統(tǒng)的高分辨率渲染相比,可在游戲中提供更高的性能。它使用神經(jīng)網(wǎng)絡(luò)輔助運(yùn)動(dòng)矢量,從低分辨率渲染中生成精美的高分辨率圖像。英特爾還展示了14款支持XeSS技術(shù)的游戲,并表示未來(lái)將繼續(xù)深化與頂級(jí)游戲工作室的合作,以增加對(duì)這種強(qiáng)大并開(kāi)放的AI超分技術(shù)得到廣泛的使用,為游戲玩家提供更好的游戲體驗(yàn)。
2種不同的芯片設(shè)計(jì)
英特爾銳炫A系列獨(dú)立顯卡的芯片代號(hào)有2個(gè)———ACM-G10和ACM-G11。ACM-G10包含多達(dá)32個(gè)Xe內(nèi)核和光追單元,16 MB的L2緩存,256位GDDR6接口,16路PCIE4接口;ACM-G11包含多達(dá)8個(gè)Xe內(nèi)核和光追單元,4 MBL2緩存,96位顯存接口,8路PCIE4,2種芯片設(shè)計(jì)都包含2個(gè)Xe多功能編解碼引擎,和4路顯示輸出引擎。
在芯片設(shè)計(jì)中,頻率是必不可少的一個(gè)因素。但是,頻率的提升會(huì)要求電壓的升高,從而帶來(lái)功耗的增加。通過(guò)實(shí)時(shí)監(jiān)控獨(dú)立顯卡的性能指標(biāo),例如功耗,溫度和使用率,并且動(dòng)態(tài)調(diào)節(jié)時(shí)鐘頻率來(lái)與之適配。此外,在顯卡運(yùn)行各種不同負(fù)載的時(shí)候,或者運(yùn)行同一個(gè)負(fù)載但不同階段的時(shí)候,顯卡的占用率等指標(biāo)是不一樣的,從而時(shí)鐘頻率會(huì)在一個(gè)范圍內(nèi)動(dòng)態(tài)調(diào)整,而且這個(gè)范圍的分布也是有規(guī)律的,在分布內(nèi),一些接近中部的頻率出現(xiàn)的概率會(huì)高一些。
考慮到這種分布的情況,在制定獨(dú)立顯卡參數(shù)配置的時(shí)候,先標(biāo)定一個(gè)有代表性的負(fù)載,然后在這個(gè)負(fù)載運(yùn)行的時(shí)候,全程測(cè)量并統(tǒng)計(jì)時(shí)鐘頻率的分布,最終在整個(gè)負(fù)載完成后,把平均時(shí)鐘頻率作為參數(shù)配置中的定義。當(dāng)然,對(duì)于不同的平臺(tái),有著不同的TDP,即基于散熱的設(shè)計(jì)功耗。更寬松的TDP限制下,時(shí)鐘頻率的分布范圍也會(huì)整體提升。
英特爾銳炫A系列移動(dòng)端獨(dú)立顯卡
產(chǎn)品方面,英特爾銳炫A系列移動(dòng)端獨(dú)立顯卡首發(fā)2款型號(hào),包括針對(duì)超薄本設(shè)計(jì)的A350M以及為兼顧性能和輕薄而設(shè)計(jì)的A370M,搭載銳炫5和銳炫7系列的產(chǎn)品,會(huì)在2022年夏天面市。
A370M有8個(gè)Xe內(nèi)核和光追單元,64 bit位寬,時(shí)鐘頻率1550,4 GB顯存,功耗設(shè)計(jì)在35~50 w。A550M的Xe內(nèi)核數(shù)和顯存位寬等參數(shù)上,基本是A370M的2倍。銳炫7系列有A730M和A770M兩款產(chǎn)品,最高可達(dá)32Xe內(nèi)核,16 GB內(nèi)存,256 bit位寬。
英特爾銳炫A系列獨(dú)立顯卡均全面支持DirectX 12 Ultimate和領(lǐng)先的游戲技術(shù),例如硬件加速的光線(xiàn)追蹤和Xe超級(jí)采樣(XeSS),XeSS將在今夏發(fā)布,并有望得到超過(guò)20款游戲的支持。為了讓業(yè)內(nèi)更多軟件和硬件支持該技術(shù),英特爾計(jì)劃面向所有人開(kāi)放XeSS SDK和工具包。
性能
首先是與集顯對(duì)比,相對(duì)于第12代酷睿移動(dòng)處理器搭載的集顯,最多可達(dá)兩倍的性能提升。同時(shí)這些游戲都能在1 080 p 60 fps運(yùn)行,能給用戶(hù)不錯(cuò)的體驗(yàn)。
對(duì)比12代酷睿i7-1280P中集成的96個(gè)執(zhí)行單元、1 450 MHz頻率的銳炬Xe核顯,綜合游戲性能高出一倍左右。
在運(yùn)行包括《GTA V》、《堡壘之夜》等游戲時(shí),A370M顯卡能在1 080 p下達(dá)到90幀/秒,而且這是在開(kāi)了中等或者高畫(huà)質(zhì)下測(cè)量的結(jié)果。
內(nèi)容創(chuàng)作方面,相比第12代酷睿的集成顯卡,搭載A370M獨(dú)立顯卡的平臺(tái)在視頻編解碼方面,以Davinci為例,4K H.264轉(zhuǎn)H.265的性能可多達(dá)60 %的提升。而在AI相關(guān)功能上,例如Adobe PR里的兩個(gè)應(yīng)用場(chǎng)景,更是有翻倍的性能提升。
值得注意的是,性能的提升并不僅來(lái)自于獨(dú)立顯卡,同樣得益于基于整個(gè)系統(tǒng)的Deep Link技術(shù)的加持。Deep Link涵蓋了不同的技術(shù),例如:動(dòng)態(tài)功率共享,超級(jí)編碼和超級(jí)算力。
首先是動(dòng)態(tài)功率共享,該技術(shù)能在系統(tǒng)功耗的限制范圍內(nèi),盡可能最大化釋放CPU或GPU的性能。所有搭載英特爾12代酷睿和銳炫的筆記本電腦,都能啟用這項(xiàng)技術(shù)。
第二個(gè)是超級(jí)編碼技術(shù)。在之前的編解碼流程里,通常把編碼工作放在一個(gè)顯卡的編解碼器上,編碼效率成為了整個(gè)流程的性能瓶頸;而現(xiàn)在的筆記本系統(tǒng),例如搭載了12代酷睿處理器和銳炫A系列獨(dú)立顯卡的系統(tǒng),集成顯卡和獨(dú)立顯卡都有硬件編碼能力。所以超級(jí)編碼技術(shù),就是同時(shí)運(yùn)用2個(gè)顯卡的編解碼引擎,來(lái)大大提升編解碼效率。這種協(xié)作是通過(guò)OneVPL(一個(gè)跨平臺(tái)的開(kāi)放性框架)的API接口來(lái)實(shí)現(xiàn)的。當(dāng)超級(jí)編碼開(kāi)始工作時(shí),一組組解碼后的原始幀通過(guò)特定的API函數(shù)被交給oneVPL,進(jìn)而按組被分配到不同的多媒體引擎上,拷貝到相應(yīng)的內(nèi)存中緩存起來(lái)。不論每一組有多少幀,相應(yīng)的集顯或者獨(dú)顯的多媒體引擎會(huì)開(kāi)始按照設(shè)定的格式編碼。而OneVPL會(huì)完成后續(xù)的打包工作,把編碼后的幀一組組拼接成最終視頻來(lái)輸出。這種并行處理,編碼效率比單一顯卡提升非常顯著。
三是超級(jí)算力。每一個(gè)搭載英特爾銳炫獨(dú)立顯卡的筆記本,都可以從獨(dú)立顯卡的算力中獲益,但是不要忘記,英特爾CPU的集成顯卡中同樣也提供了計(jì)算引擎。為了把負(fù)載合理的分配給不同的計(jì)算引擎,就設(shè)計(jì)一個(gè)基于機(jī)器學(xué)習(xí)的服務(wù)———MLS。
MLS是OpenVino中的一個(gè)框架,把負(fù)載分配給不同的算力模塊。根據(jù)當(dāng)前應(yīng)用或負(fù)載的特征,例如延遲敏感度、吞吐量、性能要求、功率消耗等等。這些因素幫助MLS做出決策,把負(fù)載分配給獨(dú)立顯卡,集成顯卡,或者CPU。
舉個(gè)例子,當(dāng)想對(duì)一段視頻做處理,例如去噪點(diǎn)、超分、銳化等,導(dǎo)入畫(huà)面會(huì)逐幀傳遞給MLS框架,每一幀還會(huì)拆成若干塊,這些塊排在工作隊(duì)列里,MLS啟動(dòng)一個(gè)個(gè)工作線(xiàn)程,把這些塊根據(jù)需求自動(dòng)分配到不同的算力模塊中,一部分分配到集顯的計(jì)算引擎,一部分分配到獨(dú)顯的矩陣引擎。隨著顯卡完成當(dāng)前任務(wù),MLS會(huì)不斷派發(fā)新的任務(wù),直到最后完成所有塊的處理,打包這些增強(qiáng)后的畫(huà)面作為輸出。
正是因?yàn)槿翫eep Link技術(shù)的加持,在內(nèi)容創(chuàng)作上,動(dòng)態(tài)功率共享、超級(jí)編碼、超級(jí)算力可以分別帶來(lái)最多30%,60%,24%的性能提升。
Xe媒體引擎:提供最廣泛的編/解碼器首發(fā)支持AV1
媒體引擎方面,提供了對(duì)H.265 / HEVC、H.264 / MPEG-4/ AVC、VP9的支持,以及業(yè)界首個(gè)對(duì)AV1編碼和解碼的硬件加速支持。
開(kāi)放媒體聯(lián)盟主席Matt Frost先生指出,AV1的效率比最常見(jiàn)的編解碼器H.264高了50 %,比HEVC高了20 %,能夠以更低的帶寬和更小的文件大小提供更高的畫(huà)面質(zhì)量,而且它是開(kāi)放的且沒(méi)有版權(quán)費(fèi)。目前,F(xiàn)FMPEG、Handbrake、Adobe和XSplit都已經(jīng)集成了對(duì)銳炫AV1的支持。
Xe顯示引擎:加入全新Smooth(平滑同步)Sync
在顯示方面,Xe已經(jīng)支持HDMI 2.0b和DP1.4a的規(guī)格,游戲玩家可以享受高達(dá)1080p360Hz、或者4臺(tái)具有4k120Hz HDR的顯示器連接。
在同步技術(shù)方面,英特爾支持VESA標(biāo)準(zhǔn)的Adaptive Sync,可提供流暢的游戲而不會(huì)撕裂。此外還有Speed Sync可以適用于任何顯示器并解決不同的問(wèn)題。
此次全新推出的Smooth Sync技術(shù),運(yùn)用了模糊化2個(gè)撕裂幀之間的邊界,來(lái)減少視覺(jué)失真,使圖像看起來(lái)更加連貫。之后所有銳炫顯卡都會(huì)支持Smooth Sync功能。
產(chǎn)品上市與相關(guān)生態(tài)
無(wú)疑問(wèn),得益于Evo平臺(tái)更快的處理器速度、超長(zhǎng)的續(xù)航時(shí)間、輕薄便攜時(shí)尚的外觀設(shè)計(jì),很多OEM都將優(yōu)先推出銳炫配置在Evo設(shè)計(jì)上,在英特爾銳炫顯卡的加持下,將讓游戲和內(nèi)容創(chuàng)作在Evo平臺(tái)上有更好的使用體驗(yàn)。據(jù)英特爾介紹,從第二季度開(kāi)始,采用銳炫3系列的筆記本產(chǎn)品有望國(guó)內(nèi)面市,銳炫5和銳炫7系列的產(chǎn)品有望在今年夏天發(fā)布。
在此次英特爾銳炫A系列獨(dú)立顯卡的解析會(huì)上,英特爾還發(fā)布了新的顯卡控制界面———Arc Control英特爾銳炫控制面板。
Arc Control提供了一站式與銳炫顯卡相關(guān)的設(shè)定或者信息接收,包括可以讓用戶(hù)快速升級(jí)驅(qū)動(dòng),及時(shí)看到顯卡性能的工作負(fù)載、虛擬攝像頭設(shè)定、自動(dòng)生成游戲高光時(shí)刻、還有讓每個(gè)人都能成為像是專(zhuān)業(yè)主播一樣的軟件設(shè)定等。
目前,Arc Control控制面板已經(jīng)可以下載。需要注意的是,Arc Control控制面板適用于所有英特爾顯卡,也因此不只有英特爾的獨(dú)立顯卡能用,英特爾的集成顯卡也能用。值得一提的是,Arc Control控制面板不需要登錄,這一功能大大提升了用戶(hù)體驗(yàn)。
英特爾銳炫A系列移動(dòng)端獨(dú)立顯卡的推出,首先是進(jìn)一步完善了英特爾移動(dòng)平臺(tái),也為用戶(hù)和游戲玩家?guī)?lái)更多一項(xiàng)選擇。隨著相關(guān)產(chǎn)品的上市,相信可以緩解目前“一卡難求”的市場(chǎng)局面。對(duì)于另外2家顯卡廠商,到底是挑戰(zhàn),還是在競(jìng)爭(zhēng)中創(chuàng)新、進(jìn)步,那就敬請(qǐng)期待吧。