急速馳騁　十款ＧＤＤＲ５顯卡全接觸

2009-11-30 04:33:06望穿秋水

微型計算機(jī) 2009年19期

望穿秋水

如果說過去采用GDDR5顯存的顯卡還屈指可數(shù)的話，那么如今采用GDDR5顯存的顯卡已經(jīng)呈現(xiàn)遍地開花的局面——從AMD最高端的雙核心旗艦Radeon HD 4870x2，到主流的高端型號Radeon HD 4870，再到新近上市的中高端顯卡Radeon HD 4860，甚至主流的Radeon HD 4750都采用了GDDR5顯存。下面我們就帶大家一起來認(rèn)識GDDR5顯存。

一起來認(rèn)識GDDR5顯存

頻率是存儲器最為顯著的特征。目前GDDR3的數(shù)據(jù)傳輸頻率最高可以達(dá)到2600MHz，相比之下，目前GDDR5可以達(dá)到5000MHz。不過這依舊不是終點(diǎn)，GDDR5最高數(shù)據(jù)傳輸頻率將達(dá)到6000MHz。和之前幾代GDDR顯存一樣，GDDR5也是建立在多倍數(shù)據(jù)預(yù)取技術(shù)上的產(chǎn)品。根據(jù)顯存發(fā)展的歷史來看，GDDRl顯存采用2bit數(shù)據(jù)預(yù)取技術(shù)，GDDR2、GDDR3和GDDR4都采用了4bit數(shù)據(jù)預(yù)取技術(shù)，GDDR5正是新一代8bit數(shù)據(jù)取技術(shù)的產(chǎn)物，達(dá)到了令人驚異的高性能。

優(yōu)秀的雙總線設(shè)計——高速傳輸無憂

相比GDDR3采用的4bit預(yù)取數(shù)據(jù)而言，GDDR5的優(yōu)勢在于將預(yù)取數(shù)據(jù)增加到了8bit，因此GDDR5就能夠在同樣的物理時鐘頻率下達(dá)到更高的數(shù)據(jù)傳輸速度。不僅如此，GDDR5顯存采用了雙數(shù)據(jù)總線，能夠同時在數(shù)據(jù)總線的上升和下降階段傳輸數(shù)據(jù)。同時，每條總線都獨(dú)立配備了完整的DBI，可以獨(dú)立傳輸、校驗(yàn)數(shù)據(jù)，是完整的雙總線規(guī)格。以往單數(shù)據(jù)總線的GDDR2、GDDR3等顯存標(biāo)稱頻率是等效工作頻率的1／2(比如標(biāo)稱頻率為900MHz的GDDR3顯存，等效工作頻率為1800MHz)，而GDDR5顯存由于雙總線技術(shù)的存在，每條總線都可以在上升和下降階段傳輸數(shù)據(jù)，因此標(biāo)稱頻率是等效工作頻率的1／4。以4000MHz等效工作頻率的GDDR5顯存為例，它的標(biāo)稱頻率為1000MHz。由于采用了8bit的預(yù)取技術(shù)，因此它的實(shí)際物理運(yùn)行頻率為125MHz。

穩(wěn)定+節(jié)能，其實(shí)很簡單——Data eye optimization數(shù)據(jù)核心優(yōu)化

對于數(shù)據(jù)的優(yōu)化是存儲器最為重要的方面，GDDR5重點(diǎn)采用了四項技術(shù)來保證數(shù)據(jù)的穩(wěn)定性和安全性。Data／address bit inversion，即數(shù)據(jù)／地址位反演是指在傳輸過程中，數(shù)據(jù)或者地址位內(nèi)的信鼠被按照一定的規(guī)則做了反演處理。數(shù)據(jù)／地址位反演技術(shù)的作用在于有效地改善了噪音對數(shù)據(jù)信號的影響，保證了數(shù)據(jù)在傳輸和存儲過程中的穩(wěn)定性。不難看出，數(shù)據(jù)／地址位反演技術(shù)是GDDR5在傳輸中最重要的處理技術(shù)，也是降低功耗和提高數(shù)據(jù)穩(wěn)定性的首要法寶。

除了數(shù)據(jù)／地址位反演技術(shù)外，三項動態(tài)調(diào)節(jié)技術(shù)：a djustable driverstrengths、adiustable voltages和adjustable terminations也是GDDR5數(shù)據(jù)核心優(yōu)化的重要組成部分。它們分別針對驅(qū)動器、電壓和終止裝置進(jìn)行自動調(diào)節(jié)。在傳統(tǒng)的顯存數(shù)據(jù)傳輸過程中，由于顯存并行傳輸?shù)奶匦裕瑢€長和外界干擾有著嚴(yán)格的規(guī)定。因此我們常常在顯存周圍看到大量的密密麻麻的終結(jié)電阻(減少反射損耗)等元件，顯卡不得不在顯存周圍采用蛇形走線來盡可能做到信號線等長。但在GDDR5上這些嚴(yán)格的要求被弱化了GDDR5自帶的調(diào)節(jié)系統(tǒng)可以在一定范圍內(nèi)保證數(shù)據(jù)信號在高速運(yùn)行時不出錯，甚至信號線都可以不用嚴(yán)格等長。除了更寬松的信號傳輸空間外，GDDR5對電壓和溫度的動態(tài)調(diào)節(jié)和實(shí)時監(jiān)控，也使得整個信號在傳輸過程中的安全性更高。另外，工程人員可以在BIOS中寫入設(shè)定好的調(diào)整信息，避免在PCB已經(jīng)正式出樣(1ayout)之后由于信號穩(wěn)定性問題導(dǎo)致返工。

安全+自由，放心傳數(shù)據(jù)——Adaptive interface timing時鐘自適應(yīng)技術(shù)

信號線和時鐘穩(wěn)定性是高速顯存設(shè)計中最重要的部分。GDDR5顯存擁有多達(dá)5條需要校準(zhǔn)的時鐘信號，分別是Clock，Command Clock，ADDR、Write Clock、DATA Clock時鐘信號。在高速運(yùn)行的情況下(諸如高達(dá)2GHz)，任何一點(diǎn)微小的差距都會帶來整個系統(tǒng)的數(shù)據(jù)錯誤、崩潰。因此，GDDR5在時序自動校準(zhǔn)、自適應(yīng)技術(shù)上已經(jīng)有了一套非常完整的方案，能夠帶來非常高的數(shù)據(jù)運(yùn)行效率。

首先，GDDR5會要求地址時鐘和總線時鐘(ADDR和CK)進(jìn)行對照并對齊。實(shí)際上這是在進(jìn)行一次芯片的初始化，在此階段控制器可以找到最佳的相位設(shè)置。接下來就需要校準(zhǔn)Write Clock(WCK)和基準(zhǔn)Clock(CK#)之間的數(shù)據(jù)，這個過程被稱為“WCK-to—CK”。在這個過程中，控制器可以找出WCK和CK#之間相位的差距，是“早”還是“遲”，然后為每一個DRAM給出相應(yīng)的調(diào)節(jié)數(shù)據(jù)。最后，控制器會調(diào)整數(shù)據(jù)總線(DATA和WCK)。由于數(shù)據(jù)總線DATA的頻率是WCK寫入時鐘的2倍，因此每次校準(zhǔn)會涉及到兩個字節(jié)。GDDR5的這種校準(zhǔn)方法，使得整個數(shù)據(jù)線環(huán)環(huán)相扣，降低了由于時鐘不同步帶來的數(shù)據(jù)錯誤或系統(tǒng)延遲，也在很大程度上降低了PCB設(shè)計的難度。由于有內(nèi)部校準(zhǔn)機(jī)制的存在，工程師們在PCB布線的一致性方面就有了更寬松的空間，這讓整個PCB的布線更為自由和寬松。

另外，更為自由的數(shù)據(jù)預(yù)取技術(shù)也讓GDDR5在圖形應(yīng)用中充滿了優(yōu)勢。在圖形計算中存在大量密集而微小的數(shù)據(jù)，這些數(shù)據(jù)甚至?xí)∮贕DDR5每次預(yù)取的最低數(shù)據(jù)。如果采用固定的預(yù)取值的設(shè)計方法，即每次無論數(shù)據(jù)大小(甚至使用空位)都一定要完全占據(jù)傳輸總線，無疑會耗費(fèi)很多能量。因此，GDDR5允許小于預(yù)取數(shù)量的數(shù)據(jù)傳輸，即采用低預(yù)取方式。這種靈活的設(shè)計，讓GDDR5在傳輸大量小數(shù)據(jù)量運(yùn)作時，功耗有明顯的降低。

糾錯+校驗(yàn)，完美保傳輸——Error compensation誤差補(bǔ)償技術(shù)

由于電磁環(huán)境或者傳輸中溫度、電壓等復(fù)雜因素的影響，顯存在數(shù)據(jù)傳輸和存儲過程中可能會產(chǎn)生少量的錯誤一個簡單的顯存數(shù)據(jù)錯誤除了導(dǎo)致渲染失敗以外，還可能導(dǎo)致顯卡徹底失去響應(yīng)、藍(lán)屏和系統(tǒng)崩潰等嚴(yán)重問題。因此對錯誤數(shù)據(jù)的校驗(yàn)和補(bǔ)償，成為GDDR5瞄準(zhǔn)的又一個重要目標(biāo)。

GDDR5的數(shù)據(jù)校驗(yàn)采用了CRC(Cyele Redundancy Check循環(huán)冗余校驗(yàn))方式。CRC校驗(yàn)是建立在GDDR5的DATA I／O和DBI的基礎(chǔ)上，如果出現(xiàn)錯誤，則觸發(fā)數(shù)據(jù)傳輸總線，然后快速重新讀取數(shù)據(jù)，或者利用如DataMask(數(shù)據(jù)掩蔽)等功能修改數(shù)據(jù)并重新傳輸。這種校驗(yàn)方式的優(yōu)勢在于能夠100％檢測出所有單、雙數(shù)據(jù)誤差。

Data Mask(數(shù)據(jù)掩蔽)是這樣一項技術(shù)：GDDR5顯存在每次讀寫數(shù)據(jù)時，并不是改寫所有的數(shù)據(jù)，大部分?jǐn)?shù)據(jù)都不需要修改。因此GDDR5利用地址總線對一部分?jǐn)?shù)據(jù)進(jìn)行掩蔽，在T--

次數(shù)據(jù)讀寫到來時，僅僅對沒有掩蔽的數(shù)據(jù)進(jìn)行更改。這樣就能在最快的時間內(nèi)完成數(shù)據(jù)讀寫。

究竟有多快——GDDR5顯存性能測試

為了進(jìn)一步驗(yàn)證GDDR5顯存究竟能為顯卡帶來多大的性能提升，我們將通過測試得出結(jié)論。由于Radeon HD 4870和Radeon HD 4850采用的都是RV770核心，在諸如流處理器、紋理單元等主要硬件規(guī)格上都是一致的。它們的主要區(qū)別是核心頻率和搭載的顯存類型——Radeon HD 4870的核心頻率更高，搭載GDDR5顯存，顯存頻率也很高；而Radeon HD 4850的核心頻率較低，搭載GDDK3顯存，顯存頻率也較低。因此我們利用第三方軟件統(tǒng)一將Radeon HD 4870和Radeon HD4850的核心頻率調(diào)到一致，以便通過游戲測試來檢驗(yàn)GDDR5顯存究竟能幫助Radeon HD 4870提升多少性能。具體的領(lǐng)先幅度可以通過RadeonHD 4870領(lǐng)先Radeon HD 4850的百分比得出。此時，Radeon HD 4870和Radeon HD 4850不同之處就是顯存頻率和顯存帶寬，前者的顯存帶寬為3600MHzx256bit÷8=115.2GB／s，后者的顯存帶寬為1986MHz×256bit÷8=63.5GB／s，幾乎相差一倍。為了不使CPU成為測試瓶頸，我們使用英特爾Core i7 920平臺。具體測試軟件使用3DMarkVantage以及主流的3D游戲。

領(lǐng)先幅度達(dá)到10％左右

從測試來看，搭載了GDDR5顯存的Radeon HD 4870的3D性能在3DMarkVantage的測試中領(lǐng)先Radeon HD 4850 8％左右，而在孤島危機(jī)等游戲的測試中，領(lǐng)先幅度更是達(dá)到了10％以上。值得一提的是，在高分辨率、開啟了全屏抗鋸齒后，Radeon HD 4870的高顯存帶寬優(yōu)勢進(jìn)一步發(fā)揮了作用，3D性能領(lǐng)先Radeon HD 4850 15％以上。這也進(jìn)一步說明了顯存帶寬在高分辨率、開啟全屏抗鋸齒后的重要性。

總結(jié)：GDDR5顯存或?qū)⒊蔀橹髁?/p>

和GDDR3顯存相比，GDDR5顯存在數(shù)據(jù)傳輸頻率以及帶寬上有無可比擬的優(yōu)勢。更高的數(shù)據(jù)傳輸頻率，可以有效降低顯卡在數(shù)據(jù)傳輸時的瓶頸，提升顯卡性能，甚至降低PCB布線難度。如果用簡單的數(shù)據(jù)來表述的話，256bit顯存位寬的Radeon HD 4850顯卡，采用1 986MHz的GDDR3顯存，顯存帶寬為63.5GB／s；而采用GDDR5顯存的Radeon HD 4870顯卡，在256bit位寬下，Radeon HD 4870利用數(shù)據(jù)傳輸頻率高達(dá)3600MHz的GDDR5顯存，顯存帶寬輕松突破115.2GB／s，遠(yuǎn)遠(yuǎn)超過RadeonHD4850。

除了高數(shù)據(jù)帶寬帶來的誘惑外，GDDR5的強(qiáng)大性能可以讓采用128bit顯存位寬的中端顯卡煥發(fā)活力，比如Radeon HD 4770和Radeon HD 4860。它們都采用GDDR5顯存來達(dá)到以往中高端甚至高端顯卡才可企及的顯存帶寬。Radeon HD 4770在128bit顯存位寬下采用數(shù)據(jù)傳輸頻率為3600MHz的GDDR5顯存，顯存帶寬為57.6GB／s——這也是256bit位寬下1800MHzGDDR3顯存的帶寬成績。因此我們看到Radeon HD 4770甚至Radeon HD4750在大部分測試環(huán)境下的3D性能比采用256-bit／GDDR3顯存的RadeonHD 4830還要好，足見GDDR5顯存帶來的性能提升。同時，更低的顯存位寬會讓顯存布線更容易，降低了PCB設(shè)計的難度，甚至僅僅需要四層PCB就可以完成制造——這無疑對降低顯卡整體售價和提升產(chǎn)品競爭力有明顯幫助。

另一方面，GDDR5顯存還有不錯的超頻性能。以主流的奇夢達(dá)“-40X”GDDR5顯存為例，它的額定頻率為4000MHz。但在不少環(huán)境中，它可以被超頻至4800MHz，超頻幅度達(dá)到了20％。

不過，我們也必須清醒地意識到高顯存帶寬對顯卡3D性能的影響是有限的。例如本文Radeon HD 4870和Radeon HD 4850的測試，前者的顯存帶寬幾乎是后者的一倍，但最終帶來的性能提升也只有15％左右?？梢赃@么認(rèn)為，高顯存帶寬是讓顯卡3D性能更上一層樓的助推劑，但如果要讓3D性能翻番，仍然需要借助全新的GPU和更先進(jìn)的核心架構(gòu)。

急速馳騁 十款ＧＤＤＲ５顯卡全接觸

急速馳騁　十款ＧＤＤＲ５顯卡全接觸