• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      急速馳騁 十款GDDR5顯卡全接觸

      2009-11-30 04:33:06望穿秋水
      微型計算機(jī) 2009年19期
      關(guān)鍵詞:校驗(yàn)時鐘總線

      望穿秋水

      如果說過去采用GDDR5顯存的顯卡還屈指可數(shù)的話,那么如今采用GDDR5顯存的顯卡已經(jīng)呈現(xiàn)遍地開花的局面——從AMD最高端的雙核心旗艦Radeon HD 4870x2,到主流的高端型號Radeon HD 4870,再到新近上市的中高端顯卡Radeon HD 4860,甚至主流的Radeon HD 4750都采用了GDDR5顯存。下面我們就帶大家一起來認(rèn)識GDDR5顯存。

      一起來認(rèn)識GDDR5顯存

      頻率是存儲器最為顯著的特征。目前GDDR3的數(shù)據(jù)傳輸頻率最高可以達(dá)到2600MHz,相比之下,目前GDDR5可以達(dá)到5000MHz。不過這依舊不是終點(diǎn),GDDR5最高數(shù)據(jù)傳輸頻率將達(dá)到6000MHz。和之前幾代GDDR顯存一樣,GDDR5也是建立在多倍數(shù)據(jù)預(yù)取技術(shù)上的產(chǎn)品。根據(jù)顯存發(fā)展的歷史來看,GDDRl顯存采用2bit數(shù)據(jù)預(yù)取技術(shù),GDDR2、GDDR3和GDDR4都采用了4bit數(shù)據(jù)預(yù)取技術(shù),GDDR5正是新一代8bit數(shù)據(jù)取技術(shù)的產(chǎn)物,達(dá)到了令人驚異的高性能。

      優(yōu)秀的雙總線設(shè)計——高速傳輸無憂

      相比GDDR3采用的4bit預(yù)取數(shù)據(jù)而言,GDDR5的優(yōu)勢在于將預(yù)取數(shù)據(jù)增加到了8bit,因此GDDR5就能夠在同樣的物理時鐘頻率下達(dá)到更高的數(shù)據(jù)傳輸速度。不僅如此,GDDR5顯存采用了雙數(shù)據(jù)總線,能夠同時在數(shù)據(jù)總線的上升和下降階段傳輸數(shù)據(jù)。同時,每條總線都獨(dú)立配備了完整的DBI,可以獨(dú)立傳輸、校驗(yàn)數(shù)據(jù),是完整的雙總線規(guī)格。以往單數(shù)據(jù)總線的GDDR2、GDDR3等顯存標(biāo)稱頻率是等效工作頻率的1/2(比如標(biāo)稱頻率為900MHz的GDDR3顯存,等效工作頻率為1800MHz),而GDDR5顯存由于雙總線技術(shù)的存在,每條總線都可以在上升和下降階段傳輸數(shù)據(jù),因此標(biāo)稱頻率是等效工作頻率的1/4。以4000MHz等效工作頻率的GDDR5顯存為例,它的標(biāo)稱頻率為1000MHz。由于采用了8bit的預(yù)取技術(shù),因此它的實(shí)際物理運(yùn)行頻率為125MHz。

      穩(wěn)定+節(jié)能,其實(shí)很簡單——Data eye optimization數(shù)據(jù)核心優(yōu)化

      對于數(shù)據(jù)的優(yōu)化是存儲器最為重要的方面,GDDR5重點(diǎn)采用了四項技術(shù)來保證數(shù)據(jù)的穩(wěn)定性和安全性。Data/address bit inversion,即數(shù)據(jù)/地址位反演是指在傳輸過程中,數(shù)據(jù)或者地址位內(nèi)的信鼠被按照一定的規(guī)則做了反演處理。數(shù)據(jù)/地址位反演技術(shù)的作用在于有效地改善了噪音對數(shù)據(jù)信號的影響,保證了數(shù)據(jù)在傳輸和存儲過程中的穩(wěn)定性。不難看出,數(shù)據(jù)/地址位反演技術(shù)是GDDR5在傳輸中最重要的處理技術(shù),也是降低功耗和提高數(shù)據(jù)穩(wěn)定性的首要法寶。

      除了數(shù)據(jù)/地址位反演技術(shù)外,三項動態(tài)調(diào)節(jié)技術(shù):a djustable driverstrengths、adiustable voltages和adjustable terminations也是GDDR5數(shù)據(jù)核心優(yōu)化的重要組成部分。它們分別針對驅(qū)動器、電壓和終止裝置進(jìn)行自動調(diào)節(jié)。在傳統(tǒng)的顯存數(shù)據(jù)傳輸過程中,由于顯存并行傳輸?shù)奶匦裕瑢€長和外界干擾有著嚴(yán)格的規(guī)定。因此我們常常在顯存周圍看到大量的密密麻麻的終結(jié)電阻(減少反射損耗)等元件,顯卡不得不在顯存周圍采用蛇形走線來盡可能做到信號線等長。但在GDDR5上這些嚴(yán)格的要求被弱化了GDDR5自帶的調(diào)節(jié)系統(tǒng)可以在一定范圍內(nèi)保證數(shù)據(jù)信號在高速運(yùn)行時不出錯,甚至信號線都可以不用嚴(yán)格等長。除了更寬松的信號傳輸空間外,GDDR5對電壓和溫度的動態(tài)調(diào)節(jié)和實(shí)時監(jiān)控,也使得整個信號在傳輸過程中的安全性更高。另外,工程人員可以在BIOS中寫入設(shè)定好的調(diào)整信息,避免在PCB已經(jīng)正式出樣(1ayout)之后由于信號穩(wěn)定性問題導(dǎo)致返工。

      安全+自由,放心傳數(shù)據(jù)——Adaptive interface timing時鐘自適應(yīng)技術(shù)

      信號線和時鐘穩(wěn)定性是高速顯存設(shè)計中最重要的部分。GDDR5顯存擁有多達(dá)5條需要校準(zhǔn)的時鐘信號,分別是Clock,Command Clock,ADDR、Write Clock、DATA Clock時鐘信號。在高速運(yùn)行的情況下(諸如高達(dá)2GHz),任何一點(diǎn)微小的差距都會帶來整個系統(tǒng)的數(shù)據(jù)錯誤、崩潰。因此,GDDR5在時序自動校準(zhǔn)、自適應(yīng)技術(shù)上已經(jīng)有了一套非常完整的方案,能夠帶來非常高的數(shù)據(jù)運(yùn)行效率。

      首先,GDDR5會要求地址時鐘和總線時鐘(ADDR和CK)進(jìn)行對照并對齊。實(shí)際上這是在進(jìn)行一次芯片的初始化,在此階段控制器可以找到最佳的相位設(shè)置。接下來就需要校準(zhǔn)Write Clock(WCK)和基準(zhǔn)Clock(CK#)之間的數(shù)據(jù),這個過程被稱為“WCK-to—CK”。在這個過程中,控制器可以找出WCK和CK#之間相位的差距,是“早”還是“遲”,然后為每一個DRAM給出相應(yīng)的調(diào)節(jié)數(shù)據(jù)。最后,控制器會調(diào)整數(shù)據(jù)總線(DATA和WCK)。由于數(shù)據(jù)總線DATA的頻率是WCK寫入時鐘的2倍,因此每次校準(zhǔn)會涉及到兩個字節(jié)。GDDR5的這種校準(zhǔn)方法,使得整個數(shù)據(jù)線環(huán)環(huán)相扣,降低了由于時鐘不同步帶來的數(shù)據(jù)錯誤或系統(tǒng)延遲,也在很大程度上降低了PCB設(shè)計的難度。由于有內(nèi)部校準(zhǔn)機(jī)制的存在,工程師們在PCB布線的一致性方面就有了更寬松的空間,這讓整個PCB的布線更為自由和寬松。

      另外,更為自由的數(shù)據(jù)預(yù)取技術(shù)也讓GDDR5在圖形應(yīng)用中充滿了優(yōu)勢。在圖形計算中存在大量密集而微小的數(shù)據(jù),這些數(shù)據(jù)甚至?xí)∮贕DDR5每次預(yù)取的最低數(shù)據(jù)。如果采用固定的預(yù)取值的設(shè)計方法,即每次無論數(shù)據(jù)大小(甚至使用空位)都一定要完全占據(jù)傳輸總線,無疑會耗費(fèi)很多能量。因此,GDDR5允許小于預(yù)取數(shù)量的數(shù)據(jù)傳輸,即采用低預(yù)取方式。這種靈活的設(shè)計,讓GDDR5在傳輸大量小數(shù)據(jù)量運(yùn)作時,功耗有明顯的降低。

      糾錯+校驗(yàn),完美保傳輸——Error compensation誤差補(bǔ)償技術(shù)

      由于電磁環(huán)境或者傳輸中溫度、電壓等復(fù)雜因素的影響,顯存在數(shù)據(jù)傳輸和存儲過程中可能會產(chǎn)生少量的錯誤一個簡單的顯存數(shù)據(jù)錯誤除了導(dǎo)致渲染失敗以外,還可能導(dǎo)致顯卡徹底失去響應(yīng)、藍(lán)屏和系統(tǒng)崩潰等嚴(yán)重問題。因此對錯誤數(shù)據(jù)的校驗(yàn)和補(bǔ)償,成為GDDR5瞄準(zhǔn)的又一個重要目標(biāo)。

      GDDR5的數(shù)據(jù)校驗(yàn)采用了CRC(Cyele Redundancy Check循環(huán)冗余校驗(yàn))方式。CRC校驗(yàn)是建立在GDDR5的DATA I/O和DBI的基礎(chǔ)上,如果出現(xiàn)錯誤,則觸發(fā)數(shù)據(jù)傳輸總線,然后快速重新讀取數(shù)據(jù),或者利用如DataMask(數(shù)據(jù)掩蔽)等功能修改數(shù)據(jù)并重新傳輸。這種校驗(yàn)方式的優(yōu)勢在于能夠100%檢測出所有單、雙數(shù)據(jù)誤差。

      Data Mask(數(shù)據(jù)掩蔽)是這樣一項技術(shù):GDDR5顯存在每次讀寫數(shù)據(jù)時,并不是改寫所有的數(shù)據(jù),大部分?jǐn)?shù)據(jù)都不需要修改。因此GDDR5利用地址總線對一部分?jǐn)?shù)據(jù)進(jìn)行掩蔽,在T--

      次數(shù)據(jù)讀寫到來時,僅僅對沒有掩蔽的數(shù)據(jù)進(jìn)行更改。這樣就能在最快的時間內(nèi)完成數(shù)據(jù)讀寫。

      究竟有多快——GDDR5顯存性能測試

      為了進(jìn)一步驗(yàn)證GDDR5顯存究竟能為顯卡帶來多大的性能提升,我們將通過測試得出結(jié)論。由于Radeon HD 4870和Radeon HD 4850采用的都是RV770核心,在諸如流處理器、紋理單元等主要硬件規(guī)格上都是一致的。它們的主要區(qū)別是核心頻率和搭載的顯存類型——Radeon HD 4870的核心頻率更高,搭載GDDR5顯存,顯存頻率也很高;而Radeon HD 4850的核心頻率較低,搭載GDDK3顯存,顯存頻率也較低。因此我們利用第三方軟件統(tǒng)一將Radeon HD 4870和Radeon HD4850的核心頻率調(diào)到一致,以便通過游戲測試來檢驗(yàn)GDDR5顯存究竟能幫助Radeon HD 4870提升多少性能。具體的領(lǐng)先幅度可以通過RadeonHD 4870領(lǐng)先Radeon HD 4850的百分比得出。此時,Radeon HD 4870和Radeon HD 4850不同之處就是顯存頻率和顯存帶寬,前者的顯存帶寬為3600MHzx256bit÷8=115.2GB/s,后者的顯存帶寬為1986MHz×256bit÷8=63.5GB/s,幾乎相差一倍。為了不使CPU成為測試瓶頸,我們使用英特爾Core i7 920平臺。具體測試軟件使用3DMarkVantage以及主流的3D游戲。

      領(lǐng)先幅度達(dá)到10%左右

      從測試來看,搭載了GDDR5顯存的Radeon HD 4870的3D性能在3DMarkVantage的測試中領(lǐng)先Radeon HD 4850 8%左右,而在孤島危機(jī)等游戲的測試中,領(lǐng)先幅度更是達(dá)到了10%以上。值得一提的是,在高分辨率、開啟了全屏抗鋸齒后,Radeon HD 4870的高顯存帶寬優(yōu)勢進(jìn)一步發(fā)揮了作用,3D性能領(lǐng)先Radeon HD 4850 15%以上。這也進(jìn)一步說明了顯存帶寬在高分辨率、開啟全屏抗鋸齒后的重要性。

      總結(jié):GDDR5顯存或?qū)⒊蔀橹髁?/p>

      和GDDR3顯存相比,GDDR5顯存在數(shù)據(jù)傳輸頻率以及帶寬上有無可比擬的優(yōu)勢。更高的數(shù)據(jù)傳輸頻率,可以有效降低顯卡在數(shù)據(jù)傳輸時的瓶頸,提升顯卡性能,甚至降低PCB布線難度。如果用簡單的數(shù)據(jù)來表述的話,256bit顯存位寬的Radeon HD 4850顯卡,采用1 986MHz的GDDR3顯存,顯存帶寬為63.5GB/s;而采用GDDR5顯存的Radeon HD 4870顯卡,在256bit位寬下,Radeon HD 4870利用數(shù)據(jù)傳輸頻率高達(dá)3600MHz的GDDR5顯存,顯存帶寬輕松突破115.2GB/s,遠(yuǎn)遠(yuǎn)超過RadeonHD4850。

      除了高數(shù)據(jù)帶寬帶來的誘惑外,GDDR5的強(qiáng)大性能可以讓采用128bit顯存位寬的中端顯卡煥發(fā)活力,比如Radeon HD 4770和Radeon HD 4860。它們都采用GDDR5顯存來達(dá)到以往中高端甚至高端顯卡才可企及的顯存帶寬。Radeon HD 4770在128bit顯存位寬下采用數(shù)據(jù)傳輸頻率為3600MHz的GDDR5顯存,顯存帶寬為57.6GB/s——這也是256bit位寬下1800MHzGDDR3顯存的帶寬成績。因此我們看到Radeon HD 4770甚至Radeon HD4750在大部分測試環(huán)境下的3D性能比采用256-bit/GDDR3顯存的RadeonHD 4830還要好,足見GDDR5顯存帶來的性能提升。同時,更低的顯存位寬會讓顯存布線更容易,降低了PCB設(shè)計的難度,甚至僅僅需要四層PCB就可以完成制造——這無疑對降低顯卡整體售價和提升產(chǎn)品競爭力有明顯幫助。

      另一方面,GDDR5顯存還有不錯的超頻性能。以主流的奇夢達(dá)“-40X”GDDR5顯存為例,它的額定頻率為4000MHz。但在不少環(huán)境中,它可以被超頻至4800MHz,超頻幅度達(dá)到了20%。

      不過,我們也必須清醒地意識到高顯存帶寬對顯卡3D性能的影響是有限的。例如本文Radeon HD 4870和Radeon HD 4850的測試,前者的顯存帶寬幾乎是后者的一倍,但最終帶來的性能提升也只有15%左右??梢赃@么認(rèn)為,高顯存帶寬是讓顯卡3D性能更上一層樓的助推劑,但如果要讓3D性能翻番,仍然需要借助全新的GPU和更先進(jìn)的核心架構(gòu)。

      猜你喜歡
      校驗(yàn)時鐘總線
      別樣的“時鐘”
      古代的時鐘
      基于PCI Express總線的xHC與FPGA的直接通信
      機(jī)載飛控1553B總線轉(zhuǎn)以太網(wǎng)總線設(shè)計
      爐溫均勻性校驗(yàn)在鑄鍛企業(yè)的應(yīng)用
      有趣的時鐘
      時鐘會開“花”
      大型電動機(jī)高阻抗差動保護(hù)穩(wěn)定校驗(yàn)研究
      電測與儀表(2015年1期)2015-04-09 12:03:02
      基于加窗插值FFT的PMU校驗(yàn)方法
      鍋爐安全閥在線校驗(yàn)不確定度評定
      晋宁县| 梅河口市| 胶南市| 永宁县| 双江| 乌拉特中旗| 安吉县| 郯城县| 安岳县| 吴忠市| 正安县| 平湖市| 本溪| 木里| 弥渡县| 永寿县| 宁强县| 安岳县| 金湖县| 呼伦贝尔市| 太和县| 闽清县| 梨树县| 延边| 阜阳市| 凤冈县| 武穴市| 浏阳市| 凯里市| 西林县| 江油市| 南川市| 从化市| 郴州市| 永修县| 墨江| 公安县| 黑河市| 宁明县| 含山县| 乐至县|