董宇
[摘要]隨著科學(xué)技術(shù)的發(fā)展,計(jì)算機(jī)技術(shù)更是突飛猛進(jìn),嵌入式系統(tǒng)的應(yīng)用也越來越廣泛。截至目前,各種處理器不斷的出現(xiàn),為計(jì)算機(jī)技術(shù)提供了高效、科學(xué)、安全、穩(wěn)定的運(yùn)行基礎(chǔ)上,也形成了一套綜合、系統(tǒng)的管理流程和管理模式,這也是當(dāng)前業(yè)內(nèi)人士研究的重點(diǎn)目前,以向量處理器為主的微型處理結(jié)構(gòu)應(yīng)用日益廣泛,其向量數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)的設(shè)計(jì)也成為相關(guān)人員研究的要點(diǎn)本文就多現(xiàn)場(chǎng)向量處理器中向量數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)的設(shè)計(jì)與實(shí)現(xiàn)提出了探討,以供相關(guān)工作人員參考。
[關(guān)鍵詞]多線程;處理器;計(jì)算機(jī)技術(shù);訪存款帶
[中圖分類號(hào)]F224.39 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1672-5158(2013)06-0053-01
多線程和向量技術(shù)是當(dāng)前計(jì)算機(jī)技術(shù)發(fā)展的一個(gè)重要的趨勢(shì),也是現(xiàn)代化社會(huì)發(fā)展中研究最多的處理器設(shè)計(jì)要點(diǎn)。這種設(shè)計(jì)工作中,是通過提出一個(gè)多現(xiàn)場(chǎng)向量處理其設(shè)計(jì)要點(diǎn)為基礎(chǔ),利用多線程切換數(shù)據(jù)的方式來隱藏訪存延遲現(xiàn)象的出現(xiàn),并使得向量數(shù)據(jù)在運(yùn)行中能夠直接訪問到二級(jí)cache從而提高寬帶運(yùn)行效率的一種結(jié)構(gòu)。基于這些優(yōu)勢(shì),因此在目前的向量處理器工作中,這些技術(shù)的應(yīng)用較為常見,也是實(shí)現(xiàn)現(xiàn)代化計(jì)算機(jī)技術(shù)發(fā)展的核心內(nèi)容。
一、向量處理器與多線程技術(shù)分析
在目前的社會(huì)發(fā)展中,多線程技術(shù)和向量技術(shù)一直深受著業(yè)內(nèi)人士的關(guān)注,是處理器結(jié)構(gòu)體系中結(jié)構(gòu)和編程模式的技術(shù)要點(diǎn),其在整個(gè)處理器發(fā)展中扮演著重要的角色。
1、向量處理器分析
向量處理器也被人們廣泛的稱之為陣列式處理器,是在工作中能夠同步進(jìn)行多種數(shù)據(jù)綜合處理和運(yùn)算操作的一種復(fù)雜的計(jì)算機(jī)結(jié)構(gòu)。然而截至目前的社會(huì)發(fā)展中,多數(shù)計(jì)算機(jī)組裝中都仍然是采用純良處理器為主,這種處理器在應(yīng)用中只能夠一次處理一個(gè)要素,而無法對(duì)多套數(shù)據(jù)進(jìn)行處理和歸納。向量處理器的出現(xiàn)使得計(jì)算機(jī)領(lǐng)域發(fā)生了翻天覆地的變化,它的出現(xiàn)使得整個(gè)計(jì)算機(jī)結(jié)構(gòu)、構(gòu)成和功能發(fā)生了重大變化,尤其是在上個(gè)世紀(jì)八十年代至九十年代著一段時(shí)期內(nèi),其更是成為各種超級(jí)計(jì)算機(jī)運(yùn)行和主要基礎(chǔ)。當(dāng)今社會(huì)中,大多數(shù)的商業(yè)處理器仍然是以向量處理器為主的,已成為整個(gè)社會(huì)領(lǐng)域中最為常見的一項(xiàng)。
2、多線程技術(shù)分析
所謂的多線程技術(shù)主要指的是多個(gè)線程能夠同時(shí)、并發(fā)運(yùn)行的一項(xiàng)綜合性技術(shù)體系,具有多線程能力的計(jì)算機(jī)因?yàn)橛兄亟M的硬件和軟件系統(tǒng)的支撐能夠在同一時(shí)間運(yùn)行多個(gè)不同的軟件和線程,進(jìn)而提高了計(jì)算機(jī)的處理效率和處理質(zhì)量,同時(shí)從整體上提升了計(jì)算機(jī)技術(shù)的應(yīng)用優(yōu)勢(shì)。截至目前,我們?cè)诠ぷ髦锌梢詫⒍嗑€程技術(shù)分為以下三個(gè)方面:主要指的是細(xì)粒度多線程體系結(jié)構(gòu)、粗粒度多線程體系結(jié)構(gòu)和同時(shí)多線程體系結(jié)構(gòu)。這三種結(jié)構(gòu)體系的相互促進(jìn)、相互協(xié)調(diào)運(yùn)行使得整個(gè)計(jì)算機(jī)體系呈現(xiàn)出巨大的發(fā)展態(tài)勢(shì),也為計(jì)算機(jī)技術(shù)的全面、綜合、統(tǒng)一邁進(jìn)提供了扎實(shí)的基礎(chǔ)平臺(tái)。
3、向量技術(shù)
向量技術(shù)從誕生以來一直應(yīng)用在高性能計(jì)算機(jī)當(dāng)中,是計(jì)算機(jī)技術(shù)發(fā)展的指導(dǎo)依據(jù)和基礎(chǔ)平臺(tái)。隨著科學(xué)技術(shù)的發(fā)展和計(jì)算機(jī)技術(shù)的進(jìn)步,向量技術(shù)也得到了極大的邁進(jìn),其已經(jīng)廣泛的應(yīng)用在各類處理器結(jié)構(gòu)當(dāng)中,成為處理工作中的指導(dǎo)依據(jù)和應(yīng)用基礎(chǔ)。經(jīng)過多年的實(shí)踐證明,向量技術(shù)的能夠更好的適應(yīng)計(jì)算機(jī)技術(shù)、處理技術(shù)和自動(dòng)化技術(shù)的發(fā)展要求,從阿爾達(dá)到更高的實(shí)際應(yīng)用性能的優(yōu)勢(shì)。
二、多線程向量存儲(chǔ)結(jié)構(gòu)設(shè)計(jì)
1、多線程向量體系結(jié)構(gòu)
多線程處理器中設(shè)計(jì)有多套獨(dú)立的線場(chǎng),包括PC、通用寄存器、浮點(diǎn)寄存器、向量寄存器、狀態(tài)寄存器等。每個(gè)線程從軟件的角度看都是一個(gè)獨(dú)立的處理器,線程的數(shù)量可以很多。多線程處理器設(shè)計(jì)有專門的向量部件,執(zhí)行擴(kuò)展的寬向量指令。多線程向量處理器通過將來自多個(gè)線程的指令交叉執(zhí)行來隱藏長延遲操作帶來的流水線阻塞,當(dāng)來自某個(gè)線程的指令由長延遲操作而阻塞的時(shí)候,其他線程的指令仍可以繼續(xù)執(zhí)行,從而保持流水線的滿負(fù)荷工作。
2、多線程向量存儲(chǔ)結(jié)構(gòu)
將多線程與向量技術(shù)結(jié)合,可以隱藏向量數(shù)據(jù)訪問的存儲(chǔ)器延遲,但需要處理好向量數(shù)據(jù)與標(biāo)量數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)和數(shù)據(jù)相關(guān)性。我們?cè)O(shè)計(jì)了一種向量與標(biāo)量混合訪問的存儲(chǔ)層次,一級(jí)數(shù)據(jù)緩存只緩存標(biāo)量數(shù)據(jù),不緩存向量數(shù)據(jù)。向量訪存操作將不進(jìn)入一級(jí)數(shù)據(jù)緩存,直接通過二級(jí)緩存訪問。這樣做是基于兩點(diǎn)考慮:首先,L1D容量小而向量數(shù)據(jù)規(guī)模大,這樣避免了向量數(shù)據(jù)與標(biāo)量數(shù)據(jù)爭奪有限的LID資源,避免LID的數(shù)據(jù)抖動(dòng),利于充分發(fā)揮標(biāo)量處理部件的計(jì)算性能;其次,由于有多線程的延遲隱藏機(jī)制,二級(jí)緩存高速緩存的訪問延遲可以得到很好的隱藏,不會(huì)對(duì)向量處理部件的性能造成過大的影響。高速緩存數(shù)據(jù)塊的大小與向量寄存器的位數(shù)一致。這樣,每個(gè)向量訪存操作都能夠消耗或生成一個(gè)完整高速緩存塊,便于高速緩存的控制及向量訪存部件的設(shè)計(jì)。
三、多線程向量處理器中向量數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)實(shí)現(xiàn)
向量處理器是通過向量操作來支持?jǐn)?shù)據(jù)并行性的處理器。為了有效地利用向量計(jì)算中的數(shù)據(jù)并行性,向量處理器的結(jié)構(gòu)通常包括向量寄存器文件、深度流水的ALU和一維的SIMD組織形式的多種組合。向量寄存器文件存儲(chǔ)的是數(shù)據(jù)向量,而不是單個(gè)的數(shù)據(jù)字,它們是在對(duì)向量進(jìn)行操作時(shí),順序地進(jìn)行傳送的。不僅圖像處理采用向量處理器技術(shù),當(dāng)前世界上處理速度最陜的超級(jí)計(jì)算機(jī)——日本NEc的《地球仿真測(cè)試系統(tǒng)》,也是以0.15mm工藝實(shí)現(xiàn)的向量處理器為基礎(chǔ),由5120個(gè)向量處理器(共有640個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)有8個(gè)向量處理器)組成的。
1、多線程向量處理器中向量數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)的回顧
整個(gè)計(jì)算機(jī)界似乎總是在不停的重復(fù)著“前進(jìn)-回退-再前進(jìn)”的步調(diào)。很多基礎(chǔ)性的創(chuàng)新結(jié)構(gòu)在很早之前都被提出了,但由于市場(chǎng)、技術(shù)和現(xiàn)實(shí)條件的限制最終只有很少的技術(shù)在一段時(shí)間內(nèi)成為主流。一種主流技術(shù)在走到生命盡頭之后,以前一種被遺忘技術(shù)可能被人們從故紙堆中翻出來,以嶄新的面目引導(dǎo)新的技術(shù)革新。
在處理器體系結(jié)構(gòu)設(shè)計(jì)中的上一次回歸是RISC。當(dāng)VAX開啟了變長指令,多尋址模式等CISC技術(shù)之后,處理器設(shè)計(jì)變得越來越復(fù)雜,純粹的CISC很難設(shè)計(jì),也難以實(shí)現(xiàn);這時(shí)提倡精簡的RISC替代了VAX處理器體系結(jié)構(gòu)稱主流技術(shù)。在80 90年代,RISC思想JL5e遍布所有廠商的處理器。
2、桌面優(yōu)化
在開始詳細(xì)分析向量處理器的結(jié)構(gòu)之前,不妨先看一下近30年的發(fā)展過程中桌面系統(tǒng)體系結(jié)構(gòu)的變遷。除了CPU而外,桌面系統(tǒng)的其他部件的功能也不斷增強(qiáng)。在向量處理器中以內(nèi)部互連EIB總線為核心,8個(gè)完全相同的SPE(synergistic Processor Element)向量處理核心和一個(gè)PowerPC兼容的PPE(Power Processor Element)核心圍繞在環(huán)狀數(shù)據(jù)總線四周。XIO接口提供與Rambus XDR內(nèi)存的高速互連,F(xiàn)lexIO提供了高速I/O通道,同時(shí)在應(yīng)用中也為整個(gè)計(jì)算機(jī)工作的持續(xù)進(jìn)行提供了方便。
四、結(jié)束語
本文提出一種多線程向量的存儲(chǔ)結(jié)構(gòu),該結(jié)構(gòu)支持標(biāo)量數(shù)據(jù)和向量數(shù)據(jù)的混合存儲(chǔ),利用多線程切換來隱藏訪存延遲,并讓向量數(shù)據(jù)直接訪問cache來提高帶寬。模擬實(shí)驗(yàn)表明多線程能提高實(shí)用帶寬,所提出的存儲(chǔ)結(jié)構(gòu)能支持高帶寬的向量數(shù)據(jù)訪問。
參考文獻(xiàn)
[1]孫彩霞同時(shí)多線程處理器中的資源分配策略研究[學(xué)位論文]2006
[2]Intel Pentium4 processor homepage 2011