• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      一種自適應的混合型無線NoC拓撲結構

      2016-08-12 05:48:17黎建華胡永良張肖強
      電子學報 2016年6期
      關鍵詞:有線功耗路由器

      黎建華,吳 寧,胡永良,張肖強

      (1.南京航空航天大學電子信息工程學院,江蘇南京 210016; 2.臺州學院計算機應用研究所,浙江臨海 317000)

      ?

      一種自適應的混合型無線NoC拓撲結構

      黎建華1,2,吳寧1,胡永良2,張肖強1

      (1.南京航空航天大學電子信息工程學院,江蘇南京 210016; 2.臺州學院計算機應用研究所,浙江臨海 317000)

      針對傳統(tǒng)大規(guī)模片上網(wǎng)絡(Network-on-Chip,NoC)遠距離核間多跳通信所帶來的高能耗與延時問題,提出了一種基于虛Torus的自適應的混合型無線NoC拓撲結構(VT-AWiNoC).該結構通過引入鏈路擁塞測度作為感知參數(shù),基于此采用熱點無線鏈路自動探測與帶寬動態(tài)分配機制,并設計實現(xiàn)發(fā)送器動態(tài)分配的控制電路模塊,以達到根據(jù)不同的通信流量模型,于片內(nèi)自適應地調(diào)整拓撲結構及鏈路帶寬的目的.通過建立混合型無線NoC的延時與功耗評估模型,對該結構的無線NoC進行性能評估.實驗結果表明,該自適應拓撲與其它混合型無線NoC相比,在隨機流量模型下,網(wǎng)絡平均延時降低了16.52~23.27%;在20%的熱點流量模型下,包平均能耗節(jié)省了39.19%;以真實應用FFT作為基準測試,平均延時降低了17.20%~21.68%,并節(jié)省了23.49%的包平均能耗.該結構以較小的面積開銷獲得了更優(yōu)的性能.

      無線片上網(wǎng)絡;自適應拓撲;擁塞測度

      1 引言

      片上網(wǎng)絡(Network-on-Chip,NoC)作為復雜SoC的一種新的互連與通信架構[1],當向更大規(guī)模和更復雜化方向發(fā)展時,其本身存在的延時與能耗問題嚴重限制了SoC性能的進一步提升[2].為從根本上解決傳統(tǒng)大規(guī)模有線NoC的金屬導線的布線限制及多跳通信引起的延時與功耗問題,近年來,應用片上微型天線實現(xiàn)片內(nèi)無線通信,將NoC中多跳有線金屬鏈路替換成長無線鏈路,一種無線NoC(Wireless NoC,WiNoC)應運而生[2~5].

      自D.Zhao等人基于UWB技術提出無線NoC架構以來[6],涌現(xiàn)出了大量相關的研究成果[7~10].文獻[7]針對專用無線NoC拓撲的設計方法,給出了一種基于啟發(fā)式的無線鏈路靜態(tài)分配算法.文獻[8]以網(wǎng)絡架構的處理器陣列NePA為基礎,構建了一個有線/無線混合的混合型無線NoC(NePA-WiNoC).文獻[9]充分利用小世界(Small-World)網(wǎng)絡具有較短的平均路徑長度的特點,構建了一個具有Small-World結構的混合網(wǎng)絡(SW-WiNoC).文獻[10]綜合考慮無線節(jié)點、無線鏈路數(shù)及其分布等因素,提出了一個基于無線多跳的混合無線NoC拓撲2-Level Hybrid Mesh(2LHM-WiNoC).上述各種拓撲的無線NoC,雖在性能方面得到了明顯提升,但其無線鏈路均采用靜態(tài)的信道分配機制,即不管鏈路上有無數(shù)據(jù)傳輸及實際傳輸?shù)臄?shù)據(jù)量大小,始終為其分配固定的鏈路帶寬,造成信道帶寬的浪費.特別是在無線NoC中無線信道數(shù)及總帶寬受限的條件下,如何根據(jù)通信流量模型于片內(nèi)自適應地調(diào)整拓撲結構與鏈路帶寬,對提高無線NoC的性能是至關重要的.

      本文綜合考慮無線鏈路具有低能耗和互連可變的內(nèi)在特性[9,11],以及鏈路擁塞等因素,提出了一種基于虛Torus的、低延時低能耗的自適應混合型無線NoC拓撲結構(Virtual Torus-Based Adaptive Wireless NoC,VT-AWiNoC).該結構采用基于改進擁塞測度參數(shù)的發(fā)送器動態(tài)分配控制電路模塊(Dynamic Allocation Control Circuit Module,DACCM),將發(fā)送器與信道動態(tài)分配到最擁塞的熱點無線鏈路上,于片內(nèi)完成無線NoC拓撲及鏈路帶寬的自適應調(diào)整,實現(xiàn)面向不同流量模型的帶寬按需分配.實驗表明,該結構在可接受的面積成本開銷下,在吞吐量、延時和功耗等方面獲得了更優(yōu)的通信性能.

      2 自適應的混合型無線NoC拓撲結構

      無線NoC的拓撲中除了有線節(jié)點、鏈路的布局和互連方式外,其無線節(jié)點、鏈路的數(shù)目及其位置分布對無線NoC的性能影響也至關重要.綜合考慮以上因素,本文所提出的自適應拓撲VT-AWiNoC如圖1所示.

      現(xiàn)假定有一規(guī)模為n*n的2D Mesh結構的純有線NoC網(wǎng)絡,因無線NoC主要解決大規(guī)模純有線NoC的多跳通信與布線問題,故假設n為大于6的整數(shù)(圖1中n等于18),則該自適應拓撲結構的構建規(guī)則如下:

      (1)簇與塊的劃分:考慮可用信道數(shù)、網(wǎng)絡擴展性與規(guī)則性等因素,以降低網(wǎng)絡擁塞、減小硬件開銷為原則,基于對現(xiàn)有子網(wǎng)劃分方法的理論分析[2,10,11],先將整個網(wǎng)絡劃分成若干個6*6的簇(cluster),之后將每個簇劃分成若干個3*3的塊(block),當網(wǎng)絡規(guī)模不滿足此劃分條件時,在后續(xù)討論;如圖1中共有9個6*6的簇(Cluster0~Cluster8),每個簇內(nèi)包含4個3*3的塊(Block0~Block3);路由器用R(cn,bn,zn)標記,其中變量cn表示該路由器所在的簇號,bn表示該路由器在簇cn中的塊的序號(bn∈[0,3]),zn表示該路由器在塊bn中的路由器編號.

      (2)路由器編號:將每個塊中心的有線路由器R替換成無線路由器WR,并在水平或垂直方向上的任意相鄰塊的兩個WR間插入一條靜態(tài)無線鏈路;則每個無線路由器WR的編號為WR(cn,bn,4),為簡化在圖中的描述,WR(cn,bn,4)視為對(cn,bn)四進制編號,記為WRn,這里n=(cn,bn)4,如WR(1,2,4) 記為WR6,以此類推.

      (3)對面簇與對面WR(或塊):現(xiàn)將物理上分布在一個維度兩端的兩個簇,互稱為對面簇;同理,物理上分布在一個維度兩端的兩個WR(或塊),互稱為對面WR(或?qū)γ鎵K);如圖1,Cluster0的對面簇為其水平方向上的簇Cluster2、垂直方向上的簇Cluster6;WR0的對面WR為其水平方向上的WR9、垂直方向上的WR26;而WR1只在垂直方向上存在對面WR(WR27),在水平方向上不存在對面WR.

      (4)無線鏈路插入:在每個簇中均另設置了一個自適應簇發(fā)送器(Cluster Transmitter,CT),CT采用有線鏈路與簇內(nèi)的Max(bn)+1個WR直接相連(這里Max(bn)表示某簇內(nèi)變量bn的最大值,圖1中的Max(bn)=3),簇內(nèi)的Max(bn)+1個WR共享使用該CT,并在水平或垂直方向上的相鄰CT間或?qū)γ鍯T間插入一條自適應無線鏈路,這里將對面CT間所插入的跨越整個拓撲的自適應無線鏈路簡記為長鏈路;若某簇內(nèi)的塊Block數(shù)目等于1,則該簇內(nèi)僅有1個WR獨占該簇的CT.

      (5)CT分配規(guī)則:為減少遠距離IP核間通信跳數(shù),降低相鄰簇間的相鄰WR間的擁塞程度,在提高簇發(fā)送器CT利用率,又避免CT的流量負載過重而出現(xiàn)局部擁塞的同時,限制共享CT及其信道只能用于相鄰簇間的相鄰WR間或?qū)γ鎃R間的通信,而不能將其用于簇內(nèi)的WR間通信;因此圖1中的CT0根據(jù)不同的通信流量模型,被自適應地動態(tài)分配給WR0-WR9(長鏈路)、WR0-WR26(長鏈路)、WR1-WR4、WR1-WR27(長鏈路)、WR2-WR12、WR2-WR11(長鏈路)、WR3-WR6或WR3-WR13共8條鏈路動態(tài)復用,CT的動態(tài)分配機制由后續(xù)所討論的鏈路擁塞測度參數(shù)決定.

      按照上述構建規(guī)則,當所有的CT均未分配給對面WR間通信時,上層無線鏈路構成了Mesh網(wǎng)絡;而當邊緣CT均用于與其對面WR通信時,上層靜態(tài)無線鏈路和自適應無線鏈路一起構成類似于Torus結構的虛擬環(huán)網(wǎng).正是通過自適應簇發(fā)送器CT的動態(tài)分配,于片內(nèi)實現(xiàn)上層無線拓撲及鏈路帶寬隨不同流量模型的自適應變化,故稱之為基于虛Torus的自適應的混合型無線NoC(VT-AWiNoC).

      對于n*n的2D Mesh純有線NoC,若無法滿足上述劃分條件,即當某個簇的規(guī)模不足6*6(n不為6的整數(shù)倍)或某個塊的規(guī)模不足3*3,這里不采取添加冗余路由節(jié)點的方法,而是將其視為一個完整的簇或塊.此規(guī)則既不影響自適應拓撲的構建,又可避免因添加冗余路由節(jié)點而帶來的面積與功耗開銷.

      網(wǎng)絡直徑是影響NoC性能的一個重要指標,本文VT-AWiNoC結構的上層無線網(wǎng)絡的直徑同Torus結構,網(wǎng)絡直徑為 4+2?n/6」,其中?·」表示向下取整.網(wǎng)絡直徑隨網(wǎng)絡規(guī)模變化關系如圖2所示,本文提出的拓撲結構的網(wǎng)絡直徑隨節(jié)點數(shù)的變化比較平緩,當節(jié)點數(shù)目超過392時,VT-WiNoC的網(wǎng)絡直徑明顯小于其它三種結構.這從理論上證明了當網(wǎng)絡規(guī)模較大時,該結構具有更小的網(wǎng)絡直徑,以此減小路由平均跳數(shù)與網(wǎng)絡延時.

      無線路由器WR及其與發(fā)送器CT互連結構如圖3所示,包含5個有線輸入/輸出端口(E、S、W、N和L)和4個無線輸入/輸出端口(BW-E、BW-S、BW-W、BS-N,分別面向東南西北的WR).雖然端口BW-E、BW-S、BW-W或BS-N與CT間本質(zhì)上是采用有線鏈路相連,但這些端口的數(shù)據(jù)是利用所連接的發(fā)送器,以無線方式與下一個路由器間傳輸?shù)模蕪墓δ苌蠈⑦@些端口稱為無線輸入/輸出端口.路由器WR內(nèi)部包括路由仲裁器(Routing Arbitrator,RA)、基于仲裁計數(shù)器和流量計數(shù)器的本地擁塞測度單元(Local Congestion Measure Unit,LCMU).LCMU用于統(tǒng)計該WR的每條無線輸出鏈路的擁塞情況,并將擁塞測度數(shù)據(jù)送給帶有比較器的全局擁塞測度單元GCMU(Global Congestion Measure Unit),GCMU通過1~ Max(bn)號端口分別獲取簇內(nèi)其它WR的LCMU輸出數(shù)據(jù).

      WR的每個無線輸出端口均各自連接1個靜態(tài)發(fā)送器Tx,邊緣WR的邊緣端口除外.如圖3中的WR0只有非邊緣端口BW-S-out和BW-E-out各自連接了1個Tx,而WR3的四個輸出端口均各自連接了1個Tx.采用文獻[9]的FDMA技術進行子信道劃分,讓每個發(fā)送器Tx工作在不同的載波頻率上(f1~f4),負責實現(xiàn)垂直或水平方向上與其相鄰WR間的靜態(tài)無線互連.按照前述的自適應拓撲構建規(guī)則,對于每個WR,只有其中2個方向的無線輸出端口采用有線鏈路同時與1個發(fā)送器CT相連,具體由WR在網(wǎng)絡中的位置所決定.如圖3中的WR0,只有BW-N-out和BW-W-out同時與CT0連接,其中BW-N-out與CT0連接,與其對面簇中的WR26實現(xiàn)遠距離通信;BW-W-out與CT0連接,與其對面簇中的WR9實現(xiàn)遠距離通信.同理,對于WR3,只有其BW-S-out和BW-E-out同時與CT0連接.若將CT動態(tài)分配給不同的WR使用,其上層無線拓撲也在根據(jù)不同的通信流量模型于片內(nèi)自適應調(diào)整.

      3 擁塞測度與鏈路帶寬動態(tài)分配機制

      如何根據(jù)鏈路帶寬需求,把空閑信道動態(tài)分配給高流量的鏈路上以解決擁塞問題,將對無線NoC的總體性能提升產(chǎn)生重要影響.為便以描述擁塞測度與鏈路帶寬動態(tài)分配機制,現(xiàn)給出若干相關定義.

      定義1無線NoC體系結構圖(WiNoC Architecture Graph,WAG)WAG(A,E,L)是由多個無線路由節(jié)點a(?a∈A)互連構成的有向圖,A表示具有m*m個無線路由節(jié)點構成的集合,|A|=m*m,其中m=(n+5)/6;邊e(?e∈E)表示兩個無線路由節(jié)點間的有線鏈路;邊lab(?lab∈L,?b∈A,b=(a±1)mod(m))表示兩個相鄰的無線路由節(jié)點a與b之間互連的無線鏈路.

      定義2無線路由節(jié)點端口(Wireless Router Port,WRP)集合P(U,V,I,J),端口u(?u∈U)和v(?v∈V)分別表示無線路由節(jié)點的有線輸入端口和有線輸出端口,端口i(?i∈I)和j(?j∈J)分別表示無線路由節(jié)點的無線輸入端口和無線輸出端口;其中|U|=|V|,|I|=|J|,用a(j)表示無線路由節(jié)點a的無線輸出端口j.

      定義3時間觀察窗口(Window,W)W(t)是一段連續(xù)觀察時刻點的集合,|W|為觀察窗口的時間大小(一般用時鐘周期數(shù)表示),其中t∈[0,|W|-1].

      通常用鏈路的帶寬利用率來預測網(wǎng)絡中鏈路在下一時刻的擁塞程度.在NoC中,從路由器a到其鄰居路由器b之間的鏈路la(j)b(i)的帶寬利用率記為ra(j)b(i),它與統(tǒng)計窗口W內(nèi)已通過的流量C成正比,與帶寬B成反比:

      (1)

      但在NoC中,存在多個輸入端口爭用同一輸出端口的情況,此信息更能體現(xiàn)出下一時刻的鏈路擁塞情況.仿真分析發(fā)現(xiàn),單純的鏈路帶寬利用率只反映了在觀察時間窗W內(nèi),該輸出端口上過去已通過的流量狀況,無法反映正等待通過該輸出端口的流量情況.而正在等待通過的流量更能反映出下一時刻鏈路的帶寬需求與擁塞狀況.根據(jù)無線NoC網(wǎng)絡的通信特點,為更準確地度量某鏈路在下一時間段的擁塞程度,將兩相鄰無線路由節(jié)點間無線鏈路的擁塞測度CM定義為:

      (2)

      gt,a(j)表示路由器a中,在時刻t有流量等待通過該路由器輸出端口j的輸入端口總個數(shù).Qt,a(j)表示在觀察窗口W內(nèi)的某時刻t,路由器a中等待通過該路由器的輸出端口j的所有輸入端口(輸入端口j除外)的流量之和,體現(xiàn)了下一時間窗口W內(nèi)鏈路上的流量信息,其定義如下:

      (3)

      為簡化電路復雜度,在無線鏈路la(j)b(i)的理論帶寬B及觀察時間窗口W大小一定時,可直接使用硬件流量計數(shù)器統(tǒng)計路由器a的輸出端口j所輸出的比特流來作為Ca(j)b(i)的值.此外,輸入端口k的流量qt,a(k)a(j)在與其成正比的數(shù)據(jù)平均包長及微片寬度一定時,Qt,a(j)可看成是路由仲裁(RA)階段等待使用輸出端口j的輸入端口個數(shù),因此簡化為使用硬件仲裁計數(shù)器統(tǒng)計等待輸出的輸入端口個數(shù),此統(tǒng)計在路由仲裁階段同步完成.可見,對無線路由器中用于求解擁塞測度CM值的電路原理簡化后,只需額外增加如圖3所表示的仲裁計數(shù)器和流量計數(shù)器,這些硬件部分相對于整個無線路由器的電路開銷十分微小.

      由于只允許CTx用于相鄰簇間的相鄰WR間或?qū)γ鎃R間的通信,故CTx的自適應信道Acx可供簇內(nèi)的4個WR的8條無線鏈路動態(tài)復用.對CT進行動態(tài)分配的控制電路DACCM是實現(xiàn)片內(nèi)自適應拓撲及鏈路帶寬動態(tài)調(diào)整的關鍵模塊,按照自適應拓撲的構建規(guī)則,其電路結構如圖4所示,具體工作流程如下:

      (1)設定觀察時間窗口W,各LCMU在時間窗口W內(nèi)開始統(tǒng)計流量及鏈路利用率情況.

      (2)GCMU發(fā)送鏈路擁塞測度數(shù)據(jù)請求信息給簇內(nèi)的每個LCMU.

      (3)在時間窗口W結束時,每個LCMU根據(jù)式(2)計算本地WR在其中2個方向上的無線輸出鏈路的擁塞測度CM值,并將CM值以數(shù)據(jù)包的形式返還給GCMU,返還成功的同時復位鏈路擁塞測度的數(shù)據(jù)域.

      (4)GCMU對接收到的4個WR的鏈路擁塞測度數(shù)據(jù)包分別進行解析,經(jīng)由比較器比較分析,以構建Torus環(huán)網(wǎng)的跳數(shù)最小化為原則,無論CM值大小,將自適應信道優(yōu)先分配給長鏈路;當有多條長鏈路時,則將其分配給具有最大CM值的長鏈路;如果沒有長鏈路,則將自適應信道分配給具有最大CM值的無線鏈路,通過鏈路聚合,將具有靜態(tài)信道的鏈路與動態(tài)信道的鏈路合并成一條邏輯鏈路,在提高鏈路帶寬的同時,實現(xiàn)片內(nèi)上層無線拓撲的自適應調(diào)整;由數(shù)據(jù)選擇器完成CT在簇內(nèi)WR間的動態(tài)切換.

      (5)若在一個時間窗口W內(nèi),某長鏈路已完成了數(shù)據(jù)流通信,則該長鏈路將主動放棄該自適應信道,并將該自適應信道重新分配給該WR內(nèi)的另一無線鏈路,直至時間窗口W結束.

      4 混合型VT-AWiNoC通信機制

      所提出的混合型VT-AWiNoC架構,是由下層有線2D Mesh及上層無線2D Torus所構成的分層網(wǎng)絡.在下層有線2D Mesh拓撲內(nèi)部,采用無死鎖的確定性XY維序路由算法[2].對于上層靜態(tài)無線鏈路和自適應無線鏈路構成的虛Torus結構的環(huán)網(wǎng),其內(nèi)部采用添加有向虛通道的TXY路由算法以解決死鎖[12].盡管XY和TXY路由均具有避免死鎖的能力,但對于分層網(wǎng)絡,所存在的間接依賴關系會導致更復雜的路由死鎖[2,13].對于這種情況,采用通常打破環(huán)路的方法以避免死鎖是非常困難的,路由算法的邏輯將變得復雜,使得網(wǎng)絡性能下降,因此虛通道成為解決死鎖的一種通用方法[2,10].這里直接使用文獻[2]的方法以解決此問題,即在每個有線輸入端口設置兩個虛通道供不同方向的數(shù)據(jù)使用.

      當VT-AWiNoC中的某兩個PE間需要傳遞數(shù)據(jù)時,包可能會通過有線鏈路,無線鏈路或二者的混合.為避免源節(jié)點所在塊的多個PE因通過同一個無線路由器WR而導致?lián)砣@里通過設置擁塞控制因子,避免過度使用無線鏈路導致WR出現(xiàn)熱區(qū),以緩和WR的擁塞問題.同文獻[8]的NePA-WiNoC拓撲所采用的路由算法,本文仿真時將擁塞控制因子值固定為4,即以靜態(tài)方式調(diào)節(jié)上層無線網(wǎng)絡和下層有線網(wǎng)絡的流量分布.

      5 性能分析模型

      文獻[14]針對基于射頻傳輸線互連(RF-I)的無線NoC架構,建立了精確的功耗與延時模型,顯然不適用于本文采用片上天線互連的無線NoC架構.為對本文所提出的VT-AWiNoC拓撲的性能進行準確評估,需在仔細研究片上天線互連的信道傳播模型基礎上,建立完整的基于片上天線互連的無線NoC架構的功耗與延時模型.

      5.1延時分析模型

      延時通常定義為源節(jié)點的頭微片注入時間與目的節(jié)點接收到尾微片的時鐘周期長度.一般來說,數(shù)據(jù)包從源節(jié)點至目的節(jié)點的延時可用節(jié)點平均距離Ψ,也即為全局的包平均延時來表示:

      (4)

      (5)

      這里HR、HWR分別表示包到達目的節(jié)點所經(jīng)過的有線和無線路由器的平均跳數(shù),其值主要由拓撲結構和路由算法所決定,tR、tWR分別表示有線和無線路由器的延時,tL、tWL分別為導線連線的有線鏈路延時和天線對之間的無線鏈路延時,LR表示以比特為單位的數(shù)據(jù)包長度,BWR、BWWL分別為有線鏈路和無線鏈路帶寬.

      5.2功耗分析模型

      對無線NoC而言,功耗可從系統(tǒng)級和電路級兩個層面考慮.系統(tǒng)級功耗是針對某一特定拓撲結構,經(jīng)過最短路徑收發(fā)所有數(shù)據(jù)包所消耗的功耗單元數(shù)目,通常使用單一性連接矩陣δ來表示一個包所經(jīng)過的跳數(shù)[15].

      鏈路的導線功耗在深亞微米電路中占據(jù)主要成分,而來自開關的動態(tài)功耗又是電路級功耗的主要部分.與純有線NoC相比,對于混合型無線NoC,電路級功耗分為有線鏈路和無線鏈路功耗兩部分.其中電路級有線鏈路功耗Pr-link又包括導線連線的鏈路功耗Pw-link和有線路由器PR的功耗,而有線鏈路的開關功耗Pw-link與數(shù)據(jù)鏈路翻轉(zhuǎn)因子α、端口數(shù)據(jù)寬度Nwire、負載電容c、供電電壓Vdd和時鐘頻率f直接相關[1],故可表示為:

      (6)

      電路級無線鏈路功耗Pwi-link主要包含天線對之間無線鏈路損耗PL和收發(fā)器功耗Ptransceiver,可表示為:

      (7)

      這里M表示無線鏈路分配的頻率信道數(shù),PLi和Ptransceiver,i是無線鏈路中第i個頻率信道的片上天線和收發(fā)器電路的功耗.對于實現(xiàn)片內(nèi)無線互連的片上天線,采用基于三維笛卡爾坐標及射線跟蹤原理所建立的WiNoC片內(nèi)無線信道傳播損耗模型[16].與文獻[17]的信道模型相比,該模型綜合考慮了無線NoC所處物理環(huán)境的電導率σ、介電常數(shù)ε和磁導率μ等物理參數(shù),本文的VT-AWiNoC結構中天線對的損耗PLG表示為[16]:

      PLG=

      (8)

      假設無線NoC拓撲結構中針對有線鏈路的單一性連接矩陣為δr-link,無線鏈路的單一性連接矩陣為δwi-link.采用包平均能耗,即平均每個包從源節(jié)點路由至目的節(jié)點產(chǎn)生的功耗來衡量特定拓撲下功耗性能[9],則混合型無線NoC的包平均能耗Ppkt可表示為:

      (9)

      式(9)中Nij表示數(shù)據(jù)包從源節(jié)點i至目的節(jié)點j的以包為單位的通信量,δr-link,ij和δwi-link,ij分別表示單個數(shù)據(jù)包從源節(jié)點i至目的節(jié)點j所經(jīng)過的有線鏈路跳數(shù)和無線鏈路跳數(shù).值得注意的是,若混合WiNoC拓撲結構中任何數(shù)據(jù)包從i至j都未經(jīng)過無線鏈路,即所有的δwi-link,ij取零時,式(9)則等價于純有線NoC的包平均能耗.

      6 性能評估

      為進行準確的功耗性能評估,混合型WiNoC的有線鏈路功耗Pr-link,包括5*5路由器、有線金屬導線的動態(tài)功耗、泄露功耗均通過配置Orion2.0功耗模型來獲取[18].對于20mm*20mm的晶圓片,假設采用高阻抗硅基底(ρ=5kΩ-cm)以及633μm厚的氮化鋁(AIN)作為絕緣層,根據(jù)式(8),天線對間距取最大20mm時的傳播路徑損耗PLG約為32dB(天線對間距1mm時約為9dB).無線NoC中支持16Gbps數(shù)據(jù)速率的收發(fā)器功耗約為36.7mW[19],對應能耗約為2.3pJ/bit.若采用THz的光頻率天線,在最長的通信距離23mm下,無線鏈路(包括天線對和收發(fā)器)的能耗為0.33pJ/bit[9].采用SMIC 90nm工藝庫在Synopsys Design Compiler中對圖4中的發(fā)送器動態(tài)分配控制電路模塊DACCM進行綜合,以評估實現(xiàn)自適應拓撲所產(chǎn)生的額外能耗與面積開銷,同時,各路由器的面積與功耗在45nm下通過Orion 2.0獲取.DACCM及其它部件的能耗與面積如表1所示.

      基于上述功耗參數(shù),對基于SystemC的時鐘級片上網(wǎng)絡仿真器Noxim進行修改,分別搭建SW-WiNoC、NePA-WiNoC、2LHM-WiNoC以及VT-AWiNoC四種拓撲結構的交易級模型,并嵌入所建立的延時與功耗分析模型.為保證性能評估的公平性,實驗中網(wǎng)絡規(guī)模和通信流圖均采用完全相同的應用,分別映射到不同的拓撲結構中.資源節(jié)點數(shù)分別為144、324和576.有線鏈路用1GHz的時鐘驅(qū)動,設置無線鏈路帶寬為16Gbps,為保證兩節(jié)點間無線與有線鏈路帶寬相等的公平性,設置微片寬度為16比特,數(shù)據(jù)包長度在3~7個微片間隨機選擇.每個無線/有線輸入端口的虛通道數(shù)設置為3,每個虛通道緩存深度為4個微片大小,仿真時間設置為10000個有線時鐘周期.圖5顯示了四種混合型無線NoC拓撲和純有線2DMesh NoC在隨機流量、20%的熱點流量及FFT(Fast Fourier Transform)真實應用下的吞吐率與注入率的關系.

      表1 DACCM及相關部件的能耗與面積

      文獻[10]的2LHM-WiNoC實際上等價于本文提出的未使用自適應信道的拓撲結構,仿真表明,當網(wǎng)絡規(guī)模為144時,在均勻隨機流量模型下(如圖5(a)),VT-AWiNoC在注入率在0.4時接近飽和,純有線2D Mesh拓撲在注入率為0.2時網(wǎng)絡就達到了飽和.在20%的熱點模型流量下(如圖5(b)),VT-AWiNoC在注入率為0.25時才接近飽和,而純有線2D Mesh拓撲在注入率為0.1時就接近飽和.采用FFT真實應用作為基準測試,將1024點FFT變換的真實應用分解到其中的128個處理器節(jié)點PE上,每個PE分別執(zhí)行一個8點的基-2FFT運算,F(xiàn)FT真實應用的評估發(fā)現(xiàn)(如圖5(c)),VT-AWiNoC的吞吐率比2LHM-WiNoC平均高出15.60%.

      圖6顯示了在不同網(wǎng)絡規(guī)模下,注入率為0.2時五種拓撲的平均延時和包平均能耗對比.隨機流量模型下(如圖6(a)),當網(wǎng)絡規(guī)模為144和324時,VT-AWiNoC的平均延時低于2D Mesh拓撲,但略高于SW-WiNoC拓撲的延時,原因在于當網(wǎng)絡規(guī)模較小時,SW-WiNoC得益于更小的網(wǎng)路直徑與平均跳數(shù),但當網(wǎng)絡規(guī)模達到576或更大時,VT-AWiNoC表現(xiàn)出了更優(yōu)的性能,其平均延時比SW-WiNoC和2LHM-WiNoC分別低16.52%和23.27%.將1024點FFT變換分解到不同網(wǎng)絡規(guī)模的128~512個處理器節(jié)點PE上,每個PE分別執(zhí)行一個2~8點的基-2FFT運算,F(xiàn)FT應用的評估發(fā)現(xiàn)(如圖6(b)),當網(wǎng)絡規(guī)模達到576或更大時,VT-AWiNoC的性能增益更明顯,其平均延時比SW-WiNoC和2LHM-WiNoC分別低17.20%和21.68%.

      不同流量模型與真實應用下的包平均能耗如圖6(c)所示,實驗表明VT-AWiNoC在能耗方面均優(yōu)于其它拓撲結構.特別是在熱點流量模型下,VT-AWiNoC比2LHM-WiNoC節(jié)省39.19%的能耗,這是因為熱點模型中存在更多的遠距離通信節(jié)點,VT-AWiNoC構成了具有更少跳數(shù)的Torus環(huán)網(wǎng),節(jié)省了更多的能耗.此外,采用FFT真實應用作為基準測試,針對網(wǎng)絡節(jié)點為576的無線NoC拓撲,將1024點FFT變換的真實應用分解到其中的512個處理器節(jié)點PE上,每個PE分別執(zhí)行一個2點的基-2FFT運算.通過FFT真實應用評估發(fā)現(xiàn)VT-AWiNoC的能耗比2LHM-WiNoC拓撲節(jié)省23.49%.

      自適應無線NoC拓撲與其它無線NoC拓撲相比,主要增加了CT及實現(xiàn)發(fā)送器動態(tài)分配的控制電路模塊DACCM.以節(jié)點數(shù)目為324的網(wǎng)絡規(guī)模為例,自適應拓撲中各模塊的面積成本開銷比重如表2所示.相對于其它無線NoC而言,CT與DACCM的面積開銷之和所占用的面積成本開銷比重為3.41%~7.49%,若將處理單元PE和Cache考慮在內(nèi),其增加的面積開銷是可忽略的.實驗表明,一方面以較小的面積成本開銷為代價,換來了NoC性能方面的高增益;另一方面也避免了Torus中長金屬連線的面積開銷與布線限制.

      表2 自適應拓撲中各模塊的面積成本開銷比重(節(jié)點數(shù)=324)

      實驗分析證明,所提出的自適應的混合型無線NoC拓撲結構,在性能方面遠優(yōu)于傳統(tǒng)的有線2D Mesh片上網(wǎng)絡.與其它混合型無線NoC拓撲相比,是一種能獲得更高增益的架構.這是由于VT-AWiNoC采用基于擁塞測度與熱點無線鏈路感知的鏈路帶寬動態(tài)分配機制.與純有線2D Mesh結構相比,通過引入具有更低能耗的長無線鏈路,使包傳輸避開了大量中間有線路由節(jié)點和金屬導線;與純有線Torus結構相比,無需使用較多的跨越整個拓撲的金屬長連線,既兼顧了Torus環(huán)網(wǎng)的優(yōu)點又極大地降低了布線難度;與2LHM-WiNoC相比,其上層無線網(wǎng)絡可根據(jù)網(wǎng)絡流量模型自適應地調(diào)整發(fā)送器的分配,構建虛Torus環(huán)網(wǎng)進一步減少了跳數(shù).且當網(wǎng)絡規(guī)模越大時,性能提升愈明顯.

      7 結論

      本文提出了一種基于虛Torus的自適應的混合型無線NoC拓撲結構,該結構利用基于擁塞測度的熱點無線鏈路自動探測及帶寬動態(tài)分配機制,達到了根據(jù)不同的通信流量模型自適應地調(diào)整鏈路帶寬與拓撲結構的目的.實驗結果表明,該結構與純有線2DMesh NoC相比,以較低的面積開銷獲得了近似成倍的性能提升,同時避免了長金屬連線的面積開銷與布線限制;以其它混合型無線NoC相比,也獲得了明顯的性能增益.

      [1]楊盛光,李麗,高明倫,等.面向能耗和延時的NoC映射方法[J].電子學報,2008,36(5):937-942.

      Yang Sheng-guang,Li Li,Gao Ming-lun,et al.An energy and delay-aware mapping method of NoC[J].Acta Electronica Sinica,2008,36(5):937-942.(in Chinese)

      [2]Wen-Hsiang Hu,Chifeng Wang,Nader Bagherzadeh.Design and analysis of a mesh-based wireless network-on-chip[A].International Conference on PDP[C].Garching,Germany:IEEE,2012.483-490.

      [3]Deb S,Ganguly A,Pande P P,et al.Wireless NoC as interconnection backbone for multicore chips:promises and challenges[J].IEEE Journal on Emerging & Selected Topics in Circuits & Systems,2012,2(2):228-239.

      [4]Bialkowski M,Abbosh A.Wireless intrachip-interchip interconnections utilising tapered slot antennas for ultra-large-scale integration technology[J].IET Microw,Antennas Propagation,2010,4(10):1665-1671.

      [5]Mahmoud S F,Alajmi A R.Characteristics of a new carbon nanotube antenna structure with enhanced radiation in the sub-terahertz range[J].IEEE Transactions on Nanotechnology,2012,11(3):640-646.

      [6]Zhao D,Wang Y.SD-MAC:Design and synthesis of a hardwareefficient collision-free qos-aware MAC protocol for wireless network-onchip[J].IEEE Transactions on Computers,2008,57(9):1230-1245.

      [7]Shouyi Yin,Yang Hu,Zhen Zhang,et al.Hybrid wired/wireless on-chip network design for application-specific SoC[J].IEICE Transactions on Electronics,2012,95(4):495-505.

      [8]Chifeng W,Wen-hsiang H,Bagherzadeh N.A wireless network-on-chip design for multicore platforms[A].Proceedings of the 19th Euromicro International Conference on PDP[C].Ayia Napa,Cyprus:IEEE,2011.409-416.

      [9]Ganguly A,Chang K,Deb S,et al.Scalable hybrid wireless network-on-chip architectures for multicore systems[J].IEEE Transactions on Computers,2011,60(10):1485-1502.

      [10]Ling Wang,Zhihai Guo,Peng Lv,et al.On an overlaid hybrid wire/wireless interconnection architecture for network-on-chip[J].International Journal of Advanced Computer Science and Applications,2014,5(4):168-174.

      [11]Suk-Bok Lee,Saiwang Tam,Loannis Pefkianakis,et al.A scalable micro wireless interconnect structure for CMPs[A].Proceedings of the 15th Annual International Conference on Mobile Computing and Networking[C].New York,USA:ACM,2009.217-228.

      [12]Lu Z,Jantsch A.Flit admission in on-chip wormhole-switched networks with virtual channels[A].International Symposium on System-on-chip[C].Tampere,Finland:IEEE,2004.21-24.

      [13]Fu B,Xu S,Bao W,et al.Dandelion:A locally-high-performance and globally-high-scalability hierarchical data center network[A].International Conference on Computer Communications and Networks[C].Shanghai,China:IEEE,2014.1-8.

      [14]Yiou Chen,Jianhao Hu,Xiang Ling.Topology and mapping co-design for complex communication systems on wireless noc platforms[A].Conference on Industrial Electronics and Applications[C].Melbourne,VIC:IEEE,2013.1442-1447.

      [15]Elmiligi H,Morgan A A,El-Kharashi M W,et al.Power-aware topology optimization for networks-on-chips[A].International Symposium on Circuits and Systems[C].Seattle,WA:IEEE,2008.360-363.

      [16]Jianhua Li,Ning Wu,Yongliang Hu.Modeling and simulation of intra-chip wireless propagation channels for hybrid WiNoC[J].Sensors & Transducers Journal,2013,155(8):86-97.

      [17]Matolak D W,Kaya S,Kodi A.Channel modeling for wireless networks-on-chips[J].IEEE Communications Magazine,2013,51(6):180-186.

      [18]Kahng A B,Li B,Peh L S,et al.ORION 2.0:A power-area simulator for interconnection networks[J].IEEE Transactions on VLSI Systems,2012,20(1):191-196.

      [19]Sujay Deb,Kevin Chang,Xinmin Yu,et al.Design of an energy efficient CMOS compatible noc architecture with millimeter-wave wireless interconnects[J].IEEE Transactions on Computers,2013,62(12):2382-2396.

      黎建華(通信作者)男,1980年生于湖北宜昌.現(xiàn)為南京航空航天大學博士研究生.主要研究方向為無線片上網(wǎng)絡、SoC系統(tǒng)與專用集成電路設計.

      E-mail:ljh2007@tzc.edu.cn

      吳寧女,1956年生于安徽淮南,碩士,南京航空航天大學教授,博士生導師.主要研究方向數(shù)字系統(tǒng)理論與技術、電子系統(tǒng)集成與專用集成電路設計.

      E-mail:wunee@nuaa.edu.cn

      An Adaptive Hybrid Wireless NoC Topology Structure

      LI Jian-hua1,2,WU Ning1,HU Yong-liang2,ZHANG Xiao-qiang1

      (1.CollegeofElectronicandInformationEngineering,NanjingUniversityofAeronauticsandAstronautics,Nanjing,Jiangsu210016,China;2.InstituteofComputerApplication,TaizhouUniversity,Linhai,Zhejiang317000,China)

      Aimed at the high energy consumption and communication delay due to multi-hop wired links between distant cores of traditional and large-scale network-on-chip(NoC),a virtual Torus-based adaptive wireless NoC(VT-AWiNoC) structure is proposed.The automatic detection and dynamic bandwidth allocation mechanism to hot wireless link based on the sensing parameter for link congestion measurement is adopted.Moreover,the dynamic allocation circuit for transmitter is designed to realize adaptive adjustment of the intra-chip topology and link bandwidth as different traffic patterns.We compare the performance of our proposed VT-AWiNoC to other hybrid wireless NoC topologies by setting up the energy consumption and delay estimate models.Experimental results show that the proposed topology obtains a delay improvement of 16.52% to 23.27% under random traffic pattern,an energy saving per packet of 39.19% under hotspot traffic pattern,a delay improvement of 17.20% to 21.68% and energy saving per packet of 23.49% on real application such benchmark as FFT(Fast Fourier Transform).The proposed topology achieves higher performance gains with small additional area cost.

      wireless network-on-chip(WiNoC);adaptive topology;congestion measurement

      2014-12-29;修回日期:2015-06-24;責任編輯:覃懷銀

      國家自然科學基金(No.61376025);江蘇省產(chǎn)學研前瞻性聯(lián)合研究項目(No.BY2013003-11);浙江省自然科學基金(No.LY13F020012)

      TN47

      A

      0372-2112 (2016)06-1420-09

      猜你喜歡
      有線功耗路由器
      買千兆路由器看接口參數(shù)
      科教新報(2022年24期)2022-07-08 02:54:21
      通信工程中有線傳輸技術的改進分析
      東方有線點播排行榜
      電影故事(2017年10期)2017-07-18 11:39:14
      揭開GPU功耗的面紗
      個人電腦(2016年12期)2017-02-13 15:24:40
      數(shù)字電路功耗的分析及優(yōu)化
      電子制作(2016年19期)2016-08-24 07:49:54
      通信工程中有線傳輸技術的改進研究
      有線數(shù)字電視網(wǎng)絡雙向化改造
      “功耗”說了算 MCU Cortex-M系列占優(yōu)
      電子世界(2015年22期)2015-12-29 02:49:44
      你所不知道的WIFI路由器使用方法?
      IGBT模型優(yōu)化及其在Buck變換器中的功耗分析
      電源技術(2015年11期)2015-08-22 08:51:02
      蓬安县| 南安市| 塔河县| 平山县| 兴化市| 荣昌县| 时尚| 报价| 襄樊市| 鄱阳县| 布尔津县| 洛川县| 贞丰县| 凤翔县| 景德镇市| 仁怀市| 通州区| 凌海市| 鱼台县| 泾阳县| 天祝| 绥滨县| 望奎县| 马尔康县| 大同县| 察哈| 呼伦贝尔市| 望奎县| 犍为县| 聂荣县| 长阳| 深州市| 淮滨县| 宁城县| 怀柔区| 上饶市| 安仁县| 嘉兴市| 腾冲县| 木兰县| 温泉县|