李春偉
(北京華大九天軟件有限公司 北京 100102)
目前芯片性能受片上偏差[1]影響,主要原因?yàn)樵谕籨ie上atom的數(shù)目和位置差異;晶體管channel的長度和寬度差異;氧化層厚度差異;隨著工藝日益發(fā)展,這種差異對(duì)芯片產(chǎn)生的影響越來越明顯和嚴(yán)重,傳統(tǒng)的OCV derate設(shè)計(jì)方法也需要越來越嚴(yán)格以確保設(shè)計(jì)芯片的性能,但是這種嚴(yán)格的約束可能需要損失部分芯片性能作為代價(jià),對(duì)于時(shí)鐘處理方法,傳統(tǒng)的時(shí)鐘樹設(shè)計(jì)方法受OCV影響嚴(yán)重,基于此時(shí)鐘網(wǎng)格設(shè)計(jì)的優(yōu)點(diǎn)就凸顯了出來。文中對(duì)時(shí)鐘樹設(shè)計(jì)方法與時(shí)鐘網(wǎng)格設(shè)計(jì)方法進(jìn)行了對(duì)比分析驗(yàn)證。
時(shí)鐘樹綜合是ASIC后端設(shè)計(jì)中的一個(gè)重要環(huán)節(jié)。隨著工藝尺寸的不斷減小,時(shí)鐘樹綜合也給后端設(shè)計(jì)提出了很多新的問題。特別是進(jìn)入65 nm及后的40 nm工藝下,時(shí)序收斂更加成為了后端設(shè)計(jì)的主要瓶頸,引起了很多后端設(shè)計(jì)的關(guān)注。時(shí)鐘樹設(shè)計(jì)中時(shí)鐘偏移成為限制系統(tǒng)時(shí)鐘頻率的主要因素。
傳統(tǒng)的時(shí)鐘樹綜合技術(shù)是在時(shí)鐘結(jié)構(gòu)中插入反向器和緩沖器樹來達(dá)到時(shí)鐘到達(dá)時(shí)間的設(shè)計(jì)要求,這種方法在EDA工具流程中能夠被很好的支持和實(shí)現(xiàn),也被廣泛采用;時(shí)鐘網(wǎng)格技術(shù)是通過在時(shí)鐘結(jié)構(gòu)中應(yīng)用更加相似類型的驅(qū)動(dòng)器實(shí)現(xiàn)更低的時(shí)鐘偏移方法,它的設(shè)計(jì)方法相對(duì)比較復(fù)雜,下面將進(jìn)行詳細(xì)的對(duì)比分析。
圖1為傳統(tǒng)時(shí)鐘樹設(shè)計(jì)與時(shí)鐘網(wǎng)格設(shè)計(jì)對(duì)比圖。
圖1 設(shè)計(jì)結(jié)構(gòu)圖Fig.1 Design figure of structure
傳統(tǒng)時(shí)鐘樹[2-4]含有時(shí)鐘源,時(shí)鐘樹單元,門控單元,以及緩沖單元和負(fù)載單元;時(shí)鐘網(wǎng)格結(jié)構(gòu)則包含時(shí)鐘源,pre-mesh驅(qū)動(dòng)單元,mesh驅(qū)動(dòng)單元,mesh-net,門控以及mesh接收和負(fù)載單元。
兩種設(shè)計(jì)方法主要的區(qū)別在于時(shí)鐘網(wǎng)格結(jié)構(gòu)具有meshnet,并且作為多驅(qū)動(dòng)net連接mesh驅(qū)動(dòng)單元,設(shè)計(jì)結(jié)構(gòu)需要連接一組驅(qū)動(dòng)單元來驅(qū)動(dòng)大規(guī)模的RC mesh網(wǎng)絡(luò)。Mesh-net的主要作用在于平滑不同mesh驅(qū)動(dòng)單元到達(dá)它的有效時(shí)間,從而為降低時(shí)鐘偏移時(shí)間奠定了良好的基礎(chǔ)。
與傳統(tǒng)時(shí)鐘樹結(jié)構(gòu)相比,時(shí)鐘網(wǎng)格[5]設(shè)計(jì)具有低skew[6],抗OCV影響效果明顯的優(yōu)點(diǎn),主要應(yīng)用于高性能芯片產(chǎn)品中,其缺點(diǎn)是功耗比較大,所以設(shè)計(jì)mesh的挑戰(zhàn)就在于如何在降低功耗的基礎(chǔ)上獲得最低的skew結(jié)果,另外時(shí)鐘網(wǎng)格結(jié)構(gòu)設(shè)計(jì)起來比較復(fù)雜,需要占用更多的布線資源。
時(shí)鐘網(wǎng)格設(shè)計(jì)的另一個(gè)關(guān)鍵點(diǎn)在于設(shè)計(jì)結(jié)果的仿真分析,與時(shí)鐘樹結(jié)構(gòu)相比其需要利用仿真工具進(jìn)行仿真結(jié)果分析。
第一節(jié)已介紹芯片設(shè)計(jì)中OCV的影響原因分析,下面從時(shí)序分析的角度詳細(xì)闡述對(duì)建立時(shí)間及保持時(shí)間的影響。
當(dāng)計(jì)算觸發(fā)器的到達(dá)時(shí)間(A點(diǎn)),如圖2所示,如果時(shí)序分析時(shí),不考慮OCV的影響,時(shí)鐘路徑上的時(shí)鐘驅(qū)動(dòng)器(Clk_1_2)與數(shù)據(jù)路徑上的驅(qū)動(dòng)器(Clk_1_1)在晶片上的距離很遠(yuǎn)時(shí),就會(huì)發(fā)生一個(gè)潛在的制造性問題,將有可能造成(Clk_1_2)比(Clk_1_1)還早一點(diǎn)到的狀況,而這種狀況在STA分析時(shí)會(huì)被忽略,從而造成芯片的潛在性能問題。
圖2 建立時(shí)間Fig.2 Setup time
如圖3所示,在兩個(gè)觸發(fā)器中有一條很短的邏輯路徑,與建立時(shí)間相似,在分析保持時(shí)間時(shí),只考慮到負(fù)載與寄生參數(shù),而沒有考慮OCV影響,同樣會(huì)產(chǎn)生時(shí)序問題。
圖3 保持時(shí)間Fig.3 Hold time
從圖1可以看出,對(duì)于傳統(tǒng)時(shí)鐘樹設(shè)計(jì)方法,從時(shí)鐘源到負(fù)載單元只有很少部分的路徑可以共享,而對(duì)于時(shí)鐘網(wǎng)格結(jié)構(gòu),對(duì)于所有的負(fù)載單元,從時(shí)鐘源到mesh net全部是共享路徑,只有從mesh net經(jīng)過門控單元和接收單元到負(fù)載單元的路徑會(huì)受到OCV的影響,而共享部分路徑幾乎是不受影響的。
依據(jù)設(shè)計(jì)工藝與設(shè)計(jì)經(jīng)驗(yàn),OCV系數(shù)從為5%-10%,假設(shè)典型值設(shè)為7%,對(duì)于setup檢查,launch路徑增加insert delay的 7%,capture路徑減少 insert delay的 7%,skew值都假設(shè)為insert delay的2%,對(duì)于時(shí)鐘網(wǎng)格結(jié)構(gòu),一般來講這個(gè)值是很悲觀的,在這種情況下,參考圖4分析結(jié)果,傳統(tǒng)時(shí)鐘樹設(shè)計(jì)受OCV影響為時(shí)鐘網(wǎng)格受OCV影響的4倍。并且隨著設(shè)計(jì)工藝的不斷減小,這種影響會(huì)更加顯著。
圖4 OCV影響對(duì)比圖Fig.4 OCV contrast figure of influence
對(duì)一90 nm工藝電路進(jìn)行了時(shí)鐘網(wǎng)格與時(shí)鐘樹設(shè)計(jì)方法對(duì)比,表1為比較結(jié)果,驗(yàn)證了以上分析的正確性。本設(shè)計(jì)采用兩層時(shí)鐘網(wǎng)格設(shè)計(jì),圖5為結(jié)構(gòu)示意圖。
圖5 多級(jí)時(shí)鐘網(wǎng)格結(jié)構(gòu)圖Fig.5 Multi-level clock mesh figure of structure
表1 結(jié)果分析對(duì)比Tab.1 Result analysis and contrast
隨著深亞米工藝的不斷發(fā)展,OCV對(duì)芯片性能的影響日益顯著,時(shí)鐘網(wǎng)格設(shè)計(jì)相對(duì)于傳統(tǒng)時(shí)鐘樹設(shè)計(jì)方法,不僅有skew值小,同時(shí)更重要的是其抗OCV的影響效果顯著。實(shí)例分析驗(yàn)證了理論分析的正確性,即時(shí)鐘網(wǎng)格設(shè)計(jì)同時(shí)保證了芯片設(shè)計(jì)的性能和穩(wěn)定性。
[1]Zuchowski P S,Habitz P A,Hayes J D.Process and environmental variation impacts on ASIC timing[C]//Proceedings of the 2004 IEEE/ACM International Conference on Computeraided Design,2004:1-3.
[2]周廣,何明華.ASIC后端設(shè)計(jì)中的時(shí)鐘樹綜合[J].現(xiàn)代電子技術(shù),2011(8):2-3.
ZHOU Guang,HE Ming-hua.Clock tree synthesis in ASIC backend design[J].Modern Electronic Technology,2011(8):2-3.
[3]Friedman E G.Clock distribution networks in synchronous digital integrated circuits[J].Proceeding of the IEEE,2001(5):1-3.
[4]千路,林平分.ASIC后端設(shè)計(jì)中的時(shí)鐘偏移以及時(shí)鐘樹綜合[J].半導(dǎo)體技術(shù),2008(6):1-3.
QIAN Lu,LIN Ping-fen.Clock skew and clock tree synthesis in ASIC backend design[J].Semiconductor Technology,2008(6):1-3.
[5]Wilke G R,Murgai R.Design and analysis of “Tree+Local Meshes”clock architecture[C]//8th International Symposium on Quality Electronic Design,2007:2-4.
[6]Cheung M,Tsou A,CHIU T.Synthesized clock mesh with very small skew[R].Cadence Technology,2007:2-4.