雷 冰,張琳璐,康明魁
(中國航天科技集團(tuán)有限公司九院七七一研究所,陜西西安 710119)
星載高性能計(jì)算機(jī)系統(tǒng)內(nèi)熱流密度急劇增加,高溫環(huán)境將顯著降低芯片及整機(jī)的性能和可靠性。研究表明,電子設(shè)備的失效率隨工作溫度的升高成指數(shù)增長,55%的電子設(shè)備失效是由溫度超過規(guī)定值引起的[1-2]。
星載設(shè)備的主要散熱方式為傳導(dǎo),熱管理與熱控制原則是設(shè)計(jì)一條低熱阻傳熱通路,使內(nèi)部元器件產(chǎn)生的熱量高效快速地傳遞到機(jī)箱周圍的熱沉,以滿足熱可靠性及空間環(huán)境應(yīng)用要求。當(dāng)前,在星載設(shè)備熱設(shè)計(jì)方面,文獻(xiàn)[3]提出在大功率芯片現(xiàn)場可編程門陣列(Field Programmable Gate Array, FPGA)頂部貼導(dǎo)熱襯墊來降低腔體與芯片的接觸熱阻。文獻(xiàn)[4]提出了一種散熱帽結(jié)構(gòu),在解決芯片快速散熱的同時(shí)起到減重的作用。該類方法都是對常規(guī)金屬導(dǎo)熱材料進(jìn)行優(yōu)化設(shè)計(jì),而常規(guī)材料導(dǎo)熱能力有限且其本身密度較大,現(xiàn)有散熱技術(shù)已無法適應(yīng)星載高性能計(jì)算機(jī)的高效散熱及輕量化需求。
石墨散熱片因具有優(yōu)異的各向異性導(dǎo)熱性能成為新興散熱材料的焦點(diǎn),其橫向?qū)嵝宰罡呖蛇_(dá)1 500 W/(m·K),若與金屬材料相結(jié)合,可充分發(fā)揮其在橫向熱擴(kuò)散方面的作用[5-6]。本文結(jié)合某星上數(shù)據(jù)處理機(jī)的熱設(shè)計(jì)需求,提出以石墨散熱片為主的全路徑高效熱傳導(dǎo)方法。采用仿真分析和實(shí)測方法對整機(jī)的熱設(shè)計(jì)進(jìn)行驗(yàn)證分析,并通過仿真分析定量研究了石墨散熱片對芯片降溫的效果,可為后期石墨散熱片在星載高性能計(jì)算機(jī)上的應(yīng)用提供參考。
整機(jī)按照VITA 48.2設(shè)計(jì)標(biāo)準(zhǔn)進(jìn)行模塊化設(shè)計(jì)。VITA 48.2子規(guī)范提出了針對導(dǎo)冷插件的機(jī)械設(shè)計(jì)規(guī)范,很適合星上設(shè)備的散熱需求[7]。整機(jī)包括機(jī)箱、前后電源組件、5個(gè)計(jì)算模塊、2個(gè)交換模塊及BUS底板。單機(jī)模型如圖1所示。各功能模塊互聯(lián)方便,便于各功能板的安裝、調(diào)試和替換維修。單個(gè)插板模塊由起拔器組件、鎖緊組件、印制件、結(jié)構(gòu)框架及VPX連接器組成,前后電源組件安裝在機(jī)箱的前后壁板上。工作環(huán)境為真空環(huán)境,要求在高溫55°C下大功率元器件滿足一級降額要求。
圖1 整機(jī)模型圖
整機(jī)模塊的布局如圖2所示。該設(shè)備的總功耗為128.1 W,每個(gè)計(jì)算模塊左右各分布一個(gè)數(shù)字信號處理(Digital Signal Processor, DSP)芯片,兩個(gè)芯片互為備份,兩個(gè)交換模塊也互為備份。
圖2 模塊功耗分布圖
各個(gè)模塊上大功率器件匯總信息見表1,計(jì)算模塊上DSP器件的熱流密度最大。
表1 大功率元器件匯總表
計(jì)算模塊的DSP芯片和交換模塊的FPGA芯片為倒裝芯片球柵格陣列(Flip Chip Ball Grid Array,FCBGA)封裝,其散熱方式如圖3所示。電源組件的電源模塊為全密封金屬外殼封裝,直接裝配在金屬冷板上散熱效果最佳。
圖3 計(jì)算模塊DSP散熱設(shè)計(jì)示意圖
星載設(shè)備熱設(shè)計(jì)的原則是設(shè)計(jì)一條低熱阻、短路徑通路,保證整機(jī)的熱量快速高效地傳遞到機(jī)箱安裝的熱沉面。模塊插拔區(qū)域與機(jī)箱導(dǎo)軌槽之間鎖緊面的接觸熱阻是熱控設(shè)計(jì)的一個(gè)重要參數(shù)。文獻(xiàn)[8]基于6U(1U = 44.45 mm)板卡模塊開展了導(dǎo)軌接觸熱阻的研究。研究結(jié)果表明:在無導(dǎo)熱填料時(shí)鎖緊面的接觸熱阻約為0.226°C/W;在導(dǎo)軌槽與模塊之間的鎖緊面涂覆導(dǎo)熱硅脂時(shí),鎖緊面的接觸熱阻約為0.034°C/W。文獻(xiàn)[9]提出在模塊框架與機(jī)箱導(dǎo)軌槽接觸面之間填充液態(tài)金屬導(dǎo)熱膏來降低接觸熱阻,降溫效果明顯。液態(tài)金屬導(dǎo)熱膏會(huì)與鋁發(fā)生反應(yīng),存在腐蝕鋁表面的風(fēng)險(xiǎn)。本文選擇在接觸區(qū)域涂抹導(dǎo)熱硅脂的方法來降低金屬之間的接觸熱阻。
在導(dǎo)冷板材料確定、器件尺寸和熱耗已知的條件下,熱量傳輸距離和導(dǎo)冷板厚度是影響傳導(dǎo)效率的關(guān)鍵因素。文獻(xiàn)[10]指出,當(dāng)框架厚度達(dá)到某一數(shù)值后,繼續(xù)增加厚度對降低器件的溫度貢獻(xiàn)很小,反而會(huì)增加重量。結(jié)合該產(chǎn)品對重量的要求,框架導(dǎo)熱區(qū)域厚度h取3.5 mm,并在布局印制電路板(Printed Circuit Board, PCB)時(shí),使大功率器件盡可能靠近框架邊緣。
DSP芯片在計(jì)算模塊內(nèi)的布局如圖3所示。計(jì)算模塊1—5均采用左右備份方式,左側(cè)DSP芯片的熱量主要通過導(dǎo)熱界面材料傳導(dǎo)至模塊框架,鋁合金的導(dǎo)熱性能有限,因而框架左右兩側(cè)溫差較大。石墨散熱片也稱導(dǎo)熱石墨片,具有超高橫向?qū)嵝阅?。對于熱量分布不均勻的布局形式,利用其橫向高導(dǎo)熱性可達(dá)到均溫的效果。因此本文提出在計(jì)算模塊1—5的框架表面貼一片石墨散熱片,以提高整個(gè)框架的橫向?qū)崮芰ΑU麄€(gè)石墨散熱片的厚度為0.2 mm,單片質(zhì)量為12 g,可保證在重量增加很小的前提下增強(qiáng)計(jì)算模塊框架的導(dǎo)熱能力。
采用FloTHERM仿真軟件,按照功耗最大的工作模式對整機(jī)進(jìn)行仿真分析。求解域內(nèi)環(huán)境溫度為55°C,并在整機(jī)底部安裝面處添加55°C的source控溫面。邊界條件設(shè)置為真空環(huán)境,只考慮傳導(dǎo)和輻射。機(jī)箱材料為鋁合金,表面進(jìn)行黑色陽極化處理,輻射系數(shù)為0.9。根據(jù)廠家的實(shí)測結(jié)果,0.2 mm厚石墨散熱片的橫向?qū)嵯禂?shù)為900 W/(m·K)左右,縱向?qū)嵯禂?shù)為50 W/(m·K)。關(guān)鍵器件的仿真溫度結(jié)果見表2。
表2 關(guān)鍵元器件仿真溫度統(tǒng)計(jì)
計(jì)算模塊2分布在整個(gè)機(jī)箱最中間熱量最集中的區(qū)域,其DSP溫度最高。所有器件的最高溫度均滿足星上設(shè)備≤85°C的一級降額要求。整機(jī)的熱仿真云圖如圖4所示。圖5為計(jì)算模塊2的熱仿真云圖,圖6為交換模塊(主)的熱仿真云圖。機(jī)箱前壁板安裝電源模塊區(qū)域的最高溫度為70.8°C,機(jī)箱左壁機(jī)殼溫差在10°C左右。仿真分析驗(yàn)證了整機(jī)的熱設(shè)計(jì)滿足要求。
圖4 整機(jī)熱仿真云圖
圖5 計(jì)算模塊2熱仿真云圖
圖6 交換模塊(主)熱仿真云圖
圖7為整機(jī)在55°C真空箱內(nèi)進(jìn)行的熱真空試驗(yàn)示意圖。真空箱內(nèi)壓力<1.3×10?3Pa,在產(chǎn)品參考點(diǎn)處設(shè)置控溫傳感器,保證安裝面處參考點(diǎn)的溫度在55°C左右。機(jī)箱外部的溫度選用真空箱內(nèi)自帶的熱電偶測量,機(jī)箱上的測溫點(diǎn)及編號與整機(jī)云圖(圖4)上的參考點(diǎn)一致。熱電偶數(shù)據(jù)無明顯波動(dòng)時(shí),說明已達(dá)到熱平衡,保存試驗(yàn)數(shù)據(jù)。
圖7 熱真空試驗(yàn)示意圖
交換模塊上FPGA器件內(nèi)置的溫度傳感器可讀取到FPGA的節(jié)溫。產(chǎn)品的工作模式與仿真分析的工作模式保持一致。實(shí)驗(yàn)數(shù)據(jù)與仿真數(shù)據(jù)的對比結(jié)果見表3。機(jī)箱上的實(shí)測溫度值除了編號5外均普遍低于仿真值,該誤差來源于熱電偶與機(jī)箱的接觸熱阻;交換模塊內(nèi)FPGA的仿真溫度低于實(shí)測溫度,該誤差可能與FPGA芯片仿真設(shè)置的功耗值偏低相關(guān)。仿真誤差在10%以內(nèi),證明了仿真模型的合理性。
表3 仿真結(jié)果與試驗(yàn)結(jié)果對比表
為了對比石墨散熱片對計(jì)算模塊的熱控提升效果,以現(xiàn)有經(jīng)試驗(yàn)驗(yàn)證過的仿真模型為基礎(chǔ),模擬計(jì)算模塊1—5在粘貼石墨片前后DSP芯片的溫度。左側(cè)DSP芯片節(jié)溫在粘貼石墨片前后的數(shù)據(jù)對比見表4。在未貼石墨散熱片的情況下,計(jì)算模塊2和3上的DSP節(jié)溫大于85°C,不滿足一級降額要求。與采用常規(guī)金屬散熱相比,在計(jì)算模塊1—5框架上貼石墨散熱片,可使DSP芯片的溫度低4°C左右,鋁合金2A12的導(dǎo)熱系數(shù)為150 W/(m·K)左右,經(jīng)計(jì)算在計(jì)算模塊框架貼石墨散熱片后可將整個(gè)框架貼合區(qū)域的導(dǎo)熱系數(shù)提高至210 W/(m·K)左右,且對整個(gè)計(jì)算模塊重量的增加完全可忽略不計(jì)。
表4 粘貼石墨片前后左側(cè)DSP仿真節(jié)溫對比 °C
圖8為計(jì)算模塊2框架在未貼石墨散熱片情況下的熱仿真云圖??蚣茏笥覂蓚?cè)的溫差為7.6°C,而在貼石墨散熱片后左右兩側(cè)的溫差為3.7°C。由此可見,石墨散熱片可將集中熱源均勻化,可降低芯片節(jié)溫,從而解決大功率器件的散熱問題。
圖8 無石墨散熱片計(jì)算模塊2框架仿真云圖
針對星載高性能計(jì)算機(jī)對高效散熱的迫切需求,本文開展了星上數(shù)據(jù)處理機(jī)熱設(shè)計(jì)工作。熱設(shè)計(jì)的重點(diǎn)在于從整個(gè)散熱路徑上提高整機(jī)的熱傳導(dǎo)能力。文中提出在熱量集中的計(jì)算模塊框架區(qū)域粘貼石墨散熱片以提高整個(gè)模塊的散熱能力,并基于熱仿真模型對比了粘貼石墨散熱片前后的散熱效果。石墨散熱片可保證計(jì)算模塊內(nèi)的DSP溫度降低4°C,效果明顯。VPX類型的插板式機(jī)箱采用的熱設(shè)計(jì)方法及石墨散熱片的應(yīng)用,均可為星載高性能計(jì)算機(jī)熱設(shè)計(jì)提供工程指導(dǎo)。
文中石墨散熱片的厚度為0.2 mm,該厚度的石墨散熱片是否為最優(yōu)選擇還有待驗(yàn)證。建議后續(xù)對不同厚度石墨散熱片粘貼計(jì)算模塊框架后的散熱效果進(jìn)行研究,以為后續(xù)工程應(yīng)用提供指導(dǎo)。