林楷智,宗艷艷,張雁南
(1.高效能服務(wù)器和存儲(chǔ)技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100085;2.浪潮(北京)電子信息產(chǎn)業(yè)有限公司,北京 100085)
伴隨著科技的高速發(fā)展,人類步入了信息化時(shí)代。移動(dòng)終端的愈發(fā)普及,智能穿戴設(shè)備以及社交媒體的廣泛應(yīng)用,為人們的生活提供了巨大的便利,同時(shí)也產(chǎn)生了海量的數(shù)據(jù)[1,2]。因此,對(duì)呈幾何級(jí)增長(zhǎng)的數(shù)據(jù)存儲(chǔ)和處理提出了更為嚴(yán)苛的要求[3,4]。云計(jì)算和大數(shù)據(jù)產(chǎn)業(yè)的蓬勃發(fā)展使得這個(gè)問題迎刃而解,并為信息通信產(chǎn)業(yè)提供了強(qiáng)勁的動(dòng)力,越來越多的行業(yè)通過建立數(shù)據(jù)中心來滿足數(shù)據(jù)計(jì)算和存儲(chǔ)的需要[5,6]。
服務(wù)器以其可靠性、可用性、可擴(kuò)展性、易用性和可管理性等特點(diǎn)在數(shù)據(jù)中心扮演最核心的角色[7,8]。而服務(wù)器上電子元器件集成度以及時(shí)鐘頻率提高的同時(shí),其物理尺寸卻在減小。元器件表面的熱流密度迅速增大,工作溫度急劇升高,這將直接影響芯片的工作性能。因此,在服務(wù)器有限的體積內(nèi),在眾多高功耗電子元器件長(zhǎng)期高負(fù)荷運(yùn)行時(shí),能否快速、有效地將其產(chǎn)生的熱量傳遞到外部,將直接影響服務(wù)器運(yùn)行的穩(wěn)定性和工作效率[9]。
因此,如何高效穩(wěn)定地為服務(wù)器降溫已成為研究熱點(diǎn)。沙超群等人[10]采用吸風(fēng)式的強(qiáng)迫風(fēng)冷散熱設(shè)計(jì),利用Flotherm熱仿真軟件對(duì)整機(jī)系統(tǒng)進(jìn)行了仿真優(yōu)化,并在35℃實(shí)際應(yīng)用環(huán)境下對(duì)產(chǎn)品樣機(jī)進(jìn)行了熱測(cè)試。張子軒[11]通過將大尺寸共模風(fēng)扇模組直接安裝在機(jī)柜上的方法提出了共享風(fēng)扇的散熱方案,同時(shí)對(duì)多臺(tái)服務(wù)器進(jìn)行共同散熱,減少了使用的風(fēng)扇數(shù)量,提高了散熱效率。王晶等人[12]為了提高服務(wù)器散熱效率,提出了一種熱管與水冷技術(shù)相結(jié)合的散熱方法,首先熱管將服務(wù)器內(nèi)部CPU的熱量導(dǎo)出到服務(wù)器外部,然后通過水冷將熱量帶走,并通過測(cè)試驗(yàn)證了水冷熱管散熱系統(tǒng)的有效性。為了提高2U游戲服務(wù)器的散熱效率,吳澤云[13]進(jìn)行了機(jī)構(gòu)散熱部件的選型和布局,并完成了系統(tǒng)風(fēng)道中導(dǎo)風(fēng)罩和系統(tǒng)開孔的設(shè)計(jì),最后通過仿真分析和實(shí)驗(yàn)測(cè)試驗(yàn)證了設(shè)計(jì)的可行性。
但是,傳統(tǒng)的散熱設(shè)計(jì)多為通過查表法讀取當(dāng)前時(shí)刻的溫度值,再向風(fēng)扇輸出控制信號(hào)實(shí)現(xiàn)轉(zhuǎn)速控制,這類設(shè)計(jì)會(huì)導(dǎo)致風(fēng)扇轉(zhuǎn)速波動(dòng)較大,不利于散熱效率的提高和服務(wù)器整體功耗的優(yōu)化。本文提出一種基于預(yù)防性散熱的功耗優(yōu)化控制策略PTEC(Predictive Thermal Energy Controller),通過電流變化來預(yù)估溫度的變化趨勢(shì),提前調(diào)整風(fēng)扇轉(zhuǎn)速,為系統(tǒng)進(jìn)行預(yù)防性散熱,故整體環(huán)境溫度不會(huì)有顯著的提升,這將有利于提高系統(tǒng)相關(guān)器件的工作效率,并節(jié)省因溫升所帶來的功率消耗。
為管控系統(tǒng)中所有關(guān)鍵電子元器件的溫度,使其滿足溫升的要求,需對(duì)系統(tǒng)的散熱設(shè)計(jì)進(jìn)行優(yōu)化,達(dá)到功耗優(yōu)化的目的。散熱器是將發(fā)熱電子元器件的熱量傳導(dǎo)至周圍環(huán)境或熱沉中的熱量交換部件。裝配在PCB板上的元器件,其內(nèi)部產(chǎn)生的熱量主要通過熱傳導(dǎo)的方式傳遞至PCB板和元器件表面,再通過對(duì)流換熱傳遞至周圍環(huán)境中。
強(qiáng)迫對(duì)流換熱公式為:
Q=h*A*ΔT
(1)
其中,Q為強(qiáng)迫對(duì)流的換熱量,A為散熱表面面積,ΔT為元器件表面溫度與環(huán)境溫度的差值,h是強(qiáng)迫對(duì)流時(shí)的換熱系數(shù)。
熱阻計(jì)算公式為:
R=ΔT/P
(2)
其中,R表示熱阻,P為電子元器件功耗。當(dāng)ΔT=(Tc-Ta)時(shí),可用于計(jì)算元器件散熱器熱阻,其中Tc為元器件與散熱器接觸位置的表面溫度,Ta為散熱器進(jìn)風(fēng)溫度;當(dāng)ΔT=(Tj-Tc)時(shí),可用于計(jì)算芯片內(nèi)核與表面之間的熱阻,其中Tj為芯片的結(jié)溫。
但是,當(dāng)元器件無法通過自然冷卻滿足系統(tǒng)溫控要求時(shí),需要采用風(fēng)扇進(jìn)行強(qiáng)制冷卻。風(fēng)扇的選擇需考慮3個(gè)因素:溫差、抵消溫差所需功耗和完全消除熱量所需風(fēng)量。
在實(shí)際風(fēng)扇控制系統(tǒng)中,電子元器件工作產(chǎn)生的熱量首先傳遞至機(jī)箱內(nèi)部,然后再由風(fēng)扇將其帶出,通過熱平衡方程計(jì)算系統(tǒng)所需風(fēng)量的公式為:
(3)
其中,Q1為系統(tǒng)冷卻所需風(fēng)量,P1為系統(tǒng)發(fā)熱總功耗,ΔT1為系統(tǒng)允許溫升。
根據(jù)系統(tǒng)總體散熱量和預(yù)估的系統(tǒng)溫升,評(píng)估計(jì)算出系統(tǒng)散熱所需風(fēng)量,從而確定系統(tǒng)風(fēng)扇選型。
為了提高系統(tǒng)散熱效率,滿足服務(wù)器功耗優(yōu)化的要求,本文提出了基于PTEC的風(fēng)扇控制策略。通過監(jiān)測(cè)發(fā)熱電子元器件電流下降幅度來預(yù)估溫度下降趨勢(shì),預(yù)先調(diào)節(jié)風(fēng)扇轉(zhuǎn)速。利用傳感器監(jiān)測(cè)服務(wù)器中核心電子元器件電流和溫度的變化,若某元器件溫度大于所設(shè)定溫度閾值,根據(jù)該元器件電流下降的幅度,判斷其功率呈下降趨勢(shì),并預(yù)估該器件因功率下降而產(chǎn)生溫度下降的幅度,隨后由風(fēng)扇控制芯片發(fā)出相對(duì)應(yīng)脈沖寬度調(diào)制信號(hào)PWM(Pulse Width Modulation),通過調(diào)節(jié)PWM信號(hào)的占空比實(shí)現(xiàn)風(fēng)扇轉(zhuǎn)速的調(diào)節(jié);若發(fā)熱電子元器件溫度在小于所設(shè)定溫度閾值的情況下波動(dòng),控制系統(tǒng)則不對(duì)PWM信號(hào)進(jìn)行調(diào)節(jié),避免因溫度的波動(dòng)而造成風(fēng)扇轉(zhuǎn)速的頻繁調(diào)節(jié)。最后,利用PID控制器,實(shí)現(xiàn)風(fēng)扇轉(zhuǎn)速的精確控制,在滿足散熱需求的同時(shí)也達(dá)到了功耗優(yōu)化的目的。
本文中風(fēng)扇控制系統(tǒng)的核心發(fā)熱電子元器件為NGSFF(Next Generation Small Form Factor)固態(tài)硬盤NF1。PTEC流程圖如圖1所示,具體控制流程介紹如下:
(1)給定風(fēng)扇控制芯片MCU初值和各傳感器初值。
(2)循環(huán)讀取每一個(gè)NF1存儲(chǔ)器的溫度,并比較各存儲(chǔ)器的溫度,從而得到最高溫度。
(3)判斷NF1最高溫度是否大于溫度閾值,若是,設(shè)定該NF1為參考點(diǎn);若否,返回上一步。
(4)評(píng)估參考點(diǎn)NF1的電流趨勢(shì),若電流呈上升趨勢(shì),保持當(dāng)前轉(zhuǎn)速并通過PID控制器基于實(shí)際溫度對(duì)PWM進(jìn)行調(diào)節(jié)。
(5)評(píng)估參考點(diǎn)NF1的電流趨勢(shì),若電流呈下降趨勢(shì),則根據(jù)電流下降幅度預(yù)估溫度變化,相應(yīng)地降低PWM;通過PID控制器基于實(shí)際溫度調(diào)節(jié)PWM。
本文搭建了如圖2所示的實(shí)驗(yàn)系統(tǒng)來驗(yàn)證所提控制策略的有效性??刂葡到y(tǒng)主要由系統(tǒng)控制板、存儲(chǔ)設(shè)備、PTEC風(fēng)扇板和6個(gè)4 056 mm風(fēng)扇組成,其中系統(tǒng)控制板主要由PM8546 PCIe Swith芯片、Aspeed 2500 BMC、CPLD、16個(gè)支持NF1的固態(tài)硬盤接口、4顆redrvier芯片以及8個(gè)mini SAS HD連接器構(gòu)成。
Figure 2 Experimental devices圖2 實(shí)驗(yàn)系統(tǒng)裝置圖
圖3是風(fēng)扇控制系統(tǒng)拓?fù)浣Y(jié)構(gòu),首先由存儲(chǔ)裝置NF1內(nèi)嵌的溫度傳感器采集溫度信息,電流傳感器PAC1720采集NF1電流信息,電流和溫度信息由I2C總線經(jīng)擴(kuò)展器PCA9546后由BMC統(tǒng)一收集,并傳輸至風(fēng)扇控制芯片PIC32MX Microchip(MCU),隨后MCU芯片通過調(diào)節(jié)PWM信號(hào)來控制風(fēng)扇轉(zhuǎn)速,實(shí)現(xiàn)溫度控制。
Figure 3 Topology of fan control system 圖3 風(fēng)扇控制系統(tǒng)拓?fù)浣Y(jié)構(gòu)
考慮到系統(tǒng)中NF1存儲(chǔ)器讀寫時(shí)間的不確定性以及工作環(huán)境變化所帶來的差異,為了驗(yàn)證所提PTEC控制策略在各種復(fù)雜工況下的有效性,在不同周期、不同占空比以及不同溫度下分別進(jìn)行功耗驗(yàn)證實(shí)驗(yàn)。首先在圖2所示實(shí)驗(yàn)環(huán)境下進(jìn)行不同周期相同占空比的功耗驗(yàn)證實(shí)驗(yàn);隨后又在相同周期不同占空比與不同溫度2種實(shí)驗(yàn)條件下進(jìn)行功耗對(duì)比實(shí)驗(yàn)。
基于PTEC的風(fēng)扇控制系統(tǒng)中,溫度閾值設(shè)定為60℃,MCU每100 ms會(huì)更新PWM信號(hào)至風(fēng)扇,以實(shí)現(xiàn)轉(zhuǎn)速的實(shí)時(shí)調(diào)整,PID控制器的參數(shù)設(shè)定分別為:kp=5,ki=0.1和kd=1。3組實(shí)驗(yàn)結(jié)果都表明,采用PTEC控制策略的方法檢測(cè)到電流開始下降,預(yù)估溫度下降并提前降低風(fēng)扇轉(zhuǎn)速,進(jìn)行預(yù)防性散熱,較無PTEC的傳統(tǒng)控制方法功耗有了顯著的下降。
首先,在不同周期相同占空比下對(duì)PTEC控制方法進(jìn)行驗(yàn)證,圖4~圖6分別是周期為20 s,100 s和180 s時(shí)3種不同頻率的功耗實(shí)驗(yàn)驗(yàn)證。圖4a是周期為20 s時(shí),采用PTEC控制策略的方法和無PTEC的傳統(tǒng)控制方法的風(fēng)扇轉(zhuǎn)速及NF1功率對(duì)比曲線。因?yàn)轭A(yù)先判斷了溫度下降趨勢(shì),調(diào)低了風(fēng)扇轉(zhuǎn)速,故采用PTEC控制策略的風(fēng)扇轉(zhuǎn)速明顯低于傳統(tǒng)控制方法,采用PTEC控制策略時(shí)NF1功率較傳統(tǒng)控制方法也有所下降。從圖4b可以看出,采用PTEC控制策略的方法的風(fēng)扇電流值明顯小于傳統(tǒng)控制方法的,在同樣12 V電壓下,風(fēng)扇總體功耗下降了27.48%。圖5a和圖6a是周期為100 s和180 s時(shí),采用PTEC控制策略的方法和傳統(tǒng)控制方法的風(fēng)扇轉(zhuǎn)速和NF1功率對(duì)比曲線,隨著控制周期的增長(zhǎng),雖然預(yù)先降低了轉(zhuǎn)速,但整體NF1功率和風(fēng)扇電流值與傳統(tǒng)控制方法較為接近,2種頻率下風(fēng)扇功耗分別下降了9.59%和5.39%。
Figure 4 Comparison of experimental verification when T=20 s圖4 T=20 s實(shí)驗(yàn)驗(yàn)證對(duì)比圖
Figure 5 Comparison of experimental verification when T=100 s圖5 T=100 s實(shí)驗(yàn)驗(yàn)證對(duì)比圖
Figure 6 Comparison of experimental verification when T=180 s圖6 T=180 s實(shí)驗(yàn)驗(yàn)證對(duì)比圖
為對(duì)PTEC控制進(jìn)行充分驗(yàn)證,又進(jìn)行了周期分別為40 s,60 s,80 s,120 s,140 s和160 s的功耗優(yōu)化實(shí)驗(yàn)。圖7是采用PTEC控制策略的方法相比于傳統(tǒng)控制方法的功耗優(yōu)化曲線。由圖7可以看出,采用所提控制策略的方法在各個(gè)周期的風(fēng)扇功耗表現(xiàn)均優(yōu)于普通的控制方法,在周期較短時(shí),即頻率f=0.05Hz和f=0.025Hz時(shí),風(fēng)扇控制系統(tǒng)功耗優(yōu)化效果最為顯著,相比于傳統(tǒng)控制方法,功耗優(yōu)化率分別提高了27.48%和20.84%,隨著周期的增長(zhǎng),功耗優(yōu)化的值也會(huì)逐漸減小,在T=160 s時(shí),功耗優(yōu)化值僅為5.28%。
Figure 7 Comparison of power consumption with same duty cycle in different periods圖7 不同周期相同占空比功耗優(yōu)化對(duì)比圖
為進(jìn)一步驗(yàn)證功耗優(yōu)化效果,本節(jié)在周期為80 s時(shí),采用不同的占空比對(duì)采用PTEC控制策略的方法進(jìn)行分組實(shí)驗(yàn)驗(yàn)證。圖8~圖10分別是占空比為12.5%,50%,87.5%時(shí)的功耗優(yōu)化驗(yàn)證實(shí)驗(yàn)圖。由圖8a可以看出,當(dāng)占空比較小時(shí),采用PTEC控制策略的風(fēng)扇轉(zhuǎn)速和傳統(tǒng)控制方法的風(fēng)扇轉(zhuǎn)速有明顯不同,NF1功率較傳統(tǒng)控制方法也有所下降,由圖8b的風(fēng)扇電流對(duì)比圖可以看出,在同樣12 V電壓下風(fēng)扇功耗降低了7.66%。
Figure 8 Comparison of experimental verification with duty cycle of 12.5%圖8 占空比為12.5%實(shí)驗(yàn)驗(yàn)證對(duì)比圖
圖9和圖10分別是占空比為50%和87.5%時(shí)采用PTEC控制策略的驗(yàn)證曲線。從圖9a可以看出,占空比為50%時(shí),通過評(píng)估參考點(diǎn)NF1的電流趨勢(shì),當(dāng)電流呈下降趨勢(shì)時(shí),根據(jù)電流下降幅度預(yù)估溫度,相應(yīng)地調(diào)低了風(fēng)扇轉(zhuǎn)速。從圖9b中的采用PTEC控制策略的方法和傳統(tǒng)控制方法的電流對(duì)比圖可以看出,功耗優(yōu)化效果較為明顯,達(dá)到了14.52%。而圖10中,當(dāng)占空比為最高的87.5%時(shí),采用PTEC控制策略的方法的風(fēng)扇轉(zhuǎn)速、NF1功率以及風(fēng)扇電流都與傳統(tǒng)控制方法接近,風(fēng)扇功耗優(yōu)化值僅為0.68%。
Figure 9 Comparison of experimental verification with duty cycle of 50%圖9 占空比為50%實(shí)驗(yàn)驗(yàn)證對(duì)比圖
Figure 10 Comparison of experimental verification with duty cycle of 87.5%圖10 占空比為87.5%實(shí)驗(yàn)驗(yàn)證對(duì)比圖
圖11是風(fēng)扇控制系統(tǒng)工作周期固定為80 s,當(dāng)占空比分別為12.5%,25%,37.5%,50%,62.5%,75%和87.5%時(shí),采用PTEC控制策略的方法的風(fēng)扇功耗與傳統(tǒng)控制方法風(fēng)扇功耗的對(duì)比折線圖。由圖11可以看出,占空比過高或者過低都會(huì)導(dǎo)致采用PTEC控制策略時(shí)功耗優(yōu)化效果降低,而當(dāng)占空比為37.5%和50%時(shí),功耗優(yōu)化效果最為顯著,分別達(dá)到了14.71%和14.52%。
Figure 11 Comparison of power consumption of different duty cycles圖11 不同占空比功耗優(yōu)化對(duì)比圖
為進(jìn)一步驗(yàn)證本文所提PTEC控制方法的有效性,在20℃,25℃,30℃和35℃ 4種不同環(huán)境溫度下,在周期為20 s、占空比為50%,以及周期為80 s、占空比為25%時(shí)分別進(jìn)行采用PTEC控制策略的方法和傳統(tǒng)控制方法的對(duì)比實(shí)驗(yàn)。圖12~圖15分別為4種不同溫度下周期為20 s占空比為50%時(shí),基于PTEC控制策略的方法與傳統(tǒng)控制方法的NF1功率、風(fēng)扇轉(zhuǎn)速及電流的對(duì)比圖。
Figure 12 Comparison of experimental verification at 20℃圖12 20℃時(shí)實(shí)驗(yàn)驗(yàn)證對(duì)比圖
由圖12a可以看出,PTEC控制方法在20℃的環(huán)境下,風(fēng)扇轉(zhuǎn)速和傳統(tǒng)控制方法轉(zhuǎn)速有較大差異;從圖12b的電流對(duì)比圖可以看出,在同樣12 V電壓下,功耗優(yōu)化值僅為13.56%。
Figure 13 Comparison of experimental verification at 25℃圖13 25℃時(shí)實(shí)驗(yàn)驗(yàn)證對(duì)比圖
Figure 14 Comparison of experimental verification at 30℃圖14 30℃時(shí)實(shí)驗(yàn)驗(yàn)證對(duì)比圖
Figure 15 Comparison of experimental verification at 35℃圖15 35℃時(shí)實(shí)驗(yàn)驗(yàn)證對(duì)比圖
從圖13~圖15可以看出,隨著溫度的升高,采用PTEC控制策略的方法的風(fēng)扇轉(zhuǎn)速明顯低于傳統(tǒng)控制方法下的風(fēng)扇轉(zhuǎn)速。從電流對(duì)比曲線可知,功耗優(yōu)化的值會(huì)隨著溫度的升高而逐漸提高,在25℃,30℃和35℃度分別達(dá)到了27.48%,35.79%和39.52%。
為進(jìn)一步驗(yàn)證PTEC功耗優(yōu)化效果,本節(jié)還進(jìn)行了周期為80 s、占空比為25%的驗(yàn)證實(shí)驗(yàn)。圖16是周期為20 s、占空比為50%和周期為80 s、占空比為25%時(shí)在4種不同溫度下的功耗優(yōu)化折線圖。從圖16可以看出,隨著溫度的提高,功耗優(yōu)化的效果更加明顯,周期為20 s、占空比為50%以及周期為80 s、占空比為25%時(shí)PTEC控制方法功耗優(yōu)化值在35℃相對(duì)于在20℃時(shí)分別提高了25.96%和16.12%;同時(shí)也驗(yàn)證了,隨著風(fēng)扇工作頻率的升高,功耗優(yōu)化的效果也更加明顯。
Figure 16 Comparison of power consumption at different temperatures圖16 不同溫度功耗優(yōu)化對(duì)比圖
本文提出一種基于預(yù)防性散熱的功耗優(yōu)化控制策略對(duì)服務(wù)器的功耗進(jìn)行優(yōu)化,通過評(píng)估參考點(diǎn)的電流變化來預(yù)測(cè)NF1溫度變化的趨勢(shì),然后發(fā)出相對(duì)應(yīng)的控制信號(hào)來預(yù)先調(diào)節(jié)風(fēng)扇轉(zhuǎn)速,達(dá)到功耗優(yōu)化的目的。隨后搭建了實(shí)驗(yàn)系統(tǒng),為了驗(yàn)證PTEC控制策略在不同工況下的有效性,針對(duì)控制系統(tǒng)中的風(fēng)扇功耗優(yōu)化問題,設(shè)計(jì)不同周期相同占空比、相同周期不同占空比以及不同溫度3組實(shí)驗(yàn)來對(duì)所提控制策略進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,系統(tǒng)中NF1工作頻率越高即周期越小時(shí),功耗優(yōu)化效果越好;在周期相同而占空比不同的情況下,當(dāng)占空比接近50%時(shí),功耗優(yōu)化效果最好;在不同溫度下的對(duì)比實(shí)驗(yàn)中,隨著工作環(huán)境溫度的提高,本文所提PTEC功耗優(yōu)化控制效果越好,驗(yàn)證了控制策略的有效性。與此同時(shí),除對(duì)文中所提實(shí)驗(yàn)平臺(tái)可以滿足散熱需求的同時(shí)也能達(dá)到較好的功耗優(yōu)化效果外,針對(duì)不同種類的服務(wù)器以及不同的核心發(fā)熱電子元器件,PTEC控制策略皆可推廣使用。