胡海,張菁惠,孟憲春,夏利峰,葉振興
(合肥聯(lián)寶信息技術(shù)有限公司,安徽 合肥 230601)
智能制造技術(shù)是基于先進(jìn)的信息通信技術(shù)與先進(jìn)的制造技術(shù),并結(jié)合人類專家知識庫組成的一體化系統(tǒng),貫穿于產(chǎn)品制造的全生命周期的各個(gè)環(huán)節(jié)。智能制造技術(shù)可以在產(chǎn)品制造過程中的對人類專家的智能活動進(jìn)行分析、判斷、推理和決策,取代制造環(huán)境中的部分人力勞動,甚至在產(chǎn)品賣出后,進(jìn)行產(chǎn)品性能追蹤,反饋,從而對產(chǎn)品整個(gè)生命周期的性能、參數(shù)進(jìn)行實(shí)時(shí)的跟蹤。隨著新一代信息技術(shù)的應(yīng)用與發(fā)展,智能制造已成為國內(nèi)外制造業(yè)發(fā)展的共同趨勢,成為新一輪工業(yè)革命的核心驅(qū)動力[1,2]。
智能制造會逐漸走向數(shù)字化、網(wǎng)絡(luò)化、智能化制造,屬于多種技術(shù)的綜合應(yīng)用,且這種模式突出了知識在制造活動中的價(jià)值地位,使智能制造成為影響未來經(jīng)濟(jì)發(fā)展過程的重要生產(chǎn)模式。根據(jù)生產(chǎn)過程中產(chǎn)品的差異性,各個(gè)制造業(yè)大廠分別在進(jìn)行不同的智能制造技術(shù)升級。本文結(jié)合我司筆記本電腦設(shè)計(jì)、生產(chǎn)過程中的特點(diǎn),提出了一種可以實(shí)現(xiàn)筆記本電腦在生產(chǎn)過程中,產(chǎn)品在客戶終端使用過程中均可以實(shí)時(shí)檢測CPU 溫升,以及散熱模組的散熱性能控制方式,并經(jīng)過實(shí)驗(yàn)測試和產(chǎn)品導(dǎo)入過程,目前正在正常運(yùn)行,為企業(yè)的智能制造升級提供了助力。
筆記本電腦芯片在工作過程中,其功耗消耗會引起芯片本體及芯片周邊空氣及主板上元器件溫度的上升。筆記本電腦主板上的芯片和元器件均有一定的使用溫度范圍,在過高的本體溫度和周圍環(huán)境溫度條件下,很多元器件無法正常工作,會導(dǎo)致電腦的基本功能的喪失。而由于近年來筆記本電腦芯片功耗逐年增高,芯片工作時(shí)產(chǎn)生大量的熱量,直接影響其工作壽命,同時(shí)也會導(dǎo)致周圍元器件的失效。55%以上的電子設(shè)備及其器件的失效是由于過熱引起的,溫度每增加1 ℃,電子器件可靠性就會下降5%[3,4]。根據(jù)每種型號的筆記本電腦進(jìn)行散熱模組的設(shè)計(jì)和匹配是重要的產(chǎn)品研發(fā)環(huán)節(jié),同時(shí),散熱模組在生產(chǎn)線上的正確組裝和鎖緊,更是將產(chǎn)品從設(shè)計(jì)到生產(chǎn)出來的重要過程。筆記本電腦在制作過程中需要大量的人力進(jìn)行組裝,人員的工作素質(zhì)或者對產(chǎn)品的熟悉程度不夠,螺絲未鎖,或者散熱模組中的某些組件來料不良,導(dǎo)熱系數(shù)低,均會導(dǎo)致從芯片到環(huán)境的散熱路徑的熱阻急劇變大。在CPU 加載重載情況下,芯片熱量不能及時(shí)散出去,會導(dǎo)致整機(jī)降頻甚至直接由于溫度過高導(dǎo)致強(qiáng)制關(guān)機(jī)的風(fēng)險(xiǎn),這樣的失誤會造成產(chǎn)品大規(guī)模回收的事件,對企業(yè)的經(jīng)濟(jì)和品牌形象造成了一定的影響。
結(jié)合智能制造技術(shù),通過理論分析,設(shè)計(jì)出簡單快捷的測試程序,在生產(chǎn)過程中短時(shí)間內(nèi)就可以判斷整機(jī)產(chǎn)品螺絲是否鎖附良好并且判斷從芯片到環(huán)境的熱阻符合設(shè)計(jì)要求,防止有問題機(jī)臺流入用戶手中,并且在良品賣出到客戶處,通過系統(tǒng)及網(wǎng)絡(luò)的控制,對產(chǎn)品進(jìn)行定期的性能檢測,在散熱模組出現(xiàn)性能不足時(shí),提醒客戶更換散熱模組從而保證整機(jī)性能使用正常,是本文對筆記本電腦在智能制造方面提出的一種控制方式。
本文利用某型號筆記本電腦為原型,對其在CPU 重載加載的瞬態(tài)條件下CPU溫升變化進(jìn)行理論和實(shí)際測試分析,設(shè)計(jì)了一款測試可以自動判斷筆記本電腦CPU 到空氣間散熱路徑上的綜合熱阻是否滿足設(shè)計(jì)要求的判定程序[5-7]。熱量傳遞主要有三種方式:熱傳導(dǎo)、熱對流、熱輻射。在筆記本電腦散熱過程中,這三種方式都有發(fā)生。熱量傳遞過程中,熱阻單位為℃/W,其物理意義就是傳遞1 W 的熱量需要多少度溫差,在熱設(shè)計(jì)中將熱阻標(biāo)記為R。圖1為筆記本電腦芯片熱量傳遞的原理結(jié)構(gòu)圖和熱阻結(jié)構(gòu)圖。
圖1 筆記本電腦芯片原理及熱阻結(jié)構(gòu)圖
式(1)代表了從芯片中心到外界環(huán)境的熱阻計(jì)算公式。其中:Rja為熱量從芯片傳遞到外界空氣環(huán)境的總熱阻;Rjc為熱量從芯片中心傳遞到芯片殼體的熱阻,常稱為結(jié)殼熱阻;Rcs為熱量從芯片殼體表面經(jīng)過熱界面材料傳遞到熱管表面的界面熱阻;Rsa為從散熱模組傳遞到空氣環(huán)境中的綜合熱阻(含導(dǎo)熱熱阻和對流換熱熱阻)。
這三個(gè)熱阻組成部分里面,Rjc取決于芯片本體的封裝結(jié)構(gòu),與整機(jī)系統(tǒng)安裝過程無關(guān);Rsa的值的大小取決于散熱模組熱管組件疊層結(jié)構(gòu)的設(shè)計(jì),此結(jié)構(gòu)一般由熱管焊接一個(gè)金屬塊組成,模組制作完成后,此值也很穩(wěn)定不會受組裝影響;Rcs是芯片表面和熱管組件接觸面之間的接觸熱阻,取決于熱界面材料和芯片和散熱模組界面之間的壓力值。圖2為熱界面材料應(yīng)用的理論分析圖。熱界面材料(Thermal Interface Material)是用于涂敷在散熱器件與發(fā)熱器件之間,降低它們之間接觸熱阻所使用的材料的總稱。由于表面均會有粗糙度,所以兩個(gè)接觸表面之間,均不可能完全接觸在一起,總會有一些空氣間隙在其中,而由于空氣的導(dǎo)熱系數(shù)非常小,因此就造成了較大的接觸熱阻,而熱界面材料就可以填充這個(gè)空氣間隙,降低接觸熱阻,提高散熱性能。
圖2 界面材料應(yīng)用場景
筆記本電腦芯片的安裝過程中,熱界面材料涂敷在熱管組件的表面,由螺絲將整個(gè)散熱模組鎖附在主板上,芯片和散熱模組之間通過熱界面材料進(jìn)行傳熱,而芯片和散熱模組之間的接觸熱阻就取決于熱界面材料的導(dǎo)熱系數(shù)和安裝時(shí)候的安裝壓力,即Rcs的值對CPU 散熱效果影響很大。當(dāng)螺絲鎖付良好的時(shí)候,熱界面材料被壓縮到設(shè)計(jì)值,起到良好的導(dǎo)熱作用;而當(dāng)整機(jī)組裝過程不良,散熱模組鎖付不良,導(dǎo)致熱界面材料受不到一定的壓力,無法起到填縫的作用,當(dāng)CPU 加載重載時(shí),溫升會明顯變大。
本文采用FLotherm 軟件對某整機(jī)筆記本電腦在組裝過程中散熱模組鎖附不良造成的CPU 瞬態(tài)溫升變化進(jìn)行了熱仿真計(jì)算。為了研究CPU 在瞬間加載重載過程中,芯片功耗上升造成的CPU 核溫瞬間上升的變化過程,建立了板級系統(tǒng)模型,并采用瞬態(tài)分析模型進(jìn)行計(jì)算。主板及散熱模組等模型的材料選型及參數(shù)如表1所示,板級仿真模型如圖3所示。
圖3 板級仿真模型圖
表1 主要元器件屬性
在表1中材料的導(dǎo)熱系數(shù)都是取的該筆記本電腦材料的實(shí)際值,其中CPU grease 即CPU 表面與散熱模組之間的導(dǎo)熱界面材料,常規(guī)的用導(dǎo)熱膏。芯片瞬態(tài)加載重載過程中芯片向殼體外部傳遞熱量主要通過導(dǎo)熱實(shí)現(xiàn)。本文研究的內(nèi)容是螺絲鎖付不良造成的CPU 瞬態(tài)溫升的差異,為了能用軟件仿真模擬螺絲鎖付狀態(tài)不良造成的CPU 溫升的差異,分別將CPU grease 的導(dǎo)熱系數(shù)設(shè)置為0.03、0.3、1 和3 W/m.K等幾種不同的值來仿真模擬計(jì)算螺絲不鎖、螺絲鎖附1 顆、螺絲鎖附2 顆和螺絲正常4 顆全部鎖附良好正常狀態(tài)下,芯片本體的瞬態(tài)溫升變化。通過以上參數(shù)設(shè)置,利用Flotherm進(jìn)行瞬態(tài)仿真計(jì)算CPU 溫升,得到圖4中隨著導(dǎo)熱界面材料導(dǎo)熱系數(shù)變化,CPU 瞬態(tài)溫升的差異,其中,CPU 溫度結(jié)合實(shí)際產(chǎn)品運(yùn)行過程,設(shè)置了105 ℃的閾值,即當(dāng)CPU溫度達(dá)到105 ℃,即停止溫升。從圖4中不同界面材料導(dǎo)熱系數(shù)條件下CPU 在10 秒以內(nèi)瞬態(tài)溫升變化可以看到,當(dāng)螺絲鎖付不良導(dǎo)致芯片和散熱模組之間的界面熱阻變大時(shí),CPU 瞬時(shí)溫升上升速度很快。
圖4 不同界面材料導(dǎo)熱系數(shù)條件下CPU 在10 秒以內(nèi)瞬態(tài)溫升變化
從以上的理論和仿真分析結(jié)果可以看出,筆記本電腦整機(jī)散熱模組螺絲鎖附不良,會導(dǎo)致整機(jī)性能下降,而且如果生產(chǎn)線員工無法及時(shí)查出這種問題機(jī)臺,很可能會造成機(jī)臺流入客戶手中產(chǎn)生性能不良的投訴案例。如果能夠在生產(chǎn)線生產(chǎn)過程的中,采用動態(tài)法實(shí)時(shí)測試組裝完成后的樣機(jī)的芯片瞬態(tài)溫度響應(yīng)曲線,并且根據(jù)其溫度響應(yīng)曲線判斷機(jī)臺是否組裝良好,就可以提前規(guī)避這個(gè)風(fēng)險(xiǎn)。本文設(shè)計(jì)了一段控制程序,并將該程序直接在筆記本電腦底層EC 代碼中加入,即可以在生產(chǎn)線用于攔截不良機(jī)臺,進(jìn)行大數(shù)據(jù)收集和分析,確保廠商的散熱模組到料的品質(zhì),還可以為下一代的產(chǎn)品設(shè)計(jì)的散熱模組部件選型提供數(shù)據(jù)支撐。圖5為本文設(shè)計(jì)的邏輯控制流程圖。
圖5 邏輯控制流程圖
如圖5所示,此段代碼通過底層EC 代碼導(dǎo)入,產(chǎn)品在當(dāng)生產(chǎn)線上運(yùn)行到此監(jiān)測點(diǎn)時(shí),此段邏輯代碼被調(diào)用,風(fēng)扇開啟,瞬時(shí)給CPU 加滿重載,讓CPU 在短時(shí)間內(nèi)功耗達(dá)到最大,并在短時(shí)間內(nèi)(10 秒以內(nèi))判斷散熱模組是否安裝良好的程序。該程序可以動態(tài)實(shí)時(shí)檢測CPU 溫度,采樣頻率為1 秒鐘,CPU 溫度的分辨率為1 ℃。該程序的目的是利用在短時(shí)間內(nèi)測試CPU 瞬態(tài)溫度響應(yīng)曲線,并將測試曲線轉(zhuǎn)換成函數(shù),并跟本機(jī)型的預(yù)留的函數(shù)判定閾值進(jìn)行比較,給出整機(jī)是合格還是不良品的展示結(jié)果。為了實(shí)現(xiàn)這一目的,對整機(jī)系統(tǒng)進(jìn)行螺絲鎖附不良情況下CPU 的溫升進(jìn)行重復(fù)性測試。圖6為本文中采用的機(jī)型實(shí)物圖和對應(yīng)的CPU 芯片部分的散熱模組鎖附實(shí)物圖。
圖6 整機(jī)散熱模組鎖附實(shí)物圖
為了對仿真結(jié)果進(jìn)行準(zhǔn)確性驗(yàn)證,需要進(jìn)行整機(jī)實(shí)驗(yàn)測試。筆記本電腦整機(jī)的熱測試實(shí)驗(yàn)環(huán)境采用行業(yè)的標(biāo)準(zhǔn)chamber 進(jìn)行測試,環(huán)境溫度控制在25 ℃,使用EC 底層邏輯中加入邏輯控制代碼進(jìn)行控制,使CPU 在短時(shí)間內(nèi)加載最大的負(fù)載,同時(shí)測試每秒鐘CPU 的溫度數(shù)值。為了對比不同的螺絲鎖付狀態(tài)下,CPU 溫升效果,設(shè)計(jì)了螺絲正常鎖附、鎖附1 顆螺絲和不鎖螺絲三種實(shí)驗(yàn)條件進(jìn)行測試。圖7為經(jīng)過多臺樣機(jī)測試后,得到的這三種狀態(tài)下,CPU 核溫瞬態(tài)溫升響應(yīng)曲線。從圖7中曲線群可以看出,正和圖4中仿真結(jié)果呼應(yīng),這三種條件下,CPU 瞬態(tài)溫升響應(yīng)曲線的升溫速率相差較大,將溫升曲線利用最小二乘法的高等數(shù)學(xué)變換方法變換成溫度和時(shí)間的曲線關(guān)系,發(fā)現(xiàn)曲線斜率差異很明顯。
圖7 三種狀態(tài)下加載過程中CPU 核溫瞬態(tài)溫升響應(yīng)曲線
圖8為重復(fù)測試幾十臺不同螺絲鎖付效果的機(jī)臺的CPU瞬態(tài)溫升響應(yīng)曲線對應(yīng)的溫升斜率值的分布,得到如下結(jié)論。
圖8 溫升斜率值判定閾值設(shè)定
由圖8可得到以下結(jié)論:
(1)同一種結(jié)構(gòu)的測量重復(fù)性非常好;
(2)測試結(jié)果顯示,全不鎖和全鎖可以區(qū)分比較明顯,只鎖一個(gè)螺絲的也可以區(qū)分開來,鎖兩個(gè)螺絲的,尤其是鎖對角螺絲的,不好區(qū)分;
(3)根據(jù)圖8中數(shù)據(jù)可以設(shè)定該型號機(jī)臺生產(chǎn)過程中散熱性能判定的閾值,根據(jù)計(jì)算出來的線性回歸系數(shù)值,當(dāng)a>4.2 代表螺絲沒鎖,或者只鎖了一個(gè),是NG 的,小于這個(gè)數(shù)值的代表OK;
(4)以上數(shù)據(jù)是按照正常的樣品測試了5 個(gè)模組,每個(gè)模組重復(fù)測試三次以上得到的結(jié)論,理論上可以代表批量的數(shù)據(jù)。
通過以上的分析,該種機(jī)臺在生產(chǎn)線上運(yùn)行時(shí),到了此檢測點(diǎn)的時(shí)候,開啟檢測程序,此程序可以判斷生產(chǎn)機(jī)臺的散熱性能是否滿足設(shè)計(jì)要求,即當(dāng)某機(jī)臺生產(chǎn)過程中檢測該值超過設(shè)計(jì)閾值的時(shí)候,判定產(chǎn)品CPU 散熱不良,會被判定不合格,打回維修區(qū)進(jìn)行處理,避免問題產(chǎn)品流出。
本文采用flotherm 軟件,針對某款筆記本電腦用芯片,對板級模型條件下CPU 的瞬態(tài)溫升進(jìn)行了仿真,得到不同的界面熱阻條件下,CPU 瞬態(tài)溫升的差異。通過將控制代碼寫入筆記本電腦EC 底層,調(diào)用CPU 的加載以及溫升記錄和判斷,從而實(shí)現(xiàn)生產(chǎn)線上實(shí)時(shí)檢測筆記本電腦整機(jī)螺絲鎖附是否良好的效果。從生產(chǎn)線生產(chǎn)過程中第一時(shí)間發(fā)現(xiàn)問題機(jī)臺,避免問題機(jī)臺流入客戶手中,從而實(shí)現(xiàn)筆記本電腦散熱效果的智能制造。
本文主要結(jié)論如下:
(1)通過瞬態(tài)溫升仿真結(jié)果判定不同界面熱阻條件下,CPU 核溫溫升差異很大;
(2)通過EC 底層控制邏輯中導(dǎo)入控制代碼實(shí)現(xiàn)短時(shí)間內(nèi)對CPU 進(jìn)行功耗加載核溫度實(shí)時(shí)檢測;
(3)可實(shí)時(shí)通過底層邏輯代碼檢測CPU 等半導(dǎo)體器件結(jié)溫溫升特性從而定位組裝缺陷問題;
(4)用來幫助產(chǎn)線在實(shí)際生產(chǎn)過程中評價(jià)導(dǎo)熱材料的散熱效果,評估供應(yīng)商到料的散熱模組的優(yōu)良,并為下一代產(chǎn)品的設(shè)計(jì)提供大數(shù)據(jù)支撐;
(5)不需要額外人力安排,只需要背景服務(wù)程序在10秒內(nèi)完成整機(jī)檢驗(yàn)并反饋問題點(diǎn);
(6)可用于產(chǎn)品使用時(shí)間長后,熱管、風(fēng)扇老化造成的性能下降,CPU 溫升過高的判定。加上此散熱特性斜率的計(jì)算,當(dāng)系統(tǒng)的散熱斜率特性老化到下限值后,我們會主動提醒使用者這個(gè)現(xiàn)象讓使用者盡速維修來避免老化造成的使用者體驗(yàn)差還有熱造成電池膨脹所帶來的危險(xiǎn)。