王 群
上海碳索能源服務(wù)股份有限公司
冷水機組是暖通空調(diào)系統(tǒng)主要耗能設(shè)備,最高可達(dá)60%~70%的比例,因此對冷水機組開展節(jié)能及故障診斷的工作意義重大。
冷水機組的模型分為黑箱、灰箱模型[1]。黑箱為純數(shù)據(jù)驅(qū)動模型,隨著人工智能發(fā)展,黑箱模型在實際工程中的應(yīng)用越來越廣,但其解釋性較差?;蚁淠P徒⒘死渌畽C組的物理模型,通過數(shù)據(jù)統(tǒng)計的方式確定其中的因子,比較常見的灰箱模型包括SL、BQ、MP、GNU、GNS 及LS 模型,本文采用實際項目數(shù)據(jù)對該6種灰箱模型進行評價。
實驗數(shù)據(jù)采用項目數(shù)據(jù),數(shù)據(jù)字段為810-814,602,601,719,739,此外還采用杭州氣象數(shù)據(jù)(字段1078)。原始數(shù)據(jù)見表1。
建立模型需要的數(shù)據(jù)包括:冷凍水供回水溫度T_rchw、T_schw,冷凍水流量F_chw,冷凍機主機功率P,冷卻水回水溫度T_rcow。采用的項目數(shù)據(jù)中缺少冷卻水?dāng)?shù)據(jù),因此根據(jù)虹橋機場氣象數(shù)據(jù)進行推測。在此處假設(shè)冷卻水回水溫度比濕球溫度高3 ℃。除此之外,原始數(shù)據(jù)的預(yù)先處理還包括:
1)去除冷凍水流量、冷凍水供回水溫度無數(shù)據(jù)點,若此行有一個數(shù)據(jù)無效點,則刪除此行;
2)判斷冷機單獨運行的時間。判斷依據(jù)為:如果該數(shù)據(jù)點的有功功率小于10 kW,則判斷該時間點冷機沒有運行。如果一數(shù)據(jù)點只有1臺有功功率大于10 kW,則認(rèn)為該時間點該冷機單獨工作。經(jīng)處理后,1~4 號主機單獨工作的數(shù)據(jù)點分別有861、1 932、714、1 862個;
3) 根據(jù)時間,將不同字段的數(shù)據(jù)進行鏈接,鏈接后再次去除無數(shù)據(jù)點。此項處理之后,1~4號冷機的數(shù)據(jù)點數(shù)量分別有120、741、13、162 個,根據(jù)結(jié)果,選擇2號冷機進行試驗;
4)冷機的數(shù)據(jù)包含了一些噪聲點,利用filter.py中的zscore_filter 進行數(shù)據(jù)清洗。在zscore_filter中,根據(jù)每一個變量的值計算其zscore,如果其大于閾值,則刪除該行數(shù)據(jù),經(jīng)處理后,2 號冷機剩余662個數(shù)據(jù)點。
由于經(jīng)過處理之后的數(shù)據(jù)在時間上沒有延續(xù)性,因此每一個數(shù)據(jù)點可以視為獨立而與前后數(shù)據(jù)點無關(guān)聯(lián)。處理后的數(shù)據(jù)示例見表2。其中溫度單位K,流量單位為m3/h,制冷量單位為kW。為進行建模,溫度參數(shù)單位全部需要轉(zhuǎn)換為K。
數(shù)據(jù)詳情見表3。
表1 原始數(shù)據(jù)
表2 數(shù)據(jù)示例
表3 數(shù)據(jù)詳情
探究模型見表4。其中,Tci 為冷卻水回水溫度,即T_rcow,單位:℃;Two為冷凍水供水溫度,即Tschw,單位℃;Twi為冷凍水回水溫度,即T_rchw,單位℃;Qe 為制冷量,單位為kW。在6 個模型中,SL、BQ、MP Model 為數(shù)據(jù)模型(Black Box Model),GNU、GNS、LS Model 為半物理模型(Grey Box Model)。
該報告主要包含了對6 個模型的預(yù)測精度、外圍預(yù)測、數(shù)據(jù)減少、參數(shù)物理意義等方面的探究。
1) 6 個模型性能的基本探究,主要以RMSE(Root-Mean-Squre-Error)和 CV(Coefficient of Variance)為判斷依據(jù)。兩個參數(shù)的計算公式分別為:
其中,為預(yù)測值,yi為真實值,n為用來測試的數(shù)據(jù)量。
2) 6 個模型對訓(xùn)練數(shù)據(jù)點以外的數(shù)據(jù)預(yù)測性能。如:利用8月的數(shù)據(jù)訓(xùn)練的模型對9月COP的預(yù)測精度的研究;
3)訓(xùn)練數(shù)據(jù)減少對模型性能的影響;
4)GNS、GNU、LS Model中幾個參數(shù)的物理意義研究。
4.1.1 回歸方法
在訓(xùn)練模型時,主要的方法是模型線性化之后進行回歸。其中SL、BQ、MP、GNS、LS Models 均采用此方法進行回歸。
BQ 中 令,GNS、LS 中 令然后線性回歸之后進行再計算得到COP。為探究GNS、LS Model的性能,回歸時同時探究了是否有常數(shù)項時模型的表現(xiàn)。
在線性回歸時,分別考慮有常數(shù)項和無常數(shù)項時模型的表現(xiàn)。
以下為3個灰箱模型回歸時的具體參數(shù)轉(zhuǎn)化。
(1)GNU Model
GNU Model的公式為:
回歸對應(yīng)公式為:
第一次回歸,y=β1x1+β2x2+β3x3+C1,
表4 探究模型
(2)GNS Model
GNS Model公式為:
回歸對應(yīng)公式為:
其中,為常數(shù)項。
(3)LS Model
LS Model 公式為:
回歸對應(yīng)公式為:
4.1.2 基本性能探究結(jié)果
在測試中,隨機選取2 號冷機中300 個數(shù)據(jù)點進行訓(xùn)練(注:300個數(shù)據(jù)點已足夠作為6個模型的訓(xùn)練數(shù)據(jù),詳見訓(xùn)練數(shù)據(jù)減少部分結(jié)果),其余數(shù)據(jù)作為測試數(shù)據(jù)。為研究噪聲數(shù)據(jù)對模型性能的影響,在有噪聲影響時(利用未過濾的2號冷機數(shù)據(jù)進行訓(xùn)練),同樣選擇300個訓(xùn)練數(shù)據(jù)進行訓(xùn)練。
為防止在預(yù)測時單個噪聲點對模型造成較大影響,對于預(yù)測結(jié)果中COP 小于0,大于10 的結(jié)果進行之前,用預(yù)測結(jié)果的平均值替代。在實際計算過程中,此項僅在MP Model及GNU Model中有重要作用。各個模型的性能在不同數(shù)據(jù)下的基本表現(xiàn)見表5。
未排除預(yù)測精度的隨機性,重復(fù)100 次試驗得到測試的平均值見表6。
根據(jù)預(yù)測結(jié)果:
在沒有噪聲的情況下,除無常數(shù)項的GNS、LS Model外,6個模型在數(shù)據(jù)量足夠的情況下表現(xiàn)差異不大,預(yù)測的相對誤差CV均在6%~7%之間,其中MP Model 預(yù)測精度最高,其次為含常數(shù)項的GNS Model;
GNU Model由于訓(xùn)練過程較為復(fù)雜,需要對預(yù)測結(jié)果進行修正,以防止單個反常點對模型精度產(chǎn)生較大的影響;
有噪聲數(shù)據(jù)時,6個模型平均的預(yù)測精度均出現(xiàn)了一定程度的下降,但總體還是保持了較好的準(zhǔn)確率。在沒有進行結(jié)果的修正之前,MP Model 的CV高達(dá)190%,模型本身對噪聲相當(dāng)敏感,容易出現(xiàn)單個點偏離值異常;
表5 模型基本表現(xiàn)
表6
在沒有常數(shù)項 C 時,GNS、LS Model 預(yù)測結(jié)果均不理想,而GNU Model 表現(xiàn)與含常數(shù)項相差不大。
6 個模型的預(yù)測性能(無噪聲訓(xùn)練數(shù)據(jù))詳見圖1。
探究訓(xùn)練模型對未來數(shù)據(jù)的預(yù)測能力是模型性能探究的重要部分。將2號機數(shù)據(jù)按月分為三部分,其中包括 175 條 8 月數(shù)據(jù)點,294 條 9 月數(shù)據(jù),198 條 10 月數(shù)據(jù)。三組數(shù)據(jù)中 COP 均為 3~6 之間。比較的內(nèi)容包括:6 個模型利用8 月數(shù)據(jù)訓(xùn)練對 9 月 和 10 月 進 行 預(yù) 測 Aug-> Sept、Aug->Oct、Aug->Sept,Oct,利用9月數(shù)據(jù)訓(xùn)練對10月進行預(yù)測Sept-> Oct,利用8、9 月數(shù)據(jù)訓(xùn)練對10月進行預(yù)測Aug, Sept-> Oct;為了比較各個月的數(shù)據(jù)量不同對結(jié)果的影響,每個月的數(shù)據(jù)量根據(jù)最少數(shù)據(jù)月(8 月)進行隨機去除,并用去除后的數(shù)據(jù)進行試驗,重復(fù)試驗50 次,最后將結(jié)果進行平均。預(yù)測結(jié)果見表7。
圖1 6個模型的預(yù)測-真實值散點圖(19:含常數(shù)項,20:不含常數(shù)項)
表7 中綠色表示模型CV 值小,紅色表示CV值大。典型的模型預(yù)測-真實值散點圖見圖2。
對比預(yù)測結(jié)果:
各個模型對外圍數(shù)據(jù)的預(yù)測并不精確,僅8月數(shù)據(jù)對9月的預(yù)測結(jié)果較好,而其他項模型的CV值較大,預(yù)測結(jié)果不理想;
根據(jù)各預(yù)測結(jié)果的平均CV,排除隨機性 ,SL Model、BQ Model 和 無 常 數(shù) 項 的 LS Model 對未來數(shù)據(jù)的預(yù)測最差,其他5 個模型的性能差異不大,灰箱模型的表現(xiàn)稍好于數(shù)據(jù)驅(qū)動模型;
對所有模型而言,主要誤差來源為預(yù)測得到的COP 偏小,BQ Model 還存在部分點預(yù)測COP偏大;
在此項預(yù)測中,GNS Model結(jié)果較為穩(wěn)定,但由于其基礎(chǔ)誤差較大,參考意義不高。
為得到模型在不同的訓(xùn)練數(shù)據(jù)下的預(yù)測表現(xiàn),隨機選取n條數(shù)據(jù),對模型進行訓(xùn)練,然后用剩余數(shù)據(jù)作為測試數(shù)據(jù),計算該模型的CV。經(jīng)過30 次隨機之后,對所得的結(jié)果進行平均即為該模型在此數(shù)據(jù)量中的表現(xiàn)。6 個模型的表現(xiàn)見圖3,由于GNS Model 在沒有常數(shù)項時表現(xiàn)過差,在后面的討論中不再提及。在測試過程中注意訓(xùn)練誤差和測試誤差的變化,以預(yù)防過度擬合。
根據(jù)模型在預(yù)測時的精度做出的三色圖(N 表示無常數(shù)項)見圖4。圖中,從上往下訓(xùn)練數(shù)據(jù)條數(shù)依次增大,綠色表示CV值較?。?6.5%),紅色表示CV值較大(>9%)。
表7 模型對未來數(shù)據(jù)的預(yù)測表現(xiàn)
圖2 未來數(shù)據(jù)預(yù)測的典型預(yù)測-真實散點圖
圖3 模型在訓(xùn)練數(shù)據(jù)減少時的CV值(小圖為訓(xùn)練誤差和測試誤差)
結(jié)合各圖,可以看出:
在數(shù)據(jù)驅(qū)動模型中,SL 模型收斂最快,MP次之,BQ 最慢,在數(shù)據(jù)量足夠時BQ Model 和MP Model 模型預(yù)測精度更高,BQ、MP Model 在數(shù)據(jù)量達(dá)到125 條之后數(shù)據(jù)增加對模型的表現(xiàn)影響不大;
GNS Model 在沒有常數(shù)項時不能很好擬合數(shù)據(jù),無論是訓(xùn)練誤差還是預(yù)測誤差都較大;
相比數(shù)據(jù)驅(qū)動模型,灰箱模型所需要的訓(xùn)練數(shù)據(jù)更少,在數(shù)據(jù)較少的情況下,灰箱模型明顯有更好的預(yù)測精度;
LS Model 在沒有常數(shù)項時表現(xiàn)精度不高,而加入常數(shù)項后表現(xiàn)較好。
GNU N Model 和 GNS Model 在 所 有 模 型中表現(xiàn)最好,其需要的訓(xùn)練數(shù)據(jù)少,約75 條模型的訓(xùn)練誤差和測試誤差即相差不多,GNU Model 的參數(shù)更有物理意義,GNS Model 則擁有較高的預(yù)測精度,其他模型與這兩個模型的表現(xiàn)相差較大。
圖4 訓(xùn)練數(shù)據(jù)減少時模型CV三色圖(Min:6.5%,Max:9%,Medium:7.5%)
在6 個模型中,有GNS、GNU、LS 均為灰箱模型。為將模型應(yīng)用于故障診斷,此報告包含對模型參數(shù)物理意義的探究。
4.4.1 GNU Model
GNU Model的公式為:
回歸對應(yīng)公式:
第一次回歸,y=β1x1+β2x2+β3x3+C1,
其中,β1~β3均有各自的物理意義:
β1— ΔS,由于內(nèi)部不可逆性,冷水機組總內(nèi)熵產(chǎn)生率,
β2— Qleak,熱量損失/增加率來自或進入冷水機組,
β3——R,總換熱器熱阻。
GNS Model公式為:
回歸對應(yīng)公式為:
β1~β3為該冷機的熵增特性(characterize the entropy generation of a particular chiller)。4.4.3 LS Model
LS Model 公式為:
回歸對應(yīng)公式為:
該模型的參數(shù)意義理論上與GNS Model相似,均是冷機的熵增特性。,
4.4.4 結(jié)果及討論
在現(xiàn)有的數(shù)據(jù)中隨機選擇足夠多的數(shù)據(jù)進行反復(fù)訓(xùn)練,即得到該數(shù)據(jù)集的參數(shù)分布。此報告中選擇200~250 條數(shù)據(jù),每個數(shù)據(jù)量隨機重復(fù)50次,從而得到2 500 次訓(xùn)練的參數(shù)。由于GNU Model 無常數(shù)項的表現(xiàn),因此不再考慮加入常數(shù)項后的模型,而GNS、LS 模型,則需考慮加入常數(shù)項后的模型。
GNU Model
各參數(shù)分布圖(橫軸為參數(shù)值,縱軸為頻數(shù))
根據(jù)理論,β1~β3分別對應(yīng)熵增ΔS, 熱損Qleak,換熱器熱阻R。某一典型(冷機功率3~4 kW)的回歸結(jié)果見圖5,結(jié)合數(shù)據(jù)來源冷機的功率(Pmean=1961 kW)。統(tǒng)計結(jié)果見表8,回歸結(jié)果見表9。
初步判斷,β1、β2、β3的分布范圍不大,遵循正態(tài)分布,具有物理意義,可以作為故障診斷的依據(jù)。但在回歸時可能會有比較意外的值出現(xiàn),因此建議多次隨機取數(shù)據(jù)點訓(xùn)練之后得到參數(shù)的平均值。此外,對β2,由于與試驗結(jié)果的符號不同,因此建議通過實際測量數(shù)據(jù)進行校對,以確認(rèn)其符號。
圖5
表8 統(tǒng)計結(jié)果
表9 典型的GNU Model回歸結(jié)果
含常數(shù)項時各參數(shù)分布見圖6(橫軸為參數(shù)值,縱軸為頻數(shù))。
不含常數(shù)項時各參數(shù)分布圖見圖7(橫軸為參數(shù)值,縱軸為頻數(shù))。
根據(jù)J.M.Gordon等人的試驗,典型的結(jié)果見表9,其中A0~A2對應(yīng)β1~β3,同時與沒有常數(shù)項的回歸結(jié)果對比發(fā)現(xiàn),實際得到的參數(shù)分布和實驗數(shù)據(jù)差別較大,因此物理意義有待確認(rèn)。
LS Model
含常數(shù)項時各參數(shù)分布圖(橫軸為參數(shù)值,縱軸為頻數(shù))見圖9。
·GNS Model
圖6 含常數(shù)項時各參數(shù)分布
圖7 不含常數(shù)項時各參數(shù)分布
表10 統(tǒng)計結(jié)果(N 表示無常數(shù)項)
表11 某試驗結(jié)果
不含常數(shù)項時各參數(shù)分布圖(橫軸為參數(shù)值,縱軸為頻數(shù))見圖10,統(tǒng)計結(jié)果見表10。
根據(jù)結(jié)果,發(fā)現(xiàn)在加入常數(shù)項后各參數(shù)的分布發(fā)生了巨大變化,因此認(rèn)為在加入常數(shù)項后,LS Model參數(shù)不再具有的物理意義。
經(jīng)過華為數(shù)據(jù)的試驗,所探究的6 個模型在冷機COP 預(yù)測上均能達(dá)到較高的精度。各個模型的特點總結(jié)見表11。
從故障診斷的角度看,GNU Model 和GNS Model 兩種模型具有較好的前景。GNS Model 的參數(shù)雖然物理意義待確認(rèn),但仍可以作為換熱器工作狀況的一項指標(biāo),且其要求的訓(xùn)練參數(shù)較少,很快模型即可穩(wěn)定;GNU Model 的參數(shù)可以用來診斷制冷劑在循環(huán)中的流動情況、機組換熱器的工作情況等。但是,具體的診斷過程需要有相應(yīng)的數(shù)據(jù)才能進行更好的研究。相比之下,GNU 模型的性能更為優(yōu)秀,其各個參數(shù)物理意義較為明確,各參數(shù)基本遵循正態(tài)分布,對訓(xùn)練數(shù)據(jù)的要求較少,可以作為故障診斷的冷機模型。
圖8 含常數(shù)項時各參數(shù)分布圖
圖9 不含常數(shù)項時各參數(shù)分布圖
表12 統(tǒng)計結(jié)果(N 表示無常數(shù)項)
表13 模型探究總結(jié)