翁 虎,何 勇,梁 健
(貴州大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,貴陽(yáng) 550025)
現(xiàn)代生活中,人們的工作和生活時(shí)間大多數(shù)都在室內(nèi)度過(guò),舒適的室內(nèi)環(huán)境成為了目前人們的迫切需求.通過(guò)智能家居來(lái)調(diào)控室內(nèi)家具設(shè)備,使其改變室內(nèi)環(huán)境屬性,進(jìn)而使室內(nèi)到達(dá)舒適,是目前智能家居一個(gè)重要應(yīng)用和研究方向.室內(nèi)環(huán)境的熱舒適度由多個(gè)客觀和主觀因素共同影響,目前評(píng)價(jià)室內(nèi)熱舒適主要采用丹麥工業(yè)大學(xué)教授Fanger PO 于1970年提出的PMV-PPD 指標(biāo)[1],其中預(yù)測(cè)平均投票值(Predicted Mean Vote,PMV)指對(duì)熱環(huán)境舒適感的高低,預(yù)測(cè)不滿意百分?jǐn)?shù)(Predicted Percentage of Dissatisfied,PPD)指對(duì)熱環(huán)境不滿意的預(yù)測(cè)的百分比人數(shù).熱舒適度一般指PMV 公式計(jì)算出的熱感覺(jué)指標(biāo),其越接近0 表示環(huán)境越接近熱中性的舒適區(qū).表1所示為PMV 指標(biāo)的熱感覺(jué)分布.
表1 熱感覺(jué)與PMV 值對(duì)應(yīng)表
近年來(lái),不少學(xué)者使用機(jī)器學(xué)習(xí)算法來(lái)研究PMV公式,如使基于鳥(niǎo)群算法優(yōu)化[2]和粒子群優(yōu)化[3]的BP 神經(jīng)網(wǎng)絡(luò)算法實(shí)現(xiàn)對(duì)PMV 預(yù)測(cè),以及基于先驗(yàn)知識(shí)和模糊自適應(yīng)算法構(gòu)建的PMV 控制模型[4].多數(shù)研究集中在對(duì)PMV 的擬合回歸,本研究從智能家居角度出發(fā),考慮到實(shí)際場(chǎng)景中,在模塊化和組件化的智能家居中獲取的數(shù)據(jù)并不一定能滿足標(biāo)準(zhǔn)PMV 的計(jì)算要求,例如存在風(fēng)速和平均輻射溫度不宜獲取的情況,導(dǎo)致PMV 計(jì)算存在誤差甚至錯(cuò)誤.
針對(duì)智能家居場(chǎng)景中所面臨的問(wèn)題,本論文研究提出在在裁剪掉部分參量的情況下,引入一些容易獲取的氣候特征與環(huán)境參數(shù),使用差分進(jìn)化算法優(yōu)化后的BP 神經(jīng)網(wǎng)絡(luò)構(gòu)建對(duì)PMV 的擬合模型,實(shí)現(xiàn)在一定誤差范圍內(nèi)對(duì)PMV 的有效計(jì)算,其算法模型如圖1.
圖1 DE-BP 算法模型圖
本文研究所擬合的PMV 計(jì)算公式如式(1)所示,式(2)~式(5)為式(1)中部分參數(shù)的計(jì)算公式,表2為公式中參數(shù)的含義解釋.PMV 計(jì)算過(guò)程較為繁雜,是一個(gè)多元非線性函數(shù),分析后可知PMV 計(jì)算實(shí)際需要的參數(shù)有以下7 個(gè):基礎(chǔ)代謝率M、額外活動(dòng)機(jī)械功W、平均輻射溫度、空氣溫度ta、服裝熱阻Icl、相對(duì)風(fēng)速va和相對(duì)濕度hr.
對(duì)于上述需要獲取的客觀參數(shù)中,在智能家居領(lǐng)域內(nèi)空氣溫度和相對(duì)濕度容易采集,有很多常用溫度濕度傳感器能做到;服裝熱阻和新陳代謝率若無(wú)法準(zhǔn)確獲取,則一般使用正常成年人的指標(biāo)和經(jīng)驗(yàn)值計(jì)算;人體活動(dòng)所做的功采集較為困難,一般研究中都以靜坐為參考分析;平均輻射溫度代表房屋本及其裝飾物給人體帶來(lái)的溫度輻射作用,平均輻射溫度的測(cè)量較為復(fù)雜和困難,但研究表明[5],在多數(shù)情況下可用空氣溫度代替平均輻射溫度,其誤差可忽略不計(jì);風(fēng)速的測(cè)量較為困難,準(zhǔn)確檢測(cè)室內(nèi)人體附近的空氣流速需要昂貴復(fù)雜的設(shè)備,在智能家居中不經(jīng)濟(jì).風(fēng)速和平均輻射溫度的測(cè)量困難與不準(zhǔn)確性,在一定程度上導(dǎo)致了熱舒適度測(cè)量的客觀不確定性[6].因此論文提出的規(guī)避不易測(cè)量的參量來(lái)擬合PMV 公式的計(jì)算具有一定實(shí)際意義.
表2 PMV 公式參數(shù)解釋
本研究使用的數(shù)據(jù)集是ASHRAE 全球熱舒適數(shù)據(jù)庫(kù)[7],這是由加州大學(xué)伯克利分校收集全球上百篇論文的實(shí)際實(shí)驗(yàn)數(shù)據(jù)整理出的數(shù)據(jù)集.對(duì)于數(shù)據(jù)集中的樣本首先要進(jìn)行數(shù)據(jù)清洗,根據(jù)常識(shí)和具體情況清洗樣本中不正常的數(shù)據(jù),如存在違反常識(shí)的數(shù)據(jù):56 m/s的室內(nèi)風(fēng)速.其次,數(shù)據(jù)集是由許多世界各地的學(xué)者實(shí)際測(cè)量的,其結(jié)果可能存在誤差,因此需要使用標(biāo)準(zhǔn)公式重新計(jì)算樣本的PMV 值,使用其中誤差較小的樣本.論文模型使用的數(shù)據(jù)特征不僅包含了PMV 公式中的空氣溫度、相對(duì)濕度、衣服熱阻和新城代謝率等連續(xù)特征外,還包含了氣候類型、房間類型、月平均氣溫和季節(jié)等離散特征.對(duì)樣本中的離散特征進(jìn)行獨(dú)熱編碼(one-hoting encoding),將4 個(gè)離散特征編碼成了25 列的01 矩陣,這樣的轉(zhuǎn)換使其能參與神經(jīng)網(wǎng)絡(luò)的運(yùn)算,與其他4 個(gè)連續(xù)特征組成了29 維的輸入.為了更好的進(jìn)行神經(jīng)網(wǎng)訓(xùn)練,因此對(duì)連續(xù)特征進(jìn)行歸一化處理,歸一化公式如下所示:
BP 神經(jīng)網(wǎng)絡(luò)是采用誤差反向傳播的神經(jīng)網(wǎng)絡(luò),一般由輸入層,隱藏層和輸出層3 部分構(gòu)成,每層由多個(gè)神經(jīng)元感知器組成.每層之間通過(guò)激活函數(shù)來(lái)激活其神經(jīng)元是否參與運(yùn)算和計(jì)算權(quán)值,一般層與層之間通過(guò)全連接來(lái)進(jìn)行信息傳遞.圖2是論文的神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)示意圖.
圖2所示神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)中,wi表示第i層總的權(quán)值矩陣,加上下標(biāo)j定位到單個(gè)神經(jīng)元.bi,j是神經(jīng)元節(jié)點(diǎn)的閾值,x表示神經(jīng)網(wǎng)絡(luò)的輸入.設(shè)f為激活函數(shù),則任意一個(gè)神經(jīng)元的輸出ai,j可表示為:
圖2 神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)圖
特別地,第一層的輸入是模型參量x和權(quán)值w1的積.網(wǎng)絡(luò)還需要輸入PMV 的實(shí)際值pmv,用來(lái)和預(yù)測(cè)值PMV_P計(jì)算得到誤差,然后將誤差反向傳播到所有節(jié)點(diǎn),以計(jì)算節(jié)點(diǎn)各個(gè)參數(shù)的梯度.設(shè)模型的損失函數(shù)為L(zhǎng)(x,θ):
其中,φ(xi,θ)表示神經(jīng)網(wǎng)絡(luò),其中的參數(shù)θ是訓(xùn)練中優(yōu)化更新的權(quán)值和閾值.梯度指函數(shù)L(x,θ)對(duì)θ的偏導(dǎo),記為 ?θ,設(shè)神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率為η,則誤差反向傳播更新的參數(shù)θt+1可以表示為:
BELLA將40焦耳的能量(相當(dāng)于相機(jī)閃光能量的好幾倍)裝入僅僅持續(xù)40飛秒的紅外脈沖中,這個(gè)時(shí)間比蜜蜂拍一下翅膀還要快1萬(wàn)億倍。對(duì)于這種激光脈沖如果擊中一個(gè)人的話會(huì)發(fā)生什么情況,BELLA主管維姆·利曼斯(Wim Leemans)不愿意進(jìn)行任何猜測(cè),但是可以肯定地說(shuō),他會(huì)受到嚴(yán)重傷害,甚至?xí)劳觥?/p>
差分進(jìn)化算法是在其他進(jìn)化算法的基礎(chǔ)上提出的群體啟發(fā)式搜索算法[8],由于其簡(jiǎn)單性和有效性被廣泛應(yīng)用.DE 算法步驟和其他進(jìn)化算法類似,但部分操作有所差異.其優(yōu)化BP 神經(jīng)的主要步驟如下:
(1)初始化種群:將神經(jīng)網(wǎng)絡(luò)的初始化后的權(quán)值和閾值以浮點(diǎn)數(shù)形式編碼一個(gè)D維矩陣的個(gè)體,初始化N 個(gè)個(gè)體形成種群.根據(jù)式(8),將1/L(x,θ)作為適應(yīng)度函數(shù)f,因?yàn)檎`差越小說(shuō)明個(gè)體越好,適應(yīng)度也應(yīng)越大.
(2)變異:變異操作通過(guò)差分策略來(lái)實(shí)現(xiàn).常見(jiàn)的差分策略是隨機(jī)選取種群中兩個(gè)不同的個(gè)體xr2和xr3,將其向量差用變異因子F縮放后與待變異個(gè)體xr1合成待變異個(gè)體.j代表個(gè)體的某個(gè)基因,t表示某一代種群.
(3)交叉:根據(jù)交叉概率CR,從種群中隨機(jī)選擇一個(gè)非待變異個(gè)體與待變異個(gè)體和進(jìn)行交叉,得到待選擇個(gè)體.
(4)選擇:計(jì)算個(gè)體的適應(yīng)度,根據(jù)適應(yīng)度大小來(lái)決定選擇變異交叉后的個(gè)體還是保留原來(lái)的個(gè)體.
種群進(jìn)化迭代t代后選擇其中最大適應(yīng)度最大的個(gè)體作為DE 算法的最優(yōu)解,解碼后得到權(quán)值和閾值矩陣,將其賦值給神經(jīng)網(wǎng)絡(luò).
本文研究搭建的模型是在PMV 公式忽略風(fēng)速和平均輻射溫度,引入氣候類型,房間類型,平均月氣溫和季節(jié)等離散特征構(gòu)建對(duì)于PMV 公式的擬合,實(shí)現(xiàn)在新條件下對(duì)室內(nèi)熱舒適的評(píng)估.傳統(tǒng)的BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練存在收斂慢和下降難,易陷入局部最優(yōu)的情況,本研究采取隨機(jī)梯度下降(Stochastic Gradient Descent,SGD)算法,并在其之上加入優(yōu)化方法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程,實(shí)現(xiàn)訓(xùn)練的加速收斂和更優(yōu)結(jié)果.
(1)模型使用動(dòng)量法優(yōu)化SGD 算法,動(dòng)量法是當(dāng)每次訓(xùn)練的梯度方向與上一次梯度方向相同時(shí)會(huì)加速下降[9],在一定程度上可以避免陷入局部最優(yōu),能更快地收斂到較優(yōu)結(jié)果.設(shè)動(dòng)量參數(shù)為α,根據(jù)式(9)可以把SGD 算法的優(yōu)化過(guò)程表示如下:
Vdθ表示一階動(dòng)量,模型訓(xùn)練設(shè)定α的為0.9,意味著梯度的下降速度是原來(lái)的10 倍.
(2)神經(jīng)網(wǎng)絡(luò)存在過(guò)擬合的問(wèn)題,考慮到具體訓(xùn)練過(guò)程,本研究在模型訓(xùn)練中加入L2 正則化,對(duì)訓(xùn)練施加懲罰,過(guò)程可以表示為在L(x,θ)的每次計(jì)算中增加誤差,設(shè)λ為正則化系數(shù),‖w‖2為參數(shù)向量的L2 范式,公式表示為:
正則化目的在于對(duì)于訓(xùn)練參數(shù)的衰減,降低對(duì)于訓(xùn)練樣本的過(guò)度依賴,提高泛化性能.
(3)對(duì)于每層的輸出結(jié)果進(jìn)行批量標(biāo)準(zhǔn)化.正常的數(shù)據(jù)通過(guò)一層隱藏層后會(huì)變成新的分布,為了實(shí)現(xiàn)有效的特征學(xué)習(xí),保證每一層的輸入是相同分布,因此使用仿射變換后的標(biāo)準(zhǔn)化[10]操作處理每層的輸出數(shù)據(jù),即給標(biāo)準(zhǔn)化函數(shù)增加仿射參數(shù)β和γ,設(shè)μ表示樣本均值,δ表示樣本方差,增加一個(gè)極小數(shù)ε防止分母為零,則形成一個(gè)動(dòng)態(tài)變化的數(shù)據(jù)標(biāo)準(zhǔn)化層:
在隱藏層中間加入上述的標(biāo)準(zhǔn)化層,能有效加快網(wǎng)絡(luò)的收斂速度.
差分進(jìn)化算法的迭代設(shè)定了種群大小50 個(gè),最多進(jìn)化200 代,變異因子0.8,交叉概率0.5.BP 神經(jīng)網(wǎng)絡(luò)隱藏層少了難以對(duì)過(guò)多維度的的數(shù)據(jù)特征進(jìn)行學(xué)習(xí)訓(xùn)練,因此增大到了4 個(gè)隱藏層.學(xué)習(xí)率通過(guò)經(jīng)驗(yàn)法得出,過(guò)小會(huì)導(dǎo)致收斂速度慢,而過(guò)大會(huì)導(dǎo)致下降的幅度太大,跳過(guò)全局最優(yōu)值[11];隱藏層神經(jīng)元個(gè)數(shù)根據(jù)經(jīng)驗(yàn)公式和模型實(shí)際訓(xùn)練進(jìn)行了調(diào)整,設(shè)定為200 到300 個(gè)之間訓(xùn)練效果好,神經(jīng)元太多會(huì)降低收斂速度,太少學(xué)習(xí)效果弱.具體參數(shù)設(shè)定如表3所示.
表3 神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)定
圖3為神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程中誤差下降圖,可以看出在200 次的訓(xùn)練中,論文設(shè)計(jì)模型在訓(xùn)練中迅速且平穩(wěn)地收斂到一個(gè)較低值.
為驗(yàn)證模型引入離散變量對(duì)PMV 擬合上的有效性,將訓(xùn)練好的模型與沒(méi)有加入離散變量的模型和原PMV 模型作對(duì)比,主要對(duì)比的參數(shù)是均方誤差和R2回歸決定系數(shù).原PMV 模型的條件中風(fēng)速采用經(jīng)驗(yàn)值0.1 m/s,平均輻射溫度用空氣溫度代替.測(cè)試樣本共8927 條,測(cè)試主要比較均方誤差和R2決定系數(shù)以及最大絕對(duì)誤差.均方誤差越低表示模型測(cè)試平均誤差越小,R2越接近1 表面模型回歸效果越好,最大絕對(duì)誤差代表了模型擬合的誤差范圍.表4為實(shí)驗(yàn)結(jié)果對(duì)比.
圖3 神經(jīng)網(wǎng)絡(luò)損失下降圖
表4 模型測(cè)試結(jié)果對(duì)比表
從上述的結(jié)果分析可以看出,論文提出弱化輸入?yún)?shù),并引入一些離散特征參數(shù)后的模型比無(wú)離散變量的BP 神經(jīng)網(wǎng)絡(luò)模型和原來(lái)的PMV 模型具有更好的回歸效果和誤差表現(xiàn).通過(guò)比較離散變量的是否引入可以發(fā)現(xiàn)其對(duì)模型的數(shù)據(jù)擬合存在一定的影響,證明論文引入的環(huán)境和氣候參量具有有效性.
研究使用神經(jīng)網(wǎng)絡(luò)構(gòu)建的模型可適用于多種條件下的PMV 檢測(cè),對(duì)于增強(qiáng)和擴(kuò)展智能家居系統(tǒng)感知部分的能力具有一定可行性.本文研究從數(shù)值上忽略了風(fēng)速和平均輻射溫度的影響,并未否定實(shí)際中這兩者對(duì)室內(nèi)熱舒適的影響.模型的測(cè)試數(shù)據(jù)也存在著絕對(duì)誤差較大的樣例,其中不排除數(shù)據(jù)集樣本的真實(shí)誤差.
本文實(shí)驗(yàn)的結(jié)果表明,在放棄風(fēng)速和平均輻射溫度,并引入一些離散特征的情況下,我們搭建的模型對(duì)于PMV 具有良好的擬合效果和泛化性能,對(duì)PMV 的計(jì)算可以起到替代作用,也表明了房間類型和季節(jié)等的離散因素對(duì)室內(nèi)熱舒適具有一定影響.在可以預(yù)見(jiàn)的未來(lái)里,使用神經(jīng)網(wǎng)絡(luò)去研究室內(nèi)熱舒適的評(píng)價(jià),可以更深層次地分析環(huán)境因素與熱舒適直接的關(guān)聯(lián)程度,更精確的建立熱舒適評(píng)價(jià)模型.