張艷, 左雅, 李香平, 呂盼, 荊世博
(1.國網(wǎng)新疆電力有限公司,新疆,烏魯木齊 830001;2.國網(wǎng)新疆電力有限公司 經(jīng)濟(jì)技術(shù)研究院,新疆,烏魯木齊 830001)
能源短缺與環(huán)境問題促使了煤改電項(xiàng)目的實(shí)施,自從2003年北京地區(qū)實(shí)施煤改電工程以來,截止到2015年已經(jīng)有38.45萬戶用戶完成采暖改造,2016年463個(gè)村莊完成了“煤改清潔能源”的計(jì)劃。2017年實(shí)現(xiàn)了7區(qū)平原村“無煤化”。煤改電項(xiàng)目的實(shí)施使人們的生活環(huán)境得到了大幅度的改善,但從傳統(tǒng)的以煤炭取暖到以電力取暖使煤改電的用電費(fèi)用成為了人們擔(dān)心的焦點(diǎn)。為了更好推進(jìn)煤改電項(xiàng)目的實(shí)施,政府給予煤改電用戶一定量的電量補(bǔ)貼[1]。雖然政府給予煤改電用戶補(bǔ)貼,但在煤改電補(bǔ)貼金額的多少上依然缺少參考依據(jù)[2-5]。
采暖季煤改電用戶用電量受多重因素影響,用戶的家庭情況、用戶的住房采暖面積、采暖季室外溫度和室外濕度、采暖設(shè)備的型號(hào)類型、采暖設(shè)備的數(shù)量和用戶的行為習(xí)慣等都是需要考慮的因素。本文運(yùn)用逐步線性回歸模型和定性定量的數(shù)據(jù)分析,根據(jù)煤改電用戶的原始數(shù)據(jù),通過專家判斷和煤改電用戶調(diào)查研究結(jié)果,綜合考慮煤改電用戶用電量的各方面因素,準(zhǔn)確分析出采暖季煤改電用戶用電量的影響因素,為政府提供有價(jià)值的參考依據(jù)。
根據(jù)某市“煤改電”智能服務(wù)平臺(tái),可以得到大量的煤改電用戶信息。煤改電用戶的用電量作為模型訓(xùn)練數(shù)據(jù)集中的每個(gè)樣本的輸出項(xiàng),煤改電用戶補(bǔ)貼電量的影響因素可以從機(jī)器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)去分析。又因?yàn)槊焊碾娪脩舻挠秒娏繉儆谶B續(xù)型變量,所以屬于監(jiān)督學(xué)習(xí)中的回歸[6]問題。某市“煤改電”智能服務(wù)平臺(tái)5分鐘采集一次數(shù)據(jù),采用逐步線性回歸的模型對(duì)煤改電的用電量進(jìn)行分析,因?yàn)橹鸩骄€性回歸可以幫助人們理解現(xiàn)有的模型并對(duì)該模型做出準(zhǔn)確的改進(jìn)。在構(gòu)建逐步線性回歸模型的時(shí)候,可以運(yùn)行該模型算法找出重要的特征,也可以及時(shí)停止對(duì)不重要特征的收集,減少數(shù)據(jù)分析時(shí)的內(nèi)存消耗,提高效率。
逐步線性回歸是在線性回歸[7-8](Linear Regression)基礎(chǔ)上,加入逐步設(shè)置。線性回歸是利用線性回歸方程的最小平方函數(shù)對(duì)一個(gè)或多個(gè)自變量和因變量之間關(guān)系進(jìn)行建模的一種回歸分析。回歸模型用于連續(xù)型變量的預(yù)測(cè)分析,通常當(dāng)只有一個(gè)解析變量的時(shí)候,線性回歸稱為簡(jiǎn)單線性回歸。當(dāng)有多個(gè)解析變量的時(shí)候稱為多元線性回歸。
在SPSS預(yù)測(cè)工具中,線性回歸分為逐步線性回歸、進(jìn)入線性回歸、刪除線性回歸、向前線性回歸和向后線性回歸,最常用的是進(jìn)入和逐步2種線性回歸方式[9-10]。進(jìn)入線性回歸方式將所有變量引入模型中,做強(qiáng)制線性回歸。逐步線性回歸是將變量逐個(gè)引入模型,每引入一個(gè)解釋變量后都要進(jìn)行F檢驗(yàn),并對(duì)已經(jīng)選入的解釋變量逐個(gè)進(jìn)行t檢驗(yàn),當(dāng)后面解釋的變量對(duì)原來解釋的變量不起作用時(shí),將其刪除。通過這個(gè)反復(fù)的過程,選出模型中最優(yōu)的變量,通過逐步線性回歸的方式對(duì)用戶補(bǔ)貼電量的影響因素進(jìn)行線性回歸分析。
用戶的家庭情況、用戶的住房采暖面積、采暖季室外溫度和室外濕度、采暖設(shè)備的型號(hào)類型、采暖設(shè)備的數(shù)量、用戶的行為習(xí)慣是研究煤改電用戶的用電量影響因素需要考慮的7個(gè)因素。通過研究煤改電相關(guān)的參考文獻(xiàn)和分析某市“煤改電”智能服務(wù)平臺(tái)采集的數(shù)據(jù),將7個(gè)因素進(jìn)行分組,這樣可以降低無關(guān)因素的影響。首先對(duì)煤改電用戶數(shù)據(jù)進(jìn)行數(shù)據(jù)收集和數(shù)據(jù)清洗,然后通過對(duì)煤改電用電量的影響因素的綜合考慮,采用逐步線性回歸和定性定量2種分析手段進(jìn)行分析。
根據(jù)上述分析,建立如下指標(biāo)變量作為基礎(chǔ)的分析框架。Y為因變量,表示煤改電用戶用電量,Xi(i=1,2)為自變量。
(1)X1表示室外的日平均溫度。
(2)X2表示室外的日平均濕度。
采用逐步多元線性回歸的分析方法,煤改電用戶的用電量和采暖季室外溫度、室外濕度因素之間存在的函數(shù)關(guān)系:Y=f(X1,X2)+隨機(jī)干擾項(xiàng)。
建立模型如式(1)。
Y=β0+β1X1+β2X2+ε
(1)
式中,β0為常數(shù)項(xiàng),βi是Xi(i=1,2)對(duì)應(yīng)的偏回歸系數(shù),ε為誤差值。
在不同類別分析模型中,可以通過多種測(cè)評(píng)方式來評(píng)價(jià)預(yù)測(cè)值和真實(shí)值之間的差距,本文采用R-Squared作為評(píng)價(jià)指標(biāo)。
R-Squared評(píng)價(jià)指標(biāo)如式(2)—式(4)。
(2)
(3)
(4)
f(x)代表回歸模型x的預(yù)測(cè)值,SSres代表回歸值與真實(shí)值之間的平方差異(回歸差異),SStot代表測(cè)試數(shù)據(jù)真實(shí)值的方差(內(nèi)部差異),R2叫做決定系數(shù),用來衡量方程擬合度,一般來說R2越大擬合度越好。
R-Squared既考量了回歸值與真實(shí)值的差異,同時(shí)也兼顧了問題真實(shí)值的變動(dòng)。它用來衡量模型回歸結(jié)果的波動(dòng)可被真實(shí)值驗(yàn)證的百分比,也暗示了模型在數(shù)值回歸方面的能力。
Step1:采取某市某用戶于2018年1月2日—1月25日共24天用電量作為數(shù)據(jù)源進(jìn)行數(shù)據(jù)分析,用戶信息數(shù)據(jù)如表1所示。
表1 用戶信息數(shù)據(jù)
Step2:將整理好的數(shù)據(jù)的Excel導(dǎo)入SPSS中,對(duì)數(shù)據(jù)做線性回歸逐步處理。
Step3:將回歸分析結(jié)果導(dǎo)出,結(jié)果如表2所示。
表2 模型匯總
表2模型匯總表中,R2大于0.8說明方程對(duì)樣本點(diǎn)的擬合效果很好,R2在0.5—0.8之間擬合度可以接受。本次擬合的R2為0.596,在0.5—0.8之間,擬合度可以接受。
為明確樣本數(shù)據(jù)是否完全適合于線性回歸模型,本文采用方差分析來進(jìn)行檢驗(yàn),結(jié)果如表3所示。
表3中,F(xiàn)檢驗(yàn)代表的是對(duì)進(jìn)行線性回歸的所有自變量的回歸系數(shù)的一個(gè)總體檢驗(yàn),主要通過比較兩組數(shù)據(jù)的方差S2。如果sig<0.05,說明至少有一個(gè)自變量能夠有效預(yù)測(cè)因變量。本次sig為0.000,小于0.05,說明用電量至少與室外平均溫度或室外平均濕度任何一個(gè)有關(guān)。
表3 ANOVA
使用SPSS預(yù)測(cè)工具進(jìn)行常量、平均溫度各組樣本的多元相關(guān)回歸分析后,得出回歸方程系數(shù)相關(guān)性分析表,結(jié)果如表4所示。
表4 系數(shù)
表4中,首先對(duì)各個(gè)符號(hào)進(jìn)行說明,字符B也就是beta,代表回歸系數(shù)。非標(biāo)準(zhǔn)化系數(shù)主要擬合方程,標(biāo)準(zhǔn)化系數(shù)主要用來分析因子的重要性。t值就是對(duì)回歸系數(shù)的t檢驗(yàn)的結(jié)果,絕對(duì)值越大,sig就越小。從經(jīng)濟(jì)學(xué)的角度,sig<0.05時(shí)一般被認(rèn)為是系數(shù)檢驗(yàn)顯著[13]。本次線性回歸的sig為0,小于0.05,說明平均室外溫度的系數(shù)檢驗(yàn)顯著。
根據(jù)表4系數(shù),擬合方程可以表示為式(5),
Y=-2.102X1+45.224
(5)
在SPSS多元線性逐步回歸中,回歸系數(shù)不顯著的變量將被排除,結(jié)果如表5所示。
表5 已排除的變量
表5中,平均濕度是已排除變量,說明該變量對(duì)回歸模型沒有顯著影響,在構(gòu)建多元線性回歸方程式時(shí)不將其考慮進(jìn)去。逐步線性回歸的思想是將多個(gè)變量逐個(gè)引入模型,以確保每次引入新的變量之前回歸方程中只包含主動(dòng)變量。這是一個(gè)反復(fù)的過程,直到既沒有顯著的解釋變量選入回歸方程,也沒有不顯著的解釋變量從回歸方程中剔除為止,以保證最后所得到的解釋變量集為最優(yōu)。
Step1:根據(jù)某市“煤改電”智能服務(wù)平臺(tái)采集的數(shù)據(jù),在定量的前提下,選取2018年1月份不同采暖設(shè)備的30個(gè)樣本,不同設(shè)備用電量如表6所示。
表6 不用設(shè)備的用電量
Step2:生成設(shè)備類型因素折線圖,如圖1所示。
圖1 設(shè)備類型因素
空氣源熱泵取暖所消耗的用戶用電量高于蓄熱式電暖器和地源熱泵設(shè)備的取暖所消耗的電量,蓄熱式電暖器取暖和地源熱泵設(shè)備取暖所消耗的用電量都相對(duì)較低。
Step1:首先對(duì)數(shù)據(jù)做簡(jiǎn)單整理,采用控制變量的方法采集數(shù)據(jù),選取樣本的規(guī)則是選取相同用戶有兩處住宅的20天用電量數(shù)據(jù),選取每戶樣本的每處住宅人數(shù)相同,將其數(shù)據(jù)整理成如表7所示。
表7 采暖面積對(duì)用電量的影響
Step2:生成采暖面積因素折線圖,如圖2所示。
圖2 采暖面積因素
在排除用戶的行為習(xí)慣等影響因素的條件下,采用孫某臣和張某江兩戶的用電量數(shù)據(jù),他們都擁有兩處住宅且住宅面積都不相同。孫某臣兩處住宅在3月14日的用電量存在交叉點(diǎn),張某江兩處住宅的用電量除3月14日外存在多處交叉點(diǎn)。由此可以看出,在其他因素相同的條件下,用戶的采暖面積對(duì)用戶的用電量沒有影響。
(1)采暖季室外濕度對(duì)煤改電用戶的電量影響很小可以忽略不計(jì),采暖季的室外溫度對(duì)煤改電用戶的電量影響很大,根據(jù)公式Y(jié)=-2.102X1+45.224可以看出采暖季用戶的用電量與室外溫度成負(fù)相關(guān),隨著室外溫度的降低,煤改電用戶的用電量越大。
(2)煤改電用戶用電量受采暖設(shè)備的類型影響較大,其中空氣源熱泵日用電量是蓄熱式電暖器和地源熱泵2種設(shè)備的日用電量的2倍,耗能較多。煤改電用戶用電量受用戶采暖面積影響較小。
(3)采暖的設(shè)備類型對(duì)用戶的用電量影響很大。一方面政府可以根據(jù)分發(fā)到不同用戶的不同設(shè)備類型給與不同的補(bǔ)貼費(fèi)用;另一方面從節(jié)能減排的角度,政府可以大力推廣蓄熱式電暖器和地源熱泵等一些節(jié)能的取暖設(shè)備。