董林+葛悅琴+錢圳冰
[摘要]文章是一個研究多重變量之間的關(guān)聯(lián)程度的問題,通過利用多項式回歸方程擬合的思想,偏最小二乘回歸法、線性回歸和曲線擬合的方法建立了電力系統(tǒng)短期負荷預測的模型。模型考慮了數(shù)據(jù)相對于時間的變化情況、數(shù)據(jù)之間存在的相互影響關(guān)系,對未來的電力系統(tǒng)短期負荷情況進行了合理的預測。
[關(guān)鍵詞]偏最小二乘回歸;時間序列分析;拉格朗日乘子法;自回歸滑動平均
[DOI]1013939/jcnkizgsc201716194
1問題分析
電力系統(tǒng)負荷的變化有其自身的規(guī)律,一方面,呈現(xiàn)期性,隨著春、夏、秋、冬四季更迭,負荷在每個季節(jié)有著其自身內(nèi)部的發(fā)展規(guī)律;從周一到周五的5個工作日,負荷也有著較大的相似性,但是周末的負荷值往往低于工作日,整體呈現(xiàn)周期性。另一方面,電力系統(tǒng)負荷的變化也受許多不確定因素的影響,比如天氣、人們活動等因素。
通過綜合考慮各個氣象因子之間的相互作用,詳細地描述了綜合氣象因子和負荷指標間的回歸方程。定性分析了綜合氣象因子與負荷值之間的關(guān)系,并且通過回歸理論繪制出擬合曲線,建立回歸模型,進一步定量分析綜合氣象因素與負荷之間的相關(guān)性。
在對短期負荷的預測時,結(jié)合往年的數(shù)據(jù)以及近階段的天氣情況,我們通過加拉格朗日乘子法來修正所建立的回歸模型,使得模型預測的結(jié)果更加準確。
2名詞解釋
21多元線性回歸分析
指通過對兩個或兩個以上的自變量與一個因變量的相關(guān)分析,建立預測模型進行預測的方法,是一種普遍應用的統(tǒng)計分析與預測技術(shù)。多元線性回歸中,一般采用最小二乘方法估計回歸系數(shù),以使殘差平方和達到最小。
22拉格朗日乘子法
將約束優(yōu)化問題,根據(jù)效用函數(shù)方法,將其轉(zhuǎn)變成無約束問題,同時對無約束的效用函數(shù)利用擬牛頓算法求解其最優(yōu)解,更新乘子。其主要思想是引入一個新的參數(shù)(即拉格朗日乘子),將約束條件函數(shù)與原函數(shù)聯(lián)系到一起,使能配成與變量數(shù)量相等的等式方程,從而求出得到原函數(shù)極值的各個變量的解。
3基本假設
(1)假設2015年1月11日至17日氣象因素與往年差別不大。
(2)假設不會因數(shù)據(jù)采集系統(tǒng)或管理系統(tǒng)自身出現(xiàn)故障導致部分負荷數(shù)據(jù)的丟失。
(3)假設數(shù)據(jù)的采集過程是正確并且真實的,沒有因意外或其他特殊原因引起的數(shù)據(jù)非規(guī)則性變化。
(4)假設統(tǒng)計數(shù)據(jù)不會因電網(wǎng)負荷統(tǒng)計的標準不同而產(chǎn)生誤差。
(5)假設不會因為其他人為因素而導致數(shù)據(jù)出現(xiàn)異常情況。
4問題一的模型建立與求解
41數(shù)據(jù)綜合處理
題目所給的數(shù)據(jù)存在一些問題,需預先處理:地區(qū)一、二的天氣因素中有幾項缺失,需要參考數(shù)據(jù)進行修正補加,同時減少由于節(jié)假日因素影響到的數(shù)據(jù)。
42模型建立過程
(1)將因變量組和自變量組進行n次標準化,得到n標準化觀測數(shù)據(jù)陣分別記為:F0和E0。
問題二中自變量為5個氣象因素,因變量為日最高負荷值、日最低負荷值、日平均負荷值,即m=5,p=3。
43模型的結(jié)論
如果要用氣象因素來提高負荷預測精度,在諸氣象因素中,筆者會優(yōu)先推薦最高溫度、最低溫度、平均溫度。偏最小二乘回歸方法的模型對研究兩組多重變量之間的依賴關(guān)系的構(gòu)造是合理,并且有效的,可以很好地解決所求問題。
5問題二的模型建立與求解
51問題二的分析
問題二要求我們以已知數(shù)據(jù)作為參考,預測兩地區(qū)2015 年1月11日至17日共7天的電力負荷。我們采用了時間序列預測法中的ARMA 模型(自回歸滑動平均模型),利用已掌握的比較完備的歷史統(tǒng)計數(shù)據(jù),采取一定的數(shù)學方法進行科學的加工整理。在這個模型中,因為只有前幾年同一時間段各地區(qū)負荷量的每日數(shù)據(jù),所以選擇平穩(wěn)時間序列預測法較為準確地預測兩個地區(qū)2015 年1月11日至17日共7天的電力負荷。
52模型的構(gòu)建說明
ARMA 模型(自回歸滑動平均模型)是時序方法中最基本的模型。該模型具有隨機差分方程的形式,即
假定當k>0時,at+kat與xt不相關(guān),也就是期望E(at+kat)=0(k>0)
利用Excel數(shù)據(jù)挖掘的方法中的Trend函數(shù),得到了2015年的預測值。而我們在問題三中只有前六年的數(shù)據(jù),信息資料的質(zhì)量和數(shù)量都不是很高,所以預測得到的結(jié)果誤差應該較大。
6問題三的模型建立與求解
61模型原理
問題3涉及了氣象因素的負荷值預測,該預測值主要由兩部分構(gòu)成:一為問題三中預測的負荷值;二為約束條件:2015年氣象因子綜合對負荷值的一個影響值。在問題二中,已經(jīng)得到過去幾年氣象因子對負荷指標的回歸方程?;谠瘮?shù)和約束條件的相關(guān)分析之上,問題四所采用的優(yōu)化算法為“拉格朗日乘子法”。
62模型建立
記y=f(x)為我們希望得到的線性回歸方程,其中f(x1)為問題三中預測到的第i(i=1,2,…,7)天的日負荷值的高階函數(shù)擬合方程,λf(x2)為已知數(shù)據(jù)2015年的氣象因子綜合對日平均負荷值的一個影響值。模型如下:
y=f(x)=f(x1)+λf(x2)
63模型的求解
(1)運用MATLAB對問題三中2015年1月11日至1月17日預測值進行處理,得到日負荷值的曲線,我們選用十三階多項式進行擬合,效果很好,得到擬合方程系數(shù)陣。
(2)在第2問的基礎上,代入2015年1月11日至1月17日的相關(guān)指標,重復問題二,得到氣象因子綜合對日平均負荷值的回歸方程。
(3)將2015年1月11日至1月17日的氣象因子代入步驟二所得方程預測日平均負荷值,我們所求的,最后得到高階回歸方程組。
下圖是經(jīng)過修正擬合后的和未記及氣象因素的一個比較圖:淺色為修正后的曲線,深色為未記及氣象因素的擬合圖,7幅圖分別代表了7天,縱坐標為電力負荷值。從圖上我們可以清晰地看出修正后的圖平滑度更好,說明修正是合理有用的。
7模型的推廣
由于我國領(lǐng)土面積大,南北距離大,各個地方氣候因素不近相同,我們的模型可以進一步預測南部地區(qū)高溫對電力負荷的影響,也可以預測在東北地區(qū)嚴寒條件下對負荷值產(chǎn)生的影響。
我國某些城市第二產(chǎn)業(yè)和第三產(chǎn)業(yè)發(fā)達,特別是服務業(yè),因此我們的模型可以預測這個地方電力負荷值的主要特征以及預測該地區(qū)當?shù)氐南嚓P(guān)服務業(yè)的發(fā)展趨勢。
參考文獻:
[1]余勝威MATLAB優(yōu)化算法案例分析與應用[M].北京:清華大學出版社,2014
[2]姚澤清,鄭旭東,趙穎全國大學生數(shù)學建模競賽賽題與優(yōu)秀論文評析2005—2011年B題[M].北京:國防工業(yè)出版社,2012
[3]張志涌,楊祖櫻MATLAB教程[M].北京:北京航空航天大學出版社,2015
[4]姚澤清,鄭旭東,趙穎全國大學生數(shù)學建模競賽賽題與優(yōu)秀論文評析2005—2011年A題[M].北京:國防工業(yè)出版社,2005
[5]章文波,陳紅艷實用數(shù)據(jù)統(tǒng)計分析及SPSS 120應用[M].北京:人民郵電出版社,2006