邵 臻,王曉佳,高 飛,劉輝舟,楊 露
(合肥工業(yè)大學a.管理學院;b.過程優(yōu)化與智能決策教育部重點實驗室,合肥 230009)
基于懲罰最小二乘估計的長期用電量半?yún)?shù)預測模型
邵 臻,王曉佳,高 飛,劉輝舟,楊 露
(合肥工業(yè)大學a.管理學院;b.過程優(yōu)化與智能決策教育部重點實驗室,合肥 230009)
文章針對懲罰最小二乘估計的高精度特性,構建了基于懲罰最小二乘估計的半?yún)?shù)回歸模型。并將指數(shù)平滑思想融入模型,對模型的誤差序列進行趨勢外推與大幅度外延預測。實證結果表明了所提方法的有效性。
半?yún)?shù)模型;懲罰最小二乘估計;指數(shù)平滑;電量預測
目前,長期負荷預測領域的研究方法主要包括參數(shù)理論與非參數(shù)理論等[1~3]。狀態(tài)空間、回歸分析、神經(jīng)網(wǎng)絡、灰色理論、支持向量機和最優(yōu)組合預測方法等,基本上都屬于參數(shù)統(tǒng)計法的范疇,因變量對自變量有較強的依賴關系,當假設函數(shù)模型成立時,預測精度較高,當假設函數(shù)不成立時,預測模型的擬合情況和預測精度都不理想。非參數(shù)理論降低了自變量對因變量的限制,有較大的適應性,但也可能會失去歷史資料所提供的信息,降低模型的解釋能力。
傳統(tǒng)的參數(shù)回歸操作簡便,可以外延,適于預測,但難以精確擬合復雜的曲線;非參數(shù)回歸形式靈活,可以精確擬合復雜曲線曲面,但難以進行大幅度外延預測。半?yún)?shù)模型最早由Stone于1977年提出,它有線性主部,可以把握大勢走向,適于外延預測;還有非參數(shù)部分,可以作局部調(diào)整,使數(shù)據(jù)較精確地擬合。半?yún)?shù)模型引入了非參數(shù),克服了傳統(tǒng)偏差函數(shù)模型的局限性,使得數(shù)學模型與客觀實際更為接近,在數(shù)值上能夠分別求出參數(shù)、非參數(shù)(模型誤差)和偶然誤差,是一種非常理想的數(shù)據(jù)處理方法。本文擬對傳統(tǒng)半?yún)?shù)模型進一步改進,改進后的半?yún)?shù)模型將指數(shù)平滑法融入模型并結合懲罰最小二乘估計法進行參數(shù)估計,目前在電力負荷預測領域半?yún)?shù)模型的應用尚不多見,將其運用于電力負荷預測領域,將改善傳統(tǒng)方法諸如無法適應較大幅度外延預測要求、預測精度偏低等不足之處。
半?yún)?shù)模型一般形式為:
其中yi是因變量;xi是參數(shù)部分自變量;Tj是非參部分自變量;β是回歸系數(shù),即待求參數(shù);g為定義于實數(shù)集上的未知函數(shù);ε是隨機誤差,E(ε)=0,E(ε2)=σ2。xiβ反映了負荷預測可知的部分規(guī)律,把握因變量y變化的趨勢走向,為參數(shù)部分;g(Ti)+εi反映了負荷預測的不確定因素的影響,為非參數(shù)部分。
半?yún)?shù)回歸模型的估計方法很多,常見的有兩階段法、核函數(shù)法、樣條法、最近鄰法等等[4,5]。本文為了達到既可以排除隨機誤差項產(chǎn)生的噪音,同時又使得解具有一定的光滑性,從而有利于數(shù)據(jù)擬合以及外延預測的目的,采用基于懲罰最小二乘估計的半?yún)?shù)回歸模型。
懲罰最小二乘準則函數(shù)為[6]:
當λ→0時,g(t)趨近于觀測量的三次樣條內(nèi)插。當λ→∞時,g(t)趨近于觀測量的線形回歸。可證明懲罰最小二乘原理的懲罰項可以表達為(Fessler,1991):
其中,Q與T是 n×(n-2)和 (n-2)×(n-2)的矩陣。令 hi=ti+1-ti,i=1,2,…,n-1。
Q中元素滿足:
最終可以得到迭代求解方程,令
由式(6)、式(7)可計算 g?和 B?,觀測值的估計為:
對于模型(10)我們還無法直接進行外推預測,對于誤差時間序列項g?我們需要作進一步處理。由函數(shù)逼近論可知,對于足夠光滑的函數(shù)我們可以用多項式函數(shù)去逼近。
設誤差序列項{g?n}具有二次多項式趨勢,在二次指數(shù)平滑序列的基礎上,再做三次指數(shù)平滑序列:
光滑參數(shù)λ的取值對參數(shù),特別是對懲罰項估值的影響很大,其取值好壞將直接影響到實際擬合效果。當平滑參數(shù)值λ選取較大時,λ的取值對數(shù)據(jù)平滑問題來說是十分關鍵的。
目前在平滑參數(shù)的選取準則很多[7]。一些是基于再抽樣方法,例如CV,GCV準則等等;而另一些是基于模型復雜度懲罰方法,例如基于AIC,BIC準則的選擇方法。雖然幾類方法的形式不同,本質(zhì)上都是為了尋找合適的參數(shù),使得模型具有較優(yōu)的預測性能和泛化性能。
(1)交叉核實準則
交叉核實(cross-validation,CV),其基本思想是:選取λ所得的擬合曲線,用此曲線進行預測,使所有預測點的均方誤差最小。在應用時,常常將(xi,yi)模擬為預測點(即去掉此點),而依據(jù)剩下的n-1個點進行估計,再將(xi,yi)代入所擬合的曲線,得到此點的值,記為Y?i。于是我們定義交叉核為:
其中,hii(λ)為帽子矩陣 H(λ)中的元素,使 CV(λ)值最小的λ即為所求值。
(2)廣義交叉核實準則
廣義交叉核實法(Generalized Cross-Validation,GCV)是Leave-one out cross-validation方法的近似,我們定義廣義交叉核為:
本文采用循環(huán)預測法進行負荷預測[8,9],其基本思想是:對每一次的負荷預測值進行循環(huán)使用。對于半?yún)?shù)回歸模型,當預測yn+1時,利用三次指數(shù)平滑預測技術對g?(n+1)進行估計,得到負荷預測值 y?n+1 ,將負荷預測值y?n+1添加到原負荷樣本(y1,y2,…,yn)中組成新負荷樣本(y1,y2,...,yn,y?n+1),再采用前述半?yún)?shù)估計方法進行等間隔的下一步預測,如此循環(huán)直至得到所需的p步預測值。
影響電力負荷消耗的因素很多,例如經(jīng)濟增長水平、經(jīng)濟發(fā)展階段、經(jīng)濟結構特性以及生產(chǎn)生活水平等等諸多影響和制約因素。具體選取了全社會固定資產(chǎn)投資總額、國內(nèi)生產(chǎn)總值、人均國內(nèi)生產(chǎn)總值、工業(yè)增加值、社會消費品零售總額、人口數(shù)量、商品零售價格指數(shù)、工業(yè)總產(chǎn)值等因素。計算自變量、因變量之間的相關程度,并去除與因變量相關程度較小的影響因素。
表1 自變量、因變量間的相關系數(shù)
通過灰色關聯(lián)度理論,計算出諸多影響因素(自變量)與因變量之間的灰色關聯(lián)度,對于所選取的8個影響因素其灰色關聯(lián)度依次為:0.9088,0.7243,0.6201,0.8762 ,0.9298,0.6495,0.9418,0.6082。綜合相關系數(shù)和灰色關聯(lián)度理論選取全社會固定資產(chǎn)投資總額、工業(yè)增加值、社會消費品零售總額3個影響因素并進行單位根檢驗,自變量與3個影響因素在5%的置信水平下可以認為不存在單位根,因此選取上述3個因素建模。
本文收集了1985~2009年江蘇省年度全社會用電量及其影響因素的資料。電量單位為億kWh,人口單位為萬人,產(chǎn)業(yè)值單位為億元。影響年用電量(自變量)的因子有GDP,全社會固定資產(chǎn)投資總額,工業(yè)增加值,社會消費品零售總額,總人口數(shù)。用1985~1999年資料建模,2000~2009年資料進行檢驗。
對于光滑參數(shù)λ的選取,本文采用廣義交叉核實法(Generalized Cross-Validation,GCV)。通過GCV法迭代選取,最終選擇λ=0.43時達到較好的逼近精度和預測效果。
表2 擬合和檢驗結果
表3 擬合和檢驗結果
通過表2預測結果的對比不難發(fā)現(xiàn),基于懲罰最小二乘估計的半?yún)?shù)模型在參數(shù)擬合階段表現(xiàn)出了很高的精度。通過對原始數(shù)據(jù)良好的擬合,從而反映原始數(shù)據(jù)的變化趨勢,同時結合三次指數(shù)平滑法進行趨勢外推,從而進行預測。由表3可知基于懲罰最小二乘估計法的誤差指標是比較令人滿意的?;趹土P最小二乘估計的半?yún)?shù)模型進行用電負荷預測具有較高的預測精度和實用性,半?yún)?shù)模型相較于傳統(tǒng)用電負荷預測模型具有更高的預測精度。
比較計算結果可以看到:在進行較大幅度全社會用電量需求外延預測時,半?yún)?shù)回歸法估計的平均擬合誤差遠遠小于灰色GM(1,1)、多元線性回歸等傳統(tǒng)方法。說明半?yún)?shù)模型對電力需求預測估計精度較高。通過數(shù)值的擬合計算結果顯示,擬合估計值也比較接近真實值。也再次證明半?yún)?shù)模型對電量需求預測估計的優(yōu)越性。
文中主要考慮經(jīng)濟增長水平、經(jīng)濟發(fā)展階段、經(jīng)濟結構特性以及生產(chǎn)生活水平等等諸多影響和制約因素,然而實際中用電負荷的需求還受到其它因素的影響,如自然因素等。在今后的研究中,應進一步分析各種因素對用電負荷的影響,建立更精確的預測模型。同時半?yún)?shù)預測模型的擬合步長和預測步長的選取也是值得進一步研究的問題。
[1]牛東曉,曹樹華等.電力負荷預測技術及其應用[M].北京:中國電力出版社,2009.
[2]康重慶,夏清,張伯明.電力系統(tǒng)負荷預測研究綜述與發(fā)展方向的探討[J].電力系統(tǒng)自動化,2004,28(7).
[3]邰能靈,侯志儉,李濤,蔣傳文,宋炯.基于小波分析的電力系統(tǒng)短期負荷預測方法[J].中國電機工程學報,2003,23(1).
[4]葉阿忠.非參數(shù)計量經(jīng)濟學[M].天津:南開大學出版社,2003.
[5]Jan G,De Gooijer,Daw it Zerom.Kernel-based Multistep-ahead Pre?dictions of the US Short-term Interest Rate[J].Journal of Forecasting,2000,19(4).
[6]高寧,高彩云,徐長海.補償最小二乘估計在確定高程異常中的應用[J].測繪科學,2011,36(1).
[7]陳建東,李嫻,王小明.LS-SVM的GCV模型選擇方法與快速算法[J].模式識別與人工智能,2010,30(1).
[8]Stephanie M.Pickle,Timothy J.Robinson,Jeffrey B.Birch,Christine M.Anderson-Cook.A Semi-Parametric Approach to Robust Parame?ter Design[J].Journal of Statistical Planning and Inference,2008,138.
[9]Three-Stage Semi-Parametric Estimation of T-copulas:Asymptotics,Finite-sample Properties and Computational Aspects[Z].Computation?al Statistics and Data Analysis,2010.
F224
A
1002-6487(2012)24-0026-03
國家自然科學基金資助項目(71071045;70801024)
邵 臻(1986-),男,江蘇宿遷人,碩士研究生,研究方向:預測、決策科學與技術。
王曉佳(1982-),男,安徽蚌埠人,博士研究生,研究方向:預測、決策科學與技術。
高 飛(1986-),女,河北滄州人,碩士研究生,研究方向:決策科學與技術。
(責任編輯/亦 民)