毛錦偉,梁 甲,張修文
(1.防災(zāi)減災(zāi)湖北省重點(diǎn)實(shí)驗(yàn)室(三峽大學(xué)),湖北 宜昌 443002;2.三峽大學(xué) 土木與建筑學(xué)院,湖北 宜昌 443002)
隨著我國(guó)經(jīng)濟(jì)的高速發(fā)展,電力建設(shè)需求也日益提升,“十三五”期間,經(jīng)濟(jì)發(fā)展步入新常態(tài),經(jīng)濟(jì)增長(zhǎng)的結(jié)構(gòu)、動(dòng)力等發(fā)生深刻變化,這對(duì)電力市場(chǎng)發(fā)展產(chǎn)生深遠(yuǎn)影響。電力發(fā)展是衡量一個(gè)國(guó)家經(jīng)濟(jì)水平的重要因素之一,對(duì)用電量的精準(zhǔn)預(yù)測(cè)有利于電力企業(yè)合理安排經(jīng)營(yíng)計(jì)劃,提高經(jīng)濟(jì)效益[1]。在電力發(fā)展改革中,對(duì)新興智能技術(shù)的要求也不斷提升,智能電網(wǎng)是電力工業(yè)發(fā)展的方向和趨勢(shì)[2]。用電量預(yù)測(cè)是保證電力規(guī)劃實(shí)施運(yùn)行的基礎(chǔ),只有合理采用有效預(yù)測(cè)模型才能得到精確的結(jié)果,從而保證電力規(guī)劃的經(jīng)濟(jì)性、合理性及適用性[3]。因此,如何保證用電量精準(zhǔn)預(yù)測(cè),有效建立合理化模型成為重中之重。
目前對(duì)于用電量模型的預(yù)測(cè)方法通常為傳統(tǒng)的單耗法、彈性系數(shù)法、趨勢(shì)外推法、主成分回歸分析預(yù)測(cè)法、最小二乘回歸預(yù)測(cè)法、灰色預(yù)測(cè)法、各類神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)法和時(shí)間序列分析預(yù)測(cè)法等[4]。在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)分析方法中,BP神經(jīng)網(wǎng)絡(luò)是人工神經(jīng)網(wǎng)絡(luò)中的一個(gè)重要分支,已經(jīng)在用電量預(yù)測(cè)研究中取得了廣泛應(yīng)用。然而,BP神經(jīng)網(wǎng)絡(luò)屬于全局逼近網(wǎng)絡(luò),每給定網(wǎng)絡(luò)一個(gè)輸入,各個(gè)權(quán)值都需要調(diào)整,這將影響每個(gè)輸出,從而導(dǎo)致其學(xué)習(xí)的速度是一個(gè)較慢的過程。BP網(wǎng)絡(luò)是否達(dá)到收斂是與訓(xùn)練樣本的容量大小、算法、網(wǎng)絡(luò)結(jié)構(gòu)、期望誤差和訓(xùn)練步數(shù)等諸多方面都有很大的關(guān)系。
傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)在用電量預(yù)測(cè)應(yīng)用中出現(xiàn)的樣本數(shù)量缺乏和網(wǎng)絡(luò)結(jié)構(gòu)確定的問題,難以準(zhǔn)確預(yù)測(cè),為了更好提升預(yù)測(cè)模型的精度,針對(duì)上述問題,引入SOM神經(jīng)網(wǎng)絡(luò)(Self-Orga-nizing Feature Map,SOM)[5,6]。先對(duì)整體樣本進(jìn)行自動(dòng)聚類,再根據(jù)相似聚類結(jié)果分別建立RBF預(yù)測(cè)模型。RBF神經(jīng)網(wǎng)絡(luò)與BP神經(jīng)網(wǎng)絡(luò)相比,具有預(yù)算速度更快,而且不易陷入局部最小點(diǎn)優(yōu)點(diǎn),所以選用RBF神經(jīng)網(wǎng)絡(luò)對(duì)樣本進(jìn)行建模和預(yù)測(cè)。
為了避免由于訓(xùn)練樣本點(diǎn)分散所導(dǎo)致的預(yù)測(cè)精度降低,采用先聚類、再分類建模和預(yù)測(cè)的方法。本文利用Matlab平臺(tái)建立SOM-RBF混合算法,構(gòu)成組合人工神經(jīng)網(wǎng)絡(luò),在評(píng)測(cè)樣本有限且訓(xùn)練樣本點(diǎn)分布不均勻的情況下,得到更高的預(yù)測(cè)精度,實(shí)現(xiàn)對(duì)湖北省年用電量的精準(zhǔn)預(yù)測(cè)。
1.1.1 SOM神經(jīng)網(wǎng)絡(luò)
SOM自組織特征映射網(wǎng)絡(luò)(Self-organizing Feature Map,SOM),也稱Kohonen網(wǎng)絡(luò),由荷蘭學(xué)者Teuvo Kohonen在1981年提出。SOM 網(wǎng)絡(luò)的神經(jīng)元是全連接的,該網(wǎng)絡(luò)不僅能夠?qū)W習(xí)輸入量的分布特點(diǎn),還能夠?qū)W習(xí)輸入量的拓?fù)浣Y(jié)構(gòu)。通過訓(xùn)練,可以建立起這樣一種布局,它使得每個(gè)權(quán)值向量都位于輸入向量聚類的中心。樣本的密度分布或者蘊(yùn)含在輸入空間樣本背后的其它特征被簡(jiǎn)單壓縮到一個(gè)含有有限個(gè)節(jié)點(diǎn)的競(jìng)爭(zhēng)平面上,使某些樣本在輸出空間中相對(duì)集中地聚在一起,由此便形成了聚類。
典型SOM網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,由輸入層和競(jìng)爭(zhēng)層組成。輸入層神經(jīng)個(gè)數(shù)為m,競(jìng)爭(zhēng)層由a×b個(gè)神經(jīng)元組成的二維平面陣列,輸入層與競(jìng)爭(zhēng)層各神經(jīng)元之間實(shí)現(xiàn)全連接。
圖1 SOM網(wǎng)絡(luò)結(jié)構(gòu)圖
SOM網(wǎng)絡(luò)的一個(gè)典型特征就是可以在一維或者二維的處理單元陣列上,形成輸入信號(hào)的特征拓?fù)浞植?,因此SOM網(wǎng)絡(luò)具有抽取輸入信號(hào)模式特征的能力。SOM網(wǎng)絡(luò)一般只包含有一維陣列和二維陣列,但也可以推廣到多維處理單元陣列中去。其算法主要包括以下四個(gè)過程[7]:
(1)評(píng)估過程
對(duì)于每一種輸入模式,在對(duì)網(wǎng)絡(luò)中所有競(jìng)爭(zhēng)節(jié)點(diǎn)進(jìn)行初始化權(quán)重之后,計(jì)算它們相對(duì)于判別函數(shù)各自的函數(shù)值,其判別函數(shù)表達(dá)式如式(1)所示:
(1)
式(1)中,xi和wk分別表示輸入向量和及其對(duì)應(yīng)神經(jīng)元的權(quán)值。
(2)競(jìng)爭(zhēng)模式
按照公式(1)所示,對(duì)在競(jìng)爭(zhēng)層擁有最大判別函數(shù)值的神經(jīng)元,可以認(rèn)定其為本輪競(jìng)爭(zhēng)的優(yōu)勝者。其中,可以用歐式距離最小來表示這種特定的輸入模式,其函數(shù)表達(dá)式用公式(2)表示:
(2)
(3)自學(xué)習(xí)過程
這里使用高斯鄰域函數(shù):
(3)
(4)
在批量學(xué)習(xí)方式下,以優(yōu)勝神經(jīng)元為核心的拓?fù)溧徲蛏窠?jīng)元可表示為:
(5)
(4)自組織過程
在自組織過程中,網(wǎng)絡(luò)中各個(gè)神經(jīng)元的權(quán)值按下面的等式更新。其中,在在線學(xué)習(xí)方式下,其更新等式為:
(6)
式(6)中為學(xué)習(xí)效率,在批量學(xué)習(xí)方式下,其更新等式為:
(7)
1.1.2 RBF神經(jīng)網(wǎng)絡(luò)
1988年Brookhead和Lowe將徑向基函數(shù)(Radical Basis Function,RBF)引入神經(jīng)網(wǎng)絡(luò),RBF神經(jīng)網(wǎng)絡(luò)是一種采用局部響應(yīng)的人工神經(jīng)網(wǎng)絡(luò)。其基本理念是通過隱含層對(duì)輸入層的變換,將低維的輸入數(shù)據(jù)變換到高維模式,將非線性問題轉(zhuǎn)化為線性問題。RBF神經(jīng)網(wǎng)絡(luò)屬于前向網(wǎng)絡(luò),包括輸入層、隱含層和輸出層,網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 RBF徑向基神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
建立一個(gè)RBF神經(jīng)網(wǎng)絡(luò)的步驟:
(1)建立神經(jīng)網(wǎng)絡(luò),添加所需的訓(xùn)練輸入矢量,輸入對(duì)應(yīng)的目標(biāo)矢量以及擴(kuò)展參數(shù)。
(2)按照參數(shù)確定的算法進(jìn)行網(wǎng)絡(luò)訓(xùn)練,當(dāng)達(dá)到給定誤差要求時(shí),確定最終網(wǎng)絡(luò)各層的權(quán)值和閾值,進(jìn)而確定網(wǎng)絡(luò)結(jié)構(gòu)用以完成訓(xùn)練。
用電量預(yù)測(cè)是一個(gè)高度非線性問題,大多數(shù)預(yù)測(cè)方法是通過對(duì)觀察某些特征因子來挖掘背后的信息。然而,這些預(yù)測(cè)因子的信息之間可能存在著非常復(fù)雜的相互作用,因此,在訓(xùn)練時(shí),傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)容易出現(xiàn)過擬合現(xiàn)象,這樣預(yù)測(cè)可能會(huì)不夠準(zhǔn)確,但是在這種有特征因子的樣本數(shù)據(jù)中,會(huì)有相似的規(guī)律可尋,根據(jù)輸入樣本點(diǎn)較相似、密度大時(shí),有領(lǐng)域預(yù)測(cè)精度更高的網(wǎng)絡(luò)特性。
實(shí)際預(yù)測(cè)中,組合人工神經(jīng)網(wǎng)絡(luò)是一種提高預(yù)測(cè)精度的有效方法,混合算法是通過對(duì)輸入樣本先聚類,組合成為相似樣本,對(duì)該樣本建立RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,通過對(duì)樣本分類建模,將原來分布不均勻的各樣本點(diǎn)集中到各自相鄰的領(lǐng)域,從而預(yù)測(cè)精度將會(huì)大大提高[8]。
圖3 SOM-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)系統(tǒng)工作流程
如圖3所示,組合人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的實(shí)現(xiàn)步驟如下:
(1)對(duì)給定的樣本進(jìn)行歸一化處理,其自變量區(qū)域?yàn)閇0,1],其公式為:
xk=(xk-xmin)/(xmax-xmin)
(8)
公式(8)中,xmin為原始數(shù)據(jù)的最小值;xmax為原始數(shù)據(jù)的最大值;
(2)對(duì)于歸一化后的數(shù)據(jù)進(jìn)行SOM聚類分析,調(diào)用Matlab中的SOM 神經(jīng)網(wǎng)絡(luò)工具箱的函數(shù)命令:net=newsom(minmax(p),[x]);
(3)在SOM神經(jīng)網(wǎng)絡(luò)分出的每一種樣本類內(nèi)各自構(gòu)建一個(gè)RBF神經(jīng)網(wǎng)絡(luò),并分別用各種樣本類內(nèi)的訓(xùn)練樣本來訓(xùn)練該類的RBF神經(jīng)網(wǎng)絡(luò);
(4)對(duì)預(yù)測(cè)完后的值反歸一化處理,得到用電量具體值,通過與實(shí)際用電量誤差分析,判斷該組合神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)效果。
本文利用文獻(xiàn)[9]給出的從1997年到2016年10個(gè)影響因素和湖北省年用電量統(tǒng)計(jì)數(shù)據(jù)(見表1)可以看出,影響用電量的因素有很多種,這說明對(duì)用電量的預(yù)測(cè)是一個(gè)高度非線性問題,對(duì)10個(gè)主要影響因素和湖北省用電量均經(jīng)歸一化處理,作為輸入和目標(biāo)向量。其中,本文采取按數(shù)量隨機(jī)抽取訓(xùn)練樣本和測(cè)試樣本的選取策略,從20個(gè)樣本選取6、11、15、19、20進(jìn)行預(yù)測(cè)解決前組作為網(wǎng)絡(luò)的訓(xùn)練樣本,其余15組數(shù)據(jù)作為訓(xùn)練樣本。由于樣本數(shù)據(jù)向量中各個(gè)指標(biāo)有所不同,為了防止部分神經(jīng)元達(dá)到過飽和狀態(tài)以及方便計(jì)算,先對(duì)樣本的輸入數(shù)據(jù)進(jìn)行預(yù)處理。
表1 湖北省用電量與影響因素統(tǒng)計(jì)表
(1)本文調(diào)用Matlab[10]神經(jīng)網(wǎng)絡(luò)工具箱中的函數(shù)命令對(duì)樣本進(jìn)行分類:
net=newsom(minmax(P),[1,a]);net.trainParam.epochs=b;
其中,a為分類數(shù)目,b為訓(xùn)練次數(shù)。由訓(xùn)練結(jié)果可知,當(dāng)訓(xùn)練次數(shù)大于200次的時(shí)候,訓(xùn)練結(jié)果和100次相同,所以,訓(xùn)練次數(shù)的增加就沒有太大意義。所以選擇訓(xùn)練200次。分別取a=3,4,5,如表2所示:
表2 SOM聚類分成三類結(jié)果
如表2所示。由實(shí)際情況分析和上面三個(gè)表格的分類比較可以看出,將20組數(shù)據(jù)自適應(yīng)分成4類比較合適。其中預(yù)測(cè)樣本編號(hào)6為Ⅰ類,11為Ⅱ類,15為Ⅲ類,19、20為Ⅳ類。
(2)分別針對(duì)已經(jīng)分好的每一類樣本采用RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行建模。根據(jù)影響用電量的影響因素、實(shí)際數(shù)據(jù)和其網(wǎng)絡(luò)自身的特點(diǎn),確定RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù),調(diào)用RBF網(wǎng)絡(luò)工具箱如下:
net=newrbe(P,T,SPREAD)
其中 P代表訓(xùn)練樣本輸入,T代表訓(xùn)練樣本的輸出,即目標(biāo)向量,SPREAD為徑向基函數(shù)的分布密度,取不同的spread值,分別對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行多次嘗試性訓(xùn)練后,Ⅰ類、Ⅱ類、Ⅳ類選取最佳值30,Ⅲ類選取最佳值為0.5。
(3)樣本訓(xùn)練過程就是RBF神經(jīng)網(wǎng)絡(luò)的建立過程。訓(xùn)練完之后,即可用于對(duì)測(cè)試樣本的預(yù)測(cè)。
根據(jù)上述預(yù)測(cè)步驟,通過Matlab結(jié)合表1數(shù)據(jù)建立年用電量預(yù)測(cè)模型進(jìn)行仿真試驗(yàn),樣本編號(hào)6、11、15、19、20作為測(cè)試樣本,輸入到SOM-RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,可以得到該組訓(xùn)練樣本下實(shí)際值和預(yù)測(cè)值的對(duì)比,如圖4所示。
由圖4可知,該預(yù)測(cè)模型在5個(gè)樣本的預(yù)測(cè)上有著較好的擬合結(jié)果,對(duì)相關(guān)10個(gè)影響因素的變化有著良好的跟蹤能力,預(yù)測(cè)效果較好,并且對(duì)年用電量擬合精度較高,有著較為不錯(cuò)的預(yù)測(cè)表現(xiàn)。
如圖5所示,本文分別建立單一的BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò),對(duì)比SOM-RBF神經(jīng)網(wǎng)絡(luò),可以看出在預(yù)測(cè)效果上更接近實(shí)際值,混合算法比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)優(yōu)勢(shì)更加明顯,BP、RBF在19和20樣本數(shù)據(jù)表現(xiàn)出較大的誤差,離散程度更大。
圖4 年用電量真實(shí)值與預(yù)測(cè)值對(duì)比圖
圖5 三種神經(jīng)網(wǎng)絡(luò)對(duì)比圖
將本文采用的 SOM-RBF 組合網(wǎng)絡(luò)預(yù)測(cè)的結(jié)果,與直接應(yīng)用BP神經(jīng)網(wǎng)絡(luò)模型和RBF神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,結(jié)果見表3??梢钥闯?,BP網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果,其相對(duì)誤差最大達(dá)到了16.19%,最小也為2.24%;RBF相對(duì)誤差最大為9.09%,而混合SOM-RBF 網(wǎng)絡(luò)組合模型的預(yù)測(cè)結(jié)果,除19號(hào)樣本外,相對(duì)誤差都在3%以下。這是因?yàn)樯窠?jīng)網(wǎng)絡(luò)預(yù)測(cè)的準(zhǔn)確性和訓(xùn)練樣本數(shù)據(jù)的多少有較大的關(guān)系,特別是對(duì)BP神經(jīng)網(wǎng)絡(luò)來說,如果缺乏足夠多的訓(xùn)練數(shù)據(jù),網(wǎng)絡(luò)預(yù)測(cè)值可能存在較大的誤差。而精確網(wǎng)絡(luò)適合樣本數(shù)據(jù)較少的情況,能夠更有效提高誤差精度。
表3 三種預(yù)測(cè)模型預(yù)測(cè)效果對(duì)比分析
通過本文對(duì)湖北省近20年用電量數(shù)據(jù)樣本進(jìn)行分析,可以看出用電量是一種非線性數(shù)據(jù),傳統(tǒng)神經(jīng)網(wǎng)絡(luò)在面對(duì)非線性問題上有很好的處理能力,這往往需要大量樣本進(jìn)行網(wǎng)絡(luò)訓(xùn)練,對(duì)于預(yù)測(cè)精度問題仍是研究的重點(diǎn)和難點(diǎn)。在面對(duì)用電量數(shù)據(jù)監(jiān)測(cè)和采集不足的情況下,利用某些影響因素之間的關(guān)聯(lián)性,結(jié)合SOM和RBF各自的特點(diǎn),聚類后再分別建模預(yù)測(cè),從而提升預(yù)測(cè)模型的精度。試驗(yàn)結(jié)果表明:較傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)模型,該方法有更高的擬合精度和泛化能力,預(yù)測(cè)的相對(duì)誤差較小,能更加有效地應(yīng)用到用電量預(yù)測(cè)中。