王勝毅 ,蔄曉琨 ,于 振 ,夏 君
(1.國網(wǎng)山東省電力公司,山東 濟南 250001;2.國網(wǎng)山東省電力公司建設(shè)公司,山東 濟南 250001;3.國網(wǎng)濟南供電公司,山東 濟南 250012)
隨著我國電力系統(tǒng)特高壓交流、直流輸電線路的相繼建設(shè),分布式發(fā)電裝置的大量接入,儲能電池技術(shù)的不斷升級,電力系統(tǒng)輸電網(wǎng)絡(luò)必須進行更新和擴建以滿足日漸嚴(yán)苛的輸配電要求,近年來用于輸電線路工程項目的投資額不斷上升[1-2]。
輸電線路的工程造價,是某項輸電線路工程建設(shè)所花費的費用總額,受到自然、社會、經(jīng)濟等多種因素的制約和影響[3-6]。輸電線路工程是關(guān)系國計民生的公共事業(yè),對其造價費用的精準(zhǔn)預(yù)測具有重要的意義:首先,造價預(yù)測可以為輸電線路建設(shè)預(yù)算的確定提供依據(jù);其次,造價預(yù)測可以為輸電線路造價的審核提供標(biāo)準(zhǔn);再次,造價預(yù)測可以對輸電線路建設(shè)項目的投資進行評價和分析;最后,造價預(yù)測還可以用于優(yōu)選不同的輸電線路建設(shè)方案。
工程造價預(yù)測研究的歷史可以推溯到幾百年前,英國皇家測量師協(xié)會、美國工料測量和評估系統(tǒng)基于大量的實際工程項目,建立了最初的造價預(yù)估和評價體系。1974年工程項目唯一性理論的提出,證明了傳統(tǒng)方式下單純用已完成的工程項目來對規(guī)劃中的項目進行評估是不嚴(yán)謹(jǐn)?shù)?,調(diào)整系數(shù)的確定也相對復(fù)雜。進入20世紀(jì)90年代,計算機和通信技術(shù)飛速發(fā)展,神經(jīng)網(wǎng)絡(luò)[7-8]、遺傳算法、支持向量機[9-10]等智能算法相繼出現(xiàn)并在造價預(yù)測領(lǐng)域展現(xiàn)出廣闊的應(yīng)用價值,不同的智能算法有不同的數(shù)學(xué)特性和適用場景,有必要針對輸電線路的實際工程造價問題進行對比和分析。數(shù)據(jù)聚類可以對原始數(shù)據(jù)進行預(yù)處理,排除特殊樣本,聚攏相似數(shù)據(jù),進而提升智能預(yù)測模型的精度[11],常用的數(shù)據(jù)聚類方法包括:K-Means 聚類[12]、層次聚類[13]以及模糊聚類[14]方法。
傳統(tǒng)預(yù)測方法分為定性預(yù)測方法和定量預(yù)測方法兩類。定性預(yù)測方法主要包括:專家會議法、德爾菲法以及主觀概率法,定性預(yù)測方法的特點是要收集專家對于項目的意見和期望,過程煩瑣且預(yù)測結(jié)果不可避免會引入專家的主觀因素。
定量預(yù)測方法包括:移動平均法、指數(shù)平滑法、趨勢外推法、卡爾曼濾波法、灰色預(yù)測法等。定量預(yù)測方法不受主觀因素影響,大量應(yīng)用于實際工程的預(yù)測,然而對于復(fù)雜的建設(shè)項目,原始數(shù)據(jù)繁雜多樣,數(shù)據(jù)規(guī)律性差,該方法對于數(shù)據(jù)間的交互效應(yīng)及非線性關(guān)系的處理能力較差。
人工神經(jīng)網(wǎng)絡(luò)。BP(back propagation)神經(jīng)網(wǎng)絡(luò)是一種用于前饋多層的反向傳播學(xué)習(xí)算法。計算過程中,組成前饋多層網(wǎng)絡(luò)的各人工神經(jīng)元之間的連接權(quán)值會不斷進行修改,最終能夠使輸入該前饋多層網(wǎng)絡(luò)的信息轉(zhuǎn)化成所期望的輸出內(nèi)容。如圖1(a)所示為BP人工神經(jīng)網(wǎng)絡(luò)的計算流程。
支持向量機。支持向量機SVM(Support Vector Machine)是一類按監(jiān)督學(xué)習(xí)方式對數(shù)據(jù)進行二元分類的廣義線性分類器,它的目的是尋找一個超平面來對樣本進行分割,分割的原則是間隔最大化,最終轉(zhuǎn)化為一個凸二次規(guī)劃問題來求解,程序流程如圖1(b)所示。支持向量機算法應(yīng)用核函數(shù)原理,基于結(jié)構(gòu)風(fēng)險最小化方法來尋找歸納統(tǒng)計設(shè)計模型,進而實現(xiàn)最小風(fēng)險泛函,將數(shù)據(jù)從低維空間映射到高維空間,有效避免了“維數(shù)災(zāi)難”,在電力預(yù)測、文本分類等諸多領(lǐng)域取得了廣泛應(yīng)用。
圖1 現(xiàn)代智能預(yù)測方法計算流程
K-Means聚類算法也稱為K-均值聚類算法,K是指最終聚集的類別數(shù)。假設(shè)選取的輸入樣本為S=X1,X2,…,Xn則該算法的執(zhí)行步驟為:
a)輸入樣本中任取K個樣本點作為K個類別的初始中心 μ1,μ2,…,μk;
b)對每一個樣本點 Xi,i=1,2,…,n 計算它們與各中心的距離,將它歸入距離最小的中心所在的類別;
c)待所有樣本點歸類結(jié)束,將K個類別的中心更新為屬于該類別樣本點的均值;
d)重復(fù) b),c)過程,直至各類別的中心變動都小于某個閾值。
如圖2和圖3所示,分別為含噪聲的輸入樣本和去噪后的輸入樣本的K-Means聚類過程,聚類簇數(shù)設(shè)定為3,可以得出結(jié)論:特殊的噪聲信息會對K-Means聚類的結(jié)果產(chǎn)生較大的影響。
圖2 K-Means聚類算法(含噪聲)
圖3 K-Means聚類算法(去噪后)
層次聚類算法不指定具體的簇數(shù),而只關(guān)注簇之間的遠近,最終會形成一個樹形圖。如圖4所示,以5個初始樣本為例進行介紹,經(jīng)過4層聚類后,所有樣本都完成聚類,噪聲樣本同樣會對最終的聚類結(jié)果產(chǎn)生影響。它的基本過程如下:
a)將每個樣本點都劃分成一個類別;
b)計算各個類別之間的距離,將距離最近的兩個類別聚合成一個新的類別;
c)重復(fù)b)過程直至最后只剩一個類別,形成樹狀結(jié)構(gòu)圖;
d)依據(jù)用戶設(shè)定的聚類層數(shù),確定若干聚類后的樣本集數(shù)量,計算得到各樣本集的中心點。
圖4 層次聚類樹狀圖
模糊聚類算法FCM (Fuzzy C-Means)是一種無監(jiān)督的模糊聚類方法,在優(yōu)化目標(biāo)函數(shù)的基礎(chǔ)上對輸入樣本進行聚類。聚類結(jié)果表達為每一個數(shù)據(jù)點對聚類中心的隸屬程度,該隸屬程度用一個數(shù)值來表示。FCM的理論基礎(chǔ)完善,已經(jīng)應(yīng)用于多個領(lǐng)域并取得了較好的效果。然而,該算法在執(zhí)行前需要先假定若干參數(shù),若參數(shù)選取不當(dāng)則聚類效果不佳;其次,當(dāng)輸入樣本的數(shù)目較多時,該算法的實時性較差。 假設(shè)選取的輸入樣本為 S=X1,X2,…,Xn,算法的執(zhí)行步驟為:
a)隨機劃分隸屬度矩陣U,初始化k個聚類中心;
b)計算聚類中心 ci,i=1,2,…,k;
c)更新隸屬度矩陣U;
d)重復(fù) b),c)過程,直至所有中心點不再變化或者隸屬度矩陣U變化很小。
特殊的噪聲樣本對3類聚類方法最終的聚類結(jié)果都會產(chǎn)生一定的影響[15]。在輸電線路的歷史工程中,難免會有一些特殊的工程樣本,該類工程的造價與常規(guī)工程造價差別很大,參考性不強,稱為噪聲樣本。噪聲樣本的引入會嚴(yán)重干擾到支持向量機、BP人工神經(jīng)網(wǎng)絡(luò)等智能預(yù)測模型的訓(xùn)練準(zhǔn)確性,降低預(yù)測精度。
輸電線路工程的造價樣本數(shù)量往往十分龐大,部分樣本呈現(xiàn)相同或相似的建造環(huán)境和造價特性,可以對該類樣本進行聚類,得到該類別樣本的平均屬性,從而進一步弱化噪聲樣本的干擾,縮小輸入到支持向量機、BP神經(jīng)網(wǎng)絡(luò)算法中的訓(xùn)練樣本體積,提高智能預(yù)測模型的預(yù)測效率以及普適性,避免出現(xiàn)局部最優(yōu)的情況。所述的3類聚類方法均可以用于智能預(yù)測模型的輸入樣本預(yù)處理。
因此,提出了基于聚類算法的綜合智能預(yù)測方法,程序流程如圖5所示:首先將輸入的歷史輸電線路工程造價數(shù)據(jù)分為訓(xùn)練樣本和測試樣本;其次,去除訓(xùn)練樣本中的噪聲后,分別利用K-Means聚類、層次聚類、模糊聚類3種聚類方法對訓(xùn)練樣本進行聚類,得到可行聚類樣本 1,2,3;再次,分別將 3種聚類后樣本作為數(shù)據(jù)源,完成BP神經(jīng)網(wǎng)絡(luò)和支持向量機算法的訓(xùn)練;最后,利用兩種智能算法對測試樣本進行預(yù)測,并與測試樣本的真實造價進行比對,量化3種聚類方法對2類智能預(yù)測模型的預(yù)測精度的提高幅度。
圖5 基于聚類算法的綜合智能預(yù)測方法
選取某區(qū)域電網(wǎng)2015—2016年新建的80組220 kV輸電線路工程的造價數(shù)據(jù)作為數(shù)據(jù)源。排除其中的10組特殊建造工程,剩余70組工程數(shù)據(jù),將其中的60個樣本作為訓(xùn)練集,其余的10個樣本作為測試集,分別利用BP神經(jīng)網(wǎng)絡(luò)和支持向量機SVM預(yù)測算法進行計算和分析。
如表1所示,在利用BP神經(jīng)網(wǎng)絡(luò)和支持向量機SVM預(yù)測算法對220 kV輸電線路工程造價進行預(yù)算時誤差都控制在20%以下;預(yù)測誤差最大的工程均為8號工程(17.36%和18.11%);BP神經(jīng)網(wǎng)絡(luò)的平均預(yù)測誤差為9%,支持向量機SVM的平均預(yù)測誤差為6.87%,平均預(yù)測誤差均控制在10%以下,兩種方法在預(yù)測220 kV輸電線路工程造價時均有較高的精度。
表1 BP神經(jīng)網(wǎng)絡(luò)和支持向量機SVM預(yù)測結(jié)果
繼續(xù)使用以上70組去噪220 kV輸電線路的工程造價數(shù)據(jù)。首先,分別利用K-Means聚類、層次聚類和模糊聚類算法對該數(shù)據(jù)進行聚類,依據(jù)聚類結(jié)果排除掉6組單獨成類的樣本(視為特例),剩余64輸入數(shù)據(jù),選取56組數(shù)據(jù)作為訓(xùn)練組,8組數(shù)據(jù)作為測試組;之后基于3種聚類后的數(shù)據(jù)完成BP神經(jīng)網(wǎng)絡(luò)和支持向量機SVM算法的預(yù)測過程;最后將聚類前和聚類后的預(yù)測誤差進行比對,得到表2和表3所示的結(jié)果,聚類1表示K-Means聚類,聚類2表示層次聚類,聚類3表示模糊聚類。
表2 3種聚類方法對BP神經(jīng)網(wǎng)絡(luò)預(yù)測的影響 %
如表2所示為采用了BP神經(jīng)網(wǎng)絡(luò)預(yù)測算法在數(shù)據(jù)聚類前和執(zhí)行3種數(shù)據(jù)聚類算法后的誤差值,聚類前平均預(yù)測誤差為8.39%,K-Means聚類后平均預(yù)測誤差為8.09%,層次聚類后平均預(yù)測誤差為7.77%,模糊聚類后平均預(yù)測誤差為8.07%,可得結(jié)論:3種聚類方法均可以降低BP神經(jīng)網(wǎng)絡(luò)算法對220 kV輸電線路工程造價預(yù)測的誤差,層次聚類法降低誤差的效果最顯著。
表3為采用了支持向量機SVM預(yù)測算法在數(shù)據(jù)聚類前和執(zhí)行3種數(shù)據(jù)聚類算法后的誤差值,聚類前平均預(yù)測誤差為6.10%,K-Means聚類后平均預(yù)測誤差為5.82%,層次聚類后平均預(yù)測誤差為5.79%,模糊聚類后平均預(yù)測誤差為5.66%,可以得到結(jié)論:3種聚類方法均可降低支持向量機SVM算法對220 kV輸電線路工程造價預(yù)測的誤差,模糊聚類的誤差降低效果最顯著。
表3 3種聚類方法對支持向量機SVM預(yù)測的影響 %
BP神經(jīng)網(wǎng)絡(luò)和支持向量機SVM是常用的兩種智能預(yù)測算法,分別介紹了兩類智能預(yù)測算法的執(zhí)行過程以及適用場景,詳細討論了K-Means聚類、層次聚類和模糊聚類3種典型的聚類方法,并將其應(yīng)用于提升BP神經(jīng)網(wǎng)絡(luò)和支持向量機SVM算法的預(yù)測精度,提出了一種輸電線路工程造價的綜合智能預(yù)測方法?;谀硡^(qū)域電網(wǎng)2015—2016年新建的80組220 kV輸電線路工程造價數(shù)據(jù)開展算例測試,結(jié)果表明:兩種智能預(yù)測模型均能將預(yù)測誤差控制在20%以內(nèi),層次聚類對BP神經(jīng)網(wǎng)絡(luò)算法的誤差降低效果最為顯著,模糊聚類對支持向量機SVM算法的誤差降低效果最為顯著。