余霞
(四川電力設(shè)計(jì)咨詢有限責(zé)任公司四川成都 610041)
電力工程造價(jià)小樣本估算模型探討
余霞
(四川電力設(shè)計(jì)咨詢有限責(zé)任公司四川成都610041)
在我國(guó)社會(huì)科技快速發(fā)展以及人們對(duì)工程建設(shè)提出的要求不斷增高的條件下,電力工程建設(shè)中一般會(huì)受到多種因素的限制,顯著增加了工程模型的復(fù)雜度,實(shí)際建設(shè)中很容易受到各種因素的影響,產(chǎn)生了多種維數(shù)非常高的工程模型,可是同期相似工程又比較有限,所以對(duì)這種模型建立數(shù)學(xué)模型難度比較高,一般把這種建設(shè)工程類型叫做小樣本數(shù)據(jù)。本文主要對(duì)電力工程造價(jià)方面所構(gòu)建的小樣本估算模型進(jìn)行探討,提出筆者的思考和建議,僅供參考。
電力工程;造價(jià);小樣本;估算模型
對(duì)電力工程造價(jià)進(jìn)行管理的時(shí)候,相關(guān)審查人員以及投資方非常關(guān)心主要是靜態(tài)投資或動(dòng)態(tài)投資。所以,對(duì)新建電力工程來(lái)說(shuō),可以對(duì)工程技術(shù)指標(biāo)以及經(jīng)濟(jì)指標(biāo)符合新建工程投資發(fā)生的改變情況進(jìn)行分析。電力工程過(guò)去累積的造價(jià)資料具有一個(gè)非常顯著的特點(diǎn),就是屬性指標(biāo)比較多,能夠收集起來(lái)的同期樣本數(shù)量有限??墒窃谶M(jìn)行數(shù)學(xué)建模的時(shí)候,若數(shù)據(jù)維度非常高,并且樣本數(shù)目非常少,就會(huì)顯著減小數(shù)據(jù)模型所具有的泛化能力。所以。找到一種有效的數(shù)學(xué)方法,在盡量包含更多原始數(shù)據(jù)信息的條件下,降維數(shù)據(jù),也就是建立小樣本估算模型,這樣對(duì)下步數(shù)據(jù)模型的構(gòu)建非常有利。
1.1歸一化處理
對(duì)于實(shí)際工程項(xiàng)目來(lái)說(shuō),其里面的所有原始指標(biāo)具體表示含義都是不一樣的,各個(gè)指標(biāo)數(shù)值之間的數(shù)量級(jí)有著非常大的差別,可是采用主成分分析法進(jìn)行分析的時(shí)候,所提取的主成分一般會(huì)比較“偏愛(ài)”數(shù)量級(jí)比較偏大的指標(biāo),同時(shí)忽略或不要數(shù)量級(jí)非常小的指標(biāo),導(dǎo)致主成分提出方面產(chǎn)生主觀錯(cuò)誤。所以,對(duì)主成分進(jìn)行分析前,通常會(huì)歸一化處理屬性指標(biāo)樣本,把各個(gè)屬性指標(biāo)全部歸一化在[0,1]范圍之間[1]。對(duì)原始p個(gè)不同指標(biāo)變量x1,,,xp進(jìn)行歸一化,圖1為歸一化處理前后具體數(shù)據(jù)分布情況,處理后的數(shù)據(jù)分布比較均勻,顯著減小了指標(biāo)數(shù)量級(jí)差異給主成分提取帶來(lái)的影響,最終獲得新數(shù)據(jù)集。
圖1
1.2提取主成分
之所以采取主成份分析法,主要幾何意就是:利用各個(gè)原始指標(biāo)的線性組合,把原始數(shù)據(jù)建立的坐標(biāo)系轉(zhuǎn)變成一種新坐標(biāo)系。想要直觀的看出主成份分析法所提取的主成份原指標(biāo)具體信息量,就應(yīng)該利用Pareto圖來(lái)將各個(gè)主成分發(fā)生的變化具體百分比情況有效顯示出來(lái)。進(jìn)行累計(jì)貢獻(xiàn)率計(jì)算的時(shí)候,通常要求累積貢獻(xiàn)率為85%,相關(guān)文獻(xiàn)里面也定義為80%,就代表認(rèn)為新主成分能夠替代原始具體指標(biāo)數(shù)據(jù)[2]。
2.1進(jìn)行判斷所遵循的原則
通常估算模型都是以一定原則為基礎(chǔ),按照輸入屬性參數(shù)來(lái)計(jì)算的,從而獲得最理想的具體目標(biāo)值。隨著電力工程建設(shè)過(guò)程中安全建設(shè)變得越來(lái)越重要和電力工程以前所累積的具體樣本數(shù)據(jù)非常少這一實(shí)際情況,實(shí)際模型過(guò)程中,應(yīng)該采用以雙重風(fēng)險(xiǎn)規(guī)避為基礎(chǔ)的具體原則來(lái)開(kāi)展造價(jià)估算工作。同時(shí),支持向量機(jī)具體理論的電力工程估算模型著重考慮了安全因素,始終堅(jiān)持遵循經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化具體原則以及結(jié)構(gòu)風(fēng)險(xiǎn)最小化具體原則[3]。其中經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化具體原則是利用計(jì)算判斷盡量讓式(1)得出的結(jié)果最小,從而對(duì)在充分考慮相關(guān)安全因素的實(shí)際條件下對(duì)電力工程造價(jià)進(jìn)行估算。
式中:Remp代表所有經(jīng)驗(yàn)風(fēng)險(xiǎn)里面的最小系數(shù);而琢則代表函數(shù)廣義參數(shù);字母l代表樣本數(shù)量值;xi代表主特征參數(shù);而Q (xi,α)代表的是損失函數(shù)集。
以考慮經(jīng)驗(yàn)風(fēng)險(xiǎn)為前提條件,并且遵循結(jié)構(gòu)風(fēng)險(xiǎn)最小化具體原則,采用數(shù)據(jù)統(tǒng)計(jì)和偏相關(guān)分析方法對(duì)歷史電力工程數(shù)據(jù)和待建電力工程數(shù)據(jù)具體物理指標(biāo)進(jìn)行處理,實(shí)際建立小樣本估算模型前應(yīng)該篩選多種數(shù)據(jù)信息,通過(guò)比較科學(xué)的數(shù)學(xué)方法,以確保最大限度地具有相關(guān)有效信息為前提,盡量刪除掉那些多余的,沒(méi)有使用價(jià)值的數(shù)據(jù)。將已經(jīng)篩選好的相關(guān)數(shù)據(jù)架設(shè)成主特征因素,把主特征因素具體函數(shù)集分化為統(tǒng)一的函數(shù)子集序列,保證各個(gè)主特征具體因素子集按照置信區(qū)間的大小來(lái)有效地進(jìn)行排序,同時(shí)在不同主特征因素子集里面尋找最小經(jīng)驗(yàn)風(fēng)險(xiǎn),通過(guò)折中考慮辦法確保實(shí)際風(fēng)險(xiǎn)是最小的。
2.2具體構(gòu)建過(guò)程
對(duì)電力工程進(jìn)行造價(jià)估算實(shí)際上就是將電力工程建設(shè)過(guò)程中的相關(guān)影響因素映射到電力工程整個(gè)造價(jià)空間中,實(shí)際模型建設(shè)過(guò)程中,主要采用以支持向量機(jī)理論為基礎(chǔ)的具體方法進(jìn)行計(jì)算的。其中支持向量機(jī)通過(guò)非線性映射具體算法把低維特性電力工程歷史數(shù)據(jù)變成一種高維特征空間,同時(shí)通過(guò)線性算法線性分析樣本所具有的非線性特征,圖2為電力工程造價(jià)估算模型所采用的支持向量機(jī)具體學(xué)習(xí)方式。以雙重風(fēng)險(xiǎn)規(guī)避具體原則為基礎(chǔ),在程序里面編輯線性多項(xiàng)式型具體函數(shù),以此來(lái)對(duì)估算結(jié)果準(zhǔn)確性進(jìn)行測(cè)試[4]。
圖2
估算模型實(shí)際構(gòu)建時(shí),把輸變電工程具體造價(jià)估算所具有的主特征因素當(dāng)做支持向量機(jī)的相關(guān)輸入?yún)?shù),同時(shí)把輸變電工程造價(jià)當(dāng)做輸出函數(shù),將電力工程累積的歷史工程造價(jià)所具有的主特征因素和實(shí)際造價(jià)解當(dāng)做學(xué)習(xí)樣本來(lái)優(yōu)化計(jì)算機(jī)器;同時(shí)建構(gòu)支持向量機(jī)具體造價(jià)估算模型,再把待建工程所具有的主特征參數(shù)有效輸入該模型里面,利用前面調(diào)試的相應(yīng)計(jì)算模型來(lái)分析計(jì)算該主特征參數(shù),從而獲得待建工程最終的造價(jià)。以支持向量機(jī)具體理論為基礎(chǔ)的這種輸電力工程估算模型具體建立步驟是:
(1)對(duì)屬性參數(shù)進(jìn)行整理。通過(guò)數(shù)據(jù)統(tǒng)計(jì)和偏相關(guān)分析方法對(duì)造價(jià)數(shù)據(jù)具體物理指標(biāo)進(jìn)行處理,有效整理歷史電力工程建設(shè)過(guò)程中的相關(guān)屬性參數(shù),找出歷史電力工程所具有的主特征參數(shù)以及造價(jià)金額[5]。此外,還應(yīng)該找出待建電力工程所具有的主特征參數(shù)值。
(2)構(gòu)建樣本集。對(duì)第一步整理的具體參數(shù)進(jìn)行再一次整理,將其分成兩個(gè)不同的集合,同時(shí)把歷史電力工程所具有的主特征參數(shù)以及造價(jià)金額當(dāng)做訓(xùn)練集,這種訓(xùn)練集數(shù)據(jù)具有的主要作用就是當(dāng)做學(xué)習(xí)樣本來(lái)優(yōu)化計(jì)算機(jī)器,同時(shí)構(gòu)建支持向量機(jī)具體造價(jià)估算算法,給后續(xù)支持向量機(jī)相關(guān)訓(xùn)練環(huán)節(jié)打下堅(jiān)實(shí)的基礎(chǔ)。如果假設(shè)這個(gè)過(guò)程中構(gòu)建的訓(xùn)練樣本集是:
D={(xi,yi)|i=1,2…,n}(2)
式中:字母D代表訓(xùn)練樣本集;而xi則代表歷史電力工程所具有的主特征參數(shù);符號(hào)yi代表歷史電力工程造價(jià);字母n代表歷史電力工程數(shù)量[6]。
(3)確定具體估算函數(shù)。使用支持向量機(jī)具體理論就是為了使用非線性相應(yīng)的映射算法把低維特性的那些變電工程具體歷史數(shù)據(jù)變成一種高維特征空間,同時(shí)通過(guò)線性算法分析樣本所具有的非線性特征。因?yàn)楸疚哪P驮瓌t僅僅是回歸一個(gè)函數(shù),就是f(x)函數(shù),保證這個(gè)函數(shù)的最終計(jì)算結(jié)果與設(shè)定誤差要求相符,同時(shí)獲得的函數(shù)一定要滿足一個(gè)要求,具體為:除了訓(xùn)練集里面的歷史電力工程所具有的主特征參數(shù)x,也能夠通過(guò)函數(shù)f找出相應(yīng)的y,利用支持向量機(jī)具體理論可以獲得的回歸函數(shù)為:
f(x)=ax+b (3)
該公式的約束條件是:
|f(x)=ax+b|臆著(4)
式中:f(x)代表回歸函數(shù):字母a、b代表回歸獲得的具體參數(shù)值;而著則代表設(shè)定誤差極限。
(4)采用模型進(jìn)行估算。通過(guò)把電力工程歷史累積的數(shù)據(jù)當(dāng)做訓(xùn)練集建立了與誤差要求相符的回歸函數(shù),即f(x)函數(shù),然后把待建電力工程所具有的主特征參數(shù)當(dāng)做輸入數(shù)據(jù)代入這一函數(shù)中進(jìn)行計(jì)算,最后獲得的計(jì)算結(jié)果就是代建電力工程的具體估算造價(jià)。
上述是建立以支持向量機(jī)理論為基礎(chǔ)的電力工程估算模型所采取的主要步驟。這一模型在以利用數(shù)據(jù)統(tǒng)計(jì)和偏相關(guān)分析方法對(duì)造價(jià)數(shù)據(jù)具體物理指標(biāo)進(jìn)行處理為基礎(chǔ),通過(guò)支持向量機(jī)理論在處理小樣本數(shù)據(jù)以及非線性數(shù)據(jù)等過(guò)程中的突出優(yōu)勢(shì),有效設(shè)計(jì)了該電力工程造價(jià)具體數(shù)據(jù)估算模型。這一模型具有的突出優(yōu)勢(shì)為:能夠把低維特性相關(guān)電力工程歷史數(shù)據(jù)變?yōu)楦呔S數(shù)據(jù),然后進(jìn)行有效的分析計(jì)算,同時(shí)可以提升計(jì)算精度。
對(duì)于現(xiàn)階段電力工程造價(jià)中存在的問(wèn)題,利用數(shù)據(jù)統(tǒng)計(jì)和偏相關(guān)分析方法對(duì)造價(jià)數(shù)據(jù)具體物理指標(biāo)進(jìn)行處理,整理歷史電力工程所具有的屬性參數(shù),找出歷史電力工程和代建電力工程具有的主特征參數(shù)以及歷史電力工程造價(jià)金額。以此為基礎(chǔ),利用支持向量機(jī)理論所具有的優(yōu)勢(shì),設(shè)計(jì)出了這種電力工程具體造價(jià)估算模型。實(shí)踐結(jié)果顯示,這種方法能夠符合工程造價(jià)管理以及控制的具體需要,推廣應(yīng)用的價(jià)值非常高。
[1]張琦.油田污水站輸變電工程造價(jià)估算模型[J].油氣田地面工程,2015 (5):47~48,49.
[2]劉鳳華,謝乃明.小樣本、貧信息下民用飛機(jī)費(fèi)用估算模型及算法[J].系統(tǒng)仿真學(xué)報(bào),2014,26(3):687~691.
[3]張敏芳,劉沃野,陳煒?shù)?,?小樣本裝備軟件成本估算相關(guān)向量機(jī)建模[J].軍械工程學(xué)院學(xué)報(bào),2011,23(4):13~16.
[4]劉家福,占文鳳,梁雨華,等.P-芋型分布與信息擴(kuò)散理論的風(fēng)險(xiǎn)估算模型比較研究[J].北京師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,47(3):300~ 303.
[5]張敏芳,陳建泗,李少波,等.基于SVM/RVM的小樣本裝備軟件成本估算[J].統(tǒng)計(jì)與決策,2013(11):92~94.
[6]王綿斌,李歡歡,譚忠富,等.基于支持向量機(jī)方法的輸電工程造價(jià)指標(biāo)評(píng)估體系[J].電力建設(shè),2014,35(3):102~106.
TM743
A
1673-0038(2015)49-0133-02
2015-11-14