李建青 張?jiān)圃啤】到?/p>
摘 要:更換變壓器工程是生產(chǎn)技改工程的重要組成部分,分析工程造價(jià)合理性,往往需要參考已施過(guò)的工程造價(jià)數(shù)據(jù),在對(duì)過(guò)去樣本進(jìn)行數(shù)據(jù)整理過(guò)程中,為獲得合理投資區(qū)間,需要對(duì)異常數(shù)值進(jìn)行篩選剔除。本文通過(guò)3δ原則和箱線(xiàn)圖法對(duì)更換變壓器工程單位造價(jià)進(jìn)行數(shù)據(jù)整理,獲得合理造價(jià)區(qū)間,為項(xiàng)目立項(xiàng)、投資計(jì)劃制定提供參考。
關(guān)鍵詞:更換變壓器工程;數(shù)據(jù)整理;3δ原則;箱線(xiàn)圖法
中圖分類(lèi)號(hào):TM73 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-2064(2018)23-0155-03
1 樣本情況
本次整理2014-2017年變壓器更換工程數(shù)據(jù)共21項(xiàng),整理前各電壓等級(jí)單位造價(jià)樣本區(qū)間分別為35kV:43.15元/kVA-104.66元/kVA,110kV:52.10元/kVA-66.06元/kVA,220kV:37.26元/kVA,具體如表1所示。
由于110kV電壓等級(jí)和220kV電壓等級(jí)樣本均不大于5,本次不做區(qū)間整理,本次僅對(duì)35kV更換變壓器工程做整理分析。
電壓等級(jí)為35kV的樣本描述統(tǒng)計(jì)如表2所示。
數(shù)據(jù)散點(diǎn)圖如圖1所示。
2 整理方法
對(duì)所有技改造價(jià)數(shù)據(jù)進(jìn)行的數(shù)據(jù)分析主要分為三個(gè)部分:(1)樣本的描述統(tǒng)計(jì);(2)異常值剔除、異常數(shù)據(jù)分析;(3)總體的區(qū)間估計(jì)。
2.1 樣本的描述統(tǒng)計(jì)
統(tǒng)計(jì)樣本的均值、中位數(shù)、方差、標(biāo)準(zhǔn)差、極小值、極大值、范圍、四分位距、偏度、峰度、散點(diǎn)圖等。
軟件實(shí)現(xiàn):使用spss軟件進(jìn)行描述性統(tǒng)計(jì)分析。
2.2 異常值剔除
篩除異常值的常用方法有3δ原則和箱線(xiàn)圖法。
3δ原則;首先,運(yùn)用樣本數(shù)據(jù)來(lái)繪制頻率分布直方圖。
其次,根據(jù)頻率分布直方圖顯示結(jié)果來(lái)擬合出概率密度曲線(xiàn),并得出相應(yīng)的概率密度函數(shù)。當(dāng)數(shù)據(jù)服從正態(tài)分布時(shí),根據(jù)正態(tài)分布的定義可知,μ為樣本數(shù)據(jù)的均值,δ為樣本數(shù)據(jù)的偏差。而距離均值3δ之外的概率為P(|×-μ|>3δ)<=0.003,這屬于極小概率事件,在默認(rèn)情況下我們可以認(rèn)定,距離超過(guò)均值3δ之外的樣本是不存在的。因此當(dāng)樣本數(shù)據(jù)距離平均值大于3δ時(shí),則認(rèn)為該樣本數(shù)據(jù)為異常值。當(dāng)數(shù)據(jù)不服從正態(tài)分布時(shí),可以通過(guò)遠(yuǎn)離平均距離多少倍的標(biāo)準(zhǔn)差來(lái)判定,多少倍的取值需要根據(jù)經(jīng)驗(yàn)和實(shí)際情況來(lái)決定,具體如圖2所示。
本報(bào)告數(shù)據(jù)整理采取箱線(xiàn)圖法。箱線(xiàn)圖由五部分構(gòu)成,分別是最小值、中位數(shù)、最大數(shù)和兩個(gè)四分位數(shù)Q1和Q2。而篩除異常值則是去除樣本中小于Q1-1.5IQR或大于Q2+1.5IQR的數(shù)值。
第一步,計(jì)算出樣本的第一個(gè)四分位數(shù)Q1,等于該樣本中所有數(shù)值由小到大排列后第25%的數(shù)字。
第二步,計(jì)算出樣本的中位數(shù)F,等于該樣本中所有數(shù)值由小到大排列后第50%的數(shù)字。
第三步,計(jì)算出樣本的Q2,等于該樣本中所有數(shù)值由小到大排列后第75%的數(shù)字。
第四步,計(jì)算出樣本的四分位距IQR。
IQR=Q2-Q1
最后,計(jì)算出Q1-1.5IQR和Q2+1.5IQR的值,并剔除兩者區(qū)間外的異常值。
軟件實(shí)現(xiàn):使用spss、python和matlab進(jìn)行繪圖與計(jì)算,箱線(xiàn)圖兩個(gè)胡須的末端并非準(zhǔn)確的1.5倍箱子長(zhǎng)度,而是不超過(guò)該長(zhǎng)度的最遠(yuǎn)的值,所以使用python/matlab計(jì)算異常值范圍,因?yàn)樵靸r(jià)數(shù)據(jù)為正值,對(duì)于下限為負(fù)值的改為該區(qū)間的最小值,異常值的最終確定以spss輸出的箱線(xiàn)圖結(jié)果為準(zhǔn)。
異常值選出后,還需要根據(jù)具體工程對(duì)異常值進(jìn)行分析,分析異常發(fā)生的原因,以減少后續(xù)技改造價(jià)數(shù)據(jù)填報(bào)的異常率。
2.3 總體的區(qū)間估計(jì)
區(qū)間估計(jì)是從點(diǎn)估計(jì)值和抽樣標(biāo)準(zhǔn)誤出發(fā),按給定的概率值建立包含待估計(jì)參數(shù)的區(qū)間.其中這個(gè)給定的概率值稱(chēng)為置信度或置信水平,這個(gè)建立起來(lái)的包含待估計(jì)函數(shù)的區(qū)間稱(chēng)為置信區(qū)間,指總體參數(shù)值落在樣本統(tǒng)計(jì)值某一區(qū)內(nèi)的概率。
因?yàn)楹芏鄶?shù)據(jù)的樣本量不大,總體分布未知,所以使用walsh平均順序統(tǒng)計(jì)量構(gòu)造對(duì)稱(chēng)中心的置信區(qū)間,這一方法不依賴(lài)于總體分布,能較精確的估計(jì)置信區(qū)間。
設(shè)x1,x2,…,xn (1)
為原始數(shù)據(jù),是連續(xù)對(duì)稱(chēng)的獨(dú)立同分布隨機(jī)樣本,θ為分布的對(duì)稱(chēng)中心。首先計(jì)算walsh平均值:
W(·)=1≤i≤j≤n (2)
對(duì)walsh平均值升冪排列,記為W(1),W(2)W(N),N=n(n+1)。
如果給定置信度1-α,估計(jì)θ所在區(qū)間(),由下式確定
=W(N-K+1) (3)
其中:
K≈ (4)
這里Zα/2為正態(tài)隨機(jī)變量的α/2臨界值,若Φ(·)為標(biāo)準(zhǔn)正態(tài)分布函數(shù),則1-Φ(Zα/2)=。
在施行計(jì)算時(shí),按下列步驟進(jìn)行:
1)由α查正態(tài)分布表得到Zα/2;
2)由公式(4)計(jì)算出K及N-K+1;
3)把(1)由小到大排列,依次從小到大求出(2)的第K個(gè)值W(K),再?gòu)拇蟮叫∏蟪觯?)的從后向前的第K個(gè)值,即第N-K+1個(gè)值W(N-K+1);
4)由(3)式得到()。
軟件實(shí)現(xiàn):使用R軟件進(jìn)行區(qū)間估計(jì)結(jié)果的計(jì)算。對(duì)于一些電壓樣本量較少,R無(wú)法計(jì)算出95%或99%的置信區(qū)間的等級(jí)與方案沒(méi)有給出區(qū)間估計(jì)的結(jié)果。
3 整理過(guò)程
3.1 異常值剔除
繪制35kV變壓器工程單位造價(jià)箱線(xiàn)圖并計(jì)算正常值范圍15.93元/kVA-101.8元/kVA,存在異常值1個(gè),如圖3所示。
3.2 總體的區(qū)間估計(jì)
軟件計(jì)算結(jié)果為7.14元/kVA-72.37元/kVA(99%)。
3.3 異常數(shù)據(jù)分析
異常數(shù)據(jù)為國(guó)網(wǎng)安徽肥西縣供電有限責(zé)任公司2014年35kV嚴(yán)店變主變改造工程,該工程更換2臺(tái)35kV變壓器,設(shè)備費(fèi)114.51萬(wàn)元,而項(xiàng)目管理費(fèi)卻高達(dá)85.3萬(wàn)元,導(dǎo)致單位造價(jià)達(dá)到104.66元/kVA,與平均值63.22元/kVA偏離最多,應(yīng)為其他費(fèi)用拆分不當(dāng)所致。在本次數(shù)據(jù)整理中予以剔除。
4 樣本整理結(jié)果
本次整理2014-2017年35kV更換變壓器單位造價(jià)數(shù)據(jù)共16項(xiàng),整理后刪除異常數(shù)據(jù)1項(xiàng),保留樣本數(shù)據(jù)15項(xiàng),整理后35kV更換變壓器工程單位造價(jià)樣本區(qū)間為:43.15元/kVA -98.56元/kVA,如表3所示。
整理后35kV的樣本描述統(tǒng)計(jì)結(jié)果如表4所示。
35kV的總體區(qū)間估計(jì)如圖4所示。
剔除異常值后的樣本總體真值落在7.14元/kVA-72.37元/kVA的概率為99%。