席霞麗
(中國甘肅國際經(jīng)濟技術(shù)合作有限公司,甘肅 蘭州 730050)
工程項目竣工結(jié)算的最終結(jié)果,決定了施工單位的收益和利潤,甚至影響到其他項目的施工進度。為了合法保護施工單位的利潤空間,施工單位必須對工程項目的結(jié)算流程和方法給予重視,并且提升自身計算和預結(jié)算的能力。建設(shè)工程的竣工結(jié)算,近年來取得了長足發(fā)展,結(jié)算機制和計算策略與時俱進,無論對中小型項目,還是超大型工程,都有某種對應的結(jié)算策略[1]。然而,現(xiàn)行工程竣工結(jié)算數(shù)據(jù)仍存在一些問題,例如,隱蔽工程數(shù)據(jù)統(tǒng)計不合理、工程計量方法不規(guī)范、取費計算多加少扣等,對施工單位的結(jié)算收益產(chǎn)生較多負面影響。再者,竣工結(jié)算數(shù)據(jù)種類繁多,分部分項種類千差萬別,結(jié)合工程項目的功能,結(jié)算數(shù)據(jù)量尤為龐大[2]。因而,竣工結(jié)算需要精密的計算,細節(jié)上需要精益求精。本文提出一種優(yōu)化竣工結(jié)算策略,對選定的樣本進行數(shù)據(jù)分類和挖掘,結(jié)合BP神經(jīng)網(wǎng)絡(luò)的迭代訓練能力和優(yōu)化算法,進而找出引起竣工結(jié)算偏差較大的因素,為施工單位提供一種竣工結(jié)算優(yōu)化策略。
數(shù)據(jù)挖掘技術(shù)方興未艾,目前已經(jīng)得到廣泛應用。數(shù)據(jù)挖掘和分析的詳細過程可劃分為數(shù)據(jù)整理、數(shù)據(jù)選擇、數(shù)據(jù)分類、數(shù)據(jù)處理、數(shù)據(jù)挖掘、數(shù)據(jù)評估等環(huán)節(jié),利用對大量真實數(shù)據(jù)的提煉、分類、轉(zhuǎn)化分析與處理,可以獲得關(guān)鍵的目標值,基于這種特性,改善竣工結(jié)算的數(shù)據(jù)分類和數(shù)據(jù)分析。
對于大型復雜項目,尤其是EPC施工總包項目,工程類型較多、數(shù)量龐大。為此,引入決策樹的數(shù)據(jù)分析方法,對結(jié)算數(shù)據(jù)進行分類,進而建立竣工結(jié)算數(shù)據(jù)分析模型。最終,實現(xiàn)將大量的結(jié)算數(shù)據(jù)先按照分類指標體系進行排序,按照工程類型、建設(shè)性質(zhì)、單位工程、分部工程實現(xiàn)逐層劃分,直至具體到工序?qū)用妗?⒐そY(jié)算數(shù)據(jù)通過決策樹的統(tǒng)計、分類處理,有助于進行有效的樣本篩選和分類,準確定位重點分析數(shù)據(jù)對象,從而大幅提升施工單位自身核算數(shù)據(jù)的效率,為竣工結(jié)算工作提供全面的數(shù)據(jù)分析策略。
本文的研究對象主要是大型復雜工程,涉及類型多種多樣,建筑功能亦有千差萬別。忽略個性功能對數(shù)據(jù)的影響,經(jīng)過多次討論和分析驗證,選定地基與基礎(chǔ)、主體結(jié)構(gòu)、建筑裝飾、屋面工程、給排水和供暖、通風空調(diào)、建筑電氣、智能建筑等工程特征指標建立工程特征指標體系。
基于上述分析而確定的特征指標體系,尚不能用于計算,屬于定性指標。為此,需要將確定的指標類型,進行細化分解,進而量化,得到定量指標,方可用于編碼計算。
根據(jù)所選定的特征指標特點,并根據(jù)指標的具體特點,選定2015 年《甘肅省建筑與裝飾工程計價表》中相關(guān)的價格,以此完成定性指標的數(shù)量化。測定的相關(guān)指標的量化數(shù)值,如表1所示。
表1 定性指標的量化值
1.3.1 數(shù)據(jù)指標值的標準化
在對數(shù)據(jù)運算之前,需要對數(shù)據(jù)進行標準化處理,以避免不同數(shù)量級的數(shù)據(jù)之間對比失效。通??刹捎镁€性方法對不同數(shù)量級的指標值進行標準化,確保數(shù)據(jù)的等效性。標準化處理按公式(1)進行:
1.3.2 計算關(guān)聯(lián)系數(shù)
關(guān)聯(lián)系數(shù)反映了某個樣本數(shù)據(jù)與目標值的關(guān)聯(lián)程度。關(guān)聯(lián)系數(shù)按如下公式(2)計算:
1.3.3 計算關(guān)聯(lián)度。
關(guān)聯(lián)系數(shù)可反映單個樣本數(shù)據(jù)與目標值的關(guān)聯(lián)程度,對于不同種類或者不同功能的工程項目,如果直接比較,則會具有一定的片面性。為此,通過均值法引入具體某個數(shù)據(jù)的關(guān)聯(lián)度,參照公式(3)計算得到:
在數(shù)據(jù)初始化后,通過對得出的數(shù)據(jù)樣本的關(guān)聯(lián)度進行比較,關(guān)聯(lián)度越大,則表示該樣本數(shù)據(jù)與目標值差異越小。
BP神經(jīng)網(wǎng)絡(luò)在各個領(lǐng)域均有應用,是一種前饋神經(jīng)網(wǎng)絡(luò),具有誤差反向傳播學習的自適應能力,對于處理竣工結(jié)算數(shù)據(jù)非常合適。通常,BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)可分解為輸入層、隱含層和輸出層,是一種典型的三層結(jié)構(gòu),每層之間通過節(jié)點直接映射,形成類似神經(jīng)元的網(wǎng)絡(luò)拓撲結(jié)構(gòu)[4]。通過對數(shù)據(jù)的初始化、訓練,逐步逼近解析的目標值,在訓練過程中,樣本數(shù)據(jù)可以正向傳遞迭代信息,同時,目標值也需要反向饋送,三層之間的權(quán)值可以不斷被迭代優(yōu)化,形成負反饋作用機制,直到目標函數(shù)值達到設(shè)定標準。所以,BP神經(jīng)網(wǎng)絡(luò)具有自適應能力和自學習能力,適用于大型數(shù)據(jù)庫的模式識別、非線性目標值逼近等數(shù)據(jù)分析和模式識別領(lǐng)域[5]。三層BP神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu)如圖1所示。
從圖4可以看出,隨著鋼箱梁長度的增大,截面3所受彎矩呈現(xiàn)先減小后增大的趨勢;鋼箱梁長度由56 m增長到96 m時,截面3的彎矩減小幅度分別為17.5%、13.8%、11.5%、10.8%;鋼箱梁長度由96 m增長到116 m時,截面3的彎矩減小幅度僅為2.4%、1.0%;鋼箱梁長度由116 m增長到126 m時,截面3所受彎矩增長2.5%。
圖1 三層BP神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu)
由圖中可以看出,BP神經(jīng)網(wǎng)絡(luò)模型的輸入層可連續(xù)表示為X1,X2,X3,…Xn,神經(jīng)網(wǎng)絡(luò)的輸出層可連續(xù)表示為Y1,Y2,…Ym,輸入層和輸出層之間,通過映射的方式直接連接,通常只包含一層隱含層。Wi為輸入層-隱含層的權(quán)重系數(shù),Wj則是隱含層-輸出層的權(quán)重系數(shù),系數(shù)的大小決定了該數(shù)據(jù)的重要程度。上述神經(jīng)網(wǎng)絡(luò)模型,輸入層有n神經(jīng)元,輸出層有m個神經(jīng)元,則可以產(chǎn)生n~m的單向映射關(guān)系。
神經(jīng)網(wǎng)絡(luò)迭代訓練的基本原理是求解誤差函數(shù),得到目標值。為了獲得最優(yōu)值,通常是求解誤差函數(shù)的最小值。為了快速得到最優(yōu)解,最初的迭代訓練可人為設(shè)定誤差閾值。例如,10e-5,達到該值即可結(jié)束訓練。迭代訓練算法一般可采用牛頓法,其優(yōu)點是收斂速度快。仿真過程中,可選用目標函數(shù)的梯度方向進行迭代學習,不斷擇優(yōu)選取權(quán)重系數(shù)。
2.2.1 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)的設(shè)置
通常神經(jīng)網(wǎng)絡(luò)只設(shè)置一個隱含層,在工程技術(shù)領(lǐng)域已經(jīng)完全滿足精度要求。通過設(shè)定一個具體的三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),即可完美的逼近一個非線性的優(yōu)化目標。選定的神經(jīng)網(wǎng)絡(luò)三層結(jié)構(gòu)后,輸入層神經(jīng)元的數(shù)目由初始樣本數(shù)據(jù)決定,按照上文所述,輸入層神經(jīng)元數(shù)目為8,即X1~X8;輸出層神經(jīng)元數(shù)目設(shè)定為3,即Y1~Y3。隱含層所需要的神經(jīng)元數(shù)目由下式(4)計算得到:
式中:n為輸入層的神經(jīng)元數(shù)量,m為輸出層的神經(jīng)元數(shù)量,可根據(jù)需要設(shè)定具體個數(shù),均必須取整數(shù)。a為由經(jīng)驗確定的變量,通常取2~10,可取非整數(shù)值。
根據(jù)上文選定的特征指標體系以及取a=5,計算得出隱含層的神經(jīng)元數(shù)量為8.3,取整后,可確定隱含層神經(jīng)元的數(shù)量為8。需要注意,隱含層神經(jīng)元數(shù)通常不小于輸入層神經(jīng)元數(shù),且一般不大于輸入層神經(jīng)元與輸出層神經(jīng)元數(shù)量之積。
對于典型的神經(jīng)網(wǎng)絡(luò),為了實現(xiàn)快速迭代訓練,通常需要保證網(wǎng)絡(luò)的輸出為[-1,1]。本文中,輸入變量和輸出變量之間呈非線性的關(guān)系,所以,隱含層的計算函數(shù)選用線性激活函數(shù)tansig(),輸出層選用單極性S函數(shù)logsig ();訓練函數(shù)則定為自適應學習率的梯度下降函數(shù) traingda(),可以加快神經(jīng)網(wǎng)絡(luò)的迭代訓練速度,在較短時間內(nèi)收斂,得到最優(yōu)解。
2.2.3 數(shù)據(jù)標準化處理
竣工結(jié)算的數(shù)據(jù)量非常巨大,種類繁多,樣本數(shù)據(jù)在數(shù)量級和量綱上差異較大,樣本數(shù)據(jù)的取值類型也有很大不同。如前所述,這會嚴重影響B(tài)P神經(jīng)網(wǎng)絡(luò)模型的迭代訓練速度,以及目標值的優(yōu)化速度。為了便于神經(jīng)網(wǎng)絡(luò)迭代訓練,按照上述公式(1)將數(shù)據(jù)做標準化處理。
經(jīng)過上述步驟后,典型結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)即搭建完成。通過矩陣實驗室Matlab 2020b的虛擬仿真環(huán)境,得以實現(xiàn)具體的運算試驗。神經(jīng)網(wǎng)絡(luò)的迭代訓練流程如圖2所示。
圖2 神經(jīng)網(wǎng)絡(luò)迭代訓練流程
為驗證上文構(gòu)建的神經(jīng)網(wǎng)絡(luò)模型的合理性和準確性,確保數(shù)據(jù)分析在實際工作中具有較強的實用價值,選取了近年來甘肅省30個已竣工結(jié)算的大型房地產(chǎn)建設(shè)項目,從甘肅省工程造價信息網(wǎng)獲取樣本數(shù)據(jù),對模型進行仿真分析驗證。
仿真分析前,將樣本數(shù)據(jù)劃分為2部分,前20組數(shù)據(jù)為訓練樣本數(shù)據(jù),剩余 10 組作為測試樣本數(shù)據(jù),在上述仿真環(huán)境中用于檢驗神經(jīng)網(wǎng)絡(luò)模型的迭代訓練優(yōu)化結(jié)果。經(jīng)過仿真計算,20組訓練樣本數(shù)據(jù)的網(wǎng)絡(luò)訓練過程曲線如下圖3所示,橫坐標為BP神經(jīng)網(wǎng)絡(luò)的迭代優(yōu)化次數(shù),縱坐標為目標函數(shù)的誤差均方值。每一次的訓練過程都以20組樣本數(shù)據(jù)的輸入量和輸出值,進行相應的迭代學習和誤差調(diào)整。
圖3 神經(jīng)網(wǎng)絡(luò)訓練過程
從圖3中可以看出,當訓練次數(shù)達到 1250 時,目標函數(shù)的誤差均方值為 10e-5,此精度已經(jīng)完全滿足工程需要,此時停止訓練。經(jīng)過反向解碼,預測結(jié)果的誤差率如表2所示。
表2 數(shù)據(jù)分析結(jié)果
由表 3 中的結(jié)果可以看出,BP 神經(jīng)網(wǎng)絡(luò)建立的數(shù)據(jù)分類分析優(yōu)化模型,能夠精準定位竣工結(jié)算數(shù)據(jù)中誤差最大項目。而且,經(jīng)過大量的測試樣本數(shù)據(jù)驗證,顯示的誤差率均在10%以內(nèi),對實際的工程項目的竣工結(jié)算具有實用意義。
運用數(shù)據(jù)挖掘和數(shù)據(jù)分類技術(shù),結(jié)合BP 神經(jīng)網(wǎng)絡(luò)出色的迭代訓練能力,構(gòu)建了大型工程項目竣工結(jié)算數(shù)據(jù)的分類分析模型。通過對樣本數(shù)據(jù)的分析和驗證,結(jié)果表明,本文提出的方法能夠精準定位竣工結(jié)算數(shù)據(jù)中誤差最大項目,表明BP 神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)分類分析模型是科學有效的。施工單位參加竣工結(jié)算之前,應該著重對上述分析得出的數(shù)據(jù)類別進行分類整理,精確預結(jié)算,在實際的工程項目的竣工結(jié)算具有實用意義。