陳斌,劉西軍,張曉悅,陳曉東,劉國(guó)華
(1. 浙江水利水電專(zhuān)科學(xué)校,杭州,310018;2. 中國(guó)水電顧問(wèn)集團(tuán)華東勘測(cè)設(shè)計(jì)研究院,杭州,310014;3. 浙江大學(xué)建筑工程學(xué)院,杭州,310058)
在給定原材料品種、質(zhì)量及配合比的情況下,混凝土性能(包括強(qiáng)度、工作性和耐久性)具有唯一對(duì)應(yīng)值,因此必然是可預(yù)測(cè)的。通過(guò)建立各種線性或非線性數(shù)學(xué)模型,使預(yù)測(cè)精度得到一定保證,則可用于混凝土配合比設(shè)計(jì)和生產(chǎn)質(zhì)量控制等各個(gè)方面,是混凝土工程的基礎(chǔ)性工作之一。傳統(tǒng)的混凝土性能預(yù)測(cè)方法以水灰比定則(保羅米公式)為代表,其認(rèn)為可塑性混凝土的抗壓強(qiáng)度完全受水灰比的控制,而與其他因素?zé)o關(guān)。近年來(lái),由于混凝土不斷向高強(qiáng)、高性能化發(fā)展,成分不斷復(fù)雜,水灰比定則已不完全適用[1]。因而發(fā)展出各種調(diào)整方法。然而,最直接的混凝土性能預(yù)測(cè),仍在于以原材料用量及質(zhì)量為自變量,通過(guò)合適的數(shù)學(xué)模型,直接推求混凝土性能,已被證明比以各種比率指標(biāo)(如水膠比、砂率、漿骨比等)為自變量推求混凝土性能更為有效[2]。筆者基于國(guó)內(nèi)文獻(xiàn)公開(kāi)發(fā)表的613組配合比,采用逐步線性回歸和支持向量機(jī)等方法,建立混凝土性能預(yù)測(cè)模型;繼而采用線性規(guī)劃的單純形法、粒子群算法建立配合比優(yōu)化模型,最終集成為Compos混凝土性能預(yù)測(cè)及配合比優(yōu)化專(zhuān)家系統(tǒng)。系統(tǒng)同時(shí)提供了按《規(guī)范》(JGJ55-2000)設(shè)計(jì)配合比和大體積混凝土溫度場(chǎng)分析功能。
預(yù)測(cè)、優(yōu)化變量的選取見(jiàn)表1、表2。
多元線性回歸是最簡(jiǎn)單、最直接的變量相關(guān)性統(tǒng)計(jì)分析方法,具有物理意義明確、確定性強(qiáng)等優(yōu)點(diǎn)。由于混凝土性能預(yù)測(cè)模型的自變量數(shù)量較多,可能并非所有的自變量都與因變量有顯著關(guān)系,換言之,部分自變量的作用可以忽略,其加入甚至可能降低模型的預(yù)測(cè)準(zhǔn)確性。因而產(chǎn)生了如何從大量可能相關(guān)的自變量中挑選出對(duì)因變量有顯著影響的部分自變量的問(wèn)題。逐步回歸分析方法應(yīng)運(yùn)而生,其基本思想是:將變量逐個(gè)引入,引入變量的條件為偏回歸平方和經(jīng)檢驗(yàn)是顯著的,同時(shí)每引入一個(gè)新變量后,對(duì)已選入的變量逐個(gè)檢驗(yàn),將不顯著變量剔除。這樣保證最后所得的變量子集中的所有變量都是顯著的,經(jīng)若干步后,可得“最優(yōu)”變量子集。有關(guān)逐步線性回歸方法的具體算法可參考相關(guān)文獻(xiàn)[3],本文不贅述。Compos系統(tǒng)的多元逐步線性回歸界面,如圖1所示。
表1 預(yù)測(cè)、優(yōu)化模型的可選自變量
表2 預(yù)測(cè)、優(yōu)化模型的可選因變量
2.2 BP人工神經(jīng)網(wǎng)絡(luò)
線性回歸模型雖然具有簡(jiǎn)單、直接的優(yōu)點(diǎn),但擬合能力有限。若混凝土性能與各自變量間存在非線性關(guān)系,則需采用非線性預(yù)測(cè)模型。最常規(guī)的非線性模型當(dāng)屬多項(xiàng)式擬合。根據(jù)泰勒定理,當(dāng)泰勒級(jí)數(shù)的項(xiàng)次趨向無(wú)窮時(shí),可以任意精度擬合任何函數(shù)。但是經(jīng)驗(yàn)表明,多項(xiàng)式擬合計(jì)算效率較低,但自變量數(shù)量較多時(shí),耗時(shí)量相當(dāng)大,且實(shí)際選用的項(xiàng)次不可能過(guò)多。近年來(lái),人工神經(jīng)網(wǎng)絡(luò)模型(主要為BP人工神經(jīng)網(wǎng)絡(luò))受到較多關(guān)注。所謂BP人工神經(jīng)網(wǎng)絡(luò),就是以輸入單元為自變量,輸出單元為因變量、網(wǎng)絡(luò)單元間的連接權(quán)值和閾值為調(diào)整參量,按最小誤差原則逐步反饋修正而使網(wǎng)絡(luò)達(dá)到最佳模擬狀態(tài)的一種數(shù)學(xué)算法。其拓?fù)浣Y(jié)構(gòu)如圖2所示[4]。
圖1 Compos系統(tǒng)的混凝土性能線性回歸分析界面
圖2 BP神經(jīng)網(wǎng)絡(luò)示意
BP神經(jīng)網(wǎng)絡(luò)的主要參數(shù)為隱含層(中間層)單元數(shù)。合適的隱層單元數(shù)選擇是一個(gè)比較復(fù)雜的問(wèn)題,最佳的隱層單元數(shù)與輸入、輸出單元數(shù),訓(xùn)練集樣本數(shù)均有關(guān)系,目前尚無(wú)成熟的理論方法,基本上依賴(lài)經(jīng)驗(yàn)選定。隱層單元數(shù)過(guò)少,訓(xùn)練達(dá)不到應(yīng)有精度,容易出現(xiàn)“欠擬合”;隱層單元數(shù)過(guò)多,則易出現(xiàn)“過(guò)擬合”。筆者經(jīng)過(guò)大量試驗(yàn),發(fā)現(xiàn)隱層單元數(shù)輸入樣本數(shù)的1/2(9個(gè)),預(yù)測(cè)精度基本已達(dá)到最優(yōu)??紤]輸入、輸出層單元數(shù)的變化,基本認(rèn)為隱層單元數(shù)取10,通常情況下均能適用。
為了控制過(guò)擬合,筆者進(jìn)一步提出了一種“誤差跟蹤策略”,即:首先進(jìn)行第一次網(wǎng)絡(luò)訓(xùn)練和預(yù)測(cè),以其預(yù)測(cè)誤差作為最優(yōu)誤差的初始值。而后網(wǎng)絡(luò)每訓(xùn)練一次,立即對(duì)預(yù)測(cè)樣本組進(jìn)行預(yù)測(cè),若預(yù)測(cè)誤差小于初始值,則取其為最優(yōu)值并記錄發(fā)生位置,如此不斷重復(fù)計(jì)算,直至網(wǎng)絡(luò)訓(xùn)練誤差或訓(xùn)練次數(shù)達(dá)到預(yù)定值為止,見(jiàn)圖3。從圖上看,預(yù)測(cè)相對(duì)誤差過(guò)程線開(kāi)始上揚(yáng)的A點(diǎn),即為訓(xùn)練截止點(diǎn),超過(guò)該點(diǎn),網(wǎng)絡(luò)訓(xùn)練即進(jìn)入過(guò)擬合狀態(tài)。
BP人工神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的非線性擬合能力,但實(shí)踐表明,其過(guò)擬合控制能力較差。所謂“過(guò)擬合”,即指模型過(guò)度擬合樣本的個(gè)別甚至錯(cuò)誤信息,而偏離了對(duì)整體規(guī)律的把握。支持向量機(jī)模型(SVMs)是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的新型算法,其建立在統(tǒng)計(jì)學(xué)習(xí)理論的VC 維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小原理基礎(chǔ)上,能有效抑制過(guò)擬合,被普遍認(rèn)為優(yōu)于人工神經(jīng)網(wǎng)絡(luò)[5,6]。
圖3 過(guò)擬合狀態(tài)示意
根據(jù)大數(shù)定律,式(2)只有當(dāng)樣本數(shù)n趨于無(wú)窮大且函數(shù)集足夠小時(shí)才成立。這實(shí)際上是假定最小二乘意義的擬合誤差最小作為建模的最佳判據(jù),結(jié)果導(dǎo)致擬合能力過(guò)強(qiáng)的算法的預(yù)報(bào)能力反而降低。為此,SLT用結(jié)構(gòu)風(fēng)險(xiǎn)函數(shù) ][fRh代替 ][fRemp,并證明了 ][fRh可用下列函數(shù)求極小而得:
此處n為訓(xùn)練樣本數(shù)目,Sh為VC維空間結(jié)構(gòu),h為VC 維數(shù),即對(duì)函數(shù)集復(fù)雜性或者學(xué)習(xí)能力的度量。1-δ為表征計(jì)算的可靠程度的參數(shù)。
SLT要求在控制以VC維為標(biāo)志的擬合能力上界(以限制過(guò)擬合)的前提下追求擬合精度。控制VC維的方法有三大類(lèi):1)拉大兩類(lèi)樣本點(diǎn)集在特征空間中的間隔;2)縮小兩類(lèi)樣本點(diǎn)各自在特征空間中的分布范圍;3)降低特征空間維數(shù)。一般認(rèn)為特征空間維數(shù)是控制過(guò)擬合的唯一手段,而新理論強(qiáng)調(diào)靠前兩種手段可以保證在高維特征空間的運(yùn)算仍有低的VC維,從而保證限制過(guò)擬合。
對(duì)于分類(lèi)學(xué)習(xí)問(wèn)題,傳統(tǒng)的模式識(shí)別方法強(qiáng)調(diào)降維,而SVM與此相反。對(duì)于特征空間中兩類(lèi)點(diǎn)不能靠超平面分開(kāi)的非線性問(wèn)題,SVM采用映照方法將其映照到更高維的空間,并求得最佳區(qū)分二類(lèi)樣本點(diǎn)的超平面方程,作為判別未知樣本的判據(jù)。這樣,空間維數(shù)雖較高,但VC維仍可壓低,從而限制了過(guò)擬合。即使已知樣本較少,仍能有效地作統(tǒng)計(jì)預(yù)報(bào)。
對(duì)于回歸建模問(wèn)題,傳統(tǒng)的算法在擬合訓(xùn)練樣本時(shí),將有限樣本數(shù)據(jù)中的誤差也擬合進(jìn)數(shù)學(xué)模型了。針對(duì)傳統(tǒng)方法這一缺點(diǎn),SVR采用“ε 不敏感函數(shù)”,即對(duì)于用f (x)擬合目標(biāo)值y時(shí)時(shí),即認(rèn)為進(jìn)一步擬合是無(wú)意義的。這樣擬合得到的不是唯一解,而是一組無(wú)限多個(gè)解。SVR方法是在一定約束條件下,以取極小的標(biāo)準(zhǔn)來(lái)選取數(shù)學(xué)模型的唯一解。這一求解策略使過(guò)擬合受到限制,顯著提高了模型的預(yù)報(bào)能力。
當(dāng)混凝土性能預(yù)測(cè)模型為線性方程,則可采用線性規(guī)劃的單純形法進(jìn)行配合比優(yōu)化。以1m3混凝土的成本最低為優(yōu)化目標(biāo),以混凝土的設(shè)計(jì)強(qiáng)度、工作性或耐久性指標(biāo)為約束條件,優(yōu)化的數(shù)學(xué)模型表示如下:
式中, A = [ aij]m×n為線性約束方程組的系數(shù)矩陣;為線性約束方程組的右端項(xiàng)矩陣;x = [x ,x...x]T12n為原材料的用量;C =[c1,c2...cn]T為不同原材料的價(jià)格;m為約束條件數(shù)量,n為自變量數(shù)量。
單純形法通過(guò)從可行域的一個(gè)極點(diǎn)出發(fā),先判斷該點(diǎn)是否是極小點(diǎn),如是,則運(yùn)算結(jié)束;否則沿能使目標(biāo)函數(shù)下降的方向搜索,抵達(dá)下一個(gè)極點(diǎn);繼續(xù)執(zhí)行這一過(guò)程,直到獲得最優(yōu)點(diǎn)為止。其基本過(guò)程包括求基本可行解,換基、轉(zhuǎn)軸運(yùn)算等。有關(guān)單純形法的原理和計(jì)算過(guò)程可參見(jiàn)文獻(xiàn)[7]。圖4和圖5為采用單純形法優(yōu)化混凝土配合比的參數(shù)設(shè)定及計(jì)算結(jié)果界面。
圖4 Compos系統(tǒng)優(yōu)化配合比的參數(shù)選擇界面
圖5 Compos系統(tǒng)優(yōu)化混凝土配合比的結(jié)果輸出界面
粒子群優(yōu)化算法或稱(chēng)微粒群算法(PSO)是1995年Russell Eberhart和James Kennedy提出的[8],PSO源于人工生命理論和鳥(niǎo)類(lèi)和魚(yú)類(lèi)的群集行為,是一種基于群體智能的優(yōu)化技巧。與其他進(jìn)化類(lèi)算法相似,PSO也采用“群體”與“進(jìn)化”的概念,同樣也是依據(jù)個(gè)體(粒子)對(duì)環(huán)境的適應(yīng)度大小進(jìn)行操作,所不同的是粒子群算法不像其他進(jìn)化算法那樣對(duì)于個(gè)體使用進(jìn)化算子,而是將每個(gè)個(gè)體看作是在多維搜索空間中沒(méi)有體積和重量的粒子,以一定的速度飛行搜索,并按照個(gè)體的飛行經(jīng)驗(yàn)和群體飛行經(jīng)驗(yàn)動(dòng)態(tài)地調(diào)整飛行的速度,經(jīng)若干代的并行搜索趨近最優(yōu)解?,F(xiàn)考慮如下的優(yōu)化模型:
其中,f ( X)為定義在D維歐氏空間 ED的區(qū)域S上的實(shí)函數(shù),設(shè) N為群體規(guī)模,為粒子i的當(dāng)前位置,為粒子i的當(dāng)前飛行速度,fitnessi= f (Xi)為粒子i的適應(yīng)度值,其中 i = 1 , 2 ,L,N.記pbesti和分別為粒子i曾經(jīng)達(dá)到的最佳適應(yīng)度值及其對(duì)應(yīng)于D維空間中的位置,gbest和 Pg=(pg1, pg2,L,pgD)T分別為群體中所有粒子曾經(jīng)達(dá)到的最佳適應(yīng)度值及其對(duì)應(yīng)位置?;玖W尤核惴ú捎玫倪M(jìn)化方程(動(dòng)態(tài)調(diào)整規(guī)則)是:
式中,下標(biāo)i表示第i個(gè)粒子,d表示粒子的第d維,t表示第t代,C1,C2為學(xué)習(xí)常數(shù),分別稱(chēng)為認(rèn)知參數(shù)和社會(huì)參數(shù),通常在0~2間取值, r1~∪(0,1)和r2~∪(0,1)為兩個(gè)相互獨(dú)立的隨機(jī)數(shù)。
為了改善算法的收斂性能,1998年Y.Shi和R.C. Eberhart在速度進(jìn)化方程中引入慣性權(quán)重w[9],即:
采用(6)(7)式的稱(chēng)基本粒子群算法,采用(8)(7)式的稱(chēng)標(biāo)準(zhǔn)粒子群算法。
取混凝土各種原材料的用量為“粒子”,可建立上述的PSO優(yōu)化模型。優(yōu)化模型中,需考慮強(qiáng)度、工作性、耐久性等約束條件??刹捎眠m應(yīng)度與違反度雙值控制法。將約束條件與目標(biāo)函數(shù)分離,讓每個(gè)粒子都具有兩個(gè)函數(shù)值,一個(gè)對(duì)應(yīng)于目標(biāo)函數(shù)的適應(yīng)度值,一個(gè)對(duì)應(yīng)問(wèn)題的約束條件,反映粒子關(guān)于約束的違反程度。
粒子的優(yōu)劣將由上述二個(gè)函數(shù)按一定規(guī)則決定:
a.當(dāng)二個(gè)粒子i和j都可行時(shí),比較它們的適應(yīng)度值fitness i和fitness j,適應(yīng)度值小者為優(yōu);
b.當(dāng)二個(gè)粒子i和j都不可行時(shí),比較它們違反度值voilationi和 vo ilationj ,違反度值小者為優(yōu);
c.當(dāng)粒子i可行,粒子j不可行,如果voilalionj>e則粒子i為優(yōu);若voilalionj<e則比較它們的適應(yīng)度值fitness i和fitness j,小的粒子為優(yōu)。有關(guān)PSO算法的具體過(guò)程可參見(jiàn)有關(guān)文獻(xiàn)[10]。圖6是PSO算法優(yōu)化混凝土配合比的過(guò)程。
以配合比數(shù)據(jù)庫(kù)為平臺(tái),筆者集成了混凝土性能預(yù)測(cè)與配合比優(yōu)化系統(tǒng)。系統(tǒng)同時(shí)包含了按《普通混凝土配合比設(shè)計(jì)規(guī)程》(JGJ55-2011)和《水工混凝土試驗(yàn)規(guī)程》(SL 352-2006)設(shè)計(jì)配合比,以及基于有限元法的大體積混凝土溫度場(chǎng)分析的模塊。系統(tǒng)框架如圖7所示。
圖6 PSO算法的優(yōu)化過(guò)程
圖7 Compos系統(tǒng)框架
系統(tǒng)同時(shí)具有Excel數(shù)據(jù)導(dǎo)入與導(dǎo)出、試驗(yàn)調(diào)整等功能,方便用戶(hù)的整個(gè)配合比設(shè)計(jì)、試驗(yàn)流程。
[1]陳斌,李富強(qiáng),劉國(guó)華,等. 混凝土配合比的非線性多目標(biāo)優(yōu)化研究[J]. 浙江大學(xué)學(xué)報(bào),2005, 39(1): 16-19.
[2]Dias W P S, Pooliyadda S P. Neural networks for predicting properties of concretes with admixtures[J]. Construction and Building Materials, 2001(15): 371-379.
[3]徐世良主編. C常用算法程序集(第二版)[M]. 北京:清華大學(xué)出版社,1996.
[4]劉國(guó)華,陳斌等,基于人工神經(jīng)網(wǎng)絡(luò)和Monte-Carlo法的混凝土配合比優(yōu)化設(shè)計(jì)研究,水力發(fā)電學(xué)報(bào)[J],2003(4):45-53.
[5]S. M. Gupta. Support Vector Machines based Modeling of Concrete Strength[J]. International Journal of Electrical and Computer Engineering, 2008,3(5): 312-318.
[6]崔海霞. 高強(qiáng)混凝土強(qiáng)度預(yù)測(cè)的支持向量機(jī)模型及應(yīng)用[J]. 混凝土, 2010(5): 49-51.
[7]汪樹(shù)玉,劉國(guó)華. 系統(tǒng)分析[M]. 杭州:浙江大學(xué)出版社,2002.
[8]Kennedy J., Eberhart R.C . Particle swarm optimization [C].In: Proc. IEEE Int. conf. on neutral network,1995,1942-1948
[9]Shi Y., Eberhart R.C. A modified particle swarm optimizer[C]. In: IEEE world congress on computational intellegence,1998, 69-73.
[10]劉華瑩,林玉娥,王淑云. 粒子群算法的改進(jìn)及其在求解約束優(yōu)化問(wèn)題中的應(yīng)用[J]. 吉林大學(xué)學(xué)報(bào)(理學(xué)版),2005(4):