戴嘉偉,羅偉林
(福州大學(xué) 機(jī)械工程及自動(dòng)化學(xué)院,福建 福州 350108)
多學(xué)科設(shè)計(jì)優(yōu)化(MDO)在眾多工程領(lǐng)域已得到廣泛運(yùn)用。復(fù)雜非線性系統(tǒng)的優(yōu)化設(shè)計(jì)通常具有子學(xué)科多、學(xué)科之間耦合關(guān)系強(qiáng)等特點(diǎn),進(jìn)行數(shù)值仿真計(jì)算需要較高成本,且模擬時(shí)間長(zhǎng)。為解決多學(xué)科設(shè)計(jì)優(yōu)化中數(shù)值模擬時(shí)間長(zhǎng)、效率低的問題,研究人員迫切希望有一種計(jì)算效率高,且精度又有保證的設(shè)計(jì)方法。
在該背景下,基于代理模型的優(yōu)化技術(shù)得到越來越多的關(guān)注[1]。代理模型的基本思想為通過從樣本中采集大量的有特征的樣本點(diǎn),構(gòu)造出一個(gè)計(jì)算量小、可替代高精度數(shù)值模型的模型。目前,常用的代理模型類型包括:多項(xiàng)式響應(yīng)面模型(PRS)、Kriging模型、徑向基函數(shù)(RBF)模型、人工神經(jīng)網(wǎng)絡(luò)(ANN)模型等。
與其他幾類模型相比,徑向基函數(shù)模型具有更優(yōu)越的非線性映射能力。徑向基函數(shù)代理模型在工程設(shè)計(jì)優(yōu)化領(lǐng)域有著廣泛的應(yīng)用,如復(fù)雜機(jī)械系統(tǒng)的可靠性評(píng)價(jià)[2]、翼型氣動(dòng)隱身優(yōu)化[3]、火炮多柔體動(dòng)力學(xué)結(jié)構(gòu)優(yōu)化[4]、圖像的噪聲抑制與細(xì)節(jié)保存[5]等。JIN R等[6]通過優(yōu)化效率、優(yōu)化精度等方面的比較,指出徑向基代理模型是較可靠的一種代理模型。韓鼎和鄭建榮[7]通過對(duì)多種代理模型的研究,從擬合精度、魯棒性、實(shí)現(xiàn)難度等多個(gè)方面比較,認(rèn)為徑向基函數(shù)代理模型有較為突出的擬合能力,并具有很高的魯棒性。BABAEI M和PAN I[8]通過對(duì)多種代理模型進(jìn)行評(píng)估發(fā)現(xiàn),三次徑向基函數(shù)代理模型是其中最可信賴的。CHENG K等人[9]在基于方差的全局敏感性研究中,對(duì)多種代理模型進(jìn)行了測(cè)試,指出徑向基函數(shù)幾乎為所有光滑測(cè)試算例提供了理想逼近,且只需要調(diào)整一個(gè)參數(shù),就能有效處理大量的訓(xùn)練樣本。
按照優(yōu)化過程中代理模型的樣本特點(diǎn)和使用方法,代理模型技術(shù)可分為靜態(tài)代理模型與動(dòng)態(tài)代理模型[10]:(1)靜態(tài)代理模型的樣本點(diǎn)數(shù)在優(yōu)化算法迭代開始之前就已經(jīng)采集好,在優(yōu)化過程中保持不變。若想要保證代理模型的精度,就需要在初始時(shí)采集足夠多的樣本點(diǎn),但這樣降低了優(yōu)化效率;(2)動(dòng)態(tài)代理模型在優(yōu)化過程中會(huì)根據(jù)給定的規(guī)則不斷地更新樣本點(diǎn),并重新構(gòu)造代理模型,整個(gè)優(yōu)化過程中代理模型和樣本點(diǎn)都是變化的。與靜態(tài)代理模型相比,動(dòng)態(tài)代理模型在優(yōu)化效率與優(yōu)化精度上都有著明顯的優(yōu)勢(shì)。
但信賴域方法容易陷入局部最優(yōu)解。為此,基于最小化置信下限準(zhǔn)則的動(dòng)態(tài)代理模型方法[14]被提出,但該方法受限于平衡常數(shù)的不確定性[15]。將置信下限與信賴域相結(jié)合為提高動(dòng)態(tài)代理模型的優(yōu)化效率和全局最優(yōu)解提供了一種有效途徑[16]。
筆者提出一種基于徑向基函數(shù),聯(lián)合自適應(yīng)置信下限與信賴域的動(dòng)態(tài)代理模型優(yōu)化策略(self-adaptive lower confidence bound and trust region-dynamic radial basis function, ALCBTR-DRBF)。在優(yōu)化迭代的過程中,以代理模型預(yù)測(cè)值與真實(shí)模型響應(yīng)值之間的誤差作為確定置信下限公式中的動(dòng)態(tài)平衡常數(shù)的依據(jù),應(yīng)用遺傳算法對(duì)置信下限進(jìn)行優(yōu)化,然后根據(jù)代理模型與真實(shí)模型的擬合程度更新信賴域信息,在新的信賴域內(nèi)選取并新增樣本點(diǎn)更新徑向基代理模型,最后將該優(yōu)化策略用于數(shù)學(xué)測(cè)試算例與NASA減速器優(yōu)化設(shè)計(jì)中,以證明該優(yōu)化策略的有效性。
徑向基函數(shù)具有結(jié)構(gòu)簡(jiǎn)單、計(jì)算效率高的優(yōu)點(diǎn),可適用于復(fù)雜的高維非線性問題[17]。應(yīng)用該函數(shù),基本計(jì)算思路為:在d維空間中抽取n個(gè)初始樣本點(diǎn)x1,x2,…,xn∈Rd,目標(biāo)或約束的真實(shí)響應(yīng)值為y(x1),y(x2),…,y(xn),徑向基函數(shù)基本形式為:
(1)
若滿足:
(2)
則式(1)可寫為:
Y=Φ·W
(3)
(4)
式中:W—權(quán)系數(shù)向量,W=(w1,w2,…,wn)T;Y—樣本點(diǎn)的真實(shí)響應(yīng)值,Y=(y1,y2,…,yn)T;Φ—徑向基函數(shù)。
常用的徑向基函數(shù)包括高斯函數(shù)、三次函數(shù)、逆多二次函數(shù)以及多二次函數(shù)等。筆者使用逆多二次函數(shù),其數(shù)學(xué)表達(dá)式為:
(5)
式中:r—預(yù)測(cè)點(diǎn)與樣本點(diǎn)之間的歐氏距離;c—形狀參數(shù),c為正常實(shí)數(shù),通常取值范圍為(0,10)。
1.2.1 樣本更新
在動(dòng)態(tài)代理模型的優(yōu)化過程中,常用的樣本點(diǎn)更新方法有:期望改進(jìn)(expected improvement,EI)準(zhǔn)則和最小化置信下限準(zhǔn)則。此外,SBESTER A等人[18]提出了一種并行加點(diǎn)的方法,并結(jié)合徑向基函數(shù)驗(yàn)證了其有效性。
進(jìn)行樣本點(diǎn)更新時(shí),傳統(tǒng)的EI準(zhǔn)則每次迭代更新都會(huì)計(jì)算任意點(diǎn)相對(duì)代理模型當(dāng)前預(yù)測(cè)最優(yōu)值的改善期望,添加可被改善期望值最大的點(diǎn),能較好地平衡搜尋的全局性與效率。當(dāng)預(yù)測(cè)標(biāo)準(zhǔn)差較小時(shí),搜尋將在當(dāng)前預(yù)測(cè)值附近,強(qiáng)化局部搜索能力;當(dāng)預(yù)測(cè)標(biāo)準(zhǔn)值較大時(shí),搜尋重點(diǎn)將轉(zhuǎn)移到預(yù)測(cè)精度低的區(qū)域,從而提高全局搜尋能力。傳統(tǒng)的EI準(zhǔn)則要根據(jù)期望函數(shù)計(jì)算空間中每個(gè)樣本點(diǎn)的期望值,在復(fù)雜問題中計(jì)算量偏大、效率降低。因此,置信下限準(zhǔn)則被提了出來。
置信下限準(zhǔn)則一般表示為[19]:
(6)
假設(shè)徑向基函數(shù)每個(gè)確定性響應(yīng)值y(x)是某個(gè)隨機(jī)過程Y(x)的實(shí)現(xiàn),利用n個(gè)響應(yīng)的分布Y=(y(1),y(2),…,y(n)),可求出假設(shè)的隨機(jī)過程在xn+1處的方差為:
(7)
當(dāng)平衡常數(shù)w=0時(shí),置信下限準(zhǔn)則與預(yù)測(cè)值等價(jià),此時(shí)搜索重心將放在當(dāng)前預(yù)測(cè)值周邊,提高局部搜索能力;當(dāng)w→+∞時(shí),預(yù)測(cè)值對(duì)整體表達(dá)幾乎不產(chǎn)生影響,置信下限準(zhǔn)則將等價(jià)于最大化預(yù)測(cè)標(biāo)準(zhǔn)差,搜索重心從預(yù)測(cè)值周邊轉(zhuǎn)移到預(yù)測(cè)精度較低的部分,搜索范圍從局部過渡到全局并加強(qiáng)全局搜索能力,且使問題變?yōu)樽钚』瘑栴}。
為減少置信下限準(zhǔn)則中平衡常數(shù)w因人為經(jīng)驗(yàn)確定所帶來的誤差與波動(dòng),常采用一種自適應(yīng)平衡常數(shù)置信下限方法。
1.2.2 平衡常數(shù)的自動(dòng)確定
通過代理模型預(yù)測(cè)值與真實(shí)模型響應(yīng)值之間的誤差與預(yù)測(cè)標(biāo)準(zhǔn)差的比較,可確定平衡常數(shù)為:
(8)
信賴域方法常被用來解決非線性規(guī)劃問題,其核心思想是在每次迭代時(shí),在一個(gè)選定的可信賴區(qū)域內(nèi),利用近似模型在當(dāng)前中心點(diǎn)擬合真實(shí)模型,通過優(yōu)化算法尋優(yōu)得到當(dāng)前近似模型最優(yōu)解,將其作為下一次優(yōu)化迭代時(shí)信賴域區(qū)域更新的起始點(diǎn)。該方法通過近似模型與真實(shí)模型的擬合程度,判斷是否需要縮放信賴域空間。若當(dāng)前近似模型滿足精度要求,則擴(kuò)大信賴域搜索范圍;否則縮小信賴域搜索范圍,保證下次優(yōu)化結(jié)果的精度。如此反復(fù)迭代更新直至獲得真實(shí)模型最優(yōu)解。
對(duì)于任意非線性目標(biāo)函數(shù)f(x),假設(shè)近似模型mk(p)=f(xk+p),在第k次迭代中的增量p為:
(9)
式中:Δk—信賴域半徑。
假定在優(yōu)化過程的第k步增量為pk,則目標(biāo)函數(shù)在第k步的實(shí)際下降量記為:
Aredk=f(xk)-f(xk+pk)
(10)
近似模型的下降量記為:
Predk=mk(0)-mk(pk)
(11)
參數(shù)Δk的選定一般根據(jù)下式進(jìn)行調(diào)整:
(12)
式中:rι—近似模型與目標(biāo)函數(shù)的近似程度。
rι越接近于1表示近似程度越高,此時(shí)可以適當(dāng)擴(kuò)大信賴域半徑;反之,則需對(duì)Δk適當(dāng)縮小。信賴域方法通常使用Taylor展開式逼近原函數(shù),涉及到復(fù)雜的Hessian矩陣計(jì)算,使整體計(jì)算量偏大。因此,筆者使用徑向基代理模型替代Taylor展開式來逼近原函數(shù)。
基于所采用的最小化置信下限方法,優(yōu)化問題可用如下模型表示:
(13)
s.t.hj(x)=0j=1,2,…,J
gk(x)≤0k=1,2,…,K
xL,i≤xi≤xU,ii=1,2,…,nv
約束條件為真實(shí)模型所具有的約束,其優(yōu)化流程如圖1所示。
圖1 優(yōu)化流程圖
具體步驟如下:
(1)確定設(shè)計(jì)變量與設(shè)計(jì)空間D,建立分析模型;令迭代計(jì)數(shù)參數(shù)k=1,通過最優(yōu)拉丁超立方采樣方法[20]選取初始樣本點(diǎn)(循環(huán)中為新增樣本點(diǎn))。在選取初始樣本點(diǎn)時(shí),樣本點(diǎn)數(shù)量通常為設(shè)計(jì)變量數(shù)的3到6倍,筆者選取初始樣本點(diǎn)數(shù)為:
(14)
(2)當(dāng)k=1時(shí),初始信賴域采樣空間S1為整個(gè)設(shè)計(jì)空間,即S1=D。當(dāng)k>1時(shí),信賴域空間是已更新的采樣空間;計(jì)算真實(shí)模型對(duì)應(yīng)初始樣本點(diǎn)(循環(huán)中為新增樣本點(diǎn)對(duì)應(yīng)的響應(yīng)值),然后將樣本點(diǎn)和響應(yīng)值儲(chǔ)存到相應(yīng)數(shù)據(jù)庫(kù)中;
(3)根據(jù)所獲得樣本構(gòu)建徑向基函數(shù)模型。依照已知信息和公式(13)獲得平衡常數(shù)w,根據(jù)式(6)確定置信下限;
(5)將第k次優(yōu)化所得到的可能最優(yōu)解xk代入真實(shí)模型,得到對(duì)應(yīng)真實(shí)響應(yīng)值f(xk),并將xk和f(xk)存入數(shù)據(jù)庫(kù);
(6)判斷是否滿足收斂標(biāo)準(zhǔn)。當(dāng)k=1時(shí),直接轉(zhuǎn)入步驟7;當(dāng)k>1時(shí),計(jì)算優(yōu)化過程中第k次與第k+1次所對(duì)應(yīng)最優(yōu)解的真實(shí)響應(yīng)值之間的相對(duì)誤差,判斷該誤差是否滿足收斂判定條件。若滿足,循環(huán)停止,優(yōu)化流程結(jié)束,步驟(4)中所得最優(yōu)解即為真實(shí)模型最優(yōu)解。若不滿足,則轉(zhuǎn)入步驟(7);
(7)根據(jù)已知信息更新信賴域采樣空間。令迭代參數(shù)k=k+1,轉(zhuǎn)至步驟(2)。
信賴域更新方法使用目標(biāo)函數(shù)值的下降程度作為更新準(zhǔn)則,能夠?qū)Σ蓸涌臻g進(jìn)行合理縮放,提高局部?jī)?yōu)化的精度與效率。筆者以最小化問題為例,信賴域更新的目的是使優(yōu)化迭代時(shí),基于當(dāng)前代理模型的優(yōu)化,實(shí)現(xiàn)目標(biāo)函數(shù)的真實(shí)值的顯著下降。具體的更新步驟如下:
(1)確定信賴域采樣空間新的中心點(diǎn)xc。若目標(biāo)函數(shù)的真實(shí)值下降,即y(xk-1)-y(xk)>0,則將當(dāng)前可能最優(yōu)解xk作為更新的中心點(diǎn),否則使用上一次的可能最優(yōu)解xk-1作為信賴域采樣空間更新的中心點(diǎn);
(2)根據(jù)參數(shù)rι來調(diào)整信賴域半徑Δk,依據(jù)如下:
(15)
式中:c1,c2,r1,r2—常數(shù);δ—最大信賴域半徑。
δ可取為初始設(shè)計(jì)空間半徑R。利用信賴域準(zhǔn)則更新樣本空間,為避免數(shù)次迭代后出現(xiàn)信賴域半徑過小或信賴域半徑過大的問題,此時(shí)可使用文獻(xiàn)[21]的方法進(jìn)行處理,得到更新之后的信賴域區(qū)域:
(16)
式中:xlbc—信賴域采樣空間的下邊界;xubc—信賴域采樣空間的上邊界;λR—最小信賴域半徑。
為了使優(yōu)化策略更好地跳出局部最優(yōu)解,給定最小信賴域半徑λR。其中,λ為常數(shù),可根據(jù)不同的優(yōu)化問題取不同的值。
首先,選用SC函數(shù)和GN函數(shù)作為測(cè)試函數(shù)。
(1)SC函數(shù)表達(dá)式為:
(17)
該函數(shù)是兩變量、單峰函數(shù),又稱六背駝峰函數(shù),有2個(gè)全局最優(yōu)解和4個(gè)局部最優(yōu)解,全局理論極小值為-1.031 6。
(2)GN函數(shù)表達(dá)式為:
(18)
可見該函數(shù)是兩變量函數(shù),全局理論極小值為0。
筆者使用所提出的ALCBTR-DRBF優(yōu)化策略,與動(dòng)態(tài)徑向基函數(shù)代理模型(DRBF)策略、基于信賴域的動(dòng)態(tài)徑向基函數(shù)代理模型(TR-DRBF)策略、基于傳統(tǒng)置信下限(w=1)的動(dòng)態(tài)徑向基函數(shù)代理模型(LCB-DRBF)策略、基于最小化置信下限與信賴域的Kriging動(dòng)態(tài)代理模型策略(IMLCB-TR),分別對(duì)SC函數(shù)和GN函數(shù)進(jìn)行優(yōu)化,對(duì)優(yōu)化性能進(jìn)行比較。
信賴域方法參數(shù)取值如下:c1=0.75,c2=1.25,r1=0.1,r2=0.75,λ=0.05。取10次優(yōu)化結(jié)果的中位數(shù)作為最優(yōu)解,模型調(diào)用次數(shù)取10次優(yōu)化調(diào)用次數(shù)的平均值。
優(yōu)化結(jié)果對(duì)比如表1所示。
表1 優(yōu)化結(jié)果對(duì)比
模型調(diào)用次數(shù)對(duì)比如表2所示。
表2 模型調(diào)用次數(shù)對(duì)比
由表1和表2可知:(1)針對(duì)SC函數(shù),筆者所提出的ALCBTR-DRBF策略擁有最高的精度,且有著最少的模型調(diào)用次數(shù);(2)針對(duì)GN函數(shù),ALCBTR-DRBF策略所得的最優(yōu)解中間值與全局最優(yōu)解非常接近,在精度和效率方面都明顯優(yōu)于其他4種方法;(3)在優(yōu)化效率方面,DRBF調(diào)用模型次數(shù)最少,僅為133次,但該方法明顯陷入了局部最優(yōu)的情況。
綜上所述,ALCBTR-DRBF優(yōu)化策略在全局性和收斂性上有著更好的表現(xiàn)。
為了驗(yàn)證該優(yōu)化策略在工程優(yōu)化領(lǐng)域的有效性,筆者選用了MDO領(lǐng)域經(jīng)典算例—NASA齒輪減速器[22]。該優(yōu)化問題可概括為:在滿足齒輪彎曲應(yīng)力、接觸應(yīng)力和扭轉(zhuǎn)變形的前提下,使減速器的體積(質(zhì)量)最小。
減速器結(jié)構(gòu)如圖2所示。
圖2 齒輪減速器結(jié)構(gòu)
該算例的數(shù)學(xué)模型如下[23]:
(19)
式中:x1—齒面寬度,2.6≤x1≤3.6;x2—齒輪模數(shù),0.3≤x2≤1.0;x3—小齒輪齒數(shù),17≤x3≤28;x4,x5—兩齒輪軸承間距,7.3≤x4≤8.3,7.3≤x5≤8.3;x6,x7—兩齒輪軸軸徑,2.9≤x6≤3.9,5≤x7≤5.5。
該優(yōu)化設(shè)計(jì)問題的約束為非線性,筆者假設(shè)目標(biāo)函數(shù)是一個(gè)高精度分析模型,真實(shí)模型約束為約束條件;分別比較ALCBTR-DRBF策略與DRBF策略、TR-DRBF策略和MLCB-DRBF策略的優(yōu)化結(jié)果,如表3所示。
表3 優(yōu)化結(jié)果
由表3知:(1)該算例理論最優(yōu)解為2 994,ALCBTR-DRBF策略所得優(yōu)化結(jié)果與理論最優(yōu)解誤差僅為0.006%,而DRBF策略、TR-DRBF策略、LCB-DRBF策略、IMLCB-TR策略與最優(yōu)解的誤差分別為6.5%、1.4%、9.0%、0.05%;(2)筆者提出的優(yōu)化策略調(diào)用分析模型的次數(shù)分別是DRBF策略、TR-DRBF策略、LCB-DRBF策略、IMLCB-TR策略分析模型調(diào)用次數(shù)的26.3%、62.4%、39.7%和43.0%。
由此可見,從優(yōu)化精度與優(yōu)化效率來看,筆者所提ALCBTR-DRBF策略均優(yōu)于DRBF策略、TR-DRBF策略、LCB-DRBF策略和IMLCB-TR策略。
(1)針對(duì)多學(xué)科優(yōu)化設(shè)計(jì)的需求,筆者在現(xiàn)有動(dòng)態(tài)徑向基函數(shù)代理模型方法的基礎(chǔ)上,提出了集合信賴域和置信下限準(zhǔn)則的動(dòng)態(tài)徑向基函數(shù)代理模型優(yōu)化方法;
(2)筆者提出的ALCBTR-DRBF策略整合了信賴域方法和置信下限準(zhǔn)則的優(yōu)點(diǎn),置信下限準(zhǔn)則中的平衡常數(shù),利用代理模型預(yù)測(cè)值與真實(shí)模型響應(yīng)值之間的誤差與預(yù)測(cè)標(biāo)準(zhǔn)差的比較來確定,并在優(yōu)化迭代更新的過程中不斷自適應(yīng)變化,能有效減少因?yàn)樵囼?yàn)確定最佳平衡常數(shù)帶來的工作量;
(3)筆者選用減速器設(shè)計(jì)優(yōu)化問題,驗(yàn)證了該優(yōu)化策略在工程優(yōu)化領(lǐng)域的有效性;并與其他幾種方法進(jìn)行了對(duì)比,證明ALCBTR-DRBF在優(yōu)化精度與效率上有一定的優(yōu)勢(shì)。
接下來,筆者需要做的工作是進(jìn)一步驗(yàn)證ALCBTR-DRBF策略在對(duì)更復(fù)雜的工程問題進(jìn)行求解的有效性,進(jìn)一步完善采用該策略在處理更高維問題時(shí)的性能;同時(shí),還要研究初始樣本點(diǎn)的選取對(duì)該方法的影響,以便得到一個(gè)合理的初始樣本點(diǎn)挑選方法,更好地指導(dǎo)復(fù)雜的工程實(shí)際問題。