何 磊,錢煒祺,汪 清,陳 海,楊 俊
(中國空氣動力研究與發(fā)展中心,綿陽 621000)
氣動數(shù)據(jù)建模是飛行器飛行性能仿真評估的基礎(chǔ)。對于飛機(jī)、導(dǎo)彈等飛行器,其常規(guī)飛行包線內(nèi)的氣動特性通常是馬赫數(shù)、總迎角、滾轉(zhuǎn)角及三個等效舵偏角的六維函數(shù),如果要通過計算和風(fēng)洞試驗(yàn)手段
飛行器的氣動特性建模主要有兩大類方法:一類是基于機(jī)理建模的方法,如多項(xiàng)式模型、基于幾何對稱關(guān)系的三角函數(shù)模型、微分/積分方程模型等,比較典型的例子是大迎角非定常氣動力的微分方程模型[2-7]。另一類方法是基于人工智能的“黑箱”建模方法,如決策樹方法、BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)建模方法、模糊邏輯建模方法、Kriging方法及高斯過程法等[8-11],其基本思想是建立決策樹、神經(jīng)網(wǎng)絡(luò)等輸入-輸出之間的映射模型,通過訓(xùn)練樣本數(shù)據(jù)的學(xué)習(xí),對模型的結(jié)構(gòu)、權(quán)值參數(shù)進(jìn)行調(diào)整,使其對數(shù)據(jù)具有最佳的擬合及預(yù)測效果,因而該方法也通常稱為機(jī)器學(xué)習(xí)方法。相比較而言,基于機(jī)器學(xué)習(xí)的建模方法對非線性數(shù)據(jù)的擬合能力通常優(yōu)于機(jī)理建模方法,但泛化能力較弱,而機(jī)理建模方法中的模型各項(xiàng)都有一定的物理意義,具有較好的普適性。近年來,深度學(xué)習(xí)方法研究取得了重大進(jìn)展,該方法也是機(jī)器學(xué)習(xí)方法,目前已在流體力學(xué)和氣動特性建模中得到了初步應(yīng)用[12]。為加以區(qū)分,BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)建模方法、Kriging方法等通常稱為淺層學(xué)習(xí)方法。本文采用三類建模方法——分類與回歸樹方法、淺層學(xué)習(xí)方法和深度學(xué)習(xí)方法,對典型案例的氣動數(shù)據(jù)進(jìn)行了建模計算,并對這幾類建模方法的優(yōu)勢和不足進(jìn)行了比較分析。
分類與回歸樹(Classification and Regression Tree Method,CART)方法是一種決策樹方法,也是一種非常有趣并且十分有效的非參數(shù)分類和回歸方法,是以實(shí)例為基礎(chǔ),利用已知的多變量數(shù)據(jù)構(gòu)建預(yù)測準(zhǔn)則,再根據(jù)其他變量值進(jìn)行預(yù)測的方法[13]。該方法采用了與傳統(tǒng)統(tǒng)計學(xué)完全不同的二叉決策樹的形式來構(gòu)建預(yù)測準(zhǔn)則,其決策樹的主要結(jié)構(gòu)如圖1所示,其基本思想是根據(jù)樣本各變量值Xi與閾值Ti的比較進(jìn)行分化,構(gòu)建起二叉樹,樹的葉子結(jié)點(diǎn)Li代表的就是預(yù)測值,其中,分化的優(yōu)劣及閾值Ti的選取由它產(chǎn)生的子結(jié)點(diǎn)值的離散程度來確定。決策樹的最終構(gòu)建包含兩個過程:建樹和剪枝。建樹就是通過部分的訓(xùn)練樣本數(shù)據(jù)建立起決策樹,直到每一個葉子結(jié)點(diǎn)都對應(yīng)樣本點(diǎn)為止。剪枝的過程則是通過剩余的訓(xùn)練樣本數(shù)據(jù),對已經(jīng)構(gòu)建的決策樹進(jìn)行結(jié)點(diǎn)的增減,使得決策樹在分類性能上能夠達(dá)到最優(yōu)。該方法目前在航空科學(xué)研究領(lǐng)域已得到了應(yīng)用[14-15]。
圖1 CART方法中的決策樹示例Fig.1 Decision tree in CART method
考慮如圖2所示的軸對稱火箭,采用DATCOM軟件[16],計算馬赫數(shù)M=1.5、總迎角α=6°情況下三個舵面都偏轉(zhuǎn)時的軸向力,作為實(shí)測數(shù)據(jù)進(jìn)行建模。數(shù)據(jù)共有216組舵面組合,對應(yīng)滾轉(zhuǎn)舵偏δx= 0°,5°,10°;偏航舵偏δy=-15°,-10°,-5°,0° ,5°,10°,15°,20°;俯仰舵偏δz=-20°,-15°,-10°,-5°,0° ,5°,10°,15°,20°的全組合。同時由于每組舵面組合取了8個不同的滾轉(zhuǎn)角φ=-135°,-45°,0°,22.5°,45°,67.5°,90°,180°。因而共計216×8=1728個狀態(tài)數(shù)據(jù)點(diǎn)。文獻(xiàn)[17]中基于均勻性原則從1728組數(shù)據(jù)中選出50個狀態(tài)點(diǎn)作為訓(xùn)練樣本點(diǎn),采用正交最小二乘法(OLS)進(jìn)行建模,對其余1678個狀態(tài)點(diǎn)進(jìn)行預(yù)測,得到了比較好的結(jié)果。
對這一算例考慮CART建模方法,首先分析了訓(xùn)練樣本數(shù)對建模效果的影響。圖3中給出了不同訓(xùn)練樣本數(shù)情況下CART模型對所有1728組樣本的預(yù)測結(jié)果,可以看到,隨著訓(xùn)練樣本點(diǎn)的增加,預(yù)測結(jié)果的均方差逐步減小。圖4中的“CART”給出了訓(xùn)練樣本數(shù)為250時建立的CART模型對一組舵偏組合狀態(tài)的預(yù)測結(jié)果,及其與正交最小二乘建模結(jié)果的比較。從圖4中可以看到該建模方法是可行的。
圖2 典型軸對稱火箭Fig.2 Typical axisymmetric rocket
圖3 訓(xùn)練樣本數(shù)對預(yù)測均方差影響Fig.3 Influence of training samples number on modelling result
圖4 建模預(yù)測結(jié)果對比Fig.4 Comparison of model prediction results
在函數(shù)逼近領(lǐng)域,早先最普遍采用的神經(jīng)網(wǎng)絡(luò)是BP網(wǎng)絡(luò),它是一種是多層前饋神經(jīng)網(wǎng)絡(luò),因網(wǎng)絡(luò)訓(xùn)練采用誤差反向傳播(Back-Propagation,BP)學(xué)習(xí)算法而得名。近年來,隨著徑向基函數(shù)(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò)的提出和發(fā)展,為函數(shù)逼近提供了一種更有效的方法,它在逼近能力、分類能力、學(xué)習(xí)速度等方面均優(yōu)于BP網(wǎng)絡(luò)[18]。
RBF網(wǎng)絡(luò)是一種三層前向神經(jīng)網(wǎng)絡(luò):輸入層由信號源節(jié)點(diǎn)組成;第二層為隱層,隱單元的個數(shù)由所描述的問題而定,隱層采用徑向基函數(shù)作為網(wǎng)絡(luò)的激勵函數(shù);第三層為輸出層,采用線性激勵函數(shù)。
設(shè)一個多輸入多輸出的RBF網(wǎng)絡(luò)有m個輸入節(jié)點(diǎn)、n個隱層節(jié)點(diǎn)、p個輸出節(jié)點(diǎn)。RBF網(wǎng)絡(luò)的輸出為:
(1)
(2)
式中cj為第j個徑向基函數(shù)的中心;σj為與第j個徑向基函數(shù)寬度相關(guān)的變量;‖·‖為L2范數(shù),表示x與cj的歐拉距離。徑向基函數(shù)的輸出位于區(qū)間(0 ,1)內(nèi),輸入與中心向量的距離越近,則基函數(shù)的輸出越大。對于給定的輸入x,只有靠近中心部分才被激活。
Kriging模型是從采礦和地理統(tǒng)計學(xué)應(yīng)用中發(fā)展起來的一種響應(yīng)面函數(shù)模型,是在已知近似函數(shù)的基礎(chǔ)上添加了局部的“擾動”來擬合樣本點(diǎn)[19]。該方法實(shí)際上是高斯過程建模方法(Gaussian Process,GP)的特例。高斯過程定義為一系列隨機(jī)變量的集合,且其中任意兩個隨機(jī)變量間都滿足聯(lián)合高斯分布。高斯過程建模方法核心思想是將訓(xùn)練樣本視為高斯隨機(jī)過程,當(dāng)系統(tǒng)有新輸入時,高斯過程方法對輸出的預(yù)測值是一個符合高斯分布的隨機(jī)變量。高斯過程建模需要確定均值函數(shù)、協(xié)方差函數(shù)中的未知參數(shù),這些未知參數(shù)被統(tǒng)稱為超參數(shù),通?;谪惾~斯原理來確定[20]。
Kriging建模的具體方法如下[19]:設(shè)訓(xùn)練樣本的自變量x為n維向量,ns個樣本輸出構(gòu)成的輸出向量為y,則其近似函數(shù)模型為:
(3)
rT(x)=[R(x,x1),R(x,x2),...,R(x,xns)]T;
(4)
這里,x的上標(biāo)表示樣本點(diǎn)序號,下標(biāo)表示矢量的分量;R(xi,xj)是任意兩個樣本點(diǎn)xi和xj的互相關(guān)函數(shù);參數(shù)θk即為超參數(shù)。
(5)
(6)
而參數(shù)θk的最大似然估計則由下式給出:
(7)
(8)
式中rT(xpre)利用式(4)計算。
為提高Kriging模型的泛化能力,可通過交叉校驗(yàn)的方法來對模型中的超參數(shù)進(jìn)行優(yōu)化。交叉校驗(yàn)的基本思想是從所有樣本點(diǎn)中依次選取不同的樣本點(diǎn)進(jìn)行建模后,對剩余樣本點(diǎn)進(jìn)行預(yù)測,計算其均方預(yù)測誤差。然后基于均方預(yù)測誤差最小化的原則對超參數(shù)θk進(jìn)行優(yōu)化,以舍一交叉校驗(yàn)為例,其均方預(yù)測誤差如下式(9)。
(9)
其中e(ns-i)表示建模數(shù)據(jù)不包含(xi,yi)時,利用其余ns-1個樣本點(diǎn)建模結(jié)果對xi的預(yù)測誤差。
支持向量機(jī)(Support Vector Machines,SVM)是在統(tǒng)計學(xué)習(xí)理論的基礎(chǔ)上發(fā)展起來的新型算法,由V.Vapnik等在20世紀(jì)90年代提出,建立在嚴(yán)密的統(tǒng)計學(xué)理論基礎(chǔ)上,引入了結(jié)構(gòu)風(fēng)險最小化原則,具有較好的泛化能力。該模型的基本思想是在線性可分情況下構(gòu)建最優(yōu)分類超平面,獲得支持向量,然后以支持向量的核展開表示模型,從而達(dá)到模型的稀疏表示。對于非線性問題,則是將原問題映射到一個高維特征空間,然后在特征空問中進(jìn)行線性運(yùn)算[21-22]。最小二乘支持向量機(jī)(Least Square SVM)是標(biāo)準(zhǔn)SVM的一個變形,是將標(biāo)準(zhǔn)支持向量機(jī)算法中的不等式約束化為等式約束得到的。由此,求解二次優(yōu)化問題轉(zhuǎn)化成解一次線性方程組,使收斂速度更快,計算的復(fù)雜性降低。具體算法為:
給定N個訓(xùn)練樣本{xi,yi},其中xi∈Rn為n維的訓(xùn)練樣本輸入,yi∈R為訓(xùn)練樣本輸出。其目標(biāo)函數(shù)為:
s.t.yi(wTg(xi)+b)=1-ξi,i=1,...,N
(10)
式中,w為l維權(quán)重矢量,g(x)是將x從輸入空間映射到特征空間的函數(shù),ξi是xi的松弛系數(shù),b為偏置項(xiàng),γ是邊際系數(shù)。
將上述目標(biāo)函數(shù)增廣為拉格朗日函數(shù)形式后,對各變量求偏導(dǎo)并令其偏導(dǎo)數(shù)為0,可將求解的優(yōu)化問題轉(zhuǎn)化為求解如下線性方程組,即:
(11)
其中,l=[1,1,…,1]T;y=[y1,y2,…,yN]T;α=[α1,α2,…,αN]T;I為單位矩陣;Ω為核函數(shù)矩陣,矩陣元素Ωij=f(xi,xj),f(·)為滿足Mercer條件的對稱正定核函數(shù),通常取為:
f(xi,xj)=exp(-‖xi-xj‖2/δ),δ為核半徑。
由式(11)解出b和α后,LS-SVM的回歸函數(shù)為:
(12)
上述模型中有兩個超參數(shù)——正則化參數(shù)γ和核半徑δ,需要通過交叉校驗(yàn)等方法來確定[23]。
2.4.1 火箭氣動特性建模
沿用1.2節(jié)中的算例,將基于均勻性原則選取的50個狀態(tài)點(diǎn)作為訓(xùn)練樣本點(diǎn),采用Kriging建模方法進(jìn)行建模,對其余1678個狀態(tài)點(diǎn)進(jìn)行預(yù)測,預(yù)測的均方誤差為0.1924。進(jìn)一步針對50個建模樣本采用舍一交叉校驗(yàn)方法來優(yōu)化超參數(shù),對其余1678個狀態(tài)點(diǎn)進(jìn)行預(yù)測,可得出均方誤差為0.1219。圖5中給出了兩組典型舵偏狀態(tài)下的建模預(yù)測結(jié)果對比。其中“Kriging”表示標(biāo)準(zhǔn)Kriging模型建模結(jié)果,“Kriging(with CV)”表示通過交叉校驗(yàn)方法優(yōu)化超參數(shù)后的建模結(jié)果。可以看到,對這一氣動建模問題能采用Kriging模型進(jìn)行建模,且通過交叉校驗(yàn)可提高模型的泛化能力。
圖5 Kriging模型建模預(yù)測結(jié)果Fig.5 Prediction results of Kriging model
2.4.2 三角翼大迎角非定常氣動特性建模
以NASA阿姆斯研究中心7 ft×10 ft低速風(fēng)洞中開展的展弦比λ=2尖前緣三角翼俯仰振蕩動態(tài)試驗(yàn)[24]為研究對象。迎角變化歷程為:
α(τ)=45°+45°sin(kτ)
(13)
首先用靜態(tài)試驗(yàn)數(shù)據(jù)和減縮頻率k=0.01、0.03、0.04的大振幅振動試驗(yàn)數(shù)據(jù)訓(xùn)練Kriging模型、RBF神經(jīng)網(wǎng)絡(luò)模型和SVM支持向量機(jī)模型。不同減縮頻率下的不同氣動系數(shù)訓(xùn)練結(jié)果與試驗(yàn)數(shù)據(jù)的比較示于圖6,圖中“Kriging”對應(yīng)Kriging模型,“RBF”對應(yīng)RBF神經(jīng)網(wǎng)絡(luò)模型,“SVM”對應(yīng)SVM支持向量機(jī)模型,“Exp.”對應(yīng)風(fēng)洞試驗(yàn)數(shù)據(jù)。由圖6可見,訓(xùn)練結(jié)果與試驗(yàn)數(shù)據(jù)擬合得較好。
再用訓(xùn)練后的模型參數(shù)預(yù)測縮減頻率k=0.02的工況。不同模型的預(yù)測結(jié)果與試驗(yàn)數(shù)據(jù)比較示于圖7,具體的預(yù)測誤差值示于表1。從圖表中看出,預(yù)測結(jié)果與試驗(yàn)數(shù)據(jù)也符合較好。其中,由于SVM進(jìn)行了交叉校驗(yàn),一定程度上提升了模型的泛化能力,使得SVM的預(yù)測結(jié)果略優(yōu)于Kriging模型和RBF神經(jīng)網(wǎng)絡(luò)模型。
(a)k=0.01,阻力系數(shù)建模結(jié)果
(b)k=0.03,升力系數(shù)建模結(jié)果
(c)k=0.04,俯仰力矩系數(shù)建模結(jié)果
圖6 建模結(jié)果對比
Fig.6 Comparison of modeling results
(a)k=0.02,阻力系數(shù)預(yù)測結(jié)果
(b)k=0.02,升力系數(shù)預(yù)測結(jié)果
(c)k=0.02,俯仰力矩系數(shù)預(yù)測結(jié)果
圖7 預(yù)測結(jié)果對比
Fig.7 Comparison of model prediction results
2.4.3 氣動熱試驗(yàn)數(shù)據(jù)融合
以某飛行器的表面熱流數(shù)據(jù)為例,對數(shù)值計算獲得的連續(xù)分布熱環(huán)境和風(fēng)洞試驗(yàn)點(diǎn)熱流值進(jìn)行融合。要求融合后的結(jié)果在風(fēng)洞試驗(yàn)點(diǎn)位置處同測量結(jié)果一致,對CFD數(shù)值仿真網(wǎng)格點(diǎn)處的值進(jìn)行適當(dāng)?shù)男拚?,融合后的結(jié)果能夠在整體上體現(xiàn)試驗(yàn)結(jié)果的數(shù)據(jù)特性。圖8是所有氣動熱數(shù)據(jù)樣本點(diǎn)的位置,其中32 922個藍(lán)色點(diǎn)為CFD網(wǎng)格點(diǎn),計算數(shù)據(jù)如圖9所示,118紅色點(diǎn)位置為風(fēng)洞試驗(yàn)測量點(diǎn),試驗(yàn)數(shù)據(jù)如圖10示。
表1 k=0.02工況的不同模型預(yù)測誤差Table 1 Comparison of prediction error for different model for k=0.02 case
圖8 數(shù)據(jù)采集點(diǎn)Fig.8 Data sampling points
圖9 數(shù)值計算數(shù)據(jù)Fig.9 Data of CFD
圖10 風(fēng)洞試驗(yàn)數(shù)據(jù)Fig.10 Wind tunnel test data
數(shù)據(jù)融合過程中需要建立風(fēng)洞試驗(yàn)數(shù)據(jù)和CFD計算數(shù)據(jù)的差量模型,并使用差量模型對CFD網(wǎng)格點(diǎn)處的值進(jìn)行修正。由于Kriging模型具有準(zhǔn)確擬合建模數(shù)據(jù)點(diǎn)的特性,因此被用于建立差量模型。另外,由于風(fēng)洞試驗(yàn)點(diǎn)位置與CFD網(wǎng)格點(diǎn)并非完全對應(yīng),因此對每個風(fēng)洞試驗(yàn)點(diǎn),選取附近的CFD數(shù)據(jù)點(diǎn)利用RBF方法進(jìn)行插值。之所以采用RBF方法是由于實(shí)驗(yàn)表明在數(shù)據(jù)較少時,RBF建模效率比Kriging更高,且建模精度相當(dāng)。
由此可得氣動熱數(shù)據(jù)融合方法:(1)針對每一個風(fēng)洞試驗(yàn)點(diǎn),若有與之對應(yīng)的CFD數(shù)據(jù)點(diǎn),則直接使用,否則,選取附近少量CFD數(shù)據(jù),使用RBF方法建立插值模型,并計算相應(yīng)的值;(2)計算風(fēng)洞試驗(yàn)數(shù)據(jù)和CFD計算數(shù)據(jù)的差量,并使用Kriging方法建立差量模型;(3)使用Kriging模型對所有的CFD數(shù)據(jù)點(diǎn)進(jìn)行修正,得到融合結(jié)果。
為了驗(yàn)證本文所提方法的有效性,隨機(jī)選取10%的風(fēng)洞試驗(yàn)數(shù)據(jù)作為預(yù)測驗(yàn)證數(shù)據(jù),其余90%的數(shù)據(jù)作為樣本數(shù)據(jù)與CFD計算數(shù)據(jù)一起構(gòu)建融合模型。實(shí)驗(yàn)進(jìn)行了兩次,圖11(a)和圖11(b)的紅色點(diǎn)是兩次實(shí)驗(yàn)隨機(jī)選取的10%風(fēng)洞試驗(yàn)數(shù)據(jù)在空間的分布情況。圖12(a)和圖12(b)是驗(yàn)證結(jié)果對比,其中橫坐標(biāo)表示用于驗(yàn)證的風(fēng)洞試驗(yàn)數(shù)據(jù)的真實(shí)值,縱坐標(biāo)表示在這些驗(yàn)證位置通過融合模型計算得到的預(yù)測值。第一次和第二次實(shí)驗(yàn)驗(yàn)證的均方根誤差分別為0.04782和0.02762。由圖12和均方根誤差可知預(yù)測數(shù)據(jù)與驗(yàn)證數(shù)據(jù)基本一致,說明模型達(dá)到了數(shù)據(jù)融合的目的。
(a)第一次實(shí)驗(yàn)
(b)第二次實(shí)驗(yàn)圖11 兩次實(shí)驗(yàn)驗(yàn)證數(shù)據(jù)分布圖Fig.11 The positions of validation data for two experimental cases
(a)第一次實(shí)驗(yàn)
(b)第二次實(shí)驗(yàn)圖12 預(yù)測數(shù)據(jù)與驗(yàn)證數(shù)據(jù)對比Fig.12 Comparison of validation data and prediction
通過上述機(jī)器學(xué)習(xí)模型算例分析,可以看到,幾種方法都能對氣動數(shù)據(jù)進(jìn)行較好的建模。但幾種模型也有各自的特點(diǎn)和優(yōu)缺點(diǎn),如表2所示。
(1)Kriging建模方法可對訓(xùn)練樣本完全擬合,RBF神經(jīng)網(wǎng)絡(luò)方法和SVM支持向量機(jī)方法則不要求訓(xùn)練樣本完全擬合。
(2)Kriging建模方法、RBF神經(jīng)網(wǎng)絡(luò)方法和SVM支持向量機(jī)方法都可以通過交叉校驗(yàn)優(yōu)化超參數(shù)來提高模型的泛化能力。對Kriging模型而言,超參數(shù)是θk;對RBF模型而言,超參數(shù)是隱層節(jié)點(diǎn)數(shù);對SVM模型而言,超參數(shù)是γ和δ。CART方法則對訓(xùn)練樣本量有較高要求,建模結(jié)果的精度和模型的泛化能力隨訓(xùn)練樣本數(shù)增加而提高。
(3)Kriging方法、RBF神經(jīng)網(wǎng)絡(luò)方法和SVM支持向量機(jī)方法都需要對樣本數(shù)據(jù)進(jìn)行大量的矩陣運(yùn)算,但RBF神經(jīng)網(wǎng)絡(luò)方法的矩陣維數(shù)取決于隱層節(jié)點(diǎn)數(shù),而Kriging方法和SVM支持向量機(jī)方法的矩陣維數(shù)取決于樣本點(diǎn)數(shù),當(dāng)樣本點(diǎn)數(shù)較多時,矩陣運(yùn)算的計算資源要求會增加,計算效率和計算精度會下降。因此,Kriging方法和SVM支持向量機(jī)方法中的建模樣本點(diǎn)數(shù)不宜過多,在普通個人微機(jī)上一般不超過2000個樣本點(diǎn),具體數(shù)量視微機(jī)性能而定,而RBF神經(jīng)網(wǎng)絡(luò)方法則對樣本點(diǎn)數(shù)無特殊限制。CART建模方法中沒有矩陣運(yùn)算,且樣本點(diǎn)越多,建模效果越好,但隨著樣本點(diǎn)的增加,邏輯判斷運(yùn)算量較大。
表2 幾種建模方法比較Table 2 Comparison of modeling methods
前面的淺層學(xué)習(xí)方法存在兩方面問題,一是需要人為提取輸入特征參數(shù),二是泛化能力有所不足。深度神經(jīng)網(wǎng)絡(luò)通過增加隱層層數(shù),一方面使得模型能更有效地表征非線性函數(shù)的豐富特征;另一方面則通過層與層之間的無監(jiān)督學(xué)習(xí),實(shí)現(xiàn)特征的逐級提取,可較好地克服淺層學(xué)習(xí)方法存在的不足。但是,隨著網(wǎng)絡(luò)層數(shù)的增加,如果采用傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法會出現(xiàn)三個問題,一是“梯度消失”現(xiàn)象;二是優(yōu)化易于陷入局部最優(yōu)值;三是如果網(wǎng)絡(luò)全連接的話,會帶來網(wǎng)絡(luò)權(quán)值參數(shù)數(shù)目的幾何增長。因此,在深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法中,使用自下而上非監(jiān)督學(xué)習(xí)與自上而下監(jiān)督學(xué)習(xí)結(jié)合的方法,對訓(xùn)練數(shù)據(jù)特征提取后再進(jìn)行網(wǎng)絡(luò)權(quán)值調(diào)整,解決了“梯度消失”和陷入局部最優(yōu)的問題;同時基于局部感知和權(quán)值共享,則大幅減少了待優(yōu)化網(wǎng)絡(luò)權(quán)值數(shù)[25-26]。
近年來,隨著計算資源的增強(qiáng)和大數(shù)據(jù)的興起,以深度神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)方法在圖像與語音識別、語義理解、智能控制等方面得到了廣泛應(yīng)用,并逐步與空氣動力學(xué)研究結(jié)合[27-33]。文獻(xiàn)[33]將深度神經(jīng)網(wǎng)絡(luò)模型用于氣動特性建模,基于CNN模型對翼型氣動系數(shù)進(jìn)行了預(yù)測,但該方法只能處理給定馬赫數(shù)和迎角的情況,沒有將流動條件作為輸入,限制了其使用范圍。為了在輸入中引入流動條件,文獻(xiàn)[34]中利用迎角度數(shù)對翼型圖像進(jìn)行旋轉(zhuǎn),利用馬赫數(shù)對圖像顏色進(jìn)行改變,構(gòu)造了一幅人工圖像,作為預(yù)測模型的輸入。本節(jié)提出另一種方法,將流動條件參數(shù)組成一個向量,認(rèn)為該向量是一幅分辨率為1×nfc的圖像,其中nfc為流動條件的參數(shù)個數(shù)。通過雙三次插值,將該向量的分辨率調(diào)整為同翼型圖像一致,與翼型圖像一起構(gòu)成“合成圖像”,即2個二維矩陣,作為預(yù)測模型的輸入。同時,由于翼型圖像與流動參數(shù)向量對應(yīng)圖像的特征豐富程度不同,選用如圖13所示的有向無環(huán)圖(Directed Acyclic Graph,DAG)深度神經(jīng)網(wǎng)絡(luò)[35],該網(wǎng)絡(luò)結(jié)構(gòu)在卷積層1后分為兩個支路,能較好地處理圖像特征相差較大的情況,提高預(yù)測精度[11]。其訓(xùn)練和測試方法與常規(guī)CNN預(yù)測模型類似。具體的網(wǎng)絡(luò)參數(shù)設(shè)置:圖像分辨率為85×85;卷積層1選取卷積核大小為8×8,卷積核數(shù)量為40,步長為1;卷積層2選取卷積核大小為5×5,卷積核數(shù)量為80,步長為1;卷積層3選取卷積核大小為5×5,卷積核數(shù)量為120,步長為2;卷積層4選取卷積核大小為2×2,卷積核數(shù)量為120,步長為2;所有卷積層所用到的非線性激勵函數(shù)均選取為ReLU函數(shù);池化區(qū)域大小為2×2,步長為2,即相鄰池化區(qū)域不重疊,選擇的池化方法為最大池化法。
圖13 DAG模型結(jié)構(gòu)Fig.13 Model structure of DAG network
算例中用到的翼型為NACA0012翼型疊加擾動函數(shù)后的變形體,共300個;流動條件中迎角取值為2°、6°、9°、12°和15°,馬赫數(shù)取值為0.1、0.3和0.6,雷諾數(shù)固定為6.5×106;翼型形狀和流動條件任意組合,共構(gòu)成翼型數(shù)據(jù)樣本4200組。圖14中給出了隨機(jī)選取的8個翼型圖像。圖15給出了3個迎角和馬赫數(shù)組成的向量[6,0.3]、[9,0.6]、[12,0.1]乘以放大倍數(shù)后變?yōu)閇102,127.5]、[153,255]、[204,42.5],視為三張圖片將分辨率調(diào)整為85×85后的圖像。
圖14 任意8個翼型圖像(翼型厚度放大10倍)Fig.14 Eight random selected airfoils (thickness amplified 10 times)
圖15 任意3個由迎角和馬赫數(shù)構(gòu)成的圖像Fig.15 Pictures corresponding to three sets of angle of attack and Mach number
將這4200組樣本的順序打亂,隨機(jī)選擇3360組翼型圖像和對應(yīng)的流動條件作為訓(xùn)練樣本,將氣動系數(shù)作為期望值,對預(yù)測模型進(jìn)行訓(xùn)練;剩下的840組翼型數(shù)據(jù)作為測試樣本,對預(yù)測模型進(jìn)行測試。結(jié)果顯示,840組翼型升力系數(shù)、阻力系數(shù)、俯仰力矩系數(shù)預(yù)測結(jié)果的標(biāo)準(zhǔn)差絕對值分別為0.0418、0.0049和0.0042,相對值分別為4.38%、7.23%和12.73%。隨機(jī)給出一個翼型在不同迎角和馬赫數(shù)下CFD計算氣動系數(shù)和預(yù)測氣動系數(shù)的對比如圖16所示。圖16中,“CFD”表示通過CFD計算得到的氣動系數(shù),“DAG”表示通過模型預(yù)測得到的氣動系數(shù),α表示迎角。從圖16中可以看出,本文建立的預(yù)測模型能夠比較準(zhǔn)確地對3個氣動系數(shù)進(jìn)行預(yù)測。
(a)升力系數(shù)對比
(b)阻力系數(shù)對比
在此需要指出的是,深度學(xué)習(xí)模型雖然從建模便捷性和泛化能力等方面看優(yōu)于淺層學(xué)習(xí)模型,但也存在不足,還需要進(jìn)一步的改進(jìn)完善:一是對訓(xùn)練數(shù)據(jù)量的要求較高;二是模型中超參數(shù),如網(wǎng)絡(luò)層數(shù)、隱層節(jié)點(diǎn)數(shù)的選取,較為困難,這些超參數(shù)的選取對建模結(jié)果有直接影響;三是所提取特征的可解釋性較弱。
本文對氣動特性“黑箱”建模的三類機(jī)器學(xué)習(xí)方法——分類與回歸樹方法、淺層學(xué)習(xí)方法和深度學(xué)習(xí)方法,進(jìn)行了算法說明與分析應(yīng)用。將分類與回歸樹方法、Kriging建模方法、RBF神經(jīng)網(wǎng)絡(luò)方法及SVM支持向量機(jī)方法分別應(yīng)用于火箭氣動特性建模、三角翼大迎角非定常氣動特性建模、氣動熱試驗(yàn)數(shù)據(jù)融合。結(jié)果顯示淺層學(xué)習(xí)方法可通過交叉校驗(yàn)對模型中的超參數(shù)進(jìn)行優(yōu)化來提高泛化能力;Kriging建模方法和SVM支持向量機(jī)方法的訓(xùn)練樣本數(shù)受矩陣運(yùn)算限制較大。CART方法對訓(xùn)練樣本量有較高要求,但其建模結(jié)果的精度和模型的泛化能力隨訓(xùn)練樣本數(shù)增加而提高。
同時,將流動條件參數(shù)組成向量,再映射為圖像,與翼型圖像構(gòu)成“合成圖像”,建立了以翼型幾何圖像、來流馬赫數(shù)、迎角為輸入,翼型氣動特性為輸出的DAG深度神經(jīng)網(wǎng)絡(luò)模型,得到了比較好的預(yù)測效果,拓展了氣動特性深度學(xué)習(xí)建模方法的使用范圍。
從上述對淺層學(xué)習(xí)和深度學(xué)習(xí)模型的分析應(yīng)用看,淺層學(xué)習(xí)在模型結(jié)構(gòu)簡潔性、計算效率和建模數(shù)據(jù)量方面有優(yōu)勢,而深度學(xué)習(xí)模型在泛化能力、特征自動提取方面有優(yōu)勢。因此,后續(xù)可考慮將兩種建模方法結(jié)合起來開展研究。例如,提高深度學(xué)習(xí)模型的可解釋性,分析其提取特征的物理含義并將這些特征作為淺層學(xué)習(xí)的輸入,使淺層學(xué)習(xí)模型在較少數(shù)據(jù)量的情況下也能具有較強(qiáng)的泛化能力。