顏 鑫,應(yīng)愷寧,戴鷺楠,譚鈞夫,沈中華,倪辰蔭*
(1.南京理工大學(xué) 電子工程與光電技術(shù)學(xué)院,南京 210094,中國;2.南京理工大學(xué) 理學(xué)院,南京 210094,中國;3.南京理工大學(xué) 計算機(jī)科學(xué)與工程學(xué)院,南京 210094,中國)
激光技術(shù)在檢測領(lǐng)域[1]應(yīng)用十分廣泛,其中激光超聲[2-4]技術(shù)是無損檢測[5-8]領(lǐng)域的重要研究工具。激光超聲與傳統(tǒng)超聲[7]相比有許多優(yōu)點(diǎn):激光超聲不僅能夠在固體中產(chǎn)生,同樣可以在液體、氣體中產(chǎn)生;并且依據(jù)材料的不同性質(zhì),激光聲源能激發(fā)出縱波、橫波和表面波等多模態(tài)波,是一種理想的聲源。波場成像[9-13]方法可用于表征和研究各種材料系統(tǒng)中的彈性場相互作用。其中基于激光超聲的波場成像方法,即使用掃描激光測振系統(tǒng)[11]來檢測由超聲激發(fā)源產(chǎn)生的材料表面上的運(yùn)動,通過重復(fù)的激發(fā)超聲,測振系統(tǒng)在不同的檢測點(diǎn)能夠得到一組離散的時間序列信號(離面位移-時間信號),這些隨時間變化的數(shù)據(jù)顯示了超聲在材料內(nèi)部傳播的細(xì)節(jié)?;诩す獬暤牟▓龀上窦夹g(shù),利用可視化的超聲波場圖像對材料性質(zhì)進(jìn)行分析,并且有著激光超聲無損檢測高精度、非接觸和無損傷的優(yōu)點(diǎn),因此有著重要的意義和應(yīng)用背景。
近年來,隨著深度學(xué)習(xí)算法的更新迭代和數(shù)據(jù)的爆炸式增長,深度學(xué)習(xí)已經(jīng)在生物醫(yī)學(xué)[14]、自動駕駛[15]、圖像識別[16]、自然語言處理[17]等領(lǐng)域取得了突破性進(jìn)展。傳統(tǒng)深度學(xué)習(xí)算法的任務(wù)就是建立輸入數(shù)據(jù)到輸出數(shù)據(jù)直接的映射關(guān)系,即提供一個訓(xùn)練集,包括輸入和其對應(yīng)的輸出,如果神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果是錯的,它將會調(diào)整計算,并在訓(xùn)練集上不斷重復(fù)計算,直至得到期望的結(jié)果。為了找出這種映射關(guān)系,通常需要數(shù)據(jù)對網(wǎng)絡(luò)進(jìn)行訓(xùn)練。當(dāng)數(shù)據(jù)量過少時,模型無法得到準(zhǔn)確的結(jié)果;而當(dāng)數(shù)據(jù)量過于龐大時,又會導(dǎo)致模型的泛化能力過差,模型陷入過擬合。因此最終訓(xùn)練出來的模型好壞與數(shù)據(jù)息息相關(guān)。在許多物理模型之中,訓(xùn)練的數(shù)據(jù)之中往往暗含著物理定律,但是這些都沒有體現(xiàn)在傳統(tǒng)的深度學(xué)習(xí)算法之中。因此,為了規(guī)避數(shù)據(jù)稀疏性的影響,讓神經(jīng)網(wǎng)絡(luò)也能夠利用物理定律,布朗大學(xué)RAISSI等人[18-20]提出了一種基于物理信息的神經(jīng)網(wǎng)絡(luò)(physical-informed neural networks,PINN),結(jié)合了數(shù)據(jù)驅(qū)動和物理模型的優(yōu)勢,能在少量數(shù)據(jù)下訓(xùn)練出符合物理規(guī)律的模型,避免了模型過擬合并提高了其泛化能力;在此基礎(chǔ)上,RAISSI教授證明了在構(gòu)建物理系統(tǒng)的正向問題和反向問題上,可以使用偏微分方程作為先驗(yàn)信息來約束最小化過程,即PINN可以用于解決物理模型的正反問題。在正向問題中,可以得到偏微分方程的近似解;而在反向問題中,可以計算出偏微分方程所涉及的參數(shù)甚至是未知的函數(shù)。由于可在PINN中引入基于物理規(guī)律的表達(dá)式,許多學(xué)者已經(jīng)將其在不同的領(lǐng)域進(jìn)行了應(yīng)用,例如流體力學(xué)[21]、生物醫(yī)學(xué)[22]、材料領(lǐng)域[23]等。PINN在激光超聲無損檢測領(lǐng)域的應(yīng)用目前仍處于起步階段,但是激光超聲信號滿足波傳播的物理定律,因此可以以此建立物理模型。
針對上述問題,本文作者開展了正向重建激光超聲波場圖像和反向推演波速的研究。首先,基于聲波波動方程建立了PINN模型,并使用數(shù)值計算實(shí)驗(yàn)獲得的激光超聲信號作為輸入數(shù)據(jù),對所建模型進(jìn)行了訓(xùn)練;其次,利用神經(jīng)網(wǎng)絡(luò)作為函數(shù)逼近器,在數(shù)值計算模型的表面波波場數(shù)據(jù)基礎(chǔ)上,正向訓(xùn)練出表面波波場圖像,減小了數(shù)據(jù)稀疏性對于神經(jīng)網(wǎng)絡(luò)的影響;最后,利用表面波數(shù)據(jù)進(jìn)行PINN參數(shù)反演,神經(jīng)網(wǎng)絡(luò)自動推演出表面波波速,即建立的PINN模型可以用于反演偏微分方程(波動方程)里面的參數(shù)。
傳統(tǒng)神經(jīng)網(wǎng)絡(luò)[24-25]為一個多層的網(wǎng)絡(luò)結(jié)構(gòu),分為“輸入層”、“隱藏層”和“輸出層”,如圖1所示。在這3層結(jié)構(gòu)中,“輸入層”接收待訓(xùn)練的數(shù)據(jù);“隱藏層”可以不止一層,每一層有多個神經(jīng)元,其接收前一層的數(shù)據(jù)進(jìn)行非線性運(yùn)算,運(yùn)算的結(jié)果為“輸出層”的輸入;最后“輸出層”輸出結(jié)果。其中“輸入層”、“隱藏層”和“輸出層”兩兩連接。
圖1 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Structure of Neural network
圖1中,x1~xn為“輸入層”的輸入值,輸入值在經(jīng)過神經(jīng)元后會進(jìn)行非線性變化,如下式所示:
(1)
式中:σ(·)表示激活函數(shù);j表示該層的神經(jīng)元的個數(shù);n表示輸入的個數(shù);wj表示該層第j個神經(jīng)元為輸入值賦予的權(quán)重;xj為第j個神經(jīng)元的輸入,即為上一層的輸出值;b表示該隱藏層神經(jīng)元帶有的偏置;Zj為該層的輸出值,也是下一層的輸入值。
本文中基于波動方程建立PINN模型,與普通的神經(jīng)網(wǎng)絡(luò)相比,在激活函數(shù)的選擇上面需要注意以下幾點(diǎn):首先,由于波動方程涉及到偏微分方程的運(yùn)算,所以需要激活函數(shù)的2階導(dǎo)數(shù)存在、且不為0,例如激活函數(shù)ReLU就不能運(yùn)用;其次,例如sigmoid和tanh等存在2階導(dǎo)數(shù)且不為0的激活函數(shù)都可以使用,而在實(shí)際訓(xùn)練模型的時候,由于檢測到的振動幅度較小,使用sigmoid激活函數(shù)容易出現(xiàn)梯度消失的問題,因此實(shí)際使用中tanh較好,表達(dá)式如下式所示:
(2)
在神經(jīng)網(wǎng)絡(luò)中,“輸入層”到“隱藏層”都會進(jìn)行這種非線性變換,而在“隱藏層”到“輸出層”中將進(jìn)行線性變換,如下式所示:
(3)
“隱藏層”到“輸出層”進(jìn)行運(yùn)算時,如式(3)所示,只進(jìn)行線性運(yùn)算。經(jīng)由神經(jīng)網(wǎng)絡(luò)模型計算出來的預(yù)測值,將繼續(xù)作為偏微分方程的輸入,計算殘差。
PINN將利用控制超聲波傳播的線性2階偏微分方程[26-27],如下式所示:
u″=c2Δu,(x∈Ω,t∈[0,T])
(4)
式中:u(t,x)是偏微分方程的解;t是時間;c表示波速;Ω是表示實(shí)數(shù)集;u″是離面位移u對時間t求2次導(dǎo)數(shù);Δu表示對u進(jìn)行拉普拉斯運(yùn)算;T代表求解時間域。網(wǎng)絡(luò)結(jié)構(gòu)原理如圖2所示。
圖2 PINN結(jié)構(gòu)圖Fig.2 Structure of PINN
圖2表示PINN先建立一個神經(jīng)網(wǎng)絡(luò)的位移逼近函數(shù)u(t,x),之后建立偏微分方程的殘差f,f的值越趨近于0表示神經(jīng)網(wǎng)絡(luò)的預(yù)測值越符合物理模型,表達(dá)式為:
f:=u″-c2(x)Δu
(5)
式中:“:=”表示更新參數(shù)。定義PINN的損失函數(shù)為:
L=λMu+Mf
(6)
式中:λ>0為懲罰項系數(shù),通過改變λ,可以調(diào)整神經(jīng)網(wǎng)絡(luò)的逼近函數(shù),從而達(dá)到幫助神經(jīng)網(wǎng)絡(luò)快速收斂的效果;Mu為神經(jīng)網(wǎng)絡(luò)預(yù)測值up和真實(shí)值u的均方根誤差;Mf為偏微分方程的殘差f的均方根誤差,其表達(dá)式分別為:
(7)
(8)
式中:Nu表示預(yù)測值的總個數(shù);Nf表示偏微分方程采集點(diǎn)的個數(shù)。
由第1.1節(jié)可知,多層神經(jīng)網(wǎng)絡(luò)在訓(xùn)練中需要經(jīng)過多次迭代計算,每次迭代根據(jù)當(dāng)前神經(jīng)網(wǎng)絡(luò)的權(quán)重和偏置計算輸入數(shù)據(jù)前向運(yùn)算的結(jié)果,根據(jù)建立的損失函數(shù)來計算神經(jīng)網(wǎng)絡(luò)的輸出與目標(biāo)輸出之間的誤差,此時需要反向傳播計算損失相對于參數(shù)的梯度,使用梯度下降算法更新參數(shù)以減少下一次迭代的損失。
梯度下降算法更新公式為:
(9)
式中:θ為待更新參數(shù);α為學(xué)習(xí)率,決定了梯度更新的步長;L為損失誤差;?為偏導(dǎo)數(shù)符號;上標(biāo)k為迭代的次數(shù);由于神經(jīng)網(wǎng)絡(luò)之中需要迭代更新的參數(shù)往往為多個,下標(biāo)i對應(yīng)不同的參數(shù)。由式(9)可以看出,如果學(xué)習(xí)率過小,損失函數(shù)的變化速度會很慢;如果學(xué)習(xí)率過大,可能會使損失函數(shù)直接越過全局最優(yōu)解,陷入局部最優(yōu)解。本文中采用自適應(yīng)矩估計(adaptive moment estimation,Adam)優(yōu)化算法[28],收斂速度比傳統(tǒng)的梯度下降算法更快,不易陷入局部最優(yōu)。
本文中均采用4層神經(jīng)網(wǎng)絡(luò),每層有128個神經(jīng)元,激活函數(shù)為tanh,優(yōu)化器為Adam。
為利用PINN進(jìn)行波場成像及參數(shù)反演,首先使用仿真軟件進(jìn)行數(shù)值計算以獲取波場數(shù)據(jù)。在數(shù)值計算模型中,利用固體力學(xué)和固體傳熱兩個模塊[29],模擬了激光入射在鋁材料上導(dǎo)致局部吸收能量形成熱彈激光超聲這一過程[30-31]。本文中通過固定超聲激發(fā)點(diǎn),會在材料表面產(chǎn)生超聲信號,而通過移動掃查探測點(diǎn)可以測得不同位置的離面位移信號,即物體表面質(zhì)點(diǎn)震動離開表面原位的距離,從而進(jìn)行數(shù)值計算實(shí)驗(yàn)研究。通過設(shè)置不同的激發(fā)點(diǎn)位置和探測點(diǎn)掃查范圍,得到了兩組數(shù)據(jù)。
數(shù)值計算的第1組數(shù)據(jù)如圖3中激發(fā)位置與掃查范圍1所示。樣品材料設(shè)置為鋁,長度為6.0 mm,厚度為1.0 mm,其中激發(fā)點(diǎn)位于上表面中心處,位置設(shè)為0點(diǎn)。測量范圍在整個上表面[-3.0 mm,3.0 mm]區(qū)域,每步掃描步長為50.0 μm,共包含121個掃描點(diǎn),時間步長數(shù)據(jù)采集間隔為0.02 μs,101個總時間步長點(diǎn)共2.0 μs。數(shù)據(jù)以(Nx,Nt)的形式排列,大小為(121×101),其中Nx為x方向的網(wǎng)格點(diǎn),Nt為總時間步長。B掃圖像u(t,x)如圖4a所示,其中橫坐標(biāo)表示時間,縱坐標(biāo)表示探測點(diǎn)的位置,兩條直線分別為掠面縱波、表面波。直線的斜率表示為該波的波速??梢园l(fā)現(xiàn):在x=0.0 mm處,由激發(fā)光輻照產(chǎn)生的熱膨脹離面位移遠(yuǎn)遠(yuǎn)大于其它探測點(diǎn)的離面位移,由熱膨脹引起的離面位移為納米級,圖4a中為一條黃綠色的橫線(即圖4a中激發(fā)點(diǎn)處熱膨脹信號),而超聲傳播過程中的離面位移數(shù)量級為0.01 nm,熱膨脹信號至少比超聲信號引起的離面位移大兩個數(shù)量級。
圖3 數(shù)值計算模型(固定激發(fā)、多點(diǎn)探測)Fig.3 Numerical calculation setup for fixed generation and multiple point detection
圖4 激光超聲多模態(tài)B掃圖像a—探測點(diǎn)包含激發(fā)點(diǎn) b—探測點(diǎn)不包含激發(fā)點(diǎn)Fig.4 B-scan image of laser ultrasonic multi-modea—when detection points include the excitation point b—when detection points exclude the excitation point
數(shù)值計算的第2組數(shù)據(jù)如圖3中激發(fā)位置與掃查范圍2所示。樣品表面寬度為6.0 mm,深度為1.0 mm,其中激發(fā)點(diǎn)位于上表面中心點(diǎn)左側(cè)1.0 mm處。波場成像測量范圍在上表面[0.0 mm,3.0 mm]區(qū)域,模擬掃描步長100.0 μm(31個掃描點(diǎn)),時間步長數(shù)據(jù)采集間隔為0.02 μs(101個總時間步長點(diǎn)共2.0 μs)。B掃圖如圖4b所示,與圖4a的區(qū)別在于此時的探測點(diǎn)不包含激發(fā)點(diǎn),但都有掠面縱波和表面波,其斜率代表各自的波速。其中熱膨脹處的離面位移為納米級,而由于超聲傳播特性而引起的離面位移也為納米級,因此,激發(fā)點(diǎn)無法體現(xiàn)出超聲傳播所引起的離面位移變化。
需要指出的是,激光超聲具有多模態(tài)激發(fā)的特性,針對這一特性,本文作者提出的PINN模型可以加入不同的控制方程表示不同模態(tài)的特點(diǎn)。為了研究方便,先從單模態(tài)超聲傳播著手,研究激光超聲中波場成像原理。因此,本文中PINN模型只對單個波進(jìn)行建模分析,由此,作者先對波場數(shù)據(jù)進(jìn)行預(yù)處理操作。由圖4可知,B掃圖像包含掠面縱波、表面波等多個超聲波模態(tài)。從時域信號幅值來看,除激發(fā)點(diǎn)外,表面波幅值比其它模態(tài)聲波大一個數(shù)量級,所以選取表面波模態(tài)進(jìn)行分析。取表面波信號最大幅值處為其到達(dá)時間,處理后的單模態(tài)數(shù)據(jù)如圖5所示。橫坐標(biāo)均為時間,縱坐標(biāo)均為探測點(diǎn)的位置,直線的斜率為波速。
圖5 激光超聲單模態(tài)B掃圖像Fig.5 B-scan image of laser ultrasonic single-mode
在訓(xùn)練PINN模型時,為驗(yàn)證PINN模型能用少量數(shù)據(jù)重建波場的可行性,在均勻采樣、掃描距離和總時長均一定的前提下,增大掃描步長和時間步長,再將少量數(shù)據(jù)輸入PINN中進(jìn)行訓(xùn)練,最后與原始掃描步長和時間步長的波場數(shù)據(jù)進(jìn)行對比。
本節(jié)中使用數(shù)值模型中獲得的2組計算數(shù)據(jù),對上文建立的基于波動方程的PINN模型進(jìn)行訓(xùn)練,從而正向得到激光超聲單模態(tài)(表面波)波場圖像的結(jié)果,進(jìn)而反向推演激光超聲單模態(tài)波場參數(shù)。
為了利用少量的波場u(t,x)數(shù)據(jù)重建波場圖像,首先進(jìn)行第1組數(shù)值計算數(shù)據(jù)(數(shù)據(jù)大小為121×101,共12221個數(shù)據(jù)點(diǎn))訓(xùn)練PINN模型。圖6a為正向PINN模型重建出來的B掃圖像,其中橫坐標(biāo)為時間,縱坐標(biāo)為探測點(diǎn)的位置。從圖6a中可明顯看出,在x=0.0 mm處的離面位移遠(yuǎn)遠(yuǎn)大于其它探測點(diǎn)處的離面位移,這是由于數(shù)值模型中激發(fā)點(diǎn)的離面位移遠(yuǎn)遠(yuǎn)大于其它點(diǎn),在訓(xùn)練模型過程中被作為了主要特征。
圖6 探測點(diǎn)包含激發(fā)點(diǎn)時前向PINN訓(xùn)練結(jié)果Fig.6 Forward PINN training results when detection points include the excitation point
圖6b中給出了PINN模型訓(xùn)練過程中的損失函數(shù)的變化過程。圖中橫坐標(biāo)表示迭代次數(shù),縱坐標(biāo)表示損失函數(shù)的值。由圖6b可知,訓(xùn)練數(shù)據(jù)包含探測點(diǎn)時,損失函數(shù)的值基本平穩(wěn)無法下降。這是由于x=0.0 mm處的離面位移主要由激發(fā)源導(dǎo)致的熱膨脹引起,其幅值比其它探測點(diǎn)處獲得的離面位移高了一個數(shù)量級,因此PINN模型會將x=0.0 mm點(diǎn)的數(shù)據(jù)作為主要訓(xùn)練特征。而PINN模型是基于波動方程構(gòu)建殘差損失的,x=0.0 mm處的熱膨脹引起的離面位移并不能在波動方程中體現(xiàn),因此與損失函數(shù)矛盾且損失函數(shù)無法下降。
針對這一問題,使用掃查路徑不包含激發(fā)點(diǎn)的第2組數(shù)值計算數(shù)據(jù)(大小為31×101,共3131個數(shù)據(jù)點(diǎn),掃描步長為100.0 μm,時間步長為0.02 μs)中約10%的數(shù)據(jù)(大小為16×21,共336個數(shù)據(jù)點(diǎn),掃描步長為200.0 μm,時間步長為0.1 μs)訓(xùn)練PINN模型。與上述情況不同,其損失函數(shù)可以收斂,下降趨勢如圖7所示。
圖7 探測點(diǎn)不包含激發(fā)點(diǎn)時的正向PINN模型損失函數(shù)Fig.7 Loss function of forward PINN model when detection points do not contain the excitation point
圖7表示第2組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)時,PINN模型訓(xùn)練過程中的損失函數(shù)的變化過程。除個別跳變點(diǎn)之外,PINN模型的損失函數(shù)逐漸接近零,平穩(wěn)地趨近于收斂。這表明當(dāng)探測點(diǎn)不包含激發(fā)點(diǎn)時,第1組數(shù)據(jù)中作為主要干擾信息的熱膨脹源不存在,正向PINN模型可以利用波場數(shù)據(jù)重建波場圖像。對于訓(xùn)練出來的PINN模型,圖8表現(xiàn)了其重建B掃圖像的結(jié)果。其中圖8a表示PINN模型重建出來的B掃圖像,圖8b表示PINN模型預(yù)測的數(shù)據(jù)與數(shù)值計算數(shù)據(jù)的相對誤差圖。由圖8b可知,將PINN計算的數(shù)據(jù)與數(shù)值計算數(shù)據(jù)進(jìn)行對比,誤差主要集中在表面波到達(dá)時刻點(diǎn)附近,波場數(shù)據(jù)u(t,x)的平均誤差為0.0123 nm,其誤差相比于原始波場數(shù)據(jù)下降了一個數(shù)量級(超聲傳播過程中引起的離面位移為納米級)。圖8c和圖8d為隨機(jī)選取了x=0.5 mm,x=1.0 mm的時間-位移波形圖像??梢钥闯?PINN擬合的表面波與數(shù)值模擬實(shí)驗(yàn)的表面波數(shù)據(jù)的波形基本一致。
圖8 探測點(diǎn)不包含激發(fā)點(diǎn)時前向PINN訓(xùn)練結(jié)果Fig.8 Forward PINN training results when detection points do not contain the excitation point
由上述可知,在訓(xùn)練正向PINN模型時,探測點(diǎn)包含激發(fā)點(diǎn)時,由于激發(fā)點(diǎn)處產(chǎn)生的大幅度熱膨脹,導(dǎo)致待訓(xùn)練數(shù)據(jù)的內(nèi)部數(shù)據(jù)規(guī)律與PINN模型內(nèi)置的波動方程信息不對應(yīng)。由此可知,訓(xùn)練PINN模型時主要特征需要符合模型中作為判據(jù)的物理信息(在本例中,是式(5)的波動方程)。本文中,當(dāng)與物理規(guī)律無關(guān)的干擾源高于波場數(shù)據(jù)引起的離面位移一個數(shù)據(jù)量級乃至以上時,式(6)中的損失項Mu中激發(fā)點(diǎn)的數(shù)據(jù)將作為主要特征,與損失項Mf中的波動方程相矛盾,PINN模型將不收斂。
在正向利用PINN模型重建波場圖像之后,下面進(jìn)行單模態(tài)激光超聲信號參數(shù)的反向推演。對于給定的波場u(t,x),目標(biāo)是識別未知參數(shù)波速c。反向PINN模型對于噪聲信息有著更好的魯棒性,因此,即使探測點(diǎn)包含了激發(fā)點(diǎn),也可以反演出波速c。使用第1組數(shù)值計算模型的數(shù)據(jù)中約25%的數(shù)據(jù)量(大小為61×51,共3111個數(shù)據(jù)點(diǎn),掃描步長為100.0 μm,時間步長為0.04 μs)進(jìn)行訓(xùn)練反向PINN模型。圖9a中給出了PINN重建出來的B掃圖像,橫坐標(biāo)為時間,縱坐標(biāo)表示探測點(diǎn)的位置,圖中的斜線為表面波到達(dá)每個探測點(diǎn)時刻,在x=0.0 mm處為激發(fā)點(diǎn)。圖9b表示PINN模型預(yù)測的波場數(shù)據(jù)與真實(shí)數(shù)據(jù)的絕對誤差分布。由圖9b可知,其誤差主要也是集中在激發(fā)點(diǎn)附近和表面波到達(dá)時刻附近,這是由于訓(xùn)練的數(shù)據(jù)之中包含一部分噪聲的干擾,波場數(shù)據(jù)u(t,x)的平均絕對誤差為0.0046 nm,計算誤差與原波場數(shù)據(jù)相比下降了4個數(shù)量級。圖9c和圖9d為隨機(jī)選取x=-1.5 mm,x=2.5 mm時的時間-位移圖像,波形基本一致。
圖9 探測點(diǎn)包含激發(fā)點(diǎn)時反向PINN訓(xùn)練結(jié)果Fig.9 Inverse PINN training results when detection points include the excitation point
表1中給出了反向推演的波速結(jié)果。從表中可知,PINN反演出來的波速與真實(shí)波速相比,誤差為3.28%。
表1 真實(shí)波速和PINN反演波速(包含激發(fā)點(diǎn))Table 1 True wave velocity and velocity inversed by PINN (including the excitatiion point)
由于已經(jīng)證明了反向推演參數(shù)對于干擾數(shù)據(jù)有更好的魯棒性,接下來討論小數(shù)據(jù)訓(xùn)練PINN模型時波場成像質(zhì)量的問題。利用給定的波場數(shù)據(jù)u(t,x),在數(shù)據(jù)中不包含激發(fā)點(diǎn)數(shù)據(jù)的情況下,識別未知參數(shù)波速c。本次使用了第2組數(shù)值計算模型的數(shù)據(jù)中約21%的數(shù)據(jù)量進(jìn)行訓(xùn)練PINN模型(大小為31×21,共651個數(shù)據(jù)點(diǎn),掃描步長為100.0 μm,時間步長為0.1 μs)。圖10a為PINN模型重建的B掃圖像;圖10b表示PINN預(yù)測的波場數(shù)據(jù)與真實(shí)數(shù)據(jù)的絕對誤差。平均絕對誤差為0.0046 nm,相比于原波場數(shù)據(jù),平均絕對誤差下降了一個數(shù)量級。圖10c和圖10d為隨機(jī)選取的x=1.0 mm,x=2.0 mm時的時間-位移波形圖像,將PINN預(yù)測的數(shù)據(jù)與真實(shí)的數(shù)據(jù)進(jìn)行對比,PINN擬合的表面波與真實(shí)數(shù)據(jù)的表面波基本一致。
圖10 探測點(diǎn)不包含激發(fā)點(diǎn)時反向PINN訓(xùn)練結(jié)果Fig.10 Inverse PINN training results when detection points do not contain the excitation point
如表2所示,PINN反演出來表面波波速,與真實(shí)表面波波速誤差為1.80%。
表2 真實(shí)波速和PINN反演波速(不含激發(fā)點(diǎn))Table 2 True wave velocity and velocity inversed by PINN (excluding the excitation point)
經(jīng)過兩組不同的數(shù)據(jù)訓(xùn)練出來的PINN模型均可以反演出波速,且誤差均在5.00%以內(nèi)。第1組數(shù)據(jù)其探測點(diǎn)包含了激發(fā)點(diǎn),PINN模型仍可以反演出模型;第2組數(shù)據(jù)訓(xùn)練出的反向PINN模型的誤差比正向PINN模型的誤差低了一個數(shù)量級,顯示出了PINN對噪聲的魯棒性(抗干擾性)很強(qiáng)。這是由于反向訓(xùn)練PINN模型時,波速是未知參數(shù),參與訓(xùn)練時以波動方程為主要特征進(jìn)行訓(xùn)練,通過調(diào)節(jié)懲罰項系數(shù)λ調(diào)節(jié)神經(jīng)網(wǎng)絡(luò)模型,而在正向訓(xùn)練PINN時,由于激發(fā)點(diǎn)處熱膨脹導(dǎo)致離面位移比其它探測點(diǎn)高了多個數(shù)量級,波動方程的殘差損失無法作為主要特征,因此,在正向過程中無法重建包含探測點(diǎn)的波場圖像。同時,由于波動方程作為主要特征學(xué)習(xí)時,神經(jīng)網(wǎng)絡(luò)能夠減小其它干擾噪聲的影響,所以第2組數(shù)據(jù)的反向成像質(zhì)量也優(yōu)于正向過程。
需要指出的是,本文中目前只利用描述激光超聲傳播的波動方程進(jìn)行波場重建以及反演內(nèi)部參數(shù),并依此對單模態(tài)超聲信號進(jìn)行分析。在激光超聲檢測技術(shù)中,還可進(jìn)一步針對激光超聲多模態(tài)特性,分別對不同模態(tài)的激光超聲信號建立獨(dú)立的控制方程來重建不同模態(tài)激光超聲信號的波場及參數(shù)反演。此外,在其它光學(xué)研究領(lǐng)域,這一將物理信息嵌入神經(jīng)網(wǎng)絡(luò)的方法同樣適用于基于麥克斯韋方程物理信息的研究場景,如光電器件仿真領(lǐng)域。這些基于物理信息的神經(jīng)網(wǎng)絡(luò)模型可為激光仿真技術(shù)的研究提供其它可行思路。
介紹了PINN用于正向求解波動方程和反向推演參數(shù)的原理,利用神經(jīng)網(wǎng)絡(luò)的逼近理論和自動微分技術(shù),PINN可以幫助人們避免許多傳統(tǒng)神經(jīng)網(wǎng)絡(luò)會遇到的問題,例如:數(shù)據(jù)量過于稀少、模型的泛化性不夠等;進(jìn)一步證明了PINN求解波動方程時,在數(shù)據(jù)量稀疏的情況下完成對波場的正向重建,以及自動反向求解波動方程的波速;最后,將其應(yīng)用到激光超聲領(lǐng)域,實(shí)現(xiàn)了對于表面波波場的正向重建和反向波速推演,并將結(jié)果與數(shù)值計算模型的數(shù)據(jù)進(jìn)行對比。研究結(jié)果表明:重建的波場數(shù)據(jù)精確度較高,與原波場數(shù)據(jù)的絕對誤差下降了至少一個數(shù)量級;在反向的過程中,PINN模型自動推演表面波波速,無需進(jìn)行人為分析,且對噪聲有著抗干擾性。