韓文花,徐俊,沈曉暉,吳正陽
(上海電力學(xué)院自動化工程學(xué)院,上海200090)
自學(xué)習(xí)粒子群與梯度下降混雜的漏磁反演方法*
韓文花,徐俊,沈曉暉,吳正陽
(上海電力學(xué)院自動化工程學(xué)院,上海200090)
利用自學(xué)習(xí)粒子群優(yōu)化算法的全局尋優(yōu)能力克服梯度下降法過分依賴初始解,易陷入局部極值的缺點,從而提高梯度下降法的優(yōu)化性能。以徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)為前向模型,基于自學(xué)習(xí)粒子群與梯度下降混雜的反演方法用于漏磁缺陷輪廓重構(gòu)中。實驗結(jié)果表明,該反演方法重構(gòu)的缺陷輪廓比較準確,且在漏磁信號存在噪聲的情況下,重構(gòu)結(jié)果到與實際輪廓相近,并具有一定的噪聲魯棒性。
漏磁檢測,反演方法,粒子群優(yōu)化,梯度下降法
漏磁檢測作為一種重要的無損檢測方法,具有對使用環(huán)境要求低、檢測速度較快、可實現(xiàn)缺陷的定量化評價以及可以發(fā)現(xiàn)一定深度的缺陷等優(yōu)點,在工程實踐中得到了廣泛的應(yīng)用[1]。漏磁檢測針對的測量對象是由鐵磁性材料制作而成的軍用裝備[2]、風(fēng)電場設(shè)備[3]、石油管道[4]等。由于處于復(fù)雜惡劣的環(huán)境中,這些設(shè)備或設(shè)施容易出現(xiàn)腐蝕、裂紋等缺陷,給正常的生產(chǎn)運行帶來巨大的安全隱患。為了避免不必要的損失和事故,需對其進行定期檢測[5]。
在漏磁檢測中,缺陷輪廓重構(gòu)是指根據(jù)由傳感器采集所得的漏磁信號求得缺陷的輪廓信息,也就是將缺陷進行定量化。缺陷輪廓重構(gòu)一般使用的是反演方法,反演方法分為兩大類:基于模型和非模型的反演方法。非模型反演方法通過信號處理技術(shù)直接建立信號與缺陷幾何形狀的關(guān)系實現(xiàn)重構(gòu),其中典型的有應(yīng)用神經(jīng)網(wǎng)絡(luò)建立函數(shù)關(guān)系,這類方法處理快速,但受限于神經(jīng)網(wǎng)絡(luò)訓(xùn)練時的缺陷尺寸范圍[6]。而基于模型的反演方法是指建立一個物理模型(即前向模型),可以將漏磁信號轉(zhuǎn)化成缺陷輪廓信息,再使用迭代方法等不斷最小化由前向模型輸出的漏磁信號與測量漏磁信號之間的差值,最終所求的解則為重構(gòu)的缺陷輪廓。梯度下降法(Gradient Descent,GD)已經(jīng)作為迭代算法應(yīng)用于漏磁反演方法中并取得了良好的重構(gòu)效果[7],但由于梯度下降法中本身的缺陷,使得其性能嚴重受限于該算法的初始解。若其初始解遠離真實缺陷輪廓,就會導(dǎo)致其收斂緩慢,甚至陷入到局部極值中。
為了解決初始解對梯度下降法性能的影響,本文將自學(xué)習(xí)粒子群優(yōu)化算法(Self-learning Particle Swarm Optimization,SLPSO)[8]引入到梯度下降法中。SLPSO為改進型PSO,包含4種速度更新模式、自學(xué)習(xí)機制和維度更新,提高了PSO的優(yōu)化性能。將SLPSO迭代優(yōu)化所得的解作為梯度下降法的初始解,以縮短其運行時間,從而提高重構(gòu)效率。
不同于許多只結(jié)合全局最優(yōu)位置(gbest)和個體最優(yōu)位置(pbest)更新粒子速度,SLPSO采用自學(xué)習(xí)機制從4種速度更新模式中選取最合適的一種,從而應(yīng)對不同的情況。SLPSO中,在每次迭代的最后部分都需要對gbest進行維度更新,進而更新了gbest的存檔位置(abest),所以粒子每個維度的有用信息都能有效利用。
1.14 種速度更新模式及自學(xué)習(xí)機制
位置pbest和gbest是最常用的兩種速度更新變量,在PSO速度更新中有著重要的作用,pbest有利于PSO進行局部搜索,而gbest有利于PSO全局收斂,所以不過分依賴兩者中的任何一個是十分有必要的。如果每次都同時使用pbest和gbest,反而可能抑制兩者的優(yōu)點。此外,適應(yīng)度函數(shù)在不同的取值范圍其變化趨勢也會不同,所以在不同情況需使用不同的變量更新粒子速度。SLPSO針對開發(fā)pbest附近區(qū)域、跳出局部極值、探索新區(qū)域和收斂于gbest附近區(qū)域等4種不同情形,引入了4種速度更新公式。
1)開發(fā)pbest附近區(qū)域:
2)跳出局部極值:
3)探索新區(qū)域
4)收斂于gbest附近區(qū)域
其中vk,d為第k個粒子第d維度上的速度;N為粒子種群大??;pbestrand,d為一隨機粒子的pbest第d維度上的位置;N(0,1)為服從標(biāo)準正態(tài)分布的隨機值;b為學(xué)習(xí)因子,o是慣性權(quán)重,γ為選擇概率允許的最小值。
為了選擇最合適的更新公式,SLPSO采用了一種自學(xué)習(xí)機制。具體而言,每一種速度更新公式都有隨迭代次數(shù)不斷變化的選擇概率,通過概率匹配方法選擇其中一種,即結(jié)合下一代適應(yīng)度、當(dāng)代成功率和前代選擇概率計算公式選擇概率,因此,由速度更新公式帶來的適應(yīng)度值變化越大,這種更新公式就更可能被選擇,從而每個粒子能夠使用有效的更新公式進行更新。
在說明選擇概率之前,需引出增進值和獎勵值。
其中Pk,i(t)為第k個粒子對第i個速度更新公式的增進值;rk,i(t)為獎勵值;f為適應(yīng)度函數(shù);α為從0到1均勻分布的隨機值;gk,i為從最后一次選擇概率更新起,第k個粒子使用第i個更新公式后成功學(xué)習(xí)的次數(shù);Gk,i為第i個速度更新公式被選擇的次數(shù);sk,i(t)則為選擇概率;ck,i為懲罰因子。
通過獎勵值,則可更新選擇概率。
其中,R為速度更新公式的個數(shù)。
通過上述公式計算得出速度更新公式的選擇概率,每個粒子都能夠在每次迭代時選擇出最佳的更新公式。此外,mk定義為第k個粒子連續(xù)未成功學(xué)習(xí)次數(shù),如果mk超過最大閾值(Uf),則4個更新公式的選擇概率都需要同時更新且mk初始化為0。
1.2 維度更新
對于大多數(shù)改進型PSO而言,如果某個粒子的更新位置要優(yōu)于gbest,那么該更新位置就會取代gbest所有維度上的值。這種方式最明顯的缺點是所有維度上的有用信息未得到充分的利用。實際上,真正所期望的信息往往只是幾個維度上的。為此,SLPSO引入了abest,如果某個粒子更新完后的位置優(yōu)于原先位置,則更新完后位置的某些維度很有可能含有有用信息,因此,abest就應(yīng)充分檢查每個維度的信息。具體而言,每一次都將更新完后位置的一個維度上的值替代abest對應(yīng)維度上的,如果組合成的新位置要優(yōu)于原先abest值,就證明了那個維度上的信息是有用信息,保留新產(chǎn)生的abest,直到所有維度都利用完畢。但這種檢查有用信息的方式是十分耗時的,所以使用學(xué)習(xí)概率(P1)判斷每個維度上的值是否需要調(diào)用abest進行有用信息檢查,SLPSO從而節(jié)約了許多計算資源,提高了運行效率。
此外,對于許多優(yōu)化問題如多峰問題,相對收斂于abest,各個粒子更應(yīng)該搜尋局部區(qū)域,這樣更有可能找到全局最優(yōu)。而4種更新公式都促進了粒子群收斂,這樣就不能保持有利收斂到abest的更新公式與其他3個的平衡,所以要控制能夠調(diào)用最后一個更新公式的粒子個數(shù)。SLPSO在每次迭代都更新能夠調(diào)用第4種更新公式的粒子數(shù),獎勵值、成功率和選擇概率也同時更新。圖1為SLPSO算法的流程圖。
圖1 SLPSO的流程圖
基于SLPSO和GD的漏磁反演方法,以徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(Radial Basis Function Neural Network,RBFNN)作為前向模型,將指定缺陷輪廓轉(zhuǎn)化成漏磁信號,SLPSO提供反演迭代開始之前的初始解,也就是GD的起始解,預(yù)測解在GD迭代的過程不斷地接近實際缺陷輪廓,直到達到最大迭代次數(shù)或者預(yù)測解經(jīng)過前向模型的輸出漏磁信號與實際漏磁信號的差值達到要求,其流程圖如圖2所示。
圖2 基于SLPSO和GD的漏磁重構(gòu)反演方法流程圖
使用該反演方法之前,先訓(xùn)練RBFNN。使用前向模型估計的漏磁信號與實際漏磁信號的誤差平方和作為兩者差異的評估標(biāo)準,同時該函數(shù)也作為SLPSO的適應(yīng)度函數(shù)。
其中,M為漏磁缺陷的維度,也就是采樣點數(shù);P=[p1p2…pM]為實際漏磁信號,即由傳感器采集到的信號;Y=[y1y2…yM]為RBFNN前向模型估計的漏磁信號。
在該反演方法中,使用梯度下降法更新預(yù)測的缺陷輪廓,最小化式(9)的函數(shù)值,每次迭代解的更新公式如式(10)所示。
其中,X(t)為GD第t次迭代的解,其維度與缺陷輪廓采樣點等同,即X(t)=[x1(t),x2(t),…,xN(t)];η為學(xué)習(xí)速率,決定了GD的收斂速度;當(dāng)GD達到最大迭代次數(shù)或者GD解的函數(shù)值F低于預(yù)設(shè)的閾值時迭代結(jié)束。
由于所用前向模型為RBFNN,且RBFNN的徑向基函數(shù)使用的是高斯函數(shù),如式(11)所示,所以可由式(12)得出F的偏導(dǎo)。
其中,H為使用的高斯函數(shù)個數(shù);ω為與每個基函數(shù)相關(guān)的權(quán)值;c為高斯函數(shù)的中心。
為了驗證基于SLPSO與GD混雜的漏磁反演方法的有效性,使用了240個缺陷輪廓-漏磁信號樣本對。其中210個用于訓(xùn)練RBFNN,其余30個用來驗證反演效果。這些缺陷都是矩形的二維缺陷,其深從0.15 in到0.85 in,寬從1 in到7 in。RBFNN的輸入層節(jié)點個數(shù)等同于缺陷輪廓的采樣點數(shù),輸出層節(jié)點個數(shù)等同于漏磁信號的采樣點數(shù),均為100個。本文分別采用不含噪聲和含5%均勻噪聲的漏磁信號進行漏磁反演,這樣既可以驗證該反演方法的重構(gòu)能力,又能夠判斷其對噪聲的魯棒性。
圖3給出了深0.7 in、寬2.2 in的缺陷輪廓重構(gòu)結(jié)果,其中實線為實際輪廓,虛線為不含噪聲的漏磁信號重構(gòu)的輪廓,點劃線為含5%噪聲的漏磁信號重構(gòu)出的輪廓,從圖上可以看出,含噪聲的信號重構(gòu)出的輪廓與實際輪廓相近,精度與不含噪聲的輪廓相差不大。見圖4~圖6。與圖3類似,不含噪聲的漏磁信號重構(gòu)的輪廓更接近實際輪廓,比含噪聲的信號重構(gòu)的輪廓更加準確,這是因為漏磁信號中的噪聲對該反演方法的影響,但含噪聲的漏磁信號重構(gòu)的輪廓總體上比較接近實際輪廓,因此,可表明基于SLPSO與GD混雜的漏磁反演方法對噪聲具有一定的魯棒性。
為了解決梯度下降法對初始解的依賴性、易陷入局部極值等缺點,本文引入自學(xué)習(xí)粒子群優(yōu)化算法,通過該方法的優(yōu)化為梯度下降法提供一個與最優(yōu)解相近的初始解,從而提高了梯度下降法的優(yōu)化效率和性能。此外,本文將這種基于自學(xué)習(xí)粒子群與梯度下降混雜的反演方法用于漏磁缺陷重構(gòu)中,成功地實現(xiàn)了缺陷輪廓的重構(gòu),且具有一定的噪聲魯棒性。
圖3 深0.7 in、寬2.2 in的缺陷重構(gòu)輪廓
圖4 深0.8 in、寬3.0 in的缺陷重構(gòu)輪廓
圖6 深0.85 in、寬6.6 in的缺陷重構(gòu)輪廓
[1]張衛(wèi)民,楊旭,王玨,等.基于霍爾元件陣列的缺陷漏磁檢測技術(shù)研究[J].北京理工大學(xué)學(xué)報,2011,31(6):647-651.
[2]雷良金,王長龍,孫世宇,等.基于蟻群算法的徑向基網(wǎng)絡(luò)漏磁信號二維反演[J].火力與指揮控制,2011,36(3):163-165.
[3]丁松,田貴云,王平.風(fēng)力發(fā)電設(shè)備無損檢測技術(shù)研究[J].無損檢測,2011(11):37-41.
[4]Ireland R C,Torres C R.Finite Element Modelling of a Circumferential Magnetizer[J].Sensors and Actuators,A: Physical,2006,129(1-2):197-202.
[5]Priewald R H,Magele C,Ledger P D,et al.Fast Magnetic Flux Leakage Signal Inversion for the Reconstruction of Arbitrary Defect Profiles in Steel Using Finite Elements[J]. IEEE Transactions on magnetics,2013,49(1):506-516.
[6]Maryam R,Reza K A,Slawomir K,et al.Sizing of 3-D Arbitrary Defects Using Magnetic Flux Leakage Measurements[J].IEEETransactionsonmagnetics,2010,46(4): 1024-1033.
[7]Pradeep R,Lalita U,Satish S U.Electromagnetic NDE Signal Inversion by Function-Approximation Neural Networks[J]. IEEE Transactions on Magnetics,2002,38(6):3633-3642.
[8]Li C H,Yang S X,Nguyen T T.A Self-Learning Particle Swarm Optimizer for Global Optimization Problems[J]. IEEE Transactions on Systems,man,and Cybernetics—part B:Cybernetics,2012,42(3):627-646.
Hybrid of Self-learning Particle Swarm Optimization and Gradient Descent Based Magnetic Flux Leakage Inversion
HAN Wen-hua,XU Jun,SHEN Xiao-hui,WU Zheng-yang
(College of Automation Engineering,Shanghai University of Electric Power,Shanghai 200090,China)
Byusingtheglobaloptimizationabilityofself-learningPSO,overcomethe disadvantages of gradient descent method unduly relying on initial solution and easy falling into local minimum,thereby the optimizing performance is enhanced.Radial basis function neural network is used as forward model,and the inversing approach based on the hybrid of self-learning PSO and gradient descent is applied to reconstruction of defect profile on magnetic flux leakage.The experiment results show the profiles reconstructed by the proposed approach are relatively accurate and still close to the true profile with existence of noise in magnetic flux leakage signal.So the proposed approach is partly robust to noise.
magnetic flux leakage inspection,inversion approach,particle swarm optimization,gradient descent
TP73
A
1002-0640(2015)01-0088-04
2013-11-10
:2014-02-23
國家自然科學(xué)基金資助項目(51107080)
韓文花(1976-),女,山東日照人,副教授。研究方向:無損檢測,智能優(yōu)化算法,信號處理等。