陳曉冬
(江蘇省特種設備安全監(jiān)督檢驗研究院(揚州分院) 揚州 225000)
燃氣已成為現(xiàn)代社會中供應城市居民生活以及工業(yè)生產(chǎn)的重要能源,是城市建設的重要組成部分。城市居民生活用氣主要通過管道運輸、液化天然氣儲運2種方式輸送到用戶所在位置。城市燃氣管道大多埋于地下,且網(wǎng)點多、鋪設線路長、覆蓋面廣,具有復雜性和不可見性,且管內(nèi)輸送的燃氣具有易燃易爆、擴散速度快等特點,一旦管道出現(xiàn)破損極易發(fā)生爆炸、泄漏等重大安全事故,對企業(yè)和社會造成惡劣影響。因此對燃氣管道剩余壽命做出準確預測,保證燃氣管道在使用期的可靠性和穩(wěn)定性,是各大燃氣企業(yè)現(xiàn)階段的首要目標。深度學習是機器學習中一種基于對數(shù)據(jù)進行表征學習的算法,通過逐層挖掘數(shù)據(jù)中的深層特征,使機器能夠像人一樣具有分析學習能力。由于其不依賴專家經(jīng)驗、區(qū)域化分層學習、多元非線性擬合等特點,能夠很好地滿足企業(yè)在過程優(yōu)化、故障診斷、安全預警和大數(shù)據(jù)分析等方面的智能化需求,助力燃氣企業(yè)實現(xiàn)數(shù)字化轉(zhuǎn)型,走向智能高效的發(fā)展道路。
21世紀以來,歐美國家針對管線安全運行和經(jīng)濟效益2個重要因素,依靠不斷進步的科學技術,提出了建立綜合治理體系的概念,并不斷在工程化、智能化、模式化方向深入發(fā)展。在城市燃氣管道剩余壽命預測方向,我國的有關研究起步相對比較晚,在研究初期主要是針對燃氣管道緩蝕劑和涂料開展研究。隨著全球范圍內(nèi)的相關學者、從業(yè)人員對燃氣管道剩余壽命及完整性的深入研究,國內(nèi)的科研人員也開展了大量研究,不過我國對城市燃氣管道剩余壽命預測仍然處于探索的初級階段。
梁成浩等[1]通過概率統(tǒng)計的方法建立了材料腐蝕壽命預測系統(tǒng),分析推算腐蝕管道的剩余壽命。余建星等[2]統(tǒng)計了多起海底管道事故原因,采用ANSYS有限元軟件分析多種參數(shù)對海底管道疲勞壽命的影響作用,并得出了管道失效的主要原因。李增杰等[3]提出一種結(jié)合統(tǒng)計模型的BP神經(jīng)網(wǎng)絡,通過用統(tǒng)計模型修正BP神經(jīng)網(wǎng)絡的誤差,實現(xiàn)對城市燃氣管道剩余壽命的預測。劉穎等[4]提出了一種基于WS-LSTM算法的海底管道剩余壽命預測方法,結(jié)合小波變換和LSTM網(wǎng)絡提高了模型的魯棒性和泛化能力。
綜上所述,國內(nèi)外學者對管道剩余壽命預測方法基本大多建立在數(shù)學模型的基礎上,部分還依賴專家的經(jīng)驗和評估,且得到的精確度較低,而利用深度學習算法預測管道剩余壽命還處于萌芽階段。本文嘗試將深度學習算法應用在城市管道剩余壽命的預測上,提出了一種基于PSO-SAE算法的城市燃氣管道剩余壽命預測方法。
粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)是一種通過模擬鳥類群體搜索食物的行為的進化算法,其基本思想在于通過群體中個體之間的協(xié)作和信息共享來尋找最優(yōu)解[5]。粒子群優(yōu)化算法是一種高效的并行搜索算法,同時保留了基于種群的全局搜索策略,操作模型比較簡單,避免了復雜的遺傳操作,并且保留了每個粒子的個體歷史極值。PSO算法流程如圖1所示。
圖1 粒子群優(yōu)化算法流程
PSO優(yōu)化過程可以描述為:首先初始化一個隨機粒子群即該問題的一組隨機解。然后通過重復迭代找到最優(yōu)解。在每一輪的進化求解迭代中,粒子算法通過關注2個極限粒子即全局最優(yōu)粒子和個體最優(yōu)粒子(pbest,gbest)來更新整個種群的全局狀態(tài)。在找到這2個極限粒子后,通過式(1)和式(2)來更新個體的速度和位置以達到全局最優(yōu)解:
式中:
vi—— 粒子個體的速度;
xi—— 粒子個體當前位置;
rand() —— 一個介于0和1之間的隨機數(shù);
c1,c2—— 學習因子,通常c1=c2=2;
ω —— 一個非負常數(shù),是搜索函數(shù)的慣性因子,當ω較大時,模型具有較強的全局求解能力,而局部求解能力較弱;當ω較小時,優(yōu)化算法的全局求解能力較弱,局部求解能力較強。
動態(tài)變化ω能獲得比固定ω更好的尋優(yōu)求解結(jié)果。動態(tài)變化ω在PSO迭代的過程中線性改變大小,也可以通過PSO優(yōu)化算法的某個測度函數(shù)自適應改變大小。現(xiàn)階段一種較為普遍的動態(tài)變化策略是線性遞減權(quán)值(Linearly Decreasing Weight,LDW)策略,可表示為式(3):
式中:
Gk——最大迭代次數(shù);
ωini——初始慣性權(quán)值;
ωend——迭代到最大次數(shù)時的慣性權(quán)值。
一組比較常用的權(quán)值是:ωini=0.9,ωend=0.4。
引入慣性因子ω,極大地提高了PSO算法的尋優(yōu)能力,針對不同的最優(yōu)解求解問題,可以自適應地調(diào)整局部和全局求解能力,使得PSO算法有效地應用于實際求解問題。
稀疏自編碼網(wǎng)絡(Sparse Autoencoder,SAE)是一種無監(jiān)督的機器學習算法,通過編碼器和解碼器,得到輸入樣本數(shù)據(jù)的隱藏低維特征。同時克服低維特征中具有冗余特征的不足,對隱藏層節(jié)點增加稀疏性約束來限定不是所有的神經(jīng)元任何時刻都是處于激活狀態(tài)。網(wǎng)絡原理如圖2所示。
圖2 稀疏自編碼網(wǎng)絡結(jié)構(gòu)
其編碼和解碼過程分別用式(4)和式(5)表示:
式中:
σ ——映射函數(shù);
x ——輸入數(shù)據(jù);
h ——編碼器輸出的隱藏層特征;
z ——解碼器輸出的重構(gòu)特征;
W,b ——編碼器的權(quán)重和偏置;
W ',b'——解碼器的權(quán)重和偏置。
將KL散度作為正則項加入網(wǎng)絡的損失函數(shù)中,以此對網(wǎng)絡加以稀疏性約束,見式(6)~式(9):
式中:
Jsparse(W,b),J(W,b)——稀疏化前后的懲罰函數(shù);
hW,b(x(i))——訓練中的權(quán)重暫存系數(shù);
s——隱藏層中隱藏神經(jīng)元的數(shù)量;
nl——第l層隱藏層的輸入;
λ——正則化系數(shù);
i ——每層的節(jié)點;
索引j——依次代表隱藏層中的每一個神經(jīng)元;
x(i)和y(i)——神經(jīng)元的輸入及輸出;
β——控制稀疏性懲罰因子的權(quán)重;
aj(2)(x) ——在輸入數(shù)據(jù)x,樣本數(shù)為m的情況下,隱藏神經(jīng)元j的激活度。
為了保證平均激活度維持在一個比較低的水平,引入超參數(shù)稀疏ρ,稀疏率通常是一個比較小的常數(shù),使神經(jīng)元激活度以此來降低隱含層神經(jīng)元的活躍度。把相對熵加入目標函數(shù)中,懲罰平均激活度和稀疏率相差較大的權(quán)重,保證最后訓練得出的權(quán)重矩陣能夠讓隱藏層神經(jīng)元的平均激活度維持ρ這個水平。
稀疏自編碼網(wǎng)絡的訓練結(jié)果一定程度上取決于網(wǎng)絡超參數(shù)的設置,不恰當?shù)某瑓?shù)會導致網(wǎng)絡陷入局部最優(yōu)解或是進入過擬合狀態(tài),使得網(wǎng)絡提取不恰當?shù)牡途S特征表達,影響預測結(jié)果。針對這一問題本文提出利用粒子群優(yōu)化算法,在網(wǎng)絡訓練過程中利用粒子群優(yōu)化算法對SAE網(wǎng)絡中的學習率、稀疏率等構(gòu)成等高維超參數(shù)空間進行最優(yōu)求解,動態(tài)更新當前最優(yōu)超參數(shù)集,自適應地調(diào)整網(wǎng)絡超參數(shù)來改進SAE算法。該算法流程如圖3所示。
圖3 PSO-SAE算法流程
首先初始化SAE網(wǎng)絡的權(quán)重和閾值,計算此時的準確率。以此時的準確率作為PSO的適應度值,并根據(jù)該適應度更新SAE網(wǎng)絡的超參數(shù)。以PSO尋優(yōu)得出的超參數(shù)訓練SAE網(wǎng)絡更新網(wǎng)絡權(quán)重和閾值。重復以上兩步直至網(wǎng)絡收斂。
為驗證本文提出算法的可行性,首先選擇與燃氣管道腐蝕密切相關的影響因素作為輸入特征,具體特征為濕度、溫度、含鹽量、電阻率、壓力。通過PSO-SAE網(wǎng)絡提取輸入數(shù)據(jù)的隱藏特征,利用softmax層建立前置網(wǎng)絡提取的隱藏特征和管道剩余壽命之間的映射關系,使網(wǎng)絡最終輸出管道剩余壽命的預測結(jié)果,將燃氣管道壽命預測值與真實值之間的均方誤差作為評價指標。
考慮城市燃氣管道所屬環(huán)境復雜,管道長時間受土壤理化特性影響,因此本文對輸入的數(shù)據(jù)首先進行歸一化處理以消除單位量綱以及尺度之間的差異對網(wǎng)絡造成的影響。將總計1 000個數(shù)據(jù)樣本按4:1的比例劃分為訓練集和測試集,設置初始學習率為0.001,稀疏率為0.5,對比固定超參數(shù)的普通SAE算法和自適應更新超參數(shù)的PSO-SAE算法的預測能力。普通SAE算法的訓練損失和預測準確率如圖4、圖5所示。
從圖4、圖5中可以看出,固定超參數(shù)的普通SAE算法無法很好地克服求解參數(shù)多、收斂速度慢、收斂后震蕩明顯、易過擬合等不足。本文構(gòu)建的SAE模型的預測結(jié)果誤差較大,且測試集準確率相比于訓練集準確率也有明顯的降低,說明SAE算法泛化能力不強,無法準確預測城市燃氣管道剩余壽命,容易導致企業(yè)對管道運行狀況做出錯誤的預估,進而導致嚴重的安全事故,造成人員傷亡和經(jīng)濟損失,對企業(yè)和社會帶來不可估量的損失。因此普通的SAE算法無法滿足企業(yè)對城市燃氣管道壽命預測的要求。
圖4 普通SAE算法訓練損失
圖5 普通SAE算法預測結(jié)果
相比于普通的SAE算法,本文所提出的PSOSAE算法則很好地克服了這些問題。PSO-SAE算法訓練損失和預測結(jié)果如圖6、圖7所示。
圖6 PSO-SAE算法訓練損失
圖7 PSO-SAE算法預測結(jié)果
從圖6、圖7中不難看出,PSO-SAE算法損失函數(shù)的收斂速度更快,在5 000輪訓練后就實現(xiàn)收斂,且收斂后震蕩不明顯更加穩(wěn)定。隨著損失函數(shù)的收斂,模型預測的準確率也穩(wěn)定在更高水平,訓練集準確率達到93.92%,測試集準確率達到92.16%,且二者差距不大。這充分說明PSO-SAE算法有較強的泛化能力,對企業(yè)目前已收集到的城市燃氣管道特征數(shù)據(jù)進行充分學習后對該特征下的管道壽命有很強的預測能力,而且對企業(yè)未采集的陌生數(shù)據(jù)同樣也具備準確預測能力,可以實現(xiàn)管理現(xiàn)有燃氣管道的同時,在土壤環(huán)境發(fā)生變化、新管道鋪設等場景下快速支撐燃氣企業(yè)安全維護工作。
為了進一步驗證PSO-SEA算法的有效性,本文通過橫向?qū)Ρ鹊姆椒?將PSO-SAE算法與目前較為常見的人工智能算法對城市燃氣管道壽命預測能力進行比較。通過對相同數(shù)據(jù)集充分學習后,各個算法預測準確率結(jié)果如圖8所示。
圖8 不同算法預測結(jié)果對比
從結(jié)果中不難看出,本文提出的PSO-SAE算法在各種智能算法中具有最準確的預測能力,同時該算法采用輕量化的網(wǎng)絡結(jié)構(gòu),通過較少的算力就可以實現(xiàn)對燃氣管道壽命的高精度預測,且訓練效率高、訓練速度快。成本低、見效快,可以在燃氣企業(yè)的安全管控項目中快速落地,長效化監(jiān)測燃氣管道安全情況。
以上實驗充分說明該算法可以精確預測城市燃氣管道壽命,解決了企業(yè)風險評估方法缺乏、檢驗檢測技術單一及風險防控技術不足等問題,賦能企業(yè)安全生產(chǎn)、風險防控,推動企業(yè)數(shù)字化、智能化轉(zhuǎn)型進入新臺階。
本文提出了一種基于PSO-SAE算法的城市燃氣管道剩余壽命預測辦法,該算法通過PSO優(yōu)化算法自適應地調(diào)整SAE網(wǎng)絡中的超參數(shù)很好地解決了普通SAE網(wǎng)絡自身泛化能力弱、容易陷入過擬合的不足。通過實驗數(shù)據(jù)對其進行測試和對照分析,實驗結(jié)果充分表明該算法學習能力強、訓練效率高、泛化能力強、預測結(jié)果準確。同時相比于傳統(tǒng)方法,該算法不依賴專家經(jīng)驗、成本低,對于燃氣企業(yè)的安全生產(chǎn)、管理具有積極的參考意義。