雷錚強,王維斌,李立軍
(1.國家石油天然氣管網(wǎng)集團有限公司 科學技術(shù)研究總院分公司,廊坊 065099;2.河北省特種設備監(jiān)督檢驗研究院廊坊分院,廊坊 065001)
射線檢測底片的缺陷影像識別和復評是判斷管道環(huán)焊縫質(zhì)量的重要依據(jù)之一,為有效管控大口徑高壓力高強鋼管道環(huán)焊縫失效的問題,國內(nèi)管道企業(yè)進行了在役油氣管道環(huán)焊縫射線檢測底片復核和超標缺陷排查工作[1-2]。由于底片復評工作量大且非常依賴評片人員的專業(yè)經(jīng)驗,嚴重缺陷的排查效率較低。中俄東線作為首條全數(shù)字化移交的大口徑輸氣管道,在環(huán)焊縫檢測方面,全線采用了膠片射線檢測(RT)底片數(shù)字化技術(shù)、數(shù)字射線成像技術(shù)(DR)、全自動超聲檢測技術(shù)(AUT)等數(shù)字化無損檢測技術(shù),為智能評片技術(shù)積累了高質(zhì)量的缺陷特征樣本數(shù)據(jù)。
筆者基于射線檢測底片圖像和人工評級結(jié)果,采用深度學習等算法對未熔合等主要缺陷圖像特征的智能識別分析技術(shù)進行研究,并對數(shù)字化無損檢測技術(shù)在智能化方向的應用前景進行了展望。
按照標準GB 50369—2014 《油氣長輸管道工程施工及驗收規(guī)范》的要求,中俄東線北段管道采用了100%的AUT檢測,同時對20%的焊口進行RT復驗,并對RT檢測的部分含缺陷焊口進行了DR檢測效果驗證,用于DR設備校正、相關標準體系的研究完善等[3]。按照相關標準要求,DR成像灰度等級應不低于12位,像素尺寸應不大于200 μm,缺陷評定標準與RT缺陷評級標準一致。RT和DR的數(shù)字化射線檢測圖像均參照標準ASTM E 2339—2008《無損檢測的數(shù)字圖像和傳輸標準實施規(guī)程》的要求,數(shù)字底片圖像以Dicom(醫(yī)學數(shù)字成像和通信)格式存儲。
對中俄東線北段管道的RT檢測底片數(shù)字化圖像進行了質(zhì)量分析。各檢測單位使用了3家不同品牌的底片數(shù)字化設備,通過抽查統(tǒng)計分析了數(shù)字化掃描底片中像質(zhì)計的最小可見絲號及缺陷圖像清晰度關聯(lián)情況。RT數(shù)字化底片最小可見絲號與缺陷圖像清晰度關系如圖1所示,筆者隨機抽取了83張使用不同型號設備進行數(shù)字化的缺陷底片,發(fā)現(xiàn)原物理底片上的缺陷,經(jīng)數(shù)字化后其缺陷可見、不清晰和不可見的分別有27,26和30張,相應的數(shù)字化底片最小可見像質(zhì)計絲號平均值分別為10.2,9.9和9.2號。參照高速列車焊縫射線檢測智能評定系統(tǒng)[4]及GB/T 26141.2—2010《無損檢測射線照相底片數(shù)字化系統(tǒng)的質(zhì)量鑒定 第二部分:最低要求》等標準要求,數(shù)字化后的底片可見像質(zhì)計絲號應與原物理底片一致,并且數(shù)字化等級應達到DB級以上。因此,在底片數(shù)據(jù)清洗及選擇缺陷特征樣本數(shù)據(jù)時,選擇缺陷清晰可見的底片圖像,能提升智能識別算法的精度。
圖1 RT數(shù)字化底片最小可見絲號與缺陷圖像清晰度關系
對于缺陷清晰的底片圖像,通常也具有以下特點:①底片圖像間存在較大的亮度差異、單張圖像背景起伏較大;②底片中缺陷圖像與背景的灰度對比度很低;③由于X光散射現(xiàn)象,底片圖像中存在較大的隨機噪聲;④各類缺陷具有位置隨機、形態(tài)各異、尺寸跨度較大等特點。這些問題都會對缺陷的圖像檢測產(chǎn)生較大的干擾,從而造成誤檢和漏檢。因此,在對射線檢測底片圖像進行智能識別算法開發(fā)時,需要在圖像處理、目標檢測算法開發(fā)調(diào)試等方面提高檢測算法的適應性。
射線檢測缺陷智能識別分析及軟件開發(fā)框圖如圖2所示,射線檢測圖像智能識別技術(shù)結(jié)合底片圖像特點和深度學習等人工智能技術(shù),其開發(fā)的主要內(nèi)容包括RT檢測數(shù)據(jù)管理、圖像數(shù)據(jù)批量處理、缺陷樣本收集和標注、建立缺陷智能識別算法模型、輔助評片、結(jié)果數(shù)據(jù)查閱分析以及對應的軟件功能模塊開發(fā)。通過對流程和軟件進行技術(shù)研發(fā),目前筆者單位已經(jīng)初步具備射線檢測底片圖像智能識別分析的能力,實現(xiàn)了未熔合等主要缺陷的自動檢測,提升了環(huán)焊縫線性危害缺陷排查的智能化水平和效率。
圖2 射線檢測缺陷智能識別分析及軟件開發(fā)框圖
對于中俄東線不同標段和不同批次的X射線檢測底片圖像,筆者進行了統(tǒng)一批量處理,以滿足樣本標注和缺陷智能識別分析的基本格式要求。射線檢測底片圖像處理的主要算法流程如圖3所示,具體包括以下幾個算法。
圖3 射線檢測底片圖像處理的主要算法流程
(1) 歸一化處理。由于射線檢測底片圖像采集所使用的掃描儀規(guī)格不同,其具有多種通道數(shù)和位數(shù),且圖像長寬方向不一。通過歸一化處理,可獲得精度和尺寸一致的圖像數(shù)據(jù)。
(2) 去白邊處理。X射線檢測底片數(shù)字化掃描過程中,在圖像采集的起始和末尾時可能產(chǎn)生無有效底片圖像的白邊區(qū)域。去除白邊區(qū)域可去除對智能識別結(jié)果的影響。
(3) 自適應裁剪。中俄東線單張底片圖像寬度約為900像素,高度為8 000~20 000像素。為解決缺陷尺寸相對于整幅底片圖像占比很小導致的檢出率較低及不同底片圖像尺寸不一等問題,設計和研發(fā)了一種自適應裁剪工具,以提高缺陷在圖像中的相對占比,同時確保圖像尺度在較小的范圍內(nèi)波動。經(jīng)試驗分析和評估,設定裁剪后單張底片圖像的尺寸為2 000像素×1 000像素。
(4) 樣本隨機劃分。在深度學習算法中,通常將原始數(shù)據(jù)集劃分為訓練集、驗證集和測試集3個部分,劃分時需要盡可能保持數(shù)據(jù)分布的一致性。其中訓練集用于學習模型參數(shù),驗證集用于挑選超參數(shù),測試集用于判定訓練出模型是否達標。
4.維持平衡計分卡的長期效益。為了適應企業(yè)宏觀環(huán)境、行業(yè)環(huán)境和自身條件的變化,平衡計分卡的評價指數(shù)也要與時俱進。因此,虎豹集團需要根據(jù)企業(yè)自身內(nèi)部和外部環(huán)境的變化,對平衡計分卡的評估指數(shù)進行企業(yè)戰(zhàn)略目標校驗,確保平衡計分卡設計框架的長久運行。在企業(yè)信息化建設的基礎上,隨時報告并總結(jié)平衡計分卡的評價效果,收集和分析平衡計分卡的戰(zhàn)略指標數(shù)據(jù),建立平衡計分卡報告評價體系。同時,要建立平衡計分卡的定期維護團隊,對考核結(jié)果及運行現(xiàn)狀進行自我檢查,從而形成長期有效的平衡計分卡創(chuàng)新績效管理體系。
在缺陷樣本的標注及閱覽缺陷細節(jié)特征等過程中,需要反復對缺陷的X射線檢測圖像進行調(diào)整,通過調(diào)整圖像亮度、缺陷的對比度和辨識度等,達到增強缺陷圖像顯示的效果。針對該技術(shù)需求,筆者開發(fā)了智能灰階工具和窗技術(shù),智能灰階和窗技術(shù)的處理效果如圖4所示。
圖4 智能灰階和窗技術(shù)的處理效果
(1) 智能灰階工具。在醫(yī)學影像學領域,可以使用自適應直方圖均衡方法,計算圖像中多個局部區(qū)域的直方圖,之后通過重新分布亮度來改變圖像的對比度,該方法對于明暗區(qū)域?qū)Ρ让黠@的X射線檢測圖像有較好的圖像增強顯示效果。但是管道環(huán)焊縫的X射線底片圖像明暗區(qū)域?qū)Ρ炔⒉幻黠@,像素值分布比較均勻,采用與醫(yī)學X射線圖像相同的處理方法時,會出現(xiàn)過度放大圖像中均勻區(qū)域噪聲的現(xiàn)象。限制對比度自適應直方圖均衡方法(智能灰階)可將輸入的影像按照像素點分成塊區(qū)域,再對每一個區(qū)域進行自適應直方圖均衡處理,可有效減少噪點,保存缺陷影像的細節(jié)特征。
(2) 窗技術(shù)。在醫(yī)學影像學領域,窗技術(shù)是觀察不同密度正常組織或病變組織的一種顯示技術(shù),包括窗寬和窗位。提高窗位則圖像變黑;降低窗位則圖像變白。增大窗寬,則圖像層次增多且對比度下降;縮小窗寬,則圖像層次減少,組織間對比度增加。引入窗技術(shù),評片人員可通過調(diào)節(jié)窗寬和窗位來改變X射線底片圖像黑白及不同區(qū)域間的對比度,以便于觀察各類形態(tài)不同的缺陷,達到輔助評片的目的。
基于深度學習的主流目標檢測算法根據(jù)有無候選框生成階段分為雙階段目標檢測算法和單階段目標檢測算法兩類。雙階段目標檢測算法(如Faster R-CNN算法)先在圖像中提取候選區(qū)域,然后基于候選區(qū)域做二次修正得到檢測結(jié)果,其檢測精度較高,但檢測速度較慢;單階段目標檢測算法(如YOLO算法)直接對圖像進行計算,生成檢測結(jié)果,檢測速度快,但檢測精度相對較低。
筆者同時采用了這兩類目標檢測算法并基于不同缺陷數(shù)據(jù)集進行了設計和調(diào)優(yōu),最終確定對于環(huán)焊縫區(qū)域和圓形缺陷的采用Faster R-CNN算法,未熔合和條形缺陷采用YOLO算法。
(1) 環(huán)焊縫區(qū)域檢測。焊縫樣本集具有以下特點:① 焊縫圖像尺寸變化范圍較??;② 裁剪后的焊縫樣本集高度為2 000像素,寬度為100~600像素;③ 高寬比為3.3~20的焊縫圖像占比較大。
(2) 圓形缺陷檢測。圓形缺陷圖像樣本集具有以下特點:① 缺陷高度為13~644像素,寬度為15~213像素;② 缺陷高寬比為0.25~10.3,跨度較大。圓形缺陷樣本圖像的面積分布如下:① 面積小于322像素的占11%;② 面積介于322像素和962像素之間的占84%;③ 面積大于962像素的占5.46%?;谝陨咸攸c,筆者設計了不同的網(wǎng)絡結(jié)構(gòu)、數(shù)據(jù)增強方法、預訓練模型、參數(shù)設置、loss函數(shù)以及nms算法,開展了12組消融試驗,并選擇以Faster R-CNN作為圓形缺陷的目標檢測方法,主干網(wǎng)絡采用ResNet101,同時考慮到缺陷尺寸變化較大,引入特征金字塔結(jié)構(gòu)(FPN)來對主干網(wǎng)絡進行改造。
(3) 未熔合和條形缺陷檢測。未熔合為斷續(xù)的細直黑線,長寬比變化非常劇烈。條形缺陷的形狀特征不規(guī)則,通常將長寬比大于3的缺陷判斷為條形缺陷。由于YOLO算法有卷積層池化作用,圖像會不斷地進行壓縮。然而大部分缺陷屬于小尺寸目標,默認的候選邊界框?qū)π〕叽缒繕舜嬖跈z測不準確的問題。筆者通過K-meas聚類分析得到合適的anchor box尺寸,并設計了8組消融試驗,最終確定了超參設置和檢測模型。
筆者采用查準率和查全率對缺陷特征的智能識別檢測結(jié)果進行評估。查準率和查全率通常借助混淆矩陣進行得分統(tǒng)計,混淆矩陣包括4個子定義:① 真正例(TP),實際為正例,預測為正例;② 真反例(TN),實際為負例,預測為負例;③ 假正例(FP),實際為負例,預測為正例;④ 假反例(FN),實際為正例,預測為負例。
查準率Pr是指在所有預測為正例中真正例的比例,即預測的準確性;查全率R是指在所有正例中被正確預測的比例,即預測正確的覆蓋率。
交并比(IoU)衡量的是兩個區(qū)域的重疊程度,是兩個區(qū)域重疊部分面積占二者總面積的比例。交并比計算方式如圖5所示,兩個矩形框的交并比是紅色交叉面積與紅色合并面積比值。交并比為0.5,并不意味著每個框剛好有50%與另外一個框面積重疊,而是每個框大約有2/3的面積重疊。
圖5 交并比計算方式示意
經(jīng)過數(shù)據(jù)清洗和預處理,以3 000余張原始的X射線檢測底片圖像作為樣本數(shù)據(jù),進行缺陷智能識別算法的開發(fā)和調(diào)試。由于缺陷僅存在于X射線底片圖像中的焊縫區(qū)域,筆者首先檢測焊縫并提取其為感興趣區(qū)域(ROI),然后對ROI執(zhí)行未熔合等缺陷的識別和檢測算法。由于焊縫檢測采用深度學習目標檢測方法,需對大量圖像進行焊縫標注,以得到用于訓練焊縫檢測模型的樣本集。環(huán)焊縫及主要缺陷特征樣本的智能識別結(jié)果如表1所示。
表1 環(huán)焊縫及主要缺陷特征樣本智能識別結(jié)果
3.2.1 環(huán)焊縫檢測效果及分析
采用Faster R-CNN最優(yōu)焊縫模型對1 464張測試樣本進行檢出效果測試,設置IoU閾值為0.5及置信度閾值為0.8情況下,焊縫圖像的查準率和查全率均達到了99.9%。即該算法能實現(xiàn)焊縫區(qū)域的準確檢出,同時具有很低的誤檢率。焊縫圖像的智能識別效果如圖6所示,可見,焊縫智能識別模型能夠適應圖像亮度、對比度及圖像邊緣過渡區(qū)域變化,檢測結(jié)果穩(wěn)定且滿足缺陷檢測的要求。
圖6 焊縫圖像的智能識別效果示例(上:焊縫標注區(qū)域;下:焊縫智能識別區(qū)域)
3.2.2 圓形、條形及未熔合缺陷的檢測效果及分析
根據(jù)中俄東線X射線檢測的實際缺陷數(shù)量分布情況,確定圓形缺陷、未熔合及條形缺陷是最主要的3種焊接缺陷類型,基于這3種缺陷的圖像樣本數(shù)據(jù),進行了智能識別算法開發(fā)和調(diào)試其缺陷圖像的人工標注和智能識別效果對比如圖7所示。
圖7 圓形、條形及未熔合缺陷圖像的人工標注和智能識別效果對比示例
(1) 圓形缺陷的智能識別。設置IoU閾值為0.5及置信度閾值設為0.8情況下,焊縫圖像的查準率和查全率分別為86.9%和97.8%。對不同尺寸圓形缺陷,其智能識別效果有所差異,對于面積小于322像素的圓形缺陷,缺陷圖像的形態(tài)變化很小且對比度較明顯,樣本標注較為精確;圓形缺陷面積為322~962像素時(樣本中該尺寸缺陷占比極大),其主要由單個缺陷、小范圍聚集狀缺陷及小區(qū)域的微弱缺陷組成,缺陷形態(tài)跨度較大,檢測指標降低;圓形缺陷面積大于962像素時,該類缺陷主要是聚集狀缺陷,由于標注為一個整體時會包含大量的背景區(qū)域,實際模型檢測時可能將缺陷逐個檢出,而非整體檢出,計算得到的交并比降低至閾值以下,最終導致對標注為大缺陷的圓形缺陷的查準率和查全率指標偏低。此外,面積大于962像素的圓形缺陷訓練樣本比例較低,可能是導致指標值降低的另一方面原因。
(2) 未熔合及條形缺陷的智能識別。與圓形缺陷不同,未熔合及條形缺陷圖像的形態(tài)相似性更大,為提高這兩類缺陷的識別分類準確性,采用同一個YOLO深度學習算法進行智能識別模型的開發(fā)和調(diào)試。該做法引入了一種競爭機制,將未熔合和條形缺陷圖像的細微差異嵌入到訓練智能識別模型中,并最終在兩類缺陷的分類準確性方面體現(xiàn)出來。由表1可見,未熔合缺陷的查準率和查全率較低,存在較多的誤判和漏判問題。這主要是中俄東線管道環(huán)焊縫的厚度大,單個未熔合缺陷的自身高度低于一個焊層厚度,在X射線底片上未熔合缺陷影像的黑度和對比度偏低,導致未熔合缺陷圖像的智能識別更加困難。
(3) 裂紋缺陷的智能識別。由于裂紋缺陷數(shù)量較少,未單獨進行裂紋缺陷的智能識別算法模型開發(fā)。采用上述圓形缺陷、未熔合及條形缺陷的智能算法模型,測試了中俄東線北段的19處裂紋缺陷底片圖像。裂紋缺陷的智能識別算法測試結(jié)果如表2所示,現(xiàn)有智能檢測模型共報告30處缺陷,其中15處識別為未熔合缺陷,且其置信度大多在0.5以上,高于真實未熔合缺陷的平均值。裂紋缺陷檢測效果如圖8所示,圖8(a),(b)兩個裂紋缺陷識別結(jié)果為未熔合,圖8(c)裂紋識別為條形缺陷。初步分析,裂紋缺陷智能識別的置信度偏高,其主要原因與裂紋缺陷的黑度和對比度偏高有關??梢姡悄茏R別算法模型對于裂紋缺陷有較好的識別作用,且多數(shù)分類為未熔合,盡管有4處識別為條形缺陷及11處非裂紋缺陷誤判為未熔合和條形缺陷,結(jié)合缺陷智能識別分類的置信度排序,仍有望提升裂紋、未熔合等危害性缺陷的排查效率。
表2 裂紋缺陷的智能識別算法測試結(jié)果
圖8 裂紋缺陷檢測效果示例
當前,基于X射線檢測底片圖像的缺陷智能識別技術(shù),可用于輔助評片和環(huán)焊縫質(zhì)量排查,及時減少漏判、誤判,提高危害性缺陷排查的技術(shù)水平和效率。
缺陷智能分析技術(shù)在管道環(huán)焊縫全生命周期中的作用如圖9所示,除建設期產(chǎn)生的射線、超聲等檢測圖像數(shù)據(jù)外,在役管道還需要進行周期性的內(nèi)檢測及相應的開挖檢測,管道運行階段仍會不斷產(chǎn)生新的管道環(huán)焊縫檢測數(shù)據(jù)。通過與建設期移交的無損檢測缺陷數(shù)據(jù)等進行自動對比,可以快速準確地實現(xiàn)補口腐蝕和焊縫缺陷增長的智能分析預測,更好地做出維護修復決策。X射線檢測底片圖像的缺陷智能識別技術(shù),將在DR射線檢測圖像[5]、AUT檢測三維圖像、內(nèi)檢測信號圖像[6]等方面繼續(xù)發(fā)展,助力管道大數(shù)據(jù)價值的充分挖掘,實現(xiàn)管道智能化運營管理水平的提升。
圖9 缺陷智能分析技術(shù)在管道環(huán)焊縫全生命周期中的作用框圖
基于中俄東線北段管道全數(shù)字化移交的射線檢測底片圖像和人工評級結(jié)果,通過數(shù)據(jù)清洗和缺陷特征標注,建立了全自動焊接環(huán)焊縫射線檢測缺陷樣本數(shù)據(jù)庫,可用于缺陷智能識別算法的調(diào)試、優(yōu)化和效果評價。采用Faster R-CNN、YOLO等最新深度學習算法,完成了未熔合等主要類型缺陷智能識別技術(shù)的研究和開發(fā),初步實現(xiàn)了未熔合、裂紋等危害性缺陷的智能識別。
在“全數(shù)字化移交、全智能化運營、全生命周期管理”的目標框架下,射線檢測底片缺陷智能識別技術(shù)的開發(fā)和應用,可應用于輔助評片、危害性缺陷篩查及判斷缺陷增長情況,從而實現(xiàn)管道大數(shù)據(jù)價值的充分挖掘,提升管道智能化運營管理的水平。