沈煜佳,陳夕松,夏 峰,姜 磊
(1.東南大學(xué)自動(dòng)化學(xué)院,江蘇南京 210096;2.南京富島信息工程有限公司,江蘇南京 210061)
在采油工程領(lǐng)域,抽油機(jī)是機(jī)械采油時(shí)代最主要的開(kāi)采設(shè)備,開(kāi)發(fā)抽油機(jī)井工況檢測(cè)診斷系統(tǒng)對(duì)于管控油田采油作業(yè)的安全高效進(jìn)行、提高油田產(chǎn)量具有重要意義。在目前大數(shù)據(jù)背景下,通過(guò)深度學(xué)習(xí)網(wǎng)絡(luò)提取示功圖特征并建立診斷模型,實(shí)現(xiàn)示功圖的工況監(jiān)測(cè)、異常識(shí)別與自動(dòng)診斷已逐漸成為抽油機(jī)故障診斷技術(shù)研究的重要方向[1]。
由于地質(zhì)情況等條件的影響,大部分抽油機(jī)示功圖都難以接近工程原理中標(biāo)準(zhǔn)工況下的示功圖。以典型示功圖為分類(lèi)標(biāo)準(zhǔn)進(jìn)行故障診斷往往會(huì)導(dǎo)致多數(shù)識(shí)別結(jié)果為異常,誤報(bào)率較高。出于工程適用性考慮,目前業(yè)內(nèi)通常以抽油機(jī)長(zhǎng)期平穩(wěn)運(yùn)行時(shí)的示功圖作為該設(shè)備的標(biāo)準(zhǔn)示功圖,只有出現(xiàn)與之不相似的示功圖時(shí)才判定檢測(cè)到故障。常用的重疊面積法[2]、統(tǒng)計(jì)分析法等相似識(shí)別方法雖能實(shí)現(xiàn)故障檢測(cè),但仍需工藝專(zhuān)家進(jìn)行標(biāo)定或通過(guò)進(jìn)一步訓(xùn)練來(lái)診斷故障類(lèi)型。為解決上述問(wèn)題,本文研究了基于深度學(xué)習(xí)相似識(shí)別的抽油機(jī)井故障檢測(cè)與診斷一體化方法,能通過(guò)識(shí)別示功圖變化檢測(cè)故障,并檢索出故障特征庫(kù)進(jìn)行診斷,指導(dǎo)油田科學(xué)穩(wěn)定生產(chǎn)。同時(shí),通過(guò)數(shù)據(jù)融合的方式提高相似匹配模型準(zhǔn)確率,具有較好的應(yīng)用價(jià)值。
采用深度學(xué)習(xí)網(wǎng)絡(luò)提取示功圖特征進(jìn)行訓(xùn)練,首先需要對(duì)示功圖原始二維數(shù)據(jù)進(jìn)行預(yù)處理,然后依據(jù)圖形相似性對(duì)示功圖樣本集進(jìn)行分類(lèi),建立二分類(lèi)和三元組模型的訓(xùn)練集和驗(yàn)證集,分別輸入對(duì)應(yīng)網(wǎng)絡(luò)訓(xùn)練,獲得二分類(lèi)和三元組相似識(shí)別模型。最后建立抽油機(jī)的標(biāo)準(zhǔn)庫(kù)與故障庫(kù),應(yīng)用訓(xùn)練好的模型進(jìn)行實(shí)時(shí)故障檢測(cè),并在故障庫(kù)中檢索故障類(lèi)型以實(shí)現(xiàn)診斷。
對(duì)示功圖原始數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理、坐標(biāo)歸一化并映射到網(wǎng)格中,采用OpenCV 將示功圖二維原始數(shù)據(jù)轉(zhuǎn)化為圖像輸入。主要步驟如下:
(1)由于傳感器等不穩(wěn)定因素,抽油機(jī)的示功圖原始二維數(shù)據(jù)可能存在部分異常數(shù)據(jù),因此需要進(jìn)行異常數(shù)據(jù)過(guò)濾處理,主要包括位移或載荷數(shù)據(jù)為空、全為零或近似為零、位移與載荷數(shù)據(jù)采樣點(diǎn)數(shù)不一致、位移超出最大沖程或載荷超出最大載荷、生產(chǎn)設(shè)備故障五類(lèi)。
(3)新建的m×n 二維網(wǎng)格,將坐標(biāo)歸一化后的二維數(shù)據(jù)映射到網(wǎng)格并向下取整,得到網(wǎng)格化后位移、載荷數(shù)據(jù)對(duì)應(yīng)的二維像素點(diǎn)數(shù)據(jù)和:
式中:m 表示每個(gè)示功圖原始樣本數(shù)據(jù)集中位移x和載荷f 的采樣點(diǎn)數(shù),j 表示樣本數(shù)據(jù)的第j 個(gè)數(shù)據(jù)點(diǎn),在相似識(shí)別這類(lèi)細(xì)粒度分類(lèi)的問(wèn)題中,為兼顧圖像特征量和計(jì)算量,一般設(shè)置n=224,作為深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的輸入層大小。
(4)將示功圖二維坐標(biāo)點(diǎn)兩兩相連至最后一點(diǎn),最后將首尾相接形成示功圖封閉曲線(xiàn)。
本文方法融合了二分類(lèi)和基于三元組損失的相似識(shí)別模型。其中,二分類(lèi)模型建立過(guò)程主要包括如下步驟:
(1)以示功圖圖形相似性為依據(jù),將示功圖樣本集分為不同類(lèi)別的子樣本集,各子樣本集互不相交且并集為整個(gè)集合,類(lèi)別內(nèi)的示功圖彼此相似,類(lèi)別間的示功圖彼此不相似,并采用增加隨機(jī)擾動(dòng)的方法進(jìn)行數(shù)據(jù)增強(qiáng)[3],均衡樣本數(shù)量較少的類(lèi)別。
(2)在每個(gè)類(lèi)別內(nèi)確定由工藝專(zhuān)家標(biāo)定的標(biāo)準(zhǔn)示功圖,即錨點(diǎn)。
(3)以對(duì)第1 類(lèi)示功圖為例,對(duì)類(lèi)內(nèi)除錨點(diǎn)外的示功圖進(jìn)行無(wú)放回抽樣,用兩種顏色將錨點(diǎn)和隨機(jī)選取的示功圖疊加繪制成同一張圖像,重復(fù)此步驟得到二分類(lèi)正樣本集,標(biāo)簽τbinary為1;相反地,將任一類(lèi)示功圖錨點(diǎn)與對(duì)類(lèi)外任意樣本類(lèi)別進(jìn)行無(wú)放回抽樣所得的示功圖疊加繪制成同一張圖像,重復(fù)此步驟得到二分類(lèi)負(fù)樣本集,標(biāo)簽τbinary為0。
(4)采用留出法將總樣本集劃分成訓(xùn)練集和驗(yàn)證集,采用Caffe 下的ResNet50 網(wǎng)絡(luò)為基礎(chǔ)進(jìn)行數(shù)據(jù)訓(xùn)練和驗(yàn)證。激活函數(shù)為ReLu,池化方法為Max pooling、Global Average pooling,優(yōu)化算法為SGD,損失函數(shù)采用SoftmaxWithLoss 函數(shù),其余訓(xùn)練參數(shù)(見(jiàn)表1)。
(5)將訓(xùn)練好的二分類(lèi)模型部署到各臺(tái)抽油機(jī)的邊緣計(jì)算網(wǎng)關(guān)。
表1 二分類(lèi)網(wǎng)絡(luò)訓(xùn)練參數(shù)
基于三元組損失的相似識(shí)別模型建立過(guò)程主要包括如下步驟:
(1)采用留出法將前述分類(lèi)后的相似性樣本集劃分訓(xùn)練集和驗(yàn)證集,采用Caffe 下的ResNet50 網(wǎng)絡(luò)為基礎(chǔ)進(jìn)行訓(xùn)練和驗(yàn)證,激活函數(shù)為ReLu,池化方法為Max pooling、Global Average pooling,優(yōu)化算法為SGD,batch_size 為24。
(2)在全連接層后得到特征向量[4],引入L2NORM層求出L2 歸一化的單位特征向量。
(3)在L2NORM 層后引入三元組選擇層,從分類(lèi)后的相似性樣本集中隨機(jī)選取類(lèi)別p 并從中隨機(jī)選取l 個(gè)圖像作為原始示功圖錨點(diǎn)集合A,對(duì)A 內(nèi)的每一個(gè)錨點(diǎn),隨機(jī)選擇類(lèi)別p 內(nèi)的樣本作為正樣本,隨機(jī)選擇除p 類(lèi)外任意類(lèi)別并從中隨機(jī)選取負(fù)樣本,得到三元組(),重復(fù)上述步驟得到三元組集合T=。
(4)在三元組選擇層之后引入三元組損失[5]層,損失函數(shù)為:
式中:α 表示三元組損失邊距值,+表示[]內(nèi)的值大于零的時(shí)候,取該值為損失,否則取損失為零。計(jì)算參數(shù)梯度并進(jìn)行反向傳播,更新網(wǎng)絡(luò)參數(shù)。
(5)將訓(xùn)練好的三元組相似識(shí)別模型部署到各臺(tái)抽油機(jī)的邊緣計(jì)算網(wǎng)關(guān)。
使用訓(xùn)練好的相似識(shí)別模型進(jìn)行抽油機(jī)故障檢測(cè),采用數(shù)據(jù)融合的方式分析檢測(cè)結(jié)果,并由工藝專(zhuān)家標(biāo)定抽油機(jī)設(shè)備的標(biāo)準(zhǔn)庫(kù)與故障庫(kù),對(duì)故障示功圖進(jìn)行實(shí)時(shí)診斷,流程(見(jiàn)圖1)步驟如下:
(1)對(duì)任一抽油機(jī)設(shè)備,由工藝專(zhuān)家標(biāo)定其標(biāo)準(zhǔn)示功圖庫(kù)與故障示功圖庫(kù),輸入三元組相似識(shí)別模型轉(zhuǎn)換為標(biāo)準(zhǔn)與故障示功圖特征庫(kù),并將故障信息記錄在油井信息庫(kù)中。
(2)實(shí)時(shí)采集抽油機(jī)示功圖數(shù)據(jù),過(guò)濾異常數(shù)據(jù)并進(jìn)行預(yù)處理生成示功圖。
(3)根據(jù)設(shè)備生產(chǎn)參數(shù)進(jìn)行預(yù)檢測(cè),若出現(xiàn)示功圖最大、最小載荷變化超過(guò)基準(zhǔn)值,或是示功圖面積小于基準(zhǔn)面積的情況,直接判斷檢測(cè)到故障,計(jì)算特征向量并轉(zhuǎn)入步驟(5)。
(4)將實(shí)時(shí)示功圖與標(biāo)準(zhǔn)示功圖以疊加繪制樣本與樣本對(duì)的形式分別輸入二分類(lèi)模型和三元組相似識(shí)別模型,得到分類(lèi)標(biāo)簽τbinary和余弦相似度ξ+,ξ+超過(guò)標(biāo)定閾值Th 時(shí)對(duì)應(yīng)不相似標(biāo)簽τtriplet=0,否則對(duì)應(yīng)相似標(biāo)簽τtriplet=1,若τtriplet=τbinary=0 則判定檢測(cè)到故障。
(5)對(duì)檢測(cè)到故障的示功圖進(jìn)行故障檢索:查詢(xún)計(jì)算實(shí)時(shí)示功圖特征與各故障示功圖特征之間相似度ξ-,若ξ-均超過(guò)標(biāo)定閾值Th,表示檢測(cè)到新故障,需要標(biāo)定并更新故障庫(kù),否則返回相似度最高的故障示功圖對(duì)應(yīng)的故障信息,進(jìn)行報(bào)警并通知現(xiàn)場(chǎng)人員采取措施。
本文選取某原油開(kāi)采企業(yè)20 臺(tái)抽油機(jī)的示功圖原始數(shù)據(jù)進(jìn)行實(shí)驗(yàn),該企業(yè)油田環(huán)境復(fù)雜,抽油機(jī)出現(xiàn)供液不足、平衡塊過(guò)重等故障的概率較高。以2019 年6 月至2020 年7 月的數(shù)據(jù)構(gòu)建訓(xùn)練集、驗(yàn)證集及對(duì)照測(cè)試集,分析本文方法對(duì)抽油機(jī)故障的檢測(cè)與診斷作用。
選取2019 年6 月至2020 年6 月之間的示功圖數(shù)據(jù)進(jìn)行預(yù)處理,以示功圖圖形相似性為依據(jù),將示功圖樣本集劃分為42 個(gè)不同類(lèi)別,選取其中34 個(gè)類(lèi)別并采用增加隨機(jī)擾動(dòng)的方法均衡樣本數(shù)量較少的類(lèi)別,總樣本數(shù)為174 398 個(gè)。
采用前述方法選取樣本對(duì)進(jìn)行疊加繪制,構(gòu)建二分類(lèi)樣本集,共計(jì)112 342 個(gè),其中正樣本集58 659個(gè),負(fù)樣本集53 683 個(gè)。劃分出10 000 張樣本作為驗(yàn)證集,其余作為訓(xùn)練集,輸入二分類(lèi)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,訓(xùn)練集和驗(yàn)證集損失率(見(jiàn)圖2(a))。在34 個(gè)類(lèi)別的樣本中劃分出6 008 個(gè)作為驗(yàn)證集,其余168 390 個(gè)作為訓(xùn)練集,輸入基于三元組損失的相似識(shí)別網(wǎng)絡(luò)進(jìn)行訓(xùn)練,訓(xùn)練集和驗(yàn)證集損失率(見(jiàn)圖2(b))。
圖2 訓(xùn)練結(jié)果
圖3 對(duì)照測(cè)試集示例
表2 融合二分類(lèi)和三元組的測(cè)試結(jié)果
以2020 年7 月的示功原始數(shù)據(jù)作為測(cè)試數(shù)據(jù)并進(jìn)行示功圖預(yù)處理,為驗(yàn)證模型的泛化能力,引入未用于訓(xùn)練的8 個(gè)圖形類(lèi)別的示功圖樣本加入測(cè)試數(shù)據(jù),由工藝專(zhuān)家標(biāo)定各臺(tái)設(shè)備的標(biāo)準(zhǔn)示功圖庫(kù)與故障示功圖庫(kù),生成基于三元組和二分類(lèi)模型的對(duì)照測(cè)試集。兩個(gè)測(cè)試集樣本均為8 833 個(gè),圖3(a)、圖3(b)為對(duì)照測(cè)試集示例。
標(biāo)定生產(chǎn)參數(shù)預(yù)檢測(cè)的基準(zhǔn)值為標(biāo)準(zhǔn)值的65%,三元組相似識(shí)別閾值為0.95,輸入本文模型進(jìn)行測(cè)試,故障檢測(cè)準(zhǔn)確率及診斷結(jié)果示例(見(jiàn)表2、表3)。
由表2、表3 可知,本文方法能夠?qū)Τ橛蜋C(jī)井故障起到較好的檢測(cè)作用,并能在檢測(cè)到異常時(shí)檢索故障庫(kù)實(shí)現(xiàn)故障類(lèi)型檢索與更新,可以幫助油田現(xiàn)場(chǎng)人員及時(shí)發(fā)現(xiàn)設(shè)備故障并采取措施,這對(duì)管控生產(chǎn)、穩(wěn)定產(chǎn)量具有十分重要的意義。
本文提出了一種基于相似識(shí)別的抽油機(jī)井故障檢測(cè)與診斷方法,融合二分類(lèi)網(wǎng)絡(luò)和基于三元組損失的相似識(shí)別網(wǎng)絡(luò),檢測(cè)出與平穩(wěn)工況下的示功圖不相似的故障示功圖,減少了故障誤報(bào)與漏報(bào)。同時(shí),通過(guò)建立故障特征庫(kù),在檢測(cè)到異常工況時(shí)能夠檢索故障特征庫(kù)實(shí)現(xiàn)故障類(lèi)型診斷。實(shí)驗(yàn)結(jié)果表明,該方法能夠有效識(shí)別示功圖趨勢(shì)變化,檢測(cè)抽油機(jī)故障并診斷出故障類(lèi)別,提供了一種抽油機(jī)井故障檢測(cè)與診斷的解決方案。