仲志丹,樊浩杰,李鵬輝
(1.河南科技大學(xué) 機電工程學(xué)院,河南 洛陽 471003;2.洛陽乾禾儀器有限公司,河南 洛陽 471000)
目前,有桿泵抽油機井在中國石油開采中占有舉足輕重的地位[1]。抽油機井發(fā)生故障時,不僅會造成石油開采不能有序的進(jìn)行,影響進(jìn)度目標(biāo),嚴(yán)重時還會造成安全事故。因此,準(zhǔn)確地對抽油機井故障進(jìn)行診斷很有必要。
抽油機井故障診斷主要是根據(jù)抽油機懸點處載荷和位移的變化數(shù)據(jù)所繪制的示功圖的形狀來判斷。傳統(tǒng)方式中巡井工人根據(jù)平時的經(jīng)驗來識別示功圖形狀,但這種方法效率和準(zhǔn)確度低、不能滿足油田現(xiàn)代化生產(chǎn)的需要[2-3]。近年來,隨著計算機識別技術(shù)的發(fā)展,越來越多的計算機識別模型被應(yīng)用在示功圖識別上,如反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)[4-5]、支持向量機(Support Vector Machine,SVM)[6-7]等。這些模型識別示功圖主要通過人工預(yù)先選取示功圖幾何特征,然后根據(jù)特征進(jìn)行示功圖分類識別。人工選取的示功圖不變矩、矢量曲線等幾何特征,經(jīng)常受到人為因素的干擾,導(dǎo)致特征提取不準(zhǔn)確,降低了分類精度。并且這些模型都是利用有監(jiān)督學(xué)習(xí)的方式,用大量有標(biāo)簽的示功圖數(shù)據(jù)(即已知示功圖類別)進(jìn)行模型訓(xùn)練。這些有標(biāo)簽示功圖數(shù)據(jù)的獲取需要大量的人力和專家知識對示功圖進(jìn)行標(biāo)定,造成人力浪費以及人為可能標(biāo)定失誤帶來的識別錯誤率上升。
近年來,隨著人工智能的熱浪襲來,Hinton等提出一種“自編碼器”的深度學(xué)習(xí)模型受到人們的關(guān)注[8]。該模型采用無監(jiān)督學(xué)習(xí)[9]的方式,用大量不需要標(biāo)簽的圖像數(shù)據(jù)(未知圖像類別)來學(xué)習(xí)輸入圖像特征且能夠從高維輸入圖像數(shù)據(jù)學(xué)習(xí)出低維圖像特征,被廣泛應(yīng)用于人臉識別[10]、醫(yī)學(xué)圖像檢測[11]等各個領(lǐng)域,取得了顯著的成果。其中,稀疏自編碼器[12-13](SAE)不僅能夠自動提取圖像像素特征,解決了人工選取示功圖幾何特征的不準(zhǔn)確,還能夠利用無監(jiān)督方式學(xué)習(xí)得到數(shù)據(jù)特征的稀疏簡明表達(dá),節(jié)省了給圖像賦予類別標(biāo)簽的人力勞動且降低分類任務(wù)的復(fù)雜度,提高了后續(xù)softmax分類器的分類精度[14]。基于此,提出一種基于稀疏自編碼神經(jīng)網(wǎng)絡(luò)的示功圖識別模型,對抽油機井故障進(jìn)行智能診斷。
稀疏自編碼神經(jīng)網(wǎng)絡(luò)(SAENN)是由稀疏自編碼器和softmax分類器組成。稀疏自編碼器主要負(fù)責(zé)自動提取圖像稀疏特征過程,softmax分類器負(fù)責(zé)特征分類過程。
圖1 自編碼器結(jié)構(gòu)Fig.1 Auto-encoder structure
自編碼器提取的特征不能簡明表達(dá)輸入層數(shù)據(jù)。于是Olshausen等提出了一種稀疏編碼的理論,通過研究人類大腦的非監(jiān)督學(xué)習(xí)過程,發(fā)現(xiàn)人類通過大腦中的神經(jīng)元學(xué)習(xí)外界事物的過程中,大部分神經(jīng)元都是處于休眠狀態(tài),只有少部分神經(jīng)元受到刺激而被激活,即神經(jīng)元的響應(yīng)是稀疏的[17]。正因為如此,人腦才具有更好學(xué)習(xí)數(shù)據(jù)特征的能力,這對于自編碼器同樣適用。加上稀疏性限制后構(gòu)成稀疏自編碼器能夠?qū)W習(xí)到特征的稀疏表達(dá),使提取的特征更具有可分性。稀疏性限制就是當(dāng)神經(jīng)元輸出函數(shù)的值無限接近于1的時候,輸出被激活,無限接近于0的時候,輸出被抑制,大部分輸出被抑制的情況叫做稀疏性限制。
自編碼器的損失函數(shù)為
增加懲罰因子后進(jìn)行稀疏性限制的稀疏自編碼器的損失函數(shù)表示為
式中β為控制稀疏性懲罰因子的權(quán)重;s為隱藏層節(jié)點的數(shù)量。
重構(gòu)誤差的大小間接體現(xiàn)了編碼過程提取稀疏特征的有效性。由于以稀疏自編碼器的損失函數(shù)來評價重構(gòu)誤差的大小,故通過反向傳播算法最小化公式(4)可以得到最優(yōu)的權(quán)重矩陣W偏置矩陣b,最終可以得到輸入數(shù)據(jù)的隱藏層稀疏表達(dá)特征[19]。
由圖1隱藏層學(xué)習(xí)到的更具稀疏可分性的特征作為分類器的輸入,通過分類器可最終得到分類結(jié)果,這一過程是有監(jiān)督學(xué)習(xí)的。由于文中研究的是多種工況下示功圖的識別,所以這是一個多分類問題,故選用softmax分類器根據(jù)稀疏自編碼器學(xué)習(xí)到的特征對示功圖進(jìn)行分類。
softmax分類器是邏輯回歸分類器在多分類問題上的推廣[20],在多分類問題上類別標(biāo)簽可以取多個值。經(jīng)過softmax分類器的分類,可以在輸出層計算出輸入示功圖屬于各分類標(biāo)簽的概率,其中概率最大的即為分類結(jié)果。
通過安裝在延長油田抽油機上的120臺QH101-2型無線遠(yuǎn)程示功圖測量儀(如圖2所示)每隔一定時間進(jìn)行數(shù)據(jù)采集,把采集的數(shù)據(jù)壓縮打包后,通過自身所帶的SIM900A模塊利用GPRS網(wǎng)絡(luò)傳輸給遠(yuǎn)程數(shù)據(jù)服務(wù)器中心。通過計算機登陸服務(wù)器就可以看到保存在服務(wù)器中的示功圖數(shù)據(jù)。
圖2 QH101-2型無線遠(yuǎn)程示功圖測量儀Fig.2 QH101-2 wireless remote indicator dynamometer
原始的示功圖數(shù)據(jù)是測量的抽油機上下沖程過程中n個采樣點的懸點位移和懸點載荷。然后分別以位移作為橫坐標(biāo),載荷作為縱坐標(biāo),將測量的n個采樣點繪制在直角坐標(biāo)系中并連成一條封閉的曲線,即示功圖,圖3為供液不足工況下的示功圖,不同形狀的示功圖直接反應(yīng)了抽油機井的不同工作狀況。
圖3 抽油機井供液不足示功圖Fig.3 Indicator diagram of insufficient liquid supply in pumping well
為了減少稀疏自編碼器訓(xùn)練時間,提高網(wǎng)絡(luò)學(xué)習(xí)中收斂速度,保證示功圖的形狀不變,實驗中通過MATLAB仿真軟件將測量的示功圖原始數(shù)據(jù)處理成64pixel×64pixel的二值化示功圖圖像。
選擇從延長油田獲取的示功圖數(shù)據(jù)并處理后的8 000張二值化示功圖圖像作為樣本。其中,有3 200張8種典型工況的無標(biāo)簽樣本作為稀疏自編碼器無監(jiān)督訓(xùn)練的訓(xùn)練樣本。余下的4 800張8種不同工況的有標(biāo)簽樣本,每一種工況有600張示功圖圖像。這8種不同工況類別的示功圖分別為正常示功圖、供液不足、氣體影響、示功圖異常、氣鎖、油井結(jié)蠟、活塞脫出、固定凡爾漏失,具體示功圖形狀如圖4所示。每一種工況樣本的2/3作為softmax分類器有監(jiān)督訓(xùn)練的訓(xùn)練集,1/3作為測試集。那么所有工況的有標(biāo)簽訓(xùn)練集樣本為3 200,測試集樣本為1 600.
圖4 8種不同工況類別示功圖形狀Fig.4 Shapes of indicator diagram in eight different working conditions
1.1節(jié)與1.2節(jié)已經(jīng)介紹了稀疏自編碼器與softmax分類器,本節(jié)將主要介紹稀疏自編碼神經(jīng)網(wǎng)絡(luò)在示功圖識別中的具體流程,如圖5所示。詳細(xì)步驟如下
1)設(shè)定期望平均稀疏激活度參數(shù)ρ,訓(xùn)練學(xué)習(xí)速率η,隨機初始化權(quán)重矩陣W和偏置矩陣b;
2)設(shè)定前向傳播中分批次訓(xùn)練樣本數(shù)、訓(xùn)練迭代周期次數(shù)等,執(zhí)行前向傳播過程;
3)對輸出層的每一個節(jié)點,計算加入稀疏性限制之后的損失函數(shù);
4)使用反向傳播算法求出最終輸出層與各層神經(jīng)元的“殘差”,利用梯度下降法不斷更新權(quán)重矩陣W和偏置矩陣b,最終得到最優(yōu)的W和b.
1)用(1)中得到的權(quán)重矩陣W(1)和偏置矩陣b(1)等參數(shù)初始化稀疏自編碼器特征提取層;
2)設(shè)置softmax分類器正則化參數(shù)λ,輸出層節(jié)點數(shù),執(zhí)行前向傳播算法,提取特征并進(jìn)行分類;
3)使用反向傳播算法求出最終輸出層與各層神經(jīng)元的“殘差”,利用梯度下降法不斷更新權(quán)值和偏置,對整個稀疏自編碼神經(jīng)網(wǎng)絡(luò)進(jìn)行微調(diào)。
1)計算輸入數(shù)據(jù)屬于每個分類標(biāo)簽的概率,選取概率最大的作為分類結(jié)果;
2)用輸出分類結(jié)果與實際輸入結(jié)果作對比,計算識別準(zhǔn)確率。
本實驗所用硬件平臺為Intel i5-3210M 2.5 GHz CPU,內(nèi)存8 GB的64位計算機,所使用的軟件平臺為Matlab2014a.
稀疏自編碼神經(jīng)網(wǎng)絡(luò)的參數(shù)選擇與示功圖識別精度息息相關(guān)。文中稀疏自編碼器輸入層神經(jīng)元個數(shù)由示功圖圖像像素點個數(shù)決定即64×64=4 096.令稀疏自編碼器的隱藏層神經(jīng)元個數(shù)為600,softmax分類器輸出層神經(jīng)元個數(shù)為8,根據(jù)文獻(xiàn)[7]設(shè)置學(xué)習(xí)速率η=0.5.稀疏自編碼器迭代次數(shù)達(dá)到200次時,重構(gòu)誤差趨于穩(wěn)定,因此設(shè)定迭代次數(shù)為200.在實驗中發(fā)現(xiàn)不同的期望平均稀疏激活度參數(shù)ρ和正則化參數(shù)λ對實驗結(jié)果產(chǎn)生很大影響,圖6反映的是不同期望平均稀疏激活度參數(shù)ρ對測試集樣本識別準(zhǔn)確率的影響。從圖6可知,期望平均稀疏激活度參數(shù)ρ=0.035的時候示功圖識別精度最高。
圖5 稀疏自編碼神經(jīng)網(wǎng)絡(luò)識別示功圖流程Fig.5 Flowchart of sparse auto-encoder neural network for indicator diagram recognition
圖6 期望平均稀疏激活度參數(shù)對識別準(zhǔn)確率影響Fig.6 Influence of expected average sparsity activation parameter on recognition accuracy
在ρ=0.035的條件下,softmax分類器不同正則化參數(shù)與訓(xùn)練集樣本識別準(zhǔn)確率、測試集樣本識別準(zhǔn)確率的關(guān)系,如圖7所示。當(dāng)λ=1×10-5時訓(xùn)練集樣本識別準(zhǔn)確率和測試集樣本識別準(zhǔn)確率都已達(dá)到峰值,故設(shè)定優(yōu)化后的正則化參數(shù)λ=1×10-5.
圖7 正則化參數(shù)與識別準(zhǔn)確率的關(guān)系Fig.7 Relationship between regularization parameter and recognition accuracy
利用1 600張實測示功圖測試集樣本對訓(xùn)練完成后的稀疏自編碼神經(jīng)網(wǎng)絡(luò)模型進(jìn)行測試,由于篇幅限制,選取了部分示功圖故障識別結(jié)果,見表1.
為了評價稀疏自編碼神經(jīng)網(wǎng)絡(luò)模型的識別性能,通過把相同的1 600張測試集樣本分別輸入到BP神經(jīng)網(wǎng)絡(luò)、支持向量機(SVM)、稀疏自編碼神經(jīng)網(wǎng)絡(luò)模型進(jìn)行測試對比,測試結(jié)果見表2.其中BP神經(jīng)網(wǎng)絡(luò)采用單隱層結(jié)構(gòu)(600個隱藏層神經(jīng)元),SVM采用徑向基函數(shù)作為核函數(shù)。BP神經(jīng)網(wǎng)絡(luò)需要人工選取示功圖不變矩特征,支持向量機需要人工選取示功圖矢量曲線特征,二者都不能實現(xiàn)對示功圖的準(zhǔn)確表達(dá),而稀疏自編碼器通過網(wǎng)絡(luò)學(xué)習(xí)自動提取圖像稀疏特征,能夠?qū)崿F(xiàn)對示功圖簡明有效表達(dá)。而提取的稀疏特征能夠準(zhǔn)確地區(qū)分不同示功圖之間差別,大大提高了softmax分類器的識別精度。由實驗結(jié)果可知,稀疏自編碼神經(jīng)網(wǎng)絡(luò)模型測試識別準(zhǔn)確度高達(dá)99.44%,性能遠(yuǎn)優(yōu)于BP,SVM等識別模型,故該模型在抽油機井故障診斷中具有明顯優(yōu)勢。
表1 實測示功圖故障識別結(jié)果Table 1 Fault recognition result of actual indicator diagrams
表2 各種模型識別性能對比Table 2 Comparison of various models’s recognition accuracy
將基于稀疏自編碼神經(jīng)網(wǎng)絡(luò)的抽油機井故障診斷方法應(yīng)用于通過Labwindows/CVI開發(fā)環(huán)境開發(fā)的抽油機井故障智能診斷系統(tǒng)中,該系統(tǒng)已經(jīng)在勝利油田、江漢油田、新疆油田得到應(yīng)用,系統(tǒng)可視化界面如圖8所示。該系統(tǒng)可以對實測示功圖數(shù)據(jù)進(jìn)行實時繪制,并根據(jù)繪制的示功圖及時給出診斷結(jié)果與處理建議。油田工作人員可以根據(jù)診斷結(jié)果對抽油機井故障及時進(jìn)行處理,極大程度降低了由故障造成的油田停產(chǎn)、減產(chǎn)、抽油設(shè)備損壞等現(xiàn)象。
圖8 抽油機井故障智能診斷系統(tǒng)Fig.8 Intelligent fault diagnosis system for pumping well
1)借助人工智能思想,提出稀疏自編碼神經(jīng)網(wǎng)絡(luò)模型識別示功圖。稀疏自編碼器訓(xùn)練過程采用無監(jiān)督學(xué)習(xí)方式,代替了傳統(tǒng)有監(jiān)督模型訓(xùn)練需要人工標(biāo)定大量示功圖標(biāo)簽的過程,大大減少了人力勞動,避免了人為標(biāo)定錯誤;
2)稀疏自編碼神經(jīng)網(wǎng)絡(luò)自動提取示功圖數(shù)據(jù)特征,避免了BP神經(jīng)網(wǎng)絡(luò)、支持向量機等傳統(tǒng)模型人工預(yù)先提取示功圖幾何特征的繁瑣與特征選取的不當(dāng);
3)稀疏自編碼神經(jīng)網(wǎng)絡(luò)提取的稀疏可分性示功圖數(shù)據(jù)特征能夠提高示功圖的識別準(zhǔn)確率,為抽油機井故障診斷帶來了新思路,解決了長期以來困擾油井工作人員不能有效地診斷抽油機井故障的難題,提高了油田作業(yè)效率,進(jìn)一步提升了石油產(chǎn)量。