高 卓
(中海油能源發(fā)展裝備技術(shù)有限公司 天津 300452)
近年來,大數(shù)據(jù)、云計(jì)算等現(xiàn)代信息技術(shù)的發(fā)展推動(dòng)了新一輪的科技革命,行業(yè)數(shù)字化建設(shè)進(jìn)入新的發(fā)展階段[1]。 油氣產(chǎn)業(yè)作為社會(huì)發(fā)展的重要經(jīng)濟(jì)命脈,數(shù)字化、智能化轉(zhuǎn)型已經(jīng)勢(shì)在必行。 目前各大油氣企業(yè)紛紛加大了數(shù)字化業(yè)務(wù)布局的力度,開展智能化建設(shè)。 依托大數(shù)據(jù)、云計(jì)算等智能化技術(shù),將海量工業(yè)數(shù)據(jù)作為輸入信息進(jìn)行智能化分析,解決油田開發(fā)生產(chǎn)面臨的難題,為項(xiàng)目運(yùn)行提供科學(xué)的解決方案[2]。
透平發(fā)電機(jī)、天然氣壓縮機(jī)等是油氣田開發(fā)生產(chǎn)的重要裝備,在運(yùn)行中多采用傳動(dòng)設(shè)備傳遞動(dòng)力。 然而受自身缺陷以及外界作業(yè)環(huán)境等因素的影響,在生產(chǎn)作業(yè)過程中,動(dòng)設(shè)備不可避免地會(huì)出現(xiàn)各種形式的故障,制約了油田開發(fā)生產(chǎn)的優(yōu)快進(jìn)行,嚴(yán)重者可能導(dǎo)致設(shè)備損壞,誘發(fā)安全生產(chǎn)事故。 在長(zhǎng)期運(yùn)轉(zhuǎn)狀態(tài)下,隨著時(shí)間的推移,設(shè)備自身性能也會(huì)隨之降低并逐步演化成為功能性故障[3]。根據(jù)設(shè)備的歷史運(yùn)行數(shù)據(jù),對(duì)其潛在故障進(jìn)行評(píng)估和預(yù)測(cè),有計(jì)劃地安排停機(jī)檢修,能夠保證動(dòng)設(shè)備長(zhǎng)期穩(wěn)定運(yùn)轉(zhuǎn)。 目前油氣行業(yè)多通過設(shè)備狀態(tài)監(jiān)測(cè)、實(shí)時(shí)數(shù)據(jù)庫(kù)系統(tǒng)等方式對(duì)動(dòng)設(shè)備運(yùn)行狀態(tài)進(jìn)行評(píng)估,基于人工經(jīng)驗(yàn)判斷或者設(shè)置閾值等方式實(shí)現(xiàn)設(shè)備故障預(yù)警。 在新一輪技術(shù)科技革命浪潮中,應(yīng)用大數(shù)據(jù)技術(shù)對(duì)動(dòng)設(shè)備歷史數(shù)據(jù)進(jìn)行深入挖掘分析,提取關(guān)鍵信息評(píng)估設(shè)備運(yùn)行狀態(tài)變化是動(dòng)設(shè)備維護(hù)管理的必然需求。
本研究以石油工業(yè)常見的動(dòng)設(shè)備實(shí)時(shí)運(yùn)行數(shù)據(jù)參數(shù)、檢驗(yàn)參數(shù)、監(jiān)測(cè)數(shù)據(jù)、海上平臺(tái)中控生產(chǎn)數(shù)據(jù)等為基礎(chǔ),以機(jī)器學(xué)習(xí)等智能方法為手段,開展常見動(dòng)設(shè)備運(yùn)行狀態(tài)和異常預(yù)測(cè)研究,構(gòu)建動(dòng)設(shè)備異常預(yù)測(cè)和早期識(shí)別診斷模型,實(shí)現(xiàn)動(dòng)設(shè)備異常的提前預(yù)警,減少設(shè)備故障發(fā)生率,提高油氣田開發(fā)生產(chǎn)效率。
動(dòng)設(shè)備運(yùn)行過程中,可靠度是評(píng)判動(dòng)設(shè)備正常運(yùn)行的重要指標(biāo)。 因此通過數(shù)據(jù)分析得到設(shè)備各項(xiàng)參數(shù),對(duì)設(shè)備的運(yùn)行狀況以及故障發(fā)生率進(jìn)行預(yù)測(cè)。 該過程需要大量的數(shù)據(jù),包括設(shè)備固有參數(shù)、運(yùn)行環(huán)境數(shù)據(jù)以及運(yùn)行信息等等。 設(shè)備運(yùn)行信息數(shù)據(jù)能夠直接反映設(shè)備的運(yùn)行狀態(tài),其余信息則間接反映其運(yùn)行情況,因此應(yīng)根據(jù)不同參數(shù)的影響程度給予不同的權(quán)重值[4]。 動(dòng)設(shè)備運(yùn)行環(huán)境數(shù)據(jù)對(duì)設(shè)備的使用年限有著重要的影響,常見的參數(shù)包括溫度、濕度、空氣灰塵量、振動(dòng)數(shù)據(jù)等等。 利用傳感器采集設(shè)備環(huán)境數(shù)據(jù)并傳入數(shù)據(jù)庫(kù)中,能夠提升模型預(yù)測(cè)的精度。 動(dòng)設(shè)備的固有參數(shù)包括設(shè)備尺寸、額定參數(shù)、材料材質(zhì)等,是大數(shù)據(jù)分析的重要信息。 在構(gòu)建模型的過程中還應(yīng)該將設(shè)備的商品信息納入數(shù)據(jù)庫(kù)中,如設(shè)備品牌、供貨商以及規(guī)格參數(shù)等,該類數(shù)據(jù)是設(shè)備追本溯源的重要信息,是對(duì)設(shè)備產(chǎn)品品牌評(píng)估預(yù)測(cè)的重要支撐。 動(dòng)設(shè)備運(yùn)行狀況數(shù)據(jù)能夠直接反映設(shè)備狀態(tài),是故障預(yù)測(cè)和診斷分析的重要憑證,常用的參數(shù)包括溫度、實(shí)際電壓、功率、開關(guān)量、振動(dòng)量等。 數(shù)據(jù)收集是大數(shù)據(jù)預(yù)測(cè)分析的重要基礎(chǔ),上述數(shù)據(jù)分布在不同系統(tǒng)中,需要借助有效的平臺(tái)工具采集存儲(chǔ)[5]。 一般來說,傳感器讀數(shù)、工作參數(shù)、技術(shù)資料信息、巡檢信息、分析化驗(yàn)信息、檢維修記錄、設(shè)備狀態(tài)等數(shù)據(jù)可通過傳感器、監(jiān)控和數(shù)據(jù)采集系統(tǒng)(supervisory control and data acquisition,SCADA)、設(shè)備記錄器等部件獲取,并存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)或云平臺(tái)中。
1.2.1 模型構(gòu)建
基于大數(shù)據(jù)分析的動(dòng)設(shè)備運(yùn)行狀況預(yù)測(cè)模型及其架構(gòu),如圖1 所示。 針對(duì)構(gòu)建的原始數(shù)據(jù)庫(kù),進(jìn)行特征提取與選擇,即從清洗后的數(shù)據(jù)中提取與設(shè)備運(yùn)行狀況相關(guān)的特征數(shù)據(jù),包括設(shè)備工作參數(shù)、振動(dòng)頻率、溫度變化等。 同時(shí),可以借助特征選擇算法篩選出對(duì)設(shè)備運(yùn)行狀況預(yù)測(cè)具有較高影響的特征數(shù)據(jù)作為樣本。 在采集動(dòng)設(shè)備歷史數(shù)據(jù)的基礎(chǔ)上,對(duì)原始數(shù)據(jù)分類處理,并進(jìn)行深入挖掘,評(píng)估不同參數(shù)變量之間的相關(guān)程度,得到變量的相關(guān)變化趨勢(shì),構(gòu)建動(dòng)設(shè)備系統(tǒng)信息模型,將采集到的設(shè)備固有參數(shù)、環(huán)境數(shù)據(jù)以及運(yùn)行信息加載到數(shù)據(jù)庫(kù)中,組成動(dòng)設(shè)備系統(tǒng)大數(shù)據(jù)源。 應(yīng)用機(jī)器學(xué)習(xí)方法對(duì)大數(shù)據(jù)源建模,通過分析不同系統(tǒng)參數(shù)相互間的關(guān)聯(lián)性,對(duì)其運(yùn)行狀態(tài)進(jìn)行正確表征。 基于深度學(xué)習(xí)輸出結(jié)果,進(jìn)行故障診斷并制定維護(hù)計(jì)劃。 當(dāng)模型預(yù)測(cè)出設(shè)備可能出現(xiàn)的故障時(shí),采取相應(yīng)的維護(hù)措施,預(yù)防故障的發(fā)生,減少停機(jī)時(shí)間。 另外,通過不斷收集新的運(yùn)行數(shù)據(jù)和反饋信息,對(duì)預(yù)測(cè)模型進(jìn)行持續(xù)優(yōu)化和改進(jìn),提升模型的準(zhǔn)確性、可靠性,提高設(shè)備運(yùn)行狀況的預(yù)測(cè)精度和實(shí)用性。
圖1 基于大數(shù)據(jù)分析的動(dòng)設(shè)備運(yùn)行狀況預(yù)測(cè)模型和架構(gòu)示意圖
一般來說,傳感器等部件采集到的原始數(shù)據(jù)多存在遺漏值、離群值以及無效數(shù)據(jù)等問題,直接建模精度有限。為保證預(yù)測(cè)的有效性,需要對(duì)采集的原始數(shù)據(jù)進(jìn)行清洗和預(yù)處理,包括去除異常值、填補(bǔ)缺失值、去除噪聲等,確保數(shù)據(jù)質(zhì)量。 此外,保留動(dòng)設(shè)備運(yùn)行核心數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行降維處理,在保證模型預(yù)測(cè)精度的前提下降低模型數(shù)據(jù)量。 主成分分析法、最小二乘回歸誤差分析法、Pearson 相關(guān)系數(shù)分析法、最大互信息系數(shù)分析法是常用的降維方法。 對(duì)于石油工業(yè)動(dòng)設(shè)備來說,不同參數(shù)間的關(guān)系多表現(xiàn)為多線性、非線性特征,為準(zhǔn)確表達(dá)其數(shù)學(xué)函數(shù)特征,因此多采用最大互信息系數(shù)分析法描述兩個(gè)隨機(jī)變量之間的依賴關(guān)系,對(duì)變量之間的函數(shù)關(guān)系進(jìn)行準(zhǔn)確表征。 最大互信息系數(shù)分析法認(rèn)為,如果兩個(gè)參數(shù)變量之間存在關(guān)聯(lián)性,那么可以在其平面散點(diǎn)圖上繪制網(wǎng)格,將數(shù)據(jù)點(diǎn)進(jìn)行分割,在提升網(wǎng)格分辨率的前提下,計(jì)算不同分辨率下的最大互信息值,對(duì)計(jì)算得到的信息值進(jìn)行歸一化處理,即得到所需的結(jié)果[6]。
1.2.2 預(yù)測(cè)分析
基于提取的特征數(shù)據(jù),應(yīng)用機(jī)器學(xué)習(xí)、統(tǒng)計(jì)分析等方法預(yù)測(cè)設(shè)備運(yùn)行趨勢(shì),常見的預(yù)測(cè)方法包括回歸分析法、時(shí)間序列分析、神經(jīng)網(wǎng)絡(luò)法、支持向量機(jī)回歸法、灰色預(yù)測(cè)模型法以及馬爾科夫鏈模型法等,其中尤其以支持向量機(jī)回歸法應(yīng)用更為廣泛[7]。 支持向量機(jī)回歸法預(yù)測(cè)分析時(shí),對(duì)于給定的訓(xùn)練數(shù)據(jù),優(yōu)選訓(xùn)練樣本D={(x1,y1)…(xi,yi)},yi∈R,其中x表示樣本數(shù)據(jù)的屬性,y表示屬性的對(duì)應(yīng)值,構(gòu)建函數(shù)關(guān)系表達(dá)式f(x)=wx+b,其中w、b表示待定參數(shù),f(x) 為輸入變量的預(yù)測(cè)值。
支持向量機(jī)回歸方法原理如圖2 所示,給定兩類數(shù)據(jù),分別用實(shí)心圓形和空心圓形表示,兩條虛線分別表示穿越兩類樣本的直線,二者之間的距離為分類間隔,即2/w。 可以看出,當(dāng)w為最小值時(shí),分類間隔2/w達(dá)到最大。 通過機(jī)器學(xué)習(xí)使得預(yù)測(cè)值f(x) 盡可能地接近y, 當(dāng)二者的差值較小時(shí),即能較為準(zhǔn)確地預(yù)測(cè)y, 該計(jì)算過程可以看作是凸函數(shù)最佳化的求解問題,即min1/2w2,約束條件s.t.|f(xi)- yi |≤εi,其中ε表示預(yù)測(cè)值與實(shí)際值的差,即將求解分類間隔問題轉(zhuǎn)變?yōu)榍蠼庾钚≈档膯栴}。在ε合理的情況下,能夠進(jìn)行有效的數(shù)學(xué)求解,即可行性預(yù)測(cè)[8]。
圖2 支持向量機(jī)原理圖
在實(shí)際計(jì)算過程中,受離群值和誤差等因素的影響,可行性預(yù)測(cè)難以實(shí)現(xiàn),需要應(yīng)用損失函數(shù)、懲罰函數(shù)進(jìn)行求解,其數(shù)學(xué)表達(dá)式見式(1)所示,其中C表示正則化系數(shù),ξi表示松弛變量。 應(yīng)用約束條件的目的在于確保所有屬性點(diǎn)值(xi,yi) 均能滿足敏感度損失函數(shù),即讓松弛變量ξi替代屬性點(diǎn)值(xi,yi) 的損失。 對(duì)于懲罰函數(shù)來說,其能夠較好地解決因離群值等因素導(dǎo)致的問題,并判斷訓(xùn)練模型是否過度。 在機(jī)器學(xué)習(xí)過程中,懲罰系數(shù)以及模型內(nèi)部參數(shù)對(duì)于輸出結(jié)果有著較大的影響,因此需要通過試誤法得到錯(cuò)誤率最低的最佳參數(shù)組合,并作為最適模型的參數(shù)。
另外,動(dòng)態(tài)劣化度g(xp) 指標(biāo)能夠?qū)υO(shè)備運(yùn)行趨勢(shì)進(jìn)行科學(xué)的評(píng)估,其計(jì)算公式如下式(2)所示,其計(jì)算結(jié)果介于0 和1 之間,0 表示最優(yōu),1 表示最差,xp為指標(biāo)參數(shù)預(yù)測(cè)值,xmin表示指標(biāo)參數(shù)運(yùn)行的最小值,xmax為運(yùn)行最大值[9-10]。 基于支持向量機(jī)回歸法以及動(dòng)態(tài)劣化度計(jì)算方法,對(duì)動(dòng)設(shè)備運(yùn)行狀態(tài)和趨勢(shì)進(jìn)行預(yù)測(cè),能夠得到滿意的應(yīng)用效果。
在構(gòu)建大數(shù)據(jù)模型的基礎(chǔ)上,從線上、線下兩個(gè)角度建立動(dòng)設(shè)備故障診斷知識(shí)圖庫(kù),如圖3 所示。 在大數(shù)據(jù)源的基礎(chǔ)上,選擇合適的特征參數(shù),計(jì)算待選特征域信息之間的相關(guān)性,基于故障規(guī)則表,構(gòu)建故障診斷模型。 線上方面,構(gòu)建基于大數(shù)據(jù)的故障診斷知識(shí)庫(kù),通過智能化采集設(shè)備將相關(guān)信息記錄到數(shù)據(jù)庫(kù)中,當(dāng)出現(xiàn)故障問題時(shí)生成故障信息表,其中設(shè)備型號(hào)、狀態(tài)詳情等信息作為知識(shí)庫(kù)的輸入信息,在此基礎(chǔ)上預(yù)測(cè)、推薦可能的故障原因,并默認(rèn)優(yōu)選可能性最大的原因。 線下方面,采用人工巡檢的方式,如果設(shè)備未發(fā)生故障,巡檢人員填寫巡檢單,將巡檢站點(diǎn)、設(shè)備、時(shí)間、人員等信息記錄到數(shù)據(jù)庫(kù)中。 如設(shè)備未處于正常運(yùn)行狀態(tài),巡檢人員填寫故障信息單,故障原因可以人工判斷選擇,也可以通過知識(shí)庫(kù)調(diào)用選擇。 當(dāng)動(dòng)設(shè)備故障處理完成后,對(duì)現(xiàn)場(chǎng)拍照并填寫任務(wù)詳情單,記錄動(dòng)設(shè)備故障處理人、任務(wù)內(nèi)容、任務(wù)完成情況等,根據(jù)實(shí)際處理情況確認(rèn)設(shè)備故障原因,并上傳到知識(shí)庫(kù)中。
圖3 動(dòng)設(shè)備故障診斷知識(shí)圖庫(kù)的構(gòu)建示意圖
以某石油企業(yè)某壓縮機(jī)組某工藝系統(tǒng)為例,對(duì)其運(yùn)行狀態(tài)進(jìn)行預(yù)測(cè)。 結(jié)合技術(shù)人員實(shí)際經(jīng)驗(yàn),選擇獨(dú)立子系統(tǒng)指標(biāo)參數(shù)XI?A,TI?B,F(xiàn)IC?C,PIC?D 作為指標(biāo)參數(shù),應(yīng)用支持向量機(jī)回歸以及動(dòng)態(tài)劣化度計(jì)算法,得到t時(shí)刻XI?A等指標(biāo)的預(yù)測(cè)值和動(dòng)態(tài)劣化度,計(jì)算結(jié)果見表1,并對(duì)設(shè)備狀態(tài)進(jìn)行檢測(cè)。 以PIC?D 子系統(tǒng)為例,將計(jì)算得到的動(dòng)態(tài)劣化度作為狀態(tài)監(jiān)測(cè)指標(biāo),某日上午08:42 觸發(fā)動(dòng)態(tài)劣化度并報(bào)警;傳統(tǒng)閾值監(jiān)測(cè)方法于當(dāng)日08:58 觸發(fā)閾值并報(bào)警,本文方法監(jiān)測(cè)的最早報(bào)警時(shí)間較常規(guī)閾值報(bào)警提前了16 min,并通過知識(shí)庫(kù)給出故障分析原因,應(yīng)用效果顯著。
表1 某項(xiàng)目t 時(shí)刻工藝系統(tǒng)轉(zhuǎn)速、壓力、溫度等指標(biāo)參數(shù)預(yù)測(cè)結(jié)果
石油工業(yè)生產(chǎn)工藝和生產(chǎn)裝備復(fù)雜,在長(zhǎng)周期作業(yè)環(huán)境下容易出現(xiàn)設(shè)備隱患問題,因此進(jìn)行動(dòng)設(shè)備運(yùn)行狀態(tài)監(jiān)測(cè)對(duì)于防范設(shè)備運(yùn)行風(fēng)險(xiǎn)、保證設(shè)備正常運(yùn)行有著重要的意義。 收集設(shè)備固有參數(shù)、運(yùn)行環(huán)境以及設(shè)備運(yùn)行信息等數(shù)據(jù),對(duì)采集的原始數(shù)據(jù)進(jìn)行清洗和預(yù)處理,包括去除異常值、填補(bǔ)缺失值、去除噪聲等,確保數(shù)據(jù)質(zhì)量,提取與設(shè)備運(yùn)行狀況相關(guān)的特征數(shù)據(jù),應(yīng)用機(jī)器學(xué)習(xí)方法對(duì)大數(shù)據(jù)源建模,通過分析不同系統(tǒng)參數(shù)相互間的關(guān)聯(lián)性,對(duì)設(shè)備運(yùn)行狀態(tài)進(jìn)行正確表征。 在構(gòu)建大數(shù)據(jù)模型的基礎(chǔ)上,從線上、線下兩個(gè)角度建立動(dòng)設(shè)備故障診斷知識(shí)圖庫(kù),基于機(jī)器學(xué)習(xí)模型進(jìn)行故障原因診斷。 綜上,基于大數(shù)據(jù)的動(dòng)設(shè)備運(yùn)行狀況預(yù)測(cè)研究能夠?qū)崿F(xiàn)設(shè)備故障提前預(yù)警,進(jìn)而提升設(shè)備可靠性和運(yùn)行效率,應(yīng)用效果較好,具備推廣價(jià)值。