• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于自動(dòng)譜聚類與多極端學(xué)習(xí)機(jī)模型的油井油液含水率軟測(cè)量

      2016-08-06 07:12:22黃海礁
      化工學(xué)報(bào) 2016年7期
      關(guān)鍵詞:油液螢火蟲含水率

      李 琨,韓 瑩,黃海礁

      ?

      基于自動(dòng)譜聚類與多極端學(xué)習(xí)機(jī)模型的油井油液含水率軟測(cè)量

      李琨1,韓瑩1,黃海礁2

      (1渤海大學(xué)工學(xué)院,遼寧 錦州 121013;2遼河油田分公司錦州采油廠采油作業(yè)五區(qū),遼寧 錦州 121209)

      摘要:油井油液的含水率是石油生產(chǎn)中的一個(gè)重要參數(shù),及時(shí)、準(zhǔn)確的測(cè)量對(duì)提高采油生產(chǎn)效率具有重要的意義。針對(duì)傳統(tǒng)人工測(cè)量所存在的不足,引入軟測(cè)量技術(shù),建立基于自動(dòng)譜聚類與多極端學(xué)習(xí)機(jī)(automatic spectral clustering-multiple extreme learning machines, ASC-MELM)的軟測(cè)量模型。提出一種自動(dòng)譜聚類(spectral clustering, SC)算法,由改進(jìn)的螢火蟲算法(firefly algorithm, FA)對(duì)聚類數(shù)目和尺度參數(shù)進(jìn)行優(yōu)化選取,所提出的改進(jìn)螢火蟲算法(improved firefly algorithm, IFA)采用以一定概率跳出當(dāng)前解的機(jī)制,避免傳統(tǒng)FA過早陷入局部最優(yōu)解的不足;對(duì)聚類后的不同訓(xùn)練子集,分別由極端學(xué)習(xí)機(jī)(extreme learning machine, ELM)建立子模型,由IFA對(duì)其中的隱含層輸入權(quán)值、隱含層神經(jīng)元的偏置和隱含層節(jié)點(diǎn)個(gè)數(shù)進(jìn)行優(yōu)化選取;最后,將多個(gè)子模型的結(jié)果取加權(quán)平均值輸出。由國內(nèi)某油田作業(yè)區(qū)一口生產(chǎn)井進(jìn)行實(shí)例驗(yàn)證,結(jié)果表明所提出方法具有較高的預(yù)測(cè)精度,對(duì)于實(shí)現(xiàn)油井油液含水率的軟測(cè)量是合理有效的。

      關(guān)鍵詞:軟測(cè)量;油井油液含水率;譜聚類;極端學(xué)習(xí)機(jī);螢火蟲算法;測(cè)量;石油;模型

      引 言

      油井油液的含水率是油田生產(chǎn)的一個(gè)重要指標(biāo),對(duì)原油的開采、計(jì)量、運(yùn)輸?shù)榷加兄匾挠绊?。油液含水率不僅關(guān)系到油井的工作壽命,還關(guān)系到油田生產(chǎn)企業(yè)的經(jīng)濟(jì)效益。因此,油液含水率的準(zhǔn)確測(cè)量對(duì)計(jì)量油井產(chǎn)量、掌握油井生產(chǎn)動(dòng)態(tài)、評(píng)價(jià)油藏的開發(fā)程度和價(jià)值、制定合理開發(fā)措施等具有十分重要的意義。油液是油、氣和水的混合體,其含水率的計(jì)算公式為

      其中,m水、m油和m氣分別表示油液中水、油和氣的質(zhì)量。一般來說,m氣遠(yuǎn)遠(yuǎn)小于m水和m油的和,所以油液含水率可以近似定義為

      目前,國內(nèi)對(duì)油井油液含水率的測(cè)量一般采用人工取樣后蒸餾測(cè)試的方法,存在周期長(zhǎng)、誤差大、實(shí)時(shí)性低、人力成本高等問題。按照傳統(tǒng)的方法,油田作業(yè)區(qū)的每口井從原油采集到人工取樣再到給出測(cè)量結(jié)果,一般需要一到兩天的時(shí)間,致使目前生產(chǎn)中存在無法根據(jù)測(cè)量結(jié)果及時(shí)、準(zhǔn)確地獲知油井生產(chǎn)的真實(shí)情況等問題,從而不能制定合理高效的油井開采方案。

      軟測(cè)量技術(shù)是由比較容易測(cè)量的變量通過構(gòu)造某種數(shù)學(xué)關(guān)系來推斷難以測(cè)量的主要變量,實(shí)現(xiàn)某種程度上由軟件計(jì)算代替硬件直接測(cè)量的功能;其目的就是利用較易獲取的可測(cè)信息,通過數(shù)學(xué)建模來實(shí)現(xiàn)對(duì)主要變量的推斷。針對(duì)目前生產(chǎn)中采用機(jī)理模型測(cè)量油井油液含水率方法中所存在的不足,文獻(xiàn)[1]提出采用軟測(cè)量技術(shù)進(jìn)行估算,建立了基于支持向量機(jī)的原油含水率軟測(cè)量模型;文獻(xiàn)[2]提出基于BP神經(jīng)網(wǎng)絡(luò)和CPN網(wǎng)絡(luò)的原油含水率軟測(cè)量方法;文獻(xiàn)[3]提出基于粒子群優(yōu)化 RBF神經(jīng)網(wǎng)絡(luò)的原油含水率軟測(cè)量方法,采用粒子群優(yōu)化算法對(duì) RBF神經(jīng)網(wǎng)絡(luò)的相關(guān)參數(shù)進(jìn)行優(yōu)化;文獻(xiàn)[4]提出果蠅優(yōu)化廣義回歸神經(jīng)網(wǎng)絡(luò)的原油含水率軟測(cè)量方法,采用果蠅優(yōu)化算法對(duì)廣義回歸神經(jīng)網(wǎng)絡(luò)的相關(guān)參數(shù)進(jìn)行優(yōu)化。

      在實(shí)際工業(yè)生產(chǎn)中,受數(shù)據(jù)采集設(shè)備、生產(chǎn)工藝和技術(shù)等的影響,傳統(tǒng)的基于單一模型的軟測(cè)量建模方法存在模型訓(xùn)練復(fù)雜度高、過程特性匹配不佳和預(yù)測(cè)精度低等問題[5-7]。隨著軟測(cè)量理論的不斷發(fā)展,基于多模型的軟測(cè)量建模方法越來越受到重視,通過將多個(gè)模型的預(yù)測(cè)結(jié)果相加,提高模型的預(yù)測(cè)精度和泛化能力[6]。其中,基于聚類的多模型軟測(cè)量建模方法是近年來一個(gè)重要的研究方向,通過聚類算法將數(shù)據(jù)樣本分為多個(gè)類,同一類內(nèi)的數(shù)據(jù)具有較高的相似度,而不同類數(shù)據(jù)的相似度較低,由不同類數(shù)據(jù)分別訓(xùn)練模型,再綜合不同模型的預(yù)測(cè)結(jié)果,從而提高軟測(cè)量模型對(duì)具有不同過程特性數(shù)據(jù)樣本的適應(yīng)能力。文獻(xiàn)[5]首先采用自適應(yīng)模糊核聚類和最小二乘支持向量機(jī)進(jìn)行多模型建模,然后由 D-S 證據(jù)理論對(duì)多個(gè)模型的輸出進(jìn)行融合得到總的輸出,再由ARIMA 模型進(jìn)行動(dòng)態(tài)校正,但是在聚類過程中并沒有考慮訓(xùn)練樣本集的數(shù)據(jù)分布情況,另外采用交叉驗(yàn)證法確定高斯核函數(shù)中的 c 和σ,計(jì)算復(fù)雜度高,參數(shù)確定較慢;文獻(xiàn)[6]采用放射傳播聚類和最小二乘支持向量機(jī)進(jìn)行多模型建模,然后由 D-S 證據(jù)理論對(duì)多個(gè)輸出結(jié)果進(jìn)行合成,但是由于放射傳播聚類輸出的聚類數(shù)目依賴于輸入的偏向參數(shù)p[8], 如何確定合理的p并未在文中涉及;文獻(xiàn)[7]首先采用FCM方法將訓(xùn)練集樣本聚類為c類,然后對(duì)每一個(gè)數(shù)據(jù)子類建立高斯回歸子模型,最后采用D-S 證據(jù)理論對(duì)多個(gè)子模型的輸出結(jié)果進(jìn)行合成,但是,采用 FCM方法并沒有考慮訓(xùn)練集樣本的數(shù)據(jù)分布特性,另外,聚類個(gè)數(shù)c需要提前給定;文獻(xiàn)[9]采用FCM方法和高斯回歸模型建立集成的多軟測(cè)量模型,采用Adaboost算法訓(xùn)練樣本的權(quán)重,從而提高算法的泛化能力和預(yù)測(cè)精度,但是同樣,F(xiàn)CM方法沒有考慮訓(xùn)練集樣本的數(shù)據(jù)分布特性,以及聚類個(gè)數(shù)c需要提前給定。

      傳統(tǒng)的K-means、FCM聚類算法雖然實(shí)現(xiàn)簡(jiǎn)單,但是要求數(shù)據(jù)集形狀為凸球形,而在實(shí)際工業(yè)生產(chǎn)中,所采集的數(shù)據(jù)集很難滿足這一條件,因此聚類結(jié)果極易陷入局部最優(yōu)。譜聚類是近年來提出的一種基于圖論的聚類算法[10],適用于任意形狀的數(shù)據(jù)集,且能夠收斂于全局最優(yōu)解,已在很多領(lǐng)域取得了較好的應(yīng)用效果[11-14]。本文首先對(duì)傳統(tǒng)的譜聚類算法進(jìn)行改進(jìn),提出了一種改進(jìn)的自動(dòng)譜聚類算法,將聚類數(shù)目k和尺度參數(shù)σ看作優(yōu)化目標(biāo),由改進(jìn)的螢火蟲算法對(duì)其進(jìn)行優(yōu)化選取,所提出的改進(jìn)螢火蟲算法,針對(duì)傳統(tǒng)螢火蟲算法易發(fā)生“早熟”的情況,提出一種搜索解的選擇機(jī)制,以一個(gè)較低的概率將活力較低的螢火蟲在搜索空間內(nèi)去除,同時(shí)產(chǎn)生一個(gè)新的螢火蟲;然后,對(duì)于聚類后的每一個(gè)數(shù)據(jù)子集,采用極端學(xué)習(xí)機(jī)建立軟測(cè)量子模型,極端學(xué)習(xí)機(jī)是由Huang等[15]于2006年提出的一種新型的前饋神經(jīng)網(wǎng)絡(luò),摒棄像BP算法等傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法由于人為設(shè)置大量網(wǎng)絡(luò)訓(xùn)練參數(shù)而極易陷入局部最優(yōu)解的不足,能夠產(chǎn)生唯一的最優(yōu)解;最后,將多個(gè)子模型的輸出結(jié)果相結(jié)合得到最終結(jié)果。將研究成果應(yīng)用于某油田作業(yè)區(qū)一口作業(yè)井的油液含水率的測(cè)量中進(jìn)行了實(shí)例驗(yàn)證。

      1 譜聚類算法(SC)

      1.1 傳統(tǒng)譜聚類算法

      譜聚類算法有很多不同的具體實(shí)現(xiàn)方法,本文采用基于規(guī)范化拉普拉斯矩陣的譜聚類算法[10]。給定輸入樣本集X={x1, x2,…, xn},設(shè)定聚類數(shù)目k和尺度參數(shù)σ,其中σ為所采用的高斯核函數(shù)的尺度參數(shù),定義如下

      其中,xi, xj∈X。

      建立相似度矩陣S∈Rn×n,計(jì)算規(guī)范化度矩陣D,然后構(gòu)造規(guī)范化拉普拉斯矩陣L=D-1/2(D-S)D-1/2;對(duì)L進(jìn)行特征值分解,計(jì)算前k個(gè)最小的特征值對(duì)應(yīng)的特征向量u1, u2, …, uk,將特征向量u1, u2, …, uk進(jìn)行列排列,組成矩陣U,令Y∈Rk對(duì)應(yīng)U的第i(i=1, 2, …, n)行向量;最后由K-means算法將(Yi)i=1,2,…,n聚類為k類。

      由于傳統(tǒng)的譜聚類算法中的分類算法還是K-means算法,因而需要預(yù)先指定聚類數(shù)目 k;另外,譜聚類算法對(duì)其中的尺度參數(shù)σ較為敏感,傳統(tǒng)的方法是憑經(jīng)驗(yàn)預(yù)先設(shè)定不同的σ值,分別進(jìn)行聚類,將聚類結(jié)果中最好的σ作為參數(shù)。因此,傳統(tǒng)算法中對(duì)于k和σ的確定較為煩瑣,耗費(fèi)時(shí)間較多。對(duì)此,本文結(jié)合參數(shù)優(yōu)化的思想來改進(jìn)傳統(tǒng)的譜聚類算法,在每一次迭代中隨機(jī)調(diào)整k的值,然后將每一代k所對(duì)應(yīng)的聚類中心Center和σ作為一對(duì)搜索解,采用合適的指標(biāo)函數(shù),在搜索空間內(nèi)通過搜索最優(yōu)的指標(biāo)函數(shù)值來確定最佳的 Center和σ,隨之即可確定最佳的聚類數(shù)k。

      1.2 自動(dòng)譜聚類算法(ASC)

      1.2.1 CritC指標(biāo)函數(shù) 本文采用CritC指標(biāo)函數(shù)[16],該指標(biāo)能夠很好地綜合不同類數(shù)據(jù)之間的相異性和相同類數(shù)據(jù)之間的相似性,定義如下

      1.2.2 改進(jìn)的螢火蟲算法(IFA) 螢火蟲算法是由Yang[17]提出的一種新型的群智能優(yōu)化算法,它源于自然界中螢火蟲的熒光行為,能夠較好地應(yīng)用于多種優(yōu)化問題[18-21]。首先定義每個(gè)螢火蟲的亮度為I(r),其中r表示兩個(gè)螢火蟲之間的笛卡爾距離;然后定義兩個(gè)螢火蟲間的吸引度 β(r),每個(gè)螢火蟲受到比它亮度更亮的螢火蟲的吸引而移動(dòng),位置更新公式如下

      其中,α表示步長(zhǎng),α∈[0,1];rand為[0,1]上服從均勻分布的一個(gè)隨機(jī)數(shù)。

      但是,F(xiàn)A算法在搜索最優(yōu)解過程中易發(fā)生“早熟”情況從而陷入局部最優(yōu)[22]。對(duì)此,本文對(duì)經(jīng)典FA算法進(jìn)行改進(jìn),提出了改進(jìn)的FA算法(IFA)。給定一閾值 ξ,當(dāng)螢火蟲向比它亮度更亮的螢火蟲移動(dòng)時(shí),如果它們之間的距離r≤ξ,則認(rèn)為該螢火蟲的活力(搜索新區(qū)域的能力)較低,那么以一定的概率p(p∈(0,0.5))將該螢火蟲在搜索空間內(nèi)去除,同時(shí)在搜索空間內(nèi)隨機(jī)產(chǎn)生一個(gè)新的螢火蟲。

      閾值ξ的定義如下

      式中,IBrightest表示最亮螢火蟲的亮度;Ii表示第i個(gè)螢火蟲的亮度;N為螢火蟲的數(shù)量。

      IFA算法中,通過這種方式,以一定概率跳出當(dāng)前解,在一定程度上更改搜索解的位置更新路線,搜索新的解空間區(qū)域,從而避免過早陷入局部最優(yōu)解的情況。IFA算法的主要步驟如下:

      (1)產(chǎn)生初始螢火蟲群體,{X1, X2,…, XN};

      (2)計(jì)算每個(gè)螢火蟲的亮度,{I1, I2,…, IN};

      (3)每個(gè)螢火蟲根據(jù)式(5)進(jìn)行位置更新,如果兩個(gè)螢火蟲之間的距離r≤ξ,以一定的概率p(p ∈(0,0.5))將該螢火蟲在搜索空間內(nèi)去除,同時(shí)在搜索空間內(nèi)隨機(jī)產(chǎn)生一個(gè)新的螢火蟲;

      (4)更新解集中每一代的當(dāng)前最優(yōu)解和所有代的全局最優(yōu)解;

      (5)如果滿足終止條件,停止迭代,否則返回步驟(2)重新迭代。

      1.2.3 基于IFA優(yōu)化的SC算法(IFA-SC) 對(duì)于改進(jìn)的SC算法,在自動(dòng)聚類過程中還涉及兩個(gè)問題,一個(gè)是最佳聚類數(shù)k的確定,另一個(gè)是當(dāng)k確定后最佳聚類中心的確定。對(duì)于k的選擇,在每一次迭代中,可以采用隨機(jī)選取的策略,k的取值范圍為:k∈[1,](n為樣本數(shù))[23];然后在每一個(gè)k下,將聚類中心Center和尺度參數(shù)σ看作一對(duì)搜索解(螢火蟲),由 IFA算法進(jìn)行優(yōu)化選取,在搜索空間內(nèi)通過搜索最佳的 CritC值來確定最優(yōu)的Center和σ。當(dāng)最優(yōu)的Center確定時(shí),最佳的聚類數(shù)目k也隨之確定。

      所提出的IFA-SC算法的主要步驟如下:

      (2)給定初始的Center和σ(σ∈(0, 1])值,隨機(jī)產(chǎn)生初始螢火蟲群體,計(jì)算初始群體中每個(gè)螢火蟲的亮度;

      (3)根據(jù)SC算法將數(shù)據(jù)集聚類為k類,計(jì)算當(dāng)前聚類結(jié)果的CritC指標(biāo)值;

      (4)根據(jù)式(5)更新每個(gè)螢火蟲的位置;(5)由IFA算法進(jìn)行迭代選擇,更新當(dāng)前最優(yōu)解和全局最優(yōu)解,達(dá)到設(shè)定的迭代次數(shù)停止;

      (6)隨機(jī)產(chǎn)生一個(gè)新的k值,重復(fù)步驟(2)~步驟(5);

      (7)如果滿足終止條件,停止迭代,輸出全局最優(yōu)解,否則返回步驟(6)重新迭代;

      (8)輸出的全局最優(yōu)解為最優(yōu)的Center和σ,由步驟(3)將數(shù)據(jù)集聚類為k類。

      1.2.4 仿真實(shí)驗(yàn) 為了說明本文所提出 IFA-SC算法的有效性,由UCI數(shù)據(jù)庫中的iris、wine和seeds數(shù)據(jù)集進(jìn)行仿真實(shí)驗(yàn)。首先,為了說明不同尺度參數(shù)值對(duì)SC算法的影響,分別賦予其不同的σ值,由3個(gè)數(shù)據(jù)集分別進(jìn)行仿真,結(jié)果如圖1所示。

      圖1 不同σ下iris、wine和seeds數(shù)據(jù)集的聚類準(zhǔn)確率Fig.1 Clustering accuracy of iris, wine and seeds data setswith different σ

      由圖1可以看到,對(duì)于iris、wine和seeds數(shù)據(jù)集,不同的σ值對(duì)聚類準(zhǔn)確率的影響是較大的,若依賴手動(dòng)設(shè)置,不合適的σ值會(huì)影響聚類效果。另外,可以看到,當(dāng)σ在[0, 1]區(qū)間內(nèi)取值時(shí)可以得到最高的聚類準(zhǔn)確率,因此,為了提高聚類的效率,本文將σ限定在[0, 1]區(qū)間內(nèi)取值。為了進(jìn)一步說明本IFA-SC改進(jìn)算法的有效性,將其與SC和FA-SC進(jìn)行聚類效果的對(duì)比分析,聚類準(zhǔn)確率如表1所示(運(yùn)行20次),最大迭代次數(shù)為500代。

      表1 不同方法聚類準(zhǔn)確率對(duì)比Table 1 Comparison of clustering accuracy of different methods

      由表1,對(duì)于經(jīng)典的SC算法,當(dāng)指定合適的σ 和k的值時(shí),聚類的效果較好,且多次運(yùn)行具有較好的聚類穩(wěn)定性;但是對(duì)于FA-SC算法,運(yùn)行多次程序后,最大聚類準(zhǔn)確率雖然與經(jīng)典的SC算法相比差別不大,但是多次聚類的平均值卻較低,說明經(jīng)典FA算法中的“早熟”情況影響了聚類的穩(wěn)定性;而改進(jìn)后的 IFA-SC算法由于采用了“跳出”機(jī)制以杜絕過早陷入局部最優(yōu)解的情況,不僅保證了聚類的準(zhǔn)確率,還提高了聚類的穩(wěn)定性。

      2 極端學(xué)習(xí)機(jī)(ELM)

      2.1 基本原理

      ELM 將傳統(tǒng)單隱層前饋神經(jīng)網(wǎng)絡(luò)參數(shù)的訓(xùn)練問題轉(zhuǎn)化為線性方程組的求解問題,整個(gè)訓(xùn)練過程不需要反復(fù)調(diào)整相關(guān)參數(shù)。因此,與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)方法相比,ELM的訓(xùn)練速度得到提高,具有學(xué)習(xí)速度快、泛化能力強(qiáng)和不易陷入局部收斂等優(yōu)點(diǎn)。

      其中,βj為隱含層神經(jīng)元與第i個(gè)輸出神經(jīng)元之間的連接權(quán)值;ωj為隱含層神經(jīng)元與輸入神經(jīng)元之間的連接權(quán)值;bj為第j個(gè)隱含層神經(jīng)元的偏置。

      其中,H+為H的Moore-Penrose廣義逆。

      ELM計(jì)算的主要步驟如下:

      (1)初始化,隨機(jī)生成ω、b和L;

      (2)計(jì)算隱含層輸出矩陣H;

      (4)計(jì)算輸出值。

      2.2 IFA-ELM

      由ELM的基本原理,在初始化階段,隱含層輸入權(quán)值ω、隱含層神經(jīng)元偏置b和隱含層節(jié)點(diǎn)個(gè)數(shù)L的值隨機(jī)給定。那么,ELM模型的輸出值會(huì)受到隨機(jī)設(shè)定的ω、b和L的值的影響;對(duì)此,本文采用IFA算法對(duì)ω、b和L進(jìn)行優(yōu)化選取,IFA-ELM建模主要步驟如下:

      (1)設(shè)定待優(yōu)化參數(shù)ω、b和L的取值范圍,其中,ω∈[0, 1],b∈[0, 10],L∈(1, N];

      (2)將數(shù)據(jù)集樣本歸一化到區(qū)間[0, 1];

      (3)由IFA算法進(jìn)行待優(yōu)化參數(shù)ω和b的優(yōu)化選取,對(duì)于 L,每一次迭代都在取值范圍內(nèi)隨機(jī)取一個(gè)值,根據(jù)2.1節(jié)ELM建模的步驟(1)~步驟(4)計(jì)算所有樣本的輸出值,將數(shù)據(jù)集所有樣本的實(shí)際值和模型輸出值的均方根誤差作為適應(yīng)度函數(shù);

      (4)若滿足終止條件,輸出記錄的最優(yōu)參數(shù);若不滿足終止條件,返回步驟(3)重新迭代選擇;

      (5)將得到的最優(yōu)的ω、b和L作為ELM模型的參數(shù),計(jì)算輸出值并進(jìn)行反歸一化處理。

      2.3 仿真驗(yàn)證

      為了驗(yàn)證所提出IFA-ELM方法的有效性,采用如下非線性函數(shù)進(jìn)行仿真實(shí)驗(yàn)

      其中,x1∈[0, 1],x2∈[-5, 5]。

      隨機(jī)生成300組數(shù)據(jù)進(jìn)行仿真,隨機(jī)選取250組數(shù)據(jù)作為訓(xùn)練樣本建立模型,剩余50組數(shù)據(jù)作為測(cè)試樣本,將本文所提出的 IFA-ELM方法分別與FA-ELM、BP[2]、PSO-RBF[3]、FOA-GRNN[4]和DCI-ELM[24]進(jìn)行對(duì)比分析。幾種方法 RMSE和MAE指標(biāo)對(duì)比結(jié)果如表2所示,訓(xùn)練結(jié)果和預(yù)測(cè)結(jié)果如圖 2和圖 3所示。相比于 BP、PSO-RBF、FOA-GRNN、FA-ELM和DCI-ELM幾種不同的方法,所提出的IFA-ELM方法具有較好的預(yù)測(cè)效果。

      表3 針對(duì)非線性函數(shù)不同方法的MAE和RMSE指標(biāo)對(duì)比Table 2 Comparison of MAE and RMSE index value of different methods for nonlinear function

      3 自動(dòng)譜聚類與多極端學(xué)習(xí)機(jī)模型(ASC-MELM)

      本文所提出的ASC-MELM模型的結(jié)構(gòu)框圖如圖4所示。

      圖2 不同方法的預(yù)測(cè)值對(duì)比Fig.2 Comparison of predicted value of different methods

      圖3 不同方法的預(yù)測(cè)誤差Fig.3 Comparison of predicted error of different methods

      圖4 ASC-MELM結(jié)構(gòu)框圖Fig.4 Structure diagram of ASC-MELM

      ASC-MELM模型算法的具體實(shí)現(xiàn)步驟如下。

      (1)確定訓(xùn)練集,將其進(jìn)行預(yù)處理。

      (2)由IFA-SC算法將訓(xùn)練集樣本自動(dòng)聚類為k類,分別表示為樣本子集1,…,樣本子集k。

      (3)分別由每一個(gè)樣本子集訓(xùn)練 IFA-ELM軟測(cè)量模型,表示為IFA-ELM 1,…,IFA-ELM k。

      (4)確定測(cè)試集樣本,對(duì)其進(jìn)行預(yù)處理。

      (5)由測(cè)試集樣本與每一個(gè)樣本子集的聚類中心計(jì)算權(quán)值w1,w2,…,wk,計(jì)算方法如下。

      假設(shè)測(cè)試樣本集T={T1, T2, …, TM}由M個(gè)樣本組成,每個(gè)樣本為d維;k個(gè)聚類中心分別表示為: Center1,Center2,…,Centerk,都為d維。計(jì)算測(cè)試樣本集中第i個(gè)樣本與第j個(gè)聚類中心的歐氏距離

      其中,i=1, 2, …, M;j=1, 2, …, k。

      那么,計(jì)算第 i個(gè)測(cè)試集樣本相對(duì)于第 j個(gè)IFA-ELM模型的權(quán)值如下

      其中,i=1, 2, …, M;j=1, 2, …, k。

      (6)將測(cè)試集樣本作為每一個(gè) IFA-ELM模型的輸入,分別得到k個(gè)模型的輸出結(jié)果。

      (7)將步驟(5)得到的k個(gè)權(quán)值和步驟(6)得到的k個(gè)輸出結(jié)果求加權(quán)平均,得到最終輸出值。

      (8)為了降低系統(tǒng)的時(shí)變性對(duì)模型預(yù)測(cè)效果的影響,使所建立的模型能夠跟隨新的采樣數(shù)據(jù)進(jìn)行更新,本文采用文獻(xiàn)[25]中的方法進(jìn)行模型的在線更新。當(dāng)輸入新的樣本數(shù)據(jù)后,將其加入建模數(shù)據(jù)集中,同時(shí)刪除時(shí)間點(diǎn)最舊的數(shù)據(jù)以保證建模數(shù)據(jù)集中數(shù)據(jù)數(shù)量的一致,另外設(shè)置長(zhǎng)度一定的預(yù)測(cè)數(shù)據(jù)集,然后根據(jù)步驟(1)~步驟(7)得到預(yù)測(cè)數(shù)據(jù)集,設(shè)置預(yù)測(cè)誤差累計(jì)閾值,當(dāng)預(yù)測(cè)數(shù)據(jù)集預(yù)測(cè)誤差的累計(jì)值大于該閾值時(shí),重新訓(xùn)練模型進(jìn)行更新,否則不變。

      4 實(shí)例驗(yàn)證

      游梁式抽油機(jī)采油系統(tǒng)是國內(nèi)外油田生產(chǎn)中最主要的生產(chǎn)方式,本文將國內(nèi)某油田作業(yè)區(qū)一口生產(chǎn)井作為實(shí)驗(yàn)對(duì)象,采集其一段時(shí)期內(nèi)的生產(chǎn)數(shù)據(jù)進(jìn)行驗(yàn)證。

      油井生產(chǎn)過程中,油液由抽油泵通過抽油桿的上下往復(fù)運(yùn)動(dòng)輸送到井口流出。井口流出油液與懸點(diǎn)載荷、沖次、沖程、井口壓力等參數(shù)密切相關(guān),而這些井上參數(shù)是比較容易測(cè)量的。因此,在油液含水率的軟測(cè)量中,選擇容易直接測(cè)量的一些生產(chǎn)參數(shù)作為輔助變量,通過對(duì)生產(chǎn)工藝的研究和現(xiàn)場(chǎng)生產(chǎn)經(jīng)驗(yàn)以及查閱相關(guān)文獻(xiàn)[26-27],本文選擇上下沖程平均載荷差、沖次、沖程、產(chǎn)液量、井口油壓和套壓作為輔助變量。

      選取該生產(chǎn)井300組生產(chǎn)數(shù)據(jù)進(jìn)行仿真驗(yàn)證,隨機(jī)選取250組數(shù)據(jù)作為訓(xùn)練樣本用以建立軟測(cè)量模型,剩余50組數(shù)據(jù)作為測(cè)試樣本。在人工測(cè)量油液含水率時(shí),由于人工化驗(yàn)的周期較長(zhǎng),會(huì)造成得到測(cè)試結(jié)果的時(shí)刻和各輔助變量記錄的時(shí)刻不一致;因此,為了保證軟測(cè)量建模的準(zhǔn)確性,記錄每一組數(shù)據(jù)中油液采樣的時(shí)刻,使其與各輔助變量的采樣時(shí)刻相匹配。首先由 IFA-SC算法將訓(xùn)練集樣本進(jìn)行自動(dòng)聚類,得到的聚類結(jié)果如圖5所示,由于訓(xùn)練樣本集數(shù)據(jù)為多維,為了顯示聚類效果,采用PCA主元分析方法提取主元,將聚類后的數(shù)據(jù)映射到二維空間。

      圖5 基于IFA-SC算法的訓(xùn)練樣本的自動(dòng)聚類Fig.5 Automatic clustering results of training samples based on IFA-SC

      由圖5可以看到,訓(xùn)練集樣本被自動(dòng)聚類為4類(即k=4),樣本數(shù)目分別為101、38、61和50;然后由每一類的樣本數(shù)據(jù)分別訓(xùn)練 IFA-ELM軟測(cè)量模型,得到4個(gè)子模型;再由測(cè)試樣本計(jì)算每一個(gè) IFA-ELM子模型對(duì)應(yīng)的權(quán)值 w1、w2、w3和w4;最后對(duì)4個(gè)子模型輸出求加權(quán)平均得到最終結(jié)果。

      為了驗(yàn)證本文所提出ASC-MELM軟測(cè)量模型的有效性,將其與IFA-ELM、BP[2]、PSO-RBF[3]、FOA-GRNN[4]和DCI-ELM[24]幾種不同方法進(jìn)行比較,幾種方法的RMSE和MAE指標(biāo)值對(duì)比如表3所示,預(yù)測(cè)結(jié)果對(duì)比如圖6和圖7所示。

      表3 針對(duì)油液含水率幾種方法的MAE和RMSE指標(biāo)對(duì)比Table 3 Comparison of MAE and RMSE index value of different methods for moisture content of well oil

      圖6 ASC-MELM與幾種方法的預(yù)測(cè)結(jié)果對(duì)比Fig.6 Comparison of predicted value between ASC-MELM and several methods

      圖7 幾種方法的預(yù)測(cè)誤差率對(duì)比Fig.7 Comparison of predicted error of different methods

      根據(jù)表3、圖6和圖7的對(duì)比結(jié)果可以看到,當(dāng)不采用聚類方法時(shí),本文所提出的IFA-ELM單一模型的預(yù)測(cè)效果優(yōu)于BP、PSO-RBF、FOA-GRNN 和DCI-ELM幾種方法;當(dāng)采用ASC聚類方法將數(shù)據(jù)集進(jìn)行分類后,多模型的預(yù)測(cè)性能又有提高,說明所提出的ASC-MELM方法是有效的。

      5 結(jié) 論

      針對(duì)油井油液含水率單一軟測(cè)量模型精度較低的不足,提出基于自動(dòng)譜聚類與多極端學(xué)習(xí)機(jī)的軟測(cè)量模型。由提出的自動(dòng)譜聚類算法對(duì)訓(xùn)練集進(jìn)行自動(dòng)分類,對(duì)不同子集分別建立極端學(xué)習(xí)機(jī)軟測(cè)量模型,對(duì)多個(gè)輸出取加權(quán)平均值。由改進(jìn)的螢火蟲算法對(duì)聚類數(shù)目、尺度參數(shù)、隱含層輸入權(quán)值、隱含層神經(jīng)元的偏置和隱含層節(jié)點(diǎn)個(gè)數(shù)進(jìn)行優(yōu)化選取。由某油田一口生產(chǎn)井的生產(chǎn)數(shù)據(jù)進(jìn)行實(shí)例驗(yàn)證,結(jié)果表明,所提出方法具有較好的預(yù)測(cè)性能。

      References

      [1] 李志明, 孔令富. 基于SVM的軟測(cè)量在原油含水率估算中的應(yīng)用[J]. 燕山大學(xué)學(xué)報(bào), 2006, 30(4): 328-333.

      LI Z M, KONG L F. Application of soft sensor based on SVM on estimation of water cut of crude oil[J]. Journal of Yanshan University, 2006, 30(4): 328-333.

      [2] 王麗娜, 劉翠玲. 基于CPN網(wǎng)絡(luò)井口計(jì)量原油含水率預(yù)測(cè)模型[J].東北石油大學(xué)學(xué)報(bào), 2009, 33(6): 101-104.

      WANG L N, LIU C L. Model for prediction of crude oil water content at wellhead metering based on CPN neural network[J]. Journal of Daqing Petroleum Institute, 2009, 33(6): 101-104.

      [3] 吳良海. 基于粒子群優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)原油含水率預(yù)測(cè)[J]. 計(jì)算機(jī)仿真, 2010, 27(5): 261-263.

      WU L H. Prediction of crude oil moisture based on RBF neural network optimized by PSO[J]. Computer Simulation, 2010, 27(5): 261-263.

      [4] 劉翠玲, 張路路, 王進(jìn)旗, 等. 基于FOA-GRNN油井計(jì)量原油含水率的預(yù)測(cè)[J]. 計(jì)算機(jī)仿真, 2012, 29(11): 243-246.

      LIU C L, ZHANG L L, WANG J Q, et al. Application of FOA-GRNN to prediction of moisture content in crude oil of wellhead metering[J]. Computer Simulation, 2012, 29(11): 243-246.

      [5] 王振雷, 唐苦, 王昕. 一種基于D-S和ARIMA的多模型軟測(cè)量方法[J]. 控制與決策, 2014, 29(7): 1160-1166.

      WANG Z L, TANG K, WANG X. A multi-model soft sensing method based on D-S and ARIMA model[J]. Control and Decision, 2014, 29(7):1160-1166.

      [6] 唐苦, 王昕, 王振雷. 基于證據(jù)合成規(guī)則的多模型軟測(cè)量[J]. 控制理論與應(yīng)用, 2014, 31(5):632-637.

      TANG K, WANG X, WANG Z L. Multi-model soft sensor based on Dempster-Shafer rule[J]. Control Theory & Applications, 2014, 31(5):632-637.

      [7] 梅從立, 楊銘, 劉國海. 基于證據(jù)合成的高斯過程回歸多模型軟測(cè)量方法[J]. 化工學(xué)報(bào), 2015, 66(11): 4555-4564.

      MEI C L, YANG M, LIU G H. A multi-model based soft sensor using evidence theory and Gaussian process regression[J]. CIESC Journal, 2015, 66(11): 4555-4564.

      [8] 王開軍, 張軍英, 李丹, 等. 自適應(yīng)仿射傳播聚類[J]. 自動(dòng)化學(xué)報(bào), 2007, 33(12): 1242-1246.

      WANG K J, ZHANG J Y, LI D, et al. Adaptive affinity propagation clustering[J]. Acta Automatic Sinica, 2007, 33(12): 1242-1246.

      [9] 嵇小輔, 張翔. 基于FCM與集成高斯過程回歸的賴氨酸發(fā)酵軟測(cè)量[J]. 智能系統(tǒng)學(xué)報(bào), 2015, 10(1): 156-162.

      JI X F, ZHANG X. Soft measurement of lysine fermentation based on FCM and integrated Gaussian process regression[J]. CAAI Transactions on Intelligent Systems, 2015, 10(1): 156-162.

      [10] VON LUXBURG U. A tutorial on spectral clustering[J]. Statistics and Computing, 2007, 17(4): 395-416.

      [11] HU H, WANG X, YANG Z, et al. A spectral clustering approach to identifying cuts in wireless sensor networks[J]. Sensors Journal, IEEE, 2015, 15(3): 1838-1848.

      [12] WANG S, LU J, GU X, et al. Unsupervised discriminant canonical correlation analysis based on spectral clustering[J]. Neurocomputing, 2016, 171: 425-433.

      [13] LIU H, ZHAO F, JIAO L. Fuzzy spectral clustering with robust spatial information for image segmentation[J]. Applied Soft Computing, 2012, 12(11): 3636-3647.

      [14] MEHRKANOON S, ALZATE C, MALL R, et al. Multiclass semisupervised learning based upon kernel spectral clustering[J]. IEEE Transactions on Neural Networks and Learning Systems, 2015, 26(4): 720-733.

      [15] HUANG G B, ZHU Q Y, SIEW C K. Extreme learning machine: theory and applications[J]. Neurocomputing, 2006, 70(1): 489-501.

      [16] BREABAN M, LUCHIAN H. A unifying criterion for unsupervised clustering and feature selection[J]. Pattern Recognition, 2011, 44(4): 854-865.

      [17] YANG X S. Nature-inspired Metaheuristic Algorithms[M]. Beckington: Luniver Press, 2010.

      [18] LONG N C, MEESAD P, UNGER H. A highly accurate firefly based algorithm for heart disease prediction[J]. Expert Systems with Applications, 2015, 42(21): 8221-8231.

      [19] SAHU R K, PANDA S, PADHAN S. A hybrid firefly algorithm and pattern search technique for automatic generation control of multi area power systems[J]. International Journal of Electrical Power & Energy Systems, 2015, 64: 9-23.

      [20] OLATOMIWA L, MEKHILEF S, SHAMSHIRBAND S, et al. A support vector machine-firefly algorithm-based model for global solar radiation prediction[J]. Solar Energy, 2015, 115: 632-644.

      [21] BAYKASOGLU A, OZSOYDAN F B. Adaptive firefly algorithm with chaos for mechanical design optimization problems[J]. Applied Soft Computing, 2015, 36: 152-164.

      [22] YU S, ZHU S, MA Y, et al. Enhancing firefly algorithm using generalized opposition-based learning[J]. Computing, 2015: 1-14.

      [23] 于劍, 程乾生. 模糊聚類方法中的最佳聚類數(shù)的搜索范圍[J]. 中國科學(xué)(E輯), 2002, 32(2): 274-280.

      YU J, CHEN Q S. Search range of the optimal cluster number in fuzzy clustering [J]. Science in China (Series E), 2002, 32(2): 274-280.

      [24] 王超, 王建輝, 顧樹生,等. 改進(jìn)式混合增量極限學(xué)習(xí)機(jī)算法[J].控制與決策, 2015, 30(11): 1981-1986.

      WANG C, WANG J H, GU S S, et al. Improved hybrid incremental extreme learning machine algorithm[J]. Control & Decision, 2015, 30(11): 1981-1986.

      [25] 田中大, 李樹江, 王艷紅, 等. 短期風(fēng)速時(shí)間序列混沌特性分析及預(yù)測(cè)[J]. 物理學(xué)報(bào), 2015, 64(3): 030506-1-12.

      TIAN Z D, LI S J, WANG Y H, et al. Chaotic characteristics analysis and prediction for short-term wind speed time series[J]. Acta Phys. Sin., 2015, 64(3): 030506-1-12.

      [26] 李翔宇, 高憲文, 侯延彬. 基于在線動(dòng)態(tài)高斯過程回歸抽油井動(dòng)液面軟測(cè)量建模[J]. 化工學(xué)報(bào), 2015, 6(6): 2150-2158.

      LI X Y, GAO X W, HOU Y B. Online dynamic Gaussian process regression for dynamic liquid level soft sensing of sucker-rod pumping well[J]. CIESC Journal, 2015, 6(6): 2150-2158.

      [27] 王通, 高憲文, 劉文芳. 自適應(yīng)軟測(cè)量方法在動(dòng)液面預(yù)測(cè)中的研究與應(yīng)用[J]. 化工學(xué)報(bào), 2014, 65(12): 4898-4904.

      WANG T, GAO X W, LIU W F. Adaptive soft sensor method and application in determination of dynamic fluid levels[J]. CIESC Journal, 2014, 65(12): 4898-4904.

      2015-11-27收到初稿,2016-03-18收到修改稿。

      聯(lián)系人及第一作者:李琨(1983—),男,博士,副教授。

      Received date: 2015-11-27.

      中圖分類號(hào):TP 273

      文獻(xiàn)標(biāo)志碼:A

      文章編號(hào):0438—1157(2016)07—2925—09

      DOI:10.11949/j.issn.0438-1157.20151785

      基金項(xiàng)目:國家自然科學(xué)基金項(xiàng)目(61403040)。

      Corresponding author:LI Kun, bhulikun@163.com supported by the National Natural Science Foundation of China (61403040).

      Soft sensor method for moisture content of well oil based on automatic spectral clustering and multiple extreme learning

      LI Kun1, HAN Ying1, HUANG Haijiao2
      (1College of Engineering, Bohai University, Jinzhou 121013, Liaoning, China;2The Fifth District of Jinzhou Oil Production Plant, Liaohe Oilfield Company, Jinzhou 121209, Liaoning, China)

      Abstract:Moisture content of the well oil is a key production variable in the oilfield, and it has great significance for improving the oil production efficiency by timely and accurate measurement of it. In order to overcome some deficiencies of the traditional manual measurement, the soft sensor technology is introduced to establish a soft sensor model based on automatic spectral clustering - multiple extreme learning machines (ASC-MELM). An automatic spectral clustering (ASC) algorithm is proposed and an improved firefly algorithm (FA) is applied to reach an optimal selection of the clustering number and the scale parameter. The proposed improved firefly algorithm (IFA) adopts a mechanism of jumping out of the current solution at a certain probability, which can avoid the deficiency of falling into the local optimal solution earlier of the traditional FA. For different training subsets after the clustering, the multiple extreme learning machines (ELM) are adopted to establish the different sub-models, in which IFA is used to reach an optimal selection of the hidden layer input weights, the hidden layer biases and the number of the hidden layer nodes. Finally, the output is obtained by calculating the weighted average of multiple sub-models. An application example of an oil well in a domestic oilfield is given. The simulation results show that the proposed method has better predicted accuracy and it is reasonable and effectiveto realize the soft sensor for moisture content of the well oil.

      Key words:soft sensor; moisture content of well oil; spectral clustering; extreme learning machine; firefly algorithm; measurement; petroleum; model

      猜你喜歡
      油液螢火蟲含水率
      基于在線監(jiān)測(cè)的油液污染智能控制系統(tǒng)
      昆明森林可燃物燃燒機(jī)理研究
      基于表面能的濕煤顆粒含水率表征方法
      通過油液分析查找發(fā)動(dòng)機(jī)抱軸故障原因
      弱膨脹土增濕變形量試驗(yàn)及路堤填筑分析
      螢火蟲
      螢火蟲
      原油含水率在線測(cè)量技術(shù)研究
      電子制作(2016年1期)2016-11-07 08:42:56
      抱抱就不哭了
      夏天的螢火蟲
      林周县| 南皮县| 秀山| 申扎县| 余江县| 天镇县| 平昌县| 获嘉县| 安塞县| 松溪县| 普格县| 长岭县| 上蔡县| 蒙城县| 河源市| 侯马市| 德州市| 涿州市| 额尔古纳市| 罗江县| 洛隆县| 山阴县| 黄骅市| 涟水县| 金溪县| 三门峡市| 清苑县| 曲阳县| 峨边| 庄浪县| 泾源县| 剑川县| 开江县| 长葛市| 大关县| 成武县| 西畴县| 资兴市| 资溪县| 南宫市| 荆州市|