• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于卷積神經(jīng)網(wǎng)絡(luò)的原油組分光譜分析研究

    2022-01-04 07:03:50沈陽孔筍馮永仁左有祥周明高
    測井技術(shù) 2021年5期
    關(guān)鍵詞:校正預(yù)處理組分

    沈陽,孔筍,馮永仁,左有祥,周明高

    (中海油田服務(wù)股份有限公司油田技術(shù)研究院,河北三河065201)

    0 引 言

    油藏流體主要由各種碳?xì)浠衔锝M成,流體中的溶解氣數(shù)量多、差異大。碳?xì)浠衔镩_采和利用的各個方面都取決于流體的類型,而地層原油的組分含量是決定流體類型的關(guān)鍵,確定原油的組成對設(shè)備設(shè)計(jì)到開采策略具有重要的指導(dǎo)作用[1]。原油雖成分復(fù)雜,但其含氫基團(tuán)的震動吸收光譜的倍頻及組合頻正好位于近紅外光譜范圍(700~2 500 nm)內(nèi),因此,可以利用近紅外光譜對原油成分進(jìn)行測定[2-3]。近紅外光譜分析技術(shù)測量方便、速度快、成本低,非常適合于原油在線快速分析[4]。

    原油近紅外光譜分析中需要用多元校正方法。常用的方法有多元線性回歸法(Multiple Linear Regression,MLR)、主成分回歸法(Principal Component Analysis,PCR)、偏最小二乘法(Partial Least Squares,PLS)、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)和支持向量機(jī)(Support Vector Machines,SVM)等[5]。其中,MLR、PCR和PLS是線性方法,ANN和SVM屬于非線性方法。理想情況下,近紅外光譜的吸收強(qiáng)度與原油組分含量呈線性相關(guān),但受測井儀器的非線性響應(yīng)和井下環(huán)境的影響,實(shí)際采集的原油光譜與組分含量之間可能存在某種非線性關(guān)系。此時,僅采用線性方法難以正確反映近紅外光譜和原油成分之間的關(guān)系。

    因此,在建立校正模型之前,需要先對光譜進(jìn)行預(yù)處理,消除與原油組分含量無關(guān)的其他影響因素的干擾。目前常用的近紅外光譜預(yù)處理方法有:平滑、導(dǎo)數(shù)、標(biāo)準(zhǔn)正態(tài)變量變換(Standard Normal Variate,SNV)、多元散射校正(Multiplicative Scatter Correction,MSC)等[6-7]。針對不同的數(shù)據(jù)特點(diǎn)采用不同的預(yù)處理方法,不恰當(dāng)?shù)念A(yù)處理可能會導(dǎo)致模型的預(yù)測能力下降[8]。

    該文以原油的近紅外光譜為研究對象,提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的原油組分定量分析方法。該方法利用神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)能力,自適應(yīng)學(xué)習(xí)光譜中的噪聲特征,將噪聲從光譜數(shù)據(jù)中去掉,提高校正模型預(yù)測準(zhǔn)確率。利用該方法對原油樣品近紅外光譜進(jìn)行校正和預(yù)測,取得了較好的實(shí)驗(yàn)效果。

    1 卷積去噪網(wǎng)絡(luò)

    利用卷積神經(jīng)網(wǎng)絡(luò)對原始光譜數(shù)據(jù)進(jìn)行預(yù)處理,去除光譜中影響校正模型的因素,從而提高校正模型的預(yù)測效果。預(yù)測模型的結(jié)構(gòu)見圖1,將其命名為CDNet(Convolutional Denoising Network)。CDNet分為預(yù)處理和校正模型2個模塊,預(yù)處理模塊由2個卷積塊(Block1和Block2)構(gòu)成。校正模型為3層感知機(jī),(Multilayer Perceptron,MLP),由2個全連接層(FC1和FC2)和1個輸出層構(gòu)成。

    圖1 預(yù)測模型CDNet結(jié)構(gòu)圖

    預(yù)處理模塊的作用是替代現(xiàn)有的近紅外光譜預(yù)處理方法,利用神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)能力,學(xué)習(xí)輸入的光譜數(shù)據(jù)中影響預(yù)測的因素,并將其扣除。其中,每個卷積塊(Block)包括1個卷積層(Conv)和1個跳躍連接。跳躍連接使得卷積層只需學(xué)習(xí)測量光譜與目標(biāo)光譜之間的差異,即光譜中的干擾因素,而網(wǎng)絡(luò)更容易學(xué)習(xí)這種差異[9]。不僅如此,這種輸入輸出具有相同形狀的結(jié)構(gòu),也便于堆疊卷積塊的數(shù)量以達(dá)到更優(yōu)的效果。卷積塊可以表示為

    (1)

    式中,Xc為卷積層的輸出;Xinput為卷積塊的輸入;Wc為卷積層卷積核的權(quán)重;Xb為卷積塊的輸出。

    為了獲得較好的預(yù)測能力,校正模型由2個全連接層(FC1和FC2)和輸出層組成。預(yù)測過程可以表示為

    (2)

    式中,XFC1和XFC2分別為FC1和FC2層的輸出;Xb2為Block2層的輸出;WFC1和WFC2分別為FC1和FC2層的權(quán)值矩陣;bFC1和bFC2分別為FC1和FC2層的偏置向量;AFC1(x)為FC1層的激活函數(shù),用來實(shí)現(xiàn)非線性的映射。

    預(yù)測模型CDNet在MLP校正模型的基礎(chǔ)上加入了基于卷積神經(jīng)網(wǎng)絡(luò)的預(yù)處理模塊,對輸入的光譜數(shù)據(jù)進(jìn)行修正,以提高后續(xù)校正模型的預(yù)測性能。預(yù)測模型CDNet具有3個主要特點(diǎn)。

    (1)將光譜的預(yù)處理步驟融入到模型當(dāng)中,進(jìn)行整體優(yōu)化,避免了預(yù)處理和校正模型獨(dú)立優(yōu)化的不足。以往預(yù)處理步驟在模型之外進(jìn)行,無法利用訓(xùn)練模型過程中輸入的組分含量信息進(jìn)行優(yōu)化,而且對多組分中的每個組分應(yīng)用相同的預(yù)處理方法。預(yù)測模型CDNet將預(yù)處理整合到模型當(dāng)中,讓組分含量信息參與優(yōu)化預(yù)處理過程,對多組分?jǐn)?shù)據(jù)中每個組分進(jìn)行針對性的優(yōu)化。

    (2)傳統(tǒng)的預(yù)處理方法效果依賴于參數(shù)的設(shè)置,參數(shù)選擇需要通過經(jīng)驗(yàn)確定,效果不穩(wěn)定。使用卷積神經(jīng)網(wǎng)絡(luò)替代傳統(tǒng)的預(yù)處理方法,通過網(wǎng)絡(luò)的自適應(yīng)性,可以更有效地去除光譜中不利于校正模型預(yù)測的因素,提高模型的性能。

    (3)MLP校正模型可以同時處理光譜與物質(zhì)含量之間的線性和非線性關(guān)系。MLP校正模型網(wǎng)絡(luò)包含輸入層、隱藏層和輸出層,由于層次之間的復(fù)雜的映射關(guān)系,通過調(diào)整隱藏層的層數(shù)以及各層的節(jié)點(diǎn)數(shù),網(wǎng)絡(luò)可以逼近任意復(fù)雜的映射關(guān)系。

    2 實(shí)驗(yàn)部分

    為了驗(yàn)證該方法的有效性,設(shè)計(jì)了實(shí)驗(yàn)方案和實(shí)驗(yàn)裝置。通過在實(shí)驗(yàn)室進(jìn)行原油的組分配比,然后采集原油的近紅外光譜。

    2.1 實(shí)驗(yàn)裝置

    實(shí)驗(yàn)裝置包括:手搖泵、真空泵、混合罐、樣品罐、攪拌器、光譜儀、計(jì)算機(jī)等部分,如圖2所示。

    圖2 實(shí)驗(yàn)裝置

    樣品罐用于存放甲烷、乙烷、丙烷、丁烷、戊烷以及氮?dú)鈽悠贰;旌瞎迣⒃团c甲烷、乙烷、丙烷、丁烷、戊烷在罐中高壓混合。手搖泵可通過手搖控制進(jìn)入混合罐的樣品含量。真空泵用來抽取管路中殘余氣體。攪拌器用于將混合罐中混合樣品攪拌均勻。光譜儀用于采集混合罐中樣本的光譜數(shù)據(jù),波長范圍1 100~2 110 nm。

    2.2 光譜數(shù)據(jù)采集

    在實(shí)驗(yàn)過程中,原油混合一定量的甲烷、乙烷、丙烷、丁烷、戊烷,采集混合溶液的近紅外光譜。數(shù)據(jù)采集過程中,首先要抽真空以保證管路中沒有殘留的氣體;然后,通過手搖泵進(jìn)行樣品混合,保證混合罐的壓力。由于氮?dú)庠诮t外區(qū)域幾乎沒有吸收,因此,對光譜采集的影響可以忽略不計(jì)。重復(fù)上面的過程,共采集了97個樣品,其光譜見圖3。由圖3可見,吸收峰主要在1 200、1 400和1 700 nm附近。其中,1 200 nm附近主要是C-H基團(tuán)的二級倍頻吸收,1 400 nm附近主要是C-H的合頻吸收,1 700 nm附近主要是C-H基團(tuán)的一級倍頻吸收[10]。

    圖3 混合原油的近紅外光譜

    2.3 模型建立

    在97個樣本中,經(jīng)過初步分析,剔除了3個異常樣本,剩余94個樣本用于后續(xù)分析。使用Duplex算法[11]分為64個校正集樣本和30個測試集樣本。校正集用于模型的訓(xùn)練,測試集用于模型之間的性能比較。

    CDNet模型的預(yù)處理模塊中,2個卷積層的卷積核k1、k2分別設(shè)置為11和35??紤]到每個卷積塊去除一種干擾因素,同時保持光譜波長點(diǎn)數(shù)量基本不變,所以卷積核的個數(shù)設(shè)置為1。校正模型中全連接層FC1、FC2的神經(jīng)元個數(shù)分別為256和128。輸出層有1個神經(jīng)元,輸出值為組分含量預(yù)測值。模型訓(xùn)練采用的損失函數(shù)是均方誤差

    (3)

    訓(xùn)練過程中的損失值變化見圖4。由圖4可見,迭代3 000次以后模型已經(jīng)收斂,后續(xù)的訓(xùn)練可能會使得模型過擬合,因此,模型選擇迭代3 000次時的網(wǎng)絡(luò)權(quán)值。

    圖4 訓(xùn)練過程損失迭代圖

    預(yù)處理模塊中卷積層的卷積核k是CDNet網(wǎng)絡(luò)非常重要的1個參數(shù),k過大或過小都會影響卷積層學(xué)習(xí)近紅外光譜干擾因素的效果,從而影響校正模型的預(yù)測效果。采用網(wǎng)格搜索的方法,對核大小的組合進(jìn)行了評估,結(jié)果見圖5。

    圖5 卷積核大小的選擇

    圖5中的方塊可以分成4個區(qū)域:左上、左下、右上和右下。從圖5中可以直觀地看出,右上區(qū)域的方塊顏色要比其余3個區(qū)域淺,說明該區(qū)域的參數(shù)組合得到的校正模型預(yù)測效果比其余區(qū)域更好;同時,也說明Block1應(yīng)選擇1個小卷積核,而Block2應(yīng)選擇1個大卷積核,所以最終選擇了11和35作為卷積核的大小。

    3 實(shí)驗(yàn)結(jié)果分析

    在實(shí)驗(yàn)的過程中,選擇了偏最小二乘模型進(jìn)行比較。同時,為了驗(yàn)證預(yù)處理模塊的有效性,還使用不帶預(yù)處理的感知機(jī)模型進(jìn)行了建模對比。模型的預(yù)測效果使用測試集的均方根誤差ERMSEP和決定系數(shù)R2來衡量,計(jì)算公式為

    (4)

    (5)

    實(shí)驗(yàn)結(jié)果見表1。首先觀察沒有預(yù)處理模塊的校正模型MLP和PLS的對比,在丙烷、丁烷2種組分的預(yù)測上,MLP的效果優(yōu)于PLS,這一結(jié)果說明光譜中存在與樣品含量相關(guān)的非線性因素,僅使用線性模型無法準(zhǔn)確預(yù)測物質(zhì)的含量。其次,CDNet預(yù)測模型對丙烷和丁烷的效果優(yōu)于MLP,而且乙烷和戊烷的效果優(yōu)于PLS,這說明加入的預(yù)處理模塊有效地降低了光譜中干擾因素的影響,提高了模型的預(yù)測效果。

    表1 輕烴組分預(yù)測結(jié)果對比

    對于甲烷組分,由于甲烷在原油中的溶解度低,故在所有樣本中含量都很低(小于2%)。此外,甲烷的近紅外吸收峰與乙烷、丙烷等組分重疊[12]。因此,盡管校正模型MLP和PLS的結(jié)果優(yōu)于預(yù)測模型CDNet,但R2普遍偏低,其結(jié)果并不足以區(qū)分方法之間的優(yōu)劣。

    為了研究卷積神經(jīng)網(wǎng)絡(luò)的預(yù)處理效果,將預(yù)處理模塊的輸出結(jié)果與現(xiàn)有的預(yù)處理方法進(jìn)行對比。圖6(a)為輸入樣品的原始光譜,圖6(b)為預(yù)測乙烷組分的CDNet預(yù)測模型中Block2的輸出,圖6(c)為用Savitzky-Golay方法對相同樣本求一階導(dǎo)數(shù)(窗口大小為5)所得到的光譜。

    圖6 原始光譜、Block2的輸出及Savitzky-Golay求導(dǎo)后的光譜

    比較圖6(b)和圖6(c)可見,Block2類似于S-G導(dǎo)數(shù)的結(jié)果,但是S-G導(dǎo)數(shù)在1 250~1 640 nm和1 800~2 110 nm波段引入了高頻噪聲,對模型帶來不利的影響。不僅如此,S-G法的參數(shù)是依據(jù)經(jīng)驗(yàn)事先設(shè)定的,與校正模型之間沒有關(guān)聯(lián)性。對校正參數(shù)是依據(jù)經(jīng)驗(yàn)事先設(shè)定的,與校正模型之間沒有關(guān)聯(lián)性。而CDNet預(yù)處理模塊的參數(shù)是在整體網(wǎng)絡(luò)的訓(xùn)練過程中自動優(yōu)化的,針對每一個組分的校正模型進(jìn)行了自適應(yīng)調(diào)整,更加有針對性地扣除干擾因素,保留更多對當(dāng)前預(yù)測的組分有用的信息。

    由表1可見,相比于MLP校正模型,CDNet預(yù)測模型的預(yù)測效果有較大提升。為研究加入預(yù)處理模塊前后的區(qū)別,將同一樣本分別輸入MLP校正模型和CDNet預(yù)測模型中,然后根據(jù)全連接層的權(quán)重值計(jì)算各波長點(diǎn)對最終預(yù)測值的貢獻(xiàn),結(jié)果見圖7。由圖7可見,區(qū)別較大的2個波段,一個是1 400 nm附近,另一個是1 800~2 100 nm。由圖6(b)中可知,經(jīng)過預(yù)處理后這2個波段的值都被抑制到接近,因此,在后續(xù)的校正模型中貢獻(xiàn)也接近為0。其中,1 800~2 100 nm波段并非C-H基團(tuán)的吸收區(qū),而1 400 nm附近,此處是C-H基團(tuán)的合頻吸收區(qū),受到抑制的原因可能是合頻吸收與組分含量的關(guān)聯(lián)度不大。其他與C-H基團(tuán)吸收相關(guān)的波段,如1 200 nm附近和1 700 nm附近,都被完整地保留了下來。

    圖7 MLP校正模型和CDNet預(yù)測模型各波長點(diǎn)貢獻(xiàn)值

    綜上所述,CDNet的預(yù)處理模塊抑制了光譜中與組分含量關(guān)系不相關(guān)的一些波段的值,使得校正模型避免這些波段的干擾,專注于與組分含量高度相關(guān)的波段,從而提高預(yù)測效果。

    4 結(jié) 論

    (1)提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的原油輕烴組分定量預(yù)測模型CDNet。其在MLP校正模型的基礎(chǔ)上加入了預(yù)處理模塊,該模塊能自適應(yīng)地學(xué)習(xí)光譜中的干擾信息并去除,從而提高預(yù)測效果。

    (2)將實(shí)驗(yàn)采集的原油光譜使用PLS、MLP和CDNet分別建立回歸模型,CDNet的預(yù)測結(jié)果優(yōu)于PLS和MLP。實(shí)驗(yàn)結(jié)果表明,CDNet是一種有效的原油輕烴組分預(yù)測方法。

    猜你喜歡
    校正預(yù)處理組分
    組分分發(fā)管理系統(tǒng)在天然氣計(jì)量的應(yīng)用
    一種難溶難熔未知組分板材的定性分析
    劉光第《南旋記》校正
    國學(xué)(2020年1期)2020-06-29 15:15:30
    黑順片不同組分對正常小鼠的急性毒性
    中成藥(2018年8期)2018-08-29 01:28:26
    金雀花中黃酮苷類組分鑒定及2種成分測定
    中成藥(2018年2期)2018-05-09 07:20:09
    一類具有校正隔離率隨機(jī)SIQS模型的絕滅性與分布
    基于預(yù)處理MUSIC算法的分布式陣列DOA估計(jì)
    機(jī)內(nèi)校正
    淺談PLC在預(yù)處理生產(chǎn)線自動化改造中的應(yīng)用
    絡(luò)合萃取法預(yù)處理H酸廢水
    应城市| 育儿| 宜君县| 微博| 永仁县| 洪泽县| 遵化市| 新巴尔虎左旗| 赤城县| 云浮市| 阜平县| 星子县| 双峰县| 舟曲县| 馆陶县| 九寨沟县| 陇西县| 丹棱县| 双江| 林芝县| 札达县| 榆林市| 资溪县| 朝阳区| 鄱阳县| 玉溪市| 鄂尔多斯市| 平安县| 卓尼县| 西宁市| 石首市| 龙胜| 宁海县| 东方市| 天气| 永宁县| 宜春市| 梁山县| 宣恩县| 弋阳县| 班戈县|