李傳真 王國慶 鄒麗
摘????? 要: 結(jié)合集團(tuán)公司提出的加快建設(shè)數(shù)字化工廠的設(shè)想,利用過程工業(yè)大數(shù)據(jù)高階優(yōu)化對DCC裝置進(jìn)行診斷分析,搭建軟件模型,論述現(xiàn)有數(shù)據(jù)建模方法,提升潛力并優(yōu)化工藝控制,達(dá)到降本增效的目的。最后,探討過程工業(yè)大數(shù)據(jù)高階優(yōu)化的特點(diǎn)和挑戰(zhàn),實(shí)現(xiàn)業(yè)務(wù)價(jià)值的提升。
關(guān)? 鍵? 詞:大數(shù)據(jù);神經(jīng)網(wǎng)絡(luò);過程工業(yè);高階優(yōu)化
中圖分類號:TE319??? ???文獻(xiàn)標(biāo)識碼: A?? ????文章編號: 1671-0460(2020)06-1162-04
High-order Optimization of Big Data in DCC Device?Based on Neural Network Algorithm
LI Chuan-zhen, WANG Guo-qing, ZOU Li
(CNOOC Dongfang Petrochemical Co., Ltd., Dongfang Hainan 572600, China)
Abstract: Combined with the idea of accelerating the construction of a digital factory proposed by the group company, high-order optimization of process industry big data was used to diagnose and analyze DCC devices, and a software model was built, existing data modeling methods were discussed to reduce costs and increase efficiency. Finally, the characteristics and challenges of high-level optimization of process industry big data were analyzed in order to realize the improvement of business value.
Key words: Big data; Neural network; Process industry; High-order optimization
當(dāng)今社會信息技術(shù)飛速發(fā)展,衍生出A(artificial intelligence)、B(blockchain)、C(cloud Computing)、D(big Data)4大熱門專業(yè)。在過去十幾年,自動化及石油化工領(lǐng)域的專家學(xué)者已經(jīng)開發(fā)出適用于石油化工的排產(chǎn)軟件,用來優(yōu)化全廠加工流程,判斷產(chǎn)品結(jié)構(gòu)的影響,進(jìn)而提高企業(yè)經(jīng)濟(jì)效益。原有排產(chǎn)軟件一般都基于線性算法,適用于分析全廠簡單、清晰的流程。本課題嘗試通過使用Python3.0編程,利用神經(jīng)網(wǎng)絡(luò)算法處理過程工業(yè)大規(guī)模數(shù)據(jù),將計(jì)算機(jī)學(xué)科和大數(shù)據(jù)學(xué)科融合,繼而從海量數(shù)據(jù)中挖掘?qū)嶋H業(yè)務(wù)潛在問題,并通過建立優(yōu)化模型,找到現(xiàn)存問題突破口,實(shí)現(xiàn)業(yè)務(wù)價(jià)值提升。
1? 項(xiàng)目背景和實(shí)現(xiàn)目標(biāo)
1.1? 項(xiàng)目背景
某公司設(shè)計(jì)以海南島周邊原油、凝析油和天然氣資源為依托,按照循環(huán)經(jīng)濟(jì)、清潔生產(chǎn)和綠色低碳的原則,采用催化裂解(DCC)技術(shù)生產(chǎn)乙烯、丙烯和碳四等重要化工原料,堅(jiān)持走精細(xì)化工道路,下游延伸發(fā)展高技術(shù)含量、高附加值的化工新材料和高端精細(xì)化學(xué)品。一期為煉油裝置,二期為化工裝置,但由于二期工程丙烯腈工藝包轉(zhuǎn)讓受阻,二期項(xiàng)目僅有乙苯、苯乙烯裝置建成投產(chǎn)。現(xiàn)有流程是圍繞以DCC裝置為核心的燃油-化工型煉廠,煉油規(guī)模偏小,下游產(chǎn)業(yè)鏈延伸不夠,油品比重偏大,后續(xù)又新建兩套產(chǎn)品質(zhì)量升級項(xiàng)目,造成了成本能耗進(jìn)一步上升,抗風(fēng)險(xiǎn)能力不強(qiáng)。在丙烯腈項(xiàng)目建成投產(chǎn)前如何取得最大經(jīng)濟(jì)效益為公司急需解決的根本問題。
1.2 ?? ?預(yù)期實(shí)現(xiàn)目標(biāo)
經(jīng)對全廠的經(jīng)濟(jì)利潤進(jìn)行了分析,通過測算,汽柴油產(chǎn)品虧損嚴(yán)重,而提升經(jīng)濟(jì)效益主要依靠丙烯、苯乙烯和MTBE產(chǎn)品,能否提高丙烯、苯乙烯和MTBE 3種高價(jià)值產(chǎn)品的產(chǎn)量,主要取決全廠的核心——DCC裝置。DCC為國內(nèi)首套增強(qiáng)型催化裂解 (DCC-plus) 裝置,采用北京石油化工研究院開發(fā)的多產(chǎn)丙烯的專利技術(shù)(Deep Catalytic Cracking),是以重質(zhì)烴為原料、以丙烯為主產(chǎn)品、輕芳烴為副產(chǎn)品的化工型煉油工藝技術(shù)。與常規(guī)催化裂化最大的不同就是采取較高反應(yīng)深度,使得乙烯、丙烯和異丁烯類高附加值產(chǎn)品收率大幅升高,最大限度地減少汽柴油產(chǎn)品產(chǎn)量,研究DCC裝置低碳烯烴產(chǎn)品收率的影響因素是項(xiàng)目的關(guān)鍵點(diǎn)。
1.3? 效益可行性分析
在保證裝置負(fù)荷相同,同時(shí)原油成本沒有增加的前提下,分別將干氣中乙烯、液化氣中丙烯質(zhì)量分?jǐn)?shù)以提高1%為單位目標(biāo)進(jìn)行效益分析。通過化驗(yàn)分析,目前干氣中乙烯質(zhì)量分?jǐn)?shù)平均為35%,液化氣中丙烯含量平均為44%,提高1%后分別約為36%、45%。當(dāng)前DCC裝置進(jìn)料量約3 300 t·d-1,干氣產(chǎn)量約為300 t·d-1,乙烯產(chǎn)量約105 t·d-1;液化氣產(chǎn)量約為1 300 t·d-1,丙烯產(chǎn)量約573 t·d-1。在保證進(jìn)料量相同的前提下,提升收率后乙烯理論產(chǎn)量應(yīng)達(dá)到300×36%=108 t·d-1,丙烯產(chǎn)量應(yīng)達(dá)到1 300×45%=585 t·d-1;丙烯每噸可盈利為1 000元,增加效益為(585-573)×1 000=12 000元·d-1。每噸乙烯可以生產(chǎn)乙苯約3.5 t,乙苯為中間產(chǎn)品后續(xù)繼續(xù)加工生產(chǎn)苯乙烯,每噸苯乙烯可盈利1 500元,苯乙烯增加效益約為3.5×(108-105)×94%×1 500=14 800元·d-1。全年總計(jì)盈利(12 000 +?? 14 800)×360=9 648 000元。
2? 神經(jīng)網(wǎng)絡(luò)機(jī)器算法的大數(shù)據(jù)高階優(yōu)化原理
在機(jī)器學(xué)習(xí)和認(rèn)知科學(xué)領(lǐng)域,神經(jīng)網(wǎng)絡(luò)(neural network)是一種模仿人的大腦結(jié)構(gòu)和功能的數(shù)學(xué)模型或計(jì)算模型,用于對函數(shù)進(jìn)行估計(jì)或近似。其方法是將使用大量的神經(jīng)元構(gòu)成神經(jīng)網(wǎng)絡(luò),模擬思考。圖1、圖2為感知器和反應(yīng)器感知器模擬示意圖
圖1、圖2的圓圈就代表一個(gè)感知器。它接受多個(gè)輸入(x1,x2,x3...),生成輸出(output),如同人體神經(jīng)末梢感受各種外部環(huán)境的變化進(jìn)而產(chǎn)生電信號,達(dá)到控制相應(yīng)的身體組織器官的效果。
基于本課題的研究,可以將干氣中乙烯、液化氣中丙烯含量建立一個(gè)神經(jīng)網(wǎng)絡(luò)運(yùn)算,其神經(jīng)元就是影響其收率的各項(xiàng)操作指標(biāo)。
為了簡化模型,我們約定每種輸入只有兩種可能:1 或 0。如果所有輸入可滿足干氣乙烯、液化氣丙烯質(zhì)量分?jǐn)?shù)達(dá)到36%、45%,表示各種條件都成立,輸出就是1;如果所有輸入為0,則表示條件不成立,輸出就是0。
除上述影響收率的各項(xiàng)操作指標(biāo)外,其產(chǎn)品還會受到一些因素的影響,例如催化劑活性、催化劑加注量、原油成分改變等。這些因素對產(chǎn)品收率都或多或少產(chǎn)生影響,但影響程度各不相同。某些因素是決定性因素,另一些因素是次要因素。因此,可以給這些因素指定權(quán)重(weight),代表它們不同的重要性。
如:催化劑活性權(quán)重為4,催化劑加注量權(quán)重為2,原油成分權(quán)重為2。
3個(gè)權(quán)重總和即為4+4+2=10。
這時(shí),還需要指定一個(gè)閾值(threshold)。閾值的高低代表了影響的強(qiáng)烈,閾值越低就表示收率越低,越高表示就收率越高。
上面的決策過程,使用數(shù)學(xué)表達(dá)如下:
式中,x表示各種外部因素,w表示對應(yīng)的權(quán)重。
單個(gè)的感知器構(gòu)成了一個(gè)簡單的決策模型,已經(jīng)可以拿來用了。石油化工加工過程中,實(shí)際的決策模型則要復(fù)雜得多,是由多個(gè)感知器組成的多層網(wǎng)絡(luò)圖3。
圖3中,左側(cè)底層感知器首先接收外部輸入信號,做出計(jì)算判斷后,傳遞給上層感知器作為輸入信號,上層感知器繼續(xù)計(jì)算判斷,直至得到最后的結(jié)果。
為了方便后面的討論,需要對上面的模型進(jìn)行一些數(shù)學(xué)處理。
外部因素x1、x2、x3寫成矢量<x1, x2, x3>,簡寫為x。
權(quán)重w1、w2、w3 也寫成矢量(w1, w2, w3),簡寫為w。
定義運(yùn)算w?x = ∑wx,即w和x的點(diǎn)運(yùn)算,等于因素與權(quán)重的乘積之和。
定義b等于負(fù)的閾值b = -threshold,
感知器模型就變成了下面這樣:
其中,最困難的部分就是確定權(quán)重(w)和閾值(b)。目前為止,這兩個(gè)值都是主觀給出的,但現(xiàn)實(shí)中很難估計(jì)它們的值,必須有一種方法,可以找出答案。
這種方法就是試錯(cuò)法。其他參數(shù)都不變,w(或b)的微小變動,記作Δw(或Δb),然后觀察輸出有什么變化。不斷重復(fù)這個(gè)過程,直至得到對應(yīng)最精確輸出的那組w和b[1],這個(gè)過程稱為模型的訓(xùn)練。而最終訓(xùn)練出達(dá)到我們所需的輸出值(output)的各項(xiàng)輸入項(xiàng)(inputs),就是我們期望得到的生產(chǎn)工況圖4。
3? 工業(yè)大數(shù)據(jù)高階優(yōu)化
3.1? 數(shù)據(jù)基礎(chǔ)和來源
工業(yè)大數(shù)據(jù)的高階優(yōu)化工作基礎(chǔ)是收集數(shù)據(jù),石油化工企業(yè)都會部署了集散控制系統(tǒng)(DCS)、實(shí)驗(yàn)室管理系統(tǒng)(LIMS)、制造執(zhí)行系統(tǒng)(MES)等系統(tǒng),這些系統(tǒng)配備了歷史數(shù)據(jù)服務(wù)器,儲存了至少一個(gè)生產(chǎn)運(yùn)行周期的工況數(shù)據(jù),足以提供大量的數(shù)據(jù)供進(jìn)行分析計(jì)算。我們通過收集包括DCS裝置位點(diǎn)數(shù)據(jù)、LIMS化驗(yàn)數(shù)據(jù)、調(diào)度生產(chǎn)數(shù)據(jù)等相關(guān)歷史數(shù)據(jù),以干氣乙烯、液化氣丙烯質(zhì)量分?jǐn)?shù)達(dá)到36%、45%為目標(biāo),實(shí)際生產(chǎn)工況數(shù)據(jù)為主,輔以流程數(shù)據(jù)、實(shí)驗(yàn)室數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)。清理原始數(shù)據(jù),按工況將不同來源數(shù)據(jù)進(jìn)行匹配整合。初步分析數(shù)據(jù),發(fā)現(xiàn)、診斷裝置現(xiàn)存問題。
3.2? 分析建模
建模階段工作圍繞搭建符合某公司DCC實(shí)際運(yùn)行工況和進(jìn)料性質(zhì)的大數(shù)據(jù)高階分析預(yù)測和優(yōu)化模型,以盡量準(zhǔn)確擬合DCC裝置產(chǎn)率并尋找以目標(biāo)優(yōu)化為導(dǎo)向的參數(shù)調(diào)優(yōu)方案。持續(xù)對項(xiàng)目準(zhǔn)備階段所收集到的裝置及物料歷史數(shù)據(jù)進(jìn)行深入研究和分析,探討生產(chǎn)環(huán)境所受各項(xiàng)限制條件對目標(biāo)產(chǎn)率的影響,識別關(guān)鍵參數(shù)。搭建可行的收率預(yù)測的高階模型,利用神經(jīng)網(wǎng)絡(luò)機(jī)器算法搭建裝置感知器、權(quán)重和閾值?;诖髷?shù)據(jù)模型尋優(yōu)結(jié)果,初步驗(yàn)證方案可行性與調(diào)優(yōu)效果。在準(zhǔn)確度達(dá)標(biāo)的情況下,初步實(shí)施優(yōu)化模型,并評估優(yōu)化效果。
3.3? 模型評價(jià)與優(yōu)化
模型評價(jià)是指對于已經(jīng)建立的一個(gè)或多個(gè)模型,根據(jù)其模型的類別,使用不同的指標(biāo)評價(jià)其性能優(yōu)劣的過程。模型的優(yōu)化則是指模型性能在經(jīng)過模型評價(jià)后已經(jīng)達(dá)到了要求,但在實(shí)際生產(chǎn)環(huán)境應(yīng)用過程中,發(fā)現(xiàn)模型的性能并不理想,繼而對模型進(jìn)行重構(gòu)與優(yōu)化的過程[2]。
模型評價(jià)和優(yōu)化階段工作旨在持續(xù)優(yōu)化大數(shù)據(jù)高階分析預(yù)測和優(yōu)化模型的調(diào)優(yōu)能力,并完成產(chǎn)品化?;诔醪綄?shí)施階段結(jié)果,進(jìn)一步與DCC裝置的生產(chǎn)、技術(shù)、設(shè)備、工藝等專家共同探討過程中的各類問題,設(shè)計(jì)并進(jìn)行一系列參數(shù)調(diào)優(yōu)試驗(yàn),并將新生成數(shù)據(jù)投入到模型優(yōu)化和迭代過程中,由此不斷提高模型預(yù)測準(zhǔn)確性與優(yōu)化能力。最終將根據(jù)實(shí)際模型使用員工的操作和應(yīng)用需求設(shè)計(jì)軟件系統(tǒng)操作界面,并針對后續(xù)使用及維護(hù)過程編寫操作手冊,并提供對應(yīng)的培訓(xùn)。
4? 大數(shù)據(jù)高階優(yōu)化的特點(diǎn)及挑戰(zhàn)
4.1? 大數(shù)據(jù)高階優(yōu)化的特點(diǎn)
4.1.1 ?數(shù)據(jù)分析工具的選擇
本課題大數(shù)據(jù)高階分析預(yù)測和優(yōu)化模型選擇使用Python3.0編寫。編程腳本使用Python自帶的標(biāo)準(zhǔn)庫與眾多第三方庫。Python3.0軟件和標(biāo)本庫可從互聯(lián)網(wǎng)上免費(fèi)獲得和正常使用,不會造成模型開發(fā)與維護(hù)的額外成本。Python是一種廣泛使用的解釋型、跨平臺的通用型高級編程語言,擁有動態(tài)類型系統(tǒng)和垃圾回收功能,能夠自動管理內(nèi)存使用,并且支持多種編程范式,且擁有一個(gè)巨大而廣泛的標(biāo)準(zhǔn)庫。Python解釋器本身幾乎可以在所有的操作系統(tǒng)中運(yùn)行。
4.1.2 ?使用過程工業(yè)大數(shù)據(jù)
目前互聯(lián)網(wǎng)公司的大數(shù)據(jù)技術(shù),基本通過很簡單的統(tǒng)計(jì)分析即可揭示部分信息。而工業(yè)大數(shù)據(jù)建模是面向過程工業(yè)決策、優(yōu)化、故障診斷、控制等應(yīng)用,解決相對復(fù)雜數(shù)據(jù)建模問題,需要更深入的數(shù)據(jù)建模方法[3]。
4.1.3 ?更適宜工業(yè)生產(chǎn)挖潛增效
與傳統(tǒng)數(shù)據(jù)建模的排產(chǎn)軟件相比,排產(chǎn)軟件一般應(yīng)用于全廠加工、效益測算、產(chǎn)品分布的粗略線性計(jì)算,這種計(jì)算完全屬于自動化學(xué)科,針對的是小變量規(guī)模、短時(shí)間段的規(guī)則采樣數(shù)據(jù)。而大數(shù)據(jù)高階優(yōu)化使用非線性運(yùn)算的神經(jīng)網(wǎng)絡(luò)算法融合計(jì)算機(jī)學(xué)科和自動化學(xué)科,采樣數(shù)據(jù)范圍更大,測算精度更為嚴(yán)格,可應(yīng)用于單裝置的生產(chǎn)優(yōu)化,更適宜企業(yè)挖潛增效。
4.2? 大數(shù)據(jù)高階優(yōu)化帶來的挑戰(zhàn)
4.2.1 ?基于大數(shù)據(jù)高階優(yōu)化的主動預(yù)測
本課題主要利用過程工業(yè)大數(shù)據(jù)在生產(chǎn)運(yùn)行時(shí)產(chǎn)生的數(shù)據(jù)更好地改進(jìn)過程運(yùn)行、提高高價(jià)值產(chǎn)品收率,在后續(xù)的研究中,期望能通過數(shù)據(jù)的分析,實(shí)現(xiàn)大數(shù)據(jù)的主動預(yù)測,進(jìn)而實(shí)現(xiàn)快速分析及執(zhí)行,降低錯(cuò)誤決策的后果[4]。
4.2.2 ?多種算法建設(shè)和評估模型
考慮到石油化工生產(chǎn)屬于高危工業(yè)控制,如能從多種數(shù)學(xué)模型進(jìn)行計(jì)算并驗(yàn)證,將極大保證生產(chǎn)的安全性和平穩(wěn)性。目前除本課題使用的神經(jīng)網(wǎng)絡(luò)算法外,還有梯度提升回歸決策樹、隨機(jī)森林等多種機(jī)器算法。但除建模需要針對性的分析研究外,龐大的數(shù)據(jù)分析量對計(jì)算機(jī)配置的要求也要求很高。傳統(tǒng)的CPU不能滿足計(jì)算需求,必須使用專門為機(jī)器學(xué)習(xí)定制的GPU來計(jì)算。
5? 結(jié)束語
麥肯錫全球研究院發(fā)布的Big data:the next frontier for innovation,competition,and productivity指出過程工業(yè)可以從大數(shù)據(jù)分析和應(yīng)用中提高生產(chǎn)力、降低功耗。以工業(yè)大數(shù)據(jù)為價(jià)值源,到2020年的總體價(jià)值將近1.3萬億美元[5]。隨著工業(yè)控制與信息技術(shù)的不斷發(fā)展,各類工業(yè)控制系統(tǒng)與信息技術(shù)不斷結(jié)合,存儲收集數(shù)據(jù)的能力大幅提高,如何管理和利用,使計(jì)算機(jī)學(xué)科和自動化學(xué)科有效融合,將收集到的繁雜數(shù)據(jù)去離群、去缺失,提高工業(yè)生產(chǎn)模型的準(zhǔn)確性,進(jìn)而研究大數(shù)據(jù)高階優(yōu)化的發(fā)展規(guī)律及預(yù)測趨勢走向,幫助企業(yè)生產(chǎn)管理人員提高收益、降低風(fēng)險(xiǎn),將是未來過程工業(yè)大數(shù)據(jù)高階優(yōu)化的趨勢和潮流。
參考文獻(xiàn):
[1]韓淼. 基于高斯過程的錢塘江涌潮預(yù)報(bào)算法研究[D]. 杭州:杭州電子科技大學(xué),2018.
[2]翟高粵. 基于Python的數(shù)據(jù)分析概述[J].信息技術(shù),2018(11):5-8.
[3]劉強(qiáng),秦泗釗. 過程工業(yè)大數(shù)據(jù)建模研究展望[J]. 自動化學(xué)報(bào),2016 (2):161-171.
[4]GE智能平臺. 工業(yè)大數(shù)據(jù)云利用大數(shù)據(jù)推動創(chuàng)新、競爭和增長[J].自動化博覽,2012(12):40-42.
[5]秦明,陳凱.工業(yè)大數(shù)據(jù)集成應(yīng)用綜述[J]. 軟件導(dǎo)刊,2017(7):213-215.