王奎清
(淮陰工學院計算機與軟件工程學院,江蘇淮安 223003)
近年來鹽化工產(chǎn)業(yè)突飛猛進,我國已成為全球重要的鹽化工生產(chǎn)大國。隨著我國實施的新能源戰(zhàn)略和大力發(fā)展循環(huán)經(jīng)濟的政策,提倡綠色化工和低碳生活,鹽化工產(chǎn)業(yè)也將步入一個新的調整和發(fā)展期。課題以江蘇井神4號生產(chǎn)線的控制系統(tǒng)(DCS)和人工采集的日常實踐數(shù)據(jù)為研究數(shù)據(jù)來源。通過實際調研得知該生產(chǎn)線真空蒸發(fā)制鹽產(chǎn)工藝流程是通過采集原鹵進行蒸發(fā)、結晶、洗滌最終獲取氯化鈉和一定濃度的制鹽母液。固液比是影響鹽的質量關鍵要素,蒸發(fā)罐中固液比達標才可下料進入干燥床烘干包裝。影響固液比的因素很多,如蒸發(fā)罐溫度和壓力、循環(huán)泵電流和鹽腿實際值排出量等。怎樣更加準確地預測鹽鹵在液蒸發(fā)罐中固液比的變化,對提高其生產(chǎn)線產(chǎn)量與質量從而提高企業(yè)效益有重要作用。
當前,在鹽化工生產(chǎn)中固液比預測方面主流的預測法為定量預測法,主要分為兩類:時間序列分析預測法、因果分析預測法。時間序列分析預測法如支持向量機與指數(shù)平滑法等,靳培飛和周莉等人[1]綜合考慮支持向量機在檢測行人時表現(xiàn)出的特點,提出一種基于支持向量機提取感興趣區(qū)域的行人檢測算法。利用支持向量機對圖像進行初檢并提取出置信度較高的檢測框,先后在水平和豎直方向統(tǒng)計這些檢測框的置信度疊加并根據(jù)統(tǒng)計結果提取出行人感興趣區(qū)域,在提取的感興趣區(qū)域內進行行人的檢測[1]。該類方法主要根據(jù)上期歷史數(shù)據(jù)的固液比實際數(shù)來預測當前節(jié)點的固液比,由于只考慮時間因素不考慮外界因素(當生產(chǎn)線突然斷電、機器調試、人為干擾和天氣溫濕度等)對預測對象的影響,所以有時預測結果偏差很大。因果預測分析法如神經(jīng)網(wǎng)絡、如多元回歸分析法和神經(jīng)網(wǎng)絡。謝家智和車四方等人[2]考慮到地震災害損失的評估和預測是地震風險管理的重要環(huán)節(jié)。利用隨機權神經(jīng)網(wǎng)絡(NNRW)對我國地震災害直接經(jīng)濟損失進行了評估和預測,并將其與傳統(tǒng)的BP神經(jīng)網(wǎng)絡進行了比較。研究結果表明,在訓練時間、訓練精度和預測精度上隨機權神經(jīng)網(wǎng)絡都優(yōu)于BP神經(jīng)網(wǎng)絡,并且隨機權神經(jīng)網(wǎng)絡不易發(fā)生過擬合現(xiàn)象。因此,隨機權神經(jīng)網(wǎng)絡為地震災害直接經(jīng)濟損失的快速而精準評估和預測提供了一種新方法[2]。此類分析預測方法通過系統(tǒng)分析鹽化工生產(chǎn)線各節(jié)點,揭示因果關系和相互作用,從而預測固液比的走勢。時間序列分析法需求對鹽化工生產(chǎn)線各節(jié)點有完整的歷史數(shù)據(jù)(如蒸發(fā)罐固液比、蒸汽壓力、蒸汽溫度、循環(huán)泵電流和鹽腿實際值排出量),因果分析預測法則需要分析綜合各個影響因素,都不適合某一特定時刻的對蒸發(fā)罐內固液比預測。
貝葉斯網(wǎng)絡優(yōu)點在于處理事件之間不確定關系且有因果關系的問題。2018年李寒霜和趙忠蓋等人發(fā)現(xiàn)實際工業(yè)生產(chǎn)過程存在各種干擾因素,會導致被建模系統(tǒng)呈現(xiàn)隨機性及模型參數(shù)的不確定性。該算法首先給定參數(shù)相應的先驗分布,通過最大化目標函數(shù)的下界,從而估計得到參數(shù)的后驗分布。不僅可實現(xiàn)對參數(shù)的點估計,同時可以量化了估計值的不確定性[3]。佘玉軒等人[4]發(fā)現(xiàn)目前的多數(shù)故事線挖掘研究側重新聞文獻和事件的相似性分析,忽略了故事線的結構化表述及新聞具有的延時性,無法直觀地從模型結果看出不同新聞話題的發(fā)展過程。為此,提出一種基于貝葉斯網(wǎng)絡的無監(jiān)督故事線挖掘算法。將故事線看成日期、時間、機構、人物、地點、主題和關鍵詞的聯(lián)合概率分布,并考慮新聞時效性。在多個新聞數(shù)據(jù)集上進行的實驗和評估結果表明,與K-means、LSA等算法相比,該算法模型具有較高的故事線挖掘能力[4]。以江蘇井神鹽化股份有限公司4號生產(chǎn)線蒸發(fā)罐固液比預測為研究對象,再經(jīng)過系統(tǒng)分析影響罐內固液比因數(shù)的基礎上,描述鹽化工生產(chǎn)中固液比預測的貝葉斯網(wǎng)絡建模過程,結合調研過程中收集的數(shù)據(jù)利用pycharm結合scikit-learn 建模,將貝葉斯網(wǎng)絡、支持向量機、神經(jīng)網(wǎng)絡三種預測模型進行實驗對比。
鹽化工生產(chǎn)中固液比預測貝葉斯模型構建包括分析涉及相關變量因素,模型推理。從該企業(yè)獲得的生產(chǎn)實踐數(shù)據(jù)進行清洗,在此過程中指發(fā)現(xiàn)并糾正數(shù)據(jù)文件中可識別的錯誤,包括檢查數(shù)據(jù)一致性,處理無效值和缺失值等。由于這些數(shù)據(jù)從多個業(yè)務系統(tǒng)中抽取而來而且包含歷史數(shù)據(jù),這樣就避免不了有的數(shù)據(jù)是錯誤數(shù)據(jù),有的數(shù)據(jù)相互之間有沖突,這些錯誤的或有沖突的數(shù)據(jù)視為“臟數(shù)據(jù)”。再經(jīng)過屬性分析即從眾多屬性中理解各參數(shù)的含義以及其功能,從中挑選對固液比影響可控的關鍵參數(shù)進行分析研究之間的聯(lián)系研究其分布狀況。利用對樣本的數(shù)據(jù)集訓練,調整相關參數(shù),確定影響蒸發(fā)罐中固液比參數(shù)之間的條件獨立關系。研究路線見圖1。
圖1 研究路線圖Fig.1 Roadmap of research
模型搭建:(1)確立在貝葉斯網(wǎng)絡預測模型中影響因素。假設t時刻下的生產(chǎn)線蒸發(fā)罐中固液比(控制變量)與t-1、t-2和t-3時刻的蒸發(fā)罐中固液比(條件變量)有關聯(lián)。為了分析其他因素對當前固液比是否有影響,同時考慮在t時刻下蒸發(fā)罐固液比(gybt)與對應的t時刻蒸汽壓力(pet)、溫度(tet)、循環(huán)泵電流(mpt)和鹽腿實際值排出量(fict)之間的關聯(lián)性。
(2)算法訓練和網(wǎng)絡構建。建立一個控制變量和7個條件變量建立條件概率如公式(1)。假設存在某子集∏i?{ptt,tet,mpt,fict,gybt-1,gybt-2,gybt-3}使gybt與{ptt,tet,mpt,fict,gybt-1,gybt-2,gybt-3}是條件獨立的,對于任何x都有f(gybt|ptt,tet,mpt,fict,gybt-1,gybt-2,gybt-3)。
(1)
(3)模型推測。在相關條件因素處于離散狀態(tài)下,相關因素各個狀態(tài)都需要一個圖譜分布(圖2~圖4)。通過確立的網(wǎng)絡結構進行推測,通過系統(tǒng)分析,結合調研實際最后進行條件概率估計(圖5)。
圖2 蒸汽溫度分布圖Fig.2 Distribution map of steam temperature
圖3 蒸汽罐電流分布圖Fig.3 Distribution map of steam tank current
圖4 蒸汽壓力分布圖Fig.4 Distribution map of steam pressure
圖5 固液比Fig.5 Solid-liquid ratio
以江蘇井神鹽化股份有限公司4號生產(chǎn)線蒸發(fā)罐固液比預測為研究對象,利用pycharm結合scikit-learn 建模。如表1通過三種模型進行對比三種模型的平均絕對差、平均平方差和方均根差。發(fā)現(xiàn)基于貝葉斯網(wǎng)絡建立的固液比預測模型效果最佳,橫型性能對比圖見圖6。
表1 模型回歸預測評估Tab.1 Regression prediction and evaluation of model
圖6 模型性能對比圖Fig.6 Contrast diagram of model performance
通過pycharm軟件結合scikit-learn分別利用貝葉斯網(wǎng)絡、神經(jīng)網(wǎng)絡、支持向量機建模對鹽化工生產(chǎn)線的固液比進行預測對比,發(fā)現(xiàn)貝葉斯網(wǎng)絡模型更適合對該企業(yè)鹽化工生產(chǎn)線固液比的預測。