劉嘉鵬,唐朝暉,鐘宇澤,鄭鍶,向婉蓉
(中南大學 自動化學院,湖南 長沙,410083)
有色金屬在當今國防、工業(yè)、日常生活中扮演著十分重要的角色[1],它通常需要經過地質勘探、采礦、選礦、冶煉等獲得,其中,選礦是礦產加工中不可或缺的一環(huán)。在常用的選礦方法中,泡沫浮選法在多種有色金屬加工中的應用最為廣泛。泡沫浮選是按照人們的需求對可用礦物進行針對性選擇的一個復雜工業(yè)過程,在保證黏附目標礦物顆粒的同時,減少精礦中的其他非目標礦物顆粒。由于浮選過程耗費時間長、眾多要素難以控制,內部機理并不明顯,目前對于浮選過程性能指標(精礦品位、回收率和pH等)的監(jiān)測[2]仍然存在實時性差、準確率低等問題。
自20世紀80年代以來,對于如何構建關鍵性能指標數學模型的研究就從未停止。GONZALEZ等[3]使用原礦品位、礦漿品位等浮選過程中測得的工業(yè)數據作為輸入,建立自回歸移動平均、模糊組合等模型,預測安地納銅浮選廠精礦品位;YAN 等[4]使用7 個過程參數,構建偏最小二乘法、實時學習偏最小二乘法、自適應偏最小二乘法和反向傳播神經網絡等模型,預測銅精礦品位。上述方法在預測過程中未考慮泡沫圖像特征,還存在預測精度不夠的問題。隨著機器視覺和數字圖像處理技術的快速發(fā)展,采集泡沫浮選圖像使用軟測量的方式對關鍵性能指標進行監(jiān)測成為業(yè)界共識[5-6]。MASSINAEI 等[7]構建了泡沫圖像與工業(yè)過程參數之間的關系,開發(fā)了一種基于機器視覺的煤泥浮選監(jiān)測系統;ZHANG 等[8]設計了一種基于卷積神經記憶網絡的視覺軟傳感器模型,用神經網絡提取到的泡沫圖像特征對精礦品位的等級進行監(jiān)測。事實上,時間序列預測模型對于金融、經濟、氣候、社會、科學等眾多實際應用領域具有重要意義[9-13]。利用工業(yè)過程數據的時序信息,構建基于時間序列的神經網絡模型可以更好地預測關鍵性能指標。ZHAO等[14]提出基于局部特征的門控循環(huán)單元(gate recurrent unit, GRU),從輸入的時間序列采集關鍵特征,建立機器健康監(jiān)測系統,驗證時間序列在工業(yè)過程中的有效性和重要性;ZHANG 等[15]采用長短期記憶網絡(long short-term memory, LSTM)從視頻序列中采集信息,構建泡沫等級監(jiān)測模型,并取得較好的預測結果。
盡管泡沫圖像可以有效地表征當前浮選狀態(tài)[16],通過泡沫圖像構建基于時間序列的預測模型可以獲得較為準確的關鍵性能指標,但基于數據驅動的預測模型對未知樣本的輸入輸出難以做到精確匹配,換言之,對于泡沫浮選復雜流程工業(yè),關鍵性能指標變化范圍較大,泡沫圖像對應關鍵性能指標不具備唯一性。為解決上述問題,本文作者提出一種基于預測補償網絡的智能方法。該方法充分利用掃選泡沫圖像中的時序信息,構建基于時間序列的神經網絡模型對品位進行初始預測,分析誤差產生的原因,提高尾礦品位的預測精度。
在現代鉛鋅浮選廠,浮選生產過程由不同的浮選作業(yè)構成,主要包括鉛浮選、鋅浮選和混合礦漿浮選3個回路,是典型的具有級聯和循環(huán)返回特征的工業(yè)流程。塊狀鉛鋅礦石經過這3 個回路,產出鉛、鋅和鉛鋅混合精礦。本文研究鋅浮選過程,其輸入是經過鉛浮選后的礦漿,輸出是鋅精礦和鋅尾礦。
鋅浮選工藝示意圖如圖1所示,鋅浮選過程由粗選(快粗、粗I 和粗II)、精選(精I、精II 和精III)和掃選(掃I、掃II 和掃III) 3 個階段構成。對于尾礦品位監(jiān)測,本文以工業(yè)相機采集到的泡沫圖像為研究目標,XRF 分析儀采集的數據為鋅尾礦品位的真實標簽,構建泡沫圖像和鋅尾礦含量之間的預測補償網絡。
鋅掃選尾礦品位的預測補償(predictioncompensation, PC)網絡如圖2 所示。從泡沫視頻中獲取的特征向量集合Xi構成初始預測器的輸入,用于生成當前時刻的初始預測品位。真實品位yi組成的集合Yi-1和品位預測值組成的集合通過殘差誘因導出并得到ei。接著,ei通過改進Choquet 模糊積分(improved Choquet fuzzy integral,ICFI)的聚合模塊生成殘差補償對初始預測值進行必要的修正。最后,初始預測值和殘差補償值組合得到最終預測值
在實際生產過程中,工業(yè)相機采集的泡沫視頻時間為20 s,時間間隔為5 min,XRF 分析儀檢測尾礦品位的間隔為18~20 min。雖然歷史泡沫視頻序列之間的時間信息有效地指示了泡沫品位變化,但距離測量尾礦品位的時間戳越久,歷史泡沫視頻序列提供的時序信息越少。因此,在i時刻,選取距離當前時間戳最近的4個視頻序列為預測補償網絡特征向量提取的圖像來源。掃選槽泡沫視頻序列和鋅尾礦品位的對應關系如圖3 所示。圖中,{vt,t=1,2,…,m}表示掃選槽拍攝的泡沫視頻,m為泡沫視頻總數;{yi,i=1,2,…,n}表示鋅尾礦品位,n為尾礦品位測量總數。
圖3 掃選槽泡沫視頻序列和鋅尾礦品位對應關系Fig. 3 Correspondence between froth video sequence of scavenger and zinc tailings grade
初始預測器包括泡沫圖像的特征提取和基于時間序列網絡的品位初始預測兩部分。特征提取是提取與尾礦品位相關包含圖像特征的向量[17];基于時間序列的網絡旨在建立一個等級監(jiān)測模型,實行品位初始預測。
對于每個vt,抽取多張關鍵幀圖片,每張圖片生成特征向量f′v,將每個視頻所有的f′v歸一化并取均值,生成向量fv,用于初始預測的輸入。有關泡沫特征提取的方法見文獻[18]。
式中:r為泡沫圖像RGB 中紅色相對分量;s為氣泡的平均直徑;ga、gb、gc和gd分別為灰度共生矩陣提取的能量、對比度、熵和相關性;va和vb分別為氣泡速度的平均值和方差;b為氣泡的承載率。
以GRU 網絡為例,初始預測器的框架如圖4所示。在當前時刻,已知泡沫視頻{vt,t=1,2,…,m}對 應 的 特 征 向 量 {fv,v=1,2,…,m},Xi={f4i-3,f4i-2,f4i-1,f4i,i=1,2,…,n}構成尾礦品位監(jiān)測模型的輸入。經GRU 層后,Xi經過全連接層,得到品位初始預測值。值得注意的是,對于其他時間序列網絡如循環(huán)神經網絡(recurrent neural network, RNN)、LSTM等,圖4也同樣適用。
圖5 二進制索引獲取特征集合Fig. 5 Get feature set by binary index
一些學者將殘差用于時間序列的補償。LIAO等[19]建立Dest-ResNet 網絡用于車流速度預測,引入基于Seq2Seq的殘差網絡解決預測車流速度與實際車速之間的不匹配問題。HUANG等[20]研究了殘差遞歸神經網絡(residual recurrent neural network,R2N2),此網絡將傳統的自回歸(auto-regression,AR)模型作為初始預測器,采用RNN 估計殘差。以上方法都通過殘差的補償顯著提高了時間序列的預測精度。
在獲得品位初始預測后,將引起誤差的因素經過動態(tài)殘差補償(dynamic residual compensation,DRC)模型,得到殘差補償值。深度學習的核心是找到一個函數逼近,使得≈yi。建立動態(tài)殘差補償模型時,實際值與預測值之間的殘差由下式給出:
DRC 模型旨在學習εi中有價值的信息,充分考慮上一時刻的殘差、殘差的歷史趨勢以及殘差累積的作用,分析對真實品位的影響,使預測模型更加可靠,將校正為更準確的值。
2.2.1 殘差誘因導出模塊
通過對初始預測殘差產生的原因進行分析,結合誤差補償思想[21],構建殘差誘因導出模塊。將該模塊將初始預測的歷史輸出和真實品位的歷史值Yi-1=(y1,y2,…,yi-1) 作為輸入,得到導出結果ei=[e1i,e2i,…,eai]。當a=3時,ei中各個元素分別為
式中:i≥2且e11=0。
式中:i≥2且e21=0。
式中:i≥3且e31=e32=0。
在殘差誘因導出模塊中,連續(xù)時間戳上的殘差具有復雜性和相關性,ei由歷史殘差的合理組合得到。
2.2.2 改進Choquet模糊積分的聚合模塊
與其他聚合方式(例如平均值、中位數、加權平均等)相比[22],Choquet 模糊積分(Choquet fuzzy integral, CFI)提供一種可靠的預測策略,使用模糊測度(fuzzy measure, FM)聚合輸入,解釋輸入變量之間的高度可變性[23-24]。在品位預測中,CFI模塊獲取多個相互沖突的信息[25],處理預測值的歷史殘差,聚合ei=[e1i,e2i,…,eai],生成殘差補償值。此外,本文提供一種計算CFI 的有效方法,命名為ICFI。
采用模糊測度來度量要組合的各成分之間的相互作用[26]。令A={1,2,…,a} 為有限集合,Lj?2A,是A的冪集,其中,j=1,2,…,2a-1;μ是定義在A上的模糊測度[27],可以表示為一個集函數μ:2A→[0,1],且滿足邊界條件(即μ(?) =0,μ(A) =1)和單調性(若E?F?A,則μ(E) ≤μ(F) ≤μ(A))。
對于有限集合A,函數f是離散值函數,函數值f(1) =η1,f(2) =η2,…,f(a) =ηa。不失一般性,假設η1≤η2≤…≤ηa,記η=[η1,η2,…,ηa]。f關于模糊測度μ的離散CFI定義如下:
式中:1 ≤k≤a-1。
重新排列式(6)的各項,得到
式中:η0=(ei)η(0)=0。記Mη(k)={η(k),η(k+1),…,η(a)},依照慣例,Mη(a+1)=?。
為了更有效地計算式(7),提出一種二進制索引方案。共有2a個值決定FM,這些值存儲在v=[v0,v1,…,vj], 其中,j=0,1,…,2a-1。 在子集Lj?A中,創(chuàng)建z∈{0,1}a,使得μ(Lj)=vj。z的元素由下式給出:
因此,通過j的二進制表達式對子集Lj進行排序。當a=3 時,L0=?,L1={1},L2={2},L3={1,2},L4={3},L5={1,3},L6={2,3},L7={1,2,3}。
使用上述索引方案后,CFI的形式如下:
本文中,選定a=3進行后續(xù)實驗。因此,i時刻對εi的預測值為預測的殘差修正主模型的輸出。
和分別為i+d-1 時刻的初始預測值和殘差補償值,當d>0時(本文取d=1),最終預測值為
式中:為初始預測器的輸出,為動態(tài)殘差補償模型的輸出。
算法1 給出了預測補償算法的偽代碼。首先,初始預測器計算(步驟2);接著,動態(tài)殘差補償模型計算(步驟3~9);最后,將和結合得到(步驟10)。
算法1
實驗數據來源于中國廣東省某鉛鋅礦2019-08-10—2019-08-26期間采集的掃選槽泡沫視頻和尾礦品位,將視頻序列和尾礦品位按照圖3 進行對應,得到3 600 個泡沫視頻和1 200 個尾礦品位,并按照5:2:3的比例設置訓練集、驗證集和測試集。
預測模型性能評價環(huán)節(jié),選取平均絕對百分比誤差(eMAPE)和標準均方根誤差(eNRMSE) 2 個指標檢驗。
式中:eMAPE和eNRMSE分別為平均絕對百分比誤差(MAPE)和標準均方根誤差(NRMSE);ymax和ymin分別為真實品位的最大值和最小值。
為評估本文提出的預測補償網絡,首先設置實驗驗證動態(tài)殘差補償模型的有效性。設置GRU為初始預測器的基本網絡,對比有DRC 和無DRC的網絡模型預測性能,比較結果如表1所示。從表1可見:相比只含初始預測器的預測網絡,有DRC模型的預測補償網絡的eMAPE和eNRMSE分別下降7.58%和9.22%。顯然,有殘差補償模塊的GRU預測模型的預測性能更優(yōu)。
表1 有無DRC預測模型的性能比較Table 1 Comparison of performance of prediction models with or without DRC
選用不同初始預測器驗證有無DRC 對預測模型的影響,其中,模型1 選擇傳統的多層感知器(multi-layer perceptron, MLP)對整個初始預測器進行替換,此時,掃選槽泡沫視頻和尾礦品位一一對應,只使用了1 200個泡沫視頻和相同數量的品位數據;模型2和3分別選用RNN和LSTM替換圖4中初始預測器的GRU層;模型4選用圖4所示的初始預測器。
實驗條件設置如下:1) 所有模型在相同的實驗環(huán)境下完成;2) 模型1使用部分數據集,其余模型使用全部數據集,數據特征相同,所有品位數據來源于XRF 分析儀且經過標準化處理;3) 使用相同的驗證集確定模型超參數,確保每個模型達到最佳監(jiān)測效果。對已訓練好的模型在測試集上進行測試,并繪制如圖6 所示的預測結果散點圖。散點越靠近圖中對角線,表明預測品位越接近真實品位,模型預測效果越好。顯然,不同初始預測器在添加DRC后,預測效果都有不同程度提升。由此說明,動態(tài)殘差補償模型是必要的,可以有效提高預測模型的性能,對整個預測網絡作用顯著。
圖6 4種模型預測結果散點圖Fig. 6 Scatter charts of prediction results of four models
選用上述4 個訓練好的有DRC 的預測模型預測品位。所有模型遵循預測補償思想,先預測后補償,區(qū)別在于初始預測器的選擇不同。表2所示為4 個模型的預測性能??梢姡合啾扔贛LP-DRC模型,RNN-DRC模型的eMAPE和eNRMSE分別下降了21%和18.1%。顯然,在有時間序列的品位預測任務中,傳統的MLP 網絡無法學習時序上的前后關聯,預測效果沒有序列模型好。在序列模型中,有記憶細胞的LSTM-DRC 和GRU-DRC 模型比無記憶細胞的RNN-DRC模型的預測效果更好,尤其是GRU-DRC 模型的eMAPE比RNN-DRC 模型下降20%左右。這是因為RNN企圖將所有信息都記住,無論這些信息是否有用;LSTM 和GRU 會選擇性記憶,減輕記憶壓力,過濾噪聲信息,更有助于預測,擬合效果更好。此外,GRU 的參數較少,更簡潔,訓練速度快,效果比其他序列模型的稍好。
表2 模型預測性能的比較Table 2 Comparison of prediction performance of models
圖7 所示為4 個模型在測試集上的預測結果。與其他3個模型相比,模型4預測的品位變化趨勢更接近真實趨勢。
圖7 4種模型在測試集上的預測品位和真實品位Fig. 7 Predicted grade and real grade of four models on test set
測試集編號為120~200 樣本的誤差帶圖如圖8所示。
圖8 4種模型的誤差帶圖Fig. 8 Error band diagrams of four models
從圖7 和圖8 可見,LSTM-DRC 和GRU-DRC模型預測效果均優(yōu)于MLP-DRC 和RNN-DRC 模型的預測效果。這是因為在處理序列問題時,MLP學習不夠充分,容易陷入局部極值;過長的序列導致RNN 反向傳播時的梯度計算異常影響模型精度;LSTM和RNN模型則因為具有更新門的結構,能適當保留之前時刻的結果,捕捉長序列之間的關聯信息,有效應對長序列預測問題。
1) 為解決傳統品位預測模型的殘差問題,提出一種新穎的基于序列模型的預測補償網絡。該網絡包括初始預測器和動態(tài)殘差補償模型兩部分,通過對初始預測器的預測值補償提高網絡的預測性能。
2) 作為預測補償網絡的重要部分,構建殘差誘因導出模塊和ICFI 聚合模塊相結合的動態(tài)殘差補償模型,實現了在預測過程中補償殘差。同時,實驗驗證了動態(tài)殘差補償模型的有效性,相比于DRC模型,RNN-DRC模型的eMAPE和eNRMSE的下降幅度都超過10%。
3) 與其他神經網絡模型相比,本文提出的網絡能更準確地預測鋅尾礦品位,相比于MLP-DRC模型,GRU-DRC的eMAPE和eNRMSE的下降幅度都超過30%。
4) 在預測補償網絡的基礎上,如何對時間序列網絡進行改進以及對品位預測進行置信度評估是后續(xù)研究的方向。