高 鵬 張寧豫 張臣一 吳 劍
(1.東北大學(xué)資源與土木工程學(xué)院,遼寧沈陽(yáng)110819;2.難采選鐵礦資源高效開(kāi)發(fā)利用技術(shù)國(guó)家地方聯(lián)合工程研究中心,遼寧沈陽(yáng)110819;3.東北大學(xué)基因礦物加工研究中心,遼寧沈陽(yáng)110819;4.東北大學(xué)信息科學(xué)與工程學(xué)院,遼寧沈陽(yáng)110819)
浮選作為選礦中應(yīng)用最廣泛的一種方法,是利用礦物表面物理化學(xué)性質(zhì)的差異來(lái)選擇礦物的方法,按照分選方式不同可分為正浮選和反浮選,浮選中常用的藥劑有捕收劑、抑制劑、活化劑和pH值調(diào)整劑等。浮選過(guò)程由于工藝復(fù)雜,影響因素較多,因此優(yōu)化浮選工藝指標(biāo)是非常困難的,精礦品位和尾礦品位作為浮選的重要工藝指標(biāo)與藥劑用量之間存在復(fù)雜的非線性關(guān)系,而且特征變量之間的交互效應(yīng)會(huì)影響工藝指標(biāo),因此直接通過(guò)非線性回歸模型進(jìn)行預(yù)測(cè)在克服維數(shù)災(zāi)禍問(wèn)題方面存在一定難度,需要對(duì)模型進(jìn)行一些無(wú)法驗(yàn)證的假設(shè),導(dǎo)致預(yù)測(cè)效果一般,而藥劑消耗成本是選礦成本中重要的一部分,因此藥劑用量的預(yù)測(cè)是浮選作業(yè)中非常重要的問(wèn)題。
隨著人工智能和智能制造技術(shù)的發(fā)展,深度學(xué)習(xí)方法廣泛應(yīng)用于工業(yè)生產(chǎn)過(guò)程中,將深度學(xué)習(xí)應(yīng)用于浮選藥劑預(yù)測(cè)取得了良好的應(yīng)用效果。本文以某選礦廠為范例,基于統(tǒng)計(jì)學(xué)習(xí)理論對(duì)其浮選車間的藥劑消耗與影響因素進(jìn)行建模,并利用模型進(jìn)行優(yōu)化及預(yù)測(cè),達(dá)到管控藥劑用量的目的。
由于浮選作業(yè)中藥劑用量預(yù)測(cè)的難度較大,獲得有價(jià)值的數(shù)據(jù)較難,因此國(guó)內(nèi)外相關(guān)研究較少,耿增顯等[1]利用典型案例推理的方法對(duì)復(fù)雜工業(yè)過(guò)程進(jìn)行建模與控制。李海波等[2]研究了浮選過(guò)程混合智能優(yōu)化的控制方法,基于RBF神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)優(yōu)化控制方案。王偉[3]利用遺傳算法和非線性規(guī)劃技術(shù)研究了粗銅浮選過(guò)程加藥量的預(yù)測(cè)和控制。Vazifeh等[4]使用統(tǒng)計(jì)學(xué)技術(shù)研究了浮選過(guò)程中藥劑消耗的問(wèn)題,N.Aslan[5]使用統(tǒng)計(jì)學(xué)技術(shù)即二次規(guī)劃問(wèn)題研究了浮選藥劑消耗的優(yōu)化問(wèn)題,F(xiàn).Nakhaeie[6]建立的基于人工神經(jīng)網(wǎng)絡(luò)的ANN模型證實(shí)前饋神經(jīng)網(wǎng)絡(luò)能以足夠的精度預(yù)測(cè)工業(yè)CISA浮選柱精礦中銅和鉬的品位。
由于在未來(lái)的固定時(shí)間內(nèi)(周、月、年),原礦處理量、原礦品位、原礦磁性鐵含量、原礦氧化亞鐵含量、浮選給礦品位、浮選給礦量、浮選精礦品位、浮選尾礦品位、浮選回收率、浮選產(chǎn)率,(X1,X2,???,X10)都是隨機(jī)的,無(wú)法確定,因此預(yù)測(cè)未來(lái)1周、1月及1年的藥劑用量,不僅是某1 d藥劑消耗乘以相應(yīng)的天數(shù),本文使用Reject-Accept(R-A)隨機(jī)抽樣的方法來(lái)生成服從數(shù)據(jù)樣本概率分布特征的隨機(jī)數(shù),其核心思想是通過(guò)事件出現(xiàn)的頻率特征來(lái)模擬估計(jì)事件發(fā)生的概率規(guī)律,即通過(guò)大量的模擬試驗(yàn),生成未來(lái)1周、1月及1年的輸出隨機(jī)數(shù)矩陣,從而反映1年中輸入特征的變化規(guī)律,最后通過(guò)神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)出對(duì)應(yīng)周月年的藥劑消耗量,并通過(guò)對(duì)多次模擬的結(jié)果取均值,進(jìn)而得到未來(lái)藥劑消耗的總和。
因此,利用數(shù)據(jù)庫(kù)中的數(shù)據(jù),采用核概率密度函數(shù)估計(jì)生成每個(gè)特征的概率密度函數(shù),再利用R-A算法生成不同特征分布的隨機(jī)數(shù),利用這些隨機(jī)數(shù)生成每種藥劑最終的用量,每次都分別生成7條、30條、365條數(shù)據(jù),進(jìn)行300次模擬,利用這些特征數(shù)據(jù)預(yù)測(cè)相應(yīng)的藥劑消耗,再求和得到周、月、年的藥劑消耗總和。生成周、月、年的特征數(shù)據(jù)后,利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型對(duì)現(xiàn)有的數(shù)據(jù)進(jìn)行預(yù)測(cè),再對(duì)不同天數(shù)藥劑消耗量做預(yù)測(cè),即可得到相應(yīng)的周、月、年的藥劑消耗。
通過(guò)基本描述性分析發(fā)現(xiàn),收集到的一些參數(shù)指標(biāo)變化較小,因此為了研究這些參數(shù)的極限分布,就需要大量的樣本輔助進(jìn)行統(tǒng)計(jì)推斷,因此采用歷史的數(shù)據(jù)作為輔助,建立周、月、年預(yù)測(cè)模型。隨著礦石的開(kāi)采,原礦的性質(zhì)也會(huì)發(fā)生一定的變化,從而引起浮選藥劑用量的變化,為使該模型能夠滿足現(xiàn)場(chǎng)的長(zhǎng)期使用,所以將原礦品位、磁性鐵含量、碳酸鐵含量和亞鐵含量等原礦性質(zhì)作為數(shù)據(jù)處理的指標(biāo)。本文以原礦碳酸鐵含量數(shù)據(jù)作為范例進(jìn)行算法預(yù)測(cè)。
(1)利用555條數(shù)據(jù)作為樣本,采用核概率密度函數(shù)估計(jì)的方法,生成該指標(biāo)的概率密度圖,假設(shè)原礦碳酸鐵的含量數(shù)據(jù)分別為Z1,Z2,…,Zn,概率密度函數(shù)為fZ(z),因此概率密度函數(shù)的估計(jì)為:
步驟如下:
步驟1:產(chǎn)生均勻分布的隨機(jī)數(shù)Y~fY(y);
步驟2:產(chǎn)生均勻分布隨機(jī)數(shù)U~U(0,1);
(3)對(duì)原礦碳酸鐵含量,生成M個(gè)n維的向量,把其中的第i個(gè)帶入就能獲得完整的數(shù)據(jù),再利用完整的數(shù)據(jù)做預(yù)測(cè),1≤i≤n,因此采用模型進(jìn)行預(yù)測(cè)時(shí),可以得到M個(gè)預(yù)測(cè)值,把這M個(gè)預(yù)測(cè)值進(jìn)行平均即為藥劑用量的最終預(yù)測(cè)值。
為了對(duì)樣本數(shù)據(jù)進(jìn)行采樣,按照上節(jié)算法的運(yùn)算流程,采用核概率密度函數(shù)估計(jì)的方法,生成原始輸入變量的概率密度函數(shù)圖,分別獲取X1,X2,???,X10的概率密度函數(shù)fZ1(z),???,fZ10(z),如圖1所示。
在獲得原始輸入變量的概率密度分布后,由于構(gòu)造參考分布時(shí),使用的是均勻分布,故選擇X1,X2,???,X10分別服從如表1所示的均勻分布。
由于在構(gòu)造參考分布時(shí),使用的是均勻分布,故在確定k值的過(guò)程中,選取如表2所示的值:
根據(jù)2.2節(jié)的采樣步驟,按照表1與表2的取值范圍開(kāi)始生成樣本,在取得采樣結(jié)果后,將生成的X1,X2,???,X10數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)的輸入樣本,將反浮選天、周、月、年各藥劑總消耗數(shù)據(jù)Y1,Y2,Y3,Y4分別作為模型的輸出目標(biāo)值,隨后采用前饋神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)進(jìn)行擬合預(yù)測(cè)。
nl表示網(wǎng)絡(luò)的層數(shù),第一層為輸入值,最后一層為輸出值;sl表示第l層神經(jīng)元的個(gè)數(shù);f(?)表示的是激活函數(shù);表示第l層到第l+1層的權(quán)重矩陣;表示第l層到第l+1層的偏置;z(l)∈Rsl表示第l層的輸入;表示第l層中第i個(gè)神經(jīng)元的輸入;表示第l層的輸出,其中表示第l層中第i個(gè)神經(jīng)元的輸出。每個(gè)神經(jīng)元的表達(dá)式如下:
需要利用數(shù)據(jù)訓(xùn)練,求出相應(yīng)的權(quán)重矩陣及偏置向量,采用反向傳播算法給定樣本容量為n的樣本訓(xùn)練集,目標(biāo)函數(shù)為:
采用梯度下降算法極小化目標(biāo)函數(shù)J(W,b)
在把數(shù)據(jù)集填補(bǔ)后,利用前饋神經(jīng)網(wǎng)絡(luò)建模預(yù)測(cè)藥劑消耗。
通過(guò)數(shù)據(jù)驅(qū)動(dòng)的特征篩選方法及行業(yè)知識(shí),采用10個(gè)特征變量預(yù)測(cè)藥劑用量,10個(gè)特征變量分別記為原礦量X1,原礦品位X2,原礦磁性鐵含量X3,原礦碳酸鐵含量X4,原礦亞鐵含量X5,浮選精礦品位X6,浮選尾礦品位X7,浮選精礦回收率X8,浮選精礦產(chǎn)率X9,浮選給礦量X10。預(yù)測(cè)4種藥劑用量:捕收劑用量Y1,pH調(diào)整劑用量Y2,抑制劑用量Y3,活化劑用量Y4,使用填補(bǔ)后的555條數(shù)據(jù),進(jìn)行建模研究,并利用隨機(jī)數(shù)生成的方法得到未來(lái)7 d(1周)、30 d(1月)、365 d(1年)的特征數(shù)據(jù),預(yù)測(cè)結(jié)果見(jiàn)表3。
如表4所示,通過(guò)計(jì)算生產(chǎn)數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)的誤差表明,預(yù)測(cè)7 d(1周)的數(shù)據(jù)結(jié)果精度較高,誤差普遍小于5%;預(yù)測(cè)30 d(1月)和預(yù)測(cè)365 d(1年)的數(shù)據(jù)相比于生產(chǎn)實(shí)際數(shù)據(jù)誤差波動(dòng)較大,這是由于在實(shí)際生產(chǎn)過(guò)程中存在不定期的設(shè)備停車檢修和流程考察調(diào)試等無(wú)法預(yù)測(cè)的狀況,所以實(shí)際的藥劑用量會(huì)根據(jù)現(xiàn)場(chǎng)的情況作出相應(yīng)的調(diào)整,導(dǎo)致長(zhǎng)期的預(yù)測(cè)結(jié)果與實(shí)際結(jié)果存在較大波動(dòng)。
本文通過(guò)對(duì)浮選藥劑消耗的研究,采用拒絕采樣算法對(duì)工業(yè)生產(chǎn)中的缺失數(shù)據(jù)進(jìn)行填補(bǔ),把填補(bǔ)后的數(shù)據(jù)利用前饋神經(jīng)網(wǎng)絡(luò)進(jìn)行建模,創(chuàng)新性地將統(tǒng)計(jì)推斷和深度學(xué)習(xí)相融合,對(duì)短期現(xiàn)場(chǎng)生產(chǎn)實(shí)踐的浮選藥劑消耗量預(yù)測(cè)具有一定的指導(dǎo)意義。