陳 飛 朱婷婷 周繼開
(1.新疆維吾爾自治區(qū)特種設(shè)備檢驗(yàn)研究院,烏魯木齊 830011;2.新疆工程學(xué)院,烏魯木齊 830023)
隨著自動(dòng)化技術(shù)和計(jì)算機(jī)技術(shù)的發(fā)展,利用過(guò)程工藝本身的海量生產(chǎn)數(shù)據(jù)對(duì)生產(chǎn)工藝優(yōu)化及機(jī)理認(rèn)識(shí)等方面的研究越來(lái)越受到大家認(rèn)可。生物冶金作為含砷、硫難處理金礦的提金主要方法[1~5],近年來(lái)被廣泛研究。但大多研究都只基于工藝本身的改進(jìn),導(dǎo)致大量工藝過(guò)程數(shù)據(jù)被閑置,使隱含的有價(jià)值信息沒(méi)有被充分利用進(jìn)而造成資源的極大浪費(fèi)。為此,筆者以現(xiàn)場(chǎng)實(shí)測(cè)數(shù)據(jù)庫(kù)為主要依據(jù),通過(guò)對(duì)生物冶金工藝進(jìn)行研究,在不增加硬件成本和改變工藝的前提下提高生物冶金的提金率。
溫度、礦漿pH值、進(jìn)風(fēng)量、Fe2+濃度、磨礦細(xì)度、礦漿濃度和培養(yǎng)基是影響生物冶金提金率的主要因素[6,7],其中Fe2+濃度、磨礦細(xì)度、礦漿濃度和培養(yǎng)基屬不可控因素,溫度、礦漿pH值和進(jìn)風(fēng)量屬可控因素?,F(xiàn)場(chǎng)通過(guò)合適的檢測(cè)傳感器件對(duì)可控因素進(jìn)行實(shí)時(shí)測(cè)量、保存,為后續(xù)基于數(shù)據(jù)的生物冶金研究提供保障和可能。
現(xiàn)場(chǎng)實(shí)測(cè)數(shù)據(jù)量較大,通過(guò)常規(guī)方法處理并分析這些數(shù)據(jù)可以發(fā)現(xiàn),它們都是以時(shí)間為節(jié)點(diǎn)、以各個(gè)因素為字段的天然時(shí)間序列。因此,時(shí)間序列的分析和處理方法可用于處理這些實(shí)測(cè)數(shù)據(jù)?,F(xiàn)有的時(shí)間序列表示方法主要有移動(dòng)平均模型和指數(shù)平滑模型[8~10]。相比于移動(dòng)平均模型,指數(shù)平滑模型是對(duì)所有觀測(cè)值的加權(quán)平均,權(quán)值按照指數(shù)規(guī)律衰減,距觀測(cè)時(shí)間點(diǎn)越近權(quán)值越大,這比移動(dòng)平均模型更合理。指數(shù)平滑模型如下:
St=αyt+(1-α)St-1
(1)
式中St——在時(shí)間t時(shí)的研究對(duì)象估計(jì)值;
yt——在時(shí)間t時(shí)的研究對(duì)象觀測(cè)值;
α——平滑系數(shù),α∈(0,1)。
根據(jù)工藝過(guò)程中工藝參數(shù)的變化共性,取α=0.12。對(duì)原采集數(shù)據(jù)進(jìn)行平滑處理,可得可控參數(shù)平滑趨勢(shì)數(shù)據(jù)與平滑差值曲線如圖1~3所示。
圖1 pH值平滑趨勢(shì)數(shù)據(jù)與平滑差值曲線
圖2 溫度平滑趨勢(shì)數(shù)據(jù)與平滑差值曲線
圖3 進(jìn)風(fēng)量平滑趨勢(shì)數(shù)據(jù)與平滑差值曲線
關(guān)聯(lián)規(guī)則就是發(fā)現(xiàn)數(shù)據(jù)庫(kù)以及其他數(shù)據(jù)存儲(chǔ)中的大量項(xiàng)集間有價(jià)值的模式和項(xiàng)集間的相關(guān)性。生物冶金過(guò)程是一個(gè)生物、物理、電化學(xué)和其他因素共同作用的多域復(fù)雜過(guò)程,其黃金提取率受多方面主觀和非主觀因素影響,且影響關(guān)系尚在進(jìn)一步的精確研究當(dāng)中。利用Apriori關(guān)聯(lián)規(guī)則算法對(duì)工業(yè)實(shí)測(cè)數(shù)據(jù)庫(kù)項(xiàng)集中感興趣的規(guī)則進(jìn)行挖掘,可以得到黃金提取率與可控因素間的可描述關(guān)系。
為了提高規(guī)則的挖掘效率與速率,在進(jìn)行規(guī)則挖掘之前需要對(duì)原始數(shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行處理。一般將數(shù)據(jù)分為數(shù)值型數(shù)據(jù)和二進(jìn)制數(shù)據(jù),針對(duì)不同的算法要求,數(shù)據(jù)的轉(zhuǎn)換格式也不相同。Apriori算法是一種最有影響力的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的算法,其核心是基于兩階段頻集思想的遞推算法[11]。該關(guān)聯(lián)規(guī)則在分類上屬于單維、單層、布爾關(guān)聯(lián)規(guī)則,因此,為滿足Apriori算法要求,需將原始數(shù)據(jù)轉(zhuǎn)換為布爾型數(shù)據(jù)。
進(jìn)行關(guān)聯(lián)規(guī)則挖掘的目的就是為了發(fā)現(xiàn)各可控因素對(duì)黃金提取率的影響作用。所謂影響作用就是在其他變量都一定或處于某一穩(wěn)定范圍時(shí),該變量的變化對(duì)黃金提取率的影響。一般將影響結(jié)果分為升高、降低和不變3種情況。有一項(xiàng)集It={Pt,Tt,Ft,Ot},其中P、T、R是分屬3個(gè)不相同域的變量,O是研究對(duì)象。在下一時(shí)刻,It+1={Pt+1,Tt+1,Ft+1,Ot+1},此時(shí)各變量均有3種變化結(jié)果,以F為例:若Ft+1>Ft則記F′=1;若Ft+1 表1 生物冶金工藝參數(shù)三值狀態(tài)變換 生物冶金工藝中黃金提取率難以實(shí)時(shí)、處處在線測(cè)量,因此給相關(guān)研究帶來(lái)了極大困難。但據(jù)相關(guān)學(xué)者研究發(fā)現(xiàn),黃金提取率與ORP線性正相關(guān),因此研究可控影響因素與黃金提取率間的影響關(guān)系可轉(zhuǎn)化成研究可控影響因素與ORP間的影響關(guān)系。在以下的研究中所有ORP項(xiàng)集均取“升高”情況,即三值狀態(tài)中的{1}。 在使用Apriori算法挖掘關(guān)聯(lián)規(guī)則時(shí),為了衡量規(guī)則的價(jià)值(或者稱為興趣度),需要定義兩個(gè)指標(biāo),即支持度和置信度。一般這兩個(gè)指標(biāo)都是依據(jù)經(jīng)驗(yàn)人為設(shè)定,但筆者研究的內(nèi)容完全建立在數(shù)據(jù)分析基礎(chǔ)上,過(guò)程中并不摻入現(xiàn)有的非數(shù)據(jù)經(jīng)驗(yàn),僅將其作為最終規(guī)則的工藝驗(yàn)證標(biāo)準(zhǔn)。因此在下面的規(guī)則挖掘中只取支持度和置信度最大的規(guī)則作為強(qiáng)關(guān)聯(lián)規(guī)則,當(dāng)最大支持度和最大置信度不在同一條規(guī)則時(shí)以支持度最大為準(zhǔn)。 依據(jù)Apriori算法挖掘工藝參數(shù)pH值與ORP間的影響關(guān)系,項(xiàng)集X={Pt}、Y={Ot},可得變換如下: (2) (3) Pt取三值狀態(tài),規(guī)則X({Pt})?Y({Ot})的置信度和支持度見(jiàn)表2。依據(jù)約定的規(guī)則關(guān)聯(lián)強(qiáng)度衡量準(zhǔn)則,規(guī)則{-1,1}的置信度和支持度最大,是有價(jià)值的規(guī)則。對(duì)其進(jìn)行解釋即為“pH降低,ORP升高”, pH值的衡量起點(diǎn)為均值2。 表2 pH值與ORP影響關(guān)系關(guān)聯(lián)規(guī)則挖掘結(jié)果 同上,X({Pt})?Y({Ot})的挖掘方法,Tt取三值狀態(tài),規(guī)則X({Tt})?Y({Ot})的置信度和支持度結(jié)果見(jiàn)表3。規(guī)則{-1,1}的支持度最大,是要尋找的有價(jià)值規(guī)則。對(duì)其進(jìn)行解釋即為“溫度降低,ORP升高”,溫度的衡量起點(diǎn)為均值42.3℃。 表3 溫度與ORP影響關(guān)系關(guān)聯(lián)規(guī)則挖掘結(jié)果 X({Pt})?Y({Ot})的挖掘方法,F(xiàn)t取三值狀態(tài),規(guī)則X({Ft})?Y({Ot})的置信度和支持度結(jié)果見(jiàn)表4。規(guī)則{1,1}的支持度最大,是要尋找的有價(jià)值規(guī)則。對(duì)其進(jìn)行解釋即為“進(jìn)風(fēng)量增大,ORP升高”,進(jìn)風(fēng)量的衡量起始點(diǎn)為均值1 584.5m3/h。 表4 進(jìn)風(fēng)量與ORP影響關(guān)系關(guān)聯(lián)規(guī)則挖掘結(jié)果 由細(xì)菌活性試驗(yàn)資料可知,pH在1.0~2.2、溫度在25~45℃、進(jìn)風(fēng)量在1 400~2 300m3/h時(shí)是生物冶金所用鐵氧化硫桿菌、硫氧化硫桿菌及鐵氧化螺旋桿菌等菌種的最佳環(huán)境條件。 由上述挖掘到的規(guī)則分析可知,當(dāng)溫度均值為42.3℃時(shí),已接近細(xì)菌活性最佳溫度上限,因此溫度的下降對(duì)微生物細(xì)菌活性有利,所以規(guī)則“溫度降低,ORP升高”符合工藝實(shí)際。當(dāng)pH值均值為2時(shí),已接近細(xì)菌活性最佳pH值上限,因此pH的降低對(duì)微生物細(xì)菌活性有利,所以規(guī)則“pH值降低,ORP升高”符合工藝實(shí)際。當(dāng)進(jìn)風(fēng)量均值為1 584.5m3/h時(shí),進(jìn)風(fēng)量處于最佳環(huán)境條件的下半部分,進(jìn)風(fēng)量增加對(duì)微生物細(xì)菌活性有利,所以規(guī)則“進(jìn)風(fēng)量增大,ORP升高”符合工藝實(shí)際。但進(jìn)風(fēng)量的增加也有限度,當(dāng)進(jìn)風(fēng)量過(guò)大時(shí)會(huì)使附著在礦粒表面的微生物細(xì)菌脫落,不利于預(yù)處理過(guò)程的進(jìn)行,從而使黃金提取率降低。 筆者依據(jù)生物冶金過(guò)程數(shù)據(jù),通過(guò)對(duì)生物冶金工藝的深入分析,由數(shù)據(jù)挖掘方法得到了ORP與關(guān)鍵可控過(guò)程工藝參數(shù)間的可描述關(guān)系,揭示了生物冶金工藝的部分機(jī)理,為提高生物冶金提金率和下一步的工藝過(guò)程控制優(yōu)化提供了依據(jù)。 [1] 陳飛.基于時(shí)間序列數(shù)據(jù)挖掘的生物氧化提金工藝參數(shù)優(yōu)化[D].烏魯木齊:新疆大學(xué),2014. [2] 南新元,陳飛,孔軍.高寒地區(qū)某金礦生物氧化預(yù)處理過(guò)程溫度控制研究[J].貴金屬,2014,35(2):38~42. [3] 李泉.生物氧化提金預(yù)處理過(guò)程參數(shù)間關(guān)系的辨識(shí)研究[J].化工自動(dòng)化及儀表,2014,41(10):1185~1188. [4] 李偉,南新元,吳瓊.生物氧化提金中基于PSO-LSSVM的氧化還原電位建模研究[J].貴金屬,2014,35(4):60~64. [5] 呂重安,安娟.生物氧化預(yù)處理提金新工藝研究[J].湖南有色金屬,2010,26(1):28~30. [6] 劉子龍,秦曉鵬.影響生物氧化提金工藝的主要因素與措施[J].黃金科學(xué)技術(shù),2010,18(2):58~60. [7] 高丙朋,南新元,魏霞.基于迭代LS-SVM生物氧化提金預(yù)處理工藝參數(shù)優(yōu)化算法的研究[J].貴金屬,2012,33(2):40~43. [8] Liao S H,Chu P H,Hsiao P Y.Data Mining Techniques and Applications:A Decade Review from 2000 to 2011[J].Expert Systems with Applications,2012,39(12):11303~11311. [9] Han J W,Kamber M.Data Mining-Concepts and Techniques[M]. Amsterdam: Elsevier,2011:147~149. [10] Ralha C G,Silva C V S.A Multi-agent Data Mining System for Cartel Detection in Brazilian Government Procurement[J].Expert Systems with Applications,2012,39(14):11642~11656. [11] 包震宇.基于粗糙集對(duì)Apriori算法的改進(jìn)[D].上海:上海師范大學(xué),2010.2.2 規(guī)則定義
2.3 Apriori算法關(guān)聯(lián)規(guī)則挖掘
3 挖掘規(guī)則評(píng)估
4 結(jié)束語(yǔ)