婁小芳,鄒逢興
(國防科學(xué)技術(shù)大學(xué)機電工程與自動化學(xué)院,湖南長沙410073)
基于相關(guān)性分析的鋁工業(yè)生產(chǎn)能耗尋優(yōu)
婁小芳,鄒逢興
(國防科學(xué)技術(shù)大學(xué)機電工程與自動化學(xué)院,湖南長沙410073)
首先,針對鋁工業(yè)從采礦到電解鋁加工的整個生產(chǎn)過程,分析了生產(chǎn)噸鋁的基本能耗情況,并提出了基于相關(guān)性分析的關(guān)聯(lián)規(guī)則挖掘算法。然后,運用C語言實現(xiàn)了算法,完成了對鋁工業(yè)生產(chǎn)過程中大量能耗數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘,找出了其中相關(guān)性最密切的變量,并通過控制該變量來指導(dǎo)鋁工業(yè)生產(chǎn)的節(jié)能降耗。
鋁工業(yè);生產(chǎn)能耗;相關(guān)性分析;關(guān)聯(lián)規(guī)則;數(shù)據(jù)挖掘
隨著計算機技術(shù)的飛速發(fā)展,尤其是數(shù)據(jù)庫技術(shù)的日益普及,數(shù)據(jù)挖掘技術(shù)為我們提供了一些方法來有效利用豐富的數(shù)據(jù)。目前對于數(shù)據(jù)挖掘方面的研究已經(jīng)取得了很大的進步,開發(fā)出了許多新的算法與系統(tǒng)。鋁工業(yè)生產(chǎn)過程的能耗問題一直是人們不斷研究和探索的一個問題,目前研究雖然取得了一定的成效,但仍然有很多不足之處。為此,應(yīng)用數(shù)據(jù)挖掘技術(shù)研究不同因素對能耗的影響程度,以及各因素之間的相關(guān)性,并以此來指導(dǎo)生產(chǎn)實踐,達到鋁工業(yè)生產(chǎn)過程的節(jié)能降耗,具有重要意義。
本文首先介紹了數(shù)據(jù)挖掘技術(shù)與關(guān)聯(lián)規(guī)則挖掘的相關(guān)知識,并針對當(dāng)前鋁工業(yè)從采礦到電解鋁加工的整個生產(chǎn)過程,提煉出了生產(chǎn)噸鋁的基本能耗情況。然后,提出了基于相關(guān)性分析的關(guān)聯(lián)規(guī)則挖掘算法,并運用C語言實現(xiàn)了算法,完成了對鋁工業(yè)生產(chǎn)過程中大量能耗數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘。
(一)數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的和隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的但又是潛在有用的信息和知識的過程[1]。數(shù)據(jù)挖掘是指一個完整的過程,該過程從大型數(shù)據(jù)庫中挖掘先前未知的、有效的、實用的信息,并使用這些信息做出決策。數(shù)據(jù)挖掘的基本步驟分為五步[2]。第一步,確定業(yè)務(wù)對象,清晰地定義出業(yè)務(wù)D,記為Sup(X→Y)。
(2)關(guān)聯(lián)規(guī)則X→Y的置信度。Count(X)是項目集X的支持數(shù),表示事物數(shù)據(jù)庫D中支持項目集X的事物數(shù),關(guān)聯(lián)規(guī)則X→Y的置信度定義為Count(X→Y)/Count(X),記為Conf(X→Y)。
為了挖掘出有意義的關(guān)聯(lián)規(guī)則,一般需要給定兩個閾值,即最小支持度(Minsup)和最小置信度(Minconf)。前者表示一組數(shù)據(jù)集在統(tǒng)計意義上所需滿足的最低要求,后者反映了用戶對關(guān)聯(lián)規(guī)則的最低置信度。
在關(guān)聯(lián)規(guī)則的挖掘算法中,以Agrawal等人提出的Apriori算法最為著名,它是一種最有影響和最為常用的關(guān)聯(lián)規(guī)則挖掘算法,分兩步進行。
第一步,從事物數(shù)據(jù)庫D中找出所有支持度不小于用戶指定的最小支持度閾值的頻繁項目集。在數(shù)據(jù)挖掘中,支持度不小于用戶給定的最小支持度閾值的項目集簡稱為頻繁項目集。第二步,使用頻繁項目集產(chǎn)生所期望的關(guān)聯(lián)規(guī)則,基本原則是其置問題。認清數(shù)據(jù)挖掘的目的是數(shù)據(jù)挖掘的重要一步,挖掘的最后結(jié)果不可預(yù)測,但要探索的問題應(yīng)該是有預(yù)見性的,為了數(shù)據(jù)挖掘而挖掘則帶有盲目性,是不會成功的。第二步,準備數(shù)據(jù)。(1)數(shù)據(jù)選擇。搜索所有與業(yè)務(wù)對象有關(guān)的內(nèi)部和外部數(shù)據(jù)信息,并從中選擇出適用于數(shù)據(jù)挖掘的數(shù)據(jù)。(2)數(shù)據(jù)預(yù)處理。研究數(shù)據(jù)的質(zhì)量,進行數(shù)據(jù)的集成、變換、歸約、壓縮等,為進一步的分析做準備,并確定將要進行的挖掘操作的類型。(3)數(shù)據(jù)轉(zhuǎn)換。將數(shù)據(jù)轉(zhuǎn)換成一個分析模型,這個分析模型是針對挖掘算法建立的,這是數(shù)據(jù)挖掘成功的關(guān)鍵。第三步,數(shù)據(jù)挖掘。對所得到的經(jīng)過轉(zhuǎn)換的數(shù)據(jù)進行挖掘,除了完善和選擇合適的挖掘算法外,其余一切工作都能自動完成。第四步,結(jié)果分析。解釋并評估結(jié)果,其使用的分析方法一般應(yīng)視挖掘操作而定,通常會用到可視化技術(shù)。第五步,知識同化。將分析所得到的知識集成到業(yè)務(wù)信息系統(tǒng)的組織結(jié)構(gòu)中去。
(二)關(guān)聯(lián)規(guī)則挖掘[3]
關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘中最活躍的研究方向之一,它是由Rakesh Agrawal等人首先提出的一個重要的KDD(Knowledge Discovery in Database)研究課題,反映了大量數(shù)據(jù)中項目之間有趣的關(guān)聯(lián)或相關(guān)關(guān)系。
(1)關(guān)聯(lián)規(guī)則X→Y的支持數(shù)(度)。事物數(shù)據(jù)庫D中支持項目集X∪Y的事務(wù)數(shù)稱為關(guān)聯(lián)規(guī)則X→Y的支持數(shù),記為Count(X→Y)。關(guān)聯(lián)規(guī)則X→Y的支持度為Count(X→Y)/信度不小于用戶指定的最小置信度閾值。
基于上面對關(guān)聯(lián)規(guī)則挖掘的描述,本文提出了基于相關(guān)性分析的關(guān)聯(lián)規(guī)則挖掘算法。首先定義相關(guān)系數(shù)為:當(dāng)數(shù)據(jù)中某兩個變量是同增大或同減小的,則說明這兩個變量具有正相關(guān)性;反之,如果這兩個變量一個增大,另一個減小,則說明它們具有反相關(guān)性的。所謂相關(guān)系數(shù)就等于具有正相關(guān)或反相關(guān)性質(zhì)的數(shù)據(jù)個數(shù)除以總的數(shù)據(jù)個數(shù),對應(yīng)的分別為正相關(guān)系數(shù)和反相關(guān)系數(shù)。例如,一組數(shù)據(jù)如表1所示,每個數(shù)據(jù)包含4個變量。
表1 仿真數(shù)據(jù)
表1數(shù)據(jù)組的第1個變量和第2個變量中有6個對應(yīng)的數(shù)據(jù)是一個增大另一個減小,所以這兩個變量的反相關(guān)系數(shù)是6除以總數(shù)據(jù)個數(shù)10,等于0.6。同理,第1個變量與第3個變量中有8個對應(yīng)的數(shù)據(jù)是同增大或同減小的,所以這兩個變量的正相關(guān)系數(shù)是8除以總數(shù)據(jù)個數(shù)10,等于0.8。依此類推,第1個變量與第4個變量的反相關(guān)系數(shù)為0.6,第2個變量與第3個變量的反相關(guān)系數(shù)為0.6,第2個變量與第4個變量的正相關(guān)系數(shù)為0.6,第3個變量與第4個變量的反相關(guān)系數(shù)為0.8。
算法中定義:變量之間的相關(guān)系數(shù)就是對應(yīng)的支持度,當(dāng)變量之間的支持度不小于最小支持度閾值0.6時,這組變量就屬于頻繁項目集。在頻繁項目集中找出我們期望產(chǎn)生的關(guān)聯(lián)規(guī)則,即相關(guān)性密切的項目。所謂相關(guān)性密切就是指變量之間的相關(guān)系數(shù)不小于最小置信度閾值0.6。
具體算法程序如下:
for(k=0;k<n;k++)
(n表示數(shù)據(jù)中總的變量個數(shù))
{for(i=k+1;i<n;i++)
{p=0;
q=0;
for(j=0;j<N;j++)(N表示總的數(shù)據(jù)個數(shù))
{
if((x[j][k]<x[j+1][k])&&(x[j][i]<x[j+ 1][i]))
p=p+1;
else if((x[j][k]>=x[j+1][k])&&(x[j][i]>=x[j+1][i]))
p=p+1;
else if((x[j][k]<x[j+1][k])&&(x[j][i]>= x[j+1][i]))
q=q+1;
else if((x[j][k]>=x[j+1][k])&&(x[j][i]<x[j+1][i]))
q=q+1;
}
a=p/N;b=q/N;c=k+1;d=i+1;
if(a>=0.6)
printf(“x的第%d個變量與x的第%d個變量密切正相關(guān),正相關(guān)系數(shù)為%f ”,c,d,a);
else if(b>=0.6)
printf(“x的第%d個變量與x的第%d個變量密切反相關(guān),反相關(guān)系數(shù)為%f ”,c,d,b);
else
printf(“x的第%d個變量與x的第%d個變量非密切相關(guān) ”,c,d);
}
}
針對表1中的數(shù)據(jù),程序運行結(jié)果如圖1所示。
該結(jié)果與前面預(yù)期的結(jié)果一致,說明算法具有可行性和有效性。
鋁工業(yè)生產(chǎn)系統(tǒng)主要包括采礦廠、氧化鋁廠、電解鋁廠、鋁加工廠,每個過程都要消耗很多的能量。
采礦廠主要是進行運礦,當(dāng)前在世界氧化鋁生產(chǎn)中利用的是鋁土礦、霞石和明礬石[4]。假設(shè)采用明礬石通過拜耳法來進行氧化鋁的生產(chǎn),明礬石中氧化鋁的含量為37%,則生產(chǎn)1噸鋁大約要5.1噸明礬石,按現(xiàn)在運輸?shù)V物的耗油量,運輸這么多明礬石1公里的耗油量大約需要0.25元。
表2 噸氧化鋁綜合能源消耗計算
氧化鋁廠的耗能工序主要包括高壓溶出氣耗、蒸水量及氣耗、焙燒油耗[5]。其中,噸氧化鋁綜合能源消耗計算如表2所示[5]。根據(jù)氧化鋁的化學(xué)表達式可以粗略得知,生產(chǎn)1噸鋁大概要2噸氧化鋁,因此由表2可推算出生產(chǎn)1噸鋁能耗折標準煤的情況,如表3所示。綜合起來,氧化鋁廠生產(chǎn)噸鋁消耗的能源情況如表4所示。
表3 生產(chǎn)2噸氧化鋁綜合能源消耗折標準煤情況
圖1 相關(guān)性統(tǒng)計結(jié)果
表4 氧化鋁廠生產(chǎn)噸鋁的能源消耗情況
電解鋁廠主要是通過電解槽來進行電解生產(chǎn)的。在電解槽中,能耗(W)的表達式為[6]:
式(1)中,V為槽平均電壓,η為電流效率。根據(jù)楊云博和董春明(2009)的研究[7],中國先進鋁廠的平均電流效率為94.9%。楊玲(2008)[8]指出,當(dāng)前電解鋁廠的槽平均電壓為4.22V。所以,由公式(1)可以計算得出生產(chǎn)1噸鋁的耗能為13 251.4kWh。根據(jù)表2電的折標準煤系數(shù)0.407,計算出生產(chǎn)1噸鋁電解鋁廠的耗能為5 393.3kg。
綜上分析,鋁工業(yè)(包括采礦廠、氧化鋁廠、電解鋁廠)生產(chǎn)1噸鋁的耗能情況如表5所示。由此可見,影響總能耗(變量8)的因素有7個(變量1~變量7)。
表5 鋁工業(yè)生產(chǎn)噸鋁的耗能情況(折標準煤,單位kg)
表5是鋁工業(yè)生產(chǎn)過程中的平均能耗情況。根據(jù)表5顯示的能耗數(shù)據(jù)特征,針對氧化鋁廠和電解鋁廠消耗的各種能源,通過Matlab產(chǎn)生一組符合一定正態(tài)分布的隨機數(shù)。(1)氧化鋁廠。焦炭,產(chǎn)生1 000個服從正態(tài)分布N(52.4,5)的隨機數(shù);煤氣,產(chǎn)生1 000個服從正態(tài)分布N(212.2,20)的隨機數(shù);蒸汽,產(chǎn)生1 000個服從正態(tài)分布N(617.6,60)的隨機數(shù);電,產(chǎn)生1 000個服從正態(tài)分布N(228,20)的隨機數(shù);水,產(chǎn)生1 000個服從正態(tài)分布N(22,2)的隨機數(shù);空氣,產(chǎn)生1 000個服從正態(tài)分布N(6.4,0.6)的隨機數(shù)。(2)電解鋁廠。電,產(chǎn)生1 000個服從正態(tài)分布N(5 393.3,500)的隨機數(shù)。多年來由于技術(shù)條件和其他各種生產(chǎn)設(shè)備的不斷改進,造成鋁生產(chǎn)能耗波動比較大,所以產(chǎn)生正態(tài)分布的隨機數(shù)時,選擇的方差比較大。
運用基于相關(guān)性分析的關(guān)聯(lián)規(guī)則挖掘算法對上面產(chǎn)生的一組鋁工業(yè)生產(chǎn)能耗數(shù)據(jù)進行挖掘。首先進行相關(guān)系數(shù)計算,得出的相關(guān)系數(shù)統(tǒng)計結(jié)果如圖2所示。然后再進行關(guān)聯(lián)規(guī)則挖掘,找出相關(guān)系數(shù)不小于0.6的變量,得出相關(guān)性密切的變量關(guān)系,發(fā)現(xiàn)變量之間的關(guān)聯(lián)規(guī)則,得到的結(jié)果如圖3所示。
圖2 相關(guān)系數(shù)統(tǒng)計結(jié)果
圖3 相關(guān)性結(jié)果圖
由圖2、圖3可知,第7個變量與第8個變量是密切正相關(guān)的,而且正相關(guān)系數(shù)達到了0.958,表明該部分能耗不僅在總能耗中所占比例最大,而且相關(guān)性也最密切,其優(yōu)勢是很明顯的。其他變量之間都不是密切的正、反相關(guān)關(guān)系,它們的正、反相關(guān)系數(shù)相差不大,都是在0.50左右。很明顯,電解鋁廠電能消耗的增減性與總能耗的增減性基本是一致的。所以,要控制總能耗的大小,可以從電解鋁廠的電能消耗上下功夫。要做到鋁工業(yè)生產(chǎn)中總能耗的節(jié)約與優(yōu)化,就要優(yōu)化電解鋁廠的電能消耗,也就是要在滿足生產(chǎn)力的情況下盡可能降低電解鋁廠的電能消耗。
目前,對于降低電解鋁廠的電能消耗已經(jīng)有很多效果不錯的方法。由公式(1)可知,主要是要從降低槽平均電壓和提高電流效率上著手。田元歡和陶鏵(2007)、蔡志平(2009)、趙袆(2006)、楊玲和楊錄懷(2006)[9-12]介紹了一些降低電解鋁廠能耗的方法,實際中還有很多其他的方法,包括工藝上的、技術(shù)上的,還有管理上的。
鋁工業(yè)生產(chǎn)是一個能耗巨大的行業(yè),當(dāng)今社會能源緊缺,所以研究鋁工業(yè)生產(chǎn)的節(jié)能降耗是一件非常有意義的事。目前在這方面已經(jīng)進行了很多研究,也取得了一定的效果。本文對此進行了更深一步的研究,從數(shù)據(jù)挖掘的角度,基于鋁工業(yè)生產(chǎn)各個環(huán)節(jié)(從采礦到電解鋁加工)的特點,提煉出各環(huán)節(jié)的基本能耗情況。本文提出了一種基于相關(guān)性分析的關(guān)聯(lián)規(guī)則挖掘算法,并運用該算法對鋁工業(yè)生產(chǎn)的一組能耗數(shù)據(jù)進行了關(guān)聯(lián)規(guī)則挖掘,結(jié)果發(fā)現(xiàn),各影響能耗的因素之間相關(guān)性不是很明顯,只有電解鋁廠的電能消耗與總能耗之間有密切聯(lián)系。這樣,我們利用數(shù)據(jù)挖掘找到了降低鋁工業(yè)生產(chǎn)能耗的方法,即通過降低電解鋁廠的槽平均電壓和提高電流效率來降低能耗。所以,通過仿真驗證,發(fā)現(xiàn)該算法具有可行性、有效性,而且思路清晰。通過尋找數(shù)據(jù)之間的相關(guān)性來研究如何節(jié)能降耗,為實現(xiàn)鋁工業(yè)生產(chǎn)的節(jié)能降耗提供了一個新的方向。
[1]毛國君.數(shù)據(jù)挖掘原理與算法[M].北京:清華大學(xué)出版社,2007.
[2]羅貴章.論數(shù)據(jù)挖掘技術(shù)的實現(xiàn)及應(yīng)用[J].科技資訊,2009,(11):28-29.
[3]朱玉全,楊鶴標,孫雷.數(shù)據(jù)挖掘技術(shù)[M].南京:東南大學(xué)出版社,2006.27-28.
[4]H·H·葉列明.氧化鋁生產(chǎn)過程與設(shè)備[M].王延明,閻鼎歐,楊重愚,高守正譯.北京:冶金工業(yè)出版社,1987.3-5.
[5]伍進偉.貴州鋁廠氧化鋁技改工程的節(jié)能措施與效果[J].有色冶金節(jié)能,2003,20(1):1-4.
[6]董仕毅,劉永強,李維波.淺談預(yù)焙陽極鋁電解槽降低電壓的途徑[J].技術(shù)與裝備,2007,(6):23-24.
[7]楊云博,董春明.中國電解鋁行業(yè)能源效率初步調(diào)查與分析[J].有色冶金節(jié)能,2009,(5):5-7.
[8]楊玲.200kA大型預(yù)焙鋁電解槽的節(jié)能降耗途徑[J].冶金能源,2008,27(3):26-29.
[9]田元歡,陶鏵.降低鋁電解生產(chǎn)電能消耗的途徑[J].甘肅冶金,2007,29(3):15-18.
[10]蔡志平.120kA鋁電解槽節(jié)能生產(chǎn)的實踐[J].有色冶金節(jié)能,2009,(2):22-25.
[11]趙袆.鋁電解生產(chǎn)的節(jié)能與效果分析[J].電力需求側(cè)管理,2006,8(3):42-49.
[12]楊玲,楊錄懷.降低鋁電解直流電耗方法的探討[J].冶金能源,2006,25(4):44-56.
[責(zé)任編輯:李莉]
Energy Consumption Optimization of the Aluminum Industrial Production Based on Correlation Analysis
LOU Xiao-fang,ZOU Feng-xing
(College of Mechatronics and Automation,National University of Defense Technology,Changsha 410073,China)
The basic energy situation in 1 ton of aluminum production,for the current aluminum industry from mining to electrolytic aluminum,is extracted in this paper.And a correlation analysis of the association rule mining algorithm is proposed,then the algorithm is implemented by using C language,the association rule mining of a lot of energy consumption data of the aluminum industry is completed,the most closely related variables are found,by controlling these variables to guide the energy-saving of the aluminum industrial production process.Further more the feasibility and the effectiveness of the algorithm are verified.
aluminum industry;energy consumption;correlation analysis;association rule;data mining
book=3,ebook=133
F416.3;F224
A
1008-7362(2010)03-0083-05
2010-07-08
國家自然科學(xué)基金重點項目(60634042);國防科學(xué)技術(shù)大學(xué)優(yōu)秀研究生創(chuàng)新資助項目(S090304)
婁小芳(1986-),女,江西吉安人,國防科學(xué)技術(shù)大學(xué)機電工程與自動化學(xué)院自動控制系,研究方向是控制理論與應(yīng)用;鄒逢興(1945-),男,江西吉安人,國防科學(xué)技術(shù)大學(xué)機電工程與自動化學(xué)院自動控制系教授,研究方向是控制理論與應(yīng)用。