(北京科技大學(xué) a.自動(dòng)化學(xué)院;b.新材料技術(shù)研究院,北京 100083)
基于ANFIS改進(jìn)的大氣腐蝕環(huán)境缺失數(shù)據(jù)填補(bǔ)方法
石雅楠a,付冬梅a,支元杰a,陳閩東b
(北京科技大學(xué) a.自動(dòng)化學(xué)院;b.新材料技術(shù)研究院,北京 100083)
目的針對(duì)大氣腐蝕中重要環(huán)境數(shù)據(jù)缺失的復(fù)雜問題,提出一種相關(guān)因素(Relevance Factors)和自適應(yīng)神經(jīng)模糊推理系統(tǒng)(Adaptive Neuro-Fuzzy Inference System)結(jié)合的方法(RF-ANFIS)對(duì)缺失數(shù)據(jù)進(jìn)行填補(bǔ)。方法首先采用相關(guān)因素方法計(jì)算缺失數(shù)據(jù)和多項(xiàng)環(huán)境因素間的相關(guān)程度,篩選出相關(guān)系數(shù)較大的因子,然后應(yīng)用ANFIS構(gòu)建缺失數(shù)據(jù)與所選環(huán)境因子的關(guān)系模型。最后以二氧化硫數(shù)據(jù)為具體對(duì)象,采用北京2015年的氣象數(shù)據(jù)對(duì)所建立的模型進(jìn)行檢驗(yàn)。結(jié)果經(jīng)過改進(jìn)的RF-ANFIS模型在最優(yōu)情況下樣本均方誤差為0.696,在14個(gè)測(cè)試樣本中有13個(gè)相對(duì)誤差在20%以內(nèi),針對(duì)有限樣本的數(shù)據(jù)分析中更為適用。結(jié)論該方法有效提高了大氣腐蝕環(huán)境數(shù)據(jù)缺失的填補(bǔ)精度,對(duì)在數(shù)據(jù)缺失情況下預(yù)測(cè)大氣腐蝕速率具有重要意義。
大氣腐蝕;缺失數(shù)據(jù);相關(guān)因素;ANFIS
大氣腐蝕中缺失數(shù)據(jù)的填補(bǔ)是建模與應(yīng)用中重要且具有一定難度的研究課題。根據(jù) ISO 9223—2012標(biāo)準(zhǔn),金屬大氣的腐蝕速率與環(huán)境中的二氧化硫濃度、氯化物濃度、溫度以及濕度四個(gè)因子息息相關(guān),但這些腐蝕因子由于人為疏忽、信息獲取的滯后性等客觀因素常有缺失,因此探索合適的精確度高的填補(bǔ)方法是實(shí)際工程亟待解決的難題。
目前腐蝕數(shù)據(jù)的處理方法主要集中在灰色模型[1—4]和 BP網(wǎng)絡(luò)[5—7]?;疑到y(tǒng)中較常用的GM(1,1)模型僅適用于單變量對(duì)輸出變量的預(yù)測(cè),如利用一維時(shí)間序列建模,這種方法可獲取信息少,無法考慮多維環(huán)境因素對(duì)腐蝕因子的影響。BP網(wǎng)絡(luò)雖然可用于多維數(shù)據(jù),但其需要大量的樣本和長(zhǎng)時(shí)間的訓(xùn)練才能得到較為準(zhǔn)確的結(jié)果,且容易產(chǎn)生局部最優(yōu)和過擬合,在腐蝕數(shù)據(jù)樣本量有限時(shí)預(yù)測(cè)效果往往不理想。近年來專家將模糊神經(jīng)網(wǎng)絡(luò)逐漸應(yīng)用于腐蝕數(shù)據(jù)的分析[8—11],模糊神經(jīng)網(wǎng)絡(luò)有效融合了模糊推理系統(tǒng)和神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn),在一定程度上克服了由于原始數(shù)據(jù)樣本量過小而影響預(yù)測(cè)效果的問題。當(dāng)數(shù)據(jù)樣本維度較高時(shí),模糊神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的特殊性會(huì)導(dǎo)致維數(shù)災(zāi)難而無法計(jì)算,所以如何有效實(shí)現(xiàn)降維就成了解決問題的一個(gè)途徑。
基于上述原因,文中以二氧化硫缺失數(shù)據(jù)的填補(bǔ)為例,不同于傳統(tǒng)利用多維環(huán)境因素或在一維時(shí)間序列上預(yù)測(cè)大氣數(shù)據(jù)的單一模式,而將二者充分結(jié)合以挖掘更多信息,并通過相關(guān)因素(Relevance Factors)對(duì)所構(gòu)建的ANFIS(Adaptive Neuro-Fuzzy Inference System)進(jìn)行簡(jiǎn)化,進(jìn)而建立二氧化硫的缺失預(yù)測(cè)填補(bǔ)模型。該研究對(duì)工程應(yīng)用中填補(bǔ)二氧化硫一類有限樣本的腐蝕數(shù)據(jù)具有實(shí)際意義。
文中的數(shù)據(jù)來源于腐蝕站點(diǎn)提供的北京 2015年3月19日至2015年6月5日的環(huán)境數(shù)據(jù)和腐蝕數(shù)據(jù)。環(huán)境數(shù)據(jù)含有氣溫、風(fēng)力、濕度、天氣狀況、降水量、PM2.5、PM10、O3、NO2共9個(gè)因素,腐蝕數(shù)據(jù)即二氧化硫濃度。文中選用了統(tǒng)一的 Excel表格進(jìn)行規(guī)范化,MATLAB可以方便地將數(shù)據(jù)導(dǎo)入和導(dǎo)出表格。氣象數(shù)據(jù)的采集是按小時(shí)進(jìn)行的,每小時(shí)采一次,一天應(yīng)有24組數(shù)據(jù),表1僅列出了北京市某一天的10條數(shù)據(jù)。
表1 部分原始環(huán)境數(shù)據(jù)和腐蝕數(shù)據(jù)Table 1 Part of the original environmental data and corrosion data
ISO 9223—2012標(biāo)準(zhǔn)中統(tǒng)計(jì)二氧化硫濃度的最小單位為日,所以數(shù)據(jù)預(yù)處理的目的是將原始小時(shí)化的數(shù)據(jù)轉(zhuǎn)換成以日為單位的樣本,填補(bǔ)目標(biāo)也為二氧化硫的日平均濃度。首先將所有數(shù)據(jù)量化,根據(jù)風(fēng)力等級(jí)表將風(fēng)力轉(zhuǎn)換成區(qū)分度更高的風(fēng)速。研究表明[12],日照時(shí)間是影響腐蝕的重要因素之一,而日照時(shí)間可通過每小時(shí)的天氣狀況(晴、陰、多云、雨雪等)推斷得到,對(duì)天氣狀況處理時(shí)將晴記為1,其他情況記為0。然后將數(shù)據(jù)進(jìn)行轉(zhuǎn)換,每日的日照時(shí)間和降水量由相應(yīng)每小時(shí)的數(shù)據(jù)累加得到,而其他所有因素則求日平均值作為對(duì)應(yīng)數(shù)據(jù)。最后經(jīng)過數(shù)據(jù)預(yù)處理后共得到79個(gè)樣本用于研究。
模糊神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)具有多樣性的特點(diǎn),比較常用的是Jang提出的ANFIS系統(tǒng)。實(shí)際應(yīng)用中,網(wǎng)絡(luò)生成的模糊規(guī)則數(shù)為各輸入變量的隸屬度函數(shù)個(gè)數(shù)之積(例如網(wǎng)絡(luò)有m個(gè)輸入變量,每個(gè)變量隸屬度函數(shù)個(gè)數(shù)為n,模糊規(guī)則數(shù)即為nm)。因此在隸屬度函數(shù)個(gè)數(shù)(一般取3~5)變化不大的情況下,網(wǎng)絡(luò)的輸入變量不宜過多,否則生成的規(guī)則數(shù)過大不易于實(shí)現(xiàn)[13]。針對(duì)ANFIS這一應(yīng)用中的問題,文中引入相關(guān)因素的分析降低網(wǎng)絡(luò)的復(fù)雜性,進(jìn)而提出了一種RF-ANFIS預(yù)測(cè)模型,結(jié)構(gòu)如圖1所示。
圖1 RF-ANFIS預(yù)測(cè)模型結(jié)構(gòu)Fig.1 Structure of RF-ANFIS prediction model
第一層為所有變量的輸入層,假定輸入變量為m維,則輸出函數(shù)為:
第二層為相關(guān)因素計(jì)算層,計(jì)算每個(gè)輸入變量xk與輸出變量y之間的相關(guān)系數(shù)。相關(guān)因素分析是研究隨機(jī)變量之間是否存在某種依存關(guān)系,并對(duì)具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度的一種統(tǒng)計(jì)方法。相關(guān)系數(shù)R表示相關(guān)方向和相關(guān)程度。R在(0,1)之間為正相關(guān),在(-1,0)之間為負(fù)相關(guān),等于1為完全正相關(guān),-1為完全負(fù)相關(guān),0為不相關(guān)。變量kx與變量y之間的相關(guān)性系數(shù)公式為:本值和樣本均值。
第三層為相關(guān)因素判斷層,通過相關(guān)性系數(shù)的大小對(duì)輸入變量進(jìn)行取舍。設(shè)定一個(gè)常量c,判斷規(guī)則為若|R|大于c則將對(duì)應(yīng)的輸入變量輸出至下一層,否則留在這一層。由此已將m維的原始數(shù)據(jù)降至d維(d<m)。
第四層為降維后的輸入變量的隸屬函數(shù)層,負(fù)責(zé)輸入信號(hào)的模糊化。對(duì)于一階Takagi-Sugeno模糊系統(tǒng)具有如下模糊規(guī)則:
該層的輸出函數(shù)為:
式中:1z到dz是經(jīng)過相關(guān)系數(shù)判斷后選出的輸入變量,4O是iA到iD的隸屬函數(shù)值,表示1z到
式中:xkl和xk表示輸入變量xk的第l個(gè)樣本值和樣本均值;yl和y表示輸出變量y的第l個(gè)樣zd分別屬于 Ai到 Di的程度,n是隸屬度函數(shù)的個(gè)數(shù)。μAi(x)到 μDi(x)可以是任意合適的參數(shù)化隸屬函數(shù),如一般的鐘型函數(shù),以 μAi(x)為例:
第五層為規(guī)則的強(qiáng)度釋放層,負(fù)責(zé)將輸入信號(hào)相乘,每個(gè)節(jié)點(diǎn)的輸出代表該規(guī)則的可信度。輸出函數(shù)為:
第六層為所有規(guī)則強(qiáng)度的歸一化,第i個(gè)節(jié)點(diǎn)計(jì)算第i條規(guī)則的歸一化可信度。輸出函數(shù)為:
第七層為計(jì)算模糊規(guī)則的輸出,這一層的每個(gè)節(jié)點(diǎn)i為自適應(yīng)節(jié)點(diǎn)。輸出函數(shù)為:
式中:wi為第六層的輸出,為該節(jié)點(diǎn)的參數(shù)集,稱為后件參數(shù)。
第八層為一個(gè)固定節(jié)點(diǎn),計(jì)算所有輸入信號(hào)的總輸出,輸出函數(shù)為:
在第五層至第八層中,通常采用一種反向傳播算法和最小二乘法的混合學(xué)習(xí)算法分別對(duì)ANFIS的前件參數(shù)和后件參數(shù)進(jìn)行訓(xùn)練。首先輸入信號(hào)沿網(wǎng)絡(luò)正向傳播至第七層,在前件參數(shù)不變的情況下采用最小二乘法調(diào)節(jié)后件參數(shù),然后信號(hào)繼續(xù)沿網(wǎng)絡(luò)正向傳播直到第八層,將獲得的誤差信號(hào)沿網(wǎng)絡(luò)反向傳播,進(jìn)而調(diào)節(jié)前件參數(shù)。這種方法不僅可以降低梯度法中搜索空間的維數(shù),而且大大提高了收斂速度[14]。
以北京市二氧化硫?yàn)槔M(jìn)行仿真,仿真過程可平移至其他環(huán)境參數(shù)缺失數(shù)據(jù)的補(bǔ)償中。將79個(gè)樣本隨機(jī)分為65個(gè)訓(xùn)練樣本和14個(gè)測(cè)試樣本,根據(jù)第2節(jié)中RF-ANFIS模型的結(jié)構(gòu)逐層分析,通過改變參數(shù)c的值改變篩選的輸入變量d的個(gè)數(shù),并與傳統(tǒng)僅利用多維環(huán)境因素和僅在一維時(shí)間序列上預(yù)測(cè)的方法作對(duì)比。
3.1 建模步驟
1)相關(guān)因素分析。在收集到的樣本中二氧化硫是一個(gè)時(shí)序數(shù)據(jù),傳統(tǒng)工程上采用滾動(dòng)預(yù)測(cè)的方法建立二氧化硫缺失預(yù)測(cè)模型,但該方法僅利用了二氧化硫自身的信息而未考慮其他因素對(duì)樣本的影響。文中挖掘二氧化硫與各環(huán)境參數(shù)間的相關(guān)性,并考慮二氧化硫自身的時(shí)序特征,第t天的二氧化硫濃度與當(dāng)日的環(huán)境數(shù)據(jù)以及前五日的二氧化硫濃度的相關(guān)性系數(shù)見表2,其中Ct-1為第t-1天的二氧化硫,Ct-2表示第t-2天的數(shù)據(jù),以此類推。
表2 二氧化硫濃度與各因子的相關(guān)性系數(shù)Table 2 Relevance coefficient of the concentration of SO2and other factors
經(jīng)過相關(guān)性分析發(fā)現(xiàn),其中二氧化硫與PM2.5,PM10,NO2,Ct-1,Ct-2五個(gè)因子關(guān)聯(lián)性較明顯。二氧化硫與前三者相關(guān)是因?yàn)殪F霾天氣時(shí)二氧化硫在空氣中會(huì)轉(zhuǎn)化成硫酸鹽,導(dǎo)致硫酸鹽顆粒達(dá)到40 μg/m3以上,致使PM2.5,PM10,NO2超標(biāo)[15]。第t天的二氧化硫與t-1天和t-2天的相關(guān)性大也證明了其本身的自相關(guān)性。由此相關(guān)因素分析方法有效將十四維(m=14)的復(fù)雜問題轉(zhuǎn)化成五維(d=5)的可計(jì)算網(wǎng)絡(luò),同時(shí)排除了干擾因素的影響,為ANFIS的建模打下基礎(chǔ)。
2)ANFIS建模。根據(jù)ANFIS的結(jié)構(gòu),網(wǎng)絡(luò)固定為五層。首先設(shè)定c=0.2,此時(shí)選擇出的輸入變量個(gè)數(shù)d=5(Ct-1,PM2.5,PM10,NO2,Ct-2),輸出變量個(gè)數(shù)為1,每個(gè)輸入變量的隸屬度函數(shù)個(gè)數(shù)n=3。輸入的模糊隸屬度函數(shù)選擇鐘型函數(shù),輸出層選擇一階線性模糊推理系統(tǒng)即一階Sugeno模糊模型,采用網(wǎng)格分割法生成FIS。網(wǎng)絡(luò)學(xué)習(xí)算法選擇混合學(xué)習(xí)算法。目標(biāo)誤差為 0.001,訓(xùn)練次數(shù)設(shè)定為200次。利用訓(xùn)練樣本訓(xùn)練網(wǎng)絡(luò),在訓(xùn)練過程中,為提高函數(shù)逼近的效果,可對(duì)其隸屬度函數(shù)類型、函數(shù)個(gè)數(shù)n、訓(xùn)練次數(shù)等指標(biāo)進(jìn)行適當(dāng)?shù)恼{(diào)整。利用訓(xùn)練網(wǎng)絡(luò)學(xué)習(xí)的結(jié)果對(duì)測(cè)試樣本進(jìn)行檢測(cè),將預(yù)測(cè)結(jié)果與真實(shí)數(shù)據(jù)相比較,獲得樣本分布圖,分析誤差。
繼續(xù)改變c的值,令c=0.4,此時(shí)選出的輸入變量個(gè)數(shù)為d=4(Ct-1,PM2.5,PM10,NO2),輸出變量個(gè)數(shù)仍為1,重復(fù)上述調(diào)參數(shù)的過程;再令c=0.45和c=0.5,此時(shí)選出的輸入變量個(gè)數(shù)分別為d=3(Ct-1,PM2.5,PM10)和d=2(Ct-1,PM2.5),調(diào)整參數(shù)比較不同輸入變量下的網(wǎng)絡(luò)性能。
3.2 仿真結(jié)果
經(jīng)過上述建模過程后,將c取不同值時(shí)RF-ANFIS模型的預(yù)測(cè)結(jié)果與文獻(xiàn)[7]中BP網(wǎng)絡(luò)時(shí)間序列和文獻(xiàn)[6]中 BP網(wǎng)絡(luò)多維因素建模的方法進(jìn)行比較。表 3是五種建模方法在誤差和計(jì)算時(shí)間上的比較,可以看出,首先對(duì)于樣本的準(zhǔn)確率,RF-ANFIS模型在c=0.4時(shí)不論是整體的均方誤差還是單個(gè)樣本的相對(duì)誤差都是幾種情況中最優(yōu)的,c=0.45其次。當(dāng)c=0.5,輸入變量減少為2個(gè)時(shí),網(wǎng)絡(luò)性能已開始降低,這說明僅用Ct-1,PM2.5兩個(gè)輸入變量做預(yù)測(cè)有偏差,PM10對(duì)于二氧化硫的預(yù)測(cè)同樣重要,而c=0.2時(shí)效果也不理想。這充分說明了ANFIS的輸入變量并不是越多越好,相關(guān)系數(shù)為0.222的Ct-2加入到網(wǎng)絡(luò)中反而對(duì)二氧化硫的預(yù)測(cè)形成了干擾。對(duì)于計(jì)算時(shí)間,BP網(wǎng)絡(luò)時(shí)序建模由于其網(wǎng)絡(luò)構(gòu)造的簡(jiǎn)單性用時(shí)最短,RF-ANFIS隨著c的減小,輸入變量依次增多,使得網(wǎng)絡(luò)生成的規(guī)則呈冪指數(shù)變化用時(shí)也就越長(zhǎng)。因此綜合上述因素,如果不考慮計(jì)算時(shí)間,只追求樣本的精確度,優(yōu)先選擇c=0.4時(shí)的RF-ANFIS模型;如果在樣本精確度達(dá)到一定程度時(shí),希望節(jié)省計(jì)算時(shí)間,優(yōu)先選擇c=0.45的RF-ANFIS模型。
表3 各方法參數(shù)對(duì)比Table 3 Comparison of different methods
表 4列舉了部分訓(xùn)練樣本真實(shí)值和四種方法方法預(yù)測(cè)值的比較,從單個(gè)樣本的預(yù)測(cè)中可以看出,c=0.4時(shí)預(yù)測(cè)值與真實(shí)值幾乎完全相同,c=0.45時(shí)誤差在1%以內(nèi),同樣與真實(shí)值近似。BP網(wǎng)絡(luò)的平均誤差均大于10%,且個(gè)別樣本出現(xiàn)極大誤差,這也體現(xiàn)了BP網(wǎng)絡(luò)在樣本量不足的情況下準(zhǔn)確性降低。
表4 部分訓(xùn)練樣本不同方法預(yù)測(cè)值和相對(duì)誤差對(duì)比Table 4 Comparison of predicted values and relative errors of different methods in part of training samples
c=0.4時(shí)的RF-ANFIS模型與BP網(wǎng)絡(luò)時(shí)間序列和多維因素建模在測(cè)試樣本上的對(duì)比如圖 2所示。這14個(gè)訓(xùn)練樣本中有9個(gè)預(yù)測(cè)結(jié)果優(yōu)于多維因素建模,13個(gè)優(yōu)于時(shí)間序列建模。由此可得,經(jīng)過相關(guān)因素分析后,降低了傳統(tǒng)ANFIS維數(shù)災(zāi)難的影響,有效地將難題轉(zhuǎn)化為低維的可解決問題,說明應(yīng)用RF-ANFIS模型對(duì)缺失數(shù)據(jù)的處理是可行的。同時(shí)該方法可以通過改變常量c的值控制所選擇的輸入變量d的個(gè)數(shù),在經(jīng)過多次仿真后尋找最佳的網(wǎng)絡(luò)結(jié)構(gòu),結(jié)果比較理想。
圖2 三種建模方法測(cè)試樣本預(yù)測(cè)值與真實(shí)值比較Fig.2 Comparison of predicted values and real values of three methods in test sample
1)相關(guān)因素的引入為ANFIS在多維數(shù)據(jù)樣本適用局限性的問題上提供了一種解決途徑。根據(jù)腐蝕站點(diǎn)提供的腐蝕因子和多項(xiàng)環(huán)境數(shù)據(jù)進(jìn)行測(cè)試,結(jié)果表明,該RF-ANFIS模型可以有效實(shí)現(xiàn)二氧化硫缺失數(shù)據(jù)的填補(bǔ)。
2)提出的 RF-ANFIS模型不僅可適用于二氧化硫,可推廣至補(bǔ)償同類型腐蝕因子的缺失情況。
3)充分挖掘了多維數(shù)據(jù)之間存在的聯(lián)系和時(shí)序數(shù)據(jù)本身的自相關(guān)性,為處理時(shí)序數(shù)據(jù)問題提供了新思路。
4)相關(guān)因素分析發(fā)現(xiàn)氣象上二氧化硫與PM2.5,PM10,NO2三者有緊密的關(guān)聯(lián)性也是一個(gè)意外的收獲。
[1] 黃海軍, 李嬋, 王俊. 典型大氣腐蝕介質(zhì)的灰色預(yù)測(cè)模型分析[J]. 裝備環(huán)境工程, 2012, 9(1): 13—16. HUANG Hai-jun, LI Chan, WANG Jun. Study on Grey Prediction Model of Typical Atmospheric CorrosionMediums[J]. Equipment Environmental Engineering, 2012, 9(1): 13—16.
[2] 王安東, 陳躍良, 張勇, 等. 基于灰色馬爾科夫模型的2A12鋁合金腐蝕預(yù)測(cè)方法研究[J]. 裝備環(huán)境工程, 2014, 11(6): 22—28. WANG An-dong, CHEN Yue-liang, ZHANG Yong, et al. The Research on 2A12 Aluminum Corrosion Prediction Method Based on Gray Markov Model[J]. Equipment Environmental Engineering, 2014, 11(6): 22—28.
[3] 黃海軍, 李嬋, 王俊. 典型大氣腐蝕介質(zhì)的灰色預(yù)測(cè)模型分析[J]. 裝備環(huán)境工程, 2012, 9(1): 13—16.HUANG Hai-jun, LI Chan, WANG Jun. Study on Grey Prediction Model of Typical Atmospheric Corrosion Mediums[J]. Equipment Environmental Engineering, 2012, 9(1): 13—16.
[4] ZHI Y J, FU D M, WANG H L. Non-equidistant GM(1,1) Model Based on GCHM-WBO and Its Application to Corrosion Rate Prediction[C]// Leicester: Proceedings of IEEE International Conference on Grey Systems and Intelligent Services, 2015: 272—276.
[5] 劉成臣, 徐勝, 王浩偉, 等. 基于灰色模型和神經(jīng)網(wǎng)絡(luò)的鋁合金腐蝕預(yù)測(cè)對(duì)比[J]. 裝備環(huán)境工程, 2013, 9(1): 1—4. LIU Cheng-chen, XU Sheng, WANG Hao-wei, et al. Comparative Study of Prediction Models of Aluminum Alloys Based on Gray Model and Artificial Neural Network[J]. Equipment Environmental Engineering, 2013, 9(1): 1—4.
[6] 周立建, 穆志韜, 邢瑋, 等. 基于灰色神經(jīng)網(wǎng)絡(luò)的有機(jī)涂層壽命預(yù)測(cè)研究[J]. 裝備環(huán)境工程, 2011, 8(5): 62—66. ZHOU Li-jian, MU Zhi-tao, XING Wei, et al. Study of Service Life Prediction of Organic Coatings Based on Grey Neural Network[J]. Equipment Environmental Engineering, 2011, 8(5): 62—66.
[7] 蕭彧星, 吳光海, 孫寧, 等. BP神經(jīng)網(wǎng)絡(luò)在碳鋼和低合金鋼大氣腐蝕數(shù)據(jù)預(yù)測(cè)中的應(yīng)用[J]. 腐蝕科學(xué)與防護(hù)技術(shù), 2011, 23(2): 171—174. XIAO Yu-xing, WU Guang-hai, SUN Ning, et al. Application of Artificial Neural Network on Prediction of Atmospheric Corrosion Data for Carbon Steel and Low Alloy Steel[J]. Corrosion Science and Protection Technology, 2011, 23(2): 171—174.
[8] 鄧志安, 李姝儀, 李曉坤, 等. 基于模糊神經(jīng)網(wǎng)絡(luò)的海洋管線腐蝕速率預(yù)測(cè)新方法[J]. 中國(guó)腐蝕與防護(hù)學(xué)報(bào), 2015, 35(6): 571—576. DENG Zhi-an, LI Shu-yi, LI Xiao-kun, et al. A Prediction Method Based on Fuzzy Neural Network for Corrosion Rate of Marine Pipelines[J]. Journal of Chinese Society for Corrosion and Protection, 2015, 35(6): 571—576.
[9] TIAN Y J, LIU Y, CHENG G J, et al. PCA-FNN Based Performance Prediction for Water Injection in Oilfields[J]. Advanced Materials Research, 2014, 909: 410—417.
[10] FU Z N, XIE H W. Wind Speed Forecasting Based on FNN in Wind Farm[J]. Applied Mechanics and Materials, 2014, 651—653: 1117—1122.
[11] GHIASI M M, ARABLOO M, MOHAMMADI A H, et al. Application of ANFIS Soft Computing Technique in Modeling the CO2Capture with MEA, DEA, and TEA Aqueous Solutions[J]. International Journal of Greenhouse Gas Control, 2016, 49: 47—54.
[12] SEIDL D, JANCíKOVá Z, KO?TIAL P, et al. Exploitation of Artificial Intelligence Methods for Prediction of Atmospheric Corrosion[J]. Defect and Diffusion Forum, 2012, 326—328: 65—68.
[13] 付青文. 基于規(guī)則約簡(jiǎn)的模糊神經(jīng)網(wǎng)絡(luò)模型的研究[D].廣州: 華南理工大學(xué), 2012. FU Qing-wen. A Research of Fuzzy Neural Network Model Based on Rules Reduction[D]. Guangzhou: South China University of Technology, 2012.
[14] 張小娟. 自適應(yīng)神經(jīng)模糊推理系統(tǒng)(ANFIS)及其仿真[J].電子設(shè)計(jì)工程, 2012, 20(5): 11—13. ZHANG Xiao-juan. Study on the Adaptive Network-based Fuzzy Inference System and Simulation[J]. Electronic Design Engineering, 2012, 20(5): 11—13.
[15] 陳瑞敏, 吳雁, 康文英, 等. 連續(xù)霧霾天氣污染物濃度變化及天氣形勢(shì)特征分析[J]. 氣候與環(huán)境研究, 2014, 19(2): 209—218. CHEN Rui-min, WU Yan, KANG Wen-ying, et al. Analysis of Pollutant Concentrations and Characteristics of Continuous Smoggy Weather[J]. Climatic and Environmental Research, 2014, 19(2): 209—218.
Improved ANFIS-based Imputation Method for Missing Data on Atmospheric Corrosion Environment
SHI Ya-nana,FU Dong-meia,ZHI Yuan-jiea,CHEN Min-dongb
(a. School of Automation; b.Institute of Advanced Materials and Technology, University of Science and Technology Beijing, Beijing 100083, China)
ObjectiveTo propose a new method (RF-ANFIS) based on relevance factors and Adaptive Neuro-Fuzzy Inference System to impute missing important environmental data on atmospheric corrosion.MethodsThe relevance degree between missing data and a number of environmental factors was calculated through relevance factors. Factors of high relevance degree were selected; then a relationship model between missing data and environmental factors was built through ANFIS. Finally, SO2data was taken as the specified object to test the model according to atmospheric data of Beijing in 2015.ResultsThe error of mean square of samples in the improved RF-ANFIS model was 0.696 in the best case. The relative error of 13/14 testsamples was within 20%. It was applicable to data analysis of limited samples.ConclusionThe new method effectively improves the accuracy of imputing environmental data in atmospheric corrosion. It is vital to predict atmospheric corrosion rate with missing data.
atmospheric corrosion; missing data; relevance factors; ANFIS
FU Dong-mei(1963—), Female, from Liaoning, Doctor, Professor, Research focus: intelligent data analysis.
10.7643/ issn.1672-9242.2016.06.014
TJ01;TG172.3
A
1672-9242(2016)06-0078-07
2016-07-12;
2016-08-12
Received:2016-07-12;Revised:2016-08-12
國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃項(xiàng)目(2014CB643300);國(guó)家科技基礎(chǔ)性工作專項(xiàng)(2012FY113000)
Fund:Suported by The National Basic Research Program of China(2014CB643300); The National Science and Technology Basic Work (2012FY113000).
石雅楠(1993—),女,遼寧人,碩士研究生,主要研究方向?yàn)榇髿飧g數(shù)據(jù)挖掘的研究。
Biography:SHI Ya-nan(1993—), Female, from Liaoning, Master graduate student, Research focus: atmospheric corrosion data mining.
付冬梅(1963—),女,遼寧人,博士,教授,主要研究方向?yàn)橹悄軘?shù)據(jù)分析的研究。