盧艷軍,周小敏,任 艷,房 芮
(沈陽航空航天大學(xué) 自動化學(xué)院,沈陽 110136)
基于遺傳算法優(yōu)化支持向量機(jī)的輻射測溫方法
盧艷軍,周小敏,任 艷,房 芮
(沈陽航空航天大學(xué) 自動化學(xué)院,沈陽 110136)
溫度的監(jiān)控與測量在工業(yè)生產(chǎn)和科學(xué)研究等眾多領(lǐng)域都發(fā)揮著重要的作用。遺傳算法(Genetic Algorithm,GA)是模擬生物界中自由配對和自然選擇現(xiàn)象的一種過程全局搜索算法。而支持向量機(jī)(Support Vector Machine,SVM)是以統(tǒng)計學(xué)習(xí)理論為基礎(chǔ)的,并致力于研究少樣本情況下機(jī)器學(xué)習(xí)規(guī)律的新興學(xué)習(xí)算法,具有非常好的非線性函數(shù)擬合和泛化能力。針對目前支持向量機(jī)的結(jié)構(gòu)參數(shù)多采用經(jīng)驗或者試取,提出遺傳算法來優(yōu)化支持向量機(jī)的參數(shù),并應(yīng)用于紅外輻射溫度測量。結(jié)果表明,遺傳算法優(yōu)化方法較網(wǎng)格搜索方式無論是學(xué)習(xí)效率和預(yù)測精度都優(yōu)于后者,表明遺傳支持向量機(jī)算法能有效地用于目標(biāo)輻射溫度測量。
支持向量機(jī);遺傳算法;參數(shù)優(yōu)化;溫度測量
在高溫輻射測量現(xiàn)場一般工作環(huán)境比較惡劣,因此對于輻射本身尤其內(nèi)部溫度測量比較困難?,F(xiàn)在主要測溫方式分為接觸式和非接觸式測溫方法。接觸式測溫方法利用傳感器接觸測量,一般適用于點溫度的測量,而且不能長時間工作,故這種測量方式很難在高溫輻射測量問題上派上用場;對于高溫紅外輻射測量系統(tǒng),非接觸式測溫方法建立數(shù)學(xué)模型的方法有機(jī)理建模方法和實驗建模方法兩種[1]。機(jī)理建模是通過對系統(tǒng)本身的內(nèi)部過程研究而得出的,它的定性結(jié)論一般正確,但實際精度一般達(dá)不到要求,而一些實際系統(tǒng)中的機(jī)理較為復(fù)雜,甚至目前尚未清楚。實驗建模方法即系統(tǒng)辨識,根據(jù)系統(tǒng)運行過程中的輸入與輸出數(shù)據(jù),利用系統(tǒng)辨識模型來建立相關(guān)的數(shù)學(xué)模型。釆用這種方法建立系統(tǒng)的模型,需要有足夠多的試驗數(shù)據(jù),這正好是本文輻射測溫系統(tǒng)所能滿足的。而目前對于高溫物體溫度辨識建模的非接觸軟測量,已經(jīng)受到越來越多學(xué)者的關(guān)注[2]。例如文獻(xiàn)[3]中用BP神經(jīng)網(wǎng)絡(luò)對高溫物體的彩色圖像進(jìn)行測量,取得不錯的效果。支持向量機(jī)與神經(jīng)網(wǎng)絡(luò)一樣能在高度非線性甚至嚴(yán)重不確定性的系統(tǒng)中有自適應(yīng)、自學(xué)習(xí)和非線性逼近的能力,但由統(tǒng)計學(xué)理論發(fā)展起來的支持向量機(jī)是基于結(jié)構(gòu)風(fēng)險最小化,能真正實現(xiàn)期望風(fēng)險最小化[4-5]。但目前有個非常關(guān)鍵性的問題就是它的結(jié)構(gòu)參數(shù)如何選擇,因為結(jié)構(gòu)參數(shù)對支持向量機(jī)模型在實際應(yīng)用中有很大的影響[6-7]。本文選擇徑向基RBF作為SVM的核函數(shù),而實驗證明核函數(shù)徑向基參數(shù)對訓(xùn)練模型有重大的影響,因為σ隱含地決定了訓(xùn)練數(shù)據(jù)映射到高維空間中新的特征向量的空間分布[8-9]。但可惜的是目前還沒有明確的理論基礎(chǔ)來指導(dǎo)參數(shù)的選擇,所以支持向量機(jī)的參數(shù)尋優(yōu)問題一直被廣泛研究。1975年由密執(zhí)安大學(xué)教授J.H.Holland等提出了遺傳算法,受到了世界研究者的高度關(guān)注[10]。由于GA算法不但在大型復(fù)雜非線性系統(tǒng)的參數(shù)全局尋優(yōu),而不陷入局部最小,而且具有很強(qiáng)的魯棒性,在各種工程搜索過程和優(yōu)化問題上都有它的應(yīng)用。因此本文利用遺傳算法對支持向量機(jī)參數(shù)進(jìn)行優(yōu)化,并應(yīng)用于輻射測溫建模中。
1.1 遺傳算法參數(shù)優(yōu)化過程
遺傳算法的基本思想來源于達(dá)爾文的進(jìn)化論和孟德爾遺傳學(xué)說[11]。它模擬自然界中生物繁衍與進(jìn)化的現(xiàn)象,這樣的進(jìn)化過程實質(zhì)上遵從優(yōu)勝劣汰、適者生存的自然法則,生物的遺傳不僅是生物個體的遺傳,更是生物種群群體的遺傳,同時還遭受自然的選擇。簡單地說,種群基因中適合自然環(huán)境生存的會繼續(xù)遺傳,而那些不利于生存的基因逐漸遭到淘汰直至消亡。下面介紹遺傳算法的主要步驟:
首先初始化種群的所有染色體及基因,設(shè)計符合實際問題的適應(yīng)度評價函數(shù)。本文用支持向量回歸機(jī)在對樣本進(jìn)行訓(xùn)練時,用交叉驗證的方法取得平均均值誤差作為評價染色體適度值函數(shù)。由于在遺傳算法中適度值函數(shù)不但要求為正,而且是對最大值求解,故我們通過式(1)將最小值問題轉(zhuǎn)換為最大值問題。
(1)
然后對種群祖先的所有基因在經(jīng)過解碼后帶入到適應(yīng)度評價函數(shù)中,計算第一代每個染色體個體在種群中生存的頻率(概率)。通過雜交和變異等操作進(jìn)化下一代種群染色體的基因。這樣在經(jīng)過若干代遺傳后,重新計算下一代的適度值,找出其中最好的染色體,它即作為待求解問題的一個可能的全局最優(yōu)解,直到循環(huán)得到最優(yōu)解的時候就結(jié)束遺傳。
1.2 支持向量機(jī)回歸建模原理
基于統(tǒng)計學(xué)習(xí)理論的SVM可以通過定義適當(dāng)?shù)膿p失函數(shù)來解決連續(xù)函數(shù)擬合問題[11-14]。令訓(xùn)練樣本數(shù)據(jù)集為{xi,yi},其中i=1,…,l,xi∈Rd,yi∈Rd,x與y存在某種映射關(guān)系。用線性回歸函數(shù)f(x)=w·φ(x)+b擬合訓(xùn)練數(shù)據(jù)集{xi,yi},假設(shè)在精度ε(又稱不敏感函數(shù))下,所有訓(xùn)練數(shù)據(jù)集可以用式(1)進(jìn)行線性函數(shù)擬合:
(2)
(3)
(4)
此時,如果輸入空間特征是通過核函數(shù)映射到高維空間,即滿足K(xi,xj)=φ(xi)·φ(xj),再將式(4)帶入式(3)得出支持向量回歸預(yù)測函數(shù)為:
(5)
2.1 基于遺傳算法和SVM的輻射測溫模型
首先用CCD相機(jī)對各個溫度下標(biāo)定的黑體爐進(jìn)行高溫圖像采集,然后通過對圖像進(jìn)行分割、去噪、矩陣平均,從而求取出圖像樣本在RGB各個通道下的灰度值,然后在[0,255]進(jìn)行歸一化處理[15],再將所對應(yīng)的標(biāo)定溫度分別作為訓(xùn)練樣本集的輸入與輸出,系統(tǒng)結(jié)構(gòu)流程圖如圖1,取得的部分?jǐn)?shù)據(jù)如表1所示:
表1 測溫模型訓(xùn)練部分?jǐn)?shù)據(jù)
圖1 系統(tǒng)結(jié)構(gòu)流程圖
支持向量回歸機(jī)中有三個重要的參數(shù),即核函數(shù)的徑向基帶寬σ、控制模型復(fù)雜程度和擬合誤差大小的懲罰系數(shù)C、不敏感系數(shù)參數(shù)ε。由于本文在測溫實際應(yīng)用中,所期望的溫度預(yù)測精度在1 ℃內(nèi),我們不妨取ε=0.001(1 ℃/1 000 ℃)。接下來我們采用遺傳算法來選取參數(shù)C,σ。
步驟1:使用CCD相機(jī)對標(biāo)定后的黑體爐在不同溫度下的顏色光進(jìn)行采集,得到一系列一定間隔溫度的樣本,對圖像進(jìn)行處理,得到RGB通道下的顏色特征值空間集,并將樣本平均分成5等分;
步驟2:設(shè)定遺傳基因的種群規(guī)模、遺傳總代數(shù)、遺傳交叉概率及突變概率(例如popsize=20,popstep=30);
步驟3:將所需要選取的變量編碼成二進(jìn)制串。我們設(shè)定懲罰因子C的選取范圍為[1:5 000]、核函數(shù)參數(shù)σ的范圍為[0.01:1.28];
步驟4:染色體評價。本文采用支持向量機(jī)對顏色測溫樣本值進(jìn)行訓(xùn)練,交叉驗證取得的平均MSE作為染色體評價函數(shù)。如果染色體評價函數(shù)fitvalue滿足系統(tǒng)指定要求或者遺傳算法達(dá)到最大遺傳步驟,則轉(zhuǎn)步驟5;否則轉(zhuǎn)步驟3;
步驟5:取出fitvalue滿足系統(tǒng)指定精度條件的染色體,或取出全體fitvalue值最高的最佳染色體(當(dāng)算法計算到設(shè)定的遺傳代數(shù)最大值時),再解碼得到支持向量機(jī)模型在輻射測溫中最佳參數(shù)C,σ。
步驟6:取樣本輸入到SVM模型進(jìn)行訓(xùn)練,擬合高溫圖像顏色特征值與溫度T之間的非線性關(guān)系,并利用樣本驗證訓(xùn)練好的SVM模型,并與網(wǎng)格搜索法取得最優(yōu)參數(shù)進(jìn)行預(yù)測仿真比較。
2.2 仿真結(jié)果與分析
支持向量機(jī)結(jié)構(gòu)參數(shù)通過遺傳種群的初始化,染色體適度值評估,基因選擇,雜交,變異,解碼等一系列遺傳算法后,遺傳算法取得的最佳參數(shù)為[3 500,0.03],而網(wǎng)格搜索法我們同樣取C的范圍為[1:10:5 000],搜索步長為10;核函數(shù)參數(shù)σ的范圍為[0.01:0.02:1.28],搜索步長為0.02,取得的最佳參數(shù)為[2 000,0.21]。分別將以上兩組參數(shù)帶入SVM模型進(jìn)行訓(xùn)練與預(yù)測,得到預(yù)測誤差如圖1所示。
遺傳算法在SVM參數(shù)詢優(yōu)迭代中,將訓(xùn)練數(shù)據(jù)的交叉驗證取得的所有MSE平均值作為適度值函數(shù),隨著迭代次數(shù),MSE的結(jié)果趨勢如圖2所示。在選擇遺傳算法與網(wǎng)格搜索法優(yōu)化SVM參數(shù)時,最終取得的SVM模型在對溫度預(yù)測結(jié)果中,所取得的最大誤差、最小誤差及平均誤差如表2所示。所有仿真實驗在MATLAB7.6,Intel Core i5-2310 CPU @ 3.00 GHz中運行。
圖2 遺傳算法與網(wǎng)格搜索法模型結(jié)果與真實溫度之差
表2 遺傳詢優(yōu)算法與網(wǎng)格搜索法數(shù)據(jù)比較
從圖2中我們可以直觀地看出,遺傳算法所得出的參數(shù)結(jié)構(gòu)對SVM模型預(yù)測精度明顯比網(wǎng)格搜索出的參數(shù)結(jié)構(gòu)所取得的要高。從表2中數(shù)據(jù)比較可以看出,遺傳算法取得的模型預(yù)測最大誤差有3.165,而最小誤差只有0.013,這比網(wǎng)格搜索方法得到的預(yù)測無論是最大還是最小誤差都要小,最重要的是所有訓(xùn)練樣本集在模型預(yù)測中的平均誤差比后者小的多。從圖3中,我們又可以看出遺傳算法在到達(dá)第10步以后,訓(xùn)練誤差直線下降,說明遺傳算法收斂非???,運算效率很高。
圖3 遺傳SVM在迭代過程中預(yù)測總體誤差(MSE)趨勢
本文基于遺傳算法和支持向量機(jī)應(yīng)用擬合高溫物體顏色圖像的灰度值與真實溫度之間的映射關(guān)系,利用遺傳算法優(yōu)異的全局搜索能力選取支持向量機(jī)網(wǎng)絡(luò)的結(jié)構(gòu)參數(shù)。與常規(guī)搜索方法網(wǎng)格搜索法獲得的結(jié)果進(jìn)行了對比。實驗結(jié)果表明,基于遺傳算法的支持向量機(jī)不但擁有SVM的良好的擬合和泛化能力,還同時結(jié)合了遺傳算法全局搜索和快速收斂的智能優(yōu)化優(yōu)勢,驗證了遺傳支持向量機(jī)在輻射溫度預(yù)測以及其他回歸擬合領(lǐng)域有著十分廣闊的應(yīng)用前景。后續(xù)研究更需考慮實時性,因為這種基于圖像顏色和支持向量機(jī)的測溫技術(shù)是通過CCD相機(jī)采集了圖像之后,再通過計算機(jī)進(jìn)行圖像處理,取得高溫圖像的顏色特征值后利用支持向量機(jī)模型的訓(xùn)練而預(yù)測溫度,這會影響到溫度的實時測量,而且高溫圖像的采集設(shè)備和后續(xù)數(shù)據(jù)處理設(shè)備并沒有集成在一起,不利于商業(yè)化的生產(chǎn)和使用,這將是本文后續(xù)研究的重點。
[1]陳凱迪.基于CCD圖像傳感器的溫度測量系統(tǒng)的研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2010:3-8.
[2]Tschudi H R,Schubnell ML.Measuring temperatures in the presence of external radiation by flash assisted multiwavelength pyrometry[J].Review of Scientific Instruments,1999,70(6):2719-2727.
[3]朱麗娟,周永華,周黃斌.基于BP神經(jīng)網(wǎng)絡(luò)的彩色溫度軟測量[J].計算技術(shù)與自動化,2007,26(4):113-116.
[4]O.Chapelle,V.Vapnik.Choosing multiple parameters for support vector machines[J].Machine Learning,2002,46(1):131-159.
[5]Cherkassky V,Ma Y Q.Practical selection of SVM parameters and noise estimation for SVM regression[J].Neural Networks,2004,17(1):113-126.
[6]李嬌.支持向量機(jī)參數(shù)優(yōu)化研究[D].武漢:華中師范大學(xué),2011:45-50.
[7]Ruxandra Stoean,D.Dumitrescu,Mike Preuss.Evolutionary support vector regression machines[R].Symbolic and Numeric Algorithms for Scientific Computing,2006.
[8]Seifeddine Souahlia,Khmais Bacha,Abdelkader Chaari.SVM-based decision for power transformers fault diagnosis using rogers and doemenburg ratios DGA[R].2013.
[9]Maya Kallas,Clovis Francis,Lara Kanaan.Multi-class SVM classification combined with kernel PCA feature extraction of ECG signals[R].Telecommunications,2012.
[10]Holland J H.Genetic algorithm[J].Scientific American,1992,256(1):66-70.
[11]臧淑英,張策,張麗娟,等.遺傳算法優(yōu)化的支持向量機(jī)濕地遙感分類[J].地理科學(xué),2012,32(4):434-440.
[12]李海生.支持向量機(jī)回歸算法與應(yīng)用研究[D].廣州:華南理工大學(xué),2005:34-39.
[13]李翠平,鄭瑤瑕,張佳,等.基于遺傳算法優(yōu)化的支持向量機(jī)品位插值模型[J].北京科技大學(xué)學(xué)報,2013,35(7):84-89.
[14]劉海,張俊紅,倪廣健,等.基于遺傳支持向量機(jī)的柴油機(jī)輻射噪聲品質(zhì)預(yù)測技術(shù)[J].振動與沖擊,2013,32(2):111-115.
[15]孫元,彭小奇,嚴(yán)軍.基于彩色CCD的高溫場輻射測溫方法[J].儀器儀表學(xué)報,2011,32(11):2579-2585.
(責(zé)任編輯:劉劃 英文審校:劉敬鈺)
Radiation temperature measuring based on support vector regression and genetic algorithm optimization
LU Yan-jun,ZHOU Xiao-min,REN Yan,FANG Rui
(College of Automation,Shenyang Aerospace University,Shenyang 110136,China)
Thermometry plays a very important role in many fields such as industrial production and scientific studies.Genetic Algorithm(GA)is a global search algorithm which simulates the phenomenon of open cross and the natural selection in the biosphere.Support Vector Machine(SVM)is a new learning algorithm based on statistical learning theory with good nonlinear fitting and generalization abilities.According to the present situation where the parameters of SVM are selected by experience,puts forward genetic algorithm to optimize the parameters of SVM and applies them to the infrared radiation temperature measurement.Simulation shows that the GA optimization method has more excellent performance in learning efficiency and prediction accuracy than the grid search method.Therefore,the results prove the validity that GA and SVM can be well used in the target radiation temperature measuring.
Support Vector Machine;Genetic Algorithm;Parameter Optimization;Thermometry
2014-01-07
沈陽航空航天大學(xué)博士啟動項目(項目編號:13YB11);沈陽航空航天大學(xué)大學(xué)生創(chuàng)新項目(項目編號:2013105)
盧艷軍(1968-),女,遼寧義縣人,副教授,主要研究方向:復(fù)雜系統(tǒng)故障診斷技術(shù)及飛行器主動安全技術(shù),E-mail:sylyj2004@126.com。
2095-1248(2015)03-0058-05
TN219
A
10.3969/j.issn.2095-1248.2015.03.011