摘要:支持向量機(jī)在對(duì)非線性復(fù)雜問(wèn)題進(jìn)行處理的過(guò)程中,展現(xiàn)出來(lái)的優(yōu)勢(shì)特征非常突出,本文針對(duì)霧霾天氣預(yù)測(cè)中支持向量機(jī)的應(yīng)用做出了進(jìn)一步探究,對(duì)支持向量機(jī)的概念、支持向量機(jī)的基本思想、建立霧霾預(yù)測(cè)模型、預(yù)測(cè)試驗(yàn)給出了詳細(xì)的分析。
關(guān)鍵詞:霧霾天氣;預(yù)測(cè);支持向量機(jī)
中圖分類號(hào):X16 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2095-672X(2020)01-0-01
Abstract:Support vector machines show prominent advantages in the process of dealing with non-linear and complex problems.This paper has further explored the application of support vector machines in haze weather prediction.The concept of support vector machines,the basic idea of support vector machine, establishment of haze prediction model,and prediction experiment are given in detail.
Key words:Haze weather;Prediction;Support vector machine
霧霾的預(yù)測(cè)和治理目前已經(jīng)成為人們關(guān)注的熱點(diǎn)。而霧霾天氣中,支持向量機(jī)的應(yīng)用十分關(guān)鍵。以往應(yīng)用的預(yù)測(cè)模式,在預(yù)測(cè)模型建立的過(guò)程中,需要預(yù)報(bào)因子和預(yù)報(bào)對(duì)象的線性相關(guān)關(guān)系,其中預(yù)報(bào)因子之間,存在的線性相關(guān)性比較小。因此,針對(duì)之前使用的統(tǒng)計(jì)形式,不能解決存在的非線性關(guān)系的霧霾預(yù)測(cè)問(wèn)題。其中,V. Vapnik等學(xué)者,提出了SLT,為統(tǒng)計(jì)學(xué)習(xí)理論,屬于小樣本的機(jī)器學(xué)習(xí)理論。在此基礎(chǔ)上,對(duì)支持向量機(jī)方法進(jìn)行了構(gòu)建和發(fā)展,成為全新的統(tǒng)計(jì)學(xué)習(xí)理論方法,能夠?qū)Ψ蔷€性分類和非線性回歸進(jìn)行科學(xué)處理。
1 支持向量機(jī)的概念
1963年,首次提出了支持向量機(jī),在被提出之后獲得了相應(yīng)的發(fā)展,但是21世紀(jì)90年代之后,發(fā)展的速度非??欤瑫r(shí)衍生出了很多的改進(jìn)算法及擴(kuò)展算法[1]。其中便包括了多分類SVM 、最小二乘SVM(Least-Square SVM, LS-SVM)、支持向量回歸、支持向量聚類、半監(jiān)督SVM(semi-supervised SVM, S3VM)等[2]。此外,在人像識(shí)別及文本分類中,對(duì)支持向量機(jī)的應(yīng)用也非常普遍[3]。
2 支持向量機(jī)的基本思想
支持向量機(jī)的應(yīng)用基本思路是,在高維空間對(duì)樣本進(jìn)行映射,找到將樣本劃分成兩類的最理想線性超平面。其中需要完成的工作包括:根據(jù)Mcrccr核展開(kāi)定理,利用f,也就是非線性映射,在某個(gè)高維或者無(wú)窮維特征空間對(duì)樣本空間進(jìn)行有效映射,并在特征空間當(dāng)中對(duì)E進(jìn)行應(yīng)用,將不靈敏函數(shù)進(jìn)行轉(zhuǎn)換,使其成為誤差函數(shù)[4]。其中,全部的樣本點(diǎn),對(duì)超平面距離的計(jì)算,都不大于E時(shí),便可對(duì)最理想的回歸超平面問(wèn)題實(shí)施轉(zhuǎn)化,對(duì)二次凸規(guī)劃問(wèn)題進(jìn)行解決。此外,還能求全局最佳解,使得在對(duì)線性學(xué)習(xí)方法進(jìn)行應(yīng)用的過(guò)程中,可以在特征空間中,對(duì)高緯非線性分類問(wèn)題和高緯非線性回歸問(wèn)題進(jìn)行有效解決。
3 建立霧霾預(yù)測(cè)模型
3.1 PM2.5所產(chǎn)生的危害十分嚴(yán)重,其中最主要的影響因素是氣象因子和大氣污染物濃度
如果需要應(yīng)用氣象因素參數(shù)和數(shù)據(jù),可以通過(guò)中國(guó)天氣網(wǎng)進(jìn)行獲取,而大氣污染物數(shù)據(jù)可通過(guò)中國(guó)環(huán)境保護(hù)部門對(duì)空氣質(zhì)量數(shù)據(jù)進(jìn)行的實(shí)時(shí)發(fā)布獲取。結(jié)合相關(guān)資料和以往經(jīng)驗(yàn),可對(duì)當(dāng)日的PM2.5污染物濃度預(yù)報(bào)模型進(jìn)行有效確定,并明確其中的輸入量為可吸入顆粒物、臭氧、一氧化碳、二氧化氮的每日平均濃度,掌握前一天地面最大及最小露點(diǎn)、平均露點(diǎn)和濕度、最低氣壓以及最大風(fēng)速、平均風(fēng)速因子[5]等。
3.2 SVM回歸的霧霆預(yù)報(bào)模型分析
(1)支持向量機(jī)的核函數(shù)類型的確定。RBF核函數(shù)具備的優(yōu)勢(shì)特點(diǎn)十分突出,有著性能好及穩(wěn)定性非常高的特征,并且對(duì)于參數(shù)的調(diào)節(jié)比較少。所以,在對(duì)RBF核函數(shù)的支持向量回歸模型進(jìn)行應(yīng)用的過(guò)程中,RBF核函數(shù)為:
(2)支持向量機(jī)預(yù)測(cè)模型當(dāng)中的參數(shù)尋優(yōu)。一般情況下,根據(jù)自己以往的工作經(jīng)驗(yàn)及相關(guān)的實(shí)驗(yàn)數(shù)據(jù),便可選擇相應(yīng)的向量機(jī)參數(shù)。其中,對(duì)于交叉驗(yàn)證的方法,選擇網(wǎng)格搜索法,可對(duì)支持向量機(jī)的參數(shù)C和a進(jìn)行有效尋找。其中,需要將訓(xùn)練集進(jìn)行劃分,使其有k個(gè)子集,這樣每個(gè)子集,便成為了不同的測(cè)試集,并將剩下的子集當(dāng)做訓(xùn)練集。具體來(lái)說(shuō)便是建模k次,可結(jié)合模型的性能,評(píng)估出k次的平均絕對(duì)誤差,這樣便可對(duì)模型的最優(yōu)參數(shù)進(jìn)行有效確定。此外,對(duì)于網(wǎng)格搜索法的應(yīng)用,需要將網(wǎng)格當(dāng)中的點(diǎn)(C,σ)實(shí)施窮舉搜索。其中C,σ當(dāng)中的步長(zhǎng)增長(zhǎng),為指數(shù)增和增長(zhǎng)。
對(duì)于訓(xùn)練樣本,其中的優(yōu)化參數(shù)支持向量機(jī)的預(yù)測(cè)設(shè)備,可對(duì)相應(yīng)的支持向量進(jìn)行獲取,這樣便能對(duì)向量機(jī)中的具體結(jié)構(gòu)進(jìn)行確定。
應(yīng)用完成訓(xùn)練的支持向量預(yù)測(cè)器詳細(xì)預(yù)測(cè)被測(cè)試的樣本。
4 預(yù)測(cè)試驗(yàn)分析
4.1 試驗(yàn)軟件
在選擇試驗(yàn)軟件的過(guò)程中,結(jié)合實(shí)際情況,最終確定了LIBSVM軟件。
4.2 預(yù)測(cè)實(shí)驗(yàn)
針對(duì)菏澤的霧霾預(yù)測(cè),根據(jù)菏澤地區(qū)的氣象資料以及同期大氣環(huán)境檢測(cè)資料,對(duì)PM2.5進(jìn)行了詳細(xì)的預(yù)測(cè)。因此產(chǎn)生霧霾的季節(jié)多發(fā)生在春季及冬季,所以在檢測(cè)日期挑選上,選擇了2017年1月到來(lái)年3月的相應(yīng)氣象數(shù)據(jù)以及大氣污染數(shù)據(jù)。其中,將2017年冬季共160組數(shù)據(jù)做相應(yīng)的訓(xùn)練樣本,在每組數(shù)據(jù)中,都有12個(gè)輸入因子及PM2.5的實(shí)際值。同時(shí)將2017年11月每日的數(shù)據(jù)做被測(cè)試的樣本,在每一組數(shù)據(jù)當(dāng)中,輸入因子數(shù)量為12個(gè),并預(yù)測(cè)每天的PM2.5。針對(duì)所使用的網(wǎng)格法及交叉驗(yàn)證,找尋相應(yīng)的參數(shù)。
4.3 實(shí)驗(yàn)結(jié)果分析
實(shí)驗(yàn)應(yīng)用了菏澤地區(qū)2017年10月逐日PM2.5的實(shí)測(cè)值與預(yù)測(cè)值之間的對(duì)比。經(jīng)過(guò)PM2.5的實(shí)測(cè)值與預(yù)測(cè)值之間的對(duì)比分析,可以看出,盡管兩者存在一定的差距,但是從整體角度看,曲線的擬合度并不低。其一,如果PM2.5發(fā)生的波動(dòng)非常大時(shí),預(yù)測(cè)工作會(huì)比較理想,其曲線針對(duì)預(yù)測(cè)的結(jié)果反應(yīng)十分敏感,但從數(shù)值的角度進(jìn)行分析,存在一定的偏差。其二,PM2.5的預(yù)測(cè)數(shù)值和實(shí)際測(cè)量數(shù)值,產(chǎn)生的線性關(guān)系系數(shù)為0.80,這便有力地說(shuō)明了在該模型當(dāng)中,對(duì)于PM2.5的預(yù)測(cè)有著非常大的優(yōu)勢(shì)作用,為霧霾的預(yù)測(cè)提供了準(zhǔn)確的數(shù)據(jù)依據(jù)。
5 結(jié)束語(yǔ)
總之,由于人們的生活環(huán)境受霧霾影響越來(lái)越嚴(yán)重,所以霧霾的預(yù)測(cè)和治理已經(jīng)成為人們關(guān)注的熱點(diǎn)。而霧霾天氣中,支持向量機(jī)的應(yīng)用十分關(guān)鍵。支持向量機(jī)應(yīng)用的基本思路是,在高維空間對(duì)樣本進(jìn)行映射,找到將樣本劃分成兩類的最理想線性超平面。支持向量機(jī)對(duì)非線性復(fù)雜問(wèn)題進(jìn)行處理時(shí),展現(xiàn)出來(lái)的優(yōu)勢(shì)特征非常突出,對(duì)于RBF核函數(shù)當(dāng)中的支持向量回歸模型,可以將PM2.5與其影響因子當(dāng)中產(chǎn)生的非線性關(guān)系進(jìn)行有效反映,其中展現(xiàn)出來(lái)的優(yōu)勢(shì)為訓(xùn)練速度非???,并且準(zhǔn)確度比較好。
參考文獻(xiàn)
[1]程美英,錢干,倪志偉,朱旭輝.基于虛擬多任務(wù)二元粒子群算法和分形維數(shù)的霧霾天氣預(yù)測(cè)方法[J].系統(tǒng)科學(xué)與數(shù)學(xué),2018,38(05):623-637.
[2]陸雪華,沙遠(yuǎn)峰,黃俊理,梁春朵,何永華.基于BP人工神經(jīng)網(wǎng)絡(luò)的桂林市霧霾天氣預(yù)測(cè)[J].影像研究與醫(yī)學(xué)應(yīng)用,2018,2(05):186-188.
[3]杜二玲,盧秀麗,竇林立.支持向量機(jī)在霧霾天氣預(yù)測(cè)中的應(yīng)用[J].內(nèi)蒙古科技與經(jīng)濟(jì),2017(17):57-58.
[4]朱旭輝,倪志偉,倪麗萍,程美英,李敬明,金飛飛.基于相異度的SVM選擇性集成霧霾天氣預(yù)測(cè)方法[J].系統(tǒng)科學(xué)與數(shù)學(xué),2017,37(06):1480-1493.
[5]侯瓊煌,楊航.基于三次指數(shù)平滑模型的霧霾天氣分析與預(yù)測(cè)[J].環(huán)境保護(hù)科學(xué),2014,40(06):73-77.
收稿日期:2019-10-14
作者簡(jiǎn)介:王英(1978-),女,漢族,本科學(xué)歷,工程師,研究方向?yàn)橹?、短期天氣預(yù)報(bào)。