曹文雅 趙偉
摘? 要:本文主要基于BP算法對機(jī)動(dòng)車進(jìn)行環(huán)污檢測,希望能為當(dāng)前機(jī)動(dòng)車的環(huán)境污染現(xiàn)狀提供參考依據(jù)。
關(guān)鍵詞:機(jī)動(dòng)車;BP算法;環(huán)污檢測
當(dāng)前我國經(jīng)濟(jì)飛速發(fā)展,城市居民交通問題也變得愈發(fā)復(fù)雜。隨著機(jī)動(dòng)車的普及,各種各樣的問題也都隨之出現(xiàn),常見的有:交通事故頻發(fā)、亂停亂放、環(huán)境污染等,這一方面對城市交通和公眾素質(zhì)提出了考驗(yàn),另一方面也對相關(guān)機(jī)構(gòu)的管理方法提出了更多的要求。本文從當(dāng)前機(jī)動(dòng)車的環(huán)污檢測出發(fā),以BP算法技術(shù)為基礎(chǔ),進(jìn)而構(gòu)建完整的預(yù)測模型,為當(dāng)前機(jī)動(dòng)車的環(huán)境污染現(xiàn)狀提供參考依據(jù)。
一、實(shí)驗(yàn)設(shè)計(jì)
1.算法選擇
機(jī)動(dòng)車的環(huán)境污染在各個(gè)時(shí)間段呈現(xiàn)不同的狀態(tài),所以在進(jìn)行相關(guān)算法的選擇時(shí)要特別注意對預(yù)測方法的選擇,常用的預(yù)測方法包括:德爾菲法、神經(jīng)網(wǎng)絡(luò)、時(shí)間序列法、機(jī)器學(xué)習(xí)、回歸分析法、彈性系數(shù)法和灰色預(yù)測法等。在結(jié)合實(shí)際情況下,對各種方法進(jìn)行分析和討論之后,最終決定使用神經(jīng)網(wǎng)絡(luò)中的BP算法來構(gòu)建相關(guān)的模型。
2.樣本來源
本次數(shù)據(jù)來源基于某環(huán)境監(jiān)測部門的內(nèi)部數(shù)據(jù),記錄某區(qū)域在一段時(shí)間內(nèi)的車輛使用人數(shù)1274人,選取樣本的時(shí)間為2019年8月25日,當(dāng)天某環(huán)境監(jiān)測部門的整體數(shù)據(jù)樣本為1000條。本實(shí)驗(yàn)將這些參數(shù)共劃分為記錄編號(hào)(id)、1天內(nèi)某企業(yè)機(jī)動(dòng)車的整體環(huán)境污染量(y)、某環(huán)境監(jiān)測部門所在的城市(city)、時(shí)間變量(hour)、節(jié)假日(is 0 workday)、工作日(is 1 workday)、所在城市當(dāng)日溫度(temp)、所在城市當(dāng)天天氣(weather)8個(gè)特征變量。
3.模型構(gòu)建
基于上述8個(gè)特征變量,本次試驗(yàn)BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)預(yù)測模型的構(gòu)建步驟為:首先在構(gòu)建模型之間需要對BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)預(yù)測模型的拓?fù)浣Y(jié)構(gòu)進(jìn)行分析和設(shè)置,BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)預(yù)測模型的結(jié)構(gòu)特點(diǎn)為其輸入層、隱層和輸出層,三層都可以完成由n維到m維的映射,進(jìn)而可以將節(jié)假日(is 0 workday)、工作日(is 1 workday)、所在城市當(dāng)日溫度(temp)、所在城市當(dāng)天天氣(weather)、時(shí)間變量(hour)作為本次預(yù)測模型的特征變量,將1天內(nèi)某企業(yè)機(jī)動(dòng)車的整體環(huán)境污染量(y)作為本次實(shí)驗(yàn)預(yù)測模型的目標(biāo)變量;其次是對隱含層內(nèi)的神經(jīng)元數(shù)量和最大迭代次數(shù)進(jìn)行設(shè)置,根據(jù)本次機(jī)動(dòng)車預(yù)測模型的環(huán)境污染,本實(shí)驗(yàn)將最大迭代次數(shù)設(shè)置為300,將隱含層神經(jīng)元的數(shù)量設(shè)置為150,在對數(shù)值的計(jì)算方面選擇了大規(guī)模數(shù)值計(jì)算較好的L-BFGS算法進(jìn)行計(jì)算;最后根據(jù)相關(guān)拓?fù)浣Y(jié)構(gòu)代入?yún)?shù),其中Xn代表相應(yīng)的特征變量,Y代表1天內(nèi)某企業(yè)機(jī)動(dòng)車的整體環(huán)境污染量,Wn則代表了相關(guān)的閾值。
二、實(shí)驗(yàn)結(jié)果
1.模型預(yù)測
激活函數(shù)負(fù)責(zé)將神經(jīng)元的輸入映射到輸出端,常用的激活函數(shù)有Tanh函數(shù)?Logistic函數(shù)?Relu函數(shù)?Identiey函數(shù)。本研究采用這四種激活函數(shù)依次對模型進(jìn)行評(píng)估,從而找到最適合的預(yù)測模型。模型評(píng)估采用四種方法:RMSE均方根誤差?MSE均方誤差?MAE平均絕對誤差?R2模型擬合度。RMSE均方根誤差法計(jì)算的是觀測值與其真實(shí)值,或者觀測值與其模擬值之間的偏差。MSE均方誤差法是指參數(shù)估計(jì)值與參數(shù)真值之差平方的期望值。MSE可以評(píng)價(jià)數(shù)據(jù)的變化情況,MSE的值越小,說明預(yù)測模型描述實(shí)驗(yàn)數(shù)據(jù)具有更好的精確度。MAE平均絕對誤差是絕對誤差的平均值,平均絕對誤差能更好地反應(yīng)預(yù)測值誤差的實(shí)際情況。R2是用來說明回歸直線對觀測值的擬合程度,R2最大值為1,R2的值越接近1,說明回歸直線對觀測值的擬合程度越好;反之,R2的值越小,說明回歸直線對觀測值的擬合程度越差。
2.預(yù)測結(jié)果
在采用四種激活函數(shù)的情況下,檢測評(píng)價(jià)數(shù)據(jù)結(jié)果表明:在激活函數(shù)為Tanh情況下,擬合優(yōu)度R2的值最大,其值為0.819;MSE的值最小,其值為188.508;RMSE值最小,其值13.014;MAE的值最小,其值為9.804。從檢驗(yàn)測試數(shù)據(jù)的結(jié)果來看,在激活函數(shù)為Tanh的情況下,擬合優(yōu)度R2的值最大,其值為0.775;MSE的值最小,其值為308.650;RMSE值最小,其值16.771;MAE的值最小,其值為10.574。因此,BP神經(jīng)網(wǎng)絡(luò)的激活函數(shù)為Tanh函數(shù)作為已經(jīng)找到的機(jī)動(dòng)車預(yù)測模型,選擇城市1的數(shù)據(jù)集,以is_workday?weather?temp?wind?hour?為特征變量,id作為編號(hào),過濾掉其他的無關(guān)變量,預(yù)測未來一段時(shí)間(不同時(shí)間點(diǎn))機(jī)動(dòng)車的環(huán)境污染量情況。
三、總結(jié)
研究表明,工作日和溫度適宜的情況下居民用車概率增高,使得環(huán)境污染程度增加。而天氣不好的情況或者節(jié)假日,居民則會(huì)減少機(jī)動(dòng)車出行,環(huán)境污染程度也有所降低。
參考文獻(xiàn)
[1]? 詹志明,尹文君.環(huán)保大數(shù)據(jù)及其在環(huán)境污染防治管理創(chuàng)新中的應(yīng)用[J].環(huán)境保護(hù),2016,44(06):44-48.
[2]? 祁娟.“大數(shù)據(jù)”助力交通治污減排——京津冀首個(gè)交通節(jié)能減排實(shí)驗(yàn)室成立[J].運(yùn)輸經(jīng)理世界,2015(21):42-44.