侯毓 王春艷
摘要:如今大數(shù)據(jù)與公共服務(wù)的充分結(jié)合成為了當(dāng)前社會(huì)發(fā)展潮流?,F(xiàn)階段,我國(guó)越來越重視環(huán)境保護(hù)工作,而為了更好地帶動(dòng)大氣監(jiān)測(cè)工作的開展,就有必要積極合理地應(yīng)用大數(shù)據(jù)技術(shù)。
關(guān)鍵詞:大數(shù)據(jù)技術(shù);大氣監(jiān)測(cè);環(huán)境保護(hù)
中圖分類號(hào):X831 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2095-672X(2019)09-00-02
DOI:10.16647/j.cnki.cn15-1369/X.2019.09.044
Application of big data technology in atmospheric monitoring
Hou Yu, Wang Chunyan
(Tongliao Municipal Environmental Monitoring Station,Tongliao Inner Mongolia 028000,China)
Abstract:The combination of big data and public services has become the current trend of social development. At this stage, China is paying more and more attention to environmental protection work, and in order to better promote the development of atmospheric monitoring, it is necessary to actively and rationally apply big data technology.
Keywords:Big data technology;Atmospheric monitoring;Environmental protection
1 大氣環(huán)境監(jiān)測(cè)中大數(shù)據(jù)技術(shù)應(yīng)用的意義
我國(guó)已經(jīng)全面進(jìn)入了信息時(shí)代,每天都會(huì)產(chǎn)生大量的信息數(shù)據(jù),同時(shí)信息數(shù)據(jù)也可借助傳媒通道與通訊技術(shù)傳遞到社會(huì)的多個(gè)數(shù)據(jù)節(jié)點(diǎn)和層面當(dāng)中,從而為人們提供更加方便的服務(wù)?,F(xiàn)如今開發(fā)出了較多的新型軟件,在軟件開發(fā)的過程中也豐富了信息儲(chǔ)存的形式。在環(huán)境保護(hù)中,相關(guān)部門與系統(tǒng)所產(chǎn)生的信息可應(yīng)用在環(huán)境監(jiān)測(cè)中,且在實(shí)踐中充分利用大數(shù)據(jù)解析技術(shù)可有效提高信息采集、統(tǒng)計(jì)計(jì)算、系統(tǒng)模擬以及參數(shù)識(shí)別等工作效率,促進(jìn)了大氣環(huán)境監(jiān)測(cè)工作的順利進(jìn)行。
2 大數(shù)據(jù)解析技術(shù)在大氣環(huán)境監(jiān)測(cè)中的應(yīng)用
2.1 應(yīng)用目標(biāo)和內(nèi)容
大數(shù)據(jù)解析技術(shù)對(duì)復(fù)雜關(guān)系數(shù)據(jù)處理有著較為理想的效果,其以數(shù)據(jù)分析原理為基礎(chǔ),采用多種處理方式處理不同類型的問題。
首先要確定大數(shù)據(jù)分析技術(shù)應(yīng)用的基本目標(biāo)和實(shí)際內(nèi)容。本次研究的主要內(nèi)容是區(qū)域PM2.5濃度測(cè)算,在城市中采用單元網(wǎng)格劃分的形式,以G(g1,g2,…,gn)描述不同的單元網(wǎng)格,其中g(shù)主要應(yīng)用于1km?范圍描述,同時(shí)C(cg1,cg2,…,cgn)來描述每一個(gè)單元網(wǎng)格PM2.5濃度。在本次研究當(dāng)中取J(Ci)表示大數(shù)據(jù)解析的目標(biāo)函數(shù),函數(shù)當(dāng)中Ci可分為兩大類,一類是大氣自動(dòng)監(jiān)測(cè)站的設(shè)置,PM2.5濃度為已知量,利用C1描述;另外一類是無監(jiān)測(cè)站且濃度為未知數(shù)據(jù)的情況,以C2描述,以此為基礎(chǔ)開展數(shù)據(jù)分析。
2.2 確定特征量與數(shù)據(jù)類
因?yàn)镃2并未設(shè)置監(jiān)測(cè)站,同時(shí)PM2.5的濃度為未知數(shù),為了保證數(shù)據(jù)解析的有效性,應(yīng)及時(shí)確定特征量和數(shù)據(jù)類。以可能和需要為原則來選擇數(shù)據(jù)類,可能指的是確定有數(shù)據(jù)后選擇數(shù)據(jù)類,而需要?jiǎng)t是指分析單個(gè)數(shù)據(jù)類的基礎(chǔ)上選擇與J(Ci)函數(shù)有關(guān)的數(shù)據(jù)類。以環(huán)境的視角來分析,大多數(shù)數(shù)據(jù)類均為非線性關(guān)系,且其關(guān)系的多樣性也較為明顯,而數(shù)據(jù)類的非線性關(guān)系也使得數(shù)據(jù)解析更加困難。為了更加準(zhǔn)確地測(cè)出PM2.5的濃度值,應(yīng)科學(xué)利用環(huán)境科學(xué)領(lǐng)域的知識(shí)內(nèi)容,在現(xiàn)有條件的基礎(chǔ)上,確定數(shù)據(jù)類。數(shù)據(jù)類主要分為以下幾種類型,分別為PM2.5歷史數(shù)據(jù)、交通情況數(shù)據(jù)、網(wǎng)格內(nèi)的空氣污染數(shù)據(jù)、網(wǎng)格內(nèi)的道路數(shù)據(jù)和坐標(biāo)位置等。
確定上述數(shù)據(jù)類后,需做好特征量選擇,結(jié)合歷史數(shù)據(jù)求得PM2.5濃度的平均值,求出的平均值即為特征量。氣象條件數(shù)據(jù)的特征量較多,如風(fēng)速、氣壓、氣溫和相對(duì)濕度等。人群活動(dòng)數(shù)據(jù)類主要以人數(shù)為特征量。平均車速、高速公路長(zhǎng)度為交通情況數(shù)據(jù)類,公園、車站、工廠等的數(shù)量是空氣污染相關(guān)數(shù)據(jù)類的特征量,上述特征量屬性存在較大差異,部分特征量在時(shí)間變化的條件下也發(fā)生了較大轉(zhuǎn)變。在應(yīng)用大數(shù)據(jù)解析技術(shù)的過程中,要對(duì)特征量進(jìn)行科學(xué)分類,其主要分為空間相關(guān)數(shù)據(jù)集,以分類器完成函數(shù)預(yù)算,從而獲得準(zhǔn)確的預(yù)算結(jié)果,判斷其是否影響目標(biāo)函數(shù)。一類是時(shí)間變化條件下產(chǎn)生變化的數(shù)據(jù)集。在目標(biāo)函數(shù)計(jì)算中主要選取時(shí)間分類器。
2.3 時(shí)間分類器的選擇
解決隨時(shí)間變化量的過程中,要科學(xué)利用時(shí)間分類器,在交通狀況數(shù)據(jù)類當(dāng)中,平均車速、車輛總數(shù)是主要的特征量,在氣象條件當(dāng)中,主要的特征量有風(fēng)速、氣壓和氣溫。人數(shù)是人群流動(dòng)的特征量。設(shè)某網(wǎng)格點(diǎn)與某特征量為i、j,則xij為該類特征量,t代表時(shí)刻,則X={x1,x2,…,xn},x1={xi1,xi2,…,xij,t}。
又如在大氣污染濃度測(cè)算中,時(shí)間變化后數(shù)據(jù)也隨之變化,因此可將其視作特征量,以yi表示,i表示某網(wǎng)格點(diǎn),則Y={y1,y2,…,yn},其主要指某一時(shí)刻下待測(cè)污染物的濃度值。如特征量X容易確定,則yi與其相鄰yi-1有關(guān),i-y表示變量相鄰,P表示概率。則P=(Yi/X,Yj,i≠j)。如已知特征量X的序列條件,如出現(xiàn)y值,則可判斷其為正態(tài)分布函數(shù),狀態(tài)特征函數(shù)以exp(u·s(yi,xi,i))表示。狀態(tài)向i移動(dòng)時(shí),函數(shù)exp(λ·t(yi-1))。函數(shù)中的u與λ為待定參數(shù),滿足上述條件后方可求解。
在求解時(shí),應(yīng)用大數(shù)據(jù)解析技術(shù)可保證求解的準(zhǔn)確性。為了達(dá)到此目的,要對(duì)條件概率函數(shù)進(jìn)行轉(zhuǎn)化處理,從而確定u與λ的數(shù)值。創(chuàng)建TC的過程也是解析條件隨機(jī)場(chǎng)的過程,其將重點(diǎn)放在了函數(shù)是否符合解析的要求上,進(jìn)而得出最終結(jié)果。此外,在應(yīng)用大數(shù)據(jù)解析技術(shù)的過程中,需要采取有效措施加強(qiáng)特征值解析和推演的準(zhǔn)確性,讓SC與TC處于最佳狀態(tài)。
2.4 空間分類器選擇
空氣分類器通常也被人們稱為SC,特征量不會(huì)隨時(shí)間的變化產(chǎn)生變化,數(shù)據(jù)結(jié)果也不會(huì)發(fā)生變化。特征量對(duì)目標(biāo)函數(shù)的影響下,節(jié)點(diǎn)傳遞呈明顯的線性特征,因此,SC也具備了靜態(tài)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)特征。研究人員將神經(jīng)網(wǎng)絡(luò)視為一種復(fù)雜的系統(tǒng),其也成為了大數(shù)據(jù)解析中的輔助性工具。
在本次研究中,采用配合人造神經(jīng)網(wǎng)絡(luò)ANN,進(jìn)行網(wǎng)格PM2.5預(yù)測(cè),輸入部分IG構(gòu)建的SC分類器。IG可充分滿足ANN輸入自值的需要,應(yīng)用監(jiān)測(cè)站的網(wǎng)格,隨機(jī)選取兩個(gè)坐標(biāo),l1與l2,c1與c2表示污染物濃度,利用f11/f21/f12/f22描述特征量,在分析數(shù)據(jù)生成流程時(shí),要合理應(yīng)用數(shù)據(jù)表達(dá)式,P表示特征量距,進(jìn)而構(gòu)建ANN數(shù)據(jù)輸入。
則Pi1x=Pearson_Cor(f1i,f1x);Pi2x=Pearson_Cor(f2i,f2x)
ANN在取得數(shù)據(jù)后可通過神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)傳遞數(shù)據(jù),從而對(duì)目標(biāo)值進(jìn)行適度調(diào)整。在當(dāng)前的大氣環(huán)境監(jiān)測(cè)工作中,采用神經(jīng)網(wǎng)絡(luò)創(chuàng)建空間分類器時(shí),要結(jié)合實(shí)際采取合適的神經(jīng)網(wǎng)絡(luò),從而有效確保大氣污染濃度計(jì)算的準(zhǔn)確性與合理性。如在神經(jīng)網(wǎng)絡(luò)當(dāng)中,應(yīng)將非線性函數(shù)的變換、神經(jīng)節(jié)點(diǎn)感知偏移和節(jié)點(diǎn)權(quán)重等作為重點(diǎn)問題,采取有效的控制策略。
對(duì)此,要采用BP法,該方式將目標(biāo)鎖定在實(shí)測(cè)值和估算值的分配上,以此為基礎(chǔ)采用推演的方式在不同的權(quán)重上做好殘差分配處理,從而確保權(quán)重分配的科學(xué)性。在應(yīng)用SC時(shí),應(yīng)利用模擬訓(xùn)練有效減小殘差,從而優(yōu)化SC模型,提高特征量分析的準(zhǔn)確性。
3 大數(shù)據(jù)解析技術(shù)在大氣環(huán)境監(jiān)測(cè)的應(yīng)用要點(diǎn)
篩選關(guān)聯(lián)數(shù)據(jù)是大氣環(huán)境監(jiān)測(cè)工作中應(yīng)用大數(shù)據(jù)技術(shù)的重要環(huán)節(jié),以此為基礎(chǔ)可選擇數(shù)據(jù)類特征量,然后利用數(shù)學(xué)分析方法對(duì)特征量進(jìn)行分析和計(jì)算,總結(jié)各特征量之間的關(guān)系。大數(shù)據(jù)解析技術(shù)可保證非線性因素和多元關(guān)系的處理效果,故而其在多個(gè)行業(yè)的發(fā)展中均得以廣泛應(yīng)用。在本次的研究當(dāng)中以大氣環(huán)境監(jiān)測(cè)為例,雖然在詳盡的計(jì)算后獲得了精確的監(jiān)測(cè)結(jié)果,但是在監(jiān)測(cè)的過程中也要把控好以下幾點(diǎn)注意事項(xiàng):
首先要保證基礎(chǔ)數(shù)據(jù)收集與處理的質(zhì)量。基礎(chǔ)數(shù)據(jù)的數(shù)量較多,因此人們通常無法以直接的手段獲取數(shù)據(jù),所以,需要采取有效的統(tǒng)計(jì)學(xué)方法來獲取部分特征量。其次是要保證特征量選取的合理性。在選取特征量時(shí),有關(guān)人員需研究不同類型的問題,同時(shí)在數(shù)據(jù)與數(shù)據(jù)類的基礎(chǔ)上結(jié)合實(shí)際選擇特征量。最后是大數(shù)據(jù)解析技術(shù)當(dāng)中涵蓋了多種多樣的技術(shù)和不同類型的運(yùn)算方式。為此,監(jiān)測(cè)人員需要做好數(shù)據(jù)收集與處理工作,從而有效提高數(shù)據(jù)處理的質(zhì)量,為數(shù)據(jù)監(jiān)測(cè)提供強(qiáng)大的技術(shù)支持。
4 結(jié)束語
大氣污染問題是環(huán)境問題當(dāng)中的重要組成部分,而在大氣環(huán)境監(jiān)測(cè)的過程中,監(jiān)測(cè)數(shù)據(jù)之間存在著復(fù)雜的關(guān)系,同時(shí)監(jiān)測(cè)中也需要跨越多種障礙,采用大數(shù)據(jù)解析技術(shù)的過程中,應(yīng)當(dāng)全面了解并掌握監(jiān)測(cè)的要點(diǎn)及準(zhǔn)確的監(jiān)測(cè)流程,不斷改善數(shù)據(jù)收集、特征量選取和數(shù)據(jù)工具設(shè)計(jì)等方面的質(zhì)量,進(jìn)而為大氣監(jiān)測(cè)工作的順利開展奠定堅(jiān)實(shí)基礎(chǔ)。
參考文獻(xiàn)
[1]劉新禹,楊力.數(shù)字化監(jiān)測(cè)系統(tǒng)在大氣監(jiān)測(cè)中的應(yīng)用分析[J].綠色環(huán)保建材,2018(07).
[2]張凱雄.數(shù)字化監(jiān)測(cè)系統(tǒng)在大氣監(jiān)測(cè)中的應(yīng)用研究[J].環(huán)境與發(fā)展,2018(07).
收稿日期:2019-05-23
作者簡(jiǎn)介:侯毓(1971-),男,漢族,本科學(xué)歷,高級(jí)工程師,研究方向?yàn)榇髿馕廴局卫怼?/p>