王杉 朱亞濤 胡建輝
摘? 要: 針對(duì)我國目前氣象觀測(cè)站點(diǎn)分散不均勻?qū)е聦?shí)時(shí)得到的空氣質(zhì)量信息不準(zhǔn)確的問題,文中提出一種基于光學(xué)成像的空氣質(zhì)量定期性制定方法。該文結(jié)合通過數(shù)字圖像去霧領(lǐng)域中基于光學(xué)成像原理去霧得到的大氣透射率和通過氣象觀測(cè)領(lǐng)域中得到的空氣質(zhì)量與散射系數(shù)間的相關(guān)性,并考量同一景深下大氣透射率和散射系數(shù)之間的指數(shù)關(guān)系,利用BP神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)空氣質(zhì)量和圖片透射率間的隱性聯(lián)系,做到通過圖片來定性判定其空氣質(zhì)量。實(shí)驗(yàn)結(jié)果顯示,所提空氣質(zhì)量判定方法的整體識(shí)別率為83.72%,優(yōu)類和良類識(shí)別率達(dá)到了90%以上。
關(guān)鍵詞: 空氣質(zhì)量判定; 定性判定; 光學(xué)成像; 圖像去霧; 實(shí)驗(yàn)設(shè)計(jì); 實(shí)驗(yàn)結(jié)果分析
中圖分類號(hào): TN911.73?34; TP391? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼: A? ? ? ? ? ? ? ? ? ? ?文章編號(hào): 1004?373X(2020)08?0113?04
A methodof air quality qualitative judgement? based on optical imaging
WANG Shan, ZHU Yatao, HU Jianhui
(College of Information Engineering, East China Jiaotong University, Nanchang 330022, China)
Abstract: As the real?time information of air quality is inaccurate due to the uneven distribution of meteorological observation stations in China, a method of air quality qualitative judgement method based on optical imaging is proposed. The atmospheric transmittance obtained by defogging based on optical imaging principle in the digital image defogging domain, and the correlation between air quality and scattering coefficient obtained by meteorological observation are combined in this paper. And also, the exponential relationship between the atmospheric transmittance and the scattering coefficient at the same depth of field is considered, and the implicit relation between air quality and image transmittance is studied by means of BP neural network model. On the bsasis of the above method, the air quality is judged qualitatively by pictures. The experimental results show that the overall recognition rate of the proposed air quality judgement method is 83.72%, in which the recognition rate of superior and good classes is over 90%.
Keywords: air quality judgement; qualitative judgement; optical imaging; image defogging; experiment design; experiment result analysis
0? 引? 言
霧霾是當(dāng)今一個(gè)越來越嚴(yán)重的環(huán)境問題。學(xué)者們不僅研究它的成因并解決其造成的問題,如影響各識(shí)別系統(tǒng)等,而且還研究自行觀測(cè)的數(shù)據(jù)分析不同空氣質(zhì)量情況下各因素的變化情況[1?2],大眾則關(guān)心外面的霧霾污染程度是否適宜外出活動(dòng)。
霧或霧霾對(duì)數(shù)字圖像的影響是一樣的,而圖像去霧的研究已經(jīng)有幾十年的發(fā)展。文獻(xiàn)[3]里系統(tǒng)介紹了圖像去霧的研究進(jìn)展。數(shù)字圖像去霧,整體來講主要有兩個(gè)方面:一是基于圖像增強(qiáng)去霧[4];二是基于大氣散射模型去霧[5]。第二種目前已經(jīng)成為主流的去霧方法,其思路是研究光學(xué)成像[6]的原理,將大氣粒子對(duì)光線的散射應(yīng)用到霧天成像中,故此方法是專門針對(duì)圖像中的霧提出的解決方案,尤其是He等基于此模型提出的暗原色先驗(yàn)理論,使得圖像去霧的研究達(dá)到了一個(gè)新高度[7]。
日常生活生產(chǎn)中,人們關(guān)注空氣污染情況以減少不必要的外出。我國目前根據(jù)空氣污染指數(shù)將空氣質(zhì)量大體分為4個(gè)類別:優(yōu)、良、輕度污染和重度污染,其數(shù)字圖像如圖1所示。雖然現(xiàn)在通過網(wǎng)絡(luò)或移動(dòng)客戶端可以知道當(dāng)前城市的空氣質(zhì)量,而這些數(shù)據(jù)都是基于國家的監(jiān)測(cè)站發(fā)布的,根據(jù)中國環(huán)境監(jiān)測(cè)總站2017年發(fā)布的數(shù)據(jù):全國338個(gè)地級(jí)以上城市設(shè)置監(jiān)測(cè)點(diǎn)位僅1 436個(gè),每個(gè)城市平均下的站點(diǎn)很少很分散,這時(shí)再根據(jù)這些數(shù)據(jù)來決定是否出行就缺乏說服力。
針對(duì)這一切實(shí)問題,本文結(jié)合氣象學(xué)者和圖像去霧學(xué)者的結(jié)論,提出一種方法:通過大量有標(biāo)注其空氣質(zhì)量類別的霧霾圖像,提取圖像的大氣透射率,然后選取透射率圖像的特征值并用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和判定,最終可以做到實(shí)時(shí)直接從數(shù)字圖像中得到其空氣質(zhì)量。從實(shí)驗(yàn)結(jié)果來看,實(shí)驗(yàn)方案已基本達(dá)到判定要求。
1? 實(shí)驗(yàn)設(shè)計(jì)相關(guān)理論
本節(jié)主要介紹本文實(shí)驗(yàn)設(shè)計(jì)時(shí)所涉及的相關(guān)理論。前兩小節(jié)驗(yàn)證實(shí)驗(yàn)的可行性,后一小節(jié)介紹對(duì)于不同的透射率圖片分類所用的模型。
1.1? 大氣散射系數(shù)與空氣質(zhì)量
現(xiàn)實(shí)中可以通過肉眼觀察環(huán)境或圖片大概分辨出空氣質(zhì)量的好壞,原因在于不同空氣質(zhì)量情況下所看到的景深不同。而大氣散射系數(shù)是影響能見度的主要原因,氣象方面的學(xué)者對(duì)此進(jìn)行了相關(guān)研究。
2009年在青海瓦里關(guān)同步觀測(cè)了PM2.5中主要化學(xué)成分和大氣散射系數(shù),并分析得到大氣散射系數(shù)與PM2.5質(zhì)量濃度變化趨勢(shì)一致,兩者相關(guān)系數(shù)達(dá)到0.9以上,尤其春季和秋季顯著相關(guān)[1]。
利用廣州南沙區(qū)大氣成分站,自動(dòng)和人工觀測(cè)得到的2012年散射系數(shù)和氣象數(shù)據(jù),經(jīng)統(tǒng)計(jì)分析有以下結(jié)論:全年的散射系數(shù)均值情況為霧霾日[>]霾日[>]霧日[>]一般日[2]。
由以上學(xué)者及其他氣象學(xué)者的結(jié)論可以總結(jié)出,大氣散射系數(shù)與空氣質(zhì)量相關(guān)性很強(qiáng),可以通過散射系數(shù)的不同對(duì)空氣質(zhì)量做定性的判別。
1.2? 大氣散射模型與暗原色先驗(yàn)
經(jīng)過Nayer和Narasimhan詳細(xì)描述和推導(dǎo)的大氣散射模型[5]已經(jīng)廣泛地運(yùn)用到圖像去霧領(lǐng)域,并被用于描述圖像降質(zhì)的機(jī)理:
式中:[Ix]是有霧圖像;[L∞]是景深為無窮遠(yuǎn)的大氣光強(qiáng)度;[ρ(x)]表征物體的反光能力;[d]是景深;[β]是大氣散射系數(shù)。大氣散射系數(shù)和景深的聯(lián)合關(guān)系為:
式(2)所示關(guān)系稱為大氣透射率。故結(jié)合式(1)圖像的退化模型可表示為:
式中:[Jx]為無霧圖像;A為大氣光。基于大氣散射模型去霧的過程就是根據(jù)式(3),由已知的[Ix]結(jié)合其他知識(shí)估計(jì)出的其他未知量求得無霧圖像[Jx],此為基于光學(xué)成像去霧的基本思路。
暗原色先驗(yàn)理論指出在無霧圖片非天空的局部區(qū)域里,某一些像素總會(huì)有至少一個(gè)顏色通道具有很低的值,幾乎接近于0,這是由于物體有陰影,顏色較暗或某種顏色很鮮艷等造成的。無霧圖片的暗原色用數(shù)學(xué)定義為:
式中:[Jc]表示RGB三個(gè)通道;[Ω(x)]表示以像素X為中心的濾波模版;[c∈r,g,b]為顏色通道指數(shù);[Jdark]為其暗原色圖。
將式(3)稍作處理,變形為:
兩邊取暗原色:
根據(jù)式(4)可以推導(dǎo)出透射率的公式如下:
式中,[ω(0<ω≤1)]是調(diào)節(jié)因子,是為了保證圖片真實(shí)性。然后對(duì)得到的透射率用導(dǎo)向?yàn)V波的方法進(jìn)行細(xì)化,結(jié)合從暗原色圖片得到的A可最終復(fù)原出無霧圖片。此過程中也得到了實(shí)驗(yàn)所需的霧霾圖片的透射率分布情況,圖1中各圖片提取的透射率如圖2所示。
結(jié)合1.1節(jié)的結(jié)論:大氣散射系數(shù)與空氣質(zhì)量相關(guān)性很強(qiáng),由于式(2)大氣透射率與散射系數(shù)隨著景深呈指數(shù)遞減關(guān)系,故可以得到大氣透射率[tx]與空氣質(zhì)量之間也具有較強(qiáng)的相關(guān)性,這為實(shí)驗(yàn)的進(jìn)行提供了圖片中的數(shù)據(jù)來源。
1.3? BP神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)算法是用計(jì)算機(jī)模擬人類學(xué)習(xí)的過程,建立輸入和輸出數(shù)據(jù)之間關(guān)系的算法,其中應(yīng)用最廣泛的是BP神經(jīng)網(wǎng)絡(luò) [8]。其模型的拓?fù)浣Y(jié)構(gòu)由輸入層、隱含層和輸出層三層構(gòu)成,如圖(3)所示,[a1~am]為輸入值,[b1~bn]為輸出值,[wij]為輸入層與隱含層間的權(quán)值,[wjk]為隱含層與輸出層權(quán)值。
該算法整體實(shí)現(xiàn)過程[9]為:依次計(jì)算隱含層和輸出層的輸出,當(dāng)這些值跟期望輸出值之間不相符時(shí),則將誤差反向向前傳遞,按誤差梯度下降的方法重新設(shè)定模型的權(quán)值和閾值,反復(fù)訓(xùn)練至達(dá)到設(shè)定的迭代次數(shù)或訓(xùn)練誤差達(dá)到期望值內(nèi),結(jié)束并完成訓(xùn)練,而后可用此訓(xùn)練好的模型對(duì)新的輸入值進(jìn)行預(yù)測(cè)或分類。BP神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的非線性映射能力,Robert Hecht?Nielson證明用三層的神經(jīng)網(wǎng)絡(luò)可以逼近任意非線性函數(shù),故本文采用這種網(wǎng)絡(luò)結(jié)構(gòu)來完成實(shí)驗(yàn)。
2? 實(shí)驗(yàn)設(shè)計(jì)流程
圖片來源自微博“河南綠色中原”搜集到的鄭州2017年全年某一地點(diǎn)的圖片,每張圖片標(biāo)注有其空氣質(zhì)量類別,除去質(zhì)量很差的圖片共有338張,其中優(yōu)51張,良162張,輕度污染92張,重度污染33張,而用于訓(xùn)練和測(cè)試的圖片每類大概按3∶1的比例分配。
首先對(duì)所有的圖片以暗原色理論都求得其透射率,并按類別分別保存,效果如圖3所示。然后提取這些圖片的特征值用于BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和測(cè)試,這里選用的圖片特征值從圖形紋理方面的灰度共生矩陣中獲得。
灰度共生矩陣算法是基于圖像中某一灰度級(jí)結(jié)構(gòu)重復(fù)出現(xiàn)的概率情況來描述紋理信息[10?11],是分析圖像的局部模式和排列規(guī)則的基礎(chǔ)。根據(jù)灰度共生矩陣可計(jì)算提取出多個(gè)紋理特征值,這里選用其中3個(gè)常用的來作為透射率圖片的特征值:
1) 能量,也就是二階矩。它集中體現(xiàn)了圖像紋理的粗細(xì)度與均勻度。
2) 熵。若灰度共生矩陣的所有元素都具有較大的隨機(jī)性,那么熵較大。
3) 相關(guān)性。相關(guān)性可以描述共生矩陣中行元素或者列元素的相似度。
由每張透射率圖片分別得到0°,45°,90°,135°方向上的灰度共生矩陣,得到每個(gè)方向上的能量、熵和相關(guān)性數(shù)值后分別取均值作為這張透射率圖片的紋理特征值。部分值如表1所示。
本文選用三層BP神經(jīng)網(wǎng)絡(luò),由于每個(gè)輸入值都是有3個(gè)特征值,故輸入端口神經(jīng)元個(gè)數(shù)為3,輸出端口為4個(gè)類別的空氣質(zhì)量,即輸出神經(jīng)元個(gè)數(shù)為4,隱含層節(jié)點(diǎn)數(shù)為5,傳遞函數(shù)選對(duì)數(shù)S型轉(zhuǎn)移函數(shù),設(shè)置最大迭代次數(shù)、訓(xùn)練的目標(biāo)均方誤差和學(xué)習(xí)率分別為500,0.000 1和0.01。