岳瑩瑛 周菁菁
(蘭州資源環(huán)境職業(yè)技術(shù)大學(xué),甘肅 蘭州 730021)
目前,由于人為過度放牧、工業(yè)制造及各類自然災(zāi)害,導(dǎo)致生態(tài)系統(tǒng)逐漸失去平衡,進(jìn)而引發(fā)環(huán)境問題[1]。近年來,雖然國(guó)家加大對(duì)資源環(huán)境的管理和保護(hù)力度,但仍出現(xiàn)優(yōu)良資源匱乏的問題,并危及生態(tài)系統(tǒng)的平衡與穩(wěn)定。資源環(huán)境的健康檢測(cè)是實(shí)現(xiàn)生態(tài)環(huán)境保護(hù)和提升國(guó)內(nèi)生產(chǎn)總值的重要手段,因此相關(guān)領(lǐng)域的研究人員對(duì)其進(jìn)行深入研究,并提出多種針對(duì)資源環(huán)境的檢測(cè)方法,但現(xiàn)有的資源環(huán)境檢測(cè)方法在實(shí)際應(yīng)用中存在費(fèi)用高昂、檢測(cè)結(jié)果信息不完整的問題,導(dǎo)致其實(shí)際應(yīng)用價(jià)值無法充分發(fā)揮[2]。
圖像識(shí)別技術(shù)是人工智能的一個(gè)重要領(lǐng)域,利用該技術(shù)可實(shí)現(xiàn)對(duì)圖像資源對(duì)象的識(shí)別,從而實(shí)現(xiàn)對(duì)不同模式的目標(biāo)和對(duì)象的識(shí)別。該技術(shù)常被應(yīng)用于計(jì)算機(jī)、電力等領(lǐng)域中,其應(yīng)用效果十分可觀。但該技術(shù)在環(huán)境領(lǐng)域中的應(yīng)用相對(duì)較少,更未涉及資源環(huán)境監(jiān)測(cè)[3]。因此,為提升資源環(huán)境檢測(cè)的精度,本研究在圖像識(shí)別技術(shù)的基礎(chǔ)上,對(duì)其在資源環(huán)境檢測(cè)中的應(yīng)用展開研究。
為實(shí)現(xiàn)對(duì)環(huán)境資源的高精度檢測(cè),在開展相關(guān)研究前,對(duì)資源環(huán)境的高光譜圖像進(jìn)行針對(duì)性采集,高光譜圖像不僅涵蓋了被測(cè)對(duì)象的空間特征,還可描述被測(cè)物體的光譜波段信息[4]。為獲取高光譜圖像,本研究選用成像儀、掃描設(shè)備、支架、數(shù)據(jù)處理器、高精度分析儀等圖像獲取裝置來獲取相關(guān)圖像。采集過程如圖1所示。
圖1 高光譜圖像采集原理
為確保采集到的高光譜圖像能滿足資源環(huán)境檢測(cè)需求,應(yīng)在現(xiàn)有工作的基礎(chǔ)上,對(duì)設(shè)備進(jìn)行調(diào)試與選型,采集設(shè)備的具體型號(hào)和應(yīng)用中的技術(shù)參數(shù)見表1。
表1 高光譜圖像采集設(shè)備構(gòu)成與技術(shù)參數(shù)設(shè)計(jì)
將采集到的圖像保存到成像設(shè)備中,保存前對(duì)數(shù)據(jù)格式進(jìn)行調(diào)試,將圖像以BIL格式文件進(jìn)行保存,并對(duì)其進(jìn)行標(biāo)定處理。在采集過程中,反饋圖像極易受自然光線、環(huán)境等因素的影響,會(huì)出現(xiàn)異?,F(xiàn)象,為確保反饋圖像具有較高的精度,可在現(xiàn)有工作的基礎(chǔ)上,對(duì)反饋圖像進(jìn)行校正,該過程被稱為高光譜采集圖像的標(biāo)定過程[5]。對(duì)此過程進(jìn)行描述,見式(1)。
式中:R為高光譜采集圖像的標(biāo)定或校正處理過程;I為采集到的原始項(xiàng);B為校正或標(biāo)定處理參數(shù);W為校正模板。按照上述方式來對(duì)采集到的圖像進(jìn)行采集與標(biāo)定處理。
在完成上述設(shè)計(jì)后,使用ENV15.3工具來提取對(duì)圖像中感興趣的區(qū)域。由于采集到的樣本圖像所在的位置高度不一致,會(huì)導(dǎo)致資源環(huán)境高光譜圖像出現(xiàn)散射問題,導(dǎo)致原有的光譜變化效應(yīng)被覆蓋[6]。因此,在上述內(nèi)容的基礎(chǔ)上,對(duì)標(biāo)定圖像進(jìn)行散射處理。在此過程中,計(jì)算出樣本圖像的光譜值,將此數(shù)值作為參照,計(jì)算多項(xiàng)式回歸系數(shù),采用平滑濾波處理的方式對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,見式(2)。
式中:I為資源環(huán)境檢測(cè)數(shù)據(jù)的預(yù)處理;β為平滑濾波處理;K為圖像中多項(xiàng)式回歸系數(shù);J為圖像中的感興趣區(qū)域覆蓋面積。在此基礎(chǔ)上,對(duì)圖像進(jìn)行歸一和約束處理,導(dǎo)出數(shù)據(jù),將其作為完成預(yù)處理后的環(huán)境資源檢測(cè)數(shù)據(jù)。
在完成資源環(huán)境檢測(cè)數(shù)據(jù)進(jìn)行預(yù)處理后,利用圖像識(shí)別技術(shù)對(duì)獲取到的光譜圖像進(jìn)行類別劃分。利用PCA白化技術(shù)對(duì)經(jīng)過處理后的高光譜數(shù)據(jù)進(jìn)行特征提取,并選擇其中具有代表性的重要波段來代替原有數(shù)據(jù)[7]。將SVM作為圖像分類器,在1到6的范圍內(nèi)對(duì)主成分量不斷進(jìn)行選擇。結(jié)合分類結(jié)果的準(zhǔn)確率來確定最優(yōu)的主成分參數(shù)。在確定主成分參數(shù)時(shí),若分類結(jié)果的主成分連續(xù)增加,但分類的正確率沒有增加,則表示此時(shí)對(duì)應(yīng)的數(shù)值為最佳主成分?jǐn)?shù)值[8]。利用PCA白化技術(shù)對(duì)光譜圖像進(jìn)行變換后,在降低數(shù)據(jù)維度的同時(shí),也保留圖像中的大部分信息。在分類過程中,SVM圖像分類器的核函數(shù)見式(3)。
式中:L(a,ai)為SVM圖像分類器的核函數(shù);a為光譜圖像中的元素;ai為與a相鄰的光譜元素;為徑向基系數(shù)。利用SVM圖像分類器核函數(shù)對(duì)不同特征進(jìn)行映射。在映射過程中,可利用SVM圖像分類器對(duì)光譜圖像的二分類問題進(jìn)行處理。針對(duì)不同的光譜圖像,可采用多個(gè)SVM圖像分類器相結(jié)合的方式來實(shí)現(xiàn)。由于通過資源環(huán)境檢測(cè)技術(shù)得到的圖像有著HSI數(shù)值維度較高、特征較多及數(shù)據(jù)信息量較大的特點(diǎn),可采用SVM圖像分類器中的ovo模式,即對(duì)光譜圖像進(jìn)行一對(duì)一的分類識(shí)別模式[9]。假設(shè)在經(jīng)過預(yù)處理后得到的特征數(shù)據(jù)中存在i類和j類數(shù)據(jù)(其中i的取值小于j的取值),則針對(duì)i類和j類數(shù)據(jù)構(gòu)建一個(gè)分類器。在完成映射后,通過映射結(jié)果來區(qū)別不同的光譜圖像。將完成分類的光譜圖像特征數(shù)據(jù)擴(kuò)展到更多維度的空間中,并完成對(duì)高光譜圖像的構(gòu)建。高光譜圖像的計(jì)算公式見式(4)。
式中:D(X,Y)為多維度D中數(shù)據(jù)點(diǎn)X與數(shù)據(jù)點(diǎn)Y之間的距離;X1,…,Xn為數(shù)據(jù)X在1~n維度空間上每一個(gè)維度上的大?。籝1,…,Yn為數(shù)據(jù)Y在1~n維度空間上每一個(gè)維度上的大小。根據(jù)公式(4)可在計(jì)算機(jī)中完成對(duì)多個(gè)不同資源環(huán)境區(qū)域光譜圖像的分類,為后續(xù)資源環(huán)境區(qū)域面積的檢測(cè)與識(shí)別提供依據(jù)。
在完成對(duì)光譜圖像分類后,對(duì)資源環(huán)境區(qū)域面積進(jìn)行檢測(cè)。通過實(shí)地考察獲取到的資源環(huán)境光譜圖像的類別較多,且數(shù)據(jù)量較大,在檢測(cè)過程中極易出現(xiàn)冗余現(xiàn)象,可通過F-SVD與XGBoost相結(jié)合的方式來解決檢測(cè)過程中的常見問題。將完成分類的光譜圖像投影到維度更低的空間中,以此來避免維數(shù)災(zāi)難問題的發(fā)生,同時(shí)實(shí)現(xiàn)對(duì)光譜圖像特征的提取,并將損失的信息量盡可能降到最低[10]。通過FSVD、XGBoost來挖掘原始數(shù)據(jù)中包含的少數(shù)互不關(guān)聯(lián)的潛在變量數(shù)據(jù),利用其來實(shí)現(xiàn)對(duì)原有變量的反應(yīng),從而實(shí)現(xiàn)降低高光譜的維度。假設(shè)通過上述分類后得到的高光譜圖像分類數(shù)為W,波段數(shù)量為V,則其原始變量可表示為Q=(q1,q2,…,qv),其公共因子可表示為F,F(xiàn)=(f1,f2,…,f u),其中u的取值小于v的取值。將原始變量W進(jìn)行分組,并使組內(nèi)具有高相關(guān)性、組間具有低相關(guān)性,利用有限的u個(gè)公共因子來表示原數(shù)據(jù)中的大部分信息,并得到如式(5)所示的公式。
式中:B為因子載荷矩陣;ε為特殊因子。將經(jīng)過處理后得到的資源環(huán)境圖像代入到XGBoost當(dāng)中,并對(duì)XGBoost中的參數(shù)進(jìn)行設(shè)置,具體設(shè)置見表2。
按照表2中的內(nèi)容對(duì)XGBoost中的參數(shù)進(jìn)行設(shè)置,從而識(shí)別出資源環(huán)境圖像中屬于資源環(huán)境的區(qū)域面積,并進(jìn)行標(biāo)記。根據(jù)標(biāo)記結(jié)果,并結(jié)合幾何面積的計(jì)算公式,從而確定資源環(huán)境的具體面積,以此來實(shí)現(xiàn)對(duì)資源環(huán)境的檢測(cè)。
表2 XGBoost參數(shù)設(shè)置表
在完成對(duì)資源環(huán)境檢測(cè)方法的理論設(shè)計(jì)后,為進(jìn)一步驗(yàn)證該方法在實(shí)際應(yīng)用中的可行性,將該方法應(yīng)用到某自然生態(tài)環(huán)境中,將該自然生態(tài)環(huán)境作為試驗(yàn)環(huán)境,并對(duì)其進(jìn)行資源環(huán)境檢測(cè)。在實(shí)地勘察中,通過拍攝方式獲取該自然生態(tài)環(huán)境中的2 000張圖像,將其作為研究對(duì)象。利用本研究提出的基于圖像識(shí)別技術(shù)的檢測(cè)方法對(duì)獲取到的2 000張圖像進(jìn)行識(shí)別,為了對(duì)檢測(cè)效果進(jìn)行評(píng)價(jià),選擇OA值作為對(duì)檢測(cè)精度評(píng)價(jià)的量化指標(biāo),OA值為圖像正確分類樣本數(shù)與總樣本數(shù)的比值。OA值越大,則說明正確分類的樣本數(shù)越多,越能促進(jìn)檢測(cè)精度的提高;反之,OA值越小,則說明正確分類的樣本數(shù)越少,越無法促進(jìn)檢測(cè)精度的提升。OA值的計(jì)算公式見式(6)。
式中:T為正確分類識(shí)別的資源環(huán)境圖像數(shù)量;W為樣本中需要進(jìn)行分類識(shí)別的資源環(huán)境圖像數(shù)量。從公式(6)的進(jìn)一步分析中得出,OA值最小為0、最大為1。根據(jù)公式(6)可計(jì)算出OA的具體數(shù)值。按照OA值與檢測(cè)精度的關(guān)系,計(jì)算出2 000張圖像的檢測(cè)結(jié)果,具體情況見表3。
由表3中的檢測(cè)結(jié)果數(shù)據(jù)的精度可以看出,利用本研究提出的基于圖像識(shí)別技術(shù)的檢測(cè)方法在對(duì)樣本數(shù)量從200張到2 000張圖像進(jìn)行分類識(shí)別時(shí),其OA數(shù)值始終在0.94及以上,因此該檢測(cè)方法的精度達(dá)到極高水平。
表3 基于圖像識(shí)別技術(shù)檢測(cè)方法檢測(cè)精度OA值記錄表
由于自然資源環(huán)境中存在著較多的不確定因素,無法通過人為的方式進(jìn)行控制,因此在基于圖像識(shí)別技術(shù)的檢測(cè)方法檢測(cè)精度的基礎(chǔ)上,引入Kappa系數(shù),利用這個(gè)以混淆矩陣為基礎(chǔ)的評(píng)價(jià)參數(shù),對(duì)本研究所提出的檢測(cè)方法的檢測(cè)精度進(jìn)行更深入的評(píng)價(jià)分析,以此也能夠進(jìn)一步提高此次實(shí)例應(yīng)用分析的客觀性和可靠性。Kappa系數(shù)的計(jì)算公式如式(7)所示。
式中:N為需要進(jìn)行識(shí)別檢測(cè)的圖像樣本數(shù)量;xii為利用本研究所提出的檢測(cè)方法正確檢測(cè)識(shí)別的樣本數(shù)量;xi+為各行之和;x+i為各列之和;n為行或列。結(jié)合公式(7),明確Kappa的取值為0~1,Kappa值越大,則說明檢測(cè)精度越高;反之,Kappa值越小,則說明檢測(cè)精度越低。根據(jù)上述理論,再將通過Kappa計(jì)算公式得到的結(jié)果進(jìn)行記錄,如表4所示。
表4 基于圖像識(shí)別技術(shù)檢測(cè)方法檢測(cè)精度Kappa值記錄表
與表3相比,表4中的Kappa值盡管在數(shù)值上出現(xiàn)了略微的降低,但在環(huán)境檢測(cè)精度上,Kappa值仍在0.90以上,符合對(duì)資源環(huán)境檢測(cè)的精度要求。綜上所述,本研究所提出的檢測(cè)方法在實(shí)際應(yīng)用中具備極高的檢測(cè)精度,可對(duì)資源環(huán)境的管理和整治提供更有利的技術(shù)條件,從而實(shí)現(xiàn)對(duì)自然資源的保護(hù)。
當(dāng)前,各類科技快速發(fā)展及全球化步伐的加快,環(huán)境問題也在不斷加劇,大氣污染、土地荒漠、地震等都是由資源浪費(fèi)而造成的環(huán)境問題。此類問題的產(chǎn)生,不僅會(huì)影響到人類的正常生活,同時(shí)還會(huì)對(duì)國(guó)家經(jīng)濟(jì)的發(fā)展產(chǎn)生嚴(yán)重影響。對(duì)此,為強(qiáng)化資源環(huán)境保護(hù)能力和水平,引入圖像識(shí)別技術(shù),對(duì)資源環(huán)境檢測(cè)方法進(jìn)行設(shè)計(jì)研究,并通過試驗(yàn)對(duì)該方法的可行性進(jìn)行檢驗(yàn)。將該方法應(yīng)用于實(shí)際中,可準(zhǔn)確識(shí)別資源環(huán)境,并進(jìn)一步計(jì)算出具體覆蓋區(qū)域面積,為環(huán)境治理提供重要依據(jù)。