史 飛 飛,高 小 紅,楊 靈 玉,賈 偉,何 林 華
(青海師范大學(xué)生命與地理科學(xué)學(xué)院,青海省自然地理與環(huán)境過(guò)程重點(diǎn)實(shí)驗(yàn)室,青藏高原環(huán)境與資源教育部重點(diǎn)實(shí)驗(yàn)室,青海 西寧 810008)
基于地面高光譜數(shù)據(jù)的典型作物類(lèi)型識(shí)別方法
——以青海省湟水流域?yàn)槔?/p>
史 飛 飛,高 小 紅*,楊 靈 玉,賈 偉,何 林 華
(青海師范大學(xué)生命與地理科學(xué)學(xué)院,青海省自然地理與環(huán)境過(guò)程重點(diǎn)實(shí)驗(yàn)室,青藏高原環(huán)境與資源教育部重點(diǎn)實(shí)驗(yàn)室,青海 西寧 810008)
高光譜技術(shù)運(yùn)用于農(nóng)作物識(shí)別與分類(lèi)目前已成為農(nóng)業(yè)遙感應(yīng)用領(lǐng)域前沿課題之一。使用ASD FieldSpec4地物光譜儀實(shí)測(cè)青海省湟水流域大豆、青稞、土豆、小麥和油菜5種典型作物冠層光譜,經(jīng)數(shù)據(jù)預(yù)處理,利用1/R、d(R)、N(R)、log(R)、d(log(R))、d(N(R))6種光譜數(shù)據(jù)變換形式和在“綠峰”、“紅谷”、“紅邊”、“光譜吸收特征區(qū)”提取的16種光譜特征變量的6種選取結(jié)果,分別構(gòu)建基于BP神經(jīng)網(wǎng)絡(luò)的典型作物類(lèi)型識(shí)別模型,通過(guò)模型精度比較以尋求用于高光譜農(nóng)作物分類(lèi)的有效光譜數(shù)據(jù)形式和光譜特征變量。結(jié)果表明:1/R、d(R)、log(R)、d(log(R))及d(N(R))5種數(shù)據(jù)變換形式能顯著提高模型識(shí)別精度,以d(N(R))變換數(shù)據(jù)構(gòu)建BPNN模型其辨識(shí)精度最高,總體分類(lèi)精度達(dá)88%;在提取的16種光譜特征變量中,以變量數(shù)分別為16、14、12的3種選取方案構(gòu)建BPNN模型其辨識(shí)精度較優(yōu),總體分類(lèi)精度分別為88%、86%、84%;BPNN模型能較好地識(shí)別5種作物光譜,且采用選取光譜特征變量方法構(gòu)建BPNN模型其網(wǎng)絡(luò)訓(xùn)練效率和模型穩(wěn)定性?xún)?yōu)于光譜數(shù)據(jù)變換方法構(gòu)建BPNN模型。
高光譜;作物識(shí)別;光譜變換;光譜特征變量; BPNN模型
作物識(shí)別和分類(lèi)是農(nóng)業(yè)遙感的基礎(chǔ),是實(shí)現(xiàn)農(nóng)業(yè)資源監(jiān)測(cè)的關(guān)鍵,實(shí)時(shí)、準(zhǔn)確地獲取作物類(lèi)型、結(jié)構(gòu)和分布信息對(duì)于國(guó)家糧食安全、社會(huì)經(jīng)濟(jì)穩(wěn)定、農(nóng)業(yè)生態(tài)功能和服務(wù)均具有重要意義[1]。遙感技術(shù)與常規(guī)地面調(diào)查統(tǒng)計(jì)方法相比具有快速、高效和大面積同步觀(guān)測(cè)等特點(diǎn),已成為作物識(shí)別和分類(lèi)的主要技術(shù)手段[2]。傳統(tǒng)多光譜遙感受傳感器波段少、光譜分辨率低、植被光譜相似性的影響,無(wú)法獲得較高的作物類(lèi)型識(shí)別精度;而新興的高光譜技術(shù)通過(guò)獲取連續(xù)地物光譜信息,能在眾多窄波段范圍探測(cè)作物間細(xì)微的光譜差異,進(jìn)而準(zhǔn)確區(qū)分作物類(lèi)型[3]。近年來(lái)國(guó)內(nèi)外學(xué)者利用高光譜數(shù)據(jù)在作物識(shí)別與分類(lèi)方面已開(kāi)展了大量研究工作。Manjunath等[4]利用地面高光譜數(shù)據(jù),采用逐步判別法區(qū)分出油菜和干豆類(lèi)作物的最佳光譜波段分別集中在5.5~9.8 μm和7.5~9.6 μm;Rao等[5]利用高光譜數(shù)據(jù)建立了兩種自動(dòng)區(qū)分水稻、辣椒、甘蔗、棉花作物類(lèi)型的波譜庫(kù),總體分類(lèi)精度均達(dá)86%以上;Mahesh等[6]通過(guò)近紅外高光譜成像系統(tǒng),利用線(xiàn)性判別分析和二次判別分析,對(duì)5種含水量不同的小麥品種進(jìn)行分類(lèi),其分類(lèi)精度分別達(dá)61%和82%;邢東興等[7]通過(guò)地面實(shí)測(cè)7種果樹(shù)冠層光譜,利用數(shù)據(jù)重采樣和光譜變換,建立了區(qū)分果樹(shù)類(lèi)型的BPNN模型,其識(shí)別精度達(dá)86%;王長(zhǎng)耀等[8]利用MAIS成像光譜儀數(shù)據(jù),采用遺傳算法優(yōu)選最佳波段,通過(guò)Fuzzy-Artmap分類(lèi)器進(jìn)行小麥品種識(shí)別,總體分類(lèi)精度達(dá)97%。上述研究表明將高光譜技術(shù)運(yùn)用于作物識(shí)別和分類(lèi)具有獨(dú)特優(yōu)勢(shì)和廣泛應(yīng)用前景。
由于高光譜數(shù)據(jù)具有波段多、數(shù)據(jù)量大、信息冗余嚴(yán)重等特點(diǎn),因此在數(shù)據(jù)的應(yīng)用與處理中仍有許多問(wèn)題有待解決[9,10]。其中,如何選取有效的光譜數(shù)據(jù)形式和光譜特征變量已經(jīng)成為國(guó)內(nèi)外學(xué)者討論的重點(diǎn)[11]。針對(duì)該問(wèn)題Adam等[12,13]在濕地植被類(lèi)型識(shí)別方面以及宮鵬等[14]在森林樹(shù)種識(shí)別方面已進(jìn)行討論,結(jié)果表明:選取不同的光譜數(shù)據(jù)形式和光譜特征變量對(duì)分類(lèi)器的識(shí)別效率和精度均有直接影響。但目前在農(nóng)作物識(shí)別分類(lèi)方面對(duì)于此類(lèi)問(wèn)題研究較少,同時(shí)對(duì)高海拔地區(qū)分布的青稞、大豆、土豆、油菜等進(jìn)行高光譜作物分類(lèi)也鮮有報(bào)道。
本文以青海省湟水流域?yàn)檠芯繀^(qū),以流域內(nèi)5種作物冠層光譜為研究對(duì)象,經(jīng)數(shù)據(jù)預(yù)處理,利用光譜變換數(shù)據(jù)和光譜特征變量選取數(shù)據(jù)分別構(gòu)建BPNN識(shí)別模型,進(jìn)而對(duì)模型建模效果和驗(yàn)證精度進(jìn)行對(duì)比分析,探討用于作物分類(lèi)的有效光譜數(shù)據(jù)變換形式和光譜特征變量,為今后高光譜遙感數(shù)據(jù)廣泛應(yīng)用于農(nóng)業(yè)監(jiān)測(cè)提供方法支持。
1.1 研究區(qū)概況
湟水流域位于青海省東北部,為青藏高原與黃土高原過(guò)渡帶(36°02′~37°28′N(xiāo),100°42′~103°04′E),流域面積16 120 km2,海拔1 656~4 855 m(圖1)。流域地形以黃土丘陵、溝壑地貌為主,同時(shí)有中、高山地分布,氣候?qū)儆诘湫偷臏貛Т箨懶詺夂?。流域川水區(qū)(海拔<2 600 m)土壤肥沃,為主要農(nóng)業(yè)區(qū),廣泛種植小麥、油菜、大豆、土豆作物,土壤以灌溉型栗鈣土為主;淺山區(qū)(2 600~3 200 m)土壤貧瘠,耕地零星分布,荒山禿嶺居多,以種植青稞、油菜等作物為主,土壤多為紅、黃、灰栗鈣土;腦山區(qū)(海拔>3 200 m)多為草地,少量分布森林,土壤以暗栗鈣土、黑鈣土和山地草甸土為主。湟水流域是青海省政治、經(jīng)濟(jì)、文化、教育中心,也是省內(nèi)最大的糧食、蔬菜和果品生產(chǎn)基地[15]。
圖1 研究區(qū)概況與采樣點(diǎn)分布Fig.1 Location of the study area and distribution of sampling points
1.2 數(shù)據(jù)采集與預(yù)處理
光譜數(shù)據(jù)采集使用ASD FieldSpec4地物光譜儀,采樣時(shí)間為2014年7-8月,在晴朗無(wú)云、風(fēng)力小的天氣測(cè)量,測(cè)量時(shí)間為11:00-15:00。觀(guān)測(cè)時(shí)探頭垂直向下距離植被冠層0.7 m,儀器每15 min白板校正一次,每個(gè)測(cè)點(diǎn)測(cè)定4個(gè)方向,每次記錄5條光譜。利用數(shù)碼相機(jī)于植被正上方0.7 m處拍攝植被冠層圖像,用于記錄作物長(zhǎng)勢(shì)和健康狀況,利用GPS獲取測(cè)點(diǎn)的地理坐標(biāo)和海拔高度。
數(shù)據(jù)預(yù)處理,首先利用Savitzky-Golay方法,通過(guò)試驗(yàn)選用窗口為7的三次多項(xiàng)式進(jìn)行平滑去噪處理;其次剔除光譜數(shù)據(jù)中受水汽吸收影響強(qiáng)烈波段[16](1 350~1 400 nm、1 800~1 950 nm、2 400~2 500 nm);最后對(duì)光譜數(shù)據(jù)做平均處理,即將每個(gè)樣點(diǎn)采集的20條光譜求取平均值。經(jīng)數(shù)據(jù)預(yù)處理共獲得5種作物光譜129條,采用分層隨機(jī)抽樣法,對(duì)每種作物光譜數(shù)據(jù)按2∶1選取訓(xùn)練樣本和驗(yàn)證樣本,獲得訓(xùn)練樣本86條,驗(yàn)證樣本43條。
2.1 光譜數(shù)據(jù)變換
研究表明光譜變換方法能有效改善分類(lèi)器的識(shí)別精度[9]。本文采用6種光譜變換方法,分別為d(R)(一階微分變換)、log(R)(對(duì)數(shù)變換)、d(log(R))(對(duì)數(shù)一階微分變換)、N(R)(歸一化變換)、d(N(R))(歸一化一階微分變換)、1/R(倒數(shù)變換)。
2.2 光譜特征變量選取
植被光譜中一些顯著的反射和吸收特征,常采用光譜指數(shù)、光譜導(dǎo)數(shù)、光譜重排等方法進(jìn)行提取,本文采用光譜微分和連續(xù)統(tǒng)去除進(jìn)行光譜特征變量提取,運(yùn)用相關(guān)性分析和主成分分析選取光譜特征變量,最后利用單因素方差分析對(duì)選定的光譜特征變量進(jìn)行區(qū)分度驗(yàn)證。
2.2.1 光譜微分法 光譜微分通過(guò)數(shù)學(xué)模擬反射光譜和求取不同階數(shù)微分值,以迅速確定光譜彎曲點(diǎn),提取反射和吸收峰參數(shù)[9]。在實(shí)際應(yīng)用中,低階微分對(duì)噪聲敏感性較低,使用更為廣泛。本文采用一階光譜微分,其計(jì)算式如下:
(1)
式中:λi為波段波長(zhǎng);ρ′(λi)為波長(zhǎng)λi的一階導(dǎo)數(shù)。
2.2.2 連續(xù)統(tǒng)去除法 連續(xù)統(tǒng)去除是將反射光譜吸收強(qiáng)烈的部分波段進(jìn)行轉(zhuǎn)換,放大其吸收特征,并在共同基線(xiàn)進(jìn)行比較,便于分析和提取光譜吸收特征[17]。根據(jù)連續(xù)統(tǒng)去除后的光譜可求取吸收深度(DEP)、吸收寬度(WID)、吸收面積(AREA)等特征參量,其公式如下:
DEP=1-CRmin
(2)
WID=λb-λa
(3)
AREA=DEP×WID
(4)
式中:CRmin為一個(gè)吸收谷內(nèi)連續(xù)統(tǒng)去除后最小光譜反射率,λa、λb分別為吸收起點(diǎn)、終點(diǎn)的波長(zhǎng)值。
2.3 模型構(gòu)建方法
人工神經(jīng)網(wǎng)絡(luò)(ANN)目前作為一種基于模式識(shí)別的數(shù)據(jù)挖掘技術(shù)引入高光譜分類(lèi)研究,以解決數(shù)據(jù)量大、含混度高和高度非線(xiàn)性的分類(lèi)和識(shí)別問(wèn)題[18]。本文以反向傳播神經(jīng)網(wǎng)絡(luò)模型(BPNN)為作物光譜分類(lèi)器,將BPNN模型設(shè)定三層(輸入層+隱含層+輸出層),能實(shí)現(xiàn)任意非線(xiàn)性映射滿(mǎn)足使用需求[13,18],利用MATLABR2010b軟件實(shí)現(xiàn)模型構(gòu)建。
2.4 模型精度評(píng)價(jià)
模型精度評(píng)價(jià)指標(biāo)采用決定系數(shù)(R2)、均方根誤差(RMSE)和相對(duì)分析誤差(RPD)。當(dāng)建模R2越接近1,RMSE越小,則訓(xùn)練模型越穩(wěn)定,精度越高;驗(yàn)證R2越接近1,RMSE越小,RPD越大,則預(yù)測(cè)模型越穩(wěn)定、精度越高、預(yù)測(cè)能力越強(qiáng),公式如下:
(5)
(6)
RPD=STD(Xi)/RMSE
(7)
3.1 光譜變換結(jié)果分析
利用6種光譜變換方法改變光譜數(shù)據(jù)形式,結(jié)果如圖2。通過(guò)與原始光譜對(duì)比分析結(jié)果表明:d(R)變換凸顯了光譜曲線(xiàn)變化速率,限制了低頻背景噪聲,但也增強(qiáng)了植被光譜首尾范圍高階噪聲的擾動(dòng)。變換后5種作物光譜較為接近且僅在520nm、720nm、1 150nm、1 330nm和1 550nm光譜最值點(diǎn)處各類(lèi)型區(qū)分度明顯;log(R)變換增強(qiáng)了可見(jiàn)光范圍光譜間差異,減少了光照條件引起的乘性因素影響[14]。變換后作物類(lèi)型在可見(jiàn)光峰谷處(550nm和680nm)、光譜高值區(qū)域(750~1 300nm)和水吸收谷(1 450 nm)處區(qū)分明顯;d(log(R))變換具有l(wèi)og(R)和d(R)變換綜合作用效果,變換后可見(jiàn)光區(qū)光譜差異較d(R)變換顯著增強(qiáng),作物類(lèi)型區(qū)分明顯,但該變換過(guò)分放大了光譜首尾范圍處的噪聲;N(R)變換完全消除了光照條件差異對(duì)光譜的影響[14],使不同作物光譜在“爬升脊”(700~750 nm)處趨于一致,變換后光譜形態(tài)與原數(shù)據(jù)極為相似,僅在550 nm和1 700 nm波段處作物類(lèi)型可分;d(N(R))變換能去除光照變化、低頻噪聲和近線(xiàn)性背景影響[14],變換結(jié)果與d(R)變換相似,但在光譜“波峰波谷”處類(lèi)型區(qū)分更加明顯;1/R變換放大了可見(jiàn)光區(qū)光譜差異,削弱了光譜中的水分吸收強(qiáng)烈?guī)?,光譜形態(tài)改變較大并在400 nm處作物類(lèi)型區(qū)分明顯。
圖2 作物光譜變換結(jié)果Fig.2 The results of spectral transformation of crops
對(duì)光譜變換后數(shù)據(jù)與原數(shù)據(jù)的相關(guān)性分析結(jié)果如圖3所示。分析發(fā)現(xiàn)1/R和log(R)變換光譜與原光譜在350~2 400 nm范圍高度相關(guān),說(shuō)明兩種變換方法有好的數(shù)據(jù)保真性,但也因此保留了原數(shù)據(jù)中大量冗余信息和噪聲;N(R)變換降低700~1 100 nm范圍與原數(shù)據(jù)相關(guān)性,而與剩余波段范圍仍呈高度相關(guān),說(shuō)明該變換具有壓縮部分波段數(shù)據(jù)的能力;對(duì)d(R)、d(log(R))和d(N(R))變換進(jìn)行相關(guān)分析均表現(xiàn)為僅在部分窄波段范圍與原數(shù)據(jù)高度相關(guān),而在剩余波段則呈低相關(guān),說(shuō)明上述3種方法能保留原數(shù)據(jù)部分光譜特征信息而對(duì)大部分?jǐn)?shù)據(jù)進(jìn)行壓縮。
圖3 相關(guān)性分析Fig.3 Correlation analysis
3.2 光譜特征變量選取結(jié)果分析
3.2.1 光譜變量提取結(jié)果分析 利用光譜微分和連續(xù)統(tǒng)去除分析5種作物光譜的反射和吸收特征,發(fā)現(xiàn)在可見(jiàn)光至近紅外波段的綠峰(510~560 nm)、紅谷(650~690 nm)、紅邊(680~760 nm)、藍(lán)光區(qū)葉綠素吸收帶(400~530 nm)、紅光區(qū)葉綠素吸收帶(550~730 nm)、水弱吸收帶(930~1 000 nm)、水和氧窄吸收帶(1 100~1 250 nm)及水和二氧化碳強(qiáng)吸收帶(1 450~1 550 nm)為識(shí)別作物類(lèi)型的主要光譜特征區(qū)域。利用MATLAB軟件在綠峰、紅谷、紅邊區(qū)域提取綠峰幅值(Rg)、綠峰位置(WP_g)、紅谷幅值(Ro)、紅谷位置(WP_ro)、紅邊幅值(Dr)和紅邊位置(WP_r)6種微分特征變量,在5處光譜吸收帶提取吸收深度(DEP)和吸收面積(AREA)10種吸收特征變量,其統(tǒng)計(jì)結(jié)果如表1所示。
表1 作物特征變量統(tǒng)計(jì)Table 1 Statistical of feature variables of crops
在6種微分特征變量中WP_r、WP_g、WP_ro變異系數(shù)較小,最大僅為1.056%,表明該變量能描述5種作物中普遍且穩(wěn)定的光譜特征;Rg、Dr、Ro變異系數(shù)較大,說(shuō)明其數(shù)據(jù)內(nèi)部離散度高,由圖4進(jìn)一步比較作物的Rg、Dr、Ro均值,發(fā)現(xiàn)其數(shù)值差異明顯,表明3種特征變量能有效區(qū)分作物類(lèi)型;5種作物類(lèi)型中油菜的Rg和Ro值最大,而大豆的Rg和Ro值最小,這與采樣時(shí)油菜處于開(kāi)花期前期而大豆為節(jié)莢期后期,其不同生長(zhǎng)階段植被冠層葉片內(nèi)葉綠素含量有關(guān);土豆的Dr、Rg值較大可能與土豆為開(kāi)花期且土豆葉片較寬大有關(guān);青稞和小麥植被光譜曲線(xiàn)整體較為相似,但其Dr、Rg、Ro值存在差異,原因?yàn)閮煞N作物存在短暫的種植時(shí)差,其部分光譜特征必然存在差異。在10種吸收特征變量中DEP-980、DEP-1 200、AREA-500、AREA-980、AREA-1 200變異系數(shù)較大,剩余變量變異系數(shù)小于10%。由圖5分析10種變量在5種作物類(lèi)型間的均值發(fā)現(xiàn),除AREA-680均值差異不明顯,其余變量差異顯著,均為有效的作物類(lèi)型識(shí)別特征變量。
圖4 光譜微分特征變量Fig.4 First-derivative feature variables of crops
3.2.2 光譜特征變量選取結(jié)果 為選取信息貢獻(xiàn)率高且獨(dú)立性好的特征變量,首先計(jì)算相關(guān)系數(shù)矩陣表明:1)AREA-680、DEP-500和DEP-680,2)AREA-980、AREA-1 200、DEP-980和DEP-1 200,3)AREA-1 450與DEP-1 450,3組數(shù)據(jù)內(nèi)部?jī)烧唛g相關(guān)系數(shù)均達(dá)0.8以上,表明該變量間存在嚴(yán)重?cái)?shù)據(jù)冗余。其次采用主成分分析提取4個(gè)主成分,其累計(jì)貢獻(xiàn)率達(dá)87.4%,由成分矩陣分析表明:DEP-980、DEP-1 200、AREA-980、AREA-1 200對(duì)第一主成分,DEP-500、DEP-680、AREA-680對(duì)第二主成分,Rg、Ro對(duì)第三主成分,WP_g、Dr對(duì)第四主成分,信息貢獻(xiàn)率高。綜上選取特征變量時(shí)在3組相關(guān)性高的數(shù)據(jù)中保留信息貢獻(xiàn)率高的特征變量,而逐步剔除其余變量,最終得到6種特征變量選取方案。為進(jìn)一步驗(yàn)證所選取的特征變量是否具有較好的區(qū)分度,本文利用單因素方差分析法進(jìn)行評(píng)價(jià),結(jié)果如表2和圖6所示,圖中區(qū)分度定義為某一特征變量能夠區(qū)分5種作物類(lèi)型的任意兩種則其區(qū)分度每次累加1。在0.05的置信水平下,16種特征變量總體呈現(xiàn)較好的可分性,但相互間也存在較大的差異,Rg和Dr區(qū)分度最大達(dá)18,AREA-1 450區(qū)分度最小為8。
圖5 作物吸收特征變量Fig.5 Absorption feature variables of crops
表2 光譜特征變量選取結(jié)果Table 2 The result of spectral characteristic variables selected
3.3 模型辨識(shí)結(jié)果分析
以三層BPNN模型為分類(lèi)器,訓(xùn)練前采用premnmx函數(shù)對(duì)訓(xùn)練和驗(yàn)證樣本數(shù)據(jù)歸一化處理,采用newff函數(shù)網(wǎng)絡(luò)初始化。通過(guò)反復(fù)試驗(yàn)確定隱含層節(jié)點(diǎn)數(shù):17-25,隱含層傳遞函數(shù):tansig,輸出層傳遞函數(shù):purelin,訓(xùn)練方法:traincgf,能獲得穩(wěn)定的訓(xùn)練和驗(yàn)證精度。網(wǎng)絡(luò)中學(xué)習(xí)速率:0.01,允許誤差:10-5,訓(xùn)練迭代次數(shù):1 000。
圖6 單因素方差分析結(jié)果Fig.6 The result of single factor analysis of variance
3.3.1 基于光譜數(shù)據(jù)變換的BPNN辨識(shí)結(jié)果分析 以6種作物光譜變換數(shù)據(jù)為模型輸入,其對(duì)應(yīng)的作物類(lèi)型編碼為輸出,利用精度評(píng)價(jià)指標(biāo)對(duì)網(wǎng)絡(luò)訓(xùn)練效果予以評(píng)價(jià),最優(yōu)訓(xùn)練結(jié)果如表3。
表3 BPNN模型精度Table 3 The accuracy of BPNN model
分析發(fā)現(xiàn),經(jīng)1/R、log(R)、d(R)、d(log(R))、d(N(R))變換構(gòu)建BPNN模型其建模和辨識(shí)效果優(yōu)于原光譜數(shù)據(jù)(R)建模,模型的RPD均在2.50以上,RMSE小于0.55,建模R2大于0.95,驗(yàn)證R2大于0.84,說(shuō)明5種模型均具有好的建模、驗(yàn)證精度和極好的預(yù)測(cè)能力。d(R)變換其模型建模和驗(yàn)證R2相比原始光譜(R)建模提高0.04,而d(N(R))和d(log(R))變換能獲得更高的訓(xùn)練和驗(yàn)證精度,d(N(R))變換模型訓(xùn)練和驗(yàn)證R2分別為0.98和0.89,提高約0.07,RPD為2.93,該模型的穩(wěn)定性和辨識(shí)能力為最優(yōu)。d(log(R))變換的建模和辨識(shí)效果僅次于d(N(R))變換。上述3種變換能顯著改善模型識(shí)別效果,與該變換能降低測(cè)量環(huán)境噪聲或擴(kuò)大某波段范圍內(nèi)光譜差異,同時(shí)也能保留部分原光譜信息并對(duì)其他波段數(shù)據(jù)有效壓縮有關(guān)。采用1/R和log(R)變換的模型辨識(shí)效果與d(R)變換較為接近,3種變換的建模R2相同,但1/R和log(R)變換的驗(yàn)證R2低于d(R)變換,綜合模型穩(wěn)定性和預(yù)測(cè)能力,在3種方法中d(R)變換效果優(yōu)于log(R)優(yōu)于1/R。上述兩種變換能改善模型識(shí)別效果與該變換均能放大可見(jiàn)光區(qū)的光譜差異有關(guān)。6種變換方法中采用N(R)變換后模型的辨識(shí)能力和穩(wěn)定性最差,其建模R2為0.97,但驗(yàn)證R2僅為0.76??赡苁窃摲椒ㄔ鰪?qiáng)了網(wǎng)絡(luò)訓(xùn)練對(duì)光譜差異的敏感度,同時(shí)采用小的訓(xùn)練樣本進(jìn)行網(wǎng)絡(luò)訓(xùn)練雖能獲得好的建模精度,但由于小樣本缺乏對(duì)整體樣本的代表性,BP網(wǎng)絡(luò)可能失去對(duì)新樣本的外推能力[8]。
3.3.2 基于光譜特征變量選取的BPNN辨識(shí)結(jié)果分析 以6種光譜特征變量選取結(jié)果作為模型輸入,其對(duì)應(yīng)的作物類(lèi)型編碼為輸出,利用精度評(píng)價(jià)指標(biāo)對(duì)網(wǎng)絡(luò)訓(xùn)練效果予以評(píng)價(jià),最優(yōu)訓(xùn)練結(jié)果如表4。
表4 BPNN模型精度Table 4 The accuracy of BPNN model
分析發(fā)現(xiàn),方案1的模型辨識(shí)效果最好,其建模R2為0.98,驗(yàn)證R2為0.91,RPD為3.3,模型的建模和驗(yàn)證精度較高,具有較好的模型穩(wěn)定性和極好的預(yù)測(cè)能力;方案2引入14個(gè)變量,模型的訓(xùn)練和驗(yàn)證R2分別為0.98和0.88,RPD為2.87,該模型總體辨識(shí)效果與方案1相近,說(shuō)明當(dāng)剔除一些冗余度高且信息貢獻(xiàn)率低的特征變量時(shí)對(duì)模型辨識(shí)精度影響較小;方案3變量數(shù)為12,模型的建模R2為0.90,驗(yàn)證R2為0.88,RPD為2.58,模型仍具有較好的建模效果和預(yù)測(cè)能力,原因?yàn)樗蕹奶卣髯兞咳詾闊o(wú)效變量,模型的建模精度下降與模型輸入數(shù)據(jù)減少有關(guān);方案4-6因過(guò)度剔除特征變量,模型中用于分類(lèi)的可用信息過(guò)少致使模型穩(wěn)定性和精度顯著下降,已不能作為有效的分類(lèi)模型。
3.4 作物光譜辨識(shí)度分析
為分析5種農(nóng)作物光譜的辨識(shí)度,選取文中已訓(xùn)練的9種BPNN分類(lèi)模型,載入驗(yàn)證樣本數(shù)據(jù)并對(duì)模型的辨識(shí)結(jié)果統(tǒng)計(jì)如表5和圖7。
分析表明,5種作物光譜在9種BPNN模型中其識(shí)別精度存在差異,但也表現(xiàn)出一定規(guī)律,如油菜、大豆和土豆作物在9種BPNN模型均具有較高的生產(chǎn)精度,表明上述3種作物光譜差異明顯,不易混淆,這與3種作物本身植被形態(tài)、葉片結(jié)構(gòu)存在較大差異有關(guān)。小麥和青稞易相互混淆,其被模型準(zhǔn)確分類(lèi)效果最差,原因?yàn)榍囡c小麥同屬禾本科,植被形態(tài)以及葉片大小與結(jié)構(gòu)均較為相似,因而其光譜特征也十分接近。
表5 BPNN模型辨識(shí)精度Table 5 Identification accuracy of BPNN model
注:分類(lèi)精度是指模型的生產(chǎn)精度。
本文通過(guò)實(shí)測(cè)5種作物冠層光譜開(kāi)展其類(lèi)型識(shí)別研究,并針對(duì)光譜數(shù)據(jù)變換形式和光譜特征變量對(duì)分類(lèi)模型辨識(shí)精度的影響問(wèn)題重點(diǎn)討論。
首先,在遙感數(shù)據(jù)處理中,光譜數(shù)學(xué)變換特征一直備受關(guān)注[11]。文中采用數(shù)學(xué)變換方法改變光譜數(shù)據(jù)形式并構(gòu)建BPNN模型,能顯著提高作物類(lèi)型識(shí)別精度,但不同變換方法對(duì)光譜中噪聲的處理能力和對(duì)原光譜特征信息的提取程度不同,對(duì)于模型精度的提升存在差異;對(duì)作物光譜數(shù)據(jù)進(jìn)行微分處理能獲得86%的平均分類(lèi)精度,精度最大提升7%,而利用簡(jiǎn)單數(shù)據(jù)處理如1/R和log(R)變換,其平均分類(lèi)精度84%,精度最大提升3%;將簡(jiǎn)單數(shù)據(jù)處理與微分處理結(jié)合使用能獲得最佳的分類(lèi)精度,如6種變換中d(N(R))變換模型辨識(shí)效果最好,總體分類(lèi)精度88%,Kappa指數(shù)0.85。文中采用d(N(R))和d(log(R))兩種變換形式能取得好的識(shí)別效果,這與目前在濕地植被類(lèi)型識(shí)別、草種識(shí)別、森林和果樹(shù)樹(shù)種識(shí)別中得出的結(jié)論較為一致,表明該數(shù)據(jù)形式具有良好的適用性[12-14]。
其次,在植被光譜研究中某些光譜特征變量具有普適性,但不同類(lèi)型作物光譜受生長(zhǎng)期、冠層密度、葉片結(jié)構(gòu)等因素影響其適用性將有所不同[20]。對(duì)提取的16種光譜特征變量的適應(yīng)性進(jìn)行驗(yàn)證并經(jīng)選取構(gòu)建BPNN模型,在6種變量選取結(jié)果中,方案1-3的BPNN模型總體分類(lèi)精度分別為88%、86%、84%,表明該方法能有效降低光譜數(shù)據(jù)冗余,提高模型訓(xùn)練效率和精度;而方案4-6的BPNN模型總體分類(lèi)精度均低于70%,說(shuō)明在特征變量選取時(shí)剔除冗余度高且信息貢獻(xiàn)少的特征變量對(duì)分類(lèi)器精度影響不大,但模型引入變量過(guò)少則會(huì)導(dǎo)致BPNN模型識(shí)別精度和穩(wěn)定性迅速降低;對(duì)選取的16種特征變量分析表明具有良好的區(qū)分度和適用性,且為目前在植被研究中廣泛選取的特征參量,具有一定普適性,在今后將引入更多變量進(jìn)行討論。
最后,文中利用光譜數(shù)據(jù)形式變換結(jié)果與光譜特征變量選取結(jié)果構(gòu)建BPNN模型均能取得較好的辨識(shí)精度,但從模型的訓(xùn)練效率和穩(wěn)定性而言,采用光譜特征變量選取方法建模效果較優(yōu)。受采樣區(qū)域地形限制,本文樣本數(shù)量較少,可能在一定程度上影響模型識(shí)別精度,下一步將增加采樣點(diǎn)數(shù)量,同時(shí)結(jié)合地面實(shí)測(cè)光譜和高光譜影像開(kāi)展進(jìn)一步研究。
[1] 陳思寧,趙艷霞,申雙和.基于波譜分析技術(shù)的遙感作物分類(lèi)方法[J].農(nóng)業(yè)工程學(xué)報(bào),2012,28(5):154-160.
[2] 張群,胡春勝,陳素英,等.多時(shí)相遙感影像監(jiān)測(cè)冬小麥種植面積的變化研究[J].中國(guó)生態(tài)農(nóng)業(yè)學(xué)報(bào),2006,14(3):180-183.
[3] 楊可明,郭達(dá)志.植被高光譜特征分析及其病蟲(chóng)害信息提取研究[J].地理與地理信息科學(xué),2006,22(4):31-34.
[4] MANJUNATH K R,RAY S S,PANIGRAHY S.Discrimination of spectrally-close crops using ground-based hyperspectral data[J].Indian Society Remote Sense,2011,39(4):599-602.
[5] RAO N R,GARG P K,GHOSH S K.Development of an agricultural crops spectral library and classification of crops at cultivar level using hyperspectral data[J].Precision Agriculture,2007,8:173-185.
[6] MAHESH S,JAYAS D S,PALIWAL J,et al.Identification of wheat classes at different moisture levels using near-infrared hyperspectral images of bulk samples[J].Sense & Instrument Food Quality,2011,5:1-9.
[7] 邢東興,常慶瑞.基于花期果樹(shù)冠層光譜反射率的果樹(shù)樹(shù)種辨識(shí)研究[J].紅外與毫米波學(xué)報(bào),2009,28(3):207-211.
[8] 王長(zhǎng)耀,劉正軍,顏春燕.成像光譜數(shù)據(jù)特征選擇及小麥品種識(shí)別實(shí)驗(yàn)研究[J].遙感學(xué)報(bào),2006,10(2):249-255.
[9] 浦瑞良,宮鵬.高光譜遙感及其應(yīng)用[M].北京:高等教育出版社,2008.145-176.
[10] ULFARSSON M O,BENEDIKTSSON J A,SVEINSSON J R.Data fusion and feature extraction in the wavelet domain[J].International Journal of Remote Sensing,2003,24:3933-3945.
[11] 童慶禧,張兵,鄭蘭芬.高光譜遙感——原理技術(shù)與應(yīng)用[M].北京:高等教育出版社,2006.136-146.
[12] ELHADI A,ONISIMO M,DENIS R.Multispectral and hyperspectral remote sensing for identification and mapping of wetland vegetation[J].Wetlands Ecological Manage,2010,18:281-296.
[13] 林川,宮兆寧,趙文吉,等.基于光譜特征變量的濕地典型植物生態(tài)類(lèi)型識(shí)別方法[J].生態(tài)學(xué)報(bào),2013,33(4):1172-1185.
[14] 宮鵬,浦瑞良,郁彬.不同季相針葉樹(shù)種高光譜數(shù)據(jù)識(shí)別分析[J].遙感學(xué)報(bào),1998,2(3):211-217.
[15] 李萬(wàn)全.湟水流域農(nóng)業(yè)可持續(xù)發(fā)展面臨的困境[J].干旱區(qū)研究,1998,15(2):55-59.
[16] 王德彩,張俊輝,韓光中.土壤含水量對(duì)Vis-NIR光譜分析土壤質(zhì)地的影響[J].地理與地理信息科學(xué),2015,31(6):52-55.
[17] YUE Y M,ZHANG B,WANG K L,et al.Spectral indices for estimating ecological indicators of karst rocky desertification[J].International Journal of Remote Sensing,2010,31(8):2115-2122.
[18] 陳彥光.基于Matlab的地理數(shù)據(jù)分析[M].北京:高等教育出版社,2012.359-398.
[19] CHANG C W,LAIRD D A.Near-infrared reflectance spectroscopic analysis of soil C and N[J].Soil Science,2002,167:110-116.
[20] 王崠,吳見(jiàn).農(nóng)作物種類(lèi)高光譜遙感識(shí)別研究[J].地理與地理信息科學(xué),2015,31(2):29-33.
Identifying Typical Crop Types from Ground Hyper-spectral Data: A Case Study in the Huangshui River Basin,Qinghai Province
SHI Fei-fei,GAO Xiao-hong,YANG Ling-yu,JIA Wei,HE Lin-hua
(CollegeofLifeandGeographicalSciences,PhysicalGeographyandEnvironmentalProcessKeyLaboratoryofQinghaiProvince,KeyLaboratoryofMinistryofEducationonEnvironmentandResourceinQinghai-TibetanPlateau,QinghaiNormalUniversity,Xining810008,China)
The hyperspectral technology used in crop identification and classification has increasingly become one of the frontier issues in agricultural remote sensing applications at currently.In this study,using ASD FieldSpec4 spectrometer,canopy spectrum from five selected typical crops including soybean,barley,potato,wheat and rape was measured in the open air in the Huangshui River Basin,Qinghai Province,and then data preprocessing was finished.Six spectral transformations for original reflectance spectrum(R) such as 1/R,d(R),N(R),log(R),d(log(R)),d(N(R)) were conducted and six kinds of selection results of 16 spectral characteristic variables selected from “Green Peak”,“Red Valley”,“Red Edge” and “Spectral Absorption Feature” to construct a typical crop types identification model which based on neural network of BP.Through the comparison of the accuracy of the models to find the effective spectral data form and spectral characteristic variables for crop classification with hyperspectral data.The results showed that 5 kinds of transformation methods such as 1/R,d(R),log(R),d(log(R)),d(N(R))) could improve identification accuracy of model significantly,especially the BPNN model which created by the data of d(N(R)) has the highest overall accuracy,which reached to 88%.The number of spectral characteristic variables of 3 projects were 16,14,12,respectively,and the identification accuracy of BPNN from 3 projects was much better,which were 88%,86%,84%.The BPNN model can better identify the five crops spectra,the training efficiency and the model stability of BPNN model which created by the spectral characteristic variable selections was better than that created by the transformation forms of the spectrum.
hyperspectral;crop types identification;spectral transformation;spectral characteristic variables;BPNN model
2015-10-27;
2016-01-01
國(guó)家自然科學(xué)基金項(xiàng)目(40861022);青海省重點(diǎn)實(shí)驗(yàn)室發(fā)展專(zhuān)項(xiàng):青海省自然地理與環(huán)境過(guò)程重點(diǎn)實(shí)驗(yàn)室(2014-Z-Y24、2015-Z-Y01)
史飛飛(1991-),男,碩士研究生,從事遙感應(yīng)用與地理數(shù)據(jù)空間分析研究。*通訊作者E-mail:xiaohonggao226@163.com
10.3969/j.issn.1672-0504.2016.02.007
TP79
A
1672-0504(2016)02-0032-08