張煥雪,李強子
(中國科學院遙感與數字地球研究所,北京 100101)
隨著遙感技術的快速發(fā)展,目前已經能夠提供從局部、區(qū)域到全球范圍的連續(xù)地表采樣,并可以提供從0.61m到數十公里空間分辨率的遙感數據,實現多個空間尺度對地遙感觀測[1]。尺度變異和敏感性在使用遙感數據的分析中逐漸起到重要的作用[2]。近年來,多尺度的遙感數據廣泛用于區(qū)域乃至全球尺度的土地覆被制圖,人們越來越重視遙感數據分類精度尺度效應方面的研究[3]。隨著空間分辨率的提高,遙感往往具有更高的地面目標識別和面積估算精度[4-5]。Moody和 Woodcock研究了將高分辨率的土地覆蓋數據聚合到低分辨率過程中土地覆蓋類型面積隨分辨率的變化,結果表明當分辨率大于90m時,面積估計誤差顯著增大。
利用遙感數據識別不同農作物并估算其種植面積,是農作物產量估測的基礎[6]。在農作物遙感識別過程中,作物種植面積測量精度除了受到影像空間分辨率的影響,還與分類器類型、研究區(qū)的作物種植結構、聚集程度等因素密切相關[7-8]。何浩等發(fā)現隨著分辨率的降低,平均區(qū)域精度降低,并且在一定的區(qū)域精度保證下,農作物百分比對低分辨率數據替代高分辨率數據有很重要的影響[7]。針對具體的研究區(qū),要滿足一定的分類精度需要多少分辨率的數據;不同的分類器對同一分辨率有何不同響應;不同分辨率下同種分類器的精度有何變化;不同分辨率下作物種植成數、聚集度等因素對精度結果的影響如何等,都需要開展深入的分析和探討。
本文以河南省封丘縣冬小麥-夏玉米產區(qū)為研究區(qū),開展了尺度變化對農作物識別和種植面積估算精度的影響研究,目的在于探討不同空間分辨率的遙感數據對作物分類和面積估算精度的影響規(guī)律,并分析了作物種植成數和聚集度在不同尺度水平下對作物面積估算精度的影響,為不同作物種植結構區(qū)遙感數據和分類方法的選擇提供理論依據和實驗基礎。
研究區(qū)位于河南省新鄉(xiāng)市封丘縣,中心地理坐標114°30′E和35°03′N,大小15km×10km。該地區(qū)屬于暖溫帶大陸性季風氣候區(qū),多年平均氣溫13.9℃,降雨量615.1mm,雨熱同期,光熱水資源豐富,土壤肥沃,屬典型的一年兩熟制,秋糧作物主要為冬小麥,夏糧作物主要包括夏玉米、大豆、花生等,此外該地區(qū)還廣泛種植了經濟作物棉花及一種特有的藥材金銀花,作物種植結構相對復雜,對華北地區(qū)的農作物種植制度具有典型代表性。研究區(qū)夏玉米和大豆一般6月中旬種植,9月份收獲;棉花4月中旬種植,10月初收獲;金銀花屬多年生作物,一般在6月、7月、8月、9月四個月份分別采摘第1、2、3、4茬花。
本研究訂購了實驗區(qū)內中巴地球資源衛(wèi)星02B(CBERS-02B)CCD影像1景,接收時間為2008年8月22日,影像清晰度好,雖然有少量的云,但基本都分布在居民區(qū)上方,不影響研究中作物的識別。影像空間分辨率20m,幅寬113km,包括5個波段,前4個波段在譜段設置上與Landsat7TM相當,波譜范圍分別是0.45um~0.52um,0.52um~0.59um,0.63um~0.69um,0.77um~0.89um,第5波段是全色波段,波譜范圍是0.51um~0.73um[9]。
影像獲取后對其進行了輻射定標和幾何糾正處理。輻射定標[10]是將影像的DN值轉化為大氣頂歸一化光譜反射率,大氣糾正采用FLAASH模型[11]。幾何糾正以實驗區(qū)的歷史SPOT5影像數據作為參考影像,采用二次多項式方法對數據進行幾何精糾正,采用40個控制點,糾正誤差控制在0.5個像元內。
為了獲得實驗區(qū)內實際的農作物分布特征信息,本研究借助SPOT5全色影像(成像時間為2008年4月16日,空間分辨率2.5m),選擇了1個具有代表性的5km×5km樣區(qū),進行實際作物分布調查,獲得了樣區(qū)內準確的2008年秋季作物分布圖(圖1)。具體調查方法如下:首先根據耕作信息,參考SPOT影像勾繪出每個種植地塊的邊界,并進行唯一性編號;借助地理信息系統(tǒng)工具整理形成實驗樣區(qū)內作物田塊矢量數據集;在2008年8月19日,開展野外實地調查,實地確認地塊邊界的正確性,并逐地塊填寫作物類型;最后在室內編輯整理,得到實驗樣區(qū)的作物分布數據集。
圖1 樣區(qū)作物分布圖
本文首先以CBERS-02B20m分辨率數據為基準,對其進行尺度擴展,模擬生成多分辨率影像序列(40m,60m,80m,100m)。同時,利用地面調查數據,確定作物分類的訓練樣本與檢驗樣本。在此基礎上,利用最大似然(MLC)、支持向量機(SVM)和人工神經網絡(ANN)3種分類器開展農作物分類實驗,估算不同作物的種植面積,并分別從像元尺度和區(qū)域尺度進行分類精度和種植面積估算精度評價。在分析空間分辨率對面積估算精度影響的同時,還進行了作物種植成數和聚集度的影響分析??傮w技術路線見圖2。
圖2 技術路線圖
在遙感中常用的尺度擴展方法主要有簡單平均法、中心像元法,最近鄰法,雙線性內插,立方卷積等[12-13]。簡單平均法是將遙感影像n×n窗口內的像元平均值作為轉換后對應的低分辨率的遙感影像的像元值。中心像元法是取n×n窗口內中心像元值作為轉換后對應的低分辨率的遙感影像的像元值,該方法常用于水文學中[14]。最近鄰法,雙線性內插和立方卷積是圖像處理軟件中的常用方法,Hay等[15]發(fā)現,這3種方法在尺度轉換因子大于5時,不適合將遙感圖像從高分辨率轉換到低分辨率。本文采用了簡單平均法進行影像的尺度擴展。
根據實驗區(qū)地物物候及分布特征,將玉米、棉花、金銀花、大豆、林地和非耕地作為最終分類類別,其中林地包括樹木和苗圃,非耕地包括城鎮(zhèn)居民區(qū)、道路和水渠等。根據SPOT5數據的野外地面調查得到的作物分布圖,并結合目視判圖經驗解譯方式,基于20m分辨率的CBERS-02B影像,選取非耕地樣本1518個像元,林地樣本860個像元,玉米樣本1520個像元,棉花樣本789個像元,金銀花樣本851個像元,大豆樣本749個像元,從所選取的樣本中隨機抽取一半作為訓練樣本,另一半為用于精度評價的檢驗樣本,訓練樣本和檢驗樣本沒有重合。
本文采用的分類算法包括最大似然(MLC)、支持向量機(SVM)和人工神經網絡(ANN)3種。MLC是通過統(tǒng)計方法計算各個像元屬于每個類的概率,將該像元歸屬于概率最大的類[10];SVM選擇了徑向基函數(RBF)為核函數,核參數γ設置為0.25,懲罰因子 C設置為100[16];ANN 選用了3層神經網絡反向傳播算法,遙感數據的5個波段對應于網絡的5個輸入節(jié)點,隱含層設置8個節(jié)點,6個分類類別對應輸出層的6個輸出節(jié)點,激發(fā)函數選用Logistic函數,最大迭代次數設為1000,結束迭代的誤差閾值設為0.1[17]。
為了使分類結果具有可比性,對不同分辨率的影像和不同分類方法都采用了相同的訓練樣本和檢驗樣本,對不同數據采用了相同的分類器參數設置。
為全面分析空間分辨率對作物識別和面積估算的影響,本研究分別從像元尺度和區(qū)域尺度對不同空間分辨率、不同分類方法的結果進行了比較和分析。
(1)像元尺度上,主要是基于上述隨機選取的檢驗樣本,得到分類混淆矩陣,計算出總體像元精度和Kappa系數作為檢驗分類效果的指標。
(2)區(qū)域尺度上,文中采用了用來比較相對精度的區(qū)域精度。
以地面填圖數據得到的各類別的面積總量(A0)為基準值,將由尺度擴展得到的較低分辨率(i)下提取的各類別的面積總量Ai與A0進行對比,獲取區(qū)域內各類別的總體面積估算精度Ki,計算公式:
對于不同的研究區(qū),各作物所占的面積百分比和聚集程度是不同的,這些都會對區(qū)域精度產生影響。因此,本研究在分析空間分辨率對面積估算精度影響的同時,還進行了作物種植成數和聚集度的影響分析。
種植成數(F)[18]即某一種作物種植面積(fraction)占總種植面積(A0)的百分比,即:
聚集度[19]即同一種作物空間分布的集中程度,聚集度值越高,作物分布越零散,相反,聚集度值越低,作物分布越集中。計算方法如下:
(1)設定研究區(qū)內各作物類型像元個數的50%作為計算作物聚集度的標準。
(2)把15km×10km的研究區(qū)均分成100個1.5km×1km的小區(qū)域,統(tǒng)計各小區(qū)域內各個作物類型的像元個數,并將像元個數由大到小排列。
(3)把小區(qū)域內各作物類型的像元個數由大到小相加,直到達到總像元個數的50%。
(4)計算參與相加的小區(qū)域個數占總小區(qū)域數的百分比,這個值即為該作物的聚集度。
本文利用地面驗證樣本,計算不同分辨率影像和不同分類方法得到的混淆矩陣,進而得到總體分類精度(圖3)。
圖3 總體精度和Kappa系數隨不同分辨率的變化圖
(1)隨著空間分辨率的降低,分類精度呈下降趨勢,這與 Toll等[3-5,7]的結論一致。在分辨率優(yōu)于60m的情況下,分類精度受到空間分辨率的影響較小,分類精度基本達到90%以上,當分辨率低于80m以后,分類精度急劇下降(100m分辨率時分類精度不到50%),已經明顯不能滿足監(jiān)測需要。
(2)從3種分類方法對像元精度影響的角度分析,總體來說SVM得到的結果最為理想,而ANN精度最差,這與該方法網絡類型的選擇、隱含層數目和隱含層結點數難以確定有關。
根據不同分辨率下的不同分類結果估算各種作物的種植面積,得到不同作物的區(qū)域精度隨分辨率的變化圖(圖4)。同時以地面調查獲得的作物種植地塊分布圖為基礎,計算了不同作物的種植成數和聚集度值(表1)。
(1)在空間聚集水平接近的情況下,如玉米和金銀花,玉米的區(qū)域精度隨分辨率的降低下降速率較慢,金銀花的區(qū)域精度下降較快。隨著分辨率由20m下降到100m,玉米精度下降平均不超過20個百分點,而金銀花則下降超過50個百分點,這是因為玉米的種植成數超過了38%,而金銀花的種植成數較?。ň蛔?0%)。說明種植成數越高,區(qū)域精度隨分辨率的降低下降速率越慢。
表1 不同作物的種植成數和聚集度值
圖4 不同作物的區(qū)域精度隨分辨率的變化圖
(2)在種植成數接近的情況下,如棉花和金銀花,棉花的區(qū)域精度隨分辨率的降低下降速率較慢,金銀花的區(qū)域精度下降較快。隨著分辨率由20m下降到100m,棉花精度下降平均不超過40個百分點,而金銀花精度則下降超過50個百分點,這是因為棉花的聚集度值較小,分布較密集。表明作物分布越密集,區(qū)域精度隨分辨率的降低下降速率越慢。
(3)大豆的聚集度值為0.18,分布最為密集,雖然其種植成數很低(僅為2.57%),當分辨率優(yōu)于80m時,面積估算精度隨分辨率的降低仍然比較穩(wěn)定,精度基本在80%以上,但當分辨率降低到100m時,精度迅速下降。說明對于分布十分密集的作物,當分辨率較高時,聚集度對其精度結果起主導作用。
(4)從3種分類方法對區(qū)域精度影響的角度分析,對于玉米這種種植成數較高的作物,3種分類方法均能達到較高的精度。對于大豆、棉花和金銀花,總的來說,SVM和MLC算法能夠保證在分辨率相對較高的情況下(<80m)獲得較高的區(qū)域精度,ANN算法則在空間分辨率下降時面積估算精度急劇下降。
隨著遙感技術的發(fā)展,大量攜帶不同傳感器的衛(wèi)星陸續(xù)升空,可獲取多個不同空間分辨率的遙感數據,諸 如 Landsat MSS(80m)、Landsat TM(30m)、SPOT(20m)、CBERS(20m)、IKONOS(1m)、QuickBird(0.61m)等。在多種數據源中選擇合適的數據成了一個新的難題[20]。目前,國際上關于分辨率的一個廣泛關注的問題,就是針對某一特定研究如何選擇合適的數據源,以及要滿足一定的精度要求選用何種分類方法。
本研究的結果還可以用于指導針對不同種植結構地區(qū)滿足不同精度要求的數據源和分類方法的選擇。例如對于種植較密集且一種作物占優(yōu)勢的地區(qū)(如作物聚集度小于0.4且種植成數大于40%的情況下),要使區(qū)域精度達到90%以上,選用較低分辨率的MERIS數據即可滿足要求,并且ANN算法可以得到很高的精度;對于作物種植面積較小但分布又比較密集的地區(qū)(如種植成數不足5%但聚集度低于0.2的情況下),用中等分辨率的IRS-P6數據即可使區(qū)域精度達到90%以上,并且SVM和MLC算法均可得到較高的精度;對于作物分布比較零散的地區(qū),空間分辨率對區(qū)域精度的影響較大,要想得到90%以上的精度最好選用TM或CBERS-02B數據,并且具體分類方法的選擇需要根據研究區(qū)內具體的作物而定(比如對于種植相對較密集的作物,支持向量機方法優(yōu)于MLC和ANN方法)。
本文通過模擬多種不同分辨率影像,研究了空間分辨率對作物識別和面積估算精度的影響,同時也分析了種植成數和聚集度對作物種植面積估算精度的影響,得出如下結論:
(1)從空間分辨率對作物分類識別精度的影響分析,隨分辨率的降低,分類精度呈下降趨勢,當分辨率高于80m時,精度能維持在85%以上。
(2)從空間分辨率對作物種植面積估算精度的影響分析,隨著空間分辨率的降低,作物種植成數越高,作物種植越密集,種植面積估算精度下降的速率越慢。對于分布十分密集的作物,當分辨率高于80m時,聚集度對其精度結果起主導作用。
(3)本文研究結果可以用于針對特定遙感應用中遙感數據和分類方法的選擇。對于種植較密集且一種作物占優(yōu)勢的地區(qū),選用MERIS數據和ANN算法可使區(qū)域精度達到90%以上;對于作物種植面積較小但分布又比較密集的地區(qū),可選用IRS-P6數據和SVM或MLC算法;對于作物分布比較零散的地區(qū),最好選用TM或CBERS-02B數據,具體分類方法的選擇需要根據研究區(qū)內具體的作物而定。
在以后的研究中還需在如下方面做進一步的討論和改進:直接采用不同分辨率影像進行分類精度評價;先對高分辨率數據進行作物分類,然后對分類結果進行尺度轉化得到較低分辨率的作物識別結果;在其他不同地貌類型和種植結構的典型作物區(qū)進行試驗,測試本文中結論的適用性。
[1]徐俊鋒.IKONOS信息提取的尺度效應研究[D].浙江:浙江大學,2006.
[2]CHEN D,STOW D A,GONG P.Examining the effect of spatial resolution and texture window size on classification accuracy:An urban environment case[J].International Journal of Remote Sensing,2004,25(11):2177-2192.
[3]MOODY A,WALSH S J,ALLEN T R,et al.Scaling properties of NDVI and their relationship to land-cover spatial variability[C].Proceedings of the 1995International Geoscience and Remote Sensing Symposium,Firenze,Italy,1995.
[4]MOODY A,WOODCOCK C E.Scale-dependent errors in the estimation of land-cover proportions:Implications for global land-cover datasets[J].Photogrammetric Engineering and Remote Sensing,1994,60(5):585-594.
[5]TOLL D L.Effect of Landsat Thematic Mapper Sensor parameters on land cover classification[J].Remote Sensing of Environment,1985,17(2):129-140.
[6]吳炳方.全國農情監(jiān)測與估產的運行化遙感方法[J].地理學報,2000,55(1):23-35.
[7]何浩,朱秀芳,潘耀忠,等.尺度變化對冬小麥種植面積遙感測量區(qū)域精度影響的研究[J].遙感學報,2008,12(1):167-175.
[8]朱秀芳,潘耀忠,張錦水,等.訓練樣本對TM尺度小麥種植面積測量精度影響研究(Ⅰ):訓練樣本與分類方法間分類精度響應關系研究[J].遙感學報,2007,11(6):826-837.
[9]LI Q,WU B,JIA K,et al.Maize acreage estimation using ENVISAT MERIS and CBERS-02BCCD data in the North China Plain[J].Computers and Electronics in Agriculture,2011,78(2):208-214.
[10]賈坤,李強子,田亦陳,等.微波后向散射數據改進農作物光譜分類精度研究[J].光譜學與光譜分析,2011,31(2):483-487.
[11]VERMOTE E F,TANRE D,DEUZE J L,et al.Second simulation of the satellite signal in the solar spectrum,6S:An overview[J].IEEE Transactions on Geoscience and Remote Sensing,1997,35(3):675-686.
[12]COLLINS J B,WOODCOCK C E.Geostatistical estimation of resolution-dependent variance in remotely sensed images[J].Photogrammetric Engineering and Remote Sensing,1999,65(1):41-50.
[13]KAVZOGLU T.Simulating Landsat ETM+imagery using DAIS 7915hyperspectral scanner data[J].International Journal of Remote Sensing,2004,25(22):5049-5067.
[14]WOODCOCK C,HARWARD V J.Nested-h(huán)ierarchical scene models and image segmentation[J].International Journal of Remote Sensing,1992,13(16):3167-3187.
[15]HAY G J,NIEMANN K O,GOODENOUGH D G.Spatial thresholds,image-objects,and upscaling:A multiscale evaluation[J].Remote Sensing of Environment,1997,62(1):1-19.
[16]WOODCOCK C E,STRAHLER A H.Factor of scale in Remote Sensing[J].Remote Sensing of Environment,1987,21(3):311-332.
[17]MARCEAU D J,GRATTON D J,FOURNIER R A,et al.Remote sensing and the measurement of geographical entities in a forested environment.2.The optimal spatial resolution[J].Remote Sensing of Environment,1994,49(2):105-117.
[18]譚琨,杜培軍.基于支持向量機的高光譜遙感圖像分類[J].紅外與毫米波學報,2008,27(2):123-128.
[19]賈坤,李強子,田亦陳,等.遙感影像分類方法研究進展[J].光譜學與光譜分析,2011,31(10):2618-2623.
[20]李強子,吳炳方.作物種植成數的遙感監(jiān)測精度評價[J].遙感學報,2004,8(6):581-587.
[21]劉燦然,陳靈芝.北京地區(qū)植被景觀中斑塊形狀的指數分析[J].生態(tài)學報,2000,20(4):559-567.
[22]明冬萍,王群,楊建宇.遙感影像空間尺度特性與最佳空間分辨率選擇[J].遙感學報,2008,12(4):529-537.