周 亮,慕號偉,馬海姣,陳高星
基于卷積神經(jīng)網(wǎng)絡(luò)的中國北方冬小麥遙感估產(chǎn)
周 亮1,2,3,慕號偉1,2,3,馬海姣4,陳高星5
(1. 蘭州交通大學(xué)測繪與地理信息學(xué)院,蘭州 730070; 2. 地理國情監(jiān)測技術(shù)應(yīng)用國家地方聯(lián)合工程研究中心,蘭州 730070;3. 甘肅省地理國情監(jiān)測工程實(shí)驗(yàn)室,蘭州 730070; 4. 西北農(nóng)林科技大學(xué)水利與建筑工程學(xué)院,楊凌 712100; 5. 北京地空數(shù)馳科技有限公司,北京 100871)
針對傳統(tǒng)的農(nóng)作物估產(chǎn)方法過度依賴人工經(jīng)驗(yàn),以及實(shí)地采樣成本高等問題。該研究使用MODIS數(shù)據(jù)構(gòu)建了基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)的冬小麥估產(chǎn)模型。對2006-2016年中國北方冬小麥核心區(qū)的60個地級市進(jìn)行模型訓(xùn)練,魯棒性檢驗(yàn)以及估產(chǎn)誤差空間特征分析。結(jié)果表明:1)估產(chǎn)模型在訓(xùn)練集和驗(yàn)證集的均方根誤差(root mean square error, RMSE)分別為183.82 kg/hm2、689.72 kg/hm2,決定系數(shù)(2)分別為0.98、0.71。2)以同樣的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)對2006-2016年估產(chǎn)樣本分別作為驗(yàn)證集,訓(xùn)練11個獨(dú)立模型的RMSE平均值是772.03 kg/hm2,證明算法具有較高的魯棒性。3)2007、2012和2016年不同省份的估產(chǎn)結(jié)果表明,模型對北方冬小麥區(qū)的平原區(qū)估產(chǎn)精度較高,尤其是河北和山東2?。≧MSE為500 kg/hm2)。該文構(gòu)建的估產(chǎn)模型可以實(shí)現(xiàn)冬小麥單產(chǎn)的復(fù)雜擬合,可以應(yīng)用于較大尺度(范圍)冬小麥產(chǎn)量預(yù)報。
作物;產(chǎn)量;遙感;作物估產(chǎn);卷積神經(jīng)網(wǎng)絡(luò);深度學(xué)習(xí);冬小麥
大范圍可靠的農(nóng)情信息對糧食市場及相關(guān)政策的制定至關(guān)重要,是保障區(qū)域及國家糧食安全的重要依據(jù),特別是產(chǎn)量信息的快速、有效獲取可以降低市場風(fēng)險并提高效率[1]。其中遙感技術(shù)具有覆蓋范圍廣、重訪周期短,獲取成本相對低等優(yōu)勢,在作物長勢監(jiān)測、農(nóng)業(yè)氣象以及產(chǎn)量估算中扮演著重要的角色,且對大面積露天農(nóng)業(yè)生產(chǎn)的調(diào)查、評價、監(jiān)測和管理具有獨(dú)特的作用[2]。隨著人工智能與大數(shù)據(jù)技術(shù)的發(fā)展,遙感大數(shù)據(jù)為農(nóng)業(yè)應(yīng)用提供了智能化和信息化的技術(shù)途徑,將推動農(nóng)業(yè)遙感估產(chǎn)的發(fā)展[3]。文獻(xiàn)分析發(fā)現(xiàn)目前遙感估產(chǎn)中最為有效的方法有2種:一是利用數(shù)據(jù)同化技術(shù)把遙感反演參數(shù)信息融入到作物機(jī)理過程模型之中,實(shí)現(xiàn)大面積作物生長狀態(tài)及產(chǎn)量模擬的目的[4-5],如基于WOFOST[6]、Oryza2000[7]、WheatSM[8]、ChinaAgroys[9]4個作物模型所構(gòu)建的中國作物生長模擬監(jiān)測系統(tǒng)(CGMS-China),CGMS-China對冬小麥各主產(chǎn)省的平均預(yù)報相對誤差為7%[10]。二是基于統(tǒng)計(jì)模型方法的遙感估產(chǎn),其統(tǒng)計(jì)模型方法包括線性模型方法和非線性模型方法。線性模型方法在省級尺度[11],縣級尺度[12-13],村級以及地塊尺度[14-15]下都有良好的應(yīng)用。但是作物產(chǎn)量形成的機(jī)理通常表現(xiàn)為非線性[16],因此非線性模型方法更受研究者的關(guān)注,如支持向量回歸(support vector regression,SVR)[17]和神經(jīng)網(wǎng)絡(luò)法(neural network,NN)[18-24]等等。然而,支持向量回歸這種傳統(tǒng)統(tǒng)計(jì)學(xué)習(xí)方法并不適合大規(guī)模數(shù)據(jù)處理,當(dāng)前基于神經(jīng)網(wǎng)絡(luò)法的作物估產(chǎn)得到了快速發(fā)展。Kaul等[19-20]結(jié)合氣候、氣象和土壤等數(shù)據(jù)用人工神經(jīng)網(wǎng)絡(luò)進(jìn)行作物估產(chǎn),在不同區(qū)域中人工神經(jīng)網(wǎng)絡(luò)相比于多元線性回歸模型都有了優(yōu)越的表現(xiàn)。Kuwata等[21]結(jié)合衛(wèi)星,氣候和其他環(huán)境數(shù)據(jù)用多層受限玻爾茲曼機(jī)進(jìn)行玉米估產(chǎn),相比于SVR算法更有優(yōu)勢。You等[22-23]結(jié)合MODIS數(shù)據(jù)用多種深度學(xué)習(xí)算法進(jìn)行大豆估產(chǎn),Wang等[24]在You的研究基礎(chǔ)上使用深度遷移學(xué)習(xí)對巴西的大豆進(jìn)行估產(chǎn),在解決遙感應(yīng)用的實(shí)際需求中,發(fā)現(xiàn)深度學(xué)習(xí)在遙感數(shù)據(jù)分析中具有極大的應(yīng)用潛力[25]。從原始像素的底層特征抽象出高級語義信息的深度學(xué)習(xí)與遙感數(shù)據(jù)結(jié)合將會是解決農(nóng)作物估產(chǎn)的有效手段。
冬小麥?zhǔn)侵袊匾募Z食作物,主要分布于暖溫帶的北方冬小麥區(qū)。本文將其作為研究區(qū)域,選取研究區(qū)2006-2016年各地級市冬小麥生長季中的時間序列遙感影像作為數(shù)據(jù)源。與之前研究不同的是,本文以卷積神經(jīng)網(wǎng)絡(luò)代替以往常用的分區(qū)域回歸擬合作為估產(chǎn)方法,對農(nóng)作物估產(chǎn)展開研究。分區(qū)域回歸擬合的優(yōu)勢在于簡單靈活,但這種經(jīng)驗(yàn)分區(qū)和簡單擬合與冬小麥單產(chǎn)建立的關(guān)系更易受到自然因素變化的影響。而卷積神經(jīng)網(wǎng)絡(luò)可以從遙感信息里表達(dá)的作物生長環(huán)境中學(xué)習(xí)到與冬小麥單產(chǎn)之間的復(fù)雜關(guān)系,這種關(guān)系包含了作物的生長機(jī)理,能可靠應(yīng)用于冬小麥單產(chǎn)估算中。同時卷積神經(jīng)網(wǎng)絡(luò)具備的學(xué)習(xí)性在數(shù)據(jù)累積的情況下可以成長為高精度的冬小麥估產(chǎn)模型,對于國家級冬小麥產(chǎn)量預(yù)報具有良好的應(yīng)用前景。試驗(yàn)為表達(dá)冬小麥的生長環(huán)境與狀態(tài),選取6種不同的MODIS產(chǎn)品,通過直方圖降維和數(shù)據(jù)歸一化方法進(jìn)行特征工程,并與卷積神經(jīng)網(wǎng)絡(luò)相關(guān)聯(lián),旨在探索一種在大范圍中普適性強(qiáng)的高精度遙感估產(chǎn)方法和技術(shù)途徑。
研究區(qū)位于北方冬小麥區(qū)(31°38-42°62N,105°48-122°71E),主要分布在秦嶺、淮河以北,長城以南,包括河南、河北、山東、陜西、山西5?。▓D1)。研究區(qū)大部分在秦嶺—淮河線以北(除陜西省安康市、商洛市、漢中市和河南省信陽市),冬小麥的生育期不同,北方地區(qū)平均出苗期在10月左右,部分地區(qū)在9月中旬,而成熟期在6月左右[26],因此需要擴(kuò)大MODIS數(shù)據(jù)的時間范圍,以包含不同地區(qū)的冬小麥生育期。2016年整個研究區(qū)的小麥產(chǎn)量是7.96×107t,約占全國小麥產(chǎn)量的62%,是中國重要的小麥產(chǎn)地。研究區(qū)小麥種植以冬小麥為主,因而也是中國重要的冬小麥基地。試驗(yàn)中考慮統(tǒng)計(jì)數(shù)據(jù)不連續(xù)和高程受限的情況下篩除了河北省的承德市和張家口市,山西省的大同市、朔州市和陽泉市以及陜西省的安康市和榆林市,保留了5個省60個地級市作為估產(chǎn)區(qū)域。
圖1 研究區(qū)數(shù)據(jù)選擇及高程特征
本文采用的MODIS數(shù)據(jù)具有高時間分辨率,可以獲取足夠監(jiān)測作物產(chǎn)量的多時相影像,來源于LAADS DAAC(https://lsadsweb.modaps.eosdis.nasa.gov/)。試驗(yàn)選擇MODIS數(shù)據(jù)中不同產(chǎn)品的多個波段作為估產(chǎn)指標(biāo)(表1),MOD09A1的7個不同波長的地表反射率數(shù)據(jù)可以反映土壤濕度及作物生長環(huán)境。MYD11A2的白天和夜間地表溫度與冠層溫度密切相關(guān),可以進(jìn)行作物產(chǎn)量估算[27]。歸一化植被指數(shù)(NDVI)和增強(qiáng)型植被指數(shù)(EVI)均能很好的預(yù)測冬小麥產(chǎn)量[28],其中NDVI與冬小麥產(chǎn)量具有極高的相關(guān)性[29]。MOD15A2H的光合有效輻射(FPAR)與作物產(chǎn)量有更直接的關(guān)系,是大量作物生長模型的基礎(chǔ)[30]。試驗(yàn)中選擇MCD12Q1數(shù)據(jù)產(chǎn)品中植物功能型方案的谷物掩模,谷物掩模中包含了冬小麥的信息。研究區(qū)各地級市冬小麥單產(chǎn)數(shù)據(jù)來源于2007—2017年河南,山東,山西和陜西的統(tǒng)計(jì)年鑒以及河北的農(nóng)村統(tǒng)計(jì)年鑒,同時還有研究區(qū)的高程和水系數(shù)據(jù),以及地級市的矢量邊界。
研究區(qū)的冬小麥在上一年的9月播種,下一年的6月成熟。因此,根據(jù)冬小麥的生育期確定構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)樣本的時間范圍是一年中的第273天到下一年中的第185天,年份上選擇了2006-2016年的影像數(shù)據(jù),根據(jù)研究區(qū)范圍選擇了MODIS數(shù)據(jù)的行列號為h26v04,h26v05,h27v04,h27v05。將MYD11A2影像重采樣為500 m的空間分辨率,其中MOD15A2H影像在2016年第49天缺失,試驗(yàn)中通過對第41天和第57天的影像進(jìn)行均值補(bǔ)充,同時將MOD13A1,MYD13A1影像在時間序列上進(jìn)行融合以保證時序的完整性。MODIS發(fā)布產(chǎn)品為HDF格式,投影類型為正弦曲線投影(等面積偽圓柱投影),試驗(yàn)中采用Shell與GDAL進(jìn)行批量處理,將MODIS數(shù)據(jù)的投影轉(zhuǎn)換為基于WGS-84橢球體的UTM投影,同時對多張類型的影像進(jìn)行了波段提取,拼接,裁剪后融合為21 600張包含12個波段的影像。
表1 遙感數(shù)據(jù)類別
2.1.1 直方圖降維與歸一化
直方圖降維的前提是假設(shè)冬小麥單產(chǎn)和影像像素的位置無關(guān),僅與不同像素值的數(shù)量相關(guān)。因而將遙感影像映射到像素計(jì)數(shù)的直方圖中信息損失較少。為了使得降維特征更加明顯,需要確定直方圖降維的范圍。以信陽市為例,將其2010年冬小麥生長季中36張影像在時間序列上進(jìn)行直方圖統(tǒng)計(jì),通過可視化每個波段在時間序列上的變化(圖2),從而確定直方圖降維的范圍(表1)。
圖2 各個波段隨著時間序列的直方圖變化
每個影像在確定直方圖降維范圍后,劃分36個區(qū)間逐個離散化統(tǒng)計(jì)像素個數(shù)用來生成像素直方圖,同時對生成的像素直方圖進(jìn)行式1歸一化處理。
2.1.2 時間序列融合
以2010年的河南省信陽市為例示意卷積神經(jīng)網(wǎng)絡(luò)樣本的構(gòu)建過程(圖3),對生長季中36張包含12個波段的影像進(jìn)行直方圖提取,使得每個波段的影像生成長度為36的向量,同時時間序列上進(jìn)行融合形成36×36的矩陣,最終在288 d的生長季中由遙感影像生成36×36×12的矩陣作為卷積神經(jīng)網(wǎng)絡(luò)的輸入層。以相同時間相應(yīng)地級市的冬小麥產(chǎn)量數(shù)據(jù)作為輸出層,構(gòu)造一個完整的卷積神經(jīng)網(wǎng)絡(luò)樣本。每個地級市每年構(gòu)建一個樣本,試驗(yàn)中2006-2016年60個地級市構(gòu)建的樣本形成卷積神經(jīng)網(wǎng)絡(luò)的估產(chǎn)樣本庫,共有660個樣本,其中600個作為訓(xùn)練集,60個作為驗(yàn)證集。
圖3 卷積神經(jīng)網(wǎng)絡(luò)樣本構(gòu)建過程
對于深度學(xué)習(xí)模型,其輸入是與輸出相對應(yīng)的樣本數(shù)據(jù),后續(xù)則是堆疊在輸入層和輸出層之間的眾多操作層。研究所使用的卷積神經(jīng)網(wǎng)絡(luò)借鑒了You等提出的網(wǎng)絡(luò)結(jié)構(gòu)[22],結(jié)合樣本的特點(diǎn)將卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行改進(jìn)(圖4),采用小卷積核的多層疊加,減少了參數(shù)個數(shù),加深網(wǎng)絡(luò)深度進(jìn)而增大了網(wǎng)絡(luò)容量和復(fù)雜度,對作物生長的復(fù)雜過程進(jìn)行擬合。本文構(gòu)建的神經(jīng)網(wǎng)絡(luò)主要由輸入層,7個卷積層,7個激活層,7個批歸一化層,3個Dropout層,2個全連接層以及輸出層組成。相比于You等[22]的網(wǎng)絡(luò)結(jié)構(gòu),考慮到批歸一化算法本身對于模型泛化能力的提升,而過多的Dropout層反而降低模型的預(yù)測能力。當(dāng)模型狀態(tài)由訓(xùn)練到驗(yàn)證時,Dropout會使具體神經(jīng)元的方差產(chǎn)生偏移[31],因而在批歸一化層之后采用Dropout層,加入2參數(shù)正則化共同來提升模型的泛化能力。
圖4 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
2.2.1 網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)
本文的卷積神經(jīng)網(wǎng)絡(luò)輸入層為36×36×12的矩陣,卷積層C1~C7的卷積核個數(shù)依次是64、64、128、128、256、256、256,卷積核大小都是3×3 dpi,滑動步長分別為2、1、2、2、2、1、2,每個卷積層進(jìn)行1個零填充。同時,在每一個卷積層上進(jìn)行批歸一化和Relu函數(shù)激活操作,并在全連接層加入Dropout層。
2.2.22參數(shù)正則化
通過向目標(biāo)函數(shù)添加一個參數(shù)范數(shù)懲罰?(),用來限制模型的學(xué)習(xí)能力。將正則化后的目標(biāo)函數(shù)記為
2.2.3 損失函數(shù)
因而個樣本的2損失函數(shù)定義如下
回歸問題的2種損失函數(shù)1和2在回歸精度上相差無幾,不過在一些情況下2損失函數(shù)可能會略優(yōu)于1[32],同時收斂速度方面2損失函數(shù)也略快于1損失函數(shù),因此本文采用2損失函數(shù)。
本文采用以下4個指標(biāo)評價模型估產(chǎn)效果,即決定系數(shù)2,皮爾遜積矩相關(guān)系數(shù)Pearson’s,均方根誤差RMSE,平均相對誤差MRE,具體公式如式(6)~式(9)所示。
為了實(shí)現(xiàn)冬小麥的單產(chǎn)預(yù)測采用本文設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)開始模型訓(xùn)練,其中2006-2015年600個樣本為訓(xùn)練集,2016年60個樣本為驗(yàn)證集。將訓(xùn)練集和驗(yàn)證集分為多個批次,每個批次隨機(jī)選擇36個訓(xùn)練樣本,網(wǎng)絡(luò)訓(xùn)練1次更新1次權(quán)重,總共訓(xùn)練40 000次。通過Adam算法進(jìn)行梯度下降,將初始學(xué)習(xí)率設(shè)置為0.001,分階段逐次減少為原來的10倍,第1個階段是當(dāng)訓(xùn)練3 500次時,第2個階段是當(dāng)訓(xùn)練達(dá)到20 000次時,第3個階段是當(dāng)訓(xùn)練達(dá)到30 000次時。
模型訓(xùn)練20 000步時逐步收斂(圖5a),直到完成訓(xùn)練后保存模型并對訓(xùn)練集和驗(yàn)證集進(jìn)行產(chǎn)量預(yù)測(圖5b)。訓(xùn)練集和驗(yàn)證集的RMSE分別是183.82 kg/hm2、689.72 kg/hm2,MRE分別是2.95%、10.53%,Pearson's分別是0.98、0.71。模型對2016年60個地級市的冬小麥單產(chǎn)進(jìn)行了較為準(zhǔn)確的預(yù)測,卷積神經(jīng)網(wǎng)絡(luò)模型的估產(chǎn)誤差在合理范圍內(nèi),證明了遙感數(shù)據(jù)通過直方圖降維和歸一化方法進(jìn)行特征工程的信息損失較少,和卷積神經(jīng)網(wǎng)絡(luò)結(jié)合可以有效擬合作物生長的復(fù)雜過程。而在網(wǎng)絡(luò)結(jié)構(gòu)中加入了Dropout層、批歸一化層以及2參數(shù)正則化方法下出現(xiàn)訓(xùn)練集的預(yù)測精度相比驗(yàn)證集高的過擬合現(xiàn)象,表明模型的訓(xùn)練樣本較少,增加樣本可以提升估產(chǎn)精度。
圖5 模型訓(xùn)練過程及評價
將卷積神經(jīng)網(wǎng)絡(luò)模型的預(yù)測產(chǎn)量與統(tǒng)計(jì)產(chǎn)量進(jìn)行比較(圖6),誤差較大的區(qū)域主要分布在陜西省,山西省和河南省的一些地級市。陜西省的渭南市和西安市屬于關(guān)中平原地區(qū),模型對于關(guān)中平原地區(qū)普遍高估,這種誤差的產(chǎn)生原因可能是模型輸入中沒有敏感表達(dá)區(qū)域異質(zhì)性的參數(shù)所造成。山西省的呂梁市和太原市冬小麥種植面積較少且沒有準(zhǔn)確的冬小麥掩模,在直方圖降維過程中容易出現(xiàn)不穩(wěn)定的狀態(tài)給模型預(yù)測帶來誤差。河南省的漯河市和焦作市屬于高估,而信陽市屬于低估,可能是樣本沒有在省域尺度下進(jìn)行區(qū)分所產(chǎn)生的。例如陜西省的糧食單產(chǎn)為抽樣調(diào)查數(shù),因而不同省份統(tǒng)計(jì)數(shù)據(jù)構(gòu)建的樣本給模型預(yù)測帶來了一些困難。山東省和河北省的估產(chǎn)誤差較低,RMSE基本穩(wěn)定在500 kg/hm2以內(nèi),模型在這些區(qū)域表現(xiàn)優(yōu)秀。以山東省為例,萊蕪市的統(tǒng)計(jì)產(chǎn)量是5 227 kg/hm2相比于全省最低,模型的預(yù)測產(chǎn)量為5 014.96 kg/hm2,德州市的統(tǒng)計(jì)產(chǎn)量為7 130 kg/hm2相比于全省最高,而模型的預(yù)測產(chǎn)量是7 447.69 kg/hm2,上述結(jié)果表明卷積神經(jīng)網(wǎng)絡(luò)對于高產(chǎn)和低產(chǎn)樣本都能夠準(zhǔn)確的擬合,相比線性模型更具優(yōu)勢。總而言之,卷積神經(jīng)網(wǎng)絡(luò)模型在研究區(qū)的估產(chǎn)精度較高,可以實(shí)現(xiàn)對冬小麥的單產(chǎn)預(yù)測。
圖6 模型預(yù)測產(chǎn)量與統(tǒng)計(jì)產(chǎn)量差異
為了對估產(chǎn)算法魯棒性進(jìn)行檢驗(yàn),將2006-2016年估產(chǎn)樣本逐年作為驗(yàn)證集,對應(yīng)其余年份作為訓(xùn)練集,分別訓(xùn)練11個模型(表2)。結(jié)果表明2006—2016年11個模型RMSE的平均值是772.03 kg/hm2,MRE在10%左右,Pearson's基本大于0.8,2在0.58與0.77之間,預(yù)測數(shù)據(jù)的離散程度較為一致,表明基于卷積神經(jīng)網(wǎng)絡(luò)的估產(chǎn)算法魯棒性較好,在不同訓(xùn)練集和驗(yàn)證集下都有一個相對一致的誤差水平,在未來冬小麥單產(chǎn)預(yù)測中比較可靠。數(shù)據(jù)分析發(fā)現(xiàn)逐年訓(xùn)練的模型中2007年的誤差較大,RMSE是920.45 kg/hm2,MRE是18.82%;2012模型效果最好,RMSE是632.08 kg/hm2,MRE是8.42%。2008、2012、2014和2016年模型的預(yù)測精度較高,RMSE小于700 kg/hm2,MRE小于12%;而2007、2011、2013和2015年的模型效果較差,RMSE基本都是在900 kg/hm2左右,MRE在15%左右。模型對于偶數(shù)年和奇數(shù)年的樣本預(yù)測產(chǎn)生了較為明顯的差異,同時MRE隨著時間變化有逐漸下降的趨勢,雖然模型本身沒有時間相關(guān)性,但是統(tǒng)計(jì)數(shù)據(jù)自身的時間關(guān)聯(lián)給模型結(jié)果帶來了這種特點(diǎn),表明算法可以逼近任何復(fù)雜函數(shù),直接學(xué)得從遙感數(shù)據(jù)輸入到統(tǒng)計(jì)數(shù)據(jù)輸出的映射,這種“端到端”的關(guān)系中包含著作物生長過程,但與此同時對訓(xùn)練數(shù)據(jù)的依賴程度較高。
試驗(yàn)對2007年,2012年以及2016年中各個地級市的單產(chǎn)精度展開分析(圖7)。2007年模型的預(yù)測單產(chǎn)大都高于統(tǒng)計(jì)單產(chǎn),主要是因?yàn)樗惺〉亩←湹膯萎a(chǎn)數(shù)據(jù)呈現(xiàn)逐年遞增的趨勢,其中陜西省表現(xiàn)尤為明顯,例如商洛市2007和2008年的統(tǒng)計(jì)單產(chǎn)分別是1 365、2 280 kg/hm2,因而訓(xùn)練數(shù)據(jù)中大多是高產(chǎn)樣本,低產(chǎn)樣本不足導(dǎo)致數(shù)據(jù)不均衡給預(yù)測帶來極大的困難。同時模型的輸入?yún)?shù)中主要包含地表反射率、地表溫度以及表達(dá)作物生長狀態(tài)的植被指數(shù),并沒有考慮到農(nóng)業(yè)生產(chǎn)方式等提升所帶來的增產(chǎn),可以考慮未來研究中給模型加入人為因素作為變量。本文構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)與遙感數(shù)據(jù)相結(jié)合的估產(chǎn)算法在不同驗(yàn)證集下有著基本一致的誤差水平,可以肯定卷積神經(jīng)網(wǎng)絡(luò)在國家級冬小麥產(chǎn)量預(yù)報中的應(yīng)用價值。更進(jìn)一步的研究發(fā)現(xiàn)3個模型的誤差有一些共同的空間分布,其省域特征表現(xiàn)明顯,因而對冬小麥的單產(chǎn)誤差分省展開研究。
表2 逐年訓(xùn)練模型的精度評價
圖7 2007、2012及2016年的模型精度及誤差分布
通過對誤差分布的區(qū)域研究發(fā)現(xiàn)在華北平原大多數(shù)地區(qū)的誤差都比較低,而誤差主要分布在關(guān)中平原一帶??紤]到不同省份對于統(tǒng)計(jì)數(shù)據(jù)的收集有所差別,因此對2007、2012以及2016年不同省域的單產(chǎn)精度展開分析(表3)。模型在河北省和山東省的冬小麥估產(chǎn)誤差比較小,其RMSE基本都在500 kg/hm2左右,但是山東省在2007年的2只有0.2,這主要是因?yàn)楹蕽墒械膯萎a(chǎn)預(yù)測出現(xiàn)離群值,其統(tǒng)計(jì)單產(chǎn)和預(yù)測單產(chǎn)分別是5 462、7 142 kg/hm2,而山東省其余16個地市中除萊蕪市、青島市、德州市和東營市的誤差分別是861、738、647和615 kg/hm2外,其余地市的誤差都在350 kg/hm2以內(nèi)。河南省的單產(chǎn)誤差RMSE和MRE分別穩(wěn)定在800 kg/hm2和10%左右,各個地級市的誤差都維持在較低水平。山西省的運(yùn)城市和太原市出現(xiàn)離群值,2007年運(yùn)城市統(tǒng)計(jì)單產(chǎn)和預(yù)測單產(chǎn)分別是2 374、4 429 kg/hm2,2012年太原市的統(tǒng)計(jì)單產(chǎn)和預(yù)測單產(chǎn)分別是5 754、3 943 kg/hm2,誤差主要分布在山西北部區(qū)域,可能是因?yàn)楹0胃叨群脱谀?shù)據(jù)不精確造成的不穩(wěn)定因素。而對于陜西省來講,2007年的誤差最大,所有的預(yù)測產(chǎn)量都大于統(tǒng)計(jì)產(chǎn)量,表現(xiàn)尤為明顯的是商洛市,其統(tǒng)計(jì)產(chǎn)量和預(yù)測產(chǎn)量分別是1 365、4 439 kg/hm2,這是由于2007年厄爾尼諾現(xiàn)象以及地理分布在北亞熱帶和暖溫帶交界區(qū)域,水平方向上具有2個氣候帶過渡性特征,地形復(fù)雜,受到極端天氣影響劇烈[26]。整個算法對于遙感數(shù)據(jù)是統(tǒng)一獲取處理,因此影像產(chǎn)生的誤差對于每個樣本是一致的,而這些誤差較大的離群值產(chǎn)生的原因是不同省份的統(tǒng)計(jì)數(shù)據(jù)收集和檢驗(yàn)方式不一致,當(dāng)然不排除遙感數(shù)據(jù)處理不當(dāng)?shù)目赡苄浴τ诰矸e神經(jīng)網(wǎng)絡(luò)估產(chǎn)算法的提升,可以將模型對不同省份分開訓(xùn)練,但會存在樣本不足的情況,因而在縣級、鄉(xiāng)鎮(zhèn)級以及村級等小尺度下樣本充足且不存在數(shù)據(jù)分省統(tǒng)計(jì)的誤差,估產(chǎn)精度會更高。
表3 2007、2012及2016年模型分省精度評價
試驗(yàn)中通過直方圖的方式對遙感影像進(jìn)行降維,因此在不同的區(qū)域尺度下本文的算法都有所適用,但不適合實(shí)地采樣點(diǎn)的單產(chǎn)估算。同時深度學(xué)習(xí)算法是“端到端”的,不適用于作物生長過程的描述與機(jī)理表達(dá),只能應(yīng)用于訓(xùn)練數(shù)據(jù)所包含的區(qū)域。算法對于極端天氣等突發(fā)事件的適應(yīng)性不好,但對于氣候的年際波動適應(yīng)性較好,且可以通過輸入數(shù)據(jù)敏感的表達(dá)區(qū)域異質(zhì)性。
深度學(xué)習(xí)算法建立于大樣本之上,因而對提高算法精度可從樣本的角度出發(fā)。一是直接增加樣本量,在同一范圍更小尺度下隨著樣本數(shù)量的增加精度也會隨之提高。二是基于深度遷移學(xué)習(xí)將不同尺度或者區(qū)域的模型結(jié)合使用,也就相當(dāng)于擴(kuò)大樣本數(shù)量。相較于傳統(tǒng)作物估產(chǎn)方法都是小模型,對大樣本數(shù)據(jù)的擬合能力不強(qiáng),而且需要人工干預(yù)進(jìn)行分區(qū),不能客觀表達(dá)試驗(yàn)結(jié)果。因此大樣本成為深度學(xué)習(xí)類算法的主要特點(diǎn),但對于小樣本的作物估產(chǎn),傳統(tǒng)算法則更勝一籌。未來隨著數(shù)據(jù)的累積,相信深度學(xué)習(xí)算法的優(yōu)勢會逐漸凸顯。
本文對北方冬小麥區(qū)的估產(chǎn)方法是一種新的探索與嘗試,模型在關(guān)中平原地區(qū)的估產(chǎn)出現(xiàn)離群值,可能是輸入層中沒有參數(shù)代表區(qū)域的空間異質(zhì)性,未來研究可以嘗試在模型中加入坡度、蒸散發(fā)、降雨等地理與氣象數(shù)據(jù),提升模型在不同地域下估產(chǎn)的場景應(yīng)用。另外,本研究使用的MCD12Q1的谷物掩模數(shù)據(jù)包含其他作物,數(shù)據(jù)對估產(chǎn)結(jié)果存在一定程度擾動和誤差,因此更加精確的作物覆蓋數(shù)據(jù)可以提高估產(chǎn)精度。
根據(jù)冬小麥的生長環(huán)境,從MODIS數(shù)據(jù)中選擇12個估產(chǎn)指標(biāo),通過特征工程和卷積神經(jīng)網(wǎng)絡(luò)建立基于統(tǒng)計(jì)數(shù)據(jù)的估產(chǎn)模型,進(jìn)一步提高大范圍冬小麥單產(chǎn)估算效率。同時應(yīng)用本文構(gòu)建的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)對2006-2016年逐年樣本進(jìn)行訓(xùn)練預(yù)測,對算法應(yīng)用于國家級冬小麥產(chǎn)量預(yù)報的可行性進(jìn)行研究。主要結(jié)論如下:
1)卷積神經(jīng)網(wǎng)絡(luò)模型可以從遙感影像中有效地學(xué)習(xí)與冬小麥產(chǎn)量相關(guān)的特征,解決了傳統(tǒng)統(tǒng)計(jì)模型對復(fù)雜關(guān)系擬合的制約,不依賴實(shí)地樣本采集,在模型訓(xùn)練完成后對未來冬小麥產(chǎn)量預(yù)測可以做到實(shí)時高效。
2)基于卷積神經(jīng)網(wǎng)絡(luò)的遙感估產(chǎn)算法魯棒性較好,精度較高。而且當(dāng)模型出現(xiàn)較大偏差時,不會對算法性能產(chǎn)生負(fù)面的影響,在不同的數(shù)據(jù)集中有著較為一致的結(jié)果,對于國家級冬小麥產(chǎn)量預(yù)報具有良好的應(yīng)用前景。
3)本文所采用的直方圖降維是遙感應(yīng)用結(jié)合深度學(xué)習(xí)算法的不同思路,這個方法可以在不同尺度以及不同作物中進(jìn)行作物估產(chǎn),解決行政尺度對于算法的限制。在大范圍小尺度中隨著樣本量的增加算法精度會逐漸提升,可對未來基于卷積神經(jīng)網(wǎng)絡(luò)的農(nóng)作物估產(chǎn)研究提供科學(xué)參考。
[1] 吳炳方,蒙繼華,李強(qiáng)子. 國外農(nóng)情遙感監(jiān)測系統(tǒng)現(xiàn)狀與啟示[J]. 地球科學(xué)進(jìn)展,2010,25(10):1003-1012.
Wu Bingfang, Meng Jihua, Li Qiangzi. Review of overseas crop monitoring system with remote sensing [J]. Advances in Earth Science, 2010, 25(10): 1003-1012. (in Chinese with English abstract)
[2] 史舟,梁宗正,楊媛媛,等. 農(nóng)業(yè)遙感研究現(xiàn)狀與展望[J]. 農(nóng)業(yè)機(jī)械學(xué)報,2015,46(2):247-260.
Shi Zhou, Liang Zongzheng, Yang Yuanyuan, et al. Status and prospect of agricultural remote sensing[J]. Transactions of the Chinese Society for Agricultural Machinery, 2015, 46(2): 247-260. (in Chinese with English abstract)
[3] 陳仲新,任建強(qiáng),唐華俊,等. 農(nóng)業(yè)遙感研究應(yīng)用進(jìn)展與展望[J]. 遙感學(xué)報,2016,20(5):748-767.
Chen Zhongxin, Ren Jianqiang, Tang Huajun, et al. Progress and perspectives on agricultural remote sensing research and applications in China[J]. Journal of Remote Sensing, 2016, 20(5): 748-767. (in Chinese with English abstract)
[4] 黃健熙,黃海,馬鴻元,等. 遙感與作物生長模型數(shù)據(jù)同化應(yīng)用綜述[J]. 農(nóng)業(yè)工程學(xué)報,2018,34(21):144-156.
Huang Jianxi, Huang Hai, Ma Hongyuan, et al. Review on data assimilation of remote sensing and crop growth models[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(21): 144-156. (in Chinese with English abstract)
[5] 吳蕾,柏軍華,肖青,等. 作物生長模型與定量遙感參數(shù)結(jié)合研究進(jìn)展與展望[J]. 農(nóng)業(yè)工程學(xué)報,2017,33(9):155-166.
Wu Lei, Bai Junhua, Xiao Qing, et al. Research progress and prospect on combining crop growth models with parameters derived from quantitative remote sensing[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2017, 33(9): 155-166. (in Chinese with English abstract)
[6] Van Diepen C A, Wolf J, Van Keulen H, et al. WOFOST: A simulation model of crop production[J]. Soil Use and Management, 1989, 5(1): 16-24.
[7] Bouman B A M, Kropff M J, Tuong T P, et al. ORYZA2000: Modeling Lowland Rice[M]. Los Ba?os: International Rice Research Institute, 2003.
[8] 馮利平,高亮之,金之慶,等. 小麥發(fā)育期動態(tài)模擬模型的研究[J]. 作物學(xué)報,1997,23(4):418-424.
Feng Liping, Gao Liangzhi, Jin Zhiqing, et al. Studies on the simulation model for wheat phenology[J]. Acta Agronomica Sinica, 1997, 23(4): 418-424. (in Chinese with English abstract)
[9] Wang J, Yu Q, Lee X. Simulation of crop growth and energy and carbon dioxide fluxes at different time steps from hourly to daily[J]. Hydrological Processes, 2007, 21(18): 2474-2492.
[10] 侯英雨,何亮,靳寧,等. 中國作物生長模擬監(jiān)測系統(tǒng)構(gòu)建及應(yīng)用[J]. 農(nóng)業(yè)工程學(xué)報,2018,34(21):165-175.
Hou Yingyu, He Liang, Jin Ning, et al. Establishment and application of crop growth simulating and monitoring system in China[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(21): 165-175. (in Chinese with English abstract)
[11] 顧曉鶴,何馨,郭偉,等. 基于MODIS與TM時序插補(bǔ)的省域尺度玉米遙感估產(chǎn)[J]. 農(nóng)業(yè)工程學(xué)報,2010,26(增刊2):53-58.
Gu Xiaohe, He Xin, Guo Wei, et al. Maize yield estimation at province scale by interpolation of TM and MODIS time-series images[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2010, 26(Supp.2): 53-58. (in Chinese with English abstract)
[12] 任建強(qiáng),陳仲新,周清波,等. MODIS植被指數(shù)的美國玉米單產(chǎn)遙感估測[J]. 遙感學(xué)報,2015,19(4):568-577.
Ren Jianqiang, Chen Zhongxin, Zhou Qingbo, et al. MODIS vegetation index data used for estimating corn yield in USA[J]. Journal of Remote Sensing, 2015, 19(4): 568-577. (in Chinese with English abstract)
[13] Becker-Reshef I, Vermote E, Lindeman M, et al. A generalized regression-based model for forecasting winter wheat yields in Kansas and Ukraine using MODIS data[J]. Remote Sensing of Environment, 2010, 114(6): 1312-1323.
[14] Lambert M J, Traoré P C S, Blaes X, et al. Estimating smallholder crops production at village level from Sentinel-2 time series in Mali's cotton belt[J]. Remote Sensing of Environment, 2018, 216: 647-657.
[15] 陳聯(lián)裙,朱再春,張錦水,等. 冬小麥遙感估產(chǎn)回歸尺度分析[J]. 農(nóng)業(yè)工程學(xué)報,2010,26(增刊1):169-175.
Chen Lianqun, Zhu Zaichun, Zhang Jinshui, et al. Regression scale analysis of winter wheat yield estimation by remote sensing[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2010, 26(Supp.1): 169-175. (in Chinese with English abstract)
[16] 朱再春,陳聯(lián)裙,張錦水,等. 基于信息擴(kuò)散和關(guān)鍵期遙感數(shù)據(jù)的冬小麥估產(chǎn)模型[J]. 農(nóng)業(yè)工程學(xué)報,2011,27(2):187-193.
Zhu Zaichun, Chen Lianqun, Zhang Jinshui, et al. Winter wheat yield estimation model based on information diffusion and remote sensing data at major growth stages[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2011, 27(2): 187-193. (in Chinese with English abstract)
[17] 黎銳,李存軍,徐新剛,等. 基于支持向量回歸(SVR)和多時相遙感數(shù)據(jù)的冬小麥估產(chǎn)[J]. 農(nóng)業(yè)工程學(xué)報,2009,25(7):114-117.
Li Rui, Li Cunjun, Xu Xingang, et al. Winter wheat yield estimation based on support vector machine regression and multi-temporal remote sensing data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2009, 25(7): 114-117. (in Chinese with English abstract)
[18] Bottou L, Cun Y L. Large scale online learning[C]//Advances in neural information processing systems. 2004: 217-224.
[19] Kaul M, Hill R L, Walthall C. Artificial neural networks for corn and soybean yield prediction[J]. Agricultural Systems, 2005, 85(1): 1-18.
[20] Ji B, Sun Y, Yang S, et al. Artificial neural networks for rice yield prediction in mountainous regions[J]. The Journal of Agricultural Science, 2007, 145(3): 249-261.
[21] Kuwata K, Shibasaki R. Estimating crop yields with deep learning and remotely sensed data[C] //Geoscience and Remote Sensing Symposium (IGARSS), 2015 IEEE International. IEEE, 2015: 858-861.
[22] You J, Li X, Low M, et al. Deep gaussian process for crop yield prediction based on remote sensing data[C] //AAAI. 2017: 4559-4566.
[23] Sabini M, Rusak G, Ross B. Understanding satellite-imagery- based crop yield predictions[R]. Technical Report. Stanford University, 2017.
[24] Wang A X, Tran C, Desai N, et al. Deep transfer learning for crop yield prediction with remote sensing data[C]// Proceedings of the 1st ACM SIGCAS Conference on Computing and Sustainable Societies. ACM, 2018: 50.
[25] Zhang L, Zhang L, Du B. Deep learning for remote sensing data: A technical tutorial on the state of the art[J]. IEEE Geoscience and Remote Sensing Magazine, 2016, 4(2): 22-40.
[26] 高輝明,張正斌,徐萍,等. 2001-2009 年中國北部冬小麥生育期和產(chǎn)量變化[J]. 中國農(nóng)業(yè)科學(xué),2013,46(11):2201-2210.
Gao Huiming, Zhang Zhengbin, Xu Ping, et al. Changes of winter wheat growth period and yield in northern China from 2001-2009[J]. Scientia Agricultura Sinica, 2013, 46(11): 2201-2210. (in Chinese with English abstract)
[27] Idso S B, Jackson R D, Reginato R J. Remote-sensing of crop yields[J]. Science, 1977, 196(4285): 19-25.
[28] Kouadio L, Newlands N K, Davidson A, et al. Assessing the performance of MODIS NDVI and EVI for seasonal crop yield forecasting at the ecodistrict scale[J]. Remote Sensing, 2014, 6(10): 10193-10214.
[29] Skakun S, Franch B, Vermote E, et al. Winter wheat yield assessment using Landsat 8 and Sentinel-2 data[C] //IGARSS 2018-2018 IEEE International Geoscience and Remote Sensing Symposium. IEEE, 2018: 5964-5967.
[30] 吳炳方,曾源,黃進(jìn)良.遙感提取植物生理參數(shù)LAI/FPAR的研究進(jìn)展與應(yīng)用[J]. 地球科學(xué)進(jìn)展,2004,19(4):585-590.
Wu Bingfang, Zeng Yuan, Huang Jinliang. Overview of LAI/FPAR retrieval from remotely sensed data[J]. Advances in Earth Science, 2004, 19(4): 585-590. (in Chinese with English abstract)
[31] Ioffe S, Szegedy C. Batch normalization: Accelerating deep network training by reducing internal covariate shift[C]// ICML'15 Proceedings of the 32nd International Conference on International Conference on Machine Learning, 2015, 37: 448-456.
[32] Zhang C L, Zhang H, Wei X S, et al. Deep bimodal regression for apparent personality analysis[C]//European Conference on Computer Vision. Cham: Springer, 2016: 311-324.
Remote sensing estimation on yield of winter wheat in North China based on convolutional neural network
Zhou Liang1,2,3, Mu Haowei1,2,3, Ma Haijiao4, Chen Gaoxing5
(1.,730070,; 2.,730070,; 3.,730070,; 4.712100; 5.,100871,)
Accurate and timely winter wheat yield estimation has significant effect to grain markets and policy. Most crop estimation methods can be divided into two categories, one is based on the crop model and the other is the statistical learning method. For statistical learning methods with recent advances in deep learning, convolutional neural network (CNN) have become state-of-the-art algorithms. can extract the depth-dependent features of crop growth. However, the pivotal challenge is to combine remote sensing images with CNN. In this paper, we employ the method of histogram dimensionality reduction and time series fusion to generate the input layer. The experiment firstly performed projection transformation, splicing, mask, fusion, and clipping for 6 different MODIS images in the research area from 2006 to 2016, and then generated 21 600 fusion images of 12 bands (surface reflectance data of 7 different wavelengths in MOD09A1, surface temperature of day and night in MYD11A2, NDVI and EVI in MOD13A1, and FPAR in MOD15A2H). Then, the sensitivity range of winter wheat growth in each band is divided into 36 sections, and the histogram statistics are used to reduce the dimension to generate a vector of length 36, so the remote sensing image generates a matrix of 36×36×12 in the 228-day growing season. The corresponding time and regional statistics are applied as the output layer to construct a complete sample. The yield estimation sample database of 12 indices in the winter wheat region of north China (60 prefecture-level cities) from 2006 to 2016 was constructed, and the training set and verification set were divided into 10:1 for the training and evaluation of yield estimation model. Finally, the neural network structure is designed according to the sample, which consists of the input layer, 7 convolution layers (c1-c7), 7 activation layers, 7 batch normalization layers, 3 dropout layers, 2 full connection layers, and output layer. The number of c1-c7 convolution kernels is 64, 64, 128, 128, 256, 256, 256, the convolution kernel size is 3×3 dpi, and the sliding step length is 2, 1, 2, 2, 2, 1 and 2 respectively, 1 zero paddings per convolutional layer. At the same time, batch normalization and Relu function activation are performed on each convolutional layer, and the Dropout layer is used in the fully connected layer. The results show that: 1) The root-mean-square error (RMSE) and coefficient of determination (2) of the convolutional neural network model on the training set are 183.82 kg/hm2and 0.98 respectively. In the validation set, RMSE and2are 689.72 kg/hm2and 0.71. 2) With the same neural network structure, the average RMSE of the estimated samples from 2006 to 2016 trained as validation sets for 11 models was 772.03 kg/hm2. The error of the yield estimation model was the largest in 2007 and the smallest in 2012, and the RMSE was 920.45 kg/hm2and 632.08 kg/hm2respectively. Crop estimation algorithm based on CNN has high robustness and precision; 3) The accuracy analysis of prediction yield at the municipal level of different provinces in three temporal points of 2007, 2012 and 2016 indicates that the model has higher accuracy in most areas of the northern winter wheat region, especially, RMSE of Hebei and Shandong provinces is approximately 500 kg/hm2. The result shows that CNN is well applied to the estimation of winter wheat production. This is a great thought of remote sensing combined with the deep learning algorithm. This method can be used to estimate yield by remote sensing in different scales and regions. Compared with the traditional method, this “start-to-end” learning method has the advantage of synergy and can obtain the optimal estimation model relative to the whole area. Meanwhile, As data accumulates, the estimation accuracy will be continuously improved, and it has a good application prospect in the national agricultural production forecast.
crops; yield; remote sensing; crop yield estimation; convolutional neural network; deep learning; winter wheat
10.11975/j.issn.1002-6819.2019.15.016
S127
A
1002-6819(2019)-15-0119-10
2019-03-18
2019-06-11
國家自然科學(xué)基金項(xiàng)目(41701173,41961027);中國博士后科學(xué)基金項(xiàng)目(2016M600121);甘肅省飛天學(xué)者特聘計(jì)劃;蘭州交通大學(xué)優(yōu)秀平臺支持(201806)
周 亮,博士,副教授,研究方向?yàn)閰^(qū)域可持續(xù)發(fā)展。Email:zhougeo@126.com
周 亮,慕號偉,馬海姣,陳高星. 基于卷積神經(jīng)網(wǎng)絡(luò)的中國北方冬小麥遙感估產(chǎn)[J]. 農(nóng)業(yè)工程學(xué)報,2019,35(15):119-128. doi:10.11975/j.issn.1002-6819.2019.15.016 http://www.tcsae.org
Zhou Liang, Mu Haowei, Ma Haijiao, Chen Gaoxing. Remote sensing estimation on yield of winter wheat in North China based on convolutional neural network[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(15): 119-128. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2019.15.016 http://www.tcsae.org