邱鵬勛,汪小欽,茶明星,李婭麗
基于TWDTW的時(shí)間序列GF-1 WFV農(nóng)作物分類
邱鵬勛,汪小欽,茶明星,李婭麗
(福州大學(xué)/空間數(shù)據(jù)挖掘與信息共享教育部重點(diǎn)實(shí)驗(yàn)室/衛(wèi)星空間信息技術(shù)綜合應(yīng)用國(guó)家地方聯(lián)合工程研究中心/數(shù)字中國(guó)研究院(福建),福州 350108)
【】焉耆盆地是新疆重要的特色農(nóng)產(chǎn)品生產(chǎn)基地,農(nóng)作物種植結(jié)構(gòu)較為復(fù)雜。利用時(shí)間序列的遙感數(shù)據(jù)對(duì)研究區(qū)內(nèi)的農(nóng)作物進(jìn)行分類識(shí)別,獲得不同農(nóng)作物的空間分布、種植面積等信息,為政府部門制定糧食政策、經(jīng)濟(jì)計(jì)劃提供重要依據(jù)。同時(shí)探討時(shí)間加權(quán)的動(dòng)態(tài)時(shí)間彎曲(time weighted dynamic time warping,TWDTW)方法在農(nóng)作物分類識(shí)別中的適用性以及高分一號(hào)(GF-1)WFV在農(nóng)業(yè)領(lǐng)域的應(yīng)用潛力。以新疆焉耆盆地為研究區(qū)域,利用2018年作物生長(zhǎng)季的GF-1 WFV時(shí)間序列數(shù)據(jù)集計(jì)算歸一化植被指數(shù)(NDVI),基于TWDTW方法開展農(nóng)作物分類識(shí)別研究。分別采集不同作物的樣本點(diǎn),形成各作物NDVI的標(biāo)準(zhǔn)序列。利用TWDTW相似性匹配算法計(jì)算每個(gè)待分類像元與不同作物標(biāo)準(zhǔn)序列間的相似度距離,距離值越小則相似性越高,通過對(duì)比確定像元的農(nóng)作物類型,得到最終的分類結(jié)果,同時(shí)根據(jù)時(shí)間序列NDVI曲線建立決策樹(decision trees,DTs)分類規(guī)則,人工設(shè)置分類閾值得到分類結(jié)果,并與TWDTW方法的結(jié)果進(jìn)行對(duì)比分析。2種方法的分類結(jié)果較為一致,辣椒的種植范圍最廣,小麥主要分布在焉耆盆地北部和西部的農(nóng)二師二十一團(tuán),番茄和甜菜的種植分布較為零星。在種植面積統(tǒng)計(jì)中,辣椒的種植面積最大,其后依次為番茄、小麥和甜菜。利用野外樣本點(diǎn)對(duì)決策樹和TWDTW兩種方法的分類結(jié)果進(jìn)行精度驗(yàn)證,總體精度分別為89.58%和90.97%,kappa系數(shù)為0.804和0.830,TWDTW方法的分類精度相比于決策樹法略有提高。相比于決策樹分類方法,TWDTW方法的分類精度略有提高的同時(shí),分類結(jié)果客觀可靠,而且算法不受地域因素限制,具有較強(qiáng)的靈活性和適用性?;诿芗瘯r(shí)相的GF-1 WFV數(shù)據(jù)集,采用TWDTW算法對(duì)農(nóng)作物進(jìn)行分類,得到較好的分類結(jié)果,能夠滿足農(nóng)業(yè)部門的管理決策需求,該方法在農(nóng)業(yè)領(lǐng)域具有較大的應(yīng)用和推廣價(jià)值。
TWDTW;時(shí)間序列;高分一號(hào);農(nóng)作物分類;決策樹
研究區(qū)位于新疆巴音郭楞自治州的焉耆盆地(85°58′—87°26′E,41°46′—42°21′N),東臨博斯騰湖,北接天山山脈,行政范圍上包括和靜縣、和碩縣、焉耆縣以及博湖縣(圖1)。焉耆盆地具有典型的干旱綠洲氣候,春季回暖快,冬季較為寒冷,日照時(shí)間長(zhǎng),光熱資源豐富。該地區(qū)地勢(shì)平坦,開都河貫穿其間,水資源較為豐富,適合農(nóng)業(yè)發(fā)展。焉耆盆地是新疆重要的特色農(nóng)產(chǎn)品生產(chǎn)基地,番茄產(chǎn)業(yè)經(jīng)過30多年的發(fā)展,已成為該區(qū)域的優(yōu)勢(shì)產(chǎn)業(yè),番茄制品銷往全國(guó)各地。辣椒在該區(qū)域內(nèi)大面積種植,生產(chǎn)的辣椒質(zhì)量好、產(chǎn)量高,是全國(guó)重要的辣椒生產(chǎn)基地。同時(shí),研究區(qū)內(nèi)還種有小麥、甜菜等農(nóng)作物,種植結(jié)構(gòu)較為復(fù)雜。
圖1 研究區(qū)地理位置樣本點(diǎn)分布圖
1.2.1 GF-1/WFV數(shù)據(jù)集 本文所使用的GF-1/WFV影像數(shù)據(jù)集是從中國(guó)資源衛(wèi)星應(yīng)用中心獲取的,空間分辨率為16 m,共10個(gè)時(shí)相(5-1、5-9、5-21、6-19、8-16、8-28、9-5、9-22、10-4和11-26)。利用DEM數(shù)據(jù)對(duì)影像進(jìn)行正射校正,采用輻射定標(biāo)和大氣校正消除大氣等因素的干擾。對(duì)于某一特定時(shí)相,僅利用單景影像無法覆蓋整個(gè)研究區(qū)的情況,采用多景影像鑲嵌,并根據(jù)研究區(qū)范圍對(duì)影像進(jìn)行裁剪,得到邊界一致的數(shù)據(jù)集。由于NDVI能夠很好地反映綠色植被的生長(zhǎng)情況,對(duì)所有預(yù)處理后數(shù)據(jù)進(jìn)行NDVI計(jì)算,得到NDVI時(shí)間序列數(shù)據(jù)集,為后續(xù)農(nóng)作物分類做準(zhǔn)備。
1.2.2 樣本數(shù)據(jù)集 為了更好地驗(yàn)證農(nóng)作物分類結(jié)果,2018年7月對(duì)研究區(qū)內(nèi)的農(nóng)作物種植情況進(jìn)行了實(shí)地調(diào)察。采用GPS定點(diǎn)及拍照的方式,共收集到樣本點(diǎn)243個(gè)(圖1),根據(jù)實(shí)地調(diào)查樣本點(diǎn)的分布情況,以及谷歌地球影像上不同農(nóng)作物的色彩和紋理等特征進(jìn)行目視判讀,再增加118個(gè)樣本點(diǎn),共361個(gè)樣本構(gòu)建樣本數(shù)據(jù)集,其中辣椒103個(gè),小麥86個(gè),甜菜48個(gè),番茄54個(gè),蘆葦和其他植被58個(gè),非農(nóng)業(yè)區(qū)樣本12個(gè)。
利用農(nóng)作物樣本點(diǎn)和GF-1 WFV時(shí)間序列數(shù)據(jù)構(gòu)建NDVI時(shí)序曲線,時(shí)序曲線的波形反映了農(nóng)作物的生長(zhǎng)變化情況。根據(jù)不同作物生長(zhǎng)的物候特征,利用TWDTW算法對(duì)研究區(qū)內(nèi)的農(nóng)作物進(jìn)行分類。同時(shí)建立決策樹分類規(guī)則進(jìn)行對(duì)比,分析TWDTW方法在農(nóng)作物分類中的適用性。圖2為本文的技術(shù)路線。
圖2 農(nóng)作物分類流程圖
1.3.1 農(nóng)作物物候特征 由于不同農(nóng)作物對(duì)生長(zhǎng)的氣候條件有不同的要求,因此它們最適宜的種植也存在差異。利用樣本點(diǎn)與NDVI時(shí)間序列數(shù)據(jù)集生成農(nóng)作物的NDVI時(shí)序曲線圖(圖3),可以發(fā)現(xiàn)研究區(qū)內(nèi)小麥的最大生育期在5月底到6月初之間,7月收獲,是最早種植的農(nóng)作物。番茄和辣椒的種植時(shí)間都在4月底,但是番茄的生長(zhǎng)季較短,NDVI值在8月初達(dá)到最高,8月下旬開始收獲,而辣椒的收獲期是在9月下旬,這段時(shí)期的NDVI下降幅度較大。甜菜和蘆葦?shù)纳L(zhǎng)季都較長(zhǎng),甜菜在9月底達(dá)到生長(zhǎng)高峰,之后NDVI值迅速下降,是研究區(qū)內(nèi)收獲最遲的農(nóng)作物。
1.3.2 時(shí)間加權(quán)的動(dòng)態(tài)時(shí)間彎曲算法 時(shí)間加權(quán)的動(dòng)態(tài)時(shí)間彎曲算法是在動(dòng)態(tài)時(shí)間彎曲(DTW)算法的基礎(chǔ)上引入了時(shí)間權(quán)重因子,基于動(dòng)態(tài)規(guī)劃思想,尋找一條最小累計(jì)距離的路徑[30]。計(jì)算兩序列的相似性程度時(shí),不僅要考慮匹配點(diǎn)的數(shù)值大小,還要考慮匹配點(diǎn)間的時(shí)間跨度,避免序列間嚴(yán)重的畸形匹配現(xiàn)象[31]。
設(shè)有兩長(zhǎng)度分別為和的時(shí)間序列為:
當(dāng)你需要“布置任務(wù)”的時(shí)候,要轉(zhuǎn)過他的臉,看著他的眼,微笑,用較慢的語速說出你的需要,并讓寶貝確認(rèn)你想要表達(dá)的內(nèi)容他是否明白。這只是第一步,接下來你需要給他足夠反應(yīng)的時(shí)間,跟他商量什么時(shí)間可以完成。第三步,你需要適時(shí)地提醒他。最后,孩子完成了任務(wù),要為他豎起大拇指點(diǎn)贊;完不成任務(wù)則要和孩子一起找原因,建立下一次的規(guī)則。不斷重復(fù)這一過程,在重復(fù)中幫助孩子建構(gòu)時(shí)間規(guī)則。
圖3 農(nóng)作物NDVI時(shí)序曲線
A={a,=1,2,…,}T(1)
B={b,=1,2,…,}T(2)
構(gòu)造時(shí)間序列和的距離矩陣為:
s×m=(s)×m(3)
式中,s為兩序列間的基距離,一般采用歐式距離的平方和時(shí)間權(quán)重的乘積作為TWDTW的基距離,即:
s=w×s(4)
s=(a-b)2(6)
式中,w為權(quán)重值,為增益因子,值越大則對(duì)匹配點(diǎn)間隔差異的懲罰越大,為距離因子,m一般為時(shí)間序列的中間節(jié)點(diǎn),本文設(shè)為150。設(shè)時(shí)間序列和在處的累積距離為Q,公式如下:
(i,j)=min[(i-1, j),(i-1, j-1),(i, j-1)]+s (7)
(1,1)=11(8)
在尋找最小累積距離路徑時(shí),應(yīng)滿足:
(1)max{,}≤≤+-1
(2)若Q=s, Q1=s則0≤-≤1,0≤≤1。
從樣本數(shù)據(jù)集中隨機(jī)選擇20%的樣本作為分類訓(xùn)練樣本,提取各類樣本點(diǎn)在NDVI影像上的均值作為標(biāo)準(zhǔn)序列的節(jié)點(diǎn)值,逐像元計(jì)算待分像元與標(biāo)準(zhǔn)序列間的TWDTW距離值,值越小則相似性程度越高。通過對(duì)比待分像元與各類農(nóng)作物標(biāo)準(zhǔn)序列的相似性程度,確定像元屬性,得到最終分類結(jié)果。
運(yùn)算效率是應(yīng)用TWDTW算法最大的挑戰(zhàn),其計(jì)算時(shí)間與影像的時(shí)相數(shù)、像元數(shù)以及分類體系的復(fù)雜程度相關(guān)。為了提高運(yùn)算效率,本文對(duì)影像進(jìn)行分塊,采用多線程方法實(shí)現(xiàn)TWDTW的并行計(jì)算,極大地提高了該算法的時(shí)間效率。
1.3.3 決策樹分類方法 根據(jù)不同作物具有不同的物候特征,本文采用決策樹對(duì)農(nóng)作物進(jìn)行分類。決策樹方法是通過設(shè)定一些判斷條件對(duì)原始影像進(jìn)行逐步的二分和細(xì)化[32-33]。其中,每一個(gè)分叉點(diǎn)代表一個(gè)決策判斷條件,每個(gè)分叉點(diǎn)下有兩個(gè)葉節(jié)點(diǎn),分別代表滿足條件和不滿足條件[34-35]。根據(jù)農(nóng)作物生長(zhǎng)的NDVI時(shí)序曲線(圖2),選取待分作物與其他作物特征差異較大的敏感時(shí)期,設(shè)定判斷條件,并通過不斷地嘗試確定合理的分類閾值,建立分類規(guī)則(圖4)。
決策樹分類規(guī)則本著先易后難的原則,選取目標(biāo)農(nóng)作物與背景特征差異較大的“關(guān)鍵物候期”,優(yōu)先提取較好區(qū)分的農(nóng)作物。對(duì)于物候特征相近的農(nóng)作物,綜合利用多時(shí)相NDVI值,通過簡(jiǎn)單的物候?qū)W算法,構(gòu)建農(nóng)作物的分類條件,增大目標(biāo)作物與背景特征的差異程度,設(shè)定閾值提取目標(biāo)作物。由于小麥的種植時(shí)間最早,與研究區(qū)內(nèi)其他農(nóng)作物的物候期基本不重疊,NDVI在141 d時(shí)達(dá)到峰值,在228 d時(shí)已經(jīng)回落到較低狀態(tài),分別對(duì)這兩時(shí)期的NDVI影像設(shè)定閾值提取小麥。番茄和辣椒的最佳種植期都在4月底,雖然播種時(shí)間相近,但是番茄生長(zhǎng)周期短,在191 d時(shí)達(dá)到最大生育期,之后NDVI不斷下降,利用番茄在191 d到240 d NDVI差值較大的特點(diǎn)提取番茄。由于甜菜的收獲時(shí)間最遲,在277 d時(shí)NDVI值還處于較高水平,但僅利用這一時(shí)相還不能完全區(qū)分甜菜與蘆葦,根據(jù)NDVI時(shí)序曲線圖(圖2)可以發(fā)現(xiàn),甜菜在170 d到228 d時(shí)NDVI還處于上升趨勢(shì),而蘆葦處于下降趨勢(shì),通過兩時(shí)相差值區(qū)分兩類作物。辣椒和蘆葦?shù)奈锖蚯€較為相似,但辣椒在生育期高峰的228、240和248 d的NDVI值都大于蘆葦,而且辣椒生長(zhǎng)季開始較蘆葦晚,在170 d和141 d時(shí)NDVI都比蘆葦?shù)?,通過后三期影像減去前面兩期得到辣椒提取指標(biāo)。對(duì)于剩下未分類的區(qū)域,只需要區(qū)分其他和非植被區(qū)2個(gè)類別,對(duì)于非植被區(qū),NDVI值全年都處于較低狀態(tài),選取植被生長(zhǎng)最旺盛3個(gè)時(shí)期(170 d、191 d和240 d)的影像值進(jìn)行相加,設(shè)定閾值可有效地剔除非植被區(qū)域。
圖4 農(nóng)作物分類規(guī)則
TWDTW和決策樹2種方法的分類結(jié)果如圖5所示。從圖中可以看出,2種方法的分類結(jié)果較為一致,其中辣椒的種植范圍分布較廣,小麥主要分布在焉耆盆地北部的和碩縣、和靜縣以及農(nóng)二師二十一團(tuán)。相比于辣椒和小麥,番茄和甜菜的種植規(guī)模較小,且分布較為零星。在博斯騰湖西岸,主要分布著蘆葦及一些其他植被,這與野外考察的真實(shí)情況相符合。
對(duì)研究區(qū)內(nèi)各縣(市)的農(nóng)作物種植面積進(jìn)行統(tǒng)計(jì),可以發(fā)現(xiàn)2種分類方法估算農(nóng)作物種植面積的結(jié)果較為接近(表1),其中番茄種植面積差異較大,這主要與番茄種植地塊較為零星有關(guān),混合像元增加了分類的不確定性。從TWDTW分類結(jié)果中可以得到,研究區(qū)內(nèi)4種農(nóng)作物的總種植面積為105 413.6 hm2,其中辣椒的種植面積最大,占總種植面積的69.6%,其次分別為番茄、小麥和甜菜,種植比例分別為14.4%、9.9%和6.1%。
表1 各縣市農(nóng)作物種植面積統(tǒng)計(jì)表
圖5 農(nóng)作物分類結(jié)果
將除訓(xùn)練樣本外剩余的290個(gè)樣本點(diǎn)作為驗(yàn)證樣本,分別對(duì)2種方案的分類結(jié)果進(jìn)行精度驗(yàn)證(表2—3)。采用決策樹分類結(jié)果的總體精度(overall accuracy,OA)為89.58%,kappa系數(shù)為0.804;基于TWDTW算法分類結(jié)果的整體精度為90.97%,kappa系數(shù)為0.830,TWDTW算法的分類精度略好于決策樹。
從用戶精度(user accuracy,UA)的角度來看,不管是決策樹還是TWDTW算法分類,小麥和番茄的分類精度都是所有類別中最高的2類?;跊Q策樹的分類方法中,小麥的用戶精度達(dá)到98.55%,只有1個(gè)樣本被錯(cuò)分,而TWDTW分類方法中有4個(gè)小麥樣本被錯(cuò)分,用戶精度為94.20%?;赥WDTW分類方法相比于決策樹,除小麥的用戶精度有降低外,其他類別的作物精度都略有提高。番茄的精度從87.75%上升到91.84%,辣椒和甜菜的用戶精度分別上升了2.22%和5.00%。
從制圖精度(producer accuracy,PA)的角度來看,除了其他植被與甜菜以外,基于2種分類方法的其他3類農(nóng)作物的分類精度都高于90%?;赥WDTW分類方法與決策樹方法相比,除了番茄的精度有降低的情況外,其他類別的農(nóng)作物均有小幅提高。在2種分類結(jié)果中,蘆葦及其他植被的分類精度都較低,主要是其他農(nóng)作物與該類別間均存在一些樣本點(diǎn)誤分現(xiàn)象。
表2 決策樹分類混淆矩陣
表3 TWDTW分類混淆矩陣
決策樹分類方法通過分析不同農(nóng)作物的物候特征,選取特定時(shí)相建立分類條件,通過不斷地試驗(yàn)確定類別閾值,分類結(jié)果雖然能夠達(dá)到較高精度,但分類規(guī)則受人為主觀影響較大,且需要不斷地試驗(yàn)才有可能獲得滿意的結(jié)果?;谀骋粎^(qū)域特定年份建立的決策規(guī)則普適性不高,無法推廣到其他區(qū)域和應(yīng)用于其他年份,對(duì)于不同的研究區(qū)或不同年份,均需構(gòu)建不同的分類規(guī)則?;赥WDTW相似性匹配算法,根據(jù)樣本點(diǎn)與時(shí)間序列NDVI數(shù)據(jù)建立不同作物的標(biāo)準(zhǔn)序列,不需要選取作物分類的“關(guān)鍵物候期”,通過計(jì)算并比較待分像元與各類作物樣本的相似性程度,無需設(shè)定閾值,自動(dòng)生成分類結(jié)果。農(nóng)作物在生長(zhǎng)過程中,由于種植時(shí)間的差異性及作物生長(zhǎng)快慢導(dǎo)致曲線偏移,時(shí)間權(quán)重的加入使得TWDTW不僅能夠解決這種偏移現(xiàn)象,又能很好地區(qū)分作物間的差異[28,36]。Belgiu等[29]和Manabe等[31]利用TWDTW方法在不同研究區(qū)提取農(nóng)作物都取得了較高的精度。而決策樹分類條件的設(shè)定較為固定,容易忽略同種作物生長(zhǎng)具有快慢的客觀規(guī)律,造成作物間的誤分現(xiàn)象。因此,相比于決策樹方法,TWDTW分類精度有所提高,分類結(jié)果客觀可靠,而且算法不受地域因素和不同年份限制,具有較強(qiáng)的靈活性和適用性,在農(nóng)作物分類中具有較大的應(yīng)用潛力。
本文主要采用NDVI作為農(nóng)作物區(qū)分的特征指數(shù),NDVI能夠很好地顯示植被的生長(zhǎng)狀態(tài),但對(duì)于生長(zhǎng)季時(shí)間相近的農(nóng)作物,采用TWDTW方法有可能導(dǎo)致誤分現(xiàn)象。如分類結(jié)果中,有6個(gè)其他作物樣本點(diǎn)被誤分為辣椒,它們的生長(zhǎng)物候規(guī)律與辣椒較為相近。為了進(jìn)一步提高分類精度,針對(duì)這種現(xiàn)象可以考慮增加一些其他特征來加大作物間的差異,擴(kuò)大相似性距離,從而識(shí)別不同的農(nóng)作物。本文基于TWDTW算法的農(nóng)作物識(shí)別分類仍然存在一些未解決的問題?;谙裨鳛橛跋穹诸惖姆治鰡卧嬖凇巴锂愖V,異物同譜”的現(xiàn)象,分類結(jié)果較為破碎,存在同一田塊被分為多種農(nóng)作物的情況,分類的完整性有待進(jìn)一步提高,在今后的工作中,可以通過影像分割,基于面向田塊的方法進(jìn)一步提高影像的分類精度。在分類樣本選擇中,本文通過選取分類體系中所有作物類型,通過比較作物間相似程度確定待分像元的屬性,對(duì)于單一作物空間信息的自動(dòng)化提取還有待進(jìn)一步研究,在今后的工作中,希望通過算法自動(dòng)確定單一作物的分類閾值,實(shí)現(xiàn)對(duì)農(nóng)作物專題信息的自動(dòng)提取。
中低分辨率的衛(wèi)星影像由于幅寬較大適用于大面積種植作物的信息提取,但對(duì)于種植結(jié)構(gòu)復(fù)雜的區(qū)域具有較大的局限性,無法保證提取的精度。相比于中低分辨率的MODIS等其他衛(wèi)星影像,GF-1 WFV具有更高的空間分辨率,能夠更加準(zhǔn)確地反映特定作物地生長(zhǎng)變化情況。楊閆君等[37]采用時(shí)間序列的GF-1 WFV數(shù)據(jù),利用SVM分類器對(duì)唐山市南部區(qū)域的農(nóng)作物進(jìn)行分類,分類精度達(dá)到了96.33%。姬忠林等[38]基于決策樹模型和面向?qū)ο蟮姆诸惙椒ǎ肎F-1 WFV數(shù)據(jù)提取揚(yáng)州市冬小麥和油菜的種植信息,提取精度分別為97%和96%。從本文的分類精度和前人的研究成果都表明GF-1 WFV數(shù)據(jù)在農(nóng)作物的分類識(shí)別中具有較大的應(yīng)用潛力。
GF-1 WFV數(shù)據(jù)與中低分辨率的影像相比,雖然在空間分辨上具有一定的優(yōu)勢(shì),但對(duì)于地塊較為破碎的地區(qū),如焉耆縣和博湖縣的大部分地區(qū),由于存在混合像元,分類結(jié)果較為零星,存在一定的誤差。位于和靜縣和焉耆縣交界的農(nóng)二師二十一團(tuán)以及和碩縣,由于地塊面積大且形狀工整,在分類結(jié)果中,田塊的邊緣信息較為清晰,農(nóng)作物在空間分布上也具有較高的連續(xù)性和完整性,與野外考察的實(shí)際情況相符合,分類精度較高。為了提高農(nóng)作物的分類精度,在今后的研究中可以考慮采用更高分辨率的影像,或者結(jié)合高分辨率與中等分辨率影像對(duì)農(nóng)作物進(jìn)行監(jiān)測(cè),實(shí)現(xiàn)農(nóng)作物種植結(jié)構(gòu)的精細(xì)提取。
相比于其他的中等分辨率遙感數(shù)據(jù),如Landsat系列數(shù)據(jù)具有16 d的時(shí)間分辨率,高分一號(hào)衛(wèi)星具有較短的重訪周期,4 d的重訪周期極大地增加了獲取無云和少云影像的機(jī)率。在本研究中,選取了研究區(qū)2018年作物生長(zhǎng)季的10個(gè)不同時(shí)相的GF-1 WFV影像,而覆蓋該區(qū)域農(nóng)作物生長(zhǎng)季無云和少云的Lansat8 OLI數(shù)據(jù)總共才8個(gè)時(shí)相,限制了準(zhǔn)確獲取農(nóng)作物關(guān)鍵物候期的機(jī)率,不利于作物的識(shí)別。隨著GF-6衛(wèi)星發(fā)射升空,GF-1將與該衛(wèi)星形成星座,時(shí)間分辨率從4 d縮短到了2 d,能更加充分地滿足精準(zhǔn)農(nóng)業(yè)的要求,為我國(guó)的農(nóng)業(yè)發(fā)展提供數(shù)據(jù)保障。
本文基于時(shí)間序列GF-1 WFV數(shù)據(jù),采用TWDTW方法對(duì)研究區(qū)內(nèi)的農(nóng)作物進(jìn)行識(shí)別,并與決策樹分類結(jié)果進(jìn)行對(duì)比。結(jié)果表明,TWDTW方法在農(nóng)作物分類識(shí)別中能夠取得較高的分類精度,除辣椒和其他外,其余農(nóng)作物的分類精度都高于90%,能夠滿足作物監(jiān)測(cè)管理的需求;對(duì)于農(nóng)作物種植結(jié)構(gòu)復(fù)雜且不同作物間物候具有差異性的地區(qū),采用決策樹分類方法,結(jié)合簡(jiǎn)單的物候?qū)W算法,雖然也能夠得到較高的分類精度,但是分類主觀性強(qiáng),分類規(guī)則無法推廣到其他區(qū)域。TWDTW相比于決策樹具有更高的靈活性和適用性,在精準(zhǔn)農(nóng)業(yè)方面具有廣闊的應(yīng)用前景。
[1] 陳水森, 柳欽火, 陳良富, 李靜, 劉強(qiáng). 糧食作物播種面積遙感監(jiān)測(cè)研究進(jìn)展. 農(nóng)業(yè)工程學(xué)報(bào), 2005, 21(6): 166-171.
Chen S S, LIU Q H, CHEN L F, Li J, Liu Q. Review of research advances in remote sensing monitoring of grain crop area., 2005, 21(6): 166-171.(in Chinese)
[2] 胡瓊, 吳文斌, 宋茜, 余強(qiáng)毅, 楊鵬, 唐華俊. 農(nóng)作物種植結(jié)構(gòu)遙感提取研究進(jìn)展. 中國(guó)農(nóng)業(yè)科學(xué), 2015, 48(10): 1900-1914.
Hu Q, Wu W B, Song Q, Yu Q Y, Yang P, Tang H J. Recent progresses in research of crop patterns mapping by using remote sensing., 2015, 48(10): 1900-1914.(in Chinese)
[3] 唐華俊, 吳文斌, 楊鵬, 周清波, 陳仲新. 農(nóng)作物空間格局遙感監(jiān)測(cè)研究進(jìn)展. 中國(guó)農(nóng)業(yè)科學(xué), 2010, 43(14): 2879-2888.
Tang H J, Wu W B, Yang P, Zhou Q B, Chen Z X. Recent progresses in monitoring crop spatial patterns by using remote sensing technologies., 2010, 43(14): 2879-2888. (in Chinese)
[4] Gómez C, White J C, Wulder M A. Optical remotely sensed time series data for land cover classification: A review., 2016, 116: 55-72.
[5] 宋茜. 基于GF-1/WFV和面向?qū)ο蟮霓r(nóng)作物種植結(jié)構(gòu)提取方法研究[D]. 北京: 中國(guó)農(nóng)業(yè)科學(xué)院, 2016.
Song Q. Object-based image analysis with machine learning algorithms for cropping pattern mapping using GF-1/WFV imagery[D]. Beijing: Chinese Academy of Agricultural Sciences, 2016. (in Chinese)
[6] Wu W, Yu Q, Peter V H, You L, Yang P, Tang H. How could agricultural land systems contribute to raise food production under global change., 2014, 13(7): 1432-1442.
[7] Congalton R G. A review of assessing the accuracy of classifications of remotely sensed data.1998, 37(2): 270-279.
[8] 劉亞群. 基于多時(shí)相遙感影像的黑河流域農(nóng)作物種植結(jié)構(gòu)提取研究[D]. 重慶: 重慶交通大學(xué), 2016.
Liu Y Q. Changes in crop planting structure of the Heihe River basin in china based on the multi-temporal NDVI from TM/ETM+/OLI images. Chongqing: Chongqing Jiaotong University, 2016. (in Chinese)
[9] Vintrou E, Desbrosse A, Begue A, Traore S, Baron C, Lo Seen D. Crop area mapping in west Africa using landscape stratification of MODIS time series and comparison with existing global land products., 2012, 14(1): 83-93.
[10] Shao Y, Lunetta R S, Wheeler B, Iiames J S, Campbell J B. An evaluation of time-series smoothing algorithms for land-cover classifications using MODIS-NDVI multi-temporal data., 2016, 174: 258-265.
[11] Zhang J, Feng L, Yao F. Improved maize cultivated area estimation over a large scale combining MODIS–EVI time series data and crop phenological information., 2014, 94: 102-113.
[12] Chen Y, Lu D, Moran E, Batistella M, Dutra L V, Sanches I D A, Da Silva R F B, Huang J, Luiz A J B, de Oliveira M A F. Mapping croplands, cropping patterns, and crop types using MODIS time-series data., 2018, 69: 133-147.
[13] 楊小喚, 張香平, 江東. 基于MODIS時(shí)序NDVI特征值提取多作物播種面積的方法. 資源科學(xué), 2004, 26(6): 17-22.
Yang X H, Zhang X P, Jiang D. Extraction of multi-crop planting areas from MODIS data., 2004, 26(6): 17-22. (in Chinese)
[14] 陳穎姝, 張曉春, 王修貴, 羅強(qiáng), 熊勤學(xué), 羅文兵. 基于Landsat8 OLI與MODIS數(shù)據(jù)的洪澇季節(jié)作物種植結(jié)構(gòu)提取. 農(nóng)業(yè)工程學(xué)報(bào), 2014, 30(21): 165-173.
Chen Y S, Zhang X C, Wang X G, Luo Q, Xiong Q X, Luo W B. Extraction of crop planting structure in seasons prone to waterlogging using Landsat8 OLI and MODIS data., 2014, 30(21): 165-173. (in Chinese)
[15] 張煥雪, 曹新, 李強(qiáng)子, 張淼, 鄭新奇. 基于多時(shí)相環(huán)境星NDVI時(shí)間序列的農(nóng)作物分類研究. 遙感技術(shù)與應(yīng)用, 2015, 30(2): 304-311.
Zhang H X, Cao X, Li Q Z, Zhang M, ZhenG X Q. Research on crop identification using multi-temporal NDVI HJ images., 2015, 30(2): 304-311. (in Chinese)
[16] 白照廣. 高分一號(hào)衛(wèi)星的技術(shù)特點(diǎn). 中國(guó)航天, 2013(8): 5-9.
Bai Z G. Technical characteristics of GF-1 satellite., 2013(8): 5-9. (in Chinese)
[17] 郭燕, 武喜紅, 程永政, 王來剛, 劉婷. 用高分一號(hào)數(shù)據(jù)提取玉米面積及精度分析. 遙感信息, 2015, 30(6):31-36.
Guo Y, Wu X H, ChenG Y Z, Wang L G, Liu T. Maize recognition and accuracy evaluation based on high resolution remote sensing (GF-1) data., 2015, 30(6): 31-36. (in Chinese)
[18] 劉原峰. 基于多時(shí)相GF-1 WFV影像的綠洲主要糧食作物識(shí)別及估產(chǎn)——以民勤綠洲為例[D]. 蘭州: 西北師范大學(xué), 2016.
Liu Y F. Oasis main food crops remote-sensing recognition and yield estimation based on multi-temporal GF-1 WFV Images a case study in Minqin Oasis. Lanzhou: Northwest Normal University, 2016. (in Chinese)
[19] 黃健熙, 侯矞焯, 蘇偉, 劉峻明, 朱德海. 基于GF-1 WFV數(shù)據(jù)的玉米與大豆種植面積提取方法. 農(nóng)業(yè)工程學(xué)報(bào), 2017, 33(7): 164-170.
Huang J X, Hou Y Z, Su W, Liu J M, Zhu D H. Mapping corn and soybean cropped area with GF-1 WFV data., 2017, 33(7): 164-170. (in Chinese)
[20] 原繼東, 王志海. 時(shí)間序列的表示與分類算法綜述. 計(jì)算機(jī)科學(xué), 2015(3): 1-7.
Yuan J D, Wang Z H. Review of time series representation and classification techniques., 2015(3): 1-7. (in Chinese)
[21] Arvor D, Jonathan M, Meirelles M S P, Dubreuil V, Durieux L. Classification of MODIS EVI time series for crop mapping in the state of Mato Grosso, Brazil., 2011, 32(22): 7847-7871.
[22] SAKOE H, CHIBA S. Dynamic programming algorithm optimization for spoken word recognition., 1978, 26(1): 43-50.
[23] Keogh E. Exact indexing of dynamic time warping., 2005, 7: 386-758.
[24] Hamooni H. Phoneme sequence recognition via DTW-based classification., 2016, 48: 253-275.
[25] Jeong Y S, Jeong M K, Omitaomu O A. Weighted dynamic time warping for time series classification., 2011, 44(9): 2231-2240.
[26] 鐘禮山, 李滿春, 伍陽, 夏南, 程亮. 利用SAR影像時(shí)間序列的耕地提取研究. 地理科學(xué)進(jìn)展, 2015, 34(7): 830-839.
Zhong L S, Li M C, Wu Y, Xia N, Cheng L. Cropland extraction using SAR time series image.2015, 34(7): 830-839. (in Chinese)
[27] 葉燕清, 楊克巍, 姜江, 葛冰峰, 豆亞杰. 基于加權(quán)動(dòng)態(tài)時(shí)間彎曲的多元時(shí)間序列相似性匹配方法. 模式識(shí)別與人工智能, 2017, 30(4): 314-327.
Ye Y Q, Yang K W, Jiang J, Ge B F, Dou Y J. Multivariate time series similarity matching method based on weighted dynamic time warping algorithm., 2017, 30(4): 314-327. (in Chinese)
[28] Maus V, C?amara G, Appel M. dtwSat: Time-weighted dynamic time warping for satellite image time series analysis in R., 2017, 90(1): 1-30.
[29] Belgiu M. Sentinel-2 cropland mapping using pixel-based and object-based time weighted dynamic time warping analysis., 2018, 204: 509-523.
[30] Guan X, Huang C, Liu G. Mapping rice cropping systems in Vietnam using an NDVI-based time-series similarity measurement based on DTW distance., 2016, 8(19): 3390-3415.
[31] Manabe V D, Melo M R S, Rocha J V. Framework for mapping integrated crop-livestock systems in Mato Grosso, Brazil., 2018, 10(9): 1-17.
[32] 王凱, 趙軍, 朱國(guó)鋒, 張佩云, 劉江濤, 陳棟棟. 基于GF-1遙感數(shù)據(jù)決策樹與混合像元分解模型的冬小麥種植面積早期估算. 遙感技術(shù)與應(yīng)用, 2018, 33(1): 158-167.
Wang K, Zhao J, Zhu G F, Zhang P Y, Liu J T, Chen D D. Early estimation of winter wheat planting area in Qingyang city by decision tree and pixel unmixing methods based on GF-1 satellite data., 2018, 33(1): 158-167. (in Chinese)
[33] 王連喜, 徐勝男, 李琪, 薛紅喜, 吳建生. 基于決策樹和混合像元分解的江蘇省冬小麥種植面積提取. 農(nóng)業(yè)工程學(xué)報(bào), 2016, 32(5): 182-187.
Wang L X, Xu S N, Li Q, Xue H X, Wu J S. Extraction of winter wheat planted area in Jiangsu province using decision tree and mixed-pixel methods., 2016, 32(5): 182-187. (in Chinese)
[34] 蘇偉, 姜方方, 朱德海, 展郡鴿, 馬鴻元, 張曉東. 基于決策樹和混合像元分解的玉米種植面積提取方法. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2015, 46(9): 289-295.
Su W, Jiang F F, Zhu D H, Zhan J G, MA H Y, Zhang X D. Extraction of maize planting area based on decision tree and mixed-pixel unmixing methods.2015, 46(9): 289-295. (in Chinese)
[35] 周靜平, 李存軍, 史磊剛, 史姝, 胡海棠, 淮賀舉. 基于決策樹和面向?qū)ο蟮淖魑锓植夹畔⑦b感提取. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2016, 47(9): 318-326.
Zhou J P, Li C J, Shi L G, Shi S, Hu H T, Huai H J. Crops distribution information extracted by remote sensing based on decision tree and object-oriented method.2016, 47(9): 318-326. (in Chinese)
[36] 管續(xù)棟, 黃翀, 劉高煥. 基于DTW距離的時(shí)序相似性方法提取水稻遙感信息—以泰國(guó)為例. 資源科學(xué), 2014, 36(2): 267-272.
Guan X D, Huang C, Liu G H. Extraction of paddy rice area using a DTW distance based similarity measure.2014, 36(2): 267-272. (in Chinese)
[37] 楊閆君, 占玉林, 田慶久, 顧行發(fā), 余濤, 王磊. 基于GF-1/ WFVNDVI時(shí)間序列數(shù)據(jù)的作物分類. 農(nóng)業(yè)工程學(xué)報(bào), 2015, 31(24): 155-161.
Yang Y J, Zhan Y L, Tian Q J, Gu X F, Yu T, Wang L. Crop classification based on GF- 1/WFV NDVI time series., 2015, 31(24): 155-161. (in Chinese)
[38] 姬忠林, 張?jiān)缕? 李喬玄, 劉紹貴, 李淑娟, 任紅艷. 基于GF-1影像的冬小麥和油菜種植信息提取. 遙感技術(shù)與應(yīng)用, 2017, 32(4): 760-765.
Ji Z L, Zhang Y P, Li Q X, Liu S G, Li S J, Ren H Y. Planting information extraction of winter wheat and rape based on GF-1 images., 2017, 32(4): 760-765. (in Chinese)
Crop Identification Based on TWDTW Method and Time Series GF-1 WFV
Qiu PengXun, Wang XiaoQin, Cha MingXing, Li YaLi
(Fuzhou university/Key Laboratory of Spatial Data Mining and Information Sharing of Ministry of Education/National & Local Joint Engineering Research Center of Satellite Geospatial Information Technology/The Academy of Digital China (Fujian), Fuzhou 350108)
【】Yanqi Basin is an important production base of characteristic agricultural products in Xinjiang, and the planting structure of crops is complicated. In this study, the time series remote sensing data were used to classify and identify crops in the study area, so as to obtain the spatial distribution of different crops and their planting areas, which were the important basis for government sectors to formulate grain policies and economic plans. At the same time, the applicability of time-weighted dynamic time warping (TWDTW ) method in crop classification and the application potential of GF-1 WFV in agriculture were also discussed.【】The normalized vegetation index (NDVI), calculated from the 2018 time series GF-1 WFV data set in Yanqi Basin, Xinjiang, was used to study the crops recognition based on TWDTW method. Sample points of different crops were collected to form standard sequence of NDVI for each crop. The TWDTW similarity matching algorithm was used to calculate the similarity distance between each pixel to be classified and the standard sequence of different crops. The smaller the distance was, the higher the similarity was. The similarity was used to determine the crop type of the pixel, and the final classification result was obtained. At the same time, the classification rules of decision tree were established according to the NDVI curve of time series, and the classification result was obtained by manually setting the classification threshold, and compared with that of the TWDTW method. 【】The classification results of the two methods were very consistent. Peppers were the most widely planted and the wheat was mainly distributed in the northern part of the Yanqi Basin and the 21st Division of the Second Agricultural Division. The distributions of tomato and sugar beet were relatively sporadic. Among the results of planting area, pepper had the largest planting area, followed by tomato, wheat and sugar beet. The accuracy of the classification results of the TWDTW and decision tree methods was verified by the field sample points: the overall accuracy of them were 89.58% and 90.97%, respectively, and the kappa index of them were 0.804 and 0.830, respectively. The classification accuracy of the TWDTW method was slightly higher than that of the decision tree method. 【】Compared with the decision tree classification method, the classification accuracy of the TWDTW method was slightly improved, the classification result was more objective and reliable. The algorithm of TWDTW method was not limited by geographical factors and had strong flexibility and applicability. The experimental results showed that using TWDTW algorithm to identify crops based on the GF-1 WFV data set of dense temporal phase could get better classification results, and it had great application and popularization value in agricultural field.
TWDTW;time series; GF-1; crop identification; decision trees
10.3864/j.issn.0578-1752.2019.17.004
2019-04-20;
2019-07-03
國(guó)家重點(diǎn)研發(fā)計(jì)劃課題(2017YFB0504203)、中央引導(dǎo)地方發(fā)展專項(xiàng)(2017L3012)
邱鵬勛,E-mail:490909513@qq.com。通信作者汪小欽,E-mail:wangxq@fzu.edu.cn
(責(zé)任編程 楊鑫浩)