鄒昆霖,張若宇,江英蘭
(石河子大學機械電氣工程學院/農業(yè)部西北農業(yè)裝備重點實驗室,新疆 石河子832003)
棉花是關系國計民生的戰(zhàn)略物資,對國民經(jīng)濟和社會發(fā)展有著重要影響[1]。準確測量棉花種植面積和空間分布,對棉花田間管理,精確測量棉田單產,優(yōu)化棉花種植格局具有重要意義[2]。
目前作物種植面積和空間分布測量主要依靠遙感方法進行。張芳等[3]基于遙感圖像進行農田判別分類和面積計算取得了良好的效果;Cong Ming 等[4]提出了一種評價無監(jiān)督遙感圖像分類輸入?yún)?shù)的初步分析方法,該方法能自動確定無監(jiān)督圖像分類的適當初始簇數(shù)及其對應的中心,在不需要先驗知識的情況下,可以有效地實現(xiàn)無監(jiān)督圖像的分類,獲得準確的分類結果;李曉東等[5]采用多時相遙感數(shù)據(jù)分類計算農田,通過地表植被時序變化過程結合印象紋理等多維空間數(shù)據(jù)對水田和旱田進行了分類;潘影等[6]利用遙感影像采用決策樹算法將背景農業(yè)地表覆蓋進行多種類別的劃分,共劃分出39類農業(yè)地表類型,采用歸一化植被指數(shù)計算了北京地區(qū)裸露農田的面積,為利用遙感圖像檢測棉田信息起到了指導作用;李敏等[7]采用衛(wèi)星遙感影像通過物候歷分析和主要農作物的光譜特征,確定了棉花識別的最佳時相,并建立了識別模型;辛海強等利用遙感影像提取了包括棉花種植面積、棉花長勢、病蟲害等信息,為棉花遙感檢測研究和棉田精細化管理打下了基礎。
上述方法中遙感數(shù)據(jù)獲取的時間周期長,由于空間分辨率受限,采用遙感手段獲取作物信息的精度也有待進一步提高[8]。
無人機近地面成像因其空間分辨率高、成本低、周期短和可重復性強等特點[9],在土地和作物信息監(jiān)測等方面逐步得到應用[10-12]。無人機低空成像分類主要有2 種。第1 種是基于光譜圖像以各類植被指數(shù)為基礎的分類方法。田振坤等[13]以冬小麥為研究對象,利用農作物的波譜特征和植被指數(shù)NDVI變化閾值,對作物分類方法進行研究,結果表明該方法對農作物分類具有較高的準確性和普適性;高林等[14]研究對比分析了無人機高光譜數(shù)據(jù)計算的紅邊參數(shù)和光譜指數(shù)與冬小麥葉面積指數(shù)的相關性,結果表明多種光譜指數(shù)與植物信息具有較強相關性,為利用無人機高光譜遙感數(shù)據(jù)開展相關研究積累了經(jīng)驗。第2 種是采用可見光相機以各類紋理特征為基礎的分類方法。如李宗南等[15]利用小型無人機采集可見光圖像并計算圖像紋理特征,研究了基于該特征的玉米倒伏面積的提取方法,取得了較高精度;韓文霆等[16]提取了27 項玉米田的紋理特征設計了玉米種植信息提取算法,結果表明該方法面積計算的誤差控制在20%以內;郭鵬等[17]對比了可見光下植被指數(shù)和紋理特征在棉花、玉米、葡萄作物分類方法,結果表明基于色彩與紋理特征提取方法優(yōu)于色彩指數(shù)的提取方法,總體精度較高,但未嘗試對兩類特征的聯(lián)合。
本文在現(xiàn)有研究基礎上分別對脫葉機采棉田、未脫葉手采棉田、冬小麥田、裸地的色彩、植被指數(shù)和農田紋理特征進行計算和分析,對比色彩、植被指數(shù)和紋理特征在農田作物分類提取中的特點,整合各類特征的優(yōu)勢,實現(xiàn)了棉田精確提取和面積估測,進而為棉田精細化管理以及棉田產量精確估測提供一定的支撐。
研究區(qū)域位于新疆維吾爾自治區(qū)石河子墾區(qū),地理坐標是北緯43°26′-45°20′,東經(jīng)84°58′-86°24′,平均海拔高度450.8 m,處天山北麓中段,古爾班通古特大沙漠南緣;該地區(qū)屬于溫帶大陸性氣候,冰凍期長,夏季炎熱。
該地區(qū)作物種植制度為一年一熟,主要種植經(jīng)濟作物棉花;棉花以機采棉為主,少部分為手采棉,機采棉在9月前后兩次噴施脫葉劑,10月收獲,手采棉不噴施脫葉劑,進行人工采收。
圖1 研究區(qū)域示意圖Fig.1 Sketch map of study area
本研究數(shù)據(jù)于2017年9月17日在石河子大學農田實驗站內實驗獲得。實驗選用F450 機架配合PIXHawk 飛控(PIXhawk 2.4.6,權盛電子科技股份有限公司,中國)作為低空成像載具,該無人機為4 軸無人機,采用垂直起降方式。該機機身重量282 g,起飛重量800-1200 g,對稱電機軸距450 mm;根據(jù)該機載荷,選用鷹眼飛螢6S 可見光運動相機(飛螢6S,鷹眼航拍科技有限公司,中國)進行數(shù)據(jù)采集實驗;其飛行高度100 m,采用懸停垂直向下方式拍攝,縱向重復度大于80%,橫向重復度大于60%。實驗當天天氣晴朗,最高氣溫29 ℃,無風。
無人機所拍攝圖像由Agisoft Photoscan 軟件(PhotoScan X64,Agisoft 股份有限公司,俄羅斯,http://www.agisoft.ru)進行正射影校正和拼接。在軟件中選擇高對齊精度和高精度密集點云模式拼接航拍圖像獲得正射影圖像。影像共包含1706×4096 圖像源,圖像橫向分辨率為0.12 m/pixel、縱向分辨率為0.12 m/pixel,面積約為163.32 畝(0.10888 km2)。由于部分影像涉及居民區(qū)等因素,為避免對棉田判別算法造成影響,本研究選取了位于研究區(qū)域南部的部分地區(qū)作為感興趣區(qū)域。感興趣區(qū)域被單獨劃分出來,面積34 m2,圖像大小為784×458,共359072個像素,數(shù)據(jù)格式為.tif,RGB 三個通道,8 字節(jié)存儲,亮度范圍0-255。
1.3.1 圖像特征分析
本研究將感興趣區(qū)域中包含多種地面物體的圖像劃分為脫葉棉田、未脫葉棉田、冬小麥田、裸地4種類型,每種類型選取3 塊區(qū)域樣本作為訓練樣本,每個樣本區(qū)域大小為81×68,共66096 個像素點作為訓練集(圖2),其余292976 個像素點作為測試集,選取4 種地物特征的典型圖像,并提取顏色、植被指數(shù)、紋理特征進行分析,從而評選出適于區(qū)分不同地物類型的關鍵特征作為棉田像素判別提取的依據(jù)。
圖2 各類型地區(qū)典型樣本Fig.2 Typical sample of fields
1.3.2 特征提取
選用的可見光相機僅采集可見光下紅、綠、藍3個通道的信息,無近紅外等其他波段圖像的信息。為解決圖像分類特征量較少的問題,通過色彩空間變換、植被指數(shù)計算、紋理分析等方法進行圖像增強得到了更多特征。
植被指數(shù)是指利用綠色植被對不同波段的光照敏感性不同的特點,對不同波段進行組合運算,增強圖像信息。它本質上是綜合考慮各有關光譜信號,把多波段反射率做一定的運算,使有效圖像信息增強,同時過濾無效信息[18]。胡勇等[19]研究者選取歸一化綠紅差異指數(shù)[20]、歸一化綠藍差異指數(shù)[21]、紅綠比值指數(shù)[22]、藍綠比值指數(shù)[23]、過綠指數(shù)[24]、過紅指數(shù)[20]、標準植被指數(shù)[20]、超綠超紅差分指數(shù)[25]、植被顏色指數(shù)[26]、紅綠藍植被指數(shù)[27]、可見光波段差異植被指數(shù)[24]等植被指數(shù),各植被指數(shù)計算公式如表1所示。同時,圖像的色調、飽和度、明度和紅、綠、藍通道值也可作為單一輸入變量的植被指數(shù)。
計算植被指數(shù)以及圖像的色調、飽和度、明度和紅、綠、藍通道值,得到共計18 項植被指數(shù)特征。
表1 植被指數(shù)計算公式Tab.1 Calculation formula of vegetation index
紋理是由灰度分布在空間位置上反復交替變化而形成的,所以在圖像空間中相隔某距離的兩個像素間存在一定的相關,即圖像中灰度的空間相關特性[28]。
灰度共生矩陣是一種比較常見的、區(qū)別能力強的描述紋理特征的方法,通過由圖像灰度值之間二階聯(lián)合條件概率密度所構成的矩陣來反映圖像中任意兩點間灰度的空間相關特性[29]。
本文對RGB 色彩空間3 通道灰度值采用13×13 的窗口大小,步長取1,移動方向取0°進行紋理特征提取,得到多尺度紋理。
描述紋理特征的統(tǒng)計量采用RGB 各通道均值、方差、協(xié)同性、信息熵、二階矩、相關性。本文得到共計18 項紋理特征。
使用ENVI4.8 軟件中的統(tǒng)計功能,選擇3 處脫葉棉田、3 處未脫葉棉田、3 處冬小麥田和3 處裸地(圖2),計算這些區(qū)域36 項特征值。
1.3.3 棉田像素判別和面積估算
主成分分析(PCA)方法是在各個變量之間相關關系研究的基礎上,用一組較少的、互不相關的新變量代替原來較多的變量,并使這些新變量盡可能多地保留原來復雜變量所反映信息的一種數(shù)據(jù)分析方法,具有較好的降維去噪能力[30]。
本文先采用PCA 算法對分別對植被指數(shù)和紋理18 個特征進行主成分分析,輸出主成分個數(shù)為18 個,分別采用2 至18 個主成分為特征進行最大似然分類[31]法判別棉田像素;再采用PCA 算法對全部色彩與紋理特征共36 個特征進行主成分分析,輸出特征數(shù)為36 個,分別采用2 至36 個主成分為特征進行最大似然分類法[31]判別棉田像素。
統(tǒng)計分類結果中脫葉棉田和未脫葉棉田的像素數(shù)量,兩類棉田總面積為棉田總面積,如式1 所示,依據(jù)空間分辨率計算棉田面積。
以人工目視提取結果為基準計算誤差,誤差計算方法如式(2)。
式中:S為棉田面積(m2),n為像素點個數(shù),γS為空間分辨率(m2/pixel);
式(2)中:E為誤差,S1為人工目視識別棉田的面積(m2),S2為分類算法計算的棉田面積(m2)。
判別中分別基于植被指數(shù)特征、紋理特征和綜合特征對脫葉棉田、未脫葉棉田、冬小麥田、裸地圖像PCA 處理,再采用最大似然分類法判別棉田,分別對脫葉棉田面積、未脫葉棉田面積和棉田總面積與人工目視標記結果進行對比計算誤差。
棉田面積計算誤差如圖3所示,判別結果如圖4所示。
圖3 棉田面積誤差Fig.3 Error of cotton field area
圖4 判別結果圖Fig.4 Classification results
由圖3a 可知:基于植被指數(shù)的分類方法主成分個數(shù)為6 個時,總面積誤差相對較小。該條件下計算的棉田總面積誤差為13.11%,脫葉棉田面積誤差為12.38%,未脫葉棉田面積誤差為13.90%。判別結果如圖4a 所示。
由圖3b 可知:基于紋理特征的分類方法當主成分個數(shù)為5 個時總面積誤差最小,但脫葉棉田和未脫葉棉田的誤差均較大。由圖4b 可見:部分脫葉棉田與未脫葉棉田相互錯分,導致了總體誤差小于兩類棉田各自的分類誤差。通過觀察圖3b 可以發(fā)現(xiàn)當主成分個數(shù)在2-7 個時,全部棉田的誤差與兩類棉田誤差呈現(xiàn)不規(guī)則分布。隨著主成分個數(shù)的增加,模型分類準確率逐漸提高。當主成分個數(shù)在8-18 個分時,全部棉田誤差穩(wěn)定的分布在兩種棉田誤差之間,同時總體誤差趨于穩(wěn)定。這表明兩種棉田相互出錯誤判別的情況減少,分類誤差逐步趨于穩(wěn)定。在紋理分類方法主成分個數(shù)為8-18 范圍內,主成分個數(shù)為10 個時誤差最小,面積誤差為1.99%;脫葉棉田面積誤差為0.97%,未脫葉棉田面積誤差為5.17%。判別結果如圖4c 所示。
由圖3c 可知:兩類特征綜合分類方法主成分個數(shù)為30 個時總面積誤差最小,總面積誤差為0.51%;脫葉棉田面積誤差為0.32%,未脫葉棉田面積誤差為0.72%。判別結果如圖4d 所示。
(1)基于植被指數(shù)的分類方法在棉田面積判別中的誤差為13.11%。由圖3a 可知該方法在多數(shù)主成分個數(shù)條件下(前5 個主成分條件下除外)脫葉棉田的誤差較大,而未脫葉棉田的誤差相對較小。脫葉棉田誤差主要是由于脫葉棉田與裸地在植被指數(shù)上差別不夠顯著,因此該方法判別脫葉棉田的精度較差。
同時,脫葉棉田誤差和未脫葉棉田誤差始終分布在總體誤差兩側,說明在植被指數(shù)空間內脫葉棉田與未脫葉棉田混淆的現(xiàn)象不明顯,脫葉棉田與未脫葉棉田在植被指數(shù)上的差別較為明顯。
該方法主成分個數(shù)大于6 時,誤差隨著主成分個數(shù)的增加而增大,表明該方法所選特征中有部分特征噪聲,干擾棉田面積判別。
(2)基于紋理特征的分類方法在棉田分類中的誤差為1.99%,該方法在主成分大于8 個時,對脫葉棉田和未脫葉棉田的判別誤差均明顯小于基于植被指數(shù)特征的判別方法。該方法在主成分小于8 個時,出現(xiàn)脫葉棉田誤差與未脫葉棉田誤差均大于總體誤差的現(xiàn)象。
通過觀察圖4b 可以發(fā)現(xiàn)部分脫葉棉田與未脫葉棉田錯分現(xiàn)象,說明脫葉棉田與未脫葉棉田在紋理上的區(qū)別不夠顯著。同時該方法結果中脫葉棉田分類誤差小于總體誤差和脫葉棉田誤差,說明脫葉棉田在紋理特征上與其他地物區(qū)別較為明顯,該方法對脫葉棉田的判別精度高于未脫葉棉田。
(3)基于綜合特征分類方法中的誤差為0.51%,較其他兩類方法有較為明顯的降低。該方法在主成分個數(shù)大于15 個時趨于穩(wěn)定,而且脫葉棉田與未脫葉棉田的誤差分布于總體誤差兩側,脫葉棉田與未脫葉棉田相互混淆的現(xiàn)象不明顯。
表2 不同判別方法結果與誤差Tab.2 Results and errors of cotton field area extraction
本文借助無人機低空成像技術的優(yōu)勢,利用可見光相機采集棉田及周邊圖像,通過對比分析植被指數(shù)特征和紋理特征在區(qū)分脫葉棉田、未脫葉棉田、冬小麥田、裸地的效果,結果發(fā)現(xiàn):
(1)植被指數(shù)特征在區(qū)分未脫葉棉田上具有一定優(yōu)勢,紋理特征在區(qū)分裸地和脫葉棉田上具有顯著優(yōu)勢。
(2)綜合兩類特征的優(yōu)勢,采用PCA 算法結合兩類特征,借助最大似然分類法判別棉田像素,最終得到棉田面積估測誤差為0.51%,其中脫葉棉田誤差為0.72%,未脫葉棉田誤差為0.32%,表明該方法可以比較有效的計算棉田面積,可為收獲期棉田面積測量和空間分布分析提供參考。