楊萬(wàn)里,段凌鳳,楊萬(wàn)能
1.華中農(nóng)業(yè)大學(xué)工學(xué)院,武漢 430070; 2.華中農(nóng)業(yè)大學(xué)作物遺傳改良國(guó)家重點(diǎn)實(shí)驗(yàn)室,武漢 430070
我國(guó)是世界上最大的稻米消費(fèi)國(guó)[1],為提高我國(guó)稻米的自給率,水稻單產(chǎn)的持續(xù)增加一直是育種和栽培研究的重要目標(biāo)[2-3],精準(zhǔn)的產(chǎn)量預(yù)測(cè)可以加快育種的速度并為糧食的種植提供指導(dǎo)[4]。水稻穗部的表型特征、穗數(shù)、稻穗的投影面積等與產(chǎn)量有著極為密切的關(guān)系[5],而且穗部表型特征的識(shí)別在水稻的病蟲(chóng)害檢測(cè)、營(yíng)養(yǎng)分析、抽穗期的檢測(cè)具有重要的指導(dǎo)意義[6-7]。因此,水稻稻穗準(zhǔn)確識(shí)別和分割是水稻產(chǎn)量預(yù)測(cè)和表型研究的關(guān)鍵。
隨著近年水稻功能基因組學(xué)的發(fā)展,準(zhǔn)確快速獲取大規(guī)模群體表型數(shù)據(jù)對(duì)水稻的育種和改良具有重要意義[8-9],而傳統(tǒng)的表型數(shù)據(jù)獲取往往需要進(jìn)行大量的人工實(shí)驗(yàn)且費(fèi)時(shí)費(fèi)力,自動(dòng)化快速的表型提取方法可以突破傳統(tǒng)水稻表型技術(shù)的瓶頸,加快水稻育種速度?,F(xiàn)有研究通過(guò)圖像顏色特征分割果穗[10-12],但是這種方法分割的準(zhǔn)確度不高且容易產(chǎn)生噪聲,不能滿足復(fù)雜環(huán)境下稻穗分割的要求。隨著深度學(xué)習(xí)的快速發(fā)展,其在作物果穗的識(shí)別和分割上得到廣泛應(yīng)用。Ghosal等[13]提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的高粱穗的計(jì)數(shù)方法;Xiong等[14]提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的Panicle-SEG網(wǎng)絡(luò)進(jìn)行水稻稻穗分割,針對(duì)復(fù)雜環(huán)境具有很好的適應(yīng)性;Sadeghi-Tehran等[15]提出一種基于簡(jiǎn)單線性迭代聚類(lèi)和深度卷積神經(jīng)網(wǎng)絡(luò)的田間小麥穗自動(dòng)技術(shù)的系統(tǒng)DeepCount;段凌鳳等[16]對(duì)多個(gè)大田稻穗分割模型進(jìn)行比較,得出基于SegNet的卷積神經(jīng)網(wǎng)絡(luò)分割效果與耗時(shí)的性?xún)r(jià)比最高。部分研究基于土壤性質(zhì)[17]、氣溫、降水[18]等因素并結(jié)合遙感技術(shù)預(yù)測(cè)大田水稻產(chǎn)量,但該方法無(wú)法預(yù)測(cè)單株水稻產(chǎn)量。由于水稻產(chǎn)量預(yù)測(cè)可以更好地為生長(zhǎng)發(fā)育、遺傳育種等研究提供數(shù)據(jù)支持,因此,精確提取水稻整株和穗部的表型特征數(shù)據(jù)及產(chǎn)量預(yù)測(cè),是未來(lái)水稻育種和表型組學(xué)研究的重要內(nèi)容。
本研究使用卷積神經(jīng)網(wǎng)絡(luò)SegNet[19]和Faster R-CNN[20]對(duì)盆栽水稻稻穗分別進(jìn)行分割和穗數(shù)計(jì)數(shù),基于分割后稻穗圖像,提取穗部圖像的表型特征,結(jié)合整株水稻的顏色紋理等表型特征,構(gòu)建盆栽水稻稻穗鮮質(zhì)量、干質(zhì)量預(yù)測(cè)模型,旨在為水稻穗質(zhì)量預(yù)測(cè)提供新的思路和方法,進(jìn)一步提高水稻穗質(zhì)量預(yù)測(cè)的準(zhǔn)確性。
圖像采集系統(tǒng)如圖1A所示,采用自動(dòng)化工業(yè)流水線表型檢測(cè)平臺(tái)獲取圖像[8],盆栽水稻通過(guò)送檢線運(yùn)送到旋轉(zhuǎn)臺(tái),按照等角度旋轉(zhuǎn)13次共360°,位于水稻側(cè)面的可見(jiàn)光工業(yè)相機(jī)(AVT Stingray F-504)在每次旋轉(zhuǎn)的間隙拍攝,每盆水稻共采集13張側(cè)視png格式的RGB圖片,圖像的分辨率為2 452像素×2 056像素,自動(dòng)采集圖像并儲(chǔ)存至工作站,檢測(cè)完畢的水稻通過(guò)出檢線送出。
本試驗(yàn)的水稻品種為華粳295,試驗(yàn)基地位于華中農(nóng)業(yè)大學(xué)盆栽場(chǎng),水稻種植于塑料盆中。盆缽規(guī)格為下部直徑16 cm、上部直徑19.5 cm、盆高19 cm,每盆均裝入5.0 kg風(fēng)干土壤,添加適量水將水稻幼苗種植其中,共83盆,試驗(yàn)期間適時(shí)追肥、人工除草和病蟲(chóng)害防治。在水稻蠟熟期采集了1 079張RGB圖像,圖像獲取后,人工統(tǒng)計(jì)每株水稻的穗數(shù),并將穗部剪下稱(chēng)質(zhì)量,記作穗鮮質(zhì)量(FW),烘干后再次稱(chēng)質(zhì)量,記作穗干質(zhì)量(DW)。Faster R-CNN模型訓(xùn)練數(shù)據(jù)集材料,共322盆水稻,生長(zhǎng)環(huán)境與華粳295相同,共采集了4 186張RGB圖片。
使用Faster R-CNN目標(biāo)檢測(cè)網(wǎng)絡(luò)對(duì)稻穗進(jìn)行計(jì)數(shù)[20]。Faster R-CNN網(wǎng)絡(luò)主要包括:特征提取網(wǎng)絡(luò)CNN、區(qū)域建議網(wǎng)絡(luò)RPN、特征金字塔網(wǎng)絡(luò)FPN以及目標(biāo)區(qū)域池化ROI pooling層、分類(lèi)和回歸層。特征提取網(wǎng)絡(luò)CNN采用ResNet101殘差網(wǎng)絡(luò)結(jié)構(gòu),其中包括卷積層、激活層和池化層,其作用是在訓(xùn)練過(guò)程中對(duì)輸入CNN網(wǎng)絡(luò)的圖片進(jìn)行特征提取并輸出特征圖;FPN結(jié)構(gòu)將不同卷積層的特征圖生成一個(gè)特征圖金字塔,將特征圖金字塔輸入?yún)^(qū)域建議網(wǎng)絡(luò)RPN得到候選區(qū)域;目標(biāo)區(qū)域池化層將每個(gè)候選區(qū)域映射到特征圖上,然后對(duì)每個(gè)區(qū)域進(jìn)行最大池化得到區(qū)域建議特征圖;分類(lèi)和回歸層根據(jù)輸入的區(qū)域建議特征圖輸出候選區(qū)域的類(lèi)別和檢測(cè)框。
訓(xùn)練數(shù)據(jù)集使用322盆水稻拍攝的4 186張2 452 像素×2 056像素的盆栽水稻圖片,每張圖片中的水稻均抽穗。首先利用labellmg軟件對(duì)目標(biāo)稻穗進(jìn)行標(biāo)注,生成xml格式的文件,再轉(zhuǎn)化為json格式的文件,4 186張圖片和json文件按照3∶1的比例隨機(jī)劃分為訓(xùn)練集和驗(yàn)證集,隨后進(jìn)行模型訓(xùn)練,模型訓(xùn)練采用的是PyTorch框架,使用GPU訓(xùn)練,參數(shù)設(shè)置學(xué)習(xí)率為0.01,學(xué)習(xí)的動(dòng)量因子為0.9,權(quán)重衰減weight_decay為0.000 1,epoch為1 000,訓(xùn)練后得到稻穗檢測(cè)的模型。
稻穗分割使用的是SegNet網(wǎng)絡(luò),SegNet是由劍橋大學(xué)研發(fā)的開(kāi)源圖像分割項(xiàng)目[19],網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。在FCN網(wǎng)絡(luò)結(jié)構(gòu)上,搭建編碼解碼網(wǎng)絡(luò)結(jié)構(gòu),從而實(shí)現(xiàn)從端到端的逐像素圖像分割,圖2中綠色部分為卷積層+BN層+激活層,黃色為池化層,紅色為上采樣層,藍(lán)色為分類(lèi)層。由于本研究只需要分割出稻穗,屬于二分類(lèi)問(wèn)題,只有前景點(diǎn)和背景點(diǎn)兩個(gè)類(lèi)別,所以需要把SegNet最后1個(gè)輸出層通道數(shù)改為2,得到本研究的網(wǎng)絡(luò)結(jié)構(gòu)。
圖2 SegNet網(wǎng)絡(luò)結(jié)構(gòu)示意圖
網(wǎng)絡(luò)訓(xùn)練。第一步,訓(xùn)練數(shù)據(jù)集準(zhǔn)備。使用Photoshop對(duì)70張2 452像素×2 056像素(高×寬)的盆栽水稻圖片進(jìn)行人工標(biāo)注,將背景點(diǎn)標(biāo)注為0,稻穗像素點(diǎn)標(biāo)注為1。第二步,數(shù)據(jù)擴(kuò)增。由于盆栽圖片中稻穗部分前景點(diǎn)的像素占比很小,因此需擴(kuò)大前景點(diǎn)樣本量以保持樣本平衡,首先進(jìn)行圖片裁剪,有稻穗的區(qū)域,使用360像素×480像素(高×寬)和480像素×360像素(高×寬)的框在該區(qū)域上、下和左、右共4個(gè)方向采用滑動(dòng)窗口的形式裁剪出子圖,只有背景的區(qū)域隨機(jī)框出20%并裁減;對(duì)所有稻穗?yún)^(qū)域的子圖進(jìn)行旋轉(zhuǎn)鏡像實(shí)現(xiàn)數(shù)據(jù)擴(kuò)增,得到3 960張360像素×480像素(高×寬)的子圖。第三步,數(shù)據(jù)集劃分。將3 960張子圖按照83∶17的比例隨機(jī)劃分訓(xùn)練集和驗(yàn)證集,得到3 304張訓(xùn)練集樣本和656張驗(yàn)證集樣本,標(biāo)簽圖采用同樣的方式處理使之與子圖一一對(duì)應(yīng)。
由于訓(xùn)練樣本較少,在模型訓(xùn)練的過(guò)程中很容易導(dǎo)致過(guò)擬合,所以本研究使用網(wǎng)絡(luò)結(jié)構(gòu)相似的大田稻穗分割模型PanicleNet進(jìn)行網(wǎng)絡(luò)初始化[16],以提高模型的分割精度、縮短訓(xùn)練時(shí)間?;赾affe平臺(tái)隨機(jī)梯度下降法訓(xùn)練,學(xué)習(xí)率設(shè)置為0.001,epoch為100即所有樣本訓(xùn)練100次,訓(xùn)練集的batchsize為4,驗(yàn)證集的batchsize為2,學(xué)習(xí)的動(dòng)量因子為0.9。
1)整株特征提取。圖3左側(cè)為整體特征提取部分,主要處理過(guò)程如下:①預(yù)處理。對(duì)ROI區(qū)域進(jìn)行裁剪。②二值化。將彩色RGB圖進(jìn)行閾值分割,公式為:2G-R-B≥N(其中,G為像素點(diǎn)的綠色分量,R為紅色分量,B為藍(lán)色分量),N=20為閾值,得到水稻植株的二值圖,將整株分割的二值圖與RGB圖片進(jìn)行掩膜得到整株分割圖像。③提取綠色部分分量。使用裁剪過(guò)的植株RGB圖像,利用綠色和紅色分量,如果像素點(diǎn)綠色分量大于閾值Egthreshold并且紅色分量小于閾值ERthreshold則判定為綠色部分,與原圖掩膜得到綠色分割效果圖,Egthreshold=0.3,ERthreshold=0.15。④將預(yù)處理的RGB圖轉(zhuǎn)化為HSI圖像,然后提取I分量得到的灰度圖像與二值圖掩膜,得到最終的灰度圖。⑤將預(yù)處理的RGB圖轉(zhuǎn)化為HSL圖像,然后提取G分量的梯度圖。
基于以上的圖像處理過(guò)程可以提取51個(gè)整株水稻特征。高(H):植株形態(tài)參數(shù),植株外接矩形的高度;寬(W):植株形態(tài)參數(shù),植株外接矩形的寬度;周長(zhǎng)/面積(PAR):植株形態(tài)參數(shù),植株的周長(zhǎng)與植株投影面積的比值;總投影面積(TPA):植株形態(tài)參數(shù),植株所占的像素點(diǎn)個(gè)數(shù);面積/外接矩形的面積(TBR):植株形態(tài)參數(shù),總投影面積(TPA)與外接矩形面積的比值;高/寬(HWR):植株形態(tài)參數(shù),外接矩形高(H)與寬(W)的比值;分形維數(shù)(FDNIC):植株形態(tài)參數(shù),預(yù)處理裁剪后RGB圖的分形維數(shù);分形維數(shù)(FDIC):植株形態(tài)參數(shù),植株外接矩形裁剪后RGB圖的分形維數(shù);頻數(shù)(F1~F13):植株形態(tài)參數(shù),每盆水稻每次拍攝在360°范圍內(nèi)拍攝13張側(cè)視圖片,統(tǒng)計(jì)在13張圖片中每個(gè)相同位置像素點(diǎn)出現(xiàn)前景點(diǎn)的頻數(shù),不考慮頻數(shù)為0的點(diǎn),F(xiàn)1為13張圖中相同位置只出現(xiàn)1次前景點(diǎn)的像素個(gè)數(shù),以此類(lèi)推,得到F1~F13;緊湊度(PC1-PC6):植株形態(tài)參數(shù),反映植株的緊湊程度;綠色程度(GCV):植株顏色參數(shù),圖片中綠色部分所有像素點(diǎn)R分量數(shù)值的平均值;綠色投影面積(GPA):植株顏色參數(shù),綠色部分像素點(diǎn)個(gè)數(shù);綠色比例(GPAR):植株顏色參數(shù),綠色投影面積與整株投影面積的比值;I分量灰度直方圖:植株紋理參數(shù),均值M_I、平滑度SE_I、標(biāo)準(zhǔn)差S_I、三階矩MU3_I 、一致性U_I、熵E_I;灰度-梯度共生矩陣特征(T1~T15):植株紋理參數(shù),包含了像素的灰度信息和梯度信息,T1~T15分別表示相關(guān)性、小梯度優(yōu)勢(shì)、大梯度優(yōu)勢(shì)、能量、灰度分布不均勻性、梯度分布不均勻性、灰度均值、梯度均值、灰度熵、梯度熵、混合熵、差分矩、逆差分矩、灰度標(biāo)準(zhǔn)差、梯度標(biāo)準(zhǔn)差。
圖3 特征提取流程
2)穗部特征提取。如圖3,主要處理過(guò)程:①將所有待分割的水稻盆栽圖片裁剪為360像素×480像素(高×寬)的子圖,輸入訓(xùn)練好的Rice-PanicleNet模型,得到分割的二值水稻子圖。將這些圖片拼接得到整株的稻穗分割圖,將其與原圖掩膜,得到分割后的RGB稻穗圖。②RGB稻穗分割效果圖處理后得到H分量灰度圖、稻穗外邊緣圖 、I分量灰度圖、稻穗綠色分割二值圖,圖3只顯示穗部區(qū)域。
基于以上圖像處理過(guò)程,共提取33個(gè)穗部特征。稻穗紋理參數(shù):均值P_M_I、平滑度P_SE_I、標(biāo)準(zhǔn)差P_S_I、三階矩P_MU3_I 、一致性P_U_I、熵P_E_I、灰度-梯度共生矩陣特征(P_T1~P_T15);稻穗形態(tài)參數(shù):總投影面積P_TPA、外接矩高P_H、外接矩寬P_W、總投影面積/外接矩面積P_TBR、凸包面積P_HA、投影面積/凸包面積P_THR、周長(zhǎng)/面積P_PAR、分形維數(shù)P_FDIC、周長(zhǎng)P_P;稻穗的顏色參數(shù):黃色投影面積P_YPA、綠色投影面積P_GPA、黃色面積比P_YTR。
稻穗計(jì)數(shù)模型評(píng)估,將模型統(tǒng)計(jì)穗數(shù)與人工統(tǒng)計(jì)的實(shí)際穗數(shù)進(jìn)行比較,誤差越小,相關(guān)性越高,則模型的計(jì)數(shù)效果越好。主要的稻穗分割評(píng)價(jià)指標(biāo)有4種:交并比(IOU)、精度(Precision)、召回率(Recall)和F值(F-measure),其中,交并比(IOU)表示分割結(jié)果與實(shí)際的一致性,取值范圍為[0,1],交并比值越大表示分割效果越好,一般認(rèn)為IOU達(dá)到0.7以上,表明分割結(jié)果比較準(zhǔn)確。精度表示分割為稻穗的像素點(diǎn)中真實(shí)樣本的比例,精度越高分割效果越好。召回率是真實(shí)稻穗像素點(diǎn)被分割出來(lái)的比例,數(shù)值越大表示分割的完整性越好。F值是一個(gè)綜合性能指標(biāo),由于實(shí)際情況中,分割精度越高,召回率就越低,兩者存在矛盾,故提出由兩者計(jì)算得到的F值作為一個(gè)指標(biāo),F(xiàn)值越大,表示分割效果越好。具體公式如下:
(1)
(2)
(3)
(4)
式(1)~(4)中,SP表示預(yù)測(cè)和真實(shí)標(biāo)簽都為前景點(diǎn)的像素個(gè)數(shù),SF表示預(yù)測(cè)為前景點(diǎn)而真實(shí)標(biāo)簽為背景點(diǎn)的像素個(gè)數(shù),TP表示預(yù)測(cè)為背景點(diǎn)而真實(shí)標(biāo)簽為前景點(diǎn)的像素個(gè)數(shù),TF表示預(yù)測(cè)和真實(shí)標(biāo)簽都為背景點(diǎn)的像素個(gè)數(shù)。
在試驗(yàn)過(guò)程中,人工統(tǒng)計(jì)了每盆水稻稻穗的穗數(shù)。在測(cè)試階段閾值設(shè)置為0.5,利用訓(xùn)練好的Faster R-CNN模型,在線輸入待檢測(cè)的1 079張?jiān)糝GB圖片,輸出檢測(cè)圖。效果示意圖見(jiàn)圖4。圖4中稻穗部分用紅色矩形框標(biāo)出,同時(shí)在圖中顯示稻穗個(gè)數(shù)。每盆水稻每次拍攝13張圖片,所以檢測(cè)出13個(gè)稻穗的數(shù)值,考慮到不同角度拍照時(shí)存在遮擋及稻穗重疊的現(xiàn)象,取13張圖片中檢測(cè)到稻穗數(shù)目最大值作為檢測(cè)結(jié)果,記做穗數(shù)(PN)。
A、B、C、D為4組稻穗檢測(cè)示意圖,左邊是原始圖片的局部示意圖,右邊是檢測(cè)結(jié)果輸出圖片。A,B,C and D are four groups of schematic diagram of rice panicle detection,the left is the local schematic diagram of the original picture,and the right is the output picture of the detection result.
圖5A為Faster R-CNN模型自動(dòng)檢測(cè)穗數(shù)與人工統(tǒng)計(jì)的每盆水稻穗數(shù)的誤差。從圖5可以看出,自動(dòng)檢測(cè)與人工統(tǒng)計(jì)穗數(shù)誤差為0的有62盆,穗數(shù)誤差為1的有18盆,穗數(shù)誤差為2的有3盆;可以得出檢測(cè)完全正確的盆數(shù)占總數(shù)75%,誤差在±1以?xún)?nèi)的占總數(shù)96%。圖5B為穗數(shù)自動(dòng)檢測(cè)值與人工統(tǒng)計(jì)穗數(shù)的散點(diǎn)圖,每個(gè)點(diǎn)左側(cè)數(shù)字為該點(diǎn)的數(shù)據(jù)個(gè)數(shù),紅色線為Y=X的直線,共83個(gè)數(shù)據(jù),相關(guān)系數(shù)R2=0.760 7。
圖5 穗數(shù)自動(dòng)檢測(cè)值與人工統(tǒng)計(jì)值的相關(guān)性分析
首先,將1 079張彩色RGB原圖輸入訓(xùn)練好的SegNet模型,輸出得到二值化的分割效果圖,然后,隨機(jī)挑選6張彩色RGB原圖作為測(cè)試集,使用Photoshop人工制作標(biāo)簽,原始RGB圖片中的稻穗用白色填充,所有的背景像素用黑色填充,得到人工二值圖。將人工二值圖和SegNet模型分割二值結(jié)果圖進(jìn)行對(duì)比,計(jì)算出每張圖的IOU、Precision、Recall、F-measure。根據(jù)這些數(shù)據(jù)計(jì)算平均數(shù)。從表1可以看出,6張圖片的4個(gè)評(píng)價(jià)標(biāo)準(zhǔn)的值都在0.8以上,平均值分別為0.970、0.861、91.168%、0.838,其中,綜合評(píng)價(jià)參數(shù)F值達(dá)到91%以上,最能反映分割準(zhǔn)確度的交并比平均值達(dá)到0.83以上。
表1 分割效果評(píng)估 Table 1 Segmentation effect evaluation
本研究提取了整株水稻51個(gè)特征數(shù)據(jù)和穗部33個(gè)特征數(shù)據(jù),以及Faster R-CNN網(wǎng)絡(luò)檢測(cè)得到穗數(shù)(PN),共85個(gè)特征,人工統(tǒng)計(jì)測(cè)量得到穗數(shù)(MN)、干質(zhì)量(DW)、鮮質(zhì)量(FW)共3個(gè)數(shù)據(jù)。每張圖片85個(gè)特征數(shù)據(jù),每盆水稻13張圖像,計(jì)算13張圖片特征數(shù)據(jù)的平均值,所有數(shù)據(jù)全部歸一化處理。模型分別使用干質(zhì)量和鮮質(zhì)量作為因變量,自變量從3種不同特征數(shù)據(jù)集中篩選:整株和穗的所有85個(gè)特征數(shù)據(jù)、Faster R-CNN網(wǎng)絡(luò)檢測(cè)得到的穗數(shù)(PN)和穗部33個(gè)特征、整株水稻的51個(gè)特征。用這些自變量分別與因變量鮮質(zhì)量、干質(zhì)量數(shù)據(jù)建立預(yù)測(cè)模型,使用SPSS軟件進(jìn)行逐步線性回歸分析,若挑選出來(lái)的特征VIF低于10表示特征之間的共線性較弱,特征的Sig小于0.05表示顯著,當(dāng)所挑選的特征滿足VIF低于10和Sig小于0.05,則用于預(yù)測(cè)模型。為了驗(yàn)證模型的性能,避免產(chǎn)生過(guò)擬合的現(xiàn)象,采用K折交叉驗(yàn)證的方法,這里K取數(shù)值5,首先將所有的數(shù)據(jù)集隨機(jī)劃分為5份,每次選取其中的1份作為測(cè)試集,其余4份為訓(xùn)練集,以此建立5個(gè)預(yù)測(cè)模型并測(cè)試,記錄每次的評(píng)估參數(shù),取平均值并計(jì)算標(biāo)準(zhǔn)偏差。本研究使用R2、MAPE和SAPE作為模型的評(píng)價(jià)指標(biāo),R2為決定系數(shù)、MAPE為平均相對(duì)誤差、SAPE為相對(duì)誤差絕對(duì)值的標(biāo)準(zhǔn)差,R2越高越接近于1預(yù)測(cè)效果越好,MAPE和SAPE越小表示模型越穩(wěn)定擬合效果越好,建立的6個(gè)模型的擬合效果評(píng)估見(jiàn)表2。
由表2可知,稻穗鮮質(zhì)量的3個(gè)預(yù)測(cè)模型中,穗部特征熵(P_E_I)和灰度-梯度共生矩陣特征混合熵(P_T11)作為自變量建立的模型預(yù)測(cè)效果最好,R2為0.787±0.051、MAPE為0.107±0.024、SAPE為0.088±0.029。模型1和2對(duì)比,使用所有特征和僅使用穗特征時(shí),挑選的模型自變量一樣,而模型3僅使用整株特征預(yù)測(cè)的R2為0.505±0.177,表明穗部特征作為自變量鮮質(zhì)量的預(yù)測(cè)效果最好。
稻穗干質(zhì)量的3個(gè)預(yù)測(cè)模型中,模型4使用所有特征預(yù)測(cè)效果最好R2為0.840±0.054、MAPE為0.103±0.019、SAPE為0.087±0.019。對(duì)比模型4和5,在沒(méi)有整株特征時(shí)模型5的R2達(dá)到0.808±0.043,與模型4的R2很接近,而模型6僅使用整株特征預(yù)測(cè)時(shí),R2為0.512±0.187,這表明當(dāng)穗部特征和整株特征都作為自變量時(shí)稻穗干質(zhì)量的預(yù)測(cè)效果最好。
表2 稻穗鮮質(zhì)量和干質(zhì)量的多個(gè)預(yù)測(cè)模型五倍交叉驗(yàn)證性能評(píng)估 Table 2 Five times cross validation performance evaluation of multiple prediction models for fresh and dry weight of rice panicle
6個(gè)模型擬合效果表明,對(duì)于水稻稻穗鮮質(zhì)量的預(yù)測(cè),使用穗特征預(yù)測(cè)效果較好,而使用整株特征時(shí)預(yù)測(cè)效果相對(duì)較差;對(duì)于水稻稻穗干質(zhì)量的預(yù)測(cè),穗部特征和整株特征都作為自變量預(yù)測(cè)效果最好,僅使用整株特征預(yù)測(cè)效果相對(duì)較差。
本研究提出了一種針對(duì)室內(nèi)盆栽水稻特征提取和穗質(zhì)量預(yù)測(cè)的新方法,對(duì)比傳統(tǒng)的表型特征獲取方法,可以實(shí)現(xiàn)高通量并且快速的水稻特征提取。通過(guò)稻穗分割,提取了傳統(tǒng)方法難以獲取的穗部特征,然后使用特征數(shù)據(jù)對(duì)稻穗的鮮質(zhì)量、干質(zhì)量進(jìn)行預(yù)測(cè)。本研究基于卷積神經(jīng)網(wǎng)絡(luò)Faster R-CNN實(shí)現(xiàn)了盆栽水稻穗數(shù)的自動(dòng)檢測(cè),基于SegNet網(wǎng)絡(luò)框架訓(xùn)練模型對(duì)盆栽水稻稻穗進(jìn)行分割。利用RGB和HIS等顏色空間對(duì)整株水稻圖片和分割后稻穗圖片進(jìn)行閾值分割,經(jīng)過(guò)圖像處理,提取了51個(gè)整株水稻特征和33個(gè)穗部特征。根據(jù)提取的85個(gè)特征數(shù)據(jù),建立多個(gè)盆栽水稻稻穗鮮質(zhì)量和干質(zhì)量預(yù)測(cè)模型,使用五倍交叉驗(yàn)證對(duì)模型進(jìn)行評(píng)估,結(jié)果表明穗部特征的預(yù)測(cè)效果最好,僅使用整株特征預(yù)測(cè)相對(duì)效果最差。水稻稻穗鮮質(zhì)量預(yù)測(cè)模型中R2最高達(dá)到0.787±0.051,稻穗干質(zhì)量預(yù)測(cè)模型中R2最高達(dá)到0.840±0.054。
盆栽水稻產(chǎn)量預(yù)測(cè)對(duì)大田產(chǎn)量研究具有一定的指導(dǎo)性,由于大田水稻生長(zhǎng)環(huán)境的復(fù)雜性,生長(zhǎng)過(guò)程不可控制,產(chǎn)量預(yù)測(cè)具有一定的誤差。研究預(yù)測(cè)盆栽水稻質(zhì)量,生長(zhǎng)環(huán)境可控,因?yàn)榕柙钥梢苿?dòng)性,提取的表型數(shù)據(jù)多且數(shù)據(jù)更加精準(zhǔn),通過(guò)盆栽種植水稻預(yù)實(shí)驗(yàn),挑選出與產(chǎn)量相關(guān)性高的表型特征,在研究大田水稻時(shí)關(guān)注高相關(guān)性特征,可以大幅度提高實(shí)驗(yàn)效率,減少實(shí)驗(yàn)工作量,從而快速挑選出高產(chǎn)品種。