楊杰鍇,郭志強(qiáng),黃 遠(yuǎn),高宏盛,金 科,吳香帥,楊 杰
1. 武漢理工大學(xué)信息工程學(xué)院,寬帶無線通信與傳感器網(wǎng)絡(luò)湖北省重點實驗室,湖北 武漢 430070 2. 華中農(nóng)業(yè)大學(xué)園藝林學(xué)學(xué)院,園藝植物生物學(xué)教育部重點實驗室,湖北 武漢 430070 3. 中國農(nóng)業(yè)科學(xué)院深圳農(nóng)業(yè)基因組研究所,嶺南現(xiàn)代農(nóng)業(yè)科學(xué)與技術(shù)廣東省實驗室深圳分中心,廣東 深圳 518000
甜瓜是重要的園藝作物,生產(chǎn)上由于連作導(dǎo)致的土傳病害嚴(yán)重,影響了甜瓜的果實產(chǎn)量和品質(zhì); 嫁接不僅可以提高甜瓜抗土傳病害能力,在產(chǎn)量提升方面也有積極作用,甜瓜嫁接栽培已經(jīng)在生產(chǎn)上得到大面積應(yīng)用[1]。 嫁接愈合是嫁接苗生產(chǎn)的重要階段,愈合階段種苗質(zhì)量的評價有利于進(jìn)行環(huán)境的優(yōu)化管理。 然而,目前對于嫁接苗愈合狀態(tài)的判斷主要憑肉眼觀察接穗真葉是否出現(xiàn)和破壞性取樣測定,不僅耗時耗力,還會錯過愈合補(bǔ)救的最佳時機(jī)[2]。 因此亟需研究出快速判別嫁接苗實際愈合狀態(tài)的無損方法,提高甜瓜嫁接苗生產(chǎn)愈合階段的智慧化管理水平和種苗質(zhì)量。
如何實現(xiàn)高效、 精準(zhǔn)的嫁接苗愈合狀態(tài)分類成為人們關(guān)注的問題,尤其是嫁接后的1~7 d,是嫁接苗愈合的關(guān)鍵時間,關(guān)系著嫁接苗的愈合質(zhì)量[3]。 前人利用機(jī)器視覺技術(shù)雖能有效彌補(bǔ)人為誤差上的缺陷,但僅能從圖像層面對嫁接苗愈合狀態(tài)進(jìn)行區(qū)分,當(dāng)愈合狀態(tài)近似時識別準(zhǔn)確率將有所下降[4]。 近年來,基于圖像和光譜的分類檢測逐漸興起,高光譜成像(HSI)技術(shù)結(jié)合了機(jī)器視覺(空間信息)和連續(xù)光譜(光譜信息)的優(yōu)勢,具有快速、 準(zhǔn)確、 分類精度高等特點,能在圖像分析的基礎(chǔ)上,通過光譜分析進(jìn)一步探尋深層信息,被廣泛應(yīng)用于分類檢測[5]。 目前基于HSI的瓜類分類檢測多用于研究病蟲害感染情況,暫無針對嫁接愈合狀態(tài)研究。 本工作通過對以南瓜為砧木,甜瓜為接穗的嫁接成活苗和非成活苗在愈合期1~7 d內(nèi)連續(xù)采集高光譜圖像,在最佳預(yù)處理方法SNV-SG-SD上,提出一種融合嫁接差異信息的特征提取算法(DIS-CARS-SPA),通過構(gòu)建GS-RBF-SVM模型,實現(xiàn)對甜瓜嫁接苗愈合期1~7 d內(nèi)嫁接狀態(tài)的早期無損檢測。
選用下胚軸粗度一致、 子葉完全展開的南瓜砧木與甜瓜接穗苗。 材料培養(yǎng)在華中農(nóng)業(yè)大學(xué)園藝林學(xué)學(xué)院園藝植物生物學(xué)教育部重點實驗室進(jìn)行,采用貼接法嫁接[6]。 設(shè)置嫁接成活和非成活兩個處理,嫁接成活處理按照常規(guī)嫁接方法進(jìn)行,對于非成活處理,將接穗切口與砧木切口未完全貼合,中間留有空隙。
甜瓜嫁接苗共計500株,嫁接成活和未成活處理各250株。 嫁接完成后迅速置于透明塑料蓋中,再放入專用嫁接愈合室中進(jìn)行培養(yǎng)。 嫁接后愈合期間環(huán)境管理為第0~3天白天溫度28 ℃、 夜間溫度23 ℃,第4~7天白天溫度25 ℃、 夜間溫度20 ℃; 空氣濕度第0~3天95%,第4~7天85%; 光照強(qiáng)度第0~3天為75 μmol·m-2·s-1, 第4~7天為150 μmol·m-2·s-1。 從嫁接后第4天開始每天定時打開塑料蓋子進(jìn)行通風(fēng),避免濕度過高引起病害。
采用比利時IMEC公司制造的便攜式高光譜成像儀,工作波段470~900 nm,光譜波段數(shù)150個,拍攝范圍最大分辨率36 50×2 048像素,光照由一個150 W的鹵素光纖線光源提供。 拍攝時,根據(jù)嫁接苗大小,選擇1 000×1 000的像素分辨率,讓實時畫面獲得充分的曝光,為了避免環(huán)境光的干擾,整個系統(tǒng)放置在一個黑色的光照箱內(nèi)。 此外,一臺電腦(Inter(R) Core(TM) i5-7300HQ CPU @2.50GHz,RAM16GB)配有HSI Snapscan軟件用來獲取高光譜數(shù)據(jù)。 高光譜圖像采集時,先進(jìn)行校正,調(diào)焦,再將白板放置在鏡頭下方,使白板充滿整個畫面,直接掃描白板,最后將甜瓜嫁接苗放在鏡頭正下方直接掃描,如圖1所示。
圖1 高光譜圖像采集Fig.1 Hyperspectral image collection
二分類樣本和十四分類樣本均按照訓(xùn)練集∶測試集=7∶3進(jìn)行劃分,并通過測試集的分類精確率P作為模型評價指標(biāo),分類精確率計算為
(1)
圖2 總體研究方案Fig.2 Overall research plan
式(1)中:Npred為檢測正確嫁接成活苗和非成活苗樣本數(shù),Ntotal為實際輸入樣本數(shù)。
實驗方案由三部分組成: HSI預(yù)處理、 特征波段選取和分類模型建模分析。 實驗中需要驗證不同預(yù)處理方法、 不同特征提取方法、 不同組合類型的SVM分類模型對甜瓜嫁接狀態(tài)早期分類檢測的影響。 總體研究方案如圖2所示。
利用配套HSI Snapscan采集軟件對采集的甜瓜嫁接苗HSI數(shù)據(jù)進(jìn)行黑白標(biāo)定去噪。 因甜瓜嫁接愈合期內(nèi)的主要變化來自于新長出的真葉區(qū)域變化,故選擇真葉區(qū)域作為感興趣區(qū)域,由圖3(a)和(b)可知,感興趣區(qū)域的光譜曲線(紅色曲線)和背景區(qū)域的光譜曲線(綠色曲線)在470~900 nm范圍內(nèi)存在明顯差異; 用ENVI軟件手動圈出感興趣區(qū)域后設(shè)置二進(jìn)制掩碼(感興趣區(qū)域內(nèi)每個像素為1,背景區(qū)域為0),如圖3(c)所示。
根據(jù)掩碼圖像中感興趣區(qū)域和背景區(qū)域不一致,將感興趣區(qū)域?qū)?yīng)的高光譜圖像區(qū)域切割成30×30的塊,并返回每個塊的平均光譜再疊加,就可切分得到每一天的所有樣本光譜值,稱為原始全波段光譜數(shù)據(jù)。 另一方面,為了消除光譜數(shù)據(jù)的無關(guān)信息,提高數(shù)據(jù)和模型的魯棒性和準(zhǔn)確率,選擇常見的光譜預(yù)處理方法,如SG平滑、 一階導(dǎo)數(shù)(FD)、 二階導(dǎo)數(shù)(SD)、 標(biāo)準(zhǔn)正態(tài)變換(SNV)、 多元散射校正(MSC)等[7],與無預(yù)處理的原始光譜進(jìn)行比較對比,選取最優(yōu)的預(yù)處理方法。
圖3 分割示意圖(a): 感興趣區(qū)域和背景區(qū)域分割; (b): 感興趣區(qū)域和背景區(qū)域光譜曲線; (c): 掩碼Fig.3 Segmentation diagram(a): Segmentation of region of interest and background region; (b): Spectra of region of interest and background region; (c): Mask
基于不同預(yù)處理分別對愈合期1~7 d內(nèi)的甜瓜嫁接成活苗和非成活苗樣本按照訓(xùn)練集∶測試集=7∶3的劃分原則構(gòu)建SVM模型(選擇RBF為核函數(shù),GS為尋優(yōu)方式)。 結(jié)果如表1所示,因為SNV預(yù)處理后能減少基線漂移及光散射引起的光譜冗余數(shù)據(jù),使光譜更集中,同時SG平滑可有效去除背景噪聲,而SD預(yù)處理可明顯反映出波峰與波谷,顯示有效光譜,故將三者結(jié)合的SNV-SG-SD效果最好, 在甜瓜嫁接愈合期1~7天內(nèi)的分類準(zhǔn)確率均能達(dá)到99%以上,從而將甜瓜嫁接愈合狀態(tài)的早期分類檢測時間提前到嫁接后第1天(肉眼觀察第3~4天[3],機(jī)器視覺技術(shù)第1~2天[4])。
表1 基于不同預(yù)處理構(gòu)建SVM的同一天嫁接成活苗和非成活苗二分類結(jié)果Table 1 Two classification results of grafted survival seedlings and non-viable seedlingson the same day based on SVM constructed by different pretreatments
本方法還可對不同天嫁接成活苗或非成活苗的二分類進(jìn)行研究,選擇SNV-SG-SD預(yù)處理方法,根據(jù)多組數(shù)據(jù)組合實驗,取每組實驗結(jié)果平均值作為該組結(jié)果,篩選部分標(biāo)志結(jié)果如表2所示。 對表中標(biāo)號進(jìn)行說明,令變量Day由A={1, 2},B={3, 4, 5},C={6, 7},D={3, 4, 5, 6, 7}表示,數(shù)字代表天,若變量Day只有一個字母,則表示在所選字母集合范圍內(nèi)任選兩天進(jìn)行二分類,若表示為A-B,則從A集合中任選一天,B集合中任選一天進(jìn)行二分類,其余同理。
結(jié)果如表2所示,在愈合期內(nèi)甜瓜嫁接成活苗在第1~2天、 3~5天和6~7天二分類準(zhǔn)確率有明顯差異,其中第1~2天的準(zhǔn)確率偏低(90.17%),說明愈合初期甜瓜嫁接愈合部傷口還未修復(fù),其愈合速度較為緩慢; 第3~5天準(zhǔn)確率有了明顯上升(97.68%),說明愈合中期甜瓜嫁接愈合部傷口已經(jīng)逐漸修復(fù),呈正常愈合狀態(tài),第6~7天的準(zhǔn)確率進(jìn)一步提升達(dá)到99.15%,說明愈合后期甜瓜嫁接愈合部傷口已經(jīng)快速修復(fù),呈快速愈合狀態(tài)。 因此可認(rèn)為甜瓜嫁接成活苗在愈合期1~7 d內(nèi)愈合狀態(tài)可分成弱—中—強(qiáng)三個階段,第3天是明顯差異時間。
在愈合期內(nèi)甜瓜嫁接非成活苗在不同天的分類準(zhǔn)確率均能達(dá)到97%以上,其中第1~2天的準(zhǔn)確率相較于第3天后偏低,說明在愈合初期,非正常嫁接雖有影響,但程度不是很大,而第3天后任選兩天或第1~2天中選一天,第3天后選一天準(zhǔn)確率均為99.5%以上,說明非正常嫁接加速了變壞的過程,成為影響二分類結(jié)果的直接因素,因此可以認(rèn)為甜瓜嫁接非成活苗在愈合期1~7 d內(nèi)愈合狀態(tài)可分為弱—更弱兩個階段,第3天是明顯差異時間。
表2 基于SNV-SG-SD預(yù)處理構(gòu)建SVM的不同天嫁接成活苗/非成活苗二分類結(jié)果Table 2 Two classification results of survival/non-viable seedlings grafted on different days usingSVM constructed based on SNV-SG-SD pretreatment
2.2.1 CARS-SPA算法
以愈合期1~7 d內(nèi)甜瓜嫁接成活苗和非成活苗十四分類的特征波段提取為例,由于CARS算法易將反射率波動差異作為權(quán)重較大的變量提取為特征波段,故使用SPA算法對CARS特征提取后的特征波段進(jìn)行二次篩選,查找含有冗余信息最少的變量組[8]。 圖4(a)中采用CARS算法篩選的波段數(shù)在560~900 nm范圍內(nèi)較為密集,其中560~692和731~900 nm處更為集中,經(jīng)過CARS篩選后可得到66個特征波段。
使用SPA算法對CARS特征波段進(jìn)行降維再提取,如圖4(b)所示,篩選的特征波段數(shù)從66降到32,特征波段普遍位于582~685和730~900 nm。
2.2.2 DIS-CARS-SPA算法
CARS-SPA算法雖能進(jìn)一步簡化篩選CARS算法提取的特征波段,但由于CARS算法的隨機(jī)性,還是容易將反射率波動差異作為權(quán)重較大的波段提取為特征波段。 文獻(xiàn)[9]通過包絡(luò)線去除法提取棉花冠層的光譜差異波段,構(gòu)建估算棉花冠層葉綠素含量的BP神經(jīng)網(wǎng)絡(luò)模型,結(jié)果發(fā)現(xiàn),去包絡(luò)后冠層反射率和葉綠素含量相關(guān)性在560~740 nm波段范圍內(nèi)提高了10.7%。 文獻(xiàn)[10]通過包絡(luò)線去除法對中國西南丘陵地區(qū)的遙感影像陰影信息進(jìn)行校正重建,結(jié)果發(fā)現(xiàn),去包絡(luò)后有陰影的丘陵地區(qū)遙感影像自動分類精度提高了17.98%。 因此,借鑒光譜差異分析思想,提出DIS-CARS-SPA算法特征提取,即在預(yù)處理后先進(jìn)行嫁接差異信息的篩選,然后通過包絡(luò)線去除法確定光譜吸收曲線,再在光譜差異波段的基礎(chǔ)上進(jìn)行CARS-SPA算法特征提取,使CARS-SPA算法融合嫁接差異信息。
在愈合期1~7 d內(nèi),嫁接成活苗愈合狀態(tài)呈現(xiàn)弱—中—強(qiáng)三個階段,非成活苗愈合狀態(tài)呈現(xiàn)弱—更弱兩個階段,因此第7天的嫁接成活苗和非成活苗平均光譜曲線差異最大,
圖4 CARS-SPA算法(a): CARS算法提取的特征波段位置;(b): CARS-SPA算法提取的特征波段位置Fig.4 CARS-SPA algorithm(a): Feature band extracted by CARS algorithm;(b): Feature band extracted by CARS-SPA algorithm
圖5 嫁接差異信息選擇(a): 第7天嫁接成活苗和非成活苗的平均光譜曲線及包絡(luò)線;(b): 第7天嫁接成活苗和非成活苗的平均光譜吸收曲線;(c): DIS-CARS-SPA算法提取的特征波段位置Fig.5 The choice of grafting difference information
(a): Average spectra of grafted survival and non-viable seedlings on the 7th day; (b): Average absorption spectra of grafted survival and non-viable seedlings on the 7th day; (c): Location of the extracted feature wavelengths using DIS-CARS-SPA algorithm
可作為嫁接差異波段選擇的原始曲線。 如圖5所示,圖5(a)表示的是第7天的嫁接成活苗和非成活苗平均光譜曲線和包絡(luò)線,發(fā)現(xiàn)兩者曲線存在較大差異,將各自包絡(luò)線與實際光譜曲線相減得到光譜的吸收曲線,從圖5(b)中可以明顯發(fā)現(xiàn),552.5~634.3,651.4~697.5,709.2~900 nm三處范圍吸收曲線明顯不一,因此認(rèn)為這三個區(qū)間為甜瓜嫁接差異波段區(qū)間。 對比圖4(b)和圖5(c),圖4(b)是CARS-SPA算法提取的特征波段,最后篩選出32個特征波段,圖5(c)是DIS-CARS-SPA算法提取的特征波段,最后篩選出26個特征波段。
基于SNV-SG-SD預(yù)處理方法分別通過CARS-SPA算法和DIS-CARS-SPA算法構(gòu)建SVM模型(選擇RBF作為核函數(shù),GS作為尋優(yōu)方式),對愈合期內(nèi)不同天數(shù)(1~7 d)和不同狀態(tài)(嫁接成活苗和非成活苗)進(jìn)行十四分類,并和只預(yù)處理無特征提取步驟進(jìn)行對比。 如表3所示,只預(yù)處理未特征提取所構(gòu)建的SVM模型準(zhǔn)確率最低,僅為93.48%,預(yù)處理后經(jīng)過CARS-SPA算法所構(gòu)建的SVM模型準(zhǔn)確率達(dá)到96.26%,結(jié)果表明,特征提取可以有效降維剔除冗余信息,篩選的特征波段數(shù)從全波段150個降低至32個,分類準(zhǔn)確率提升了2.78%。 而DIS-CARS-SPA算法所構(gòu)建的SVM模型準(zhǔn)確率最高,達(dá)到96.85%,所篩選的特征波段數(shù)進(jìn)一步降低,只有26個,說明在特征提取前加入嫁接差異信息的篩選可以在更少波段的基礎(chǔ)上提升分類模型的識別準(zhǔn)確率,因此該方法是可行的。
SVM分類模型選用5種優(yōu)化算法: 網(wǎng)格尋優(yōu)(GS)、 遺傳算法(GA)、 量子遺傳算法(QGA)、 粒子群算法(PSO)、 量子粒子群算法(QPSO),4種核函數(shù): 徑向基(RBF)、 線性(LINEAR)、 多項式(POLY)、 神經(jīng)元非線性(SIGMOID)進(jìn)行建模分析。 固定RBF核函數(shù),探究不同優(yōu)化算法對SVM模型的影響,其中不同優(yōu)化算法將影響RBF核函數(shù)中的兩個重要參數(shù): 懲罰系數(shù)c和核寬度g。
如表4所示,所有優(yōu)化算法模型中,GS-SVM模型準(zhǔn)確率最高,達(dá)到96.85%,這是因為GS-SVM的可并行性高,對每個(c,g)對尋優(yōu)是相互獨立的,而其余四種算法則受不同(c,g)對組合的影響。 QPSO算法和PSO算法屬于同一類型算法,QPSO算法取消了粒子的移動方向?qū)傩?,增加了粒子位置的隨機(jī)性,在一定程度上解決了PSO算法容易陷入局部最優(yōu)解的問題,故QPSO-SVM模型準(zhǔn)確率高于PSO-SVM。 而QGA算法雖在GA算法上進(jìn)行了改進(jìn),但和GS-SVM模型準(zhǔn)確率相差較大,這是由于基礎(chǔ)GA算法對初始樣本的數(shù)量有一定依賴性,不能很好的解決大規(guī)模計算量問題,本研究對象是愈合期1~7 d內(nèi)甜瓜嫁接愈合狀態(tài)的十四分類,模型計算量大,因此準(zhǔn)確率大大降低。
以此為基礎(chǔ),選擇GS-SVM篩選的c=1 000,g=1 000作為SVM模型參數(shù),探究不同核函數(shù)選擇對十四分類準(zhǔn)確率的影響。
由表5可知,選擇RBF作為SVM模型的核函數(shù)在愈合期1~7 d內(nèi)甜瓜嫁接愈合狀態(tài)十四分類準(zhǔn)確率最高。 雖然十四分類樣本數(shù)量多,但RBF核函數(shù)具有較寬的收斂域,計算復(fù)雜度低,可以適應(yīng)大樣本情況; 而POLY核函數(shù)和SIGMOID核函數(shù)由于內(nèi)部參數(shù)眾多,當(dāng)大樣本時,核矩陣的元素值趨于無窮大,計算復(fù)雜度大幅提高,導(dǎo)致最終分類效果低; 雖然LINEAR核函數(shù)可以適應(yīng)大樣本情況,但對樣本線性度要求極高,只能解決線性可分問題,本研究非線性可分,因此導(dǎo)致分類準(zhǔn)確率低。
表3 基于SNV-SG-SD預(yù)處理后特征提取構(gòu)建SVM的嫁接成活苗/非成活苗十四分類結(jié)果Table 3 Fourteen classification results of grafted survival/non-viable seedlings by SVMbased on feature extraction after SNV-SG-SD preprocessing
表4 基于不同優(yōu)化算法的SVM模型參數(shù)選擇Table 4 Parameter selection of SVM model based on different optimization algorithms
表5 基于不同核函數(shù)的SVM模型參數(shù)選擇Table 5 Parameter selection of SVM model based on different kernel functions
以南瓜為砧木,甜瓜為接穗的甜瓜嫁接苗為研究對象,提出基于高光譜成像的甜瓜嫁接愈合狀態(tài)早期分類檢測方法。 通過樣本集劃分,先經(jīng)過SNV-SG-SD預(yù)處理,再進(jìn)行DIS-CARS-SPA特征提取,最后建立基于GS-RBF-SVM的甜瓜嫁接愈合狀態(tài)早期分類檢測模型,主要得出以下結(jié)論:
(1)方法不僅能實現(xiàn)同一天嫁接成活苗和非成活苗的二分類,還能實現(xiàn)不同天同一類型的二分類,不同天不同類型的多分類。 其中同一天的二分類效果最明顯,均能達(dá)到99%以上,說明嫁接成活苗和嫁接非成活苗在愈合期后第一天已經(jīng)呈現(xiàn)較大差異,且隨著時間推移,這種差異更加凸顯。
(2)在SNV-SG-SD最佳預(yù)處理基礎(chǔ)上,提出DIS-CARS-SPA特征提取算法,該算法融合了甜瓜成活苗和非成活苗的嫁接差異特征信息,可以在篩選更少特征波段基礎(chǔ)上,進(jìn)一步提升分類模型的識別準(zhǔn)確率。
(3)本方法可將甜瓜嫁接成活苗和非成活苗的早期分類檢測提前到嫁接后第1天(肉眼觀察第3~4天,機(jī)器視覺技術(shù)第1~2天); 同時第3天均是嫁接成活苗和非成活苗的差異突變天數(shù),嫁接成活苗狀態(tài)可分為弱—中—強(qiáng)三個階段,非成活苗狀態(tài)可分為弱—更弱兩個階段,能為甜瓜嫁接苗生產(chǎn)提供有效指導(dǎo),具有一定的理論和實踐價值。