摘要:為快速精準(zhǔn)識(shí)別水稻種質(zhì)資源,開發(fā)一種基于高光譜的高效識(shí)別方法。以9種稻種為試驗(yàn)樣品,利用光譜儀測定2 700顆種子的高光譜反射率,利用主成分分析法(principal component analysis,PCA)對(duì)高光譜數(shù)據(jù)進(jìn)行降維處理。為探討PCA最佳的主成分個(gè)數(shù),比較了不同主成分個(gè)數(shù)與判別分析法(線性判別、二次判別和馬氏距離判別)組合在基于種子高光譜數(shù)據(jù)建立水稻品種識(shí)別模型中的效果。對(duì)全波段數(shù)據(jù)樣本進(jìn)行主成分分析,以2~20個(gè)主成分個(gè)數(shù)作為特征變量,以預(yù)測集正確率為評(píng)價(jià)指標(biāo),建立3個(gè)品種判別模型,并比較其預(yù)測效果。結(jié)果表明,以累積貢獻(xiàn)率≥85% 為評(píng)價(jià)標(biāo)準(zhǔn),選擇2 個(gè)主成分,3 種模型預(yù)測集正確率分別為32.14%、38.69%和33.73%;以特征值≥1為標(biāo)準(zhǔn),選擇11個(gè)主成分,預(yù)測集正確率為68.21%、87.33%和83.18%;若考慮模型的正確率,選擇20個(gè)主成分,預(yù)測集正確率分別為84.99%、95.71%和95.32%。利用主成分分析+判別分析方法的稻種高光譜品種識(shí)別模型可行,但主成分個(gè)數(shù)不同,判別分析法的評(píng)價(jià)標(biāo)準(zhǔn)不同,識(shí)別效果差異大。當(dāng)主成分個(gè)數(shù)相同時(shí),3種判別標(biāo)準(zhǔn)中二次判別分析方法的識(shí)別效果最佳,最佳組合為20個(gè)主成分個(gè)數(shù)+二次判別分析法,預(yù)測集正確率為95.71%。研究結(jié)果表明基于高光譜技術(shù)與主成分分析的識(shí)別方法可快速識(shí)別不同稻種,具有較高的應(yīng)用價(jià)值。
關(guān)鍵詞:稻種;高光譜技術(shù);主成分分析;品種識(shí)別
doi:10.13304/j.nykjdb.2023.0640
中圖分類號(hào):S126 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):10080864(2025)03010408
水稻品種繁多,不同品種稻種存在差異,有的品種間差異大,有的品種間差異并不十分明顯[1-3]。隨著水稻品種數(shù)量增加,在種子種植、運(yùn)輸和儲(chǔ)藏過程中易發(fā)生混雜和種質(zhì)質(zhì)量降低現(xiàn)象,造成利益損失。稻種品種分類主要有電泳法、分子標(biāo)記法及基于人工嗅覺、拉曼光譜及近紅外光譜的識(shí)別技術(shù)[34]。其中,人工嗅覺識(shí)別技術(shù)誤差較大,電泳法、 分子標(biāo)記法、拉曼光譜技術(shù)以及近紅外光譜技術(shù)存在樣品準(zhǔn)備工作繁瑣、耗時(shí)長、不能無損檢測等缺陷。高光譜技術(shù)可在一系列波長下獲取被測對(duì)象光譜信息,對(duì)被測物外部特性和內(nèi)部成分進(jìn)行綜合分析[4],廣泛用于農(nóng)產(chǎn)品品種分類、損傷識(shí)別以及安全檢測等領(lǐng)域[56]。
利用高光譜技術(shù)進(jìn)行農(nóng)業(yè)物料品種識(shí)別的研究主要集中在大豆、玉米、小麥等作物。楊歡等[7]基于高光譜技術(shù)提出無損、快速的玉米種子純度識(shí)別方法;黃敏等[8]利用高光譜技術(shù)結(jié)合多尺度三維卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建小麥種子的品種快速識(shí)別模型;段丁丁等[9]基于冠層光譜數(shù)據(jù)進(jìn)行不同馬鈴薯品種區(qū)分研究。由于高光譜數(shù)據(jù)為高維非線性數(shù)據(jù),具有數(shù)據(jù)量大、噪聲、冗余和多重共線性等問題。因此,利用高光譜技術(shù)進(jìn)行品種分類時(shí)降低數(shù)據(jù)維度、提高模型分類準(zhǔn)確率和計(jì)算效率成為了關(guān)鍵。主成分(principal componentsanalysis,PCA)分析法具有減少原始數(shù)據(jù)信息損失、簡化數(shù)據(jù)結(jié)構(gòu)、避免主觀隨意性等優(yōu)點(diǎn),可將多個(gè)存在相關(guān)關(guān)系的性狀指標(biāo)簡化為幾個(gè)能反映原來主要性狀指標(biāo)的綜合指標(biāo)[10],因而在許多領(lǐng)域的綜合評(píng)價(jià)中被廣泛應(yīng)用。本課題組前期利用主成分分析方法對(duì)雜交稻芽種物理特性進(jìn)行評(píng)價(jià),構(gòu)建了科學(xué)評(píng)價(jià)體系,初步判定各種雜交稻種樣本的綜合得分,表明主成分分析方法具備構(gòu)建科學(xué)的量化評(píng)價(jià)體系能力[11]。
為此,本文基于高光譜技術(shù)與主成分分析開發(fā)一種水稻品種識(shí)別方法。該方法利用光譜儀測定種子高光譜反射率,結(jié)合主成分分析法對(duì)高光譜數(shù)據(jù)進(jìn)行降維,確定最佳主成分個(gè)數(shù),并比較不同主成分個(gè)數(shù)與3種判別分析法(線性判別、二次判別和馬氏距離判別)組合在基于種子高光譜數(shù)據(jù)建立的水稻品種識(shí)別模型中的效果,以期為開發(fā)水稻品種及品質(zhì)快速無損檢測的專用儀器提供理論支持。
1 材料與方法
1.1 供試材料
選用華南稻區(qū)的9種水稻為試驗(yàn)樣品,由華南農(nóng)業(yè)大學(xué)和廣東省金稻種業(yè)有限公司提供,分別是五優(yōu)1179、五優(yōu)6133、泰豐優(yōu)208、順兩優(yōu)1179、培雜泰豐、特優(yōu)2068、恒豐優(yōu)1179、軟華優(yōu)1179、軟華優(yōu)6100。試驗(yàn)于2022年12月至2023年2月在桂林廣西師范大學(xué)機(jī)械工程中心實(shí)驗(yàn)室進(jìn)行。
1.2 數(shù)據(jù)采集及試驗(yàn)樣本劃分
篩選顆粒飽滿種子,采用高溫烘干法測定含水率[11],得到種子含水率分布在39.7%~52.1%。將手持式物料光譜探測針放在每顆所測種子測定部位處,如圖1所示,在護(hù)穎、內(nèi)穎、外穎以及稃尖4個(gè)部位測量光譜數(shù)據(jù),數(shù)據(jù)經(jīng)斷點(diǎn)校正之后,取均值作為該種子的光譜數(shù)據(jù)。為消除光譜數(shù)據(jù)在采集時(shí)首端與末端產(chǎn)生的噪音,選擇400~2 300 nm的光譜數(shù)據(jù)進(jìn)行分析。