王 冬, 王 坤, 吳靜珠*, 韓 平*
1. 北京農(nóng)業(yè)質(zhì)量標(biāo)準(zhǔn)與檢測(cè)技術(shù)研究中心, 北京 100097 2. 北京工商大學(xué)食品安全大數(shù)據(jù)技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室, 北京 100048 3. 農(nóng)業(yè)農(nóng)村部農(nóng)產(chǎn)品質(zhì)量安全風(fēng)險(xiǎn)評(píng)估實(shí)驗(yàn)室(北京), 北京 100097
種子作為農(nóng)業(yè)投入品,是農(nóng)業(yè)生產(chǎn)過程的重要生產(chǎn)資料,其品質(zhì)對(duì)農(nóng)業(yè)經(jīng)濟(jì)有著至關(guān)重要的影響。種子質(zhì)量是種子品質(zhì)分級(jí)的重要指標(biāo),關(guān)系到種子存儲(chǔ)過程的安全問題,并且可對(duì)種子等級(jí)劃分以及優(yōu)劣判定進(jìn)行定量描述。種子活力直接影響種子的發(fā)芽速度、出苗整齊度以及抵抗逆環(huán)境生長(zhǎng)的能力,與植株的生長(zhǎng)優(yōu)勢(shì)和生產(chǎn)潛力密切相關(guān); 而老化種子則是指種子活力的自然衰退,表現(xiàn)為種子變色、發(fā)芽率低、生長(zhǎng)勢(shì)差、作物減產(chǎn)。種子的純度與真?zhèn)螘?huì)直接影響作物產(chǎn)量和農(nóng)產(chǎn)品品質(zhì),與農(nóng)業(yè)生產(chǎn)實(shí)際利益息息相關(guān)。種子分類與溯源是保證種子純度與鑒別種子真?zhèn)蔚闹匾椒ā?/p>
對(duì)種子品質(zhì)的傳統(tǒng)檢測(cè)方法大多需要對(duì)種子進(jìn)行破壞性分析,且檢測(cè)時(shí)間長(zhǎng)、過程復(fù)雜,難以滿足現(xiàn)代農(nóng)業(yè)對(duì)種子無(wú)損、快速生產(chǎn)的要求。隨著化學(xué)計(jì)量學(xué)的發(fā)展和計(jì)算機(jī)技術(shù)的進(jìn)步,近年來(lái)近紅外光譜、高光譜成像等新型分析技術(shù)在無(wú)損檢測(cè)領(lǐng)域?qū)崿F(xiàn)了諸多成功的應(yīng)用。近紅外光譜技術(shù)具有無(wú)損、快速、高效等特點(diǎn),可在不破壞樣品的情況下,快速完成光譜數(shù)據(jù)采集,真正做到無(wú)損、快速分析; 在數(shù)據(jù)模型的支持下,通過一次光譜數(shù)據(jù)掃描即可獲得多個(gè)指標(biāo)的分析結(jié)果,分析效率較傳統(tǒng)方法明顯提高。高光譜成像技術(shù)是一種將光譜技術(shù)和成像技術(shù)相結(jié)合的新型分析技術(shù),在提供光譜信息的同時(shí)還可以提供樣品的空間分布和圖像特征信息,在對(duì)樣品進(jìn)行光譜信息采集的同時(shí)還可以實(shí)現(xiàn)樣品的圖像信息采集,從而為種子品質(zhì)分析提供更多數(shù)據(jù)與信息。
本文圍繞近紅外光譜、高光譜成像等光學(xué)檢測(cè)技術(shù),針對(duì)種子品質(zhì)無(wú)損快速檢測(cè),從種子質(zhì)量評(píng)價(jià)、活力與老化檢測(cè)、純度與真?zhèn)舞b別、分類與溯源研究四個(gè)方面對(duì)近年文獻(xiàn)進(jìn)行綜述,在此基礎(chǔ)上,對(duì)種子品質(zhì)無(wú)損快速檢技術(shù)進(jìn)行總結(jié)與展望。
種子質(zhì)量關(guān)系著種子的健康狀況,是種子等級(jí)劃分以及衡量種子優(yōu)劣的定量指標(biāo)。種子質(zhì)量主要包含種子含水率、蛋白含量、脂肪酸含量、淀粉含量等。其中,水分含量關(guān)系著種子儲(chǔ)存過程的安全性。水分含量過高常會(huì)導(dǎo)致種子生蟲、發(fā)霉,造成嚴(yán)重?fù)p失。近年來(lái),很多學(xué)者針對(duì)種子水分含量的無(wú)損快速檢測(cè)做了很多嘗試[1],并取得了一定的進(jìn)展。蘆兵[2]等采用高光譜技術(shù)對(duì)水稻種子含水量采用模擬退火算法-支持向量回歸建立了定量檢測(cè)模型,預(yù)測(cè)集測(cè)定系數(shù)為0.928 6。Zhang等[3]基于可見/近紅外光譜和近紅外高光譜成像技術(shù)實(shí)現(xiàn)對(duì)玉米種子水分含量的無(wú)損檢測(cè),采用無(wú)信息變量消除算法提取特征波長(zhǎng),建立偏最小二乘回歸預(yù)測(cè)模型; 模型校正集、預(yù)測(cè)集相關(guān)系數(shù)分別為0.961和0.898,校正均方根誤差、預(yù)測(cè)均方根誤差分別為0.491%和1.315%??翟颅偟萚4]采用近紅外光譜法對(duì)玉米、水稻種子的水分含量分別建立了校正模型,結(jié)果表明,玉米、水稻種子水分模型的多元相關(guān)系數(shù)分別為0.837 1和0.832 1。
在種子質(zhì)量評(píng)價(jià)方面,近紅外光譜技術(shù)可以給出較好的解決方案; 而現(xiàn)有的關(guān)于高光譜成像技術(shù)在種子質(zhì)量評(píng)價(jià)方面的報(bào)道多采用高光譜成像儀器采集種子樣品的高光譜成像數(shù)據(jù),再?gòu)某上駭?shù)據(jù)中提取光譜信息建立校正模型,不僅可以實(shí)現(xiàn)對(duì)單粒種子的質(zhì)量評(píng)價(jià),而且可以得到準(zhǔn)確度較高的結(jié)果。
種子活力(Vigor)是種子發(fā)芽和出苗率、幼苗生長(zhǎng)的潛勢(shì)、植株抗逆能力和生產(chǎn)潛力的總和,是種子品質(zhì)的重要指標(biāo)。高活力種子具有明顯的生長(zhǎng)優(yōu)勢(shì)和生產(chǎn)潛力,是農(nóng)產(chǎn)品豐收、增產(chǎn)的重要保障。在種子活力無(wú)損快速檢測(cè)領(lǐng)域,很多學(xué)者做了有意義的嘗試[19],并取得了一定的研究進(jìn)展。范雪婷等[20]采用透射方式采集單粒水稻種子的近紅外吸收光譜,以近紅外光譜數(shù)據(jù)為自變量,以種子活力(發(fā)芽率)為因變量建立定量校正模型,“日本晴”種子活力模型校正集測(cè)定系數(shù)R2=0.944 4,“9311”種子活力模型校正集測(cè)定系數(shù)R2=0.986 1。Wu等[21]采用近紅外光譜建立了小麥種子發(fā)芽率定量模型,校正集和預(yù)測(cè)集相關(guān)系數(shù)(r)分別為0.902和0.967。Chen等[22]采用850~1 700 nm波段范圍的近紅外高光譜成像系統(tǒng)收集高光譜圖像,檢測(cè)小麥的發(fā)芽程度。實(shí)驗(yàn)分別在小麥發(fā)芽0,12,24和48 h進(jìn)行。提取胚胎和胚乳的原始光強(qiáng)度,然后將其更改為反射率作分析。比較了不同部位,不同品種,不同發(fā)芽程度的小麥的圖像和光譜信息。結(jié)果表明,同一種子在萌芽12 h后,胚的反射率低于胚乳的反射率; 在所測(cè)波段范圍內(nèi),同一品種的小麥種子在12,24和48 h萌發(fā)時(shí),反射率隨發(fā)芽時(shí)間的增加而增加,與其體內(nèi)脂肪含量的變化有關(guān)。彭彥昆等[23]采用500~900 nm波段的高光譜圖譜融合技術(shù)提出了一種番茄種子圖像采集并辨識(shí)種子特征進(jìn)而將種子分級(jí)的算法,通過標(biāo)準(zhǔn)發(fā)芽試驗(yàn)得到種子活力結(jié)果,基于連續(xù)投影算法求得反映番茄種子活力的特征波長(zhǎng)為: 535,577,595,654,684,713,744,768,809和840 nm; 在713 nm波長(zhǎng)下的圖像特征對(duì)活力結(jié)果判斷分級(jí)正確率最高,校正集、驗(yàn)證集的正確率分別為93.75%和90.48%。張婷婷等[24]采用400~1 000 nm波段的高光譜成像對(duì)單粒小麥種子生活力進(jìn)行特征波段篩選,并建立判別模型。結(jié)果表明,采用無(wú)信息變量消除-競(jìng)爭(zhēng)自適應(yīng)重加權(quán)采樣-連續(xù)投影算法從全波段光譜的688個(gè)變量篩選出了8個(gè)關(guān)鍵變量: 473,492,811,875,880,947和969 nm,基于上述8個(gè)關(guān)鍵變量所建偏最小二乘判別分析模型效果最優(yōu),校正集和預(yù)測(cè)集的小麥種子生活力整體鑒別正確率分別為86.7%和85.1%,較全波段偏最小二乘判別分析模型分別提高了4.2%和2.1%; 校正集和預(yù)測(cè)集的活種子鑒別正確率分別為93.8%和84.4%。對(duì)模型進(jìn)行優(yōu)化篩選,種子發(fā)芽率的最終鑒別正確率達(dá)到93.1%。Maor Matzrafi等[25]基于423.6~878.9 nm波段的高光譜技術(shù)和數(shù)據(jù)分析,預(yù)測(cè)棕櫚果種子的發(fā)芽率,發(fā)芽種子和非發(fā)芽種子高光譜分類準(zhǔn)確度分別為81.9%和76.4%。Ashabahebwa Ambrose等[26]采用傅里葉變換近紅外光譜和拉曼光譜評(píng)估玉米種子活力,使用傅里葉變換近紅外光譜儀在1 000~2 500 nm波長(zhǎng)范圍內(nèi)采集樣品近紅外光譜數(shù)據(jù),并采集170~3 200 cm-1范圍的拉曼光譜數(shù)據(jù)。結(jié)果表明,兩種光譜在識(shí)別有活力種子和無(wú)活力種子方面的準(zhǔn)確度均可接近100%,其中近紅外光譜建模結(jié)果優(yōu)于拉曼光譜。
另一方面,種子活力的自然衰退過程稱為種子老化,這一過程在高溫、高濕條件下往往會(huì)加快,具體表現(xiàn)為種子變色、發(fā)芽率低、生長(zhǎng)勢(shì)差、作物減產(chǎn),不利于農(nóng)業(yè)生產(chǎn)。在種子老化無(wú)損檢測(cè)方面,許多學(xué)者基于光譜及成像技術(shù)展開了探索。吳小芬等[27]采用874~1 734 nm的近紅外高光譜成像提取了兩種常見水稻種子未老化、老化48 h、老化72 h的光譜反射率,基于全波段光譜建立了支持向量機(jī)判別分析模型。結(jié)果表明,未老化種子與老化種子可以準(zhǔn)確識(shí)別,而老化48 h和老化72 h種子之間無(wú)法準(zhǔn)確識(shí)別,與基于種子活力參數(shù)的測(cè)量結(jié)果相符,不同水稻品質(zhì)對(duì)老化的反映存在差異。李美凌等[28]對(duì)不同老化程度水稻種子,采用400~1 000 nm波段的高光譜成像結(jié)合主成分分析-支持向量機(jī)算法,研究比較了不同活力水平的水稻種子活力差異。通過主成分分析算法獲得主成分圖像并確定特征波段,用支持向量機(jī)算法建立水稻種子活力鑒別模型,預(yù)測(cè)判別率可達(dá)100%。Christian Nansen等[29]基于423.6~878.9 nm波段的高光譜成像數(shù)據(jù)研究了確定三種澳大利亞原生樹種AcaciacowleanaTate,BanksiaprionotesL.F.和Corymbiacalophylla的發(fā)芽能力的方法。在每個(gè)時(shí)間點(diǎn)對(duì)種子進(jìn)行高光譜成像,以獲取單個(gè)種子的反射譜。采用正向線性判別分析算法選擇特征變量。在大約10~30 d的老化實(shí)驗(yàn)中,發(fā)芽率從90%以上下降至20%以下。每個(gè)物種的P50值(50%萌發(fā))為19.3(A.coleana),7.0(B.prionotes)和22.9(C.calophylla)。楊小玲等(請(qǐng)參閱本刊36卷12期4028頁(yè))采用400~1 000 nm波段的高光譜成像研究成熟與未成熟玉米種子的鑒別方法,通過圖像處理對(duì)種子進(jìn)行分類。研究表明,采用主成分分析算法對(duì)高光譜圖像數(shù)據(jù)進(jìn)行分解,其中第二主成分圖像差異最明顯; 采用640 nm/525 nm的波段比成像可減輕玉米種子冠部淺色部分誤識(shí)別為種子成熟度較低的不利影響,平均正確識(shí)別率93.9%。
綜上可見,采用近紅外光譜及高光譜成像技術(shù)對(duì)種子活力進(jìn)行檢測(cè),可為種子質(zhì)量篩查提供有效的技術(shù)手段,結(jié)合化學(xué)計(jì)量學(xué)算法,可建立準(zhǔn)確度較高的校正模型,有效提高了對(duì)種子活力與老化的識(shí)別正確率,從而可以有效提高種子質(zhì)量,進(jìn)而對(duì)促進(jìn)農(nóng)業(yè)生產(chǎn)起到積極作用。
種子純度與真?zhèn)舞b別是品種選育、品種檢驗(yàn)以及農(nóng)業(yè)生產(chǎn)的重要環(huán)節(jié),種子的真?zhèn)沃苯佑绊懙椒N子的儲(chǔ)藏、銷售、育種、生產(chǎn)等各個(gè)方面,直接影響作物產(chǎn)量和農(nóng)產(chǎn)品品質(zhì)。種子純度鑒定是提高作物產(chǎn)量和質(zhì)量的重要措施。種子純度鑒定技術(shù)的研究是全國(guó)種子檢驗(yàn)工作的重點(diǎn)和難點(diǎn)之一,也是種子管理過程中必須要及時(shí)解決的問題[30]。種子的純度與真?zhèn)舞b別已成為國(guó)內(nèi)外研究的熱點(diǎn)。隨著光譜技術(shù)和計(jì)算機(jī)圖像處理技術(shù)的發(fā)展,近年來(lái),機(jī)器視覺技術(shù)以及近紅外光譜技術(shù)在種子純度與真?zhèn)舞b別方面得到了較為廣泛和深入的研究和應(yīng)用[31],也取得了較好的成果。
王麗萍等[32]采用近紅外光譜技術(shù)對(duì)油菜雜交種子建立純度定量預(yù)測(cè)模型,向油菜雜交種子中加入非雜交的母本或父本種子構(gòu)成校正集樣品,建立定量校正模型,校正集測(cè)定系數(shù)R2=0.980 0。徐涿頻等[33]采用近紅漫反射光譜結(jié)合判別式偏最小二乘分類篩選法,對(duì)單粒水稻種子“新兩優(yōu)6號(hào)”與其父本、母本和其他假種子進(jìn)行了區(qū)分,所建模型的靈敏度Sn、命中率Pr和馬修斯相關(guān)系數(shù)Mcc分別為97.92%,97.58%和95.51%。冉航等[36]用4個(gè)短波近紅外波段(820,910,1 000和1 090 nm)的透射光譜和4個(gè)中波近紅外波段(1 150,1 250,1 350和1 450 nm)的反射光譜獲取種子光譜圖像并提取紋理特征來(lái)鑒定玉米雜交種純度。結(jié)果表明,透射和反射模型對(duì)5個(gè)玉米品種平均正確鑒別率均在85%以上。Timothy Wilkes等[35]通過400~1 000 nm波段的多光譜成像和高光譜成像快速區(qū)分硬質(zhì)小麥和摻假普通小麥品種,并以較低的誤差和良好的可重復(fù)性估算出摻假百分比。3%摻假樣本的分析顯示出較小的正偏差(樣本估計(jì)為3.65%,95%±1.41%),相關(guān)的變異系數(shù)(CV)為15.50%。
從以上內(nèi)容可見,采用近紅外光譜及高光譜成像等技術(shù)對(duì)種子純度與真?zhèn)芜M(jìn)行識(shí)別可以建立準(zhǔn)確度較高的校正模型; 在現(xiàn)有文獻(xiàn)報(bào)道中,可以使用較少的波段而非全波段光譜數(shù)據(jù)實(shí)現(xiàn)上述功能,這意味著可以大幅減少計(jì)算量,從而可為降低儀器成本、提高儀器工作效率提供理論基礎(chǔ)與技術(shù)支持。
種子是農(nóng)業(yè)的根本,被譽(yù)為“農(nóng)業(yè)的芯片”。對(duì)種子進(jìn)行分類與溯源研究是種子監(jiān)管過程的重要措施,是保障種子安全的有效技術(shù)手段。種子分類與溯源則是保證種子純度與鑒別種子真?zhèn)蔚闹匾椒?。在種子分類與溯源研究方面,很多學(xué)者做了有意義的嘗試。
鄭田甜(請(qǐng)參閱本刊35卷3期622頁(yè))采用600~1 100 nm波段的可見-近紅外反射光譜對(duì)3種代表性花生進(jìn)行分類識(shí)別,結(jié)果表明,馬氏距離判別分析模型對(duì)花生種子預(yù)測(cè)集判別準(zhǔn)確率達(dá)到95%。進(jìn)而建立了花生種子脂肪含量分析模型,小波分析結(jié)合主成分回歸模型的預(yù)測(cè)偏差小于0.25,相對(duì)誤差范圍0.03%~1.03%。錢麗麗等[36]采用4 000~12 000 cm-1波段范圍的近紅外光譜對(duì)2013年至2015年來(lái)自建三江地區(qū)及五常地區(qū)的291份大米進(jìn)行產(chǎn)地溯源研究,研究發(fā)現(xiàn),不同地區(qū)來(lái)源的樣品在波段5 136~5 501 cm-1處均有顯著差異,說明不同地區(qū)樣品的近紅外光譜存在顯著性差異; 采用因子化法建立的定性分析模型及聚類分析模型對(duì)建三江大米及五常大米的正確判別率均高于97.00%; 利用偏最小二乘法建立的定量分析模對(duì)兩地區(qū)大米的正確判別率分別為95.83%和94.00%。進(jìn)一步地,錢麗麗等[37]采用5 000~5 500和7 000~7 500 cm-1波段范圍的近紅外光譜結(jié)合聚類分析和偏最小二乘算法對(duì)黑龍江省3個(gè)水稻主產(chǎn)區(qū)的地理標(biāo)志大米進(jìn)行產(chǎn)地溯源研究,結(jié)果表明,用聚類分析建立的模型對(duì)建三江、五常地域預(yù)測(cè)正確率為100%,響水地域預(yù)測(cè)正確率為95.83%; 五常、響水地域判別正確率為100%,建三江地域判別正確率為95.83%。采用偏最小二乘算法建立定量分析模型對(duì)建三江、五常、響水三個(gè)地域的預(yù)測(cè)正確率分別為95.83%,100%和95.83%。宋雪健等[38]應(yīng)用近紅外漫反射光譜結(jié)合化學(xué)計(jì)量學(xué)對(duì)不同狀態(tài)下的小米進(jìn)行產(chǎn)地溯源研究,在12 000~4 000 cm-1范圍內(nèi)采用因子化法建立的定性分析模型和在特征波段(9 400.9~5 447.7和4 600.6~4 249.8 cm-1)范圍內(nèi)采用偏最小二乘法(PLS)建立的定量分析模型,對(duì)肇源、肇州兩個(gè)小米主產(chǎn)區(qū)的小米籽粒和小米粉末的正確鑒別率均在90%以上,其中小米粉模型正確預(yù)測(cè)率要高于小米籽粒模型。此外,宋雪健等[39]采用近紅外漫反射光譜技術(shù)結(jié)合偏最小二乘法,對(duì)齊齊哈爾、佳木斯、五常地區(qū)的水稻樣品建立產(chǎn)地判別模型,在7 501.3~5 447.7和4 600.6~4 249.8 cm-1波數(shù)范圍內(nèi)結(jié)合矢量歸一化預(yù)處理方式建立稻谷樣品判別模型,對(duì)3個(gè)地區(qū)樣品的正確判別率分別為82.35%,88.23%和70.58%; 在波數(shù)7 501.3~4 597.8 cm-1范圍內(nèi)結(jié)合最小-最大歸一化預(yù)處理方式建立大米粉樣品判別模型,對(duì)三個(gè)地區(qū)樣品的正確判別率分別為88.23%,94.12%和88.23%。周子立等[40]采用400~1 000 nm的近紅外光譜結(jié)合BP神經(jīng)網(wǎng)絡(luò)建立大米品種鑒別模型,對(duì)150個(gè)建模樣本的擬合殘差為9.863×10-6,識(shí)別率達(dá)到100%。Kong等[41]采用1 039~1 612 nm波段范圍的近紅外光譜結(jié)合多變量數(shù)據(jù)分析技術(shù)研究了水稻種子品種鑒定方法,比較了偏最小二乘判別分析、簇類獨(dú)立軟模式、K最近鄰算法、支持向量機(jī)、隨機(jī)森林五種機(jī)器學(xué)習(xí)算法,結(jié)果表明,偏最小二乘判別分析和K最近鄰算法模型的分類精度均超過80%,簇類獨(dú)立軟模式、支持向量機(jī)、隨機(jī)森林算法模型的分類精度均達(dá)到100%; 通過PLS-DA模型的加權(quán)回歸系數(shù)選擇了12個(gè)優(yōu)化波長(zhǎng),基于12個(gè)優(yōu)化波長(zhǎng)建立的K最近鄰算法、支持向量機(jī)、隨機(jī)森林模型的正確率均超過80%。Francisco J Rodríguez-Pulido等[42]采用914~1 715 nm波段范圍的近紅外高光譜成像對(duì)兩種土壤中的兩個(gè)紅葡萄品種(Tempranillo和Syrah)和一個(gè)白色品種(Zalema)進(jìn)行分類,使用偏最小二乘回歸預(yù)測(cè)模型和主成分分析和一般判別分析,其測(cè)定系數(shù)高于0.95。張航等[43]采集了7個(gè)品種小麥種子高光譜圖像及900~1 700 nm范圍的光譜信息,建立了主成分分析-支持向量機(jī)分類模型。結(jié)果顯示,3個(gè)品種間種子分類準(zhǔn)確率平均達(dá)到95%以上; 4個(gè)品種間種子分類準(zhǔn)確率平均達(dá)到80%左右; 6個(gè)小麥品種種子的分類準(zhǔn)確率僅66%左右。劉小丹等[44]采用近紅外高光譜成像技術(shù),在波段874~1 734 nm,采集雜交水稻種子高光譜圖像,采用PCA初步探究了3類樣本的可分性。采用連續(xù)投影算法提取7個(gè)特征波長(zhǎng)985.08,1 106.00,1 203.55,1 399.04,1 463.19,1 601.81和1 645.82 nm,基于特征波長(zhǎng)建立偏最小二乘判別分析和支持向量機(jī)模型,正確識(shí)別率達(dá)到90%以上,其中支持向量機(jī)模型效果優(yōu)于偏最小二乘判別分析模型,而全譜判別模型結(jié)果優(yōu)于特征波長(zhǎng)判別模型。Gao等[45]采用1 400~1 600 nm波段的高光譜成像技術(shù)研究了小麥種子在貯藏過程中的特征變化。收集從2007年到2012年的小麥籽粒的高光譜成像數(shù)據(jù),采用主成分分析分析了包括6年在內(nèi)的小麥籽粒的光譜數(shù)據(jù),用簇類獨(dú)立軟模式算法對(duì)不同年份的糧食進(jìn)行分類,結(jié)果表明,相鄰年份之間二分法的分類精度達(dá)到97.05%,六年混合分類的精度達(dá)到82.50%。張初等[46]采用874~1 734 nm波長(zhǎng)范圍的近紅外高光譜圖像,通過提取西瓜種子的光譜反射率,結(jié)合平滑算法,經(jīng)驗(yàn)?zāi)B(tài)分解算法和小波分析對(duì)提取出的光譜數(shù)據(jù)進(jìn)行去除噪聲處理,采用連續(xù)投影算法和遺傳偏最小二乘法選擇特征波段范圍為1 042~1 646 nm; 基于全波段光譜建立了偏最小二乘判別分析,基于特征波長(zhǎng)建立了反向傳播神經(jīng)網(wǎng)絡(luò)判別模型和極限學(xué)習(xí)機(jī)判別模型,建模集和預(yù)測(cè)集識(shí)別正確率均達(dá)到100%。Gao[47]等采用874~1 734 nm波段的近紅外高光譜成像技術(shù)研究來(lái)自中國(guó)四個(gè)不同地理來(lái)源(江蘇省、四川省、海南省、臺(tái)灣省)的240個(gè)麻風(fēng)樹種子樣品,然后分別通過光譜和圖像處理對(duì)獲得的數(shù)據(jù)集進(jìn)行分析。連續(xù)投影算法用于選擇有效波長(zhǎng); 通過主成分分析縮小關(guān)注區(qū)域圖像尺寸; 建立了最小二乘支持向量機(jī)分類模型,樣本預(yù)測(cè)正確識(shí)別率為93.75%。Qiu[48]等使用高光譜成像識(shí)別水稻種子品種,獲得了兩個(gè)不同光譜范圍(380~1 030和874~1 734 nm)的4個(gè)水稻種子品種的高光譜圖像。提取了441~948和975~1 646 nm范圍內(nèi)的光譜數(shù)據(jù),使用不同數(shù)量的訓(xùn)練樣本構(gòu)建了K鄰近、支持向量機(jī)和卷積神經(jīng)網(wǎng)絡(luò)模型; 實(shí)驗(yàn)結(jié)果表明,用較長(zhǎng)波長(zhǎng)的反射率值構(gòu)建的模型比用較短波長(zhǎng)的反射率值構(gòu)建的模型效果更好。Zhao[49]等將高光譜成像系統(tǒng)用于玉米種子的品種分類,共評(píng)估了12 900粒玉米種子,包括3個(gè)不同的品種,提取了975.01~1 645.82 nm的光譜數(shù)據(jù); 建立了使用徑向基函數(shù)的神經(jīng)網(wǎng)絡(luò)判別模型,通過加載主成分進(jìn)行最佳波長(zhǎng)選擇,校正、預(yù)測(cè)準(zhǔn)確度分別為93.85%和91.00%。Zhu[50]等使用波段范圍975~1 650 nm的近紅外高光譜成像對(duì)七種棉籽進(jìn)行分類,通過像素主成分分析形成的得分圖像顯示,不同棉籽品種之間存在差異; 根據(jù)主成分分析的載荷數(shù)據(jù)選擇有效波長(zhǎng),使用自設(shè)計(jì)卷積神經(jīng)網(wǎng)絡(luò)和殘差網(wǎng)絡(luò)提取深層特征,建立偏最小二乘判別分析、邏輯回歸和支持向量機(jī)模型,驗(yàn)證和預(yù)測(cè)的分類準(zhǔn)確度均超過80%。Zhao等[51]采集了三種葡萄籽在874~1 734 nm波段范圍內(nèi)的高光譜圖像,通過小波變換逐像素對(duì)光譜進(jìn)行預(yù)處理,并提取每個(gè)葡萄種子的光譜; 對(duì)高光譜圖像進(jìn)行主成分分析,使用六個(gè)主成分的圖像定性識(shí)別不同品種; 采用支持向量機(jī)建立判別模型,校正、預(yù)測(cè)的準(zhǔn)確度分別為94.3%和88.7%。Feng等[52]使用波段范圍874.41~1 733.91 nm的近紅外高光譜成像從兩個(gè)品種(huaidao-1和nanjing46)中識(shí)別CRISPR/Cas9誘導(dǎo)的水稻突變體; 采用主成分分析對(duì)高光譜成像數(shù)據(jù)進(jìn)行分解,并結(jié)合支持向量機(jī)和極限學(xué)習(xí)機(jī)建立分類判別模型; 進(jìn)一步地,采用主成分分析結(jié)合連續(xù)投影算法篩選光譜波長(zhǎng); 結(jié)果表明,對(duì)于huaidao-1,校準(zhǔn)集、預(yù)測(cè)集的分類準(zhǔn)確率分別為93.00%和92.75%,對(duì)于nanjing46,校正集、預(yù)測(cè)集的分類準(zhǔn)確率分別為91.25%和89.50%。此外,F(xiàn)eng等[53]采用874.41~1 733.91 nm波段的近紅外高光譜成像結(jié)合化學(xué)計(jì)量學(xué)數(shù)據(jù)對(duì)包含cry1Ab/cry2Aj-G10evo蛋白及其非轉(zhuǎn)基因(GM)親本的GM玉米籽粒進(jìn)行分類,采用偏最小二乘判別分析建立判別模型,校正和預(yù)測(cè)準(zhǔn)確度均接近100%。Yang等[54]采用924~1 657 nm波段的高光譜成像對(duì)玉米進(jìn)行分類研究。對(duì)14個(gè)品種的1120個(gè)玉米種子的高光譜圖像,基于無(wú)監(jiān)督關(guān)鍵偏度波長(zhǎng)選擇算法選擇19個(gè)關(guān)鍵波長(zhǎng),變量數(shù)占全波長(zhǎng)的8.68%,基于最小二乘支持向量機(jī)建立多模型策略用于品種識(shí)別; 結(jié)果表明,用于全波長(zhǎng)數(shù)據(jù)的多模型對(duì)測(cè)試集的分類準(zhǔn)確度達(dá)到98.18%,高于單模型的96.36%; 當(dāng)使用由無(wú)監(jiān)督關(guān)鍵偏度波長(zhǎng)選擇算法所選的19個(gè)關(guān)鍵波長(zhǎng)時(shí),分類精度為96.57%。Yang等[55]基于從430~980 nm波段的可見和近紅外高光譜圖像中提取光譜、組合形態(tài)和外觀特征,建立了用于玉米種子品種分類的方法; 使用連續(xù)投影算法構(gòu)建了光譜特征向量,從每個(gè)玉米粒中提取形態(tài)特征——面積,圓度,縱橫比,實(shí)心度和紋理特征——能量,對(duì)比度,相關(guān)性,熵及其標(biāo)準(zhǔn)偏差作為外觀特征,采用支持向量機(jī)和偏最小二乘判別分析算法建立分類模型; 與偏最小二乘判別分析模型相比,支持向量機(jī)模型的識(shí)別準(zhǔn)確率更高,胚側(cè)和背側(cè)識(shí)別準(zhǔn)確率分別為98.2%和96.3%。Zhang等[56]用380~1 030 nm波段的可見光-短波近紅外區(qū)域高光譜成像區(qū)分玉米種子的不同品種,獲取了六種玉米種子共330個(gè)樣品的高光譜圖像; 使用主成分分析和核主成分分析來(lái)探索光譜數(shù)據(jù)的內(nèi)部結(jié)構(gòu),選擇三個(gè)關(guān)鍵波長(zhǎng)——523,579和863 nm,根據(jù)最佳波長(zhǎng)從每個(gè)單波長(zhǎng)圖像的灰度共生矩陣中提取四個(gè)紋理變量,包括對(duì)比度、均勻性、能量和相關(guān)性,最后通過最小二乘支持向量機(jī)和反向傳播神經(jīng)網(wǎng)絡(luò),使用主成分、核主成分和質(zhì)地特征相結(jié)合,建立了玉米種子識(shí)別模型,準(zhǔn)確度為98.89%。Huang等[57]基于400~1 000 nm波段的高光譜成像研究玉米種子分類方法。使用連續(xù)投影算法選擇用于玉米種子品種分類的最佳波長(zhǎng),選擇特征區(qū)域,然后引入主成分分析和多維縮放以變換/減少分類特征; 建立最小二乘支持向量機(jī)模型,模型準(zhǔn)確度達(dá)到90%以上,優(yōu)于使用原始光譜和圖像特征模型的83.68%,而僅使用光譜特征模型的準(zhǔn)確度僅為76.18%。Wang等[58]將在400~1 000 nm波長(zhǎng)范圍內(nèi)提取的光譜信息與機(jī)器學(xué)習(xí)結(jié)合,對(duì)10個(gè)大豆品種進(jìn)行分類。對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理之后,進(jìn)行主成分分析,從主成分分析選擇的三個(gè)特征圖像中提取出紋理特征參數(shù); 對(duì)比了簇類獨(dú)立軟模式、偏最小二乘判別分析、遺傳神經(jīng)網(wǎng)絡(luò)和Takagi-Sugeno模糊神經(jīng)網(wǎng)絡(luò),訓(xùn)練集平均準(zhǔn)確度高于96%,預(yù)測(cè)集平均準(zhǔn)確度高于84%,其中遺傳神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)準(zhǔn)確度最高,達(dá)到92%。Huang等[59]使用400~1 000 nm波段的高光譜成像建立玉米種子分類方法,共評(píng)估了2 000粒種子,包括不同年份的四個(gè)玉米種子品種; 使用最小二乘支持向量機(jī)建立了基于種子平均光譜特征的分類模型,并使用增量支持向量數(shù)據(jù)描述,以實(shí)現(xiàn)模型的在線更新,分類準(zhǔn)確率達(dá)到94.4%,比未更新模型高10.3%。He等[60]采用400~1 000 nm波段的高光譜成像建立玉米種子分類模型,基于最小二乘支持向量機(jī)分類器將三個(gè)不同年份種植的四個(gè)典型玉米品種的2 000個(gè)種子進(jìn)行分類。模型總體正確率達(dá)到98.3%。Wang等[61]采用400~1 000 nm波段的可見/近紅外高光譜成像確定玉米種子的地理起源和年份。分別從包含兩個(gè)玉米的高光譜圖像的三個(gè)區(qū)域——胚芽,胚乳和整個(gè)玉米籽粒提取光譜特征; 主成分分析顯示不同玉米種子存在差異; 將偏最小二乘判別分析用于三個(gè)不同區(qū)域的光譜特征,以識(shí)別玉米種子的起源和年份最高準(zhǔn)確度達(dá)到99.19%,驗(yàn)證組準(zhǔn)確度達(dá)到98.44%。
在種子分類與溯源研究方面,近紅外光譜技術(shù)可在一定程度上提供解決方案,而高光譜圖像技術(shù)的介入則可提供更多的形態(tài)學(xué)數(shù)據(jù)信息,并且可以針對(duì)單粒種子進(jìn)行形態(tài)學(xué)分析,因此可在一定程度上提高分類、溯源的準(zhǔn)確度。然而,光譜學(xué)和形態(tài)學(xué)數(shù)據(jù)的融合方法仍有待繼續(xù)研究。
種子品質(zhì)對(duì)于保障農(nóng)業(yè)生產(chǎn)具有至關(guān)重要的作用。對(duì)種子品質(zhì)進(jìn)行無(wú)損快速檢測(cè)不僅是現(xiàn)代農(nóng)業(yè)生產(chǎn)的需要,而且是農(nóng)產(chǎn)品豐收、增產(chǎn)的重要保障,同時(shí)對(duì)保證農(nóng)產(chǎn)品數(shù)量安全具有重要意義。調(diào)研文獻(xiàn)可知,近紅外光譜技術(shù)在種子質(zhì)量評(píng)價(jià)方面的應(yīng)用很多。近紅外光譜技術(shù)具有快速、無(wú)損、高效等優(yōu)點(diǎn),因此在種子內(nèi)部化學(xué)物質(zhì)含量的檢測(cè)中可發(fā)揮強(qiáng)大的優(yōu)勢(shì)。然而,由于近紅外光的穿透性有限,對(duì)厚度較大的種子的穿透性仍存在一定的局限; 當(dāng)種子內(nèi)部品質(zhì)變化引起種子表層組織化學(xué)性質(zhì)改變時(shí),采用近紅外漫反射光譜對(duì)種子品質(zhì)進(jìn)行檢測(cè)可取得較好的效果。拉曼光譜技術(shù)近年來(lái)也在種子品質(zhì)檢測(cè)方面有所應(yīng)用,然而實(shí)驗(yàn)過程中的熒光干擾仍是困擾拉曼光譜技術(shù)應(yīng)用的難題。近紅外高光譜成像技術(shù)不僅可以提供樣品的光譜信息,而且還可以提供樣品的空間分布信息和圖像特征。近紅外高光譜成像技術(shù)按光譜波段大致可分為近紅外高光譜成像技術(shù)和可見-短波近紅外高光譜成像技術(shù); 其中,近紅外高光譜成像技術(shù)所提供的光譜信息的可解釋性較強(qiáng),而可見-短波近紅外高光譜成像所攜帶的光譜信息相對(duì)而言其可解釋性較弱。由此可見,不同波段的高光譜成像側(cè)重點(diǎn)不同,近紅外高光譜成像更側(cè)重于樣品的近紅外光譜信息,而可見-短波近紅外高光譜成像則更側(cè)重于樣品的形態(tài)學(xué)信息。因此,在種子活力與老化、純度與真?zhèn)?、分類與溯源方面,高光譜成像技術(shù)則體現(xiàn)出更為明顯的優(yōu)勢(shì)。然而,光譜數(shù)據(jù)和形態(tài)學(xué)數(shù)據(jù)的融合仍是本領(lǐng)域的一個(gè)難點(diǎn),采用何種融合方式以及融合數(shù)據(jù)的篩選將成為今后的研究重點(diǎn)。