張孝紅,蔣雪松*,沈 飛,姜洪喆,周宏平,何學(xué)明,江殿程,張 祎
1. 南京林業(yè)大學(xué)機(jī)械電子工程學(xué)院,江蘇 南京 210037 2. 南京財(cái)經(jīng)大學(xué)食品科學(xué)與工程學(xué)院,江蘇 南京 210023 3. 江蘇省糧油質(zhì)量監(jiān)測(cè)中心,江蘇 南京 210031
我國(guó)是世界上小麥生產(chǎn)量最大的國(guó)家,小麥作為我國(guó)三大谷物之一,2020年國(guó)家統(tǒng)計(jì)局統(tǒng)計(jì)我國(guó)播種面積達(dá)23 380千公頃,約占全國(guó)全年糧食播種面積的20%,總產(chǎn)量達(dá)13 425萬噸,約占全國(guó)全年糧食總產(chǎn)量的20%。
長(zhǎng)江中下游的小麥,由于溫暖潮濕的氣候環(huán)境,極易感染赤霉病,小麥中水分的含量是引發(fā)赤霉病感染的重要因素。 被赤霉病感染的小麥會(huì)產(chǎn)生一種嘔吐毒素,其學(xué)名為脫氧雪腐鐮刀菌烯醇(Deoxynivalenol,DON)。 研究表明,DON不僅會(huì)侵染破壞小麥的細(xì)胞組織,降低小麥的出粉率從而影響小麥的產(chǎn)量,而且還會(huì)引發(fā)人體中毒,具有致癌、致畸等潛在健康風(fēng)險(xiǎn)[1]。 Javier Enrione等[2]通過測(cè)量藜麥面粉的五種不同相對(duì)濕度下的重量數(shù)據(jù)和傅里葉變換紅外光譜面積之間的相關(guān)性來建立預(yù)測(cè)方程,實(shí)現(xiàn)藜麥面粉中水分含量的預(yù)測(cè),其R2能達(dá)到0.872 9,表明該模型具有預(yù)測(cè)功能。 蔣雪松等[3]對(duì)感染不同程度赤霉病的小麥樣品的光譜信息和傳統(tǒng)方法(UPLC-MS/MS)測(cè)得的DON含量建立PLSR定量分析模型和LDA、PLS-DA定性分析模型,根據(jù)全光譜以及特征光譜所構(gòu)建的定性分析模型的識(shí)別率高達(dá)87.69%,但定量分析模型效果不太理想。 劉亞超等[4]設(shè)計(jì)了大米多品質(zhì)參數(shù)檢測(cè)儀,通過試驗(yàn)驗(yàn)證大米含水率、直鏈淀粉質(zhì)量分?jǐn)?shù)和蛋白質(zhì)質(zhì)量分?jǐn)?shù)的相關(guān)系數(shù)為0.972 7,0.949和0.901 5,預(yù)測(cè)均方根誤差為0.363 2%,1.318 1%和0.243 0%。
相關(guān)研究發(fā)現(xiàn)[5-7],不少開發(fā)的有關(guān)農(nóng)產(chǎn)品品質(zhì)的檢測(cè)儀器,多采用漫反射檢測(cè)方式,儀器尺寸小,適合形狀大小質(zhì)地相同的檢測(cè)對(duì)象,不適用于粉末狀面粉。 由于面粉受潮極易感染赤霉病,因此檢測(cè)面粉中水分的含量以及DON超標(biāo)與否對(duì)面粉制食品安全行業(yè)具有重要的指導(dǎo)意義[8-10]。
DON由于具有穩(wěn)定的化學(xué)結(jié)構(gòu),一般的方法無法破壞其結(jié)構(gòu),去除麩皮能夠有效的降低面粉中DON的含量。 本文以去除麩皮后的小麥磨成的面粉為研究對(duì)象,基于漫透射近紅外光譜分析技術(shù), 設(shè)計(jì)了便攜式面粉品質(zhì)安全檢測(cè)儀,編寫了實(shí)時(shí)檢測(cè)軟件,分別建立了面粉濕度的最優(yōu)PLS回歸預(yù)測(cè)模型和DON超標(biāo)與否的PCA-邏輯回歸分類模型,并將模型導(dǎo)入便攜式檢測(cè)儀中,通過試驗(yàn)驗(yàn)證儀器的穩(wěn)定性和精確性,以實(shí)現(xiàn)面粉品質(zhì)的檢測(cè)目的。
以面粉為研究對(duì)象,運(yùn)用漫透射近紅外光譜檢測(cè)技術(shù),是因?yàn)槁干錂z測(cè)方式可以透過樣品使攜帶有大量樣品內(nèi)部的光譜信息被捕捉接收,且加裝反射罩不僅可以使得未被光譜儀采集到的信息通過樣品表面的反射再次被光譜儀所接收,還可以防止外界雜散光的干擾,使得光譜更能如實(shí)的反應(yīng)樣品內(nèi)部信息[11-12]。 近紅外是基于可見光和中紅外之間的電磁波,當(dāng)近紅外照射到物體上時(shí),特定頻率的光與被照物體的某個(gè)含氫基團(tuán)的振動(dòng)頻率一樣,那么該特定頻率的光會(huì)被吸收,經(jīng)過該物體透射后的近紅外光便可反映其內(nèi)部結(jié)構(gòu)信息[13]。 該面粉多品質(zhì)檢測(cè)儀包括光譜采集模塊、光源控制模塊、處理與顯示模塊和電源模塊構(gòu)成, 通過實(shí)時(shí)檢測(cè)軟件來控制光源的開關(guān), 利用USB數(shù)據(jù)線實(shí)現(xiàn)光譜儀與樹莓派之間的通信。 利用移植好的預(yù)測(cè)模型進(jìn)行面粉的濕度和DON的預(yù)測(cè),其工作原理圖如圖1所示。
圖1 檢測(cè)儀工作原理圖Fig.1 Working principle of detection system
為了縮小儀器尺寸,使儀器更具便攜性,將鋰電池放入自行設(shè)計(jì)的檢測(cè)附件下面,儀器外殼背面留有鋰電池充電口,儀器內(nèi)壁分別安裝光譜儀、樹莓派4B和光源控制板,通過擋板的上下移動(dòng)帶動(dòng)附件中反射罩的上下移動(dòng),實(shí)現(xiàn)樣品的放置與取出。 自行設(shè)計(jì)的檢測(cè)附件不僅可以通過反射罩實(shí)現(xiàn)光譜補(bǔ)償功能還可以避免外界光的干擾。 通過移動(dòng)燕尾導(dǎo)軌滑塊帶動(dòng)反射罩上下移動(dòng),實(shí)現(xiàn)與外界光的隔絕,保證光譜采集時(shí)免受外界雜散光的干擾,提高光譜的信噪比。 整個(gè)儀器的結(jié)構(gòu)示意圖如圖2所示,結(jié)構(gòu)緊湊,空間布置合理。 儀器尺寸大小為250 mm×170 mm×300 mm。
圖2 檢測(cè)儀器硬件示意圖(a): 儀器結(jié)構(gòu)圖;(b): 儀器實(shí)物圖1: 殼體;2: 通風(fēng)孔;3: 微型光譜儀;4: 把手;5: 上蓋及觸摸屏; 6: 樹莓派4B;7: 凸臺(tái);8: 光源控制電路板; 9: 卡槽;10: 檢測(cè)附件;11: 電源Fig.2 Schematic diagram of device hardware(a): Instrument strumcture diagram; (b): Physical drawing of instrument
1.2.1 光譜采集模塊
光譜采集模塊由光譜儀和檢測(cè)附件組成,光譜儀選購(gòu)了德國(guó)INSION公司的NIR 1.7/S 微型近紅外光譜儀,有效波段為: 910~1 900 nm,分辨率為16 nm,波長(zhǎng)重復(fù)性為 0.1 nm,信噪比為5 000∶1,自帶散熱風(fēng)扇。 該光譜儀把所有的光學(xué)元器件集成在一塊基底材料上,具有良好的抗震性。 由自行設(shè)計(jì)的檢測(cè)附件不僅具有光補(bǔ)償?shù)墓δ芷渖舷乱苿?dòng)的導(dǎo)軌滑塊帶動(dòng)調(diào)節(jié)桿再帶動(dòng)反射罩還可以防止外界雜散光的干擾,有效降低光譜采集時(shí)的噪聲。 該檢測(cè)附件如圖3所示。
光譜儀通過自身攜帶的光纖與檢測(cè)附件通過光纖準(zhǔn)直鏡7連接,實(shí)現(xiàn)樣品光譜信息的采集。 參考盒中分別放入1,1.5,2,2.5,3和3.5 g面粉樣品,表面等重壓平,在外界光源環(huán)境相同的情況下,利用自己編寫的檢測(cè)軟件設(shè)置積分時(shí)間為50 ms,平均掃描次數(shù)為2,采集全波段吸光度,如圖4所示。 從圖中可以看出,不同樣品量的光譜曲線大致相同,由于長(zhǎng)波近紅外穿透力較弱,隨著樣品量的增加,不僅長(zhǎng)波區(qū)域采集到的噪音會(huì)增加,而且相應(yīng)樣品的吸光度也會(huì)增加。 1 200 nm波長(zhǎng)點(diǎn)附近具有明顯的吸收峰,表明隨著樣品量的增加水分的倍頻信息也會(huì)相應(yīng)增加。 故選擇樣品量為2 g,光譜噪音較少,利于后續(xù)建模。
1.2.2 光源控制模塊
光源控制模塊由鹵素?zé)糁椤⒐庠醋?、電路板? kΩ上拉電阻和TIP120達(dá)林頓晶體管。 通過達(dá)林頓晶體管來控制12 V的大功率光源,使用1 kΩ的上拉電阻是為了防止由晶體管的開關(guān)切換引起的電流峰值導(dǎo)致GPIO引腳過載。 光源選用六個(gè)飛利浦鹵素?zé)糁?10 W 12 V),五個(gè)排成環(huán)形,還有一個(gè)位于環(huán)形中間,其有效波長(zhǎng)可達(dá)900~1 900 nm。 光源控制模塊的電路板接線圖如圖5所示。
圖3 檢測(cè)附件
圖4 不同樣品量的光譜曲線Fig.4 Spectra of flour samples with different quantities
1.2.3 處理與顯示模塊
作為便攜式面粉多品質(zhì)檢測(cè)儀的核心部件,其不僅要與光譜儀進(jìn)行通信,實(shí)現(xiàn)數(shù)據(jù)傳輸,還要對(duì)采集到的光譜信息進(jìn)行數(shù)據(jù)處理,控制光源的開和關(guān)以及顯示信息。 選擇樹莓派4B作為整個(gè)核心處理器,是因?yàn)槠浼啥雀撸阌陂_發(fā)軟件。 樹莓派4B是基于ARM(CortexA-72)的微型計(jì)算機(jī)主板,采用BroadcomBCM2711BO(1.5 GHz主頻,4核,4 G內(nèi)存)處理器,擁有2個(gè)USB3.0和2個(gè)USB2.0,還有1個(gè)以太網(wǎng)接口,40針引腳,1個(gè)HDMI接口,1個(gè)TYPE-C充電接口,非常適合用于便攜式設(shè)備的開發(fā)。 其尺寸大小為88 mm×58 mm×19.5 mm,為防止程序加載時(shí)間過長(zhǎng),芯片過熱,樹莓派4B還需安裝風(fēng)扇以及在芯片上安裝散熱片。 另外選擇7寸液晶觸摸屏實(shí)現(xiàn)終端顯示功能,其屏幕分辨率為800×480像素,觸摸屏通過樹莓派4B的HDMI接口實(shí)現(xiàn)連接。 光譜儀通過USB數(shù)據(jù)線實(shí)現(xiàn)與樹莓派4B的通信。
圖5 光源控制模塊1: 電路板;2: 樹莓派4B;3: 鋰電池;4: 1 kΩ上拉電阻; 5: 鹵素?zé)糁椋?: TIP120達(dá)林頓晶體管Fig.5 Light source control module 1: Circuit board; 2: Raspberry Pi 4B; 3: Lithium battery; 4: 1 kΩ pull-up resistor; 5: Halogen lamp bead; 6: TIP120 Darlington transistor
1.2.4 電源模塊
電源模塊選擇可充電鋰電池,該電池?fù)碛? 1800 mA·h的容量,可持續(xù)供電2 h。 輸入12 V,輸出為5,9和12 V,分別給樹莓派、光譜儀和鹵素?zé)艄╇姟?/p>
面粉樣品來自江蘇三零面粉海安有限公司,共采購(gòu)200份樣品。 將采購(gòu)后的200份樣品標(biāo)記并封于塑料袋中,其中取180份樣品用于建模集和預(yù)測(cè)集,20份樣品用于外部驗(yàn)證集,將180份樣品中的每份樣品再分三份,每份取100 g,分別用紅黃藍(lán)三種顏色標(biāo)記每種樣品中分成的三份。 紅色用于采集光譜信息,黃色用于理化試驗(yàn)以便獲取濕度值,藍(lán)色樣品用于理化試驗(yàn)以便獲取DON的含量。 所有樣品使其受一定程度的赤霉病感染,放置于常溫中保存。
取所有黃色樣品用于面粉濕度值的測(cè)定,根據(jù)《GB/T 5009.3—2016》使用直接干燥法測(cè)得,每份樣品測(cè)二次,取平均值。 根據(jù)《SN/T3137—2012出口食品中脫氧雪腐鐮刀菌烯醇、3-乙酰脫氧雪腐鐮刀菌烯醇、15-乙酰脫氧雪腐鐮刀菌烯醇及其代謝物的測(cè)定液相色譜-質(zhì)譜/質(zhì)譜法》測(cè)得所有藍(lán)色樣品的DON含量。 為保證面粉的濕度與DON不會(huì)隨著同一種樣品之間因?yàn)闇y(cè)量時(shí)間間隔過長(zhǎng)而導(dǎo)致的誤差,需要同時(shí)進(jìn)行所有紅色樣品的光譜信息采集,所有黃色樣品的濕度值測(cè)量以及所有藍(lán)色樣品的DON含量測(cè)量[14]。
面粉濕度和DON含量的統(tǒng)計(jì)結(jié)果如表1、表2所示。 建模集和預(yù)測(cè)集的標(biāo)準(zhǔn)偏差相差不大表明兩類樣本之間的差距很小。 DON測(cè)量結(jié)果中發(fā)現(xiàn)偏高的標(biāo)準(zhǔn)偏差反映了各個(gè)樣品之間DON含量相差較大,表明樣品受到了不同程度的赤霉病的感染。
表1 面粉濕度測(cè)量結(jié)果Table 1 Moisture measurement results of flour
表2 面粉DON含量測(cè)量結(jié)果Table 2 Measurement results of DON content in flour
將所有紅色樣品的70%和30%分別設(shè)置成建模集和預(yù)測(cè)集,然后從每個(gè)待測(cè)樣品中分別依次取2 g平鋪于樣品池中并使用自行設(shè)計(jì)的檢測(cè)儀采集光譜。 采集波段為900~1 870 nm,原始光譜如圖6所示。
圖6 面粉原始光譜圖Fig.6 Original spectra of flour
原始圖譜中1 195和1 470 nm波長(zhǎng)點(diǎn)處存在水分的倍頻吸收峰,表明面粉的水分對(duì)近紅外光譜的影響。 由于赤霉病在感染小麥時(shí),會(huì)使得面粉中蛋白質(zhì)、淀粉等成分減少,受感染的越嚴(yán)重,反映在1 140,1 420和1 582 nm波長(zhǎng)處的吸光度會(huì)呈現(xiàn)下降趨勢(shì)[15]。
利用箱線圖可以進(jìn)行異常值的檢測(cè),圖7為原始樣品前20個(gè)光譜波段的箱線圖,發(fā)現(xiàn)在900~1 048和1 788~1 870 nm之間存在異常值,即存在有吸光度值大于上四分位數(shù)加上1.5倍四分位間距的樣本,原因是光譜首尾端存在相當(dāng)大的噪聲,導(dǎo)致出現(xiàn)異常吸光度值。 在1 327~1 351 nm波段也出現(xiàn)異常吸光度值,是因?yàn)榇嬖谝粋€(gè)異常樣本。 圖8為剔除異常值后前20個(gè)光譜波段的箱線圖,最終截取1 048~1 747 nm波段的光譜數(shù)據(jù)進(jìn)行后續(xù)處理。
圖7 原始光譜箱線圖Fig.7 Box plot graphics depicting the outliers in original spectra
圖8 剔除異常值后的箱線圖Fig.8 Box plot graphics depicting the outliers removed
由于附件的制造精度誤差以及光譜采集時(shí)不可避免的系統(tǒng)誤差等原因,存在基線漂移和光散射等現(xiàn)象,會(huì)影響模型的精度。 因此選擇多元散射校正(MSC)、S-G卷積平滑和標(biāo)準(zhǔn)正態(tài)變換(SNV)對(duì)原始光譜數(shù)據(jù)進(jìn)行預(yù)處理。 其中S-G平滑法的預(yù)處理效果如圖9所示。
通過The Unscrambler X 10.4光譜分析軟件將未經(jīng)過預(yù)處理和經(jīng)過預(yù)處理的數(shù)據(jù)通過偏最小二乘回歸法(PLS)建立定量模型。 根據(jù)表格3所示,不采用任何預(yù)處理的建模效果要優(yōu)于經(jīng)過預(yù)處理的建模效果,其建模集和預(yù)測(cè)集相關(guān)系數(shù)分別為0.883和0.853,均方根誤差分別為0.145%和0.286%,殘差預(yù)測(cè)偏差RPD為2.5。
圖9 S-G卷積平滑F(xiàn)ig.9 Savitzky-Golay smoothing
表3 不同預(yù)處理后的PLSR預(yù)測(cè)模型Table 3 PLSR prediction models after different pretreatment
根據(jù)我國(guó)GB 2715—2005《糧食衛(wèi)生標(biāo)準(zhǔn)》對(duì)于小麥中嘔吐毒素含量的限量標(biāo)準(zhǔn)規(guī)定,把含量超過1 000 μg·kg-1的樣品歸為超標(biāo)樣品,不超過1 000 μg·kg-1的樣品歸為未超標(biāo)樣品,將未超標(biāo)樣本標(biāo)記為0類標(biāo)簽,超標(biāo)樣本標(biāo)記為1類標(biāo)簽。
3.4.1 主成分分析
對(duì)126份建模集的面粉樣品進(jìn)行主成分分析,如圖10所示,第一主成分和第二主成分的累積貢獻(xiàn)率已經(jīng)超過了99.6%,故運(yùn)用前兩個(gè)主成分就能基本表示原先86個(gè)波段下的特征信息。 利用第一第二主成分畫出圖11,發(fā)現(xiàn)樣品明顯的分類趨勢(shì),因此接下來使用邏輯回歸對(duì)樣品進(jìn)行分類并評(píng)估模型。
圖10 主成分得分圖Fig.10 Score plot of PCA
圖11 建模集樣本的主成分分析Fig.11 PCA of modeling set samples
3.4.2 邏輯回歸
邏輯回歸是一個(gè)經(jīng)典的二分類模型,基于上述PCA的分析,使用邏輯回歸對(duì)預(yù)測(cè)集進(jìn)行分類。 決策邊界如圖12所示,預(yù)測(cè)結(jié)果的混淆矩陣如圖13所示,對(duì)未超標(biāo)樣本的預(yù)測(cè)準(zhǔn)確率高達(dá)96%,對(duì)超標(biāo)樣本的預(yù)測(cè)準(zhǔn)確率高達(dá)89%。
圖12 決策邊界Fig.12 Decision boundary
圖13 邏輯回歸預(yù)測(cè)結(jié)果混淆矩陣Fig.13 Confusion matrix of LR prediction result
為進(jìn)一步驗(yàn)證模型的分類性能,做出了邏輯回歸分類模型的受試者工作特征曲線(ROC),如圖14所示,代表模型性能指標(biāo)的AUC值達(dá)到了0.927。 表明PCA-邏輯回歸模型對(duì)面粉中DON超標(biāo)與否的判別有較高的準(zhǔn)確率。
圖14 邏輯回歸ROC曲線Fig.14 LR ROC curves
本檢測(cè)儀配套的軟件是基于python語(yǔ)言對(duì)德國(guó)INSION公司的NIR 1.7/S 微型近紅外光譜儀進(jìn)行二次開發(fā)。 在Win10操作系統(tǒng)上使用PyQt5編寫人機(jī)交互界面,PyCharm Community Edition 2020.1.2 x64編寫后臺(tái)邏輯文件,然后將程序移植到樹莓派4B系統(tǒng)中,從而實(shí)現(xiàn)面粉的濕度預(yù)測(cè)和DON超標(biāo)與否的判別。 如圖15所示,該檢測(cè)系統(tǒng)主要分為4個(gè)模塊: 光譜圖像顯示區(qū)、目標(biāo)預(yù)測(cè)區(qū)、光譜儀控制模塊和模型與數(shù)據(jù)模塊。 光譜圖像顯示區(qū)主要用來顯示由光譜儀采集到的光譜數(shù)據(jù),包括采集暗背景、白參考和樣品光譜。 目標(biāo)預(yù)測(cè)區(qū)即顯示面粉的濕度值和DON有無超標(biāo)情況。 光譜儀控制模塊可以控制光源的開關(guān),連接光譜儀設(shè)置積分時(shí)間,平均掃描次數(shù),采集暗背景,白參考以及樣品光譜,也可以進(jìn)行連續(xù)測(cè)量,若勾選預(yù)測(cè),即可實(shí)現(xiàn)預(yù)測(cè)功能。 模型與數(shù)據(jù)模塊可以對(duì)采集到的數(shù)據(jù)進(jìn)行顯示和保存以及導(dǎo)入本地的數(shù)據(jù)進(jìn)行模型訓(xùn)練和保存,若本地有模型,也可直接導(dǎo)入用于預(yù)測(cè)和判別分析。
其工作流程圖如圖16所示。 當(dāng)顯示連接光譜儀成功后,設(shè)置積分時(shí)間50 ms和平均掃描次數(shù)2次,可以采集暗光譜和白參考,并將采集到的數(shù)據(jù)經(jīng)過計(jì)算繪制成圖像顯示在光譜圖像顯示區(qū);可以添加、刪除和保存已經(jīng)采集好的數(shù)據(jù);采集完一組數(shù)據(jù)后,可以進(jìn)行模型訓(xùn)練,并將訓(xùn)練好的模型保存,以便為下次采集樣本提供模型;也支持從外部導(dǎo)入數(shù)據(jù)進(jìn)行模型訓(xùn)練并保存;當(dāng)采集完暗背景和白參考后,可以測(cè)量樣品,選擇建立好的模型后,勾選預(yù)測(cè),點(diǎn)擊采集樣本,便會(huì)在目標(biāo)預(yù)測(cè)區(qū)顯示出結(jié)果;本程序也支持連續(xù)采集,設(shè)置連續(xù)采集時(shí)的時(shí)間間隔后,勾選連續(xù)測(cè)量,點(diǎn)擊采集樣本,此時(shí)光譜圖像顯示區(qū)將會(huì)連續(xù)顯示光譜圖像,目標(biāo)預(yù)測(cè)區(qū)將會(huì)連續(xù)顯示檢測(cè)結(jié)果。
圖16 工作流程圖Fig.16 Work flow chart
取剩余的20份外部驗(yàn)證集樣品并分別編號(hào)用于對(duì)便攜式面粉多品質(zhì)檢測(cè)儀的精確性和穩(wěn)定性的驗(yàn)證,使用該檢測(cè)儀對(duì)20份樣品進(jìn)行面粉濕度和DON超標(biāo)與否的預(yù)測(cè),將軟件所預(yù)測(cè)的結(jié)果與標(biāo)準(zhǔn)理化值進(jìn)行比較。 其中每份樣品的濕度分別測(cè)量3次,取3次預(yù)測(cè)結(jié)果的平均值作為最終預(yù)測(cè)結(jié)果,用最大相對(duì)誤差來衡量?jī)x器的穩(wěn)定性,每份樣品的DON超標(biāo)與否只測(cè)量一次,與實(shí)際結(jié)果進(jìn)行比較,計(jì)算識(shí)別準(zhǔn)確率來衡量?jī)x器的精確性。
試驗(yàn)結(jié)果顯示面粉水分的最大相對(duì)誤差為2.89%,面粉濕度的預(yù)測(cè)值與真實(shí)值的相關(guān)性如圖17所示,面粉濕度預(yù)測(cè)模型的相關(guān)系數(shù)為0.876,均方根誤差為0.21%,檢測(cè)儀對(duì)外部驗(yàn)證集樣品DON超標(biāo)與否的判定結(jié)果如表4所示,有2個(gè)樣本被誤判,其余全部判別正確,識(shí)別準(zhǔn)確率達(dá)到了90%,外部驗(yàn)證集的準(zhǔn)確率略低于測(cè)試集可能是因?yàn)橥獠框?yàn)證集放置時(shí)間太長(zhǎng)導(dǎo)致禾谷鐮刀菌繁殖,使原本未超標(biāo)的樣本被檢測(cè)儀預(yù)測(cè)為超標(biāo)。 檢測(cè)儀測(cè)定的結(jié)果與實(shí)際結(jié)果相差不大且具有較高的識(shí)別準(zhǔn)確率表明該儀器可以實(shí)現(xiàn)面粉濕度和DON超標(biāo)與否的預(yù)測(cè)。
圖17 面粉濕度測(cè)試結(jié)果Fig.17 Test results of flour moisture
表4 外部驗(yàn)證集判別結(jié)果統(tǒng)計(jì)Table 4 Detection result of samples in external verification set
(1)基于近紅外漫透射光譜,設(shè)計(jì)了便攜式面粉多品質(zhì)檢測(cè)儀,該檢測(cè)儀主要包括光譜采集模塊、光源控制模塊、處理與顯示模塊以及電源模塊。 其中漫透射檢測(cè)附件可以自由升降方便樣品的放置以及可以有效避免外界雜散光的干擾,設(shè)計(jì)了控制光源開關(guān)的電路,選用樹莓派4B作為核心處理器,選用可充電鋰電池供電,可持續(xù)供電2 h,儀器大小250 mm×170 mm×300 mm,滿足便攜式設(shè)備要求。
(2)將選取的180份樣品中的紅色樣品進(jìn)行光譜采集的同時(shí)測(cè)定黃色樣品的濕度理化值和藍(lán)色樣品的DON含量值。 利用箱線圖剔除光譜倆端的噪音和一個(gè)異常樣本,最終選取1 048~1 747 nm波段光譜進(jìn)行建模。 通過The Unscrambler X 10.4光譜分析軟件利用多元散射校正(MSC)、S-G卷積平滑和標(biāo)準(zhǔn)正態(tài)變換(SNV)對(duì)原始光譜數(shù)據(jù)進(jìn)行預(yù)處理,建立面粉水分的偏最小二乘回歸預(yù)測(cè)模型,結(jié)果顯示不采用任何預(yù)處理的建模效果要優(yōu)于經(jīng)過預(yù)處理的建模效果,其建模集和預(yù)測(cè)集相關(guān)系數(shù)分別為0.901和0.855,均方根誤差分別為0.145%和0.286%,殘差預(yù)測(cè)偏差RPD為2.5。 利用主成分分析和邏輯回歸對(duì)面粉中DON含量超標(biāo)與否進(jìn)行判別分析,使用混淆矩陣和ROC曲線下的AUC值來評(píng)價(jià)分類模型的性能。 其中混淆矩陣結(jié)果顯示未超標(biāo)樣本的預(yù)測(cè)準(zhǔn)確率高達(dá)96%,超標(biāo)樣本的預(yù)測(cè)準(zhǔn)確率高達(dá)89%,ROC曲線下的AUC值為0.927。
(3)基于PyQt5開發(fā)工具應(yīng)用python語(yǔ)言編寫了面粉濕度和DON超標(biāo)與否的實(shí)時(shí)分析檢測(cè)系統(tǒng)。 利用該系統(tǒng)中模型與數(shù)據(jù)模塊得到面粉濕度的PLSR預(yù)測(cè)模型和DON超標(biāo)與否的判別分析模型,實(shí)現(xiàn)模型訓(xùn)練和加載一體式,滿足便攜式面粉多品質(zhì)檢測(cè)儀的快速無損檢測(cè)。
(4)利用外部驗(yàn)證集試驗(yàn)驗(yàn)證了便攜式面粉多品質(zhì)檢測(cè)儀的精確性和穩(wěn)定性。 結(jié)果顯示面粉水分的最大相對(duì)誤差為2.89%,面粉濕度的預(yù)測(cè)值和實(shí)際值的相關(guān)系數(shù)為0.876,均方根誤差為0.21%。 面粉中DON含量超標(biāo)與否的識(shí)別準(zhǔn)確率為90%,表明該儀器可以對(duì)面粉的濕度和DON含量超標(biāo)與否進(jìn)行無損檢測(cè)分析。