倪 金,索麗敏,劉海龍
(黑龍江八一農(nóng)墾大學(xué) 信息與電氣工程學(xué)院,黑龍江大慶 163319)
大米是我國主要的糧食作物之一[1]。隨著社會經(jīng)濟的發(fā)展,大米的質(zhì)量問題逐漸引起了人們的關(guān)注。其中,大米的陳化和摻假是一個突出的問題。傳統(tǒng)的大米鑒別方法主要依賴于人工經(jīng)驗和化學(xué)分析技術(shù),普遍存在分析周期長、操作復(fù)雜、成本高等問題[2-3]。因此,需繼續(xù)探索更加準(zhǔn)確、快速、穩(wěn)定的大米鑒別方法[4]。
本文在基于近紅外光譜數(shù)據(jù)的基礎(chǔ)上采用北方蒼鷹優(yōu)化算法(Northern Goshawk Optimization,NGO)對核極限學(xué)習(xí)機(Kernel Extreme Learning Machine,KELM)的兩個重要參數(shù)進行尋優(yōu)并建立模型[5-6]。提出一種新的大米定性鑒別和摻假定量分析方法。通過驗證,該方法在陳化大米的鑒別和摻假定量分析中取得了很好的效果,對于解決陳化大米鑒別和摻假問題具有重要的實際意義。
實驗樣品為2017年和2022年水稻成熟后,于黑龍江省建三江市七星農(nóng)場采用五點式隨機采樣法獲取的五優(yōu)稻4號,將其脫粒碾磨至精白米后作為研究樣品。其中新大米樣品為2022年收獲大米,摻假大米樣品為將2017年收獲的大米按照不同比例(25%、50%、75%)摻入2022年收獲的大米中,陳化大米樣品為2017年收獲大米。采用高精度電子秤(武義銀利電子有限公司)取(5±0.02)g作為一份樣品,共計新大米30份樣品、摻假大米90份樣品、陳化大米30份樣品。
TANGO近紅外光譜儀,德國布魯克(北京)科技有限公司。
1.3.1 光譜預(yù)處理
對原始光譜數(shù)據(jù)進行標(biāo)準(zhǔn)正態(tài)變量變換(Standard Normal Variate,SNV)預(yù)處理,用于消除顆粒不均等原因產(chǎn)生的噪聲信息,原理為樣品光譜數(shù)據(jù)各波數(shù)點的吸光度符合一定分布,計算時將每個樣品的原始光譜減去理想光譜,再除以標(biāo)準(zhǔn)差[7-8]。SNV公式為
1.3.2 模型的建立
極限學(xué)習(xí)機(Extreme Learning Machine,ELM)是提出的一種機器學(xué)習(xí)模型[9],由于其可以自動生成輸入層和隱含層之間的權(quán)重和偏差值,省去了參數(shù)的設(shè)定和迭代試錯,具有操作簡單、建模速度快等優(yōu)點。為進一步提高ELM的性能,在其基礎(chǔ)上將核函數(shù)加入建模過程,構(gòu)成核極限學(xué)習(xí)機(KELM),其原理是利用核函數(shù)代替ELM中隱含層的特征映射,達到將數(shù)據(jù)升維的目的,大幅提高了模型的計算精度與泛化能力,并且該模型在面對分類任務(wù)和回歸任務(wù)時都能表現(xiàn)出較好的效果。但KELM對建模中的核函數(shù)γ與正則化參數(shù)C過分依賴,二者的取值對預(yù)測結(jié)果有決定性作用。目前γ與C值的設(shè)定多采用人工調(diào)參選取,嚴(yán)重降低了建模時的快速性和穩(wěn)定性。為解決這一問題,該文引入北方蒼鷹優(yōu)化算法(NGO)對以上兩個參數(shù)進行尋優(yōu)。NGO是一種模擬的北方蒼鷹捕獵行為的群體智能優(yōu)化算法,其思想是在輸入模式與目標(biāo)模式之間顯式地建立一個映射關(guān)系,通過不斷迭代尋得最優(yōu)的建模參數(shù)。該算法在彌補了原有不足的同時也提高了預(yù)測準(zhǔn)確率和置信度。
1.3.3 基于NGO-KELM的陳化大米定性鑒別方法
分別建立KELM分類模型和NGO優(yōu)化后的KELM分類模型。將新鮮大米30份、摻假大米90份以及陳化大米30份共計150份樣本數(shù)據(jù)隨機按照7∶3的比例分為訓(xùn)練集(105份)和測試集(45份)。采用訓(xùn)練集和測試集的預(yù)測準(zhǔn)確度和F1值作為模型的性能評價指標(biāo),并繪制混淆矩陣。
1.3.4 基于NGO-KELM的陳化大米摻假定量分析方法
基于上文定性分析,分別建立KELM回歸模型與NGO優(yōu)化后的KELM回歸模型,對摻假樣品進行摻假量的定性分析,探討KELM模型和NGOKELM模型對新鮮大米中摻雜陳化大米量的預(yù)測能力。將新鮮大米30份(摻假量0%)、摻假大米90份(摻假量25%、50%、75%)、陳化大米30份(摻假量100%)共計150份樣本按照7∶3的比例隨機分為訓(xùn)練集(105份)和測試集(45份)。對于定量預(yù)測模型采用決定系數(shù)R2和RMSE作為性能評價指標(biāo),并繪制柱狀圖來反映預(yù)測結(jié)果。
分別建立KELM模型和NGO-KELM模型,對比二者準(zhǔn)確度和F1值并繪制混淆矩陣從而確定模型的性能,實驗結(jié)果見表1。NGO-KELM模型的訓(xùn)練集和測試集準(zhǔn)確度與F1值均高于未優(yōu)化的KELM模型(NGO-KELM測試集的混淆矩陣見圖1),其測試集準(zhǔn)確度提高約5%,說明NGO能有效提高KELM模型的分類準(zhǔn)確度。
圖1 NGO-KELM模型在測試集上的混淆矩陣
表1 各模型結(jié)果對比
分別建立KELM模型和NGO-KELM模型進行實驗發(fā)現(xiàn),利用NGO優(yōu)化的KELM模型的定量預(yù)測表現(xiàn)也有顯著的提升,結(jié)果見圖2。
圖2 各模型定量預(yù)測結(jié)果對比
NGO-KELM模型測試集決定系數(shù)R2和RMSE分別提升了0.054 1和0.023 3,得到了較理想的摻假率檢測精度,見表2,該方法顯著優(yōu)于傳統(tǒng)方法。
表2 各模型定量預(yù)測結(jié)果
基于NGO-KELM實現(xiàn)了陳化大米的定性鑒別和摻假定量分析。通過近紅外光譜設(shè)備采集標(biāo)準(zhǔn)樣品的信息,并采用NGO優(yōu)化算法對KELM模型進行了優(yōu)化。建立的模型具有較高的準(zhǔn)確度和穩(wěn)定性,可以有效鑒別陳化大米,同時能對其摻假進行定量分析,為陳化大米的定性鑒別和摻假定量分析提供了一種新的分析方法。