曾燕 王曉 成新文 等
摘要:針對傳統(tǒng)的芹菜總黃酮含量測定過程復(fù)雜、時間長的問題,提出一種基于人工蜂群算法(ABC)優(yōu)化最小二乘支持向量機(jī)(LSSVM)的芹菜總黃酮提取量預(yù)測方法。首先對標(biāo)準(zhǔn)人工蜂群算法進(jìn)行改進(jìn),然后利用改進(jìn)的人工蜂群算法對最小二乘支持向量機(jī)的核寬度和正規(guī)化參數(shù)進(jìn)行尋優(yōu),最后對芹菜總黃酮的提取量進(jìn)行預(yù)測。結(jié)果表明,該方法具有預(yù)測精度高、性能穩(wěn)定的特點(diǎn),有利于實現(xiàn)芹菜總黃酮提取量的網(wǎng)絡(luò)在線預(yù)估和優(yōu)化控制。
關(guān)鍵詞:人工蜂群算法;最小二乘支持向量機(jī);總黃酮;預(yù)測;芹菜
中圖分類號: S126文獻(xiàn)標(biāo)志碼: A文章編號:1002-1302(2015)01-0298-03
收稿日期:2014-09-25
基金項目:四川理工學(xué)院科研項目(編號:2013KY04);釀酒生物技術(shù)及應(yīng)用四川省重點(diǎn)實驗室開放基金(編號:NJ2011-09)。
作者簡介:曾燕(1979—),女,四川自貢人,碩士,講師,研究方向為人工智能。E-mail:zy261365@suse.edu.cn。芹菜是1年生或2年生的傘型花科植物,在15世紀(jì)被作為藥食兩用栽培植物引入中國?,F(xiàn)代醫(yī)學(xué)研究發(fā)現(xiàn),芹菜莖、葉中含有豐富的黃酮類物質(zhì),具有清除自由基、抗氧化、抑菌、抗病毒、抗癌、抗腫瘤作用,對心血管疾病和肝病也有一定療效[1-2]。從芹菜中提取黃酮類物質(zhì),生產(chǎn)具有抗氧化作用的天然保健產(chǎn)品,已成為農(nóng)產(chǎn)品資源高效利用的研究熱點(diǎn)[3-4]。
目前測定芹菜總黃酮提取量大多采用分光光度法、光譜法等方法,測定過程復(fù)雜、時間長、成本較高[5]。采用軟件方法實現(xiàn)芹菜總黃酮提取量預(yù)測,是解決此類生物量參數(shù)難以實時在線測量和控制的有效方法[6]。近年來神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等預(yù)測技術(shù)越來越受到重視[7-8],其中神經(jīng)網(wǎng)絡(luò)技術(shù)對樣本數(shù)據(jù)量要求高,應(yīng)用受限;支持向量機(jī)預(yù)測技術(shù)雖然適用于非線性小樣本數(shù)據(jù),但其泛化能力有限,對異常樣本敏感,在實際應(yīng)用中容易出現(xiàn)大的預(yù)測偏差。最小二乘支持向量機(jī)技術(shù)提高了泛化能力,具有精度高、性能穩(wěn)定的優(yōu)點(diǎn),可用于農(nóng)業(yè)現(xiàn)代化應(yīng)用中[9]。影響最小二乘支持向量機(jī)預(yù)測精度的重要參數(shù)指標(biāo)是正規(guī)化參數(shù)和核寬度系數(shù),傳統(tǒng)的交叉驗證確定法可保證較高的預(yù)測精度,但預(yù)測速度慢,限制了其實際應(yīng)用。本研究采用改進(jìn)的人工蜂群算法對最小二乘支持向量機(jī)的參數(shù)指標(biāo)進(jìn)行優(yōu)化選擇[10-11],避免了標(biāo)準(zhǔn)人工蜂群算法過早收斂問題,實現(xiàn)了芹菜總黃酮提取量的快速預(yù)測,以期對蔬菜黃酮類物質(zhì)提取量的在線測量提供參考。
1算法基礎(chǔ)
1.1最小二乘支持向量機(jī)
最小二乘支持向量機(jī)(LSSVM )對支持向量機(jī)(SVM)進(jìn)行了改進(jìn),很好地解決了小樣本、非線性、高維數(shù)的問題,提高了問題的求解速度和泛化能力。最小二乘支持向量機(jī)通過構(gòu)建如下回歸函數(shù),將非線性問題轉(zhuǎn)化為高維特征空間的線性估計問題。
f(x)=ωTφ(x)+b。(1)
式中:φ(x)是核空間映射函數(shù);ω為權(quán)值向量;b為偏置量。
最小二乘支持向量回歸算法就是求解如下約束優(yōu)化問題。
minJ(ωξ)=12ωTω+12γ∑ni=1ξ2i;(2)
s.t. yi=ωTφ(xi)+b+ξi,i=1,2,…,n。(3)
式中:ξi為第i個樣本真實值與預(yù)測值的誤差;γ為可以動態(tài)調(diào)整的正規(guī)化參數(shù)。
可采用拉格朗日函數(shù)求解這個優(yōu)化問題。
L(ω,β,ξ,α)=12ωTω+12γ∑ni=1ξ2i-∑ni=1αi[ωφ(xi)+b+ξi-yi]。(4)
式中:αi∈R(i=1,2,…,N)為Lagrange乘子。a和b的求解與核函數(shù)的選擇有關(guān),常選擇如下形式的徑向基核函數(shù)(RBF)。
K(xi,xj)=exp-|xi-xj|22σ2。(5)
式中:σ為核寬度。
由此可見,對于最小二乘支持向量機(jī),核寬度σ和正規(guī)化參數(shù)γ是2個重要參數(shù),它們的選取直接影響著算法的學(xué)習(xí)能力和泛化性能。
1.2人工蜂群算法的改進(jìn)
人工蜂群算法(ABC) 模擬蜜蜂群智能搜索行為,具有控制參數(shù)少、算法簡單等優(yōu)點(diǎn),受到國內(nèi)外學(xué)者廣泛關(guān)注。但是標(biāo)準(zhǔn)ABC算法局部搜索能力較差,容易產(chǎn)生早熟和停滯現(xiàn)象[11]。
改進(jìn)標(biāo)準(zhǔn)ABC算法的隨機(jī)初始化種群生成方式,采用反向?qū)W習(xí)[12]的初始化策略,確保初始種群的多樣性,可以提高求解效率和改善解的質(zhì)量。
首先,隨機(jī)生成初始解集{xij|xij∈[minj,maxj]}、(i,j分別為解的個數(shù)和維度,minj,maxj分別為第j維的下界、上界)。然后,對每個初始解求出對應(yīng)的反向解,計算方法如下。
xij=minj+maxj-xij。(6)
最后,對隨機(jī)種群和反向種群的合集進(jìn)行排序,選擇適應(yīng)度較優(yōu)的解作為初始種群。
在標(biāo)準(zhǔn)ABC算法中,跟隨蜂根據(jù)雇傭蜂種群適應(yīng)度大小,按照輪盤賭策略選擇1個雇傭蜂跟隨,易導(dǎo)致群體多樣性下降,算法過早收斂。采用“信息素-靈敏度”模型代替輪盤賭選擇策略[11]。
信息素反映了解的質(zhì)量,信息素的大小與目標(biāo)函數(shù)值呈正比,每完成1次搜索過程,信息素進(jìn)行動態(tài)更新。靈敏度確定搜索的區(qū)域方向。信息素和靈敏度相結(jié)合的方法如下。
p(i)=f(i)-fminfmax-fminfnax≠fmin
0p(k)≤s(i)。(7)
式中: f(i)為個體的適應(yīng)度值;fmax,fmin為最大適應(yīng)度值和最小適應(yīng)度值;p(k)為不等于i的第k個食物源的信息素;s(i)為第i個跟隨蜂的靈敏度:s(i)~U(0,1)。
“信息素-靈敏度”模型在一定程度上避免了算法陷入局部最優(yōu),保證了算法快速進(jìn)化的方向。endprint
2預(yù)測建模
2.1芹菜總黃酮成分提取和測量方法
對于芹菜總黃酮的提取,首先將芹菜原料進(jìn)行低溫烘干,以降低機(jī)械粉碎的強(qiáng)度。將其粉碎后,稱取芹菜干粉1 g于50 mL錐形瓶中,加入一定量乙醇浸泡,從而使有效成分充分溶解。然后將浸泡好的溶液投入超聲波提取器提取,之后抽濾、定容,作為測定總黃酮含量的待測液,最后測定總黃酮含量。芹菜總黃酮的提取工藝流程如圖1所示。
采用Al(NO3)3-NaNO2分光光度方法[4] 測定總黃酮含量。取上述樣品液2 mL,用30%乙醇溶液定容至5 mL,加入15% NaNO2溶液0.3 mL,搖勻靜置6 min,再加入10%Al(NO3)3 溶液0.3 mL,搖勻靜置6 min后加入1 mol/L NaOH 溶液4 mL,再用蒸餾水定容,搖勻靜置15 min后測定吸光度,根據(jù)吸光度計算樣品液中總黃酮含量。由此可見,芹菜總黃酮提取測定過程復(fù)雜、時間長。
2.2基于ABC-LSSVM的芹菜總黃酮提取量預(yù)測模型
采用吸光度方法測定芹菜總黃酮提取量,由于測定過程復(fù)雜、時間長,制約了其生產(chǎn)應(yīng)用。因此,構(gòu)建芹菜總黃酮提取含量的預(yù)測模型,減少試驗測量次數(shù),實現(xiàn)在線實時預(yù)測尤為必要?;贏BC-LSSVM的芹菜總黃酮預(yù)測步驟如下:(1)對芹菜總黃酮提取試驗中的相關(guān)數(shù)據(jù)進(jìn)行歸一化處理;(2)參數(shù)初始化,設(shè)置最大迭代次數(shù),按反向?qū)W習(xí)策略生成初始解,計算適應(yīng)度函數(shù)值;按適應(yīng)度函數(shù)值優(yōu)劣進(jìn)行排序,排在前50%的為雇傭蜂,排在后50%的為跟隨蜂;(3)對于第n步的雇傭蜂,記錄最優(yōu)值并展開鄰域搜索,產(chǎn)生1個新位置;(4)雇傭蜂按貪婪選擇方法,當(dāng)搜索解優(yōu)于記憶中的最優(yōu)解時,替換記憶解,反之保持不變;(5)全部雇傭蜂完成鄰域搜索后,跳擺尾舞與跟隨蜂共享食物源信息;跟隨蜂按公式(7)的選擇機(jī)制選擇雇傭蜂;(6)同(3)(4),跟隨蜂記下種群最終更新后達(dá)到的最優(yōu)適應(yīng)度值以及相應(yīng)的參數(shù); (7)當(dāng)跟隨蜂的鄰域搜索次數(shù)到達(dá)閥值而仍未找到更優(yōu)位置時,偵察蜂重新初始化食物源位置;(8)如果滿足停止準(zhǔn)則,則停止計算,輸出最優(yōu)適應(yīng)度值及相應(yīng)參數(shù),否則轉(zhuǎn)向(3);(9)根據(jù)最優(yōu)解得到的LSSVM參數(shù)對測試數(shù)據(jù)集進(jìn)行仿真,用建立的芹菜總黃酮預(yù)測模型對總黃酮提取量進(jìn)行預(yù)測。
3結(jié)果與分析
根據(jù)芹菜總黃酮提取試驗,發(fā)現(xiàn)總黃酮提取量主要與提取時間、乙醇濃度、料液比等3個非線性因素的關(guān)系最為密切,三者之間的交互作用較小,且容易測量。因此,在5種料液比(1 ∶10、1 ∶20、1 ∶30、1 ∶40、1 ∶50, g ∶mL)、5種乙醇濃度水平(50%、60%、70%、80%、90%)、5種提取時間(10、20、30、40、50 min)條件下進(jìn)行芹菜總黃酮提取的單因素試驗。
在單因素試驗基礎(chǔ)上,選用L9(33)正交試驗表,考察料液比、提取時間、乙醇濃度對芹菜總黃酮提取的影響。因素水平見表1。
表1芹菜總黃酮提取條件正交試驗因素與水平
水平因素提取時間(min)乙醇濃度(%)料液比(g ∶mL)130701 ∶20240801 ∶30350901 ∶40
將試驗所得的24例數(shù)據(jù)作為樣本數(shù)據(jù),在數(shù)據(jù)歸一化之后,選取前16例試驗樣本數(shù)據(jù)作為訓(xùn)練樣本數(shù)據(jù),構(gòu)建基于ABC-LSSVM的預(yù)測模型,再用后11例樣本數(shù)據(jù)作為測試數(shù)據(jù),對該模型進(jìn)行驗證。作為訓(xùn)練樣本的16例原始數(shù)據(jù)如表2所示。
表2芹菜總黃酮預(yù)測模型訓(xùn)練樣本數(shù)據(jù)
樣品編號提取時間
(min)乙醇濃度
(%)料液比
(g ∶mL)總黃酮含量
(mg/g)140701 ∶106.472240701 ∶206.938340701 ∶307.296440701 ∶406.902540701 ∶506.830610701 ∶306.186720701 ∶306.400830701 ∶306.651940701 ∶306.9731050701 ∶306.9381140501 ∶304.2871240601 ∶305.2901340701 ∶306.5441440801 ∶307.4751540901 ∶307.1531640701 ∶206.207
在預(yù)測仿真試驗中,計算機(jī)配置為聯(lián)想雙核E5800@3.2 GHz、2 G內(nèi)存、Windows XP 操作系統(tǒng),測試軟件采用Matlab 7.0。
采用改進(jìn)的人工蜂群算法優(yōu)化最小二乘支持向量機(jī)得到的最優(yōu)化參數(shù)值為:核寬度σ=262.22,正規(guī)化參數(shù) γ=1 969.6。將基于ABC-LSSVM預(yù)測模型仿真得到的數(shù)據(jù)與實際測量數(shù)據(jù)進(jìn)行比較,結(jié)果見表3。
表3基于ABC-LSSVM的芹菜總黃酮預(yù)測結(jié)果
樣品
編號提取時間
(min)乙醇濃度
(%)料液比
(g ∶mL)實測含量
(mg/g)預(yù)測含量
(mg/g)相對誤差
(%)140801 ∶307.486.95-7.08240901 ∶307.157.180.36330701 ∶206.286.564.50440801 ∶206.496.825.09550901 ∶206.607.087.23630801 ∶306.966.92-0.55740901 ∶307.217.18-0.43850701 ∶306.466.744.28930901 ∶407.077.212.031040701 ∶406.676.771.521150801 ∶407.357.03-4.37
由表3可知,采用ABC-LSSVM的芹菜總黃酮預(yù)測模型得到的仿真數(shù)據(jù)與實測數(shù)據(jù)的最大相對誤差為7.23%,最小相對誤差為0.36%,平均相對誤差為1.14%,精度較高。實測數(shù)據(jù)與仿真數(shù)據(jù)的對比如圖2所示。endprint
圖3更直觀地描述了模型估計值與實測值的相對誤差情況?;贏BC-LSSVM的芹菜總黃酮提取量預(yù)測模型的進(jìn)化曲線如圖4所示,由圖4可見,該預(yù)測模型收斂速度快、精度高、性能穩(wěn)定。
4結(jié)論
芹菜總黃酮提取受提取時間、乙醇濃度、料液比等3種非線性因素的影響,可利用改進(jìn)的人工蜂群算法優(yōu)化最小二乘支持向量機(jī)建立芹菜總黃酮預(yù)測模型。在標(biāo)準(zhǔn)人工蜂群算法的種群初始化階段,引入反向?qū)W習(xí)策略,確保了個體分布的均勻性,并用“信息素-靈敏度”模型作為選擇策略,提高了預(yù)
測的精度和收斂速度,性能穩(wěn)定,對于芹菜總黃酮提取的網(wǎng)絡(luò)在線估計、降低測定成本具有重要意義。
參考文獻(xiàn):
[1]趙進(jìn),尤婷婷,林丹英,等. 超聲波提取芹菜總黃酮及鑒別[J]. 時珍國醫(yī)國藥,2007,18(6):1454-1455.
[2]文開新,王成章,嚴(yán)學(xué)兵,等. 黃酮類化合物生物學(xué)活性研究進(jìn)展[J]. 草業(yè)科學(xué),2010,27(6):115-122.
[3]包麗芹,韓德權(quán). 芹菜及芹菜黃酮的藥用價值[J]. 黑龍江醫(yī)藥,2007,20(4):317-320.
[4]陳欲云,劉春麗,邊名鴻. 芹菜黃酮抗氧化作用的研究[J]. 時珍國醫(yī)國藥,2012,23(7):1718-1719.
[5]何書美,喬蘭俠,劉敬蘭. 紅外光譜法測定芹菜葉提取物中總黃酮的含量[J]. 分析科學(xué)學(xué)報,2008,24(2):201-204.
[6]俞金壽. 軟測量技術(shù)及其應(yīng)用[J]. 自動化儀表,2008,29(1):1-7.
[7]王紅君,張夢,趙輝,等. 基于 BP 神經(jīng)網(wǎng)絡(luò)的溫室黃瓜灌溉預(yù)測模型[J]. 江蘇農(nóng)業(yè)科學(xué),2013,41(11):407-409.
[8]趙辰陽,徐明. 基于 FIG -SVM 的農(nóng)產(chǎn)品價格趨勢預(yù)測[J]. 江蘇農(nóng)業(yè)科學(xué),2014,42(5):385-388.
[9]楊瑋,孫紅,鄭立華,等. 基于土壤參數(shù)的冬小麥產(chǎn)量預(yù)測模型[J]. 農(nóng)業(yè)工程學(xué)報,2013,29(23):118-123.
[10]朱林,陸春偉.基于改進(jìn)蟻群支持向量機(jī)的氫含量軟測量建模[J]. 計算機(jī)仿真,2014,31(3):384-388.
[11]王慧穎,劉建軍,王全洲. 改進(jìn)的人工蜂群算法在函數(shù)優(yōu)化問題中的應(yīng)用[J]. 計算機(jī)工程與應(yīng)用,2012,48(19):36-39.
[12]汪慎文,丁立新,謝大同, 等. 應(yīng)用反向?qū)W習(xí)策略的群搜索優(yōu)化算法[J]. 計算機(jī)科學(xué),2012,39(9):183-187. 謝雨杉,李多偉,李銀芳,等. 碘試液比色法測定α-淀粉酶抑制劑活性[J]. 江蘇農(nóng)業(yè)科學(xué),2015,43(1):301-303.endprint