摘要:利用混合蛙跳算法(SFLA)對(duì)最小二乘支持向量機(jī)(LSSVM)的參數(shù)進(jìn)行優(yōu)化,建立了一種基于混合蛙跳算法和最小二乘支持向量機(jī)的芹菜總黃酮提取預(yù)測(cè)模型。仿真結(jié)果表明,該預(yù)測(cè)模型提高了預(yù)測(cè)精度,性能更加穩(wěn)定,為芹菜總黃酮提取的在線預(yù)估和優(yōu)化控制提供了可靠的技術(shù)參考。
關(guān)鍵詞:芹菜;混合蛙跳算法;最小二乘支持向量機(jī);總黃酮;預(yù)測(cè)
中圖分類號(hào):TP301 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):0439-8114(2015)06-1486-04
DOI:10.14088/j.cnki.issn0439-8114.2015.06.053
Abstract: Shuffled frog leaping algorithm (SFLA) was used to parameters of optimize least square support vector machine (LSSVM). The prediction model of extracting total flavonoids from celery based on shuffled frog leaping algorithm and least squares support vector machine was established. Simulation results showed that this prediction method had high accuracy and stable performance. It was conducive to achieve online estimation and optimal control.
Key words: celery;artificial bee colony algorithm; least squares support vector machines; total flavonoids; prediction
黃酮類化合物是一類存在于植物中的天然產(chǎn)物,屬于植物的次級(jí)代謝產(chǎn)物。現(xiàn)代醫(yī)學(xué)研究發(fā)現(xiàn),芹菜的莖葉中含有豐富的黃酮類物質(zhì),其具有清除自由基、抗氧化、抑菌、抗病毒、抗癌和抗腫瘤等作用[1,2]。從芹菜中提取黃酮類物質(zhì),以開發(fā)新型天然黃酮類藥物為目標(biāo),促進(jìn)芹菜的深加工,已成為資源高效利用的研究熱點(diǎn)[3,4]。
目前,對(duì)芹菜總黃酮的提取主要采用堿液法、微波法、超聲波法等,而對(duì)芹菜中總黃酮含量的測(cè)定,大多采用分光光度法、光譜法等方法。這些傳統(tǒng)的提取和測(cè)定方法容易受到人為操作及環(huán)境變化等不可預(yù)見性因素的影響,造成數(shù)據(jù)準(zhǔn)確性降低。采用軟件方法實(shí)現(xiàn)芹菜總黃酮提取量的預(yù)測(cè)是解決此類生物量參數(shù)難以準(zhǔn)確實(shí)時(shí)測(cè)量和控制的有效方法[5]。近年來,神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等預(yù)測(cè)方法成為當(dāng)前研究的熱點(diǎn)[6-8]。其中,神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練樣本數(shù)據(jù)要求高,對(duì)于小樣本數(shù)據(jù)應(yīng)用受到一定限制;支持向量機(jī)適用于非線性小樣本數(shù)據(jù),但泛化能力有限,對(duì)于異常樣本預(yù)測(cè)偏差較大。
本研究采用改進(jìn)的混合蛙跳算法對(duì)最小二乘支持向量機(jī)的參數(shù)進(jìn)行優(yōu)化建模[9,10],避免了算法過早收斂陷入局部最優(yōu),提高了模型的預(yù)測(cè)精度,實(shí)現(xiàn)了芹菜總黃酮提取量的快速準(zhǔn)確預(yù)測(cè),為芹菜資源的高值化利用提供了技術(shù)支撐。
1 算法基礎(chǔ)
1.1 最小二乘支持向量機(jī)
最小二乘支持向量機(jī)(LSSVM)對(duì)支持向量機(jī)(SVM)進(jìn)行了改進(jìn)[11],很好地解決了小樣本、非線性和高維數(shù)的問題,提高了求解速度和泛化能力。將非線性問題轉(zhuǎn)化為高維特征空間的線性估計(jì)問題,構(gòu)建了如下回歸函數(shù):
其中,?滓為核寬度,對(duì)于最小二乘支持向量機(jī),核寬度?滓和正規(guī)化參數(shù)?酌是其重要的兩個(gè)參數(shù),它們的選取直接影響著算法的學(xué)習(xí)能力和泛化性能。
1.2 SFLA算法的改進(jìn)
1.2.1 SFLA算法的種群初始化改進(jìn)策略 由于標(biāo)準(zhǔn)SFLA算法采用隨機(jī)方式產(chǎn)生初始種群,導(dǎo)致個(gè)體分布缺乏均勻性,影響了種群的多樣性,算法的求解效率也受到限制。因此,在種群初始化階段,引入反向?qū)W習(xí)策略,確保初始種群具有多樣性,主要步驟如下所示:
1)隨機(jī)生成初始解,用集合形式表示解集為:
x=xij|xij∈[minj,maxj],其中j=1,minj,maxj分別為第j維的下界和上界。
2)計(jì)算每個(gè)初始解對(duì)應(yīng)的反向解,公式如下所示:
其中,?孜為變異因子,N(0,1)為均值為0、方差為1的隨機(jī)量。
2 芹菜總黃酮含量的測(cè)定和預(yù)測(cè)建模
2.1 芹菜總黃酮含量的測(cè)定
將芹菜原料進(jìn)行低溫烘干粉碎后,稱取芹菜干粉1.00 g于50 mL錐形瓶中,加入一定量的乙醇浸泡,然后將浸泡好的溶液進(jìn)行超聲波提取,提取完成后抽濾、定容,作為待測(cè)液備用。取上述樣品液2.0 mL并以30%乙醇定容至5 mL,加入0.3 mL 15%NaNO2搖勻靜置6 min,再加入0.3 mL 10% Al(NO3)3,搖勻靜置6 min后加入4 mL 1 mol/L NaOH,再用蒸餾水定容,搖勻靜置15 min后測(cè)定吸光度。根據(jù)吸光度由下式計(jì)算樣品液中的總黃酮含量:
式中,m為總黃酮含量(mg/g);C為溶液中總黃酮的測(cè)定濃度(mg/mL);V1為芹菜總黃酮提取液總體積(mL);W為芹菜干粉質(zhì)量(g);V為所取待測(cè)液體積(mL)。
2.2 預(yù)測(cè)模型的構(gòu)建
采用紫外分光光度法測(cè)定芹菜總黃酮含量,測(cè)定過程復(fù)雜、時(shí)間長(zhǎng),制約了芹菜總黃酮的生產(chǎn)應(yīng)用。因此,構(gòu)建芹菜總黃酮含量的預(yù)測(cè)模型,減少測(cè)定次數(shù),對(duì)實(shí)現(xiàn)在線實(shí)時(shí)預(yù)測(cè)尤為必要。基于SFLA和LSSVM的芹菜總黃酮含量預(yù)測(cè)步驟如下:
1)對(duì)芹菜總黃酮提取試驗(yàn)中的數(shù)據(jù)進(jìn)行歸一化處理;
2)參數(shù)初始化,設(shè)置蛙群個(gè)體總數(shù)、迭代總次數(shù)、子群數(shù)、每個(gè)子群內(nèi)的蛙數(shù)、子群內(nèi)的更新次數(shù)、變異因子及最大、最小變異概率;
3)按式(5)反向?qū)W習(xí)策略構(gòu)建初始種群;
4)計(jì)算每只青蛙適應(yīng)度值后按降序排序,并分成k個(gè)子群;
5)確定每個(gè)子群的最優(yōu)解和最差解及群體全局最優(yōu)解,反復(fù)更新每個(gè)子群的最差青蛙,直至達(dá)到設(shè)定的子群迭代總次數(shù)后,將更新后的子群進(jìn)行混合,取代原來的群體;
6)按式(6)和式(7)計(jì)算群體的適應(yīng)度方差,再按式(8)計(jì)算變異概率,并按式(9)對(duì)全局最優(yōu)解進(jìn)行變異操作,更新當(dāng)前群體最優(yōu)解;
7)當(dāng)?shù)螖?shù)達(dá)到設(shè)定的最大次數(shù),則停止計(jì)算,輸出最優(yōu)解,否則轉(zhuǎn)到第4步;
8)根據(jù)最優(yōu)解優(yōu)化LSSVM的參數(shù),構(gòu)建預(yù)測(cè)模型,并對(duì)測(cè)試數(shù)據(jù)集進(jìn)行仿真和測(cè)試。
3 預(yù)測(cè)模型的應(yīng)用
在芹菜總黃酮提取試驗(yàn)中,設(shè)置了5種料液比(1∶10、1∶20、1∶30、1∶40、1∶50,m/V)、5種乙醇體積分?jǐn)?shù)(0、60%、70%、80%、90%)和5個(gè)提取時(shí)間(10、20、30、40、50 min)條件,進(jìn)行了芹菜總黃酮含量測(cè)定試驗(yàn)。將上述試驗(yàn)所得的24個(gè)數(shù)據(jù)作為樣本數(shù)據(jù),在數(shù)據(jù)歸一化之后,選取前16個(gè)試驗(yàn)樣本數(shù)據(jù)作為訓(xùn)練樣本數(shù)據(jù),構(gòu)建基于SFLA和LSSVM的預(yù)測(cè)模型;再用后11個(gè)樣本數(shù)據(jù)作為測(cè)試數(shù)據(jù),對(duì)該模型進(jìn)行驗(yàn)證。作為訓(xùn)練樣本數(shù)據(jù)的16個(gè)原始樣本數(shù)據(jù)如表1所示。
在預(yù)測(cè)仿真試驗(yàn)中,計(jì)算機(jī)配置為聯(lián)想雙核E5800@3.2 GHz,2 G內(nèi)存,Windows XP操作系統(tǒng),測(cè)試環(huán)境為Matlab 7.0。采用改進(jìn)的混合蛙跳算法優(yōu)化最小二乘支持向量機(jī)得到的最優(yōu)化參數(shù)值為:核寬度σ=9.257 1,正規(guī)化參數(shù)γ=4.453 578。將基于SFLA和LSSVM的預(yù)測(cè)模型所得仿真數(shù)據(jù)與實(shí)際測(cè)量數(shù)據(jù)進(jìn)行比較,其比較結(jié)果如表2所示。
由表2可以看出,基于SFLA和LSSVM的芹菜總黃酮含量預(yù)測(cè)模型得到的仿真數(shù)據(jù)與實(shí)測(cè)數(shù)據(jù)的最大相對(duì)誤差為4.49%,最小相對(duì)誤差為0.20%,平均相對(duì)誤差為2.12%。實(shí)測(cè)數(shù)據(jù)與仿真數(shù)據(jù)的對(duì)比如圖1所示。
為了更直觀地描述模型估計(jì)值與實(shí)際測(cè)試值的相對(duì)誤差情況,采用如圖2所示的相對(duì)誤差曲線圖。圖3為基于SFLA和LSSVM的芹菜總黃酮含量預(yù)測(cè)模型的進(jìn)化曲線,所采用預(yù)測(cè)模型的收斂速度快、精度高、性能穩(wěn)定。
4 小結(jié)
本研究提出了一種基于SFLA優(yōu)化的LSSVM芹菜總黃酮預(yù)測(cè)模型,該模型在混合蛙跳算法的初始化階段引入反向?qū)W習(xí)策略,確保了個(gè)體分布的均勻性,同時(shí)為了避免算法陷入局部最優(yōu),根據(jù)適應(yīng)度方差,動(dòng)態(tài)調(diào)整蛙群的變異概率,提高了預(yù)測(cè)的精度和收斂速度,性能穩(wěn)定。仿真試驗(yàn)結(jié)果表明,該預(yù)測(cè)模型可以應(yīng)用于芹菜總黃酮含量的在線測(cè)量,對(duì)芹菜黃酮類化合物的測(cè)定有著重要的應(yīng)用價(jià)值。
參考文獻(xiàn):
[1] 趙 進(jìn),尤婷婷,林丹英.超聲波提取芹菜總黃酮及鑒別[J].時(shí)珍國(guó)醫(yī)國(guó)藥,2007,18(6):1454-1455.
[2] 文開新,王成章.黃酮類化合物生物學(xué)活性研究進(jìn)展[J].草業(yè)科學(xué),2010,27(6):115-122.
[3] 包麗芹,韓德權(quán).芹菜及芹菜黃酮的藥用價(jià)值[J].黑龍江醫(yī)藥, 2007,20(4):317-320.
[4] 陳欲云,劉春麗,邊名鴻.芹菜黃酮抗氧化作用的研究[J].時(shí)珍國(guó)醫(yī)國(guó)藥,2012,23(7):1718-1719.
[5] 俞金壽.軟測(cè)量技術(shù)及其應(yīng)用[J].自動(dòng)化儀表,2008,29(1):1-7.
[6] 袁 琦,黃建清,符 新.基于神經(jīng)網(wǎng)絡(luò)的水產(chǎn)養(yǎng)殖水質(zhì)預(yù)測(cè)模型研究[J].湖北農(nóng)業(yè)科學(xué),2013,52(1):143-146.
[7] 高丙朋,姜 波,南新元.基于LS-SVM的番茄產(chǎn)量在線預(yù)測(cè)[J].湖北農(nóng)業(yè)科學(xué),2012,51(5):1025-1027.
[8] 楊 瑋,孫 紅,鄭立華.基于土壤參數(shù)的冬小麥產(chǎn)量預(yù)測(cè)模型[J].農(nóng)業(yè)工程學(xué)報(bào),2013,29(23):118-123.
[9] 秦 業(yè),袁海文,袁海斌,等.基于優(yōu)化最小二乘支持向量機(jī)的電能質(zhì)量擾動(dòng)分類[J].電工技術(shù)學(xué)報(bào),2012,27(8):209-214.
[10] EUSUFF M M,LANSEY K E. Optimization of water distribution network design using the shuffled frog leaping algorithm[J]. Water Resources Planning and Management,2003,129(3): 210-225.
[11] 陶新民,徐 晶,楊立標(biāo),等.一種改進(jìn)的粒子群和K均值混合聚類算法[J].電子與信息學(xué)報(bào),2010,32(1):92-97.