鄭沫利,趙艷軻,閆 敏,孫 俊,劉雍容
(1.國貿(mào)工程設(shè)計院,北京 100037; 2.江南大學物聯(lián)網(wǎng)工程學院,江蘇 無錫 214122)
我國的人口多,基數(shù)大,對糧食的需求也大,2015年調(diào)查結(jié)果顯示仍存在接近2000萬噸糧食的不足[1]。所以,針對糧食不足問題,不僅需要對糧食產(chǎn)量層面的提升,還需降低糧食的損耗或浪費。糧食的損耗分為產(chǎn)前損耗和產(chǎn)后損耗,本文主要研究和分析糧食產(chǎn)后的儲藏環(huán)節(jié)損耗。糧食儲藏損耗一直是困擾糧食收儲企業(yè)的一大難題,也是影響收儲企業(yè)經(jīng)濟效益的一個重要因素。根據(jù)農(nóng)業(yè)部門統(tǒng)計,我國糧食產(chǎn)后損失率超過8%,每年糧食損失量高達500億斤,僅在糧食儲存環(huán)節(jié)的損失率就高達5%左右,每年的糧食損失量就達310億斤,相當于150多個中型糧庫的儲備量,損失數(shù)量驚人。所以可以借助方法預測,從而將一些數(shù)據(jù)轉(zhuǎn)換決策作為指引,找到防范的主要因素[2]。儲藏中損耗可以來自自然方面,主要包括自身的生命呼吸的損耗,還可以來自蟲鼠的損耗,更嚴重的損失是在存儲過程中通過晾曬、處于通風處等造成水分過度流失[3]。由于糧食在長期的儲藏過程中會受到上述因素的影響,這就降低了國家糧食儲備的安全和經(jīng)濟效益。因此對糧食儲藏環(huán)節(jié)中損耗的評估,對于糧食產(chǎn)后減損具有重要的意義。
儲藏環(huán)節(jié)糧食產(chǎn)后損失的主要影響因素可以概括為:儲藏情況、進倉情況、出倉情況這3大部分。損失率是指總損失率,包括:進倉損失率、出倉損失率、蟲害損失率、鼠害損失率、霉變損失率、其他損失率。因此,本文針對這3大因素對產(chǎn)后糧食儲藏總損失率進行建模評估,即運用支持向量機(Support Vector Machine, SVM)模型對影響糧食儲藏損耗的因素與儲藏損耗率進行建模。在建模過程中,本文采用隨機漂移粒子群優(yōu)化(Random Drift Particle Swarm Optimization, RDPSO)算法優(yōu)化SVM模型的參數(shù)。
RDPSO算法與遺傳算法[4-6]等智能優(yōu)化算法一樣,是一種基于群體的搜索算法,是粒子群優(yōu)化(Particle Swarm Optimization, PSO)算法的一種重要改進。粒子群優(yōu)化算法[6]是1995年由Kenney和Eberhart為解決連續(xù)優(yōu)化問題而提出的群體智能優(yōu)化算法。該算法提出以來,得到了國內(nèi)外研究人員的廣泛關(guān)注,并提出了很多改進算法,例如,Mendes等人[7]提出了全通知粒子群優(yōu)化算法,Sun等人[8]提出了QPSO算法,Jordehi[9]提出了增強領(lǐng)導粒子群優(yōu)化算法(ELPSO),Garg[10]提出了一種混合智能優(yōu)化算法PSO-GA。此外,Deng等人[11]提出了基于記憶特性的動態(tài)分數(shù)階和阿爾法穩(wěn)定分布理論來提高PSO算法的全局搜索能力;仝秋娟等人[12]提出了自適應動態(tài)改變的粒子群算法。
本文運用RDPSO良好的全局搜索能力優(yōu)化SVM的參數(shù),提出基于RDPSO-SVM的糧食產(chǎn)后儲藏損耗智能評估模型?;诩Z食儲藏損耗調(diào)查數(shù)據(jù),分別對RDPSO-SVM模型、基本的SVM模型和線性回歸模型進行了測試與比較分析。實驗結(jié)果表明本文所提出的RDPSO-SVM模型比其他2種模型能夠更好地對糧食產(chǎn)后儲藏損耗進行評估預測。
為了建立糧食產(chǎn)后損耗的智能評估模型,本文通過問卷調(diào)查來收集數(shù)據(jù)。中國作為發(fā)展中的農(nóng)業(yè)大國,收集數(shù)據(jù)相對來說比較容易,但是由于中國農(nóng)業(yè)方面的工具水平相對于發(fā)達國家來說比較落后,所以糧食的收割、買賣、運輸以及儲藏等環(huán)節(jié)都存在不同程度的損耗。本文從糧食儲藏損失率的影響因子進行調(diào)查問卷的設(shè)計,并據(jù)此進行模型構(gòu)建。本文在調(diào)查問卷的設(shè)計上考慮以下一些因素:
首先是區(qū)域影響因素。本文分西南、東南、東北、西北4個地區(qū)進行數(shù)據(jù)采集。根據(jù)常識,在東北地區(qū)尤其是黑龍江濕度較低、西北地區(qū)西藏空氣干燥,糧食水分嚴重下降,這不僅影響了糧食(尤其稻谷和大豆)食用品質(zhì)和加工品質(zhì),還影響新鮮程度,更是影響重量。
其次是糧食產(chǎn)后儲藏損耗的影響因素。筆者認為,儲藏倉型、存儲技術(shù)和糧食的包散情況可以作為影響糧食儲藏損耗的主要因素;儲藏區(qū)域、進倉工藝、出倉工藝、進倉總量、儲藏量、儲糧設(shè)施、存儲技術(shù)、儲藏時間等作為影響糧食儲藏損耗的次要因素。
儲藏倉型作為影響糧食儲藏損耗的主要因素之一,在我國的發(fā)展歷史悠久,經(jīng)過不斷的變化,至今儲藏設(shè)施包括:平房倉、淺筒倉、立筒倉等。不同的地區(qū),根據(jù)每個地方的氣候、地形、住宿、文化、習慣等情況,建筑的儲藏倉型均不同。根據(jù)國家糧食統(tǒng)計局公告,2013年糧食的總量高達6億噸多[13],由于儲存設(shè)施簡陋,損耗達到75億千克[14]。
存儲技術(shù)作為影響糧食儲藏損耗的主要因素,本文的調(diào)查問卷中相關(guān)題項有:尚未應用“四合一”技術(shù)的常規(guī)儲藏、應用“四合一”技術(shù)的儲藏、應用“四合一”升級新技術(shù)的儲藏等選項。由于我國地域大、人口多,對儲糧新技術(shù)應用和重視程度也各不相同。先進儲藏技術(shù)因需要投入前期成本,長期效益難以在短期內(nèi)體現(xiàn),因此造成新技術(shù)應用少,推廣進程緩慢。
糧食的包散情況作為另一個影響儲藏損耗的因素,包括包糧和散糧2種情況。這主要是考慮到進出倉時是否會發(fā)生糧食散落,從而導致糧食損耗。據(jù)調(diào)查統(tǒng)計,散糧比例只是占到15%,應用機器包裝糧食儲藏可以減少損耗和浪費。
進倉工藝和出倉工藝作為一個次要影響因素,選項包括:散糧打包出倉(進倉)、散糧散裝出倉(進倉)、包糧包裝出倉(進倉)、包糧拆包出倉(進倉)。此外,儲藏量、進倉量、出倉量、蟲害、微生物大量繁殖和霉變等作為影響因素,均會導致糧食質(zhì)量及物質(zhì)的損失。我國由于真菌霉變[15]這個原因損失高達2000萬噸。
我國糧食產(chǎn)后損耗分析相對于國外來說比較晚,目前,國內(nèi)已經(jīng)有一些關(guān)于糧食產(chǎn)后損耗分析的研究成果,例如,趙霞等人[16]對糧食產(chǎn)后損耗進行分析,建立了糧食產(chǎn)后損失浪費評價指標體系。類似文獻[17],本文通過調(diào)查數(shù)據(jù),應用SPSS對數(shù)據(jù)進行效度分析、信度分析和相關(guān)性分析后,找出影響糧食產(chǎn)后儲藏損耗的主要因素,然后應用RDPSO-SVM進行儲藏損耗的智能建模。
首先應用SPSS對調(diào)查問卷獲取的數(shù)據(jù)進行描述性統(tǒng)計分析,得到平均損失率、標準差、數(shù)據(jù)峰度、偏度、是否存在極端值等,并用t檢驗進行驗證。由于篇幅關(guān)系,本文不再贅述。
對于調(diào)查問卷中產(chǎn)后糧食儲藏的損失因素的分析,本文采用信度分析和效度分析,其中采用內(nèi)部一致性系數(shù)克隆巴赫系數(shù)(Cronbach alpha)檢驗量表的信度;效度分析采用探索性因子分析的方法。在研究中,信度分析方面,內(nèi)部一致性系數(shù)需要大于0.7才能表明量表是有一定的可靠性;當題項數(shù)小于6個時,內(nèi)部一致性系數(shù)可以小于0.7,但要大于0.6來表明量表的可靠性。而判斷樣本是否可以進行因子分析,需要數(shù)據(jù)的KMO樣本測度和巴特萊特球體檢驗。其中KMO在0.5以下,不適合;在[0.5,0.60),勉強;在[0.6,0.7),比較適合;在[0.7,0.8),適合;在[0.8,0.9),很適合;如果在0.9以上的話,是非常適合。巴特萊特球體檢驗的統(tǒng)計值的顯著性概率如果小于或者等于顯著性水平時,該樣本數(shù)據(jù)可做因子分析。在因子分析之前,在SPSS軟件中選擇幾個主要相關(guān)的因素進行分析得出克隆巴赫系數(shù)大于0.7。然后再進行KMO和巴特萊特檢驗得出0.765在0.7到0.8之間,所以數(shù)據(jù)是有效的。
在進行回歸分析或智能建模之前,首先對調(diào)查數(shù)據(jù)就影響因素進行相關(guān)性分析。相關(guān)性分析作為一種比較常用的統(tǒng)計方法,主要是用來檢驗不同變量之間關(guān)系的緊密程度。本文采用Pearson相關(guān)系數(shù)分析法,對本項目所涉及的變量進行相關(guān)分析。由于篇幅有限,本文不再贅述。
在建立糧食產(chǎn)后儲藏損耗的回歸模型之前,需要在信度和效度上得出降維后的因子(因子)、FEGR FACTOR SCORE(系數(shù))、常數(shù)項(C)?;貧w模型是由各個因子系數(shù)和常數(shù)項得出,可以表示為:
損失率=C-[系數(shù)1]×[因子1]-[系數(shù)2]×[因子2]-…-[系數(shù)n]×[因子n]
本文提出用RDPSO-SVM建立糧食儲藏損失率與降維后的因子之間的關(guān)系模型,從而對損失率進行智能評估與預測。
通過以上描述性統(tǒng)計分析、效度分析、信度分析、相關(guān)性分析選擇有效性數(shù)據(jù),并進一步進行下述的RDPSO-SVM智能模型構(gòu)建。
RDPSO算法是受到PSO算法粒子收斂性分析和金屬導體中自由電子模型的啟發(fā)而提出的。PSO算法粒子收斂性表明,每個粒子以其局部吸引子為目標進行搜索;而金屬導體自由電子模型表明,導體中電子的運動又分為定向漂移運動和隨機無規(guī)則方式,其中漂移運動由外電場引起,使電子往勢能最小的位置運動,而隨機運動是熱運動,它能夠使粒子避免陷入局部最小勢能的位置。因此,金屬導體中的電子運動過程實際上就是一個搜索勢能最小化的過程,其中隨機運動代表全局搜索,漂移運動代表局部搜索,因此本文考慮在RDPSO算法中將粒子的運動分為2個部分,即漂移運動和隨機運動[18]。因此,RDPSO算法中,在第n+1迭代步,粒子的速度由熱運動速度和漂移速度2部分組成,如公式(1)所示:
(1)
粒子隨機運動速度由下式給出:
(2)
(3)
對于粒子的定向漂移運動,可以假設(shè)為粒子向局部吸引子的運動以體現(xiàn)粒子的局部搜索。因此,其運動速度可以表示為:
(4)
(5)
基于式(1)、式(2)、式(4),可以得到RDPSO算法粒子的速度和位置更新方程如下:
(6)
(7)
RDPSO算法中,隨機運動體現(xiàn)全局搜索,定向漂移運動體現(xiàn)局部搜索??梢酝ㄟ^控制α和β的取值來調(diào)節(jié)和平衡粒子全部搜索和局部搜索。
本文中,糧食產(chǎn)后儲藏損失率評估的基礎(chǔ)模型是SVM[20]。SVM的主要思想是將低維空間線性不可分的向量映射到高維空間,通過這樣的變換可以變成線性可分。在新的高維空間找出輸入量和輸出量之間的非線性關(guān)系。通過在高維分析出來的結(jié)果選擇適合的核函數(shù)K(Z,zi),在高維空間中求取最優(yōu)線性分類面[21]。從低維空間到高維空間是通過核函數(shù)K(Z,z1),K(Z,z2),…,K(Z,zn)映射到高維空間。SVM分類的決策為:
(8)
0≤αi≤C
(9)
其中,αi為每個訓練樣本所對應的拉格朗日系數(shù);C為懲罰因子,μ為權(quán)系數(shù)向量,b∈R為偏置,Z為樣本的特征向量,K(Z,zi)為核函數(shù)。
(10)
其中,g為核函數(shù)半徑。
本文采用RDPSO算法優(yōu)化SVM的參數(shù),使優(yōu)化后的SVM更好地進行預測分類。RDPSO-SVM的訓練流程如圖1所示。
圖1 RDPSO優(yōu)化SVM參數(shù)流程
實驗是從調(diào)查問卷的樣本集中選取180個樣本作為SVM訓練集,另取40個樣本作為測試集。每個樣本中有很多關(guān)于糧食儲藏損失的因素,包括:區(qū)域、儲糧設(shè)施、進倉工藝、出倉工藝、儲藏時間等。通過使用SPSS進行因子分析降維后,得到若干因子,然后以這些因子作為輸入,糧食儲藏損失率作為輸出,進行SVM建模[22]。然后,運用RDPSO對SVM模型進行參數(shù)尋優(yōu),精確找到最優(yōu)模型參數(shù),從而提高模型預測精度。
本文實驗中采用了線性回歸、基本SVM算法以及本文提出的RDPSO-SVM方法進行比較測試。圖2為應用了訓練樣本中的180條數(shù)據(jù)進行訓練得到的有效模型。圖中顯示了樣本和各個模型的誤差,黑色線條表示真實值,*表示應用RDPSO優(yōu)化SVM參數(shù)的模型,○表示基本SVM模型,×表示線性回歸模型。在圖2中可以明顯地看出RDPSO-SVM的預測值更接近真實值,基本SVM模型其次,然而線性回歸模型和真實值相差得很遠,其模型的擬合效果最差。因此,運用SVM模型建模,并采用RDPSO算法進行模型參數(shù)優(yōu)化可以達到很好的擬合效果。
圖2 模型訓練效果
圖3 模型預測效果比較
在圖2中可以容易看出線性回歸模型和真實值之間有很大的差距,遠離折線,所以在測試數(shù)據(jù)集上進行測試時,只是比較了RDPSO-SVM和基本SVM的效果,如圖3所示。從圖3可以看到,應用RDPSO算法優(yōu)化SVM模型后,模型的預測值更接近真實值,而基本SVM的預測值與實際值相差較大。具體的預測誤差如表1所示。其中,RDPSO-SVM模型的總的預測誤差為0.0063,而基本SVM的預測誤差為0.9649。
表1 預測誤差比較結(jié)果
因此,從上述分析可以看到,RDPSO-SVM對于糧食產(chǎn)后損耗數(shù)據(jù)不僅有良好的擬合能力,同樣具有很好的模型泛化能力。因此,RDPSO-SVM模型,即運用RDPSO優(yōu)化后的SVM模型可以很好地預測糧食產(chǎn)后損失率,該模型為糧食損耗的智能評估提供了一種通用的方法。
本文針對糧食產(chǎn)后儲藏環(huán)節(jié)的損耗,進行了問卷調(diào)查,對調(diào)查數(shù)據(jù)應用SVM模型進行智能評估。提出了運用RDPSO算法優(yōu)化SVM模型參數(shù)。RDPSO算法具有良好的全局搜索能力,可以有效地防止模型參數(shù)優(yōu)化過程中陷入局部最優(yōu)解。實驗結(jié)果表明,用本文提出的RDPSO-SVM糧食產(chǎn)后儲藏損失評估模型,與普通的線性回歸模型與基本SVM模型相比,具有更好的擬合精度和預測精度,可以作為糧食產(chǎn)后儲藏環(huán)節(jié)或其他環(huán)節(jié)損耗評估與預測的有效模型。