張夢澤,張一舟,李凱勇
(1.韓國世宗大學(xué),韓國 首爾 05006;2.青海民族大學(xué)物理與電子信息工程學(xué)院,青海 西寧 810007)
冷鏈物流的大數(shù)據(jù)是建立在物流系統(tǒng)的反饋信息技術(shù)上的,這樣能夠更加清楚地看到物流系統(tǒng)所反饋的信息,這樣能很好地監(jiān)控貨物的情況[1]。具體來說,就是在數(shù)據(jù)感知技術(shù)和信息反饋技術(shù)的基礎(chǔ)上來對大量的數(shù)據(jù)進(jìn)行整合、挖掘和處理,過濾掉多余的信息,提取有效的信息,并讓這些有效的信息能夠共享,通過網(wǎng)絡(luò)來傳輸數(shù)據(jù),并把這些數(shù)據(jù)輸送到監(jiān)控端[2]。在這個(gè)過程中產(chǎn)生了重影識別和邊界孤立點(diǎn)等很多沒用的信息,過濾掉這些信息,并對這些信息進(jìn)行識別,從而讓效率得到提高。這樣就能在大數(shù)據(jù)下形成獨(dú)立的領(lǐng)域,來集中數(shù)據(jù),提高挖掘技術(shù),進(jìn)而提高對數(shù)據(jù)的提取和辨別[3]。
賀琳等人[4]提出了一種新的區(qū)域物流系統(tǒng)空間演化特征信息提取法,對粒子群進(jìn)行優(yōu)化、重組、更新,來重新構(gòu)建這些特征,通過對類別進(jìn)行調(diào)整,提取矢量平衡點(diǎn),來計(jì)算物流信息在有限數(shù)據(jù)集方面所形成的擾動(dòng)矢量,從而形成目標(biāo)函數(shù),有利于調(diào)整和重構(gòu)物流信息,并對這些物流信息及時(shí)提取,這樣所采用的方法能大大地縮短物流信息的提取時(shí)間,提高物流的通信效率;王妍等人[5]則提出了基于互信息的實(shí)時(shí)物流特征提取算法,在對移動(dòng)網(wǎng)絡(luò)的電子商務(wù)物流信息進(jìn)行主成分分析的基礎(chǔ)上來確定好物流信息所蘊(yùn)含的強(qiáng)度,從而規(guī)定好原則,挖掘出其中的信息,通過主成分分析法來提取網(wǎng)絡(luò)物流信息,形成協(xié)方差矩陣,產(chǎn)生信息向量投影,采用對商務(wù)物流信息的及時(shí)抓取來降低噪聲,減少提取的時(shí)間,占用較小的空間,提高物流信息的質(zhì)量。
基于以上背景,本文將CART決策樹應(yīng)用到了冷鏈物流大數(shù)據(jù)有效信息提取中,從而提高冷鏈物流大數(shù)據(jù)有效信息提取性能。
在冷鏈物流大數(shù)據(jù)上建立了有效信息是采用的非結(jié)構(gòu)化的冷鏈物流數(shù)據(jù)源,這些數(shù)據(jù)也許不完整或有誤,但是對這些數(shù)據(jù)的處理能夠很好地提高數(shù)據(jù)的質(zhì)量[6]。并且因?yàn)槔滏溛锪鞔髷?shù)據(jù)是離散的空間信息,而且這些信息是孤立的或是噪聲,所以要進(jìn)行特征降維的方法來設(shè)計(jì)這些離散點(diǎn),而對于孤立點(diǎn)的敏感問題,則要用單邊加權(quán)模糊支持向量機(jī)的方法,而對數(shù)據(jù)的預(yù)處理則是由數(shù)據(jù)的清洗、規(guī)范、集成和變化等過程組成的[7]。假設(shè)t0表示冷鏈物流大數(shù)據(jù)的有效信息變量分區(qū)起點(diǎn),將冷鏈物流大數(shù)據(jù)有效信息通暢分布在第i層中,那么有效信息的返回狀態(tài)表示為
Y=AY+B[f(Y)+u]
(1)
式(1)中,A表示有效信息變量集,B表示無效信息變量,u表示物流需求系數(shù),f(Y)表示物流信息修正函數(shù)。利用CART決策樹對冷鏈物流大數(shù)據(jù)有效信息進(jìn)行分布式計(jì)算,由于CART決策樹具有容錯(cuò)性,計(jì)算過程中經(jīng)常出錯(cuò)[8],因此,根據(jù)偏度概念對冷鏈物流大數(shù)據(jù)的有效信息進(jìn)行修正,表示為
(2)
(3)
為了實(shí)現(xiàn)冷鏈物流大數(shù)據(jù)有效信息的實(shí)時(shí)提取,現(xiàn)在冷鏈物流大數(shù)據(jù)庫中挖掘出有效信息,利用冷鏈物流大數(shù)據(jù)有效信息中蘊(yùn)含的關(guān)聯(lián)規(guī)則,挖掘出冷鏈物流大數(shù)據(jù)庫中的有效信息[10]。具體過程如下:
引入蘊(yùn)含強(qiáng)度挖掘冷鏈物流大數(shù)據(jù)有效信息之間的關(guān)聯(lián)度,蘊(yùn)含強(qiáng)度的表達(dá)式為
(4)
其中,η(t,s)表示有效信息在冷鏈物流大數(shù)據(jù)中產(chǎn)生的幾率。當(dāng)采用蘊(yùn)含強(qiáng)度度量冷鏈物流大數(shù)據(jù)有效信息的關(guān)聯(lián)規(guī)則時(shí),關(guān)聯(lián)規(guī)則的度量方式如下
t?s(sup,conf,cov)
(5)
其中,sup表示支持度,conf表示置信度,cov表示覆蓋率。
在關(guān)聯(lián)規(guī)則的指引下,蘊(yùn)含關(guān)聯(lián)規(guī)則可以表示為
t?s(η,α)
(6)
其中,η表示蘊(yùn)含關(guān)聯(lián)規(guī)則的蘊(yùn)含強(qiáng)度,取值范圍在-1到1之間,α表示蘊(yùn)含強(qiáng)度的閾值。
基于冷鏈物流大數(shù)據(jù)中有效信息節(jié)點(diǎn)的數(shù)目計(jì)算,遍歷每一個(gè)有效信息,通過挖掘的冷鏈物流大數(shù)據(jù)有效信息,分析了冷鏈物流大數(shù)據(jù)有效信息。
冷鏈物流大數(shù)據(jù)有效信息的提取重點(diǎn)是檢驗(yàn)有效信息在冷鏈物流大數(shù)據(jù)中出現(xiàn)的概率[11],冷鏈物流大數(shù)據(jù)庫中包含n個(gè)有效信息數(shù)據(jù)樣本,X表示有效信息集合,那么冷鏈物流大數(shù)據(jù)有效信息的時(shí)間序列為
X={x1,x2,…,xn}?Rs
(7)
其中,xi(i=1,2,…,n)表示冷鏈物流大數(shù)據(jù)有效信息的向量,計(jì)算公式為
xi=(xi1,xi2,…,xis)T
(8)
其中,T表示轉(zhuǎn)置向量。令c表示冷鏈物流大數(shù)據(jù)有效信息的時(shí)間序列中的分類系數(shù),vij表示冷鏈物流大數(shù)據(jù)i中第j個(gè)有效信息矢量,那么冷鏈物流大數(shù)據(jù)有效信息的更新公式為
V={vij∣i=1,2,…,c,j=1,2,…,s}
(9)
采用CART決策樹對冷鏈物流大數(shù)據(jù)有效信息的更新結(jié)果進(jìn)行調(diào)整[12],實(shí)現(xiàn)冷鏈物流大數(shù)據(jù)的有效信息特征矢量重構(gòu),表示為
(10)
利用冷鏈物流大數(shù)據(jù)有效信息的時(shí)間序列,計(jì)算了冷鏈物流大數(shù)據(jù)有效信息的向量,通過更新和調(diào)整冷鏈物流大數(shù)據(jù)有效信息,重構(gòu)了冷鏈物流大數(shù)據(jù)有效信息的特征矢量。
在重構(gòu)冷鏈物流大數(shù)據(jù)有效信息特征矢量的基礎(chǔ)上,利用CART決策樹計(jì)算有效信息的權(quán)值,將有效信息決策樹矢量與均值聚類算法結(jié)合,計(jì)算冷鏈物流大數(shù)據(jù)有效信息的擾動(dòng)矢量,通過構(gòu)建有效信息適應(yīng)度目標(biāo)函數(shù),調(diào)整并重構(gòu)有效信息的類別,實(shí)現(xiàn)冷鏈物流大數(shù)據(jù)有效信息的提取。
假設(shè)X′表示具有均勻便利性的冷鏈物流大數(shù)據(jù)有效信息的特征矢量數(shù)據(jù)集,一個(gè)冷鏈物流大數(shù)據(jù)有效信息決策樹由M各單獨(dú)的有效信息枝葉組成,那么在最優(yōu)目標(biāo)策略下,滿足冷鏈物流大數(shù)據(jù)有效信息搜索的有限數(shù)據(jù)集為
(11)
(12)
(13)
根據(jù)上述公式,可以計(jì)算冷鏈物流大數(shù)據(jù)有效信息的最優(yōu)解,以及CART決策樹的聚類中心擾動(dòng)矢量,從而得到冷鏈物流大數(shù)據(jù)有效信息的聚類矩陣,將其表示為
(14)
其中,c表示冷鏈物流大數(shù)據(jù)有效信息的差分步數(shù),uik表示冷鏈物流大數(shù)據(jù)有效信息決策矩陣,為了反映出冷鏈物流大數(shù)據(jù)有效信息在決策分類過程中的變化特性,計(jì)算了CART決策樹差分?jǐn)_動(dòng)下,冷鏈物流大數(shù)據(jù)有效信息的適應(yīng)度目標(biāo)函數(shù),表示為
(15)
其中,m表示冷鏈物流大數(shù)據(jù)有效信息向量的最大值,(dik)2表示冷鏈物流大數(shù)據(jù)有效信息樣本xk與vi之間的歐式距離,計(jì)算公式為
(16)
根據(jù)以上過程,可以通過下式計(jì)算冷鏈物流大數(shù)據(jù)有效信息在決策過程中的數(shù)據(jù)值大小,計(jì)算公式為
(17)
運(yùn)用CART決策樹的差分?jǐn)_動(dòng),產(chǎn)生一個(gè)冷鏈物流大數(shù)據(jù)有效信息的初始隸屬度矩陣,并置于決策樹中,得到冷鏈物流大數(shù)據(jù)有效信息的擾動(dòng)變量,即
xn,G=xn,G+Δxi
(18)
其中,Δxi表示冷鏈物流大數(shù)據(jù)有效信息的數(shù)量增長,但是冷鏈物流大數(shù)據(jù)有效信息范圍的信息序列會受到有效信息梯度的影響,表示為
xn+1=4xn(1-xn),n=1,2,…,NP
(19)
根據(jù)以上公式的計(jì)算過程,可以得出冷鏈物流大數(shù)據(jù)有效信息的決策處于穩(wěn)定狀態(tài),在CART決策樹中加入冷鏈物流大數(shù)據(jù)有效信息的NP各擾動(dòng)變量的混沌分量,表示為
Δxi=a+(b-a)xn,n=1,2,…,NP
(20)
為了避免冷鏈物流大數(shù)據(jù)有效信息在提取過程中陷入局部最優(yōu)的狀態(tài),Nth表示門限值,計(jì)算出冷鏈物流大數(shù)據(jù)有效信息在決策中的多樣性因子,即
(21)
采用CART決策樹采集與處理冷鏈物流大數(shù)據(jù)有效信息,提取出冷鏈物流大數(shù)據(jù)有效信息的第j個(gè)樣本值,調(diào)整冷鏈物流大數(shù)據(jù)有效信息的類別
(22)
其中,N表示冷鏈物流大數(shù)據(jù)有效信息數(shù)量,根據(jù)CART決策樹對冷鏈物流大數(shù)據(jù)有效信息進(jìn)行擾動(dòng)分解,計(jì)算出決策樹中第i′個(gè)有效信息的決策中心概率值
(23)
其中,xk表示第k個(gè)冷鏈物流大數(shù)據(jù)有效信息的動(dòng)態(tài)慣性權(quán)重,a表示冷鏈物流大數(shù)據(jù)有效信息決策中心的調(diào)節(jié)參數(shù)。將冷鏈物流大數(shù)據(jù)有效信息的擾動(dòng)序列添加到CART決策樹中,對冷鏈物流大數(shù)據(jù)有效信息進(jìn)行第二次重構(gòu),提取出重構(gòu)處理后的冷鏈物流大數(shù)據(jù)有效信息
(24)
綜上所述,采用混沌算法計(jì)算了冷鏈物流大數(shù)據(jù)有效信息的決策權(quán)值,引入CART決策樹對冷鏈物流大數(shù)據(jù)有效信息進(jìn)行調(diào)整和重構(gòu),實(shí)現(xiàn)冷鏈物流大數(shù)據(jù)有效信息的提取。
為了驗(yàn)證基于CART決策樹的冷鏈物流大數(shù)據(jù)有效信息提取方法的性能,采用仿真軟件進(jìn)行實(shí)驗(yàn)分析,引入文獻(xiàn)[4]的冷鏈物流大數(shù)據(jù)有效信息提取方法和文獻(xiàn)[5]的冷鏈物流大數(shù)據(jù)有效信息提取方法作為對比對象,測試了冷鏈物流大數(shù)據(jù)有效信息的噪聲含量,結(jié)果如圖1所示。
圖1 冷鏈物流大數(shù)據(jù)有效信息的噪聲含量
從圖1的結(jié)果可以看出,采用基于CART決策樹的冷鏈物流大數(shù)據(jù)有效信息提取方法,提取到的冷鏈物流大數(shù)據(jù)有效信息是噪聲含量最少的,說明該方法可以有效保證冷鏈物流大數(shù)據(jù)有效信息的質(zhì)量,避免信息出現(xiàn)亂碼和失真的問題,提高了冷鏈物流大數(shù)據(jù)有效信息的提取性能。
為了實(shí)現(xiàn)冷鏈物流大數(shù)據(jù)有效信息提取的實(shí)時(shí)性,實(shí)驗(yàn)測試了冷鏈物流大數(shù)據(jù)有效信息的提取時(shí)間,三種方法的冷鏈物流大數(shù)據(jù)有效信息提取時(shí)間對比結(jié)果如圖2所示。
圖2 冷鏈物流大數(shù)據(jù)有效信息提取時(shí)間對比結(jié)果
從圖2的結(jié)果可以看出,隨著冷鏈物流大數(shù)據(jù)有效信息越來越大,有效信息的提取時(shí)間越來越長?;贑ART決策樹的冷鏈物流大數(shù)據(jù)有效信息提取方法所用的時(shí)間是最短的,原因是該方法通過引入CART決策樹,降低了冷鏈物流大數(shù)據(jù)有效信息的復(fù)雜度;文獻(xiàn)[4]冷鏈物流大數(shù)據(jù)有效信息提取方法的提取時(shí)間是最長的,說明基于CART決策樹的冷鏈物流大數(shù)據(jù)有效信息提取方法可以加快冷鏈物流大數(shù)據(jù)有效信息提取速度,保證了冷鏈物流大數(shù)據(jù)有效信息提取的實(shí)時(shí)性。
本文提出了基于CART決策樹的冷鏈物流大數(shù)據(jù)有效信息提取,針對傳統(tǒng)信息提取方法存在的不足,對冷鏈物流大數(shù)據(jù)有效信息進(jìn)行了預(yù)處理、分析以及重構(gòu)實(shí)現(xiàn)了冷鏈物流大數(shù)據(jù)有效信息的提取,結(jié)果顯示,該提取方法可以保證冷鏈物流大數(shù)據(jù)有效信息提取的實(shí)時(shí)性,并提高信息質(zhì)量。