張宏博 陳偉炯 閆 明
1(上海海事大學(xué)物流科學(xué)與工程研究院 上海 201306)2(北京物資學(xué)院物流學(xué)院 北京 101149)
權(quán)重確定的方法分為主觀權(quán)重和客觀權(quán)重兩個方面。主要的主觀權(quán)重方法有AHP法[1]、BWM[2],G1[3]法等,以上方法在確定權(quán)重值時主要通過專家經(jīng)驗判斷所得,受人為因素影響較大,主要依據(jù)目標(biāo)本身的重要程度來確定量化值。主要的客觀權(quán)重方法有熵權(quán)法[4]、基尼系數(shù)賦權(quán)法[5]等,其權(quán)重值主要依據(jù)確權(quán)目標(biāo)的某一具體表現(xiàn)來進(jìn)行量化計算的,權(quán)重的確定受表現(xiàn)的數(shù)值影響,會隨著評價對象的變化而變化。傳統(tǒng)的權(quán)重確定方法并不能完全滿足實際需要,從近幾年的研究可以看出,主客觀權(quán)重的組合權(quán)重確定方法逐漸增多,比如熵權(quán)法與德爾菲法的結(jié)合[6],熵權(quán)法與AHP發(fā)的結(jié)合[7]等,它們通過兩種方法的結(jié)合對傳統(tǒng)方法進(jìn)行了改進(jìn),但組合權(quán)重的研究仍需要進(jìn)一步加深。
隨著多式聯(lián)運活動的不斷加強,研究也不斷加深。研究早期國外的學(xué)者就已經(jīng)通過構(gòu)建多目標(biāo)模型來進(jìn)行路徑優(yōu)化,如文獻(xiàn)[8]構(gòu)建的人群風(fēng)險等為目標(biāo)的多目標(biāo)模型。提出的以生態(tài)環(huán)境等為目標(biāo)的多目標(biāo)模型[9]等。在這些研究所構(gòu)建的路徑求解模型中權(quán)重的賦值直接影響到優(yōu)化結(jié)果的合理性。
在本文的研究中提出一種主客觀相結(jié)合的權(quán)重確定方法,并且通過自學(xué)習(xí)進(jìn)一步提高其客觀準(zhǔn)確性。首先通過對目標(biāo)進(jìn)行AHP法主觀賦權(quán)并根據(jù)權(quán)重區(qū)間估計模型得到權(quán)重范圍,然后通過構(gòu)建貝葉斯網(wǎng)絡(luò)和極大熵準(zhǔn)則對所得到的主觀權(quán)重進(jìn)行自學(xué)習(xí),以期得到更加準(zhǔn)確的目標(biāo)權(quán)重。而且,采用貝葉斯網(wǎng)絡(luò)進(jìn)行構(gòu)造充分結(jié)合了路徑優(yōu)化模型中子目標(biāo)受多層因素影響的特點,使得到的權(quán)重更加客觀符合實際。
對于多式聯(lián)運路徑優(yōu)化這種需要構(gòu)建多目標(biāo)優(yōu)化模型的問題,由于其總目標(biāo)、子目標(biāo)以及各子目標(biāo)影響因素相互關(guān)聯(lián),可以通過構(gòu)建貝葉斯網(wǎng)絡(luò)來表達(dá)其多層次、多屬性的特點,貝葉斯網(wǎng)絡(luò)能夠反映該目標(biāo)優(yōu)化問題求解過程中的因果關(guān)系[10]。圖1為一個基本的多層次、多屬性、多目標(biāo)決策問題的貝葉斯網(wǎng)絡(luò)圖。
圖1 基本貝葉斯網(wǎng)絡(luò)圖
從圖1中可以看出,貝葉斯網(wǎng)絡(luò)圖中最高層和最底層是單純的目標(biāo)和屬性,其余的中間層包含著屬性和目標(biāo)兩層含義。中間層對于上一層來說是屬性值,對于下一層來說是目標(biāo)值,不同層級之間的直線表示的是其間的因果關(guān)系。
本文中的CPT不是指各屬性的條件概率,而是各屬性相對于目標(biāo)的初始權(quán)重和屬性值,CPT值是貝葉斯網(wǎng)絡(luò)中的二元結(jié)構(gòu)體,它表示屬性相對于其上層評價指標(biāo)的初始權(quán)重和自身的屬性值。
在自學(xué)習(xí)的過程中隨機變量的生成具有隨機性,通過采用區(qū)間估計的方法[11],對隨機變量的生成區(qū)間進(jìn)行修正,增強自學(xué)習(xí)過程中的魯棒性。
(1)
即:
(2)
根據(jù)EM法計算可以得到:
Bn×Wn=βmaxWn
(3)
(4)
通過MATLAB計算權(quán)重估計模型可以得到APH法的各目標(biāo)屬性的主觀權(quán)重范圍,為自學(xué)習(xí)過程中隨機集合確定范圍,進(jìn)一步把其權(quán)重值規(guī)定在指定范圍內(nèi)自學(xué)習(xí)波動。
Shannon最早吧熵的概念運用到信息論當(dāng)中,并進(jìn)一步得到信息熵的理念。信息熵理念是指當(dāng)?shù)玫降男畔⒃龆鄷r,所產(chǎn)生的不確定性則會降低,所以用信息熵來定義系統(tǒng)狀態(tài)的彈性。信息熵基本公式為:
(5)
式中:pi的定義為第i個屬性出現(xiàn)的概率,在本文中可以理解為第i個屬性的權(quán)重值,H(p1,p2,…,pn)為信息熵函數(shù)。根據(jù)變量的不同對于信息熵的公式定義有一定的區(qū)別。
當(dāng)pi是等概率事件時:
H=-k×n(1/n)ln(1/n)=kln(n)
(6)
當(dāng)pi是連續(xù)變量時引入相關(guān)的測度函數(shù)c(x),得到的信息熵的推導(dǎo)公式為:
(7)
最先提出了極大熵準(zhǔn)則并應(yīng)用在信息論中的是E.T.Jaynes,根據(jù)極大熵準(zhǔn)則,應(yīng)該選擇在已知的約束條件下使得熵值(或條件熵)最大的結(jié)果作為最客觀的結(jié)果[12]。熵值最大表示的是客觀數(shù)據(jù)參數(shù)的缺少而產(chǎn)生的主觀假定最少,從極大熵準(zhǔn)則在權(quán)重研究中的應(yīng)用來看,此時的主觀因素影響最小,客觀性更高。
當(dāng)變量為概率密度函數(shù)時,極大熵準(zhǔn)則表達(dá)式為:
(8)
式中:R是變量的集合,f(x)為變量的密度函數(shù),Mi是對應(yīng)第i行的原點矩,b為變量的約束。
在本文中,變量是對應(yīng)的屬性值的權(quán)重,變量的集合是離散的點。所以,根據(jù)極大熵準(zhǔn)則我們可以得出權(quán)重的極大熵計算公式:
(9)
(10)
式中:ω為屬性的權(quán)重值,ωij∈Ni,Ni是貝葉斯網(wǎng)絡(luò)中同一層級同一目標(biāo)下的權(quán)重的集合。本文將得到的權(quán)重值來進(jìn)行信息熵的計算并把極大熵值作為約束條件,在進(jìn)行自學(xué)習(xí)的過程中,將極大熵作為輸出條件,使通過自學(xué)習(xí)得到的權(quán)重值更加客觀。
設(shè)隨機樣本為X1,X2,…,Xm其集合為M,ω是貝葉斯網(wǎng)絡(luò)中某一節(jié)點的CPT屬性的初始權(quán)重值。在路徑優(yōu)化的總目標(biāo)貝葉斯網(wǎng)絡(luò)中,其對應(yīng)的每一個目標(biāo)下的同層屬性值之和為1。如圖1中第二層屬性1下對應(yīng)的三個不同屬性的ω值之間的關(guān)系應(yīng)該滿足ω1+ω2+ω3=1。α定義為在進(jìn)行自學(xué)習(xí)優(yōu)化過程中的一個節(jié)點屬性,其表示的是上文貝葉斯網(wǎng)絡(luò)中的一個節(jié)點。P(α│Xk)代表的是α節(jié)點在隨機樣本Xk下的先驗概率值,相當(dāng)于自學(xué)習(xí)過程中的貝葉斯網(wǎng)絡(luò)的CPT的對應(yīng)的屬性值。
(1) 求梯度。對于貝葉斯網(wǎng)絡(luò)中的每一個節(jié)點上的屬性和權(quán)重指標(biāo)進(jìn)行該節(jié)點權(quán)重的梯度計算,如公式所示:
(11)
(2) 根據(jù)求得的梯度進(jìn)行迭代。其中d表示為多求得的梯度步長的學(xué)習(xí)率,d為一個給定的常數(shù)。如公式所示:
(12)
(3) 對得到的經(jīng)過迭代的權(quán)重從新進(jìn)行歸一化處理,保證某一節(jié)點下的同層的所有屬性的權(quán)重值滿足∑ωi=1。
(4) 設(shè)定自學(xué)習(xí)結(jié)束的目標(biāo)即權(quán)重的信息熵達(dá)到最大值。對迭代后得到的權(quán)重按照式(9)進(jìn)行熵值計算,當(dāng)不是最大值時把求得的權(quán)重值作為初始權(quán)重再次進(jìn)行迭代求解;當(dāng)達(dá)到最大值時則停止計算迭代結(jié)束,輸出的結(jié)果則是基于貝葉斯和極大熵的結(jié)合主客觀方法的自學(xué)習(xí)權(quán)重。
根據(jù)前文的步驟陳述,對基于貝葉斯和極大熵的權(quán)重自學(xué)習(xí)進(jìn)行步驟總結(jié),具體步驟如圖2所示。
圖2 基于貝葉斯和極大熵的權(quán)重自學(xué)習(xí)流程圖
(1) 對路徑優(yōu)化模型的子目標(biāo)進(jìn)行分析,構(gòu)建多層次、多目標(biāo)的貝葉斯網(wǎng)絡(luò)。
(2) 對構(gòu)建的貝葉斯網(wǎng)絡(luò)通過AHP法進(jìn)行分析得到相應(yīng)的主觀權(quán)重值,即自學(xué)習(xí)運算前的各屬性的初始權(quán)重值。
(3) 生成自學(xué)習(xí)的隨機樣本M,其集合為X1,X2,…,Xm。
(4) 輸入極大熵原則方程E作為迭代終止的目標(biāo)。
(5) 根據(jù)本文中提出的基于貝葉斯和極大熵的自學(xué)習(xí)方法進(jìn)行迭代學(xué)習(xí)。
(6) 當(dāng)?shù)玫綕M足極大熵原則的條件時終止迭代。輸出的ωi則是貝葉斯網(wǎng)絡(luò)中的
對應(yīng)的各個節(jié)點的基于貝葉斯和極大熵的權(quán)重自學(xué)習(xí)方法的最終權(quán)重值。
本文在進(jìn)行案例分析時,對危險品的多式聯(lián)運路徑優(yōu)化模型中的各子目標(biāo)進(jìn)行分析并建立貝葉斯網(wǎng)絡(luò)。危險品運輸是眾多運輸種類中比較特殊的一類,因其發(fā)生事故危害較大而備受關(guān)注。根據(jù)數(shù)據(jù)表明,95%的危險貨物其生產(chǎn)和消費地點有著較大的距離。當(dāng)運輸距離較遠(yuǎn)時,采用多式聯(lián)運進(jìn)行運輸更加靈活同時也更加經(jīng)濟。
但是,由于運輸物品的特殊性,在多式聯(lián)運過程中往往需要考慮風(fēng)險所帶來的損失?,F(xiàn)階段國內(nèi)關(guān)于危險品多式聯(lián)運問題進(jìn)行路徑優(yōu)化模型構(gòu)建時也主要考慮成本、時間、風(fēng)險三個子目標(biāo)。在對搭建的多目標(biāo)路徑優(yōu)化求解時,進(jìn)行的權(quán)重確定比較單一,而子目標(biāo)在總目標(biāo)中所占的比例直接影響到最優(yōu)路線的選擇問題。采用本文的基于貝葉斯和極大熵的權(quán)重自學(xué)習(xí)方法則是主客觀相結(jié)合的綜合賦權(quán)方法可以較為準(zhǔn)確地表達(dá)各子目標(biāo)與總目標(biāo)之間的重要程度。現(xiàn)在本文將以時間、成本、風(fēng)險為子目標(biāo)的危險品多式聯(lián)運路徑優(yōu)化問題進(jìn)行分析,構(gòu)建貝葉斯網(wǎng)絡(luò)并通過自學(xué)習(xí)方法進(jìn)行論證。
根據(jù)分析得到的基于成本、時間、風(fēng)險三個子目標(biāo)的危險品多式聯(lián)運問題的貝葉斯網(wǎng)絡(luò)圖如圖3所示。
圖3 優(yōu)化目標(biāo)因素多層次結(jié)構(gòu)圖
(1) 根據(jù)圖3分析的多式聯(lián)運優(yōu)化目標(biāo)因素多層次結(jié)構(gòu)分析,構(gòu)建出相應(yīng)的貝葉斯網(wǎng)絡(luò)如圖4所示。
圖4 優(yōu)化模型貝葉斯網(wǎng)絡(luò)圖
(2) 對貝葉斯網(wǎng)絡(luò)各屬性進(jìn)行層次分析法分析,從而得到相應(yīng)的主觀權(quán)重作為自學(xué)習(xí)方法的初始權(quán)重,通過MATLAB對式(4)的區(qū)間估計模型進(jìn)行求解,得到相關(guān)數(shù)據(jù)??紤]到危險品運輸其自身的特殊性和發(fā)生事故后的影響,對中間層的重要性排序為風(fēng)險、成本、時間。根據(jù)該基礎(chǔ)對圖3得到的貝葉斯網(wǎng)絡(luò)的其他屬性值進(jìn)行主觀賦權(quán),并作為自學(xué)習(xí)的初始權(quán)重值。
(3) 通過在0-1區(qū)間之間生成隨機樣本,并滿足各分支層屬性的權(quán)重值之和為1。
(4) 根據(jù)圖2中總結(jié)的方法步驟進(jìn)行權(quán)重自學(xué)習(xí),設(shè)定d的值為0.2作為自學(xué)習(xí)梯度的學(xué)習(xí)率,當(dāng)?shù)玫綑?quán)重熵值最大的權(quán)重值時學(xué)習(xí)結(jié)束,輸出對應(yīng)貝葉斯網(wǎng)絡(luò)的新權(quán)重值作為結(jié)合主客觀方法的權(quán)重值。
(5) 對通過AHP法分析得到的主觀權(quán)重跟本文方法自學(xué)習(xí)得到的權(quán)重值進(jìn)行分析比較如圖5所示。權(quán)重數(shù)據(jù)如表1所示。
表1 各目標(biāo)AHP法主觀權(quán)重值
續(xù)表1
圖5 AHP法和自學(xué)習(xí)得到權(quán)重對比圖
自學(xué)習(xí)過程中得到的權(quán)重變化如圖6、圖7所示。
圖6 自學(xué)習(xí)過程中風(fēng)險權(quán)重的變化
圖7 自學(xué)習(xí)過程中極大熵的變化
根據(jù)MATLAB得到的圖片可以看出當(dāng)自學(xué)習(xí)經(jīng)過12次的迭代得到符合極大熵準(zhǔn)則的客觀權(quán)重值。根據(jù)圖5中AHP法和自學(xué)習(xí)得到的權(quán)重之間的比較,可以看出通過兩種不同方法得到的權(quán)重值總體趨勢相差不大但是每個權(quán)重值還是進(jìn)行了細(xì)微的改變。通過將主觀權(quán)重方法和客觀權(quán)重方法結(jié)合,建立了基于貝葉斯網(wǎng)絡(luò)和極大熵準(zhǔn)則的權(quán)重自學(xué)習(xí)方法,并通過該算例說明了方法的可行性和有效性。
在本文中,提出一種新的主客觀相結(jié)合的權(quán)重賦值方法。該方法首先通過構(gòu)建貝葉斯網(wǎng)絡(luò)分析優(yōu)化問題各子目標(biāo)的相關(guān)影響因素,再通過AHP法得到貝葉斯網(wǎng)絡(luò)中各因素的主觀權(quán)重值,最后通過基于極大熵準(zhǔn)則的權(quán)重自學(xué)習(xí)根據(jù)貪心爬山算法進(jìn)行學(xué)習(xí),從而得到更加客觀的各目標(biāo)權(quán)重值。
通過該方法得到的權(quán)重來求解多目標(biāo)的多式聯(lián)運路徑優(yōu)化模型,既可以充分考慮多式聯(lián)運問題中時間成本風(fēng)險等子目標(biāo)間的綜合因素,又能通過自學(xué)習(xí)的方法增加主觀權(quán)重的客觀性減少人為因素對權(quán)重值的影響。根據(jù)極大熵準(zhǔn)則,在已知的主觀權(quán)重基礎(chǔ)上,輸出權(quán)重熵值達(dá)到最大并滿足約束條件所得到的權(quán)重值為最優(yōu)的屬性權(quán)重值。從進(jìn)行的危險品多式聯(lián)運的各目標(biāo)構(gòu)建的貝葉斯網(wǎng)絡(luò)進(jìn)行案例分析可以看出,基于貝葉斯和極大熵的權(quán)重自學(xué)習(xí)方法能夠充分契合該問題的多目標(biāo)和多層次的特點,并結(jié)合主客觀方法使得到的權(quán)重值更加準(zhǔn)確可靠,同時吸收了智能算法的求解優(yōu)點。