□羅琴鳳 賈坤澤 殷允強(qiáng)
[電子科技大學(xué) 成都 611731]
21世紀(jì)以來(lái),世界各地頻繁突發(fā)公共事件(包括自然災(zāi)害、事故災(zāi)難、公共衛(wèi)生事件和社會(huì)安全事件),給人類生命財(cái)產(chǎn)安全和社會(huì)穩(wěn)定發(fā)展帶來(lái)了巨大的威脅。例如,自2019年底持續(xù)爆發(fā)的COVID-19公共衛(wèi)生事件,導(dǎo)致嚴(yán)重的全球性人員傷亡和經(jīng)濟(jì)財(cái)產(chǎn)損失。我國(guó)是世界上遭受自然災(zāi)害最嚴(yán)重的國(guó)家之一,1990~2019年的近30年,自然災(zāi)害平均每年造成我國(guó)經(jīng)濟(jì)損失2 928.5億元,死亡人數(shù)6 310.5人,受災(zāi)人口數(shù)為348 441.6萬(wàn)人[1]。
黨和國(guó)家對(duì)于災(zāi)后的救援工作給予高度的重視。中共中央總書記習(xí)近平在中央政治局第十九次集體學(xué)習(xí)時(shí)強(qiáng)調(diào):應(yīng)急管理是國(guó)家治理體系和治理能力的重要組成部分,擔(dān)負(fù)保護(hù)人民群眾生命財(cái)產(chǎn)安全和維護(hù)社會(huì)穩(wěn)定的重要使命。黨的十九屆四中全會(huì)提出“優(yōu)化國(guó)家應(yīng)急管理能力體系建設(shè),提高防災(zāi)減災(zāi)救災(zāi)能力”的努力方向[2],應(yīng)急物流是應(yīng)急管理的重要組成部分,對(duì)救援行動(dòng)的執(zhí)行至關(guān)重要。學(xué)者Trunick[3]指出物流工作占救援行動(dòng)80%,“人道主義物流領(lǐng)域先驅(qū)”Van Wassenhove[4]也認(rèn)為物流工作是決定救援行動(dòng)成功與否的關(guān)鍵。與一般商業(yè)物流不同,災(zāi)后應(yīng)急物流的首要任務(wù)是減輕災(zāi)民痛苦,故應(yīng)在保障災(zāi)民存活率、救援時(shí)效性和公平性等社會(huì)效益的前提下考慮經(jīng)濟(jì)成本,在救援中體現(xiàn)博愛(ài)(Humanity)、中立(Neutrality)和公正(Impartiality)的人道行動(dòng)三原則[5]。因此,“應(yīng)急物流”正逐漸向更重視救援本質(zhì)和人道精神的“人道主義物流”轉(zhuǎn)變。
人道主義物流是一項(xiàng)科學(xué)性、專業(yè)性、綜合性非常強(qiáng)的工作,需要來(lái)自政府部門、非政府組織、私人企業(yè)、捐贈(zèng)者和受災(zāi)群眾等眾多不同類型參與方的協(xié)調(diào)合作。加之災(zāi)害的難預(yù)測(cè)性、響應(yīng)時(shí)間的緊迫性、需求的突發(fā)性、物資的匱乏性等,人道主義物流的運(yùn)作環(huán)境極其復(fù)雜,而管理科學(xué)是有效解決此類復(fù)雜決策/優(yōu)化問(wèn)題的一門學(xué)科。
本文從運(yùn)營(yíng)管理視角梳理現(xiàn)有的災(zāi)后人道主義物流研究,首先按照資源調(diào)配、現(xiàn)場(chǎng)分診救治、醫(yī)院綜合治療等運(yùn)營(yíng)管理任務(wù)對(duì)相關(guān)文獻(xiàn)進(jìn)行梳理,然后將問(wèn)題的求解方法總結(jié)為精確方法、啟發(fā)式方法、強(qiáng)化學(xué)習(xí)方法以及混合方法并分別展開綜述,最后分別從問(wèn)題和求解方法角度對(duì)未來(lái)研究進(jìn)行展望,以期促進(jìn)災(zāi)后人道主義物流的發(fā)展。本文關(guān)于災(zāi)后人道主義物流運(yùn)營(yíng)管理研究的綜述框架見圖1。
圖 1 關(guān)于災(zāi)后人道主義物流運(yùn)營(yíng)管理研究的綜述框架
人道主義物流(Humanitarian Logistics,HL)的概念由美國(guó)弗里茨研究所的執(zhí)行董事Thomas于2005年首次提出,即為滿足災(zāi)民需要、減輕災(zāi)民痛苦,對(duì)物資、材料和相關(guān)信息進(jìn)行規(guī)劃、實(shí)施、控制,以實(shí)現(xiàn)從產(chǎn)出地到消費(fèi)地的高效率、高效益流動(dòng)和存儲(chǔ)的過(guò)程[6]。Thomas[6]還指出人道主義物流主要包括計(jì)劃、準(zhǔn)備、采購(gòu)、運(yùn)輸、倉(cāng)儲(chǔ)、配送、追蹤回溯以及報(bào)關(guān)清關(guān)等活動(dòng)。Van Wassenhove[4]將人道物流描述為:動(dòng)員人力、資源、技能和知識(shí)以幫助受災(zāi)弱勢(shì)群體的過(guò)程和系統(tǒng)。通過(guò)上述定義可以看出,人道主義物流的根本任務(wù)在于減輕災(zāi)民所遭受的痛苦,這也是災(zāi)后救援行動(dòng)的本質(zhì)所在。
下面通過(guò)將人道主義物流與應(yīng)急物流、商業(yè)物流進(jìn)行比較,進(jìn)一步說(shuō)明人道主義物流的特征。人道主義物流和應(yīng)急物流在行動(dòng)層面有重疊,但側(cè)重點(diǎn)不同。人道主義物流側(cè)重救援的本質(zhì),在救援行動(dòng)中推崇博愛(ài)、中立和公正的人道主義原則。而應(yīng)急物流更重視救援的挑戰(zhàn),在救援行動(dòng)中強(qiáng)調(diào)對(duì)“突發(fā)性、非常規(guī)性和不確定性”環(huán)境的應(yīng)對(duì)[6]。人道主義物流和商業(yè)物流在行動(dòng)目標(biāo)、物資來(lái)源、需求特征、決策結(jié)構(gòu)、物流活動(dòng)的周期性、社會(huì)網(wǎng)絡(luò)和支持系統(tǒng)等方面差異明顯[7]。商業(yè)物流是需求驅(qū)動(dòng)的(拉動(dòng)式系統(tǒng)),圍繞企業(yè)利益并根據(jù)業(yè)務(wù)需要制定物流規(guī)劃,目標(biāo)通常是最小化成本或最大化利潤(rùn)/質(zhì)量等。而人道主義物流是供應(yīng)驅(qū)動(dòng)的(推動(dòng)式系統(tǒng)),圍繞社會(huì)效益并根據(jù)可調(diào)配庫(kù)存制定物流規(guī)劃,目標(biāo)主要為最大化存活率/公平性或最小化救援響應(yīng)時(shí)間等。
根據(jù)應(yīng)急管理的階段劃分,人道主義物流活動(dòng)可分為減災(zāi)(Reduction)、備災(zāi)(Readiness)、響應(yīng)(Response)和恢復(fù)(Recovery)四個(gè)階段,覆蓋從確認(rèn)危機(jī)、評(píng)估風(fēng)險(xiǎn)、建立預(yù)警系統(tǒng)、整合技能與資源直至恢復(fù)正常狀態(tài)等任務(wù),呈現(xiàn)出流程循環(huán)性及空間交叉性[8]。減災(zāi)一般指減輕災(zāi)害影響、預(yù)防災(zāi)害發(fā)生的長(zhǎng)期行動(dòng),例如評(píng)估災(zāi)害風(fēng)險(xiǎn)、加強(qiáng)基礎(chǔ)建設(shè)、執(zhí)行建筑標(biāo)準(zhǔn)等;備災(zāi)主要指為提高災(zāi)害應(yīng)對(duì)能力而在災(zāi)前準(zhǔn)備的一系列行動(dòng),例如預(yù)警系統(tǒng)選址、救災(zāi)配送中心選址、救援物資預(yù)置、疏散策略規(guī)劃、供應(yīng)合同設(shè)計(jì)等;響應(yīng)一般指災(zāi)難發(fā)生后所采取的搶救生命、確保公共安全、避免財(cái)產(chǎn)損失,并滿足災(zāi)民基本生活需求的一系列措施,例如應(yīng)急物資調(diào)度運(yùn)輸與分配交付、臨時(shí)設(shè)施選址與任務(wù)指派、災(zāi)民疏散撤離與分診救治等;恢復(fù)主要指使災(zāi)民生命健康、生活環(huán)境,以及政治、經(jīng)濟(jì)、文化等復(fù)原或改善的長(zhǎng)期行動(dòng),例如廢墟和垃圾清除、網(wǎng)絡(luò)(道路、橋梁、信息系統(tǒng)和能源等)恢復(fù)、家庭住宅和公共基礎(chǔ)設(shè)施重建等。
此外,Holguín-Veras等[7]根據(jù)人道主義物流的運(yùn)作階段和環(huán)境將其劃分為“常規(guī)人道主義物流”(Regular humanitarian logistics,R-HL)和“災(zāi)后人道主義物流”(Post-disaster humanitarian logistics,PD-HL)。R-HL指長(zhǎng)期持續(xù)性的人道主義援助,優(yōu)先考慮物流效率,類似于商業(yè)物流。例如,對(duì)于發(fā)達(dá)國(guó)家提供預(yù)防性的醫(yī)療保健,對(duì)于第三世界國(guó)家消除饑荒、援建難民營(yíng)等。PD-HL側(cè)重于短期救援階段的災(zāi)害初步反應(yīng),重點(diǎn)是減輕人類痛苦和改善社會(huì)成效,行動(dòng)層面和人道主義物流的響應(yīng)階段類似。現(xiàn)有人道主義物流研究主要聚焦RHL相關(guān)問(wèn)題,而關(guān)于PD-HL問(wèn)題的研究相對(duì)較少[9],因此,本文重點(diǎn)針對(duì)災(zāi)后救援中的運(yùn)營(yíng)管理問(wèn)題,梳理現(xiàn)有的災(zāi)后人道主義物流研究。
災(zāi)后人道主義物流中的運(yùn)營(yíng)管理任務(wù),主要可分為資源調(diào)配、現(xiàn)場(chǎng)分診救治、醫(yī)院綜合治療等,本文將按照上述任務(wù)分類,從分配、選址、路徑、調(diào)度、排序等方面,對(duì)相關(guān)文獻(xiàn)進(jìn)行梳理。
資源調(diào)配主要是指從配送中心向?yàn)?zāi)區(qū)調(diào)配救援物資、救援人員的過(guò)程,主要涉及人道主義物流中的資源分配與調(diào)度、設(shè)施選址、路徑規(guī)劃等問(wèn)題。Rodríguez-Espíndola等[10]整合了來(lái)自多個(gè)組織的物資和人力資源,構(gòu)建了多模式、多商品動(dòng)態(tài)分配模型,研究結(jié)果顯示了救援組織之間協(xié)調(diào)的重要性。不同于商業(yè)物流,災(zāi)后人道主義物流中的人力資源分配需考慮人員匹配問(wèn)題。例如,Li等[11]針對(duì)不同救援人員的專業(yè)技能和主觀偏好,將相關(guān)的任務(wù)適應(yīng)度和時(shí)間適應(yīng)度進(jìn)行聚合,得到救援人員與災(zāi)害現(xiàn)場(chǎng)救援任務(wù)的匹配度,構(gòu)建了基于匹配概念的救援人員分配優(yōu)化模型。另外,當(dāng)突發(fā)重大公共事件時(shí),應(yīng)急物資調(diào)配一般會(huì)涉及多級(jí)配送網(wǎng)絡(luò),王妍妍和孫佰清[12]以最小化物資短缺的延遲損失、物資分配的總成本為目標(biāo),研究了基于多集散點(diǎn)、多配送中心和多受災(zāi)點(diǎn)三級(jí)配送網(wǎng)絡(luò)的應(yīng)急物資動(dòng)態(tài)多階段分配問(wèn)題。資源調(diào)配中的選址決策一般包括配送中心、避難所等設(shè)施的選址。例如,劉亞杰等[13]綜合災(zāi)區(qū)地質(zhì)特點(diǎn)、災(zāi)區(qū)需求以及受災(zāi)程度等信息,建立了基于隨機(jī)規(guī)劃的配送中心選址模型。Mollah等[14]建立了洪災(zāi)情景下成本優(yōu)化的避難所分配模型。張玲和曾倩[15]考慮受災(zāi)點(diǎn)和避難所兩類物資需求點(diǎn),研究了需求不確定情況下的配送中心選址及儲(chǔ)備問(wèn)題,并建立了基于臺(tái)風(fēng)情景下的兩階段隨機(jī)規(guī)劃模型。此外,資源調(diào)配大多會(huì)涉及路徑規(guī)劃問(wèn)題,王旭坪等[16]以最小化災(zāi)民損失和車輛調(diào)度成本為目標(biāo),研究了運(yùn)力受限情況下的應(yīng)急物資分配及救援車輛路徑規(guī)劃問(wèn)題,并基于2008年汶川地震,設(shè)計(jì)了不同運(yùn)力下的物資動(dòng)態(tài)調(diào)度方案和最優(yōu)運(yùn)力配置量。由于自然災(zāi)害后災(zāi)區(qū)的地理限制,有時(shí)將直升機(jī)用于最后一英里的應(yīng)急物資分配,Alinaghian等[17]構(gòu)建了臨時(shí)救援中心選址模型和分配基本物資的直升機(jī)動(dòng)態(tài)路徑模型,與傳統(tǒng)的靜態(tài)路徑相比,動(dòng)態(tài)路徑的總分配時(shí)間更少。
現(xiàn)場(chǎng)分診救治是指在災(zāi)害現(xiàn)場(chǎng)根據(jù)傷亡程度和傷情特點(diǎn),對(duì)災(zāi)民進(jìn)行分類以確定救治優(yōu)先順序,從而將有限醫(yī)療資源按照優(yōu)先級(jí)分配給災(zāi)民,最大限度地提高生存率。目前使用最廣泛的分診方法是Super等[18]的START(Simple Triage and Rapid Treatment)方法,此外還有Triage Sieve方法[19],SALT(Sort, Assess, Life-saving interventions, Treatment and/or Transport)方法[20]等。現(xiàn)場(chǎng)分診的救治順序通常以紅、黃、綠、黑為標(biāo)簽[21],且因?yàn)?zāi)民健康狀況會(huì)隨著時(shí)間推移而惡化,因此分診是一個(gè)動(dòng)態(tài)重復(fù)的過(guò)程。例如,Mills[22]研究了生存概率隨時(shí)間惡化的災(zāi)民救治排序問(wèn)題,利用簡(jiǎn)單有效的生存預(yù)測(cè)方法生成災(zāi)民救治優(yōu)先級(jí)。Kilic等[23]研究了在Poisson到達(dá)和健康狀況惡化的情況下,紅色和黃色等級(jí)的災(zāi)民服務(wù)率。類似地,Xiang和Zhuang[24]也設(shè)計(jì)了一個(gè)醫(yī)療服務(wù)排隊(duì)系統(tǒng),對(duì)兩類災(zāi)民的救治順序和健康狀況惡化進(jìn)行建模,分別建立了以最小化總預(yù)期死亡率、總等待時(shí)間為目標(biāo)的資源分配模型。此外,傷亡者在被送到醫(yī)院之前,一般會(huì)根據(jù)分診結(jié)果在附近的臨時(shí)醫(yī)療中心接受救護(hù),這主要涉及醫(yī)療資源的分配、臨時(shí)醫(yī)療中心的選址等決策。Rezapour等[25]研究了向各災(zāi)區(qū)以及其紅色和黃色等級(jí)的災(zāi)民,分配城市搜救人員和醫(yī)療隊(duì)等醫(yī)療資源的最佳策略。Lodree等[26]研究了一個(gè)離散時(shí)間有限水平隨機(jī)動(dòng)態(tài)規(guī)劃問(wèn)題,用于災(zāi)后分配異構(gòu)醫(yī)療團(tuán)隊(duì)以服務(wù)三種不同優(yōu)先級(jí)別的災(zāi)民。當(dāng)現(xiàn)有醫(yī)院的床位等醫(yī)療資源不足時(shí),需考慮新設(shè)臨時(shí)醫(yī)療中心。李金澤和唐芃[27]基于城市設(shè)施、人口以及路網(wǎng)等基礎(chǔ)數(shù)據(jù),構(gòu)建了多目標(biāo)應(yīng)急設(shè)施選址模型,運(yùn)用優(yōu)化算法生成了武漢方艙醫(yī)院選址方案。而Liu等[28]考慮了兩類醫(yī)療服務(wù)設(shè)施(救治高優(yōu)先級(jí)傷員的現(xiàn)有醫(yī)院以及服務(wù)輕傷者的臨時(shí)醫(yī)療中心),并將傷員分為即時(shí)和延遲兩類以表示災(zāi)后不同時(shí)期的生存概率,構(gòu)建了最佳臨時(shí)醫(yī)療中心選址和醫(yī)療服務(wù)分配模型。
現(xiàn)場(chǎng)分診救治完成后,重傷災(zāi)民必須送往醫(yī)院進(jìn)行綜合治療,其中涉及醫(yī)院、醫(yī)生、手術(shù)室、救護(hù)車的調(diào)度分配,以及救護(hù)車運(yùn)輸路徑規(guī)劃等關(guān)鍵決策。Gong和Batta[29]提出了基于離散時(shí)間策略的救護(hù)車再分配問(wèn)題,構(gòu)建了災(zāi)群確定型救護(hù)車分配模型。為有效降低救治等待期間的災(zāi)民死亡率,Cohen等[30]研究了災(zāi)后在醫(yī)院急診科的兩個(gè)治療站之間分配外科醫(yī)生的問(wèn)題。將傷員運(yùn)送到醫(yī)院也會(huì)考慮分診,Dean和Nair[31]提出了Severity-Adjusted Victim Evacuation(SAVE)構(gòu)建了資源受限情況下的SAVE模型,以便有效地將傷員按照優(yōu)先級(jí)轉(zhuǎn)移到不同地區(qū)的醫(yī)院。張晨曉等[32]綜合考慮了三類傷員的傷亡情況、心理狀況以及醫(yī)療機(jī)構(gòu)的醫(yī)療能力等,提出了以最小化傷員心理成本和最大化生存概率為目標(biāo)的醫(yī)療資源分配模型,并采用模糊規(guī)劃法求解傷員與醫(yī)療機(jī)構(gòu)的分配關(guān)系及傷員的運(yùn)送順序。救護(hù)車的調(diào)度與路徑規(guī)劃是一個(gè)重要且復(fù)雜的研究問(wèn)題,其路徑必須根據(jù)災(zāi)后道路網(wǎng)絡(luò)、現(xiàn)有道路損壞及擁堵等實(shí)際情況來(lái)制定,而救護(hù)車在災(zāi)區(qū)和醫(yī)院間的調(diào)度又受到醫(yī)院急診室等待時(shí)間、醫(yī)院容量和距離等因素的影響。Jotshi等[33]在收集了大量傷亡信息、道路交通狀況的基礎(chǔ)上,構(gòu)建了基于數(shù)據(jù)融合的應(yīng)急車輛調(diào)度和路徑仿真模型。Sung和Lee[34]將救護(hù)車路徑問(wèn)題抽象為集合劃分模型,將傷員分為即時(shí)和延遲兩類等級(jí),并在三種生存概率情景下確定傷員疏散的順序和目的地醫(yī)院。當(dāng)重傷災(zāi)民抵達(dá)醫(yī)院后,應(yīng)當(dāng)立即進(jìn)行醫(yī)療資源分配決策,涉及重新分診、手術(shù)室排程等問(wèn)題。Chan等[35]研究了已知生存概率的兩類傷亡人員的治療優(yōu)先級(jí)排序和床位分配。Cotta[36]提出了在同一手術(shù)室治療的多層傷員優(yōu)先級(jí)排序問(wèn)題。童海星等[37]考慮了突發(fā)事件下手術(shù)室排程的緊急性、醫(yī)療資源的傾斜性等因素,構(gòu)建了手術(shù)室優(yōu)化調(diào)度模型,并采用蟻群算法進(jìn)行求解,為突發(fā)情況下醫(yī)院的手術(shù)室排程提供了參考。
災(zāi)后應(yīng)急物資和傷員的運(yùn)輸是人道主義物流領(lǐng)域?qū)W者關(guān)注的重點(diǎn),目前已從基本的運(yùn)輸路徑規(guī)劃開拓出了一些新的研究視角。例如,不少學(xué)者在災(zāi)后響應(yīng)階段考慮道路修復(fù)問(wèn)題。不同于恢復(fù)階段的設(shè)施維修重建,在緊急響應(yīng)的情況下,只對(duì)部分受損路段進(jìn)行初步修復(fù)以保證路網(wǎng)連通性(災(zāi)后恢復(fù)階段則需要對(duì)整個(gè)災(zāi)區(qū)路網(wǎng)進(jìn)一步全面恢復(fù)),此時(shí)涉及維修人員調(diào)度和路徑規(guī)劃問(wèn)題(Crew Scheduling and Routing Problem, CSRP),即決策維修人員修復(fù)受損路段的順序和路徑。一些學(xué)者將Duque等[38]的混合整數(shù)規(guī)劃和動(dòng)態(tài)規(guī)劃模型作為CSRP的基礎(chǔ)研究。Shin等[39]對(duì)Duque等人提出的模型進(jìn)行拓展,增加了應(yīng)急物資車輛的調(diào)度和路徑規(guī)劃。Moreno等[40~41]將Duque等人提出的模型線性化,并進(jìn)行算法設(shè)計(jì)和改進(jìn)。在最近的研究中,Moreno等[42]又進(jìn)行了問(wèn)題上的創(chuàng)新,探究了道路修復(fù)中的異構(gòu)多人員調(diào)度與路徑問(wèn)題。另外,Li等[43]認(rèn)為,災(zāi)后道路修復(fù)依賴于一個(gè)兼具效益和效率的物流保障調(diào)度(Logistics Support Scheduling, LSS),因此將CSRP和LSS結(jié)合,案例實(shí)驗(yàn)表明,修復(fù)延遲降低45.71%,黃金72小時(shí)內(nèi)的平均修復(fù)率高達(dá)99.40%。在應(yīng)急物資和傷員運(yùn)輸模式方面,考慮到災(zāi)區(qū)需求量、需求優(yōu)先級(jí)以及交通網(wǎng)絡(luò)狀況等因素,多式聯(lián)運(yùn)比單一的運(yùn)輸模式更加適合現(xiàn)實(shí)救援情況。例如,李孟良等[44]構(gòu)建了結(jié)合公路、鐵路和航空多種運(yùn)輸方式的救援物資多式聯(lián)運(yùn)魯棒優(yōu)化模型。Liu等[28]基于救護(hù)車和直升機(jī)結(jié)合的傷員運(yùn)輸模式,設(shè)計(jì)了臨時(shí)醫(yī)療設(shè)施的最佳選址分配方案,實(shí)現(xiàn)了期望存活人數(shù)最大化和總運(yùn)營(yíng)成本最小化。Najafi等[45]針對(duì)向?yàn)?zāi)區(qū)運(yùn)送物資和向醫(yī)院運(yùn)輸傷員的兩種震后救援場(chǎng)景,構(gòu)建了一個(gè)多物資種類、多傷亡類型、多運(yùn)輸模式(直升機(jī)、卡車、救護(hù)車和火車)的多目標(biāo)動(dòng)態(tài)模型,該模型能夠滿足物資的總交貨期需求,并縮短傷員到達(dá)醫(yī)院的總時(shí)間。
綜上,目前學(xué)界積極借鑒商業(yè)物流的研究方法,將運(yùn)營(yíng)管理的思想和工具引入災(zāi)后人道主義物流領(lǐng)域。在研究?jī)?nèi)容上,基于傳統(tǒng)的分配、選址、路徑、調(diào)度、排序等商業(yè)物流問(wèn)題,災(zāi)后人道主義物流分別將其考慮在資源調(diào)配、現(xiàn)場(chǎng)分診救治、醫(yī)院綜合治療等更細(xì)化的任務(wù)情景下,更貼合實(shí)際救災(zāi)需求,有助于實(shí)現(xiàn)高效救援;在災(zāi)后人道主義物流運(yùn)營(yíng)管理模式上,現(xiàn)有文獻(xiàn)一般以市場(chǎng)機(jī)制、社會(huì)力量等為主導(dǎo)的中國(guó)救災(zāi)模式作為研究背景,這與強(qiáng)勢(shì)政府主導(dǎo)的救災(zāi)模式存在較大出入[46],從中國(guó)與世界其他各國(guó)關(guān)于新冠肺炎疫情的防控措施、力度與效果上便可見一斑。因此,對(duì)于重大突發(fā)公共事件,國(guó)內(nèi)需進(jìn)一步探索和創(chuàng)新“黨委負(fù)責(zé)、政府主導(dǎo)”的中國(guó)救災(zāi)模式下的災(zāi)后人道主義物流研究;在思想與工具運(yùn)用上,災(zāi)后人道主義物流運(yùn)營(yíng)管理研究借鑒了商業(yè)建模、供應(yīng)鏈管理等方法,但在問(wèn)題設(shè)置和模型構(gòu)建上需進(jìn)一步體現(xiàn)災(zāi)后人道主義物流的特征,例如考慮響應(yīng)時(shí)間的緊迫性、物資的匱乏性、參數(shù)的動(dòng)態(tài)性和不確定性問(wèn)題,需積極探究實(shí)際災(zāi)害情景的表征手段和建模方法;在績(jī)效評(píng)價(jià)體系的構(gòu)建上,現(xiàn)有研究逐漸傾向于兼顧災(zāi)后人道主義物流的效率、效益和公平[47],但尚沒(méi)有統(tǒng)一的方法來(lái)衡量這三個(gè)性能指標(biāo)。其中,效率指標(biāo)較容易處理,一般和商業(yè)物流績(jī)效評(píng)價(jià)指標(biāo)類似,效益指標(biāo)主要與物資需求滿足相關(guān),而公平指標(biāo)以及其近義詞,只有少量文獻(xiàn)明確提到,更少有研究將公平納入決策模型中。雖然目前大部分研究都考慮到災(zāi)后人道主義物流的“弱經(jīng)濟(jì)性”,但主要仍是套用商業(yè)物流的優(yōu)化目標(biāo),再根據(jù)所研究的問(wèn)題特征加以改進(jìn),與減輕災(zāi)民痛苦的災(zāi)后救援行動(dòng)本質(zhì)目標(biāo)存在一定出入,或?qū)⒊霈F(xiàn)決策失誤,造成未知損失。
針對(duì)越來(lái)越復(fù)雜的災(zāi)后人道主義物流運(yùn)營(yíng)管理問(wèn)題,學(xué)界提出并采用了多種運(yùn)籌優(yōu)化求解方法。本節(jié)將按照精確方法、啟發(fā)式方法、強(qiáng)化學(xué)習(xí)方法以及混合方法,對(duì)相關(guān)求解方法進(jìn)行梳理和綜述。
精確方法是指能夠直接求出問(wèn)題最優(yōu)解的方法。目前已有針對(duì)不同問(wèn)題類型的特定算法,并可應(yīng)用于人道主義物流領(lǐng)域。Ma和Wu[48]使用改進(jìn)的雙向Dijkstra算法計(jì)算應(yīng)急救援車輛的最優(yōu)路徑;Chen和Chu[49]采用Bellman-Ford算法、Dijkstra算法等尋找最優(yōu)撤離出口;Yu等[50]針對(duì)應(yīng)急物資分配調(diào)度問(wèn)題建立動(dòng)態(tài)規(guī)劃模型,特別關(guān)注了因交付延遲而造成的災(zāi)民痛苦,并通過(guò)大量的數(shù)值實(shí)驗(yàn)驗(yàn)證了動(dòng)態(tài)規(guī)劃方法的計(jì)算性能和求解質(zhì)量,他們的另一篇文章考慮了效率、效益和公平的應(yīng)急物資配置目標(biāo),證明了動(dòng)態(tài)規(guī)劃方法在求解小規(guī)模問(wèn)題時(shí)能達(dá)到最優(yōu),并針對(duì)中、大規(guī)模問(wèn)題設(shè)計(jì)了近似動(dòng)態(tài)規(guī)劃算法[51]。針對(duì)一些小規(guī)模的災(zāi)后人道主義物流問(wèn)題,可以直接使用LINGO、CPLEX、Gurobi等商業(yè)求解器進(jìn)行求解,但當(dāng)問(wèn)題規(guī)模變大時(shí),列生成、Benders分解、拉格朗日松弛等大規(guī)模優(yōu)化算法往往更加適用。Faiz等[52]分別采用CPLEX求解器和列生成算法求解帶時(shí)間窗的開放式車輛路徑問(wèn)題,結(jié)果表明當(dāng)實(shí)例規(guī)模增大時(shí)后者性能明顯更優(yōu)。Noyan等[53]針對(duì)不確定條件下救援分發(fā)點(diǎn)的選址和容量分配問(wèn)題,設(shè)計(jì)了基于Benders分解的Branch-and-Cut算法,并通過(guò)數(shù)值研究證明了該方法的計(jì)算效果。Bayram和Yaman[54]以最小化總預(yù)期疏散時(shí)間為目標(biāo),研究了避難所選址和災(zāi)民撤離路徑問(wèn)題,提出了一種基于Benders分解的精確算法求解兩階段隨機(jī)規(guī)劃模型,并使用割平面算法求解對(duì)偶子問(wèn)題。
啟發(fā)式方法是指基于問(wèn)題的特定知識(shí)和經(jīng)驗(yàn),以可接受的花費(fèi)(如計(jì)算時(shí)間、計(jì)算空間)給出最合適的解。Xavier等[55]采用改進(jìn)的節(jié)約里程法求解了救援直升機(jī)運(yùn)力和飛行路徑規(guī)劃問(wèn)題。Dubois等[56]討論了洪災(zāi)后救援隊(duì)的路徑?jīng)Q策,并使用了最佳時(shí)間流插入算法得到了較優(yōu)的路徑解。Yang等[57]采用掃描算法求解了災(zāi)后救援物資分配和運(yùn)輸問(wèn)題。然而傳統(tǒng)啟發(fā)式算法具有一定的缺陷:在求解問(wèn)題時(shí)容易陷入局部最優(yōu),且對(duì)問(wèn)題描述約束性較強(qiáng)。元啟發(fā)式算法是一類受自然現(xiàn)象和智能方法激發(fā)的啟發(fā)式方法,可以一定程度上避免上述傳統(tǒng)啟發(fā)式的問(wèn)題,且在求解復(fù)雜組合優(yōu)化問(wèn)題時(shí)成效顯著。元啟發(fā)式方法主要分為兩類,第一類是由局部搜索方法改進(jìn)而來(lái)的基于軌跡策略的元啟發(fā)式算法,如模擬退火、禁忌搜索、迭代局部搜索等[58]。Sakiani等[59]設(shè)計(jì)了特殊的模擬退火算法求解災(zāi)后應(yīng)急物資分配與再分配問(wèn)題,該算法能夠在合理時(shí)間內(nèi)得到高質(zhì)量的解;Balcik[60]利用禁忌搜索算法求解了災(zāi)情評(píng)估團(tuán)隊(duì)的選址和路徑?jīng)Q策問(wèn)題,并以地震案例對(duì)該求解方法的效果進(jìn)行了驗(yàn)證。另一類元啟發(fā)式方法是由生物學(xué)演化而來(lái)的基于群策略的元啟發(fā)式算法,如遺傳算法及文化算法等進(jìn)化算法、蟻群算法及粒子群算法等群智能算法[58]。Du和Yi[61]構(gòu)建了道路損壞情況下的救援物資交付模型,并采用遺傳算法獲得車輛路徑解。救援車輛路徑問(wèn)題一般是旅行商問(wèn)題(Travelling Salesman Problem, TSP)的變形,且蟻群算法在求解TSP問(wèn)題時(shí)優(yōu)于其他啟發(fā)式,因此蟻群算法在救援車輛路徑規(guī)劃中有很好的應(yīng)用。Liu和Xie[62]在蟻群算法的設(shè)計(jì)中考慮車輛分配和需求動(dòng)態(tài),以車輛容量、車輛到達(dá)配送中心的時(shí)間以及車輛到達(dá)災(zāi)區(qū)的時(shí)間來(lái)規(guī)劃路徑。
強(qiáng)化學(xué)習(xí)的基本思想是處于特定環(huán)境中的智能體(Agent)不斷地做出選擇,其每一項(xiàng)選擇都會(huì)得到環(huán)境不同的反饋(即獎(jiǎng)勵(lì))。智能體通過(guò)與環(huán)境的不斷交互和試錯(cuò),接收反饋信息來(lái)進(jìn)行優(yōu)化決策[63]。目前強(qiáng)化學(xué)習(xí)已應(yīng)用在路徑優(yōu)化、庫(kù)存管理、裝箱配載等經(jīng)典運(yùn)籌學(xué)問(wèn)題中,并逐漸有學(xué)者將其引入災(zāi)后人道主義物流領(lǐng)域。強(qiáng)化學(xué)習(xí)方法在求解隨機(jī)動(dòng)態(tài)多階段序貫決策問(wèn)題方面具備一定優(yōu)勢(shì),可以將復(fù)雜的序貫決策問(wèn)題建模為馬爾科夫決策過(guò)程,非常適用于動(dòng)態(tài)、隨機(jī)的災(zāi)后人道主義物流問(wèn)題求解[64]。Nadi和Edrissi[65]提出了一種以最小化總救援評(píng)估時(shí)間為目標(biāo)的隨機(jī)規(guī)劃模型,并利用強(qiáng)化學(xué)習(xí)對(duì)模型進(jìn)行優(yōu)化。他們的另一篇文章[66]提出了一種由馬爾可夫決策過(guò)程表示的多智能體評(píng)估和響應(yīng)系統(tǒng),通過(guò)強(qiáng)化學(xué)習(xí)來(lái)保障應(yīng)急響應(yīng)小組和救援評(píng)估小組之間的行動(dòng)協(xié)作。Su等[67]設(shè)計(jì)了一種用于救援路徑規(guī)劃的強(qiáng)化學(xué)習(xí)方法,該方法能夠在動(dòng)態(tài)危險(xiǎn)的環(huán)境下找到更短、更安全的可行救援路徑。Chini等[68]分別考慮了確定情況和隨機(jī)情況下應(yīng)急救援車輛路徑選擇問(wèn)題,并采用強(qiáng)化學(xué)習(xí)方法來(lái)優(yōu)化救護(hù)車智能體的路徑。Yu等[69]采用強(qiáng)化學(xué)習(xí)方法求解災(zāi)后復(fù)雜的應(yīng)急物資分配問(wèn)題,并分別與精確動(dòng)態(tài)規(guī)劃方法、啟發(fā)式算法的求解效果進(jìn)行了比較。實(shí)驗(yàn)結(jié)果表明,該算法的效率優(yōu)于動(dòng)態(tài)規(guī)劃方法,精度高于啟發(fā)式算法。雖然強(qiáng)化學(xué)習(xí)求解動(dòng)態(tài)隨機(jī)問(wèn)題具有較大的優(yōu)勢(shì),但當(dāng)問(wèn)題的求解空間變得復(fù)雜時(shí),需消耗大量的計(jì)算時(shí)間和存儲(chǔ)空間,即出現(xiàn)“維數(shù)災(zāi)難”現(xiàn)象[70],因此目前強(qiáng)化學(xué)習(xí)方法在人道主義物流研究領(lǐng)域的應(yīng)用非常有限。
精確算法和啟發(fā)式方法各自的特點(diǎn)決定了二者在很大程度上可以互補(bǔ),因此將二者結(jié)合起來(lái)的混合方法在災(zāi)后人道主義物流領(lǐng)域也得到了廣泛的應(yīng)用。現(xiàn)有的精確型和啟發(fā)式混合方法可歸納為兩種主要形式:組合形式和整合形式。組合形式指精確算法/啟發(fā)式算法或依次執(zhí)行,或相互交織,或并行執(zhí)行。這種形式的特點(diǎn)是兩種算法自身依舊保持完整獨(dú)立性。整合形式指一種算法嵌入到另一種算法內(nèi)部并成為其組成部分,常見的形式為精確算法/啟發(fā)式算法為主并調(diào)用啟發(fā)式算法/精確算法[71]。Moreno等[40]關(guān)于CSRP的一項(xiàng)研究采用組合形式的混合算法,使用構(gòu)造啟發(fā)式和局部搜索啟發(fā)式,生成Branch-and-Benders-Cuts算法的初始可行解。而Moreno等[41]關(guān)于CSRP的另一項(xiàng)研究則采用整合形式的混合算法,在Branch-and-Cut樹中調(diào)用遺傳算法和模擬退火算法探索當(dāng)前解的鄰域,實(shí)例研究證明該混合算法減少了70%以上的計(jì)算時(shí)間。Buzón-Cantera等[72]針對(duì)應(yīng)急物資分配和路徑規(guī)劃問(wèn)題,提出了一種以模擬退火算法為主、以精確算法求解子問(wèn)題為輔的混合算法,數(shù)值結(jié)果表明該混合算法能夠在較短的計(jì)算時(shí)間內(nèi)獲得較好的解。此外,優(yōu)勢(shì)互補(bǔ)的混合啟發(fā)式方法也是解決災(zāi)后人道主義物流復(fù)雜組合優(yōu)化問(wèn)題的重要方法,Zhang和Xiong[73]考慮了災(zāi)后緊急糧食運(yùn)送問(wèn)題,提出了一種混合的免疫蟻群算法,該算法利用免疫算法的快速全局收斂性和隨機(jī)性,同時(shí)結(jié)合蟻群算法的分布式搜索和正反饋能力,快速生成更好的解集,數(shù)值實(shí)驗(yàn)表明該混合算法的性能優(yōu)于蟻群算法、免疫算法以及遺傳算法。吳新勝等[74]設(shè)計(jì)了群智能混合算法優(yōu)化應(yīng)急物資運(yùn)輸路徑,充分利用粒子群算法和人工群蜂算法的群體移動(dòng)規(guī)律,對(duì)螢火蟲算法的移動(dòng)更新策略進(jìn)行改進(jìn),有效提高了原螢火蟲算法的尋優(yōu)精度和搜索效率。
求解方法的性能一般可從求解效率和求解精度兩個(gè)層面進(jìn)行評(píng)價(jià)。由于災(zāi)后人道主義物流研究一般都為復(fù)雜的組合優(yōu)化問(wèn)題,目前并沒(méi)有哪種方法能夠在兩個(gè)層面同時(shí)保持優(yōu)勢(shì)。精確算法能夠獲得問(wèn)題的最優(yōu)解,然而當(dāng)求解空間的規(guī)模無(wú)法控制時(shí),精確方法很難在合理時(shí)間內(nèi)得到最優(yōu)解。面對(duì)災(zāi)后低質(zhì)量的數(shù)據(jù)集以及緊迫的響應(yīng)時(shí)間要求,精確算法很難發(fā)揮優(yōu)勢(shì),在傷亡程度低、災(zāi)后運(yùn)輸網(wǎng)絡(luò)較為簡(jiǎn)單情形下可能更為適用。因此,以時(shí)間換精度的啟發(fā)式算法尤其是元啟發(fā)式方法,或?qū)⒊蔀閺?fù)雜災(zāi)害背景下快速求解組合優(yōu)化問(wèn)題的首選方法。相較于精確方法,元啟發(fā)式計(jì)算效率更高,對(duì)數(shù)據(jù)的質(zhì)量要求更低,且可以獲得比傳統(tǒng)啟發(fā)式更高質(zhì)量的解。隨著研究的不斷深入,學(xué)界已經(jīng)對(duì)啟發(fā)式方法、精確算法進(jìn)行了多角度、多形式的改進(jìn)或融合,設(shè)計(jì)出了多種高性能的混合方法,并在物資調(diào)度運(yùn)輸與分配交付、臨時(shí)設(shè)施選址與任務(wù)指派、災(zāi)民疏散撤離與分診救治等多種災(zāi)后應(yīng)急響應(yīng)場(chǎng)景發(fā)揮巨大的優(yōu)勢(shì)。此外,由于強(qiáng)化學(xué)習(xí)在解決隨機(jī)、動(dòng)態(tài)的決策優(yōu)化問(wèn)題具有一定的優(yōu)勢(shì),已成功被應(yīng)用于多個(gè)運(yùn)籌優(yōu)化領(lǐng)域,但其在災(zāi)后人道主義物流領(lǐng)域的研究仍處于起步階段,目前已有的應(yīng)用也僅側(cè)重于具體的案例研究,且大多只考慮單一隨機(jī)因素,針對(duì)多重隨機(jī)因素的災(zāi)后場(chǎng)景研究較少。
從PD-HL的運(yùn)營(yíng)管理問(wèn)題和求解方法角度,歸納拓展未來(lái)的研究方向和思路,以使問(wèn)題的設(shè)置和求解更加適應(yīng)災(zāi)后救援實(shí)際。
1. 任務(wù)情境的設(shè)定
現(xiàn)有災(zāi)后人道主義物流中運(yùn)營(yíng)管理任務(wù)的設(shè)置大多和商業(yè)物流類似,還需考慮災(zāi)后救援的特殊性,可從任務(wù)特征出發(fā),考慮更為細(xì)化和貼合救災(zāi)現(xiàn)實(shí)的情境設(shè)定。例如,在應(yīng)急物資分配上,可以考慮血液、藥品、食物、水、帳篷等,在用途、供運(yùn)方式、易腐爛性、緊迫程度等方面存在差異的異質(zhì)資源組合,而現(xiàn)有研究大多只考慮單一資源。同時(shí)也可以考慮不同救治類型、技能水平和設(shè)備類型等多模式異質(zhì)醫(yī)療資源分配;在應(yīng)急資源運(yùn)輸路徑和傷員運(yùn)輸路徑規(guī)劃上,可以考慮不同種類、不同速度、不同容量的多式聯(lián)運(yùn),同時(shí)考慮無(wú)人機(jī)等新型運(yùn)輸設(shè)備,從而可以靈活地根據(jù)災(zāi)區(qū)地理位置、人口密度等實(shí)際情況采取最優(yōu)的運(yùn)輸模式。此外,在自然災(zāi)害后的運(yùn)輸路徑規(guī)劃中考慮道路修復(fù),也是一個(gè)必要且復(fù)雜的研究問(wèn)題,這意味著救援組織不僅需要決策同質(zhì)/異質(zhì)維修人員的調(diào)度和路徑,而且需要據(jù)此對(duì)救援人員進(jìn)行動(dòng)態(tài)路徑更新和交通規(guī)劃;在分診救治上,可以進(jìn)一步探索簡(jiǎn)單而有效的分診規(guī)則,研究分診過(guò)度或不足的影響,同時(shí)因?yàn)?zāi)害形勢(shì)和健康狀況的動(dòng)態(tài)性,可以進(jìn)一步研究分診后因傷員優(yōu)先級(jí)更新而產(chǎn)生的救治重調(diào)度問(wèn)題。
2. 績(jī)效評(píng)價(jià)體系的構(gòu)建
目前尚未有統(tǒng)一的災(zāi)后人道主義物流的績(jī)效評(píng)價(jià)體系,鑒于救援中參與人心理感知的重要性,未來(lái)災(zāi)后人道主義物流的績(jī)效評(píng)價(jià)體系可借鑒行為運(yùn)籌管理理論,考慮決策者的不同決策偏好或有限理性、災(zāi)民的差異化心理痛苦或負(fù)面情緒等。例如,通過(guò)專家意見聯(lián)合分析法,獲取影響災(zāi)后人道主義物流行動(dòng)決策的各因素及其權(quán)重指標(biāo),基于專家偏好和意見的聯(lián)合分析,構(gòu)建災(zāi)后人道主義物流分段線性效用目標(biāo)函數(shù);通過(guò)科學(xué)嚴(yán)謹(jǐn)?shù)膶?shí)證研究,抽象表達(dá)救災(zāi)行動(dòng)和救災(zāi)效果間的函數(shù)關(guān)系,并在救災(zāi)效果中著重考慮災(zāi)民心理感知,例如用剝奪水平表示災(zāi)民因無(wú)法獲得物資或服務(wù)而遭受的痛苦水平[9],用以自我為中心的不公平厭惡程度評(píng)估物資短缺、物資充足和物資過(guò)剩等公平感知[75]等。另外,人道主義物流的優(yōu)化目標(biāo)間存在一定的背反關(guān)系,且多目標(biāo)模型求解難度頗大,如何在保證求解效率的情況下,綜合考慮多個(gè)相互沖突的目標(biāo)并建立合理的權(quán)衡,仍有待學(xué)界探索。
3. 運(yùn)營(yíng)管理模式的創(chuàng)新
現(xiàn)有國(guó)際災(zāi)害運(yùn)營(yíng)管理研究主要基于西方發(fā)達(dá)國(guó)家社會(huì)背景,救災(zāi)模式一般以市場(chǎng)機(jī)制、社會(huì)力量等為主導(dǎo),這與強(qiáng)勢(shì)政府主導(dǎo)的中國(guó)救災(zāi)模式存在較大出入。未來(lái)國(guó)內(nèi)人道主義物流研究應(yīng)當(dāng)依據(jù)中國(guó)國(guó)情,以保障人民群眾生命安全為首要運(yùn)作目標(biāo),以“黨委負(fù)責(zé),政府主導(dǎo)、社會(huì)力量和市場(chǎng)機(jī)制廣泛參與”為主體資源配置方式,以軍隊(duì)、武警部隊(duì)和公安消防等為主要應(yīng)急救援力量,探索和創(chuàng)新具有中國(guó)特色的人道主義物流運(yùn)營(yíng)管理模式,并將其應(yīng)用到國(guó)內(nèi)實(shí)際重大突發(fā)公共事件中。進(jìn)一步剖析和提煉不同管理情景和問(wèn)題設(shè)置下,中國(guó)強(qiáng)勢(shì)政府主導(dǎo)的災(zāi)后人道主義物流的核心特征、運(yùn)作效果、適用范圍和改進(jìn)方向,基于“政府—社會(huì)—市場(chǎng)”多方協(xié)同進(jìn)行災(zāi)害數(shù)理建模,突破以社會(huì)力量和市場(chǎng)機(jī)制為主導(dǎo)的國(guó)際救災(zāi)理論局限。
1. 啟發(fā)式方法的創(chuàng)新
災(zāi)后人道主義物流運(yùn)作環(huán)境復(fù)雜且響應(yīng)時(shí)間緊迫,對(duì)求解算法的有效性提出了較高的要求。近年來(lái)運(yùn)籌優(yōu)化領(lǐng)域涌現(xiàn)出一些新型啟發(fā)式方法, 例如松鼠搜索算法、鯨魚優(yōu)化算法、灰狼優(yōu)化算法,這些算法運(yùn)行速度快、搜索能力強(qiáng),適用于解決復(fù)雜的高維和多目標(biāo)優(yōu)化問(wèn)題,未來(lái)可嘗試在災(zāi)后人道主義物流領(lǐng)域應(yīng)用這些新型啟發(fā)式算法。另外,可針對(duì)災(zāi)后人道主義物流領(lǐng)域的具體災(zāi)害場(chǎng)景或問(wèn)題對(duì)現(xiàn)有啟發(fā)式方法進(jìn)行創(chuàng)新性改進(jìn),如設(shè)計(jì)更優(yōu)的擾動(dòng)策略和加速策略,以提高算法在特定災(zāi)害場(chǎng)景下的計(jì)算性能。也可借助生產(chǎn)生活的經(jīng)驗(yàn)或其他學(xué)科的知識(shí),尋找新的擬物模型,探索并設(shè)計(jì)新的更高效的啟發(fā)式方法。
2. 精確方法的改進(jìn)
精確方法在更關(guān)注求解速度的災(zāi)后人道主義物流場(chǎng)景下優(yōu)勢(shì)不明顯,因此未來(lái)可在保持求解精度的同時(shí),進(jìn)一步設(shè)計(jì)更高效快速的精確算法。例如,采用分解簡(jiǎn)化的求解思想,運(yùn)用基于列生成的分支定價(jià)算法對(duì)問(wèn)題進(jìn)行分解,推導(dǎo)出定價(jià)子問(wèn)題目標(biāo)函數(shù),并設(shè)計(jì)有效的標(biāo)簽算法進(jìn)行求解;針對(duì)災(zāi)害背景下的具體問(wèn)題,探索新的有效不等式以降低問(wèn)題。
3. 強(qiáng)化學(xué)習(xí)方法的運(yùn)用
強(qiáng)化學(xué)習(xí)方法在求解隨機(jī)動(dòng)態(tài)多階段序貫決策問(wèn)題方面具備一定優(yōu)勢(shì),但其在災(zāi)后人道主義物流運(yùn)營(yíng)管理問(wèn)題中的應(yīng)用尚處于起步階段。未來(lái)可以深入探究如何利用強(qiáng)化學(xué)習(xí)方法對(duì)救災(zāi)倉(cāng)庫(kù)選址、災(zāi)民需求預(yù)測(cè)以及災(zāi)區(qū)網(wǎng)絡(luò)布局等經(jīng)典隨機(jī)動(dòng)態(tài)決策問(wèn)題進(jìn)行優(yōu)化求解。此外,可以將人道主義物流領(lǐng)域?qū)<姨囟ǖ膽?yīng)急規(guī)劃經(jīng)驗(yàn)、知識(shí)、數(shù)據(jù)融入強(qiáng)化學(xué)習(xí)框架中,提高強(qiáng)化學(xué)習(xí)方法的學(xué)習(xí)效率和魯棒性。同時(shí),可在強(qiáng)化學(xué)習(xí)中融合深度學(xué)習(xí)的注意力機(jī)制,聚焦于救災(zāi)庫(kù)存、災(zāi)民需求、災(zāi)區(qū)路網(wǎng)等信息上,提高災(zāi)后救援效率與效益。另外,可以考慮提高強(qiáng)化學(xué)習(xí)在運(yùn)籌優(yōu)化領(lǐng)域的泛化能力,將終生學(xué)習(xí)、遷移學(xué)習(xí)、多任務(wù)學(xué)習(xí)等引入到強(qiáng)化學(xué)習(xí)中,以加速?gòu)?qiáng)化學(xué)習(xí)對(duì)災(zāi)后復(fù)雜組合優(yōu)化問(wèn)題的學(xué)習(xí)進(jìn)程,有效解決災(zāi)后人道主義物流研究中常見的多目標(biāo)動(dòng)態(tài)決策問(wèn)題。
4. 混合方法的集成
由于混合算法的優(yōu)勢(shì)集成以及災(zāi)后人道主義物流的效率和效益要求,探索不同啟發(fā)式結(jié)合的混合算法以及精確型和啟發(fā)式結(jié)合的混合方法是一項(xiàng)必要且具有挑戰(zhàn)性的工作。因此應(yīng)深入研究各種求解方法的特點(diǎn)以及不同混合策略的效果,設(shè)計(jì)高效且可執(zhí)行的混合算法,從而同時(shí)提高算法的求解速度和求解質(zhì)量。另外,強(qiáng)化學(xué)習(xí)方法的優(yōu)勢(shì)在于可通過(guò)與環(huán)境的交互獲取動(dòng)態(tài)信息,但其存在收斂效率不高、穩(wěn)定性不足等問(wèn)題,未來(lái)可考慮融合深度學(xué)習(xí)以自動(dòng)提取復(fù)雜應(yīng)急物流問(wèn)題的特征、利用其他啟發(fā)式方法指導(dǎo)強(qiáng)化學(xué)習(xí)方法更有效率的學(xué)習(xí),促進(jìn)強(qiáng)化學(xué)習(xí)和其他方法在災(zāi)后人道主義物流領(lǐng)域的混合創(chuàng)新。
電子科技大學(xué)學(xué)報(bào)(社科版)2022年1期