陳永政
(重慶財(cái)經(jīng)職業(yè)學(xué)院 應(yīng)用技術(shù)學(xué)院,重慶 402160)
城市需水預(yù)測(cè)是城市水資源規(guī)劃、管理、決策的重要依據(jù)。隨著人口與經(jīng)濟(jì)活動(dòng)的增加、生活水平的提高、城市化以及氣候變化帶來(lái)的不確定性,世界各地的水資源短缺問(wèn)題日益突出[1]。水資源和供水系統(tǒng)的優(yōu)化規(guī)劃變得越來(lái)越重要,需水量預(yù)測(cè)是供水優(yōu)化調(diào)度的依據(jù),同時(shí)為確定新水資源開發(fā)時(shí)間提供參考。需水量的科學(xué)預(yù)測(cè)有利于水資源優(yōu)化配置,預(yù)測(cè)的準(zhǔn)確性對(duì)供水系統(tǒng)安全經(jīng)濟(jì)運(yùn)行起著重要作用[2]。城市需水量預(yù)測(cè)是供水系統(tǒng)有效運(yùn)行的關(guān)鍵環(huán)節(jié)?;貧w模型法、時(shí)間序列法等傳統(tǒng)方法在供水量預(yù)測(cè)方面要求建立預(yù)測(cè)量與影響因素之間準(zhǔn)確的機(jī)理模型、大量線性化處理降低模型精度,具有較大的不確定性和模糊性,普適性較差,而基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化的神經(jīng)網(wǎng)絡(luò)為需水預(yù)測(cè)提供了新思路[3]。郭強(qiáng)等[4]采用貝葉斯BP神經(jīng)網(wǎng)絡(luò)對(duì)校園日用水量波動(dòng)范圍進(jìn)行了有效預(yù)測(cè)。Zubaidi等[5]提出了結(jié)合粒子群與人工神經(jīng)網(wǎng)絡(luò)的新方法,通過(guò)評(píng)估氣候因素進(jìn)行需水量預(yù)測(cè)。然而,城市需水量預(yù)測(cè)模型中影響因子多且普遍存在多重共線問(wèn)題,BP神經(jīng)網(wǎng)絡(luò)在求解模型時(shí)易陷入局部極值[6]。
為提升需水預(yù)測(cè)的準(zhǔn)確性,筆者把基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化的最小二乘支持向量機(jī)(LSSVM)[7]作為需水量預(yù)測(cè)的擬合模型?;依莾?yōu)化算法(GWO)具有易理解、控制參數(shù)少、不要求目標(biāo)函數(shù)和優(yōu)化條件可微等特點(diǎn)而得到廣泛應(yīng)用[8-9]。針對(duì)GWO尋優(yōu)過(guò)程易陷入局部最優(yōu)的問(wèn)題,采用一般性反向?qū)W習(xí)與非線性控制參數(shù)對(duì)其進(jìn)行改進(jìn),以提升其全局優(yōu)化性能,改進(jìn)后的算法記為IGWO。IGWO算法更適合非線性模型參數(shù)的擬合,而LSSVM模型的超參數(shù)確認(rèn)過(guò)程也是復(fù)雜的非線性擬合問(wèn)題,因此將其引入LSSVM需水預(yù)測(cè)模型,用來(lái)擬合模型的超參數(shù),構(gòu)建IGWO-LSSVM城市需水預(yù)測(cè)模型。以上海市為例,采用近35 a城市供水?dāng)?shù)據(jù)建立IGWO-LSSVM需水預(yù)測(cè)模型,驗(yàn)證灰狼優(yōu)化算法在城市需水預(yù)測(cè)模型中的有效性,以期為城市水資源綜合管理規(guī)劃提供參考。
最小二乘支持向量機(jī)(LSSVM)是支持向量機(jī)(SVM)的一種改進(jìn),它將復(fù)雜、高維的非線性問(wèn)題映射到特征線性空間,并將優(yōu)化問(wèn)題轉(zhuǎn)化為對(duì)偶凸二次規(guī)劃,用于解決高維、非線性、小樣本的問(wèn)題,因具有良好的泛化能力而得到廣泛應(yīng)用[10]。設(shè)訓(xùn)練數(shù)據(jù)集為{xi,yi},其中:i=1,2,…,l;xi∈Rn;yi∈R(R為實(shí)數(shù)集,n為維數(shù))。利用非線性映射φ(·)將樣本從原空間Rn映射到特征空間。在高維空間構(gòu)造回歸函數(shù)[11]:
式中:ω為可調(diào)權(quán)向量;φ(x)為非線性映射函數(shù);b為偏置參數(shù)。
根據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則,可得最優(yōu)ω與b:
式中:‖ω‖2為控制模型的復(fù)雜度;為誤差控制函數(shù);C為正則化參數(shù),用于平衡訓(xùn)練誤差與模型適應(yīng)度;ξi為擬合隨機(jī)誤差。
引入Lagrange乘子α,構(gòu)造拉格朗日函數(shù),得到無(wú)約束優(yōu)化問(wèn)題:
根據(jù)Karush-Kuhn-Tucker條件,分別求解L對(duì)ω、b、ξ和αi的偏微分,并消除ω和ξ,以矩陣形式表示為
式 中:e=[1,1…,1]T;y=[y1,…,yl];α=[α1,…,αl]Τ;Ω為對(duì)稱矩陣,矩陣中的元素Ωij=φ(xi)φ(xj)=K(xi,xj),其中j=1,2,…,l;K(xi,xj)為核函數(shù),為解決原空間中樣本非線性擬合問(wèn)題,采用徑向基函數(shù)。
求解優(yōu)化問(wèn)題后,得到回歸模型的線性表達(dá)式:
GWO算法是Mirjalili等[11]受灰狼群體中的捕食行為和社會(huì)等級(jí)啟發(fā)而提出的群智能優(yōu)化算法。灰狼種群社會(huì)等級(jí)如圖1所示,其中:θ狼的位置代表最優(yōu)位置,對(duì)應(yīng)求解問(wèn)題的最優(yōu)解;β、δ狼的任務(wù)是協(xié)助θ狼對(duì)狼群進(jìn)行管理及參與捕獵過(guò)程中的決策,其位置代表第2優(yōu)、第3優(yōu)位置,對(duì)應(yīng)求解問(wèn)題的2個(gè)次優(yōu)解;ε狼代表其他普通灰狼,其位置對(duì)應(yīng)解空間中的剩余候選解。GWO算法通過(guò)模擬灰狼包圍、追捕、攻擊等捕食行為逐步更新自身位置,從而實(shí)現(xiàn)全局優(yōu)化。
圖1 灰狼種群等級(jí)制度
假設(shè)種群規(guī)模為N的灰狼群為{xi|i=1,2,…,N},解空間為D維,GWO算法數(shù)學(xué)模型[12]表達(dá)式為
式中:B為灰狼與獵物間的距離;xi(t)、xi(t+1)分別為t和t+1時(shí)刻第i灰狼的位置;xp(t)為獵物的位置(當(dāng)前最優(yōu)解);C為系數(shù),表示圍捕獵物過(guò)程中所受自然界的阻礙作用,C>1或C<1表示加大或減小獵物距離;A為收斂因子,控制灰狼個(gè)體趨向或者遠(yuǎn)離當(dāng)前獵物。
A、C計(jì)算公式為
式中:r1、r2為[0,1]內(nèi)的隨機(jī)數(shù);a為控制參數(shù),從2線性遞減至0;T為迭代周期。
GWO算法中,灰狼種群中其他灰狼xo(t)在t+1時(shí)刻的位置通過(guò)θ、β、δ狼t時(shí)刻的位置進(jìn)行更新:
式中:xθ、xβ、xδ分別為θ、β、δ狼的當(dāng)前位置;x1(t+ 1)、x2(t+ 1)、x3(t+ 1)分別為θ、β、δ狼在t+1時(shí)刻的位置。
GWO算法的尋優(yōu)過(guò)程是由3個(gè)較優(yōu)解θ、β、δ狼主導(dǎo),易造成算法早熟收斂并陷入局部最優(yōu)。采用反向?qū)W習(xí)策略對(duì)候選解與其反向解所構(gòu)造的解空間同時(shí)搜索,可提升算法的搜索能力,而非線性自適應(yīng)控制參數(shù)可平衡灰狼優(yōu)化算法的開發(fā)和探索能力、提高全局優(yōu)化能力。改進(jìn)的灰狼優(yōu)化算法(IGWO)即將GWO算法引入一般性反向?qū)W習(xí)和非線性控制參數(shù)策略。
2.2.1 一般性反向?qū)W習(xí)策略
反向?qū)W習(xí)(OBL)[13]通過(guò)評(píng)估當(dāng)前可行解與其反向解,保留較優(yōu)秀解以便更好地逼近當(dāng)前候選解,OBL的思想已經(jīng)被許多研究者用來(lái)提高各種優(yōu)化方法的收斂速度。在一維空間中,假設(shè)是粒子xj的反向解,則定義為
式中:xj∈[aj,bj],aj、bj分別為變量的下限、上限。
Wang等[14]將通過(guò)當(dāng)前搜索空間中的候選對(duì)象轉(zhuǎn)換為新的搜索空間的對(duì)象,提出了一般性反向?qū)W習(xí)(GOBL)模型。設(shè)xi=(xi,1,xi,2,…,xi,D)是D維空間中的一個(gè)個(gè)體,反向解為),則第j維方向點(diǎn)表達(dá)式為
其中
式中:k為U(0, 1)范圍內(nèi)的隨機(jī)數(shù);daj、dbj分別為第j維搜索空間的最小值、最大值。
若越界,將采用下式進(jìn)行重置:
倘若我們手持的是一卷“粼粼的微波下潛伏著洶涌暗浪”的憂患之作,則恐怕難得“瀟灑”而要為之擊節(jié)共鳴、扼腕長(zhǎng)嘆了。而此刻筆者案頭所置的便是這樣一冊(cè)由著名劇作家、散文家柯靈先生所著的《墨磨人》!
假設(shè)f(xi)是一個(gè)適應(yīng)度函數(shù),用于表示候選解的適應(yīng)度。當(dāng)且僅當(dāng)f()優(yōu)于f(xi)時(shí),用取代xi。對(duì)候選解與其反向解所構(gòu)造的解空間同時(shí)搜索,將大大提高最優(yōu)解質(zhì)量。
2.2.2 非線性控制參數(shù)策略
實(shí)現(xiàn)GWO算法全局探索和局部開發(fā)之間的平衡是保證算法全局搜索性能的關(guān)鍵。全局探索能力指探測(cè)更廣泛搜索區(qū)域的能力,局部開發(fā)則強(qiáng)調(diào)利用已有信息對(duì)群體的某些區(qū)域進(jìn)行精細(xì)搜索。在GWO算法中,收斂因子A調(diào)節(jié)全局探索和局部開發(fā)之間的平衡,而A的值隨控制參數(shù)a的變化而改變,因此控制參數(shù)a在很大程度上決定著全局探索和局部開發(fā)之間的平衡度。式(10)中控制參數(shù)a由2線性遞減至0,而求解復(fù)雜優(yōu)化問(wèn)題時(shí),線性遞減策略往往不利于實(shí)際搜索。因此,設(shè)計(jì)一種非線性控制參數(shù)策略,對(duì)之前的線性遞減的控制參數(shù)進(jìn)行動(dòng)態(tài)調(diào)整:
式中:fi為個(gè)體i的適應(yīng)度;fmin、favg分別為當(dāng)前種群中最小適應(yīng)度和平均適應(yīng)度。
當(dāng)fi>favg時(shí),取得較大權(quán)值,從而增大個(gè)體的活躍度;反之,取得較小權(quán)值,使狼群個(gè)體更多地被θ、β、δ狼吸引,從而向優(yōu)勢(shì)搜索空間靠攏。此外,當(dāng)個(gè)體趨于收斂或一致時(shí),即|favg-fmin|較小時(shí),a隨之增大;當(dāng)較分散時(shí),即|favg-fmin|較大,a隨之減小。因此,式(18)控制參數(shù)更新策略更有利于全局搜索與局部探測(cè)能力的平衡。
2.2.3 IGWO算法步驟
(1)初始化參數(shù)、群體規(guī)模和最大迭代次數(shù)。
(3)采用式(18)計(jì)算控制參數(shù)。
(4)采用式(8)~式(10)計(jì)算A、C。
(5)按式(11)、式(12)更新種群中個(gè)體位置。
(6)計(jì)算適應(yīng)度值,更新θ、β、δ狼的位置。
(7)判斷終止條件是否滿足。若滿足,則輸出最優(yōu)解;否則轉(zhuǎn)至步驟(3)繼續(xù)迭代。
采用RBF的LSSVM模型有正則化參數(shù)和核寬度兩個(gè)超參數(shù),需要在回歸過(guò)程中進(jìn)行優(yōu)化,其中:正則化參數(shù)決定經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍的比例,核寬度決定樣本數(shù)據(jù)映射到特征空間分布的復(fù)雜性且影響模型在特征空間中獲得最優(yōu)分類超平面的泛化性能。因此,本文采用IGWO算法優(yōu)化模型超參數(shù),以進(jìn)一步提升LSSVM模型的需水預(yù)測(cè)泛化能力。主要步驟:①選取需水量試驗(yàn)數(shù)據(jù)并進(jìn)行歸一化處理,初始化IGWO和LSSVM模型參數(shù);②將RMSE作為優(yōu)化過(guò)程的目標(biāo)函數(shù),以目標(biāo)函數(shù)值最小為原則,采用IGWO模型優(yōu)化LSSVM模型的兩個(gè)參數(shù);③采用最優(yōu)的超參數(shù)構(gòu)建LSSVM模型,并對(duì)測(cè)試集數(shù)據(jù)進(jìn)行預(yù)測(cè)驗(yàn)證。IGWOLSSVM模型計(jì)算流程見(jiàn)圖2。
圖2 IGWO-LSSVM模型計(jì)算流程
采用IGWO-LSSVM模型進(jìn)行需水量預(yù)測(cè)。城市供水系統(tǒng)復(fù)雜,需水量具有非線性和隨機(jī)波動(dòng)性,其變化受氣候、降水量、工業(yè)用水量、居民用水量等多種因素影響。本文提出一種基于最小二乘支持向量機(jī)的時(shí)間序列需水量預(yù)測(cè)方法,用于預(yù)測(cè)城市用水量變化的總體趨勢(shì)。崔東文等[15]采用SPSS軟件對(duì)用水序列進(jìn)行自相關(guān)分析時(shí),指出當(dāng)滯后數(shù)為4時(shí),預(yù)測(cè)模型具有較好的預(yù)測(cè)效果,因此本文選用前4 a的供水量作為輸入變量,以當(dāng)前年份的供水量作為輸出變量。表1給出1985—2019年上海市自來(lái)水供水量數(shù)據(jù),共35組。隨機(jī)選擇30組數(shù)據(jù)用作訓(xùn)練集,采用訓(xùn)練集數(shù)據(jù)對(duì)IGWO-LSSVM模型進(jìn)行訓(xùn)練并建立需水預(yù)測(cè)模型,剩余5組數(shù)據(jù)用于測(cè)試模型的性能。
表1 上海市自來(lái)水逐年供水量 億m3
為了驗(yàn)證IGWO-LSSVM模型的性能,采用剩余5組數(shù)據(jù)對(duì)訓(xùn)練后的模型進(jìn)行測(cè)試,并與PSO-LSSVM模型、GWO-LSSVM模型的測(cè)試結(jié)果進(jìn)行對(duì)比,見(jiàn)表2??傮w而言,PSO-LSSVM、GWO-LSSVM、IGWOLSSVM三種模型均能對(duì)5組測(cè)試樣本做出合理預(yù)測(cè),前2種模型的平均相對(duì)誤差(1.82%、1.86%)均較為接近,而IGWO-LSSVM模型平均相對(duì)誤差為0.78%,比前2種模型平均相對(duì)誤差更小、精度更高,表明改進(jìn)后的IGWO具有更好的全局優(yōu)化能力、能尋找出更優(yōu)的模型超參數(shù),可有效解決城市需水預(yù)測(cè)問(wèn)題。
表2 模型預(yù)測(cè)效果
針對(duì)城市需水預(yù)測(cè)模型中需水量影響因子眾多且非線性的問(wèn)題,提出一種基于最小二乘支持向量機(jī)的非線性預(yù)測(cè)模型,以提升城市需水預(yù)測(cè)的準(zhǔn)確性。模型的超參數(shù)決定著LSSVM模型的泛化性能,提出采用IGWO對(duì)其進(jìn)行優(yōu)化。通過(guò)引入一般性反向?qū)W習(xí)與非線性控制參數(shù)策略,以改善其全局優(yōu)化性能,進(jìn)而提高超參數(shù)優(yōu)化選擇能力。采用構(gòu)建的IGWO-LSSVM模型對(duì)上海市需水量進(jìn)行預(yù)測(cè),結(jié)果顯示該模型平均相對(duì)誤差為0.78%,比PSO-LSSVM模型、GWO-LSSVM模型的預(yù)測(cè)精度更高,表明改進(jìn)的灰狼優(yōu)化算法在城市需水預(yù)測(cè)模型中具有較強(qiáng)的優(yōu)勢(shì)。