李成棟李銀萍周長(zhǎng)庚
(1.山東建筑大學(xué) 信息與電氣工程學(xué)院,山東 濟(jì)南250101;2.山東省智能建筑技術(shù)重點(diǎn)實(shí)驗(yàn)室,山東 濟(jì)南250101)
1965年,ZADEH[1]提出了“模糊集合”的概念,模糊系統(tǒng)理論開始發(fā)展。1973年,ZADEH[2]建立了研究模糊控制的基礎(chǔ)理論。1974年,MAMDANI[3]將模糊理論應(yīng)用于鍋爐和蒸汽機(jī)的控制,此后模糊理論持續(xù)發(fā)展。模糊系統(tǒng)在建模等領(lǐng)域得到了廣泛應(yīng)用,基于模糊規(guī)則的模糊模型具有可解釋、可嵌入經(jīng)驗(yàn)知識(shí)等獨(dú)特的優(yōu)勢(shì)。經(jīng)典模糊模型是基于一型模糊集合的,稱之為一型模糊模型。盡管一型模糊模型已經(jīng)應(yīng)用于很多領(lǐng)域,但其在處理不確定性時(shí)仍有一定的局限性。因此,為了更好地處理這一問題,學(xué)者們提出了二型模糊的概念[4-6]。相對(duì)于一型模糊集合,二型模糊集合的隸屬度由精確值轉(zhuǎn)變?yōu)槟:?,具有更高的自由度,能更好地處理不確定性問題。基于二型模糊集合的二型模糊模型具有更少的規(guī)則,但能夠獲得更佳的性能,已經(jīng)應(yīng)用于多個(gè)領(lǐng)域。
目前,在該研究領(lǐng)域,已經(jīng)提出了多種優(yōu)化方法以實(shí)現(xiàn)二型模糊模型的構(gòu)建。李軍等[7]提出了一種基于二型非單值區(qū)間二型模糊邏輯系統(tǒng)的多步預(yù)測(cè)方法,利用反向傳播(Back Propagation,BP)算法優(yōu)化參數(shù),提高了模型的預(yù)測(cè)精度。陳陽等[8]利用量子粒子群算法優(yōu)化二型模糊邏輯系統(tǒng)的參數(shù),提高了系統(tǒng)的穩(wěn)定性。王丹等[9]利用反向傳播和最小二乘法分別調(diào)整前、后件參數(shù),得到了預(yù)測(cè)精度較高的二型模糊系統(tǒng)。佃松宜等[10]針對(duì)區(qū)間二型模糊中規(guī)則參數(shù)難以設(shè)定的問題,提出了改進(jìn)量子粒子群算法優(yōu)化模糊集參數(shù),提高了模型的性能。鄭高等[11]采用BP算法調(diào)整輸入以及規(guī)則前、后件參數(shù),提高了模型的預(yù)測(cè)精度。王為國(guó)等[12]利用人類學(xué)習(xí)算法優(yōu)化模型參數(shù),提高了模型的控制性能。袁順杰等[13]提出了一種基于自組織特征映射的二型模糊模型,提高了模型的預(yù)測(cè)精度。趙鳳等[14]利用粒子群優(yōu)化算法對(duì)區(qū)間二型模糊模型優(yōu)化,改善了原模型容易陷入局部最優(yōu)的問題。李軍等[15]利用主成分分析與二型模糊系統(tǒng)相結(jié)合的方法解決規(guī)則“爆炸”問題,并利用反向傳播算法和奇異值分解提高計(jì)算效率。MELIN等[16]探討了一種基于遺傳算法的神經(jīng)網(wǎng)絡(luò)集成模糊響應(yīng)集結(jié)優(yōu)化結(jié)構(gòu),可用于時(shí)間序列預(yù)測(cè)。上述已有二型模糊模型訓(xùn)練方法側(cè)重于預(yù)測(cè)性能的表現(xiàn),但二型模糊模型輸入輸出關(guān)系較一型模糊模型更為復(fù)雜,且具有相對(duì)較多的待定參數(shù),從而使得模型計(jì)算復(fù)雜性上升,模型學(xué)習(xí)時(shí)間變長(zhǎng),在一定程度上影響了二型模糊模型的應(yīng)用范圍。因此,在其設(shè)計(jì)過程中,除了要考慮系統(tǒng)的性能,二型模糊模型構(gòu)建過程中的訓(xùn)練時(shí)間問題也是不可回避的。
針對(duì)上述問題,文章提出了一種基于分布式集成方法的區(qū)間二型模糊模型設(shè)計(jì)策略,采用分布式集成策略得到區(qū)間二型模糊模型,并通過最小二乘法優(yōu)化區(qū)間二型模糊模型后件參數(shù),降低模型訓(xùn)練的難度。文章以風(fēng)力發(fā)電和地鐵人流量預(yù)測(cè)為例,通過與自適應(yīng)模糊系統(tǒng)(Adaptive Network-based Fuzzy Inference System,ANFIS)、反向傳播神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network,BPNN)以及基于差分進(jìn)化的區(qū)間二型模糊模型(Type-2 Fuzzy Model-Differential Evolution,T2FM-DE)對(duì)比,驗(yàn)證了該方法的優(yōu)越性和有效性。
論域X上的一型模糊集A可以由在[0,1]上的隸屬度函數(shù)μA來刻畫,由式(1)表示為
式中μA(x)為x的隸屬度,μA(x)∈[0,1]。
論域X上的二型模糊集合A~可由式(2)[17]表示為
式中(x)為x的模糊隸屬度函數(shù);Jx為主隸屬度;fx(u)為次隸屬度。當(dāng)fx(u)=1時(shí),為區(qū)間二型模糊集合。后續(xù)提到的二型模糊主要指區(qū)間二型模糊。
文章所用到的一型模糊集合為三角形一型模糊集合,如圖1(a)所示;采用的二型模糊集合為梯形區(qū)間二型模糊集合,如圖1(b)所示。區(qū)間二型模糊集合的所有主隸屬度值并組成的二維區(qū)域(圖1(b)中的陰影部分)稱為不確定覆蓋域(Footprint of Uncertainty,F(xiàn)OU),其上、下兩條邊界分別為上隸屬度函數(shù)(Upper Membership Function,UMF)和下隸屬度函數(shù)(Lower Membership Function,LMF)。
圖1 模糊集合圖
區(qū)間二型模糊集合的隸屬度(x)可以由其上隸屬度函數(shù)和下隸屬度函數(shù)來刻畫,其表達(dá)式由式(3)表示為
二型模糊模型的結(jié)構(gòu)如圖2所示。其結(jié)構(gòu)與一型模糊模型的結(jié)構(gòu)十分類似,不同之處在于輸出處理環(huán)節(jié)。對(duì)于一型模糊模型而言,其輸出環(huán)節(jié)僅有一個(gè)解模糊器,但二型模糊模型的輸出環(huán)節(jié)除解模糊器之外還有一個(gè)降型器。
圖2 二型模糊模型結(jié)構(gòu)圖
假定有q個(gè)輸入變量,對(duì)第s個(gè)輸入變量xs而言,其輸入論域可以劃分為ms個(gè)二型模糊集合,,從而完備規(guī)則庫共有條模糊規(guī)則,其中的第(i1i2…iq)條規(guī)則由式(4)表示為
對(duì)二型模糊模型,給定輸入x=(x1,x2,…,xq)后,通過單點(diǎn)值模糊器和二型模糊推理過程可得到規(guī)則(i1i2…iq)的區(qū)間激活強(qiáng)度由式(5)表示為
式中和分別為二型模糊集合的下隸屬度函數(shù)及上隸屬度函數(shù)。
采用由BIGLARBEGIAN等[18]提出的方法降型及解模糊后得到二型模糊模型的精確輸出值y,由式(6)表示為
式中α≥0,β≥0且α+β=1,通常α和β均設(shè)定為0.5。
基于分布式集成方法的區(qū)間二型模糊模型設(shè)計(jì)整體框架如圖3所示。
圖3 基于分布式集成的區(qū)間二型模糊模型構(gòu)建框架圖
該方法的具體實(shí)現(xiàn)流程為
(1)將訓(xùn)練數(shù)據(jù)集X劃分為P個(gè)訓(xùn)練數(shù)據(jù)子集,其中P個(gè)訓(xùn)練數(shù)據(jù)子集的大小近似相等;
(2)針對(duì)P個(gè)訓(xùn)練數(shù)據(jù)子集,利用ANFIS方法分別構(gòu)建一型模糊模型,得到P個(gè)一型模糊模型;
(3)集成P個(gè)一型模糊模型,得到初始區(qū)間二型模糊模型;
(4)利用最小二乘法對(duì)區(qū)間二型模糊模型的參數(shù)進(jìn)行優(yōu)化,得到最終的模型。
針對(duì)每一個(gè)數(shù)據(jù)子集,訓(xùn)練得到相對(duì)應(yīng)的一型模糊模型。以第p個(gè)訓(xùn)練數(shù)據(jù)子集為例。
(1)確定其第s個(gè)輸入變量xs的論域范圍根據(jù)第p個(gè)訓(xùn)練數(shù)據(jù)子集,其上、下界的計(jì)算公式分別由式(7)和(8)表示為
(2)對(duì)該論域進(jìn)行一型模糊劃分。利用三角形一型模糊集合劃分輸入變量xs的論域,具體劃分結(jié)果如圖4所示,其中為的中心點(diǎn)。
圖4 輸入變量xs在第p個(gè)模型中的一型模糊劃分圖
在該一型模糊劃分中,輸入變量xs的模糊劃分?jǐn)?shù)為ms,其第is,p三角形一型模糊集合的隸屬函數(shù)由式(9)表示為
(3)可以構(gòu)造出針對(duì)第p個(gè)數(shù)據(jù)子集的一型模糊模型的完備模糊規(guī)則庫,由式(10)表示為
式中q為輸入變量個(gè)數(shù);is,p=1,2,…,ms;p=1,2,…,P;s=1,2,…,q。規(guī)則庫共有條模糊規(guī)則。
(4)將該模糊規(guī)則庫中的模糊規(guī)則作為初始規(guī)則,利用ANFIS方法對(duì)這些規(guī)則進(jìn)行優(yōu)化,從而針對(duì)劃分的P個(gè)訓(xùn)練數(shù)據(jù)子集構(gòu)造出相對(duì)應(yīng)的P個(gè)一型模糊模型。
將所得到的P個(gè)一型模糊模型進(jìn)行集成,構(gòu)造初始區(qū)間二型模糊模型。在一型和區(qū)間二型模糊模型中都采用完備規(guī)則庫,為實(shí)現(xiàn)集成的目標(biāo),只需要將一型模糊劃分集成為區(qū)間二型模糊劃分,將一型模糊規(guī)則中的后件集成為相對(duì)應(yīng)的區(qū)間二型模糊規(guī)則后件。
一型模糊劃分的集成主要涉及相對(duì)應(yīng)模糊集合的集成。文章所給出的集成策略如圖5所示。在該策略中,提取P個(gè)一型模糊模型中的P個(gè)三角形一型模糊集合,將P個(gè)三角形一型模糊集合進(jìn)行集成,得到梯形區(qū)間二型模糊集合。
圖5 一型模糊集合的集成圖
從而可以得到初始區(qū)間二型模糊模型的規(guī)則庫由式(11)表示為
式中q為輸入變量個(gè)數(shù);為規(guī)則(i1,…,iq)后件的區(qū)間權(quán)重,由P個(gè)一型模糊模型的規(guī)則后件集成得到,其計(jì)算式分別由(12)和(13)表示為
通過分布式集成方法得到了初始的區(qū)間二型模糊模型,為進(jìn)一步強(qiáng)化該模型的性能,需要對(duì)其參數(shù)進(jìn)行優(yōu)化處理。主要考慮區(qū)間二型模糊規(guī)則后件參數(shù)的優(yōu)化問題,將采用最小二乘方法實(shí)現(xiàn)這些參數(shù)的學(xué)習(xí)。
根據(jù)式(6),區(qū)間二型模糊模型的輸入輸出關(guān)系的向量形式可由式(14)表示為
式中f(x)為模糊規(guī)則激活向量;w為區(qū)間權(quán)重參數(shù)向量,分別由式(15)和(16)表示為
通過訓(xùn)練得到的區(qū)間二型模糊規(guī)則的區(qū)間權(quán)重向量w使得預(yù)測(cè)值和真實(shí)值的偏差最小,由式(18)表示為
式中Z為激活度矩陣;y為輸出向量,Z和y的計(jì)算由式(19)和(20)表示為
該優(yōu)化問題為最小二乘問題,從而可以得到區(qū)間二型模糊規(guī)則的區(qū)間權(quán)重向量w的最小二乘估計(jì),由式(21)表示為
為驗(yàn)證所給出方法的有效性及優(yōu)勢(shì),將其應(yīng)用于風(fēng)力發(fā)電預(yù)測(cè)和地鐵人流量預(yù)測(cè)問題中,并與經(jīng)典一型模糊模型(自適應(yīng)模糊推理系統(tǒng)ANFIS)、經(jīng)典神經(jīng)網(wǎng)絡(luò)模型(反向傳播神經(jīng)網(wǎng)絡(luò)BPNN)以及基于差分進(jìn)化的區(qū)間二型模糊模型(T2FM-DE)進(jìn)行對(duì)比。
利用對(duì)稱平均絕對(duì)百分率誤差ESMAPE以及均方百分比誤差EMSPE來衡量各預(yù)測(cè)模型的預(yù)測(cè)精度,其具體計(jì)算公式由式(22)和(23)表示為
式中yk為第k個(gè)實(shí)際數(shù)據(jù);為第k個(gè)預(yù)測(cè)數(shù)據(jù);K為數(shù)據(jù)的個(gè)數(shù)。
同時(shí),為了證明所提模型提高了學(xué)習(xí)速度,也給出了4個(gè)模型的所用訓(xùn)練時(shí)間作為對(duì)比指標(biāo),通過訓(xùn)練時(shí)間的長(zhǎng)短來說明模型學(xué)習(xí)速度的快慢。
實(shí)驗(yàn)所選的風(fēng)力發(fā)電數(shù)據(jù)來源于公共數(shù)據(jù)集。所選數(shù)據(jù)集每隔15 min采集一次風(fēng)力發(fā)電數(shù)據(jù),共包含10 000個(gè)數(shù)據(jù)點(diǎn),選取前8 000個(gè)數(shù)據(jù)進(jìn)行訓(xùn)練,后2 000個(gè)數(shù)據(jù)進(jìn)行測(cè)試。
實(shí)驗(yàn)過程中,劃分前8 000個(gè)數(shù)據(jù),得到數(shù)據(jù)個(gè)數(shù)相同的5個(gè)訓(xùn)練數(shù)據(jù)子集,進(jìn)行一型模糊訓(xùn)練,集成得到初始區(qū)間二型模糊模型,利用最小二乘法優(yōu)化區(qū)間二型模糊后件參數(shù)。
對(duì)比模型的實(shí)驗(yàn)參數(shù)設(shè)置:在ANFIS模型中,迭代次數(shù)為100次,每個(gè)輸入的模糊集個(gè)數(shù)為3;在BPNN模型中,迭代次數(shù)為10 000次;在T2FM-DE中,迭代次數(shù)為100次。最后得到的區(qū)間二型模糊模型的預(yù)測(cè)結(jié)果如圖6所示。實(shí)際值與預(yù)測(cè)值散點(diǎn)圖如圖7所示,擬合曲線表達(dá)式為y=0.9911x+5.4089。
由圖6可知,所提模型在風(fēng)電預(yù)測(cè)方面效果較好,預(yù)測(cè)值和實(shí)際值的波動(dòng)曲線相差較小。觀察圖7中實(shí)際值與預(yù)測(cè)值的散點(diǎn)圖可以看出兩者的誤差較小,說明模型的預(yù)測(cè)精度較好。
圖6 風(fēng)力發(fā)電實(shí)驗(yàn)預(yù)測(cè)結(jié)果圖
圖7 風(fēng)力發(fā)電實(shí)際值與預(yù)測(cè)值散點(diǎn)圖
模型性能指標(biāo)對(duì)比結(jié)果見表1。
表1 不同預(yù)測(cè)模型之間的指標(biāo)對(duì)比表
由表1的對(duì)比數(shù)據(jù)來看,在預(yù)測(cè)精度方面,所提出的區(qū)間二型模糊模型的預(yù)測(cè)精度與ANFIS、BPNN和T2FM-DE模型相近。但在訓(xùn)練時(shí)間上,所提模型的訓(xùn)練時(shí)間要遠(yuǎn)小于其他3個(gè)模型,比ANFIS、BPNN、T2FM-DE模型分別快約17、40和2 000倍,驗(yàn)證了分布式集成方法的有效性。
實(shí)驗(yàn)所選的地鐵人流量數(shù)據(jù)來源于網(wǎng)站:https://data.buenosaires.gob.ar/dataset? tags=transporte&_tags_limit=0,采集地址為阿根廷首都布宜諾斯艾利斯地鐵E號(hào)線,伯多Boedo車站。所選數(shù)據(jù)的采集時(shí)間為2018年3月1日至7月31日,采集間隔時(shí)間為15 min。所選數(shù)據(jù)集共包含14 000個(gè)數(shù)據(jù)點(diǎn),選擇前10 000個(gè)數(shù)據(jù)進(jìn)行訓(xùn)練,后4 000個(gè)數(shù)據(jù)進(jìn)行測(cè)試。
實(shí)驗(yàn)過程中,對(duì)前10 000個(gè)數(shù)據(jù)進(jìn)行劃分,得到數(shù)據(jù)個(gè)數(shù)相同的10個(gè)訓(xùn)練數(shù)據(jù)子集,進(jìn)行一型模糊訓(xùn)練,集成得到初始區(qū)間二型模糊模型,并利用最小二乘法優(yōu)化區(qū)間二型模糊后件參數(shù)。
對(duì)比模型的實(shí)驗(yàn)參數(shù)設(shè)置:在ANFIS模型中,迭代次數(shù)為100次,每個(gè)輸入的模糊集個(gè)數(shù)為4;在BPNN模型中,迭代次數(shù)為10 000次;在T2FM-DE中,迭代次數(shù)為100次。得到的區(qū)間二型模糊模型的預(yù)測(cè)結(jié)果如圖8所示,實(shí)際值與預(yù)測(cè)值散點(diǎn)圖如圖9所示,擬合曲線表達(dá)式為y=0.9105x+4.8339。模型性能指標(biāo)對(duì)比結(jié)果見表2。
由圖8可知,區(qū)間二型模糊模型在地鐵人流量預(yù)測(cè)中表現(xiàn)良好,且從圖9中實(shí)際值與預(yù)測(cè)值的分布可以觀察到,除個(gè)別數(shù)據(jù)點(diǎn)外,其他數(shù)據(jù)誤差較小,說明模型的預(yù)測(cè)精度較好。根據(jù)表2可知,所提模型與ANFIS、BPNN以及T2FM-DE模型的預(yù)測(cè)結(jié)果相近。但是,在訓(xùn)練時(shí)間上要明顯快于其他3個(gè)模型,僅需0.9204 s,比ANFIS模型約快68倍,比BPNN模型約快13倍,比T2FM-DE模型約快1 156倍。由此可知,所提方法在保證預(yù)測(cè)性能的前提下,能夠有效地提高了學(xué)習(xí)速度。
圖8 地鐵人流量預(yù)測(cè)結(jié)果圖
圖9 地鐵人流量實(shí)際值與預(yù)測(cè)值散點(diǎn)圖
表2 不同預(yù)測(cè)模型之間的指標(biāo)對(duì)比表
為加快區(qū)間二型模糊模型的訓(xùn)練速度,改善預(yù)測(cè)效果,文章提出了一種基于分布式集成方法的區(qū)間二型模糊模型設(shè)計(jì)策略。通過實(shí)驗(yàn)對(duì)比得出以下結(jié)論:
(1)建立的模型與ANFIS、BPNN和T2FM-DE等3種模型相比,各模型在風(fēng)力發(fā)電預(yù)測(cè)實(shí)驗(yàn)中測(cè)試的ESMAPE和EMSPE分別為3.09%、3.98%、5.48%、3.58%和0.21%、0.26%、0.35%、0.23%;在地鐵人流量預(yù)測(cè)實(shí)驗(yàn)中測(cè)試的ESMAPE和EMSPE分別為13.03%、19.78%、15.81%、11.14%和1.54%、1.54%、2.83%、0.93%。由此可以看出,所提模型的預(yù)測(cè)與其他3種的精度相近。
(2)在風(fēng)力發(fā)電和地鐵人流量預(yù)測(cè)中,所提模型、ANFIS、BPNN以及T2FM-DE模型的訓(xùn)練時(shí)間分別為0.6708、11.4037、25.7246、1 448.9600 s和0.9204、62.2756、12.1236、1 063.8330 s,所提模型分別比其他3類模型約快17、38、2 160倍和68、13、1 156倍。表明采用分布式并行訓(xùn)練機(jī)制及最小二乘法進(jìn)行參數(shù)優(yōu)化能夠顯著地加快二型模糊模型的學(xué)習(xí)速度。