田宗浩,顧國華,王 鵬,王常青
(陸軍軍官學(xué)院,合肥 230031)
1993年,Song和Chissom[1-3]首次提出了基于模糊集理論的時間序列預(yù)測模型,即模糊時間序列(Fuzzy Time Series,FTS)。為了提升FTS模型的預(yù)測精度,研究者們經(jīng)過二十多年對FTS的不斷探索,一些新的算法和思想逐漸應(yīng)用到模型中[4-6],其相應(yīng)的理論和應(yīng)用不斷完善。在FTS模型的預(yù)測過程中,不同因素對預(yù)測結(jié)果的影響不一樣,為此引入權(quán)重因子對模型進行改進[7-9]。2005年,Yu[10]提出利用模糊邏輯關(guān)系矩陣中模糊邏輯關(guān)系出現(xiàn)的頻率建立權(quán)重模型;2006年Cheng[11,12]引入趨勢權(quán)重的概念建立模糊時間序列模型對臺灣股指進行預(yù)測,并取得較好的預(yù)測效果;2012年邱望仁[13]指出傳統(tǒng)加權(quán)模型計算出觀測值對每個模糊集的隸屬度后,僅考慮了最大隸屬度所對應(yīng)的模糊狀態(tài),并沒有充分利用觀測樣本隸屬于各個模糊狀態(tài)的隸屬度,這樣的處理方式顯然會丟失掉一些有用的信息。為此,文獻[13]依據(jù)樣本數(shù)據(jù)對每個模糊子集的隸屬度,設(shè)定要考慮的隸屬度個數(shù),對Chen和Lee加權(quán)模型進行改進,進一步提高了模型的預(yù)測精度。
邱望仁[13]首次提出了廣義模糊時間序列模型的概念,并給出了廣義模糊時間序列模型的定義。不同之處在于,廣義模型不僅充分考慮觀測樣本隸屬于各個模糊集的隸屬度,而且還以此建立了不同層次的模糊邏輯關(guān)系,并把要考慮的隸屬度值作為預(yù)測值模型的權(quán)重,很大程度上提高了模型的可解釋性和預(yù)測精度。2016年王慶林[14]建立了基于GA算法的廣義模糊時間序列預(yù)測模型,并且對旅游需求進行了預(yù)測,預(yù)測結(jié)果顯著提高。通過分析發(fā)現(xiàn),文獻[13]和文獻[14]中要考慮隸屬度的個數(shù)是人為主觀確定的,當(dāng)考慮的隸屬度個數(shù)一定時,如果樣本數(shù)據(jù)對模糊集的隸屬度太小,那么它們的引入不僅會增加模型的復(fù)雜度,而且會降低預(yù)測精度。為此,本文結(jié)合模糊集理論中λ-強截集[15,16]的性質(zhì),依據(jù)觀測值對模糊集的隸屬度大小來確定要考慮的隸屬度個數(shù),改進文獻[13]和文獻[14]提出的廣義模糊時間序列模型,并通過Alabama大學(xué)22年的入學(xué)人數(shù)對改進的模型進行驗證分析。
定義1[15]:假設(shè)X為一個普通的非空集合,其模糊子集A定義為A={(x,μA(x))|x∈X} ,其中μA(x)表示x對A的隸屬度,μA(x)∈[0,1],映射A(·)或者μA(·)|X→[0,1],x?μA(x)稱為模糊集A的隸屬函數(shù)。
定義2[16]:假設(shè)U(X)為X上模糊集合的全體,則A∈U(X),對?λ∈[0,1],記(A)λ=Aλ={x|μA(x)≥λ}為A的λ截集,Aλˉ={x|μA(x)>λ}為A的λ強截集,稱λ為閾值或者置信水平。
定義3[13]:實數(shù)集R的一個子集Y(t),(t=1,2,…)表示論域,在論域Y(t)上定義n個模糊集Ai(i=1,2,…,n),fAi(t)是定義在模糊集Ai上的隸屬函數(shù),F(xiàn)(t)是fAi(t)的集合,則F(t)就定義為論域Y(t)上的一個模糊時間序列。
定義4[13]:假設(shè)狀態(tài)F(t+1)由F(t)轉(zhuǎn)移得到,則F(t+1)的一階模型可以表示為F(t+1)=F(t)?R(t,t+1),其中R(t,t+1)表示模糊邏輯關(guān)系矩陣,模糊邏輯關(guān)系矩陣的建立可以參考文獻[10-13]。
定義 5[14]:設(shè)是時間序列Y(t)上t時刻的觀測值xt對應(yīng)的模糊狀態(tài),F(xiàn)(t+1)=是時間序列Y(t)上t+1時刻的觀測值xt+1對應(yīng)的模糊狀態(tài),fAi(xt)和fAj(xt+1)分別為觀測值xt和xt+1對模糊集Ai和Aj的隸屬度,則F(t+1)和F(t)之間的模糊關(guān)系可以表示為稱之為廣義的模糊邏輯關(guān)系,其中和分別稱為廣義模糊邏輯關(guān)系的前件和后件。
傳統(tǒng)FTS預(yù)測模型在利用t時刻的樣本數(shù)據(jù)對下一時刻的值進行預(yù)測時,僅僅利用了t時刻的樣本數(shù)據(jù)對各個模糊集隸屬度中最大的模糊狀態(tài),而將其他隸屬度所對應(yīng)的模糊狀態(tài)忽略掉,這樣的處理方式顯然會丟失掉一些有用的信息。而文獻[13]和文獻[14]建立的廣義模糊時間序列模型中,模糊邏輯關(guān)系依據(jù)要考慮的隸屬度個數(shù)而定。通過對文獻[13]和文獻[14]中廣義模糊邏輯關(guān)系的分析,要考慮隸屬度的個數(shù)K由人為主觀的確定,對于這樣的廣義模糊關(guān)系而言,當(dāng)K=1時,廣義的模糊時間序列就退化成只考慮最大隸屬度的模糊時間序列;當(dāng)K的值過大時,不僅會增加模型的計算復(fù)雜度,而且也會引入一些多余的信息,反而得不到理想的預(yù)測結(jié)果。雖然邱望仁和王慶林也為模型做了相應(yīng)的簡化處理,只考慮了模糊邏輯關(guān)系FLR( )
l,1,1≤l≤K,即t時刻第l位隸屬度對應(yīng)的模糊狀態(tài)與t+1時刻最大隸屬度對應(yīng)模糊狀態(tài)之間的關(guān)系,但是當(dāng)樣本數(shù)據(jù)第l位的隸屬度很小時,其對應(yīng)的模糊狀態(tài)對下一時刻的影響也會微乎其微,過多考慮反而會增加模型的復(fù)雜度、降低預(yù)測精度。為此,本文結(jié)合模糊集理論中λ強截集的性質(zhì),通過設(shè)定合理的閾值λ,篩選出對預(yù)測結(jié)果影響比較大的模糊狀態(tài),增強了廣義模型的可解釋性。
首先設(shè)定一個合理的閾值λ,假設(shè)t時刻的樣本數(shù)據(jù)對每個模糊集的隸屬度為 (fA1(xt),fA2(xt),…,fAn(xt)),依據(jù)公式(1)以及定義2強截集的性質(zhì)對其進行預(yù)處理,確定要考慮的模糊狀態(tài):
由此得到t時刻要考慮的模糊狀態(tài)個數(shù)Kt以及相應(yīng)模糊狀態(tài)對應(yīng)的隸屬度,將其按從大到小的順序排列為,其中是排在l位的隸屬度,其對應(yīng)的模糊狀態(tài)為Ati,由此得到t時刻需要考慮的模糊狀態(tài);同理,t+1時刻要考慮模糊狀態(tài)的個數(shù)為Kt+1,其中是排在k位的隸屬度,其對應(yīng)的模糊狀態(tài)為則將稱為t時刻到t+1時刻第l層模糊狀態(tài)與第k層模糊狀態(tài)之間的模糊邏輯關(guān)系,記為FLR(l,k),其中1≤l≤Kt,1≤k≤Kt+1,則這樣的廣義模糊邏輯關(guān)系組包含Kt×Kt+1個普通的模糊邏輯關(guān)系。
為了增強廣義模糊時間序列模型的可解釋性和提高模型的預(yù)測精度,本文以Chen和Lee模型的基本框架為基礎(chǔ),利用λ強截集的性質(zhì)以及廣義模糊邏輯關(guān)系的相關(guān)運算,合理地選取要考慮的模糊狀態(tài),建立基于λ強截集的廣義模糊時間序列模型。
第一步:論域劃分及數(shù)據(jù)模糊化。
采用傳統(tǒng)模型等分論域劃分方法對樣本數(shù)據(jù)進行劃分,以便簡化本文建立模型的計算復(fù)雜度以及滿足下文對比分析的需要。假設(shè)U=[xmin-δ1,xmax+δ2] ,將論域U劃分成n個模糊子集U=(u1,u2,…,un),其中,d1=xmin-δ1,xmin和xmax分別為觀測樣本數(shù)據(jù)中的最小值和最大值,δ1和δ2分別為兩個合適的正數(shù)。
用式(2)計算觀測樣本數(shù)據(jù)對每個模糊子集的隸屬度,從而確定樣本數(shù)據(jù)對應(yīng)的模糊概念。
其中,x(t)為t時刻的觀測樣本數(shù)據(jù),mi為第i個模糊子區(qū)間的中間值,l為等分論域區(qū)間間隔長度。
第二步:確定要考慮的隸屬度個數(shù),并做歸一化處理。
針對第一步中數(shù)據(jù)模糊化的結(jié)果,計算得到樣本數(shù)據(jù)對每個模糊子集的隸屬度向量(fA1(x(t)),fA2(x(t)),…,fAn(x(t))),設(shè)定合理的閾值λ,依據(jù)公式(1)確定t時刻要考慮的隸屬度個數(shù)Kt以及其對應(yīng)的模糊概念,引入公式(3)對預(yù)處理后的隸屬度向量標(biāo)準(zhǔn)化,為預(yù)測確定權(quán)重:
其中,n為劃分模糊概念個數(shù),x(t)為t時刻觀測樣本數(shù)據(jù)。
第三步:依據(jù)訓(xùn)練數(shù)據(jù)的先后建立模糊邏輯關(guān)系及關(guān)系矩陣。
這一步是本方法的關(guān)鍵所在,根據(jù)第二步可以分別確定出t時刻要考慮的隸屬度個數(shù)Kt以及其對應(yīng)的模糊概念A(yù)it;同理可以得出t+1時刻需要考慮的隸屬度個數(shù)Kt+1和對應(yīng)的模糊概念,由此可以得到t和t+1時刻之間Kt×Kt+1個模糊邏輯關(guān)系。根據(jù)各個時刻所確定的隸屬度個數(shù)Kt,t=1,2,…,利用公式(4)確定需要建立模糊邏輯關(guān)系矩陣的個數(shù)K:
為了簡化模型的計算復(fù)雜度,本文只考慮模糊邏輯關(guān)系FLR(k,1),1≤k≤Kt,即,假設(shè)(x(t))和(x(t+1) )分別為t和t+1時刻觀測值x(t)和x(t+1)對模糊子集的隸屬度向量中第k大的隸屬度和第一大隸屬度值,其對應(yīng)的模糊子集分別為和,則為對應(yīng)的第k層模糊邏輯關(guān)系,按照時間先后順序建立第k層模糊邏輯關(guān)系集合。依據(jù)得到的模糊邏輯關(guān)系集合,可以得到K個模糊邏輯關(guān)系矩陣Rk,1≤k≤K,相應(yīng)的關(guān)系矩陣建立方法和Chen、Lee模型相同。
第四步:建立預(yù)測模型。
依據(jù)t時刻要考慮的最大隸屬度的個數(shù)Kt以及第k大隸屬度對應(yīng)的模糊狀態(tài)Ai,并利用第三步建立的關(guān)系矩陣Rk,依次得到第k個最大隸屬度對應(yīng)的預(yù)測值Fvalk(t+1):
這樣就可以得到Kt個預(yù)測值,利用公式(3)歸一化后的隸屬度向量作為第k個最大隸屬度對應(yīng)的預(yù)測值Fvalk(t+1)的權(quán)重值,為此可以得到t+1時刻的預(yù)測值為:
第五步:預(yù)測效果評估。
為了評價本文建立的λ強截集的廣義FTS模型的優(yōu)劣,通常采用誤差形式來分析預(yù)測結(jié)果。但是單一的誤差分析形式可能由于誤差算法自身所存在的缺陷導(dǎo)致評價結(jié)果不可靠或者不正確,為此,本文采用均方誤差MSE和泰爾不等系數(shù)TIC來衡量模型的預(yù)測精度[17]。
其中,x(t)為樣本數(shù)據(jù),F(xiàn)val(t)為其對應(yīng)的預(yù)測值。
利用Alabama大學(xué)22年的入學(xué)人數(shù)為實驗數(shù)據(jù)對本文模型的可行性進行驗證(數(shù)據(jù)來源于文獻[13])。首先設(shè)置合理的閾值λ,然后利用文中廣義模糊邏輯關(guān)系建立的方法得到廣義模糊邏輯關(guān)系矩陣,最后將本文提出的方法與傳統(tǒng)的加權(quán)模型和廣義模型的預(yù)測結(jié)果進行對比分析,評價本文所建立模型的優(yōu)劣。
為了對比分析的需要,依舊采用Song提出的7等分論域劃分方法,對應(yīng)的語義解釋為:“極少”、“很少”、“少”、“正?!?、“多”、“很多”和“較多”,利用式(2)對觀測樣本數(shù)據(jù)模糊化,各個樣本隸屬于每個模糊子集的隸屬度見表1。
表1 樣本數(shù)據(jù)模糊化隸屬度
設(shè)定合理的閾值λ,依據(jù)表1實驗數(shù)據(jù)對每個模糊子集的隸屬度獲得每個時刻需要考慮的模糊狀態(tài)。為了簡化計算過程和說明問題的方便,本文考慮λ分別為0,0.35,0.5,0.7四種情況下各個時刻對應(yīng)的模糊狀態(tài)并且按照隸屬度大小排列(見表2):
表2 λ分別為0,0.35,0.5,0.7時各個時刻需要考慮的模糊狀態(tài)
以λ=0.35為例,可以確定需要建立3層模糊關(guān)系,依據(jù)上文建立廣義的模糊邏輯關(guān)系的步驟可得:
(1)第1層模糊關(guān)系
(2)第2層模糊關(guān)系
(3)第3層模糊關(guān)系
依據(jù)上述模糊關(guān)系,分別應(yīng)用Chen和Lee兩種模糊邏輯關(guān)系矩陣的建立方法,得到本文建立廣義模型的模糊關(guān)系矩陣為:
(1)Chen模糊關(guān)系矩陣
(2)Lee模糊關(guān)系矩陣
結(jié)合樣本數(shù)據(jù)隸屬于各個模糊子集的隸屬度(表1)以及設(shè)置的閾值λ,利用式(1)和式(4)對隸屬度表進行預(yù)處理和歸一化,并將歸一化后樣本數(shù)據(jù)的隸屬度向量作為預(yù)測值的權(quán)重。參照Chen和Lee建立模型的預(yù)測規(guī)則,分別求出t時刻第k大隸屬度對應(yīng)模糊子集對下一時刻的預(yù)測值Fvalk(t+1),然后采用式(7)求解出模型的最終預(yù)測結(jié)果。下面以Chen建立的模型為例求解預(yù)測值,例如:λ=0.35,1972年的觀測樣本數(shù)據(jù)對各個模糊子集的隸屬度向量為 (0.9685,0.5315,0.0315,0,0,0,0),觀測值對應(yīng)的模糊集為A1和A2,歸一化后的隸屬度向量為(0.6457,0.3543,0,0,0,0,0),最大隸屬度對應(yīng)的模糊子集為A1,其預(yù)測主要用到的模糊關(guān)系對應(yīng)于RC(1)的第一行,此時的預(yù)測值Fval1(1973)為14000;次大隸屬度對應(yīng)的模糊子集為A2,用到的主要模糊關(guān)系為RC(2)的第二行,此時的預(yù)測值Fval2(1973)為14500,則1973年的最終預(yù)測值為0.6457×14000+0.3543×14500=14177。類似的可以得到其他各年的預(yù)測結(jié)果,Lee模型的預(yù)測過程也與此類似,表3為邱望仁提出的加權(quán)模型和廣義模糊時間序列模型與本文λ=0.35時廣義模糊時間序列模型分別在Chen和Lee加權(quán)模型上應(yīng)用的預(yù)測結(jié)果,最后兩行分別為對應(yīng)模型的均方誤差和泰爾不等系數(shù);表4為改進模型在考慮不同λ時的預(yù)測精度變化情況。
表3 λ=0.35時廣義模型與其他模型的預(yù)測結(jié)果
表4 λ=0,0.35,0.5,0.7情況下預(yù)測精度表
由表3可以分析出本文建立的基于λ截集的廣義模糊時間序列模型在λ=0.35時得到的結(jié)果的均方誤差和泰爾不等系數(shù)都比對應(yīng)的文獻[13]中的加權(quán)模型和廣義模糊時間序列模型要低,這說明了本文改進模型的可行性和可靠性;表4列出了本文改進模型在考慮不同λ時的預(yù)測精度變化情況,當(dāng)λ取值很小時,廣義模型考慮的隸屬度個數(shù)會很多,但是有用的信息一般是有限的,過多的信息反而降低模型的預(yù)測精度;當(dāng)λ取值很大時,考慮的隸屬度個數(shù)會減少,為此會丟失掉一些有用的信息,模型的預(yù)測精度依舊不會很高。因此,根據(jù)樣本數(shù)據(jù)的分布結(jié)構(gòu)特征和實際應(yīng)用的意義,合理地選取閾值λ的值對模型的預(yù)測精度至關(guān)重要。
本文通過分析傳統(tǒng)的加權(quán)以及廣義模糊時間序列模型的建模過程,指出傳統(tǒng)模型對隸屬度的處理以及模糊邏輯關(guān)系矩陣的建立存在缺陷,為此本文重新定義所要考慮隸屬度對應(yīng)的模糊關(guān)系和預(yù)測所需的模糊邏輯關(guān)系矩陣,建立基于λ強截集的廣義模糊時間序列模型。利用均方誤差MSE和泰爾不等系數(shù)TIC對比分析本文提出模型和傳統(tǒng)加權(quán)模型和廣義模型的預(yù)測精度以及不同λ取值情況下模型預(yù)測精度的變化情況,驗證了本文建立模型的可行性和有效性。但是本文建立的模型僅僅考慮了等間隔論域劃分情況,不能充分考慮數(shù)據(jù)的結(jié)構(gòu)特征,為此,在非等間隔論域劃分情況下本文模型的效用依舊值得深入探究,另外,閾值λ的選取也是未來研究的重點。
參考文獻:
[1]Song Q,Chissom B S.Fuzzy Time Series and Its Models[J].Fuzzy Sets Syst,1993,(54).
[2]Song Q,Chissom B S.Forecasting Enrollments With Fuzzy Time Se?ries-Part I[J].Fuzzy Sets Syst,1993,(54).
[3]Song Q,Chissom B S.Forecasting Enrollments With Fuzzy Time Se?ries-Part II[J].Fuzzy Sets Syst,1993,(52).
[4]邱望仁,劉曉東.基于AFS拓?fù)浜虵CM的模糊聚類分析[J].模糊系統(tǒng)與數(shù)學(xué),2010,22(4).
[5]張志強.基于模糊邏輯關(guān)系組的時間序列模型改進[J].應(yīng)用數(shù)學(xué)學(xué)報,2015,38(4).
[6]劉齊林,曾玲,曾祥艷.基于支持向量機的區(qū)間模糊數(shù)時間序列預(yù)測[J].數(shù)學(xué)的實踐與認(rèn)識,2015,45(22).
[7]李學(xué)森,王本德,凌賢長,周惠成.權(quán)重趨勢系數(shù)模糊優(yōu)選法在供水評價中的應(yīng)用[J].哈爾濱理工學(xué)院學(xué)報,2009,41(6).
[8]劉曉娟,方建安.綜合權(quán)重的模糊時間序列的電力負(fù)荷預(yù)測方法[J].華東電力,2012,40(4).
[9]何曉慶,蔡娜.基于模糊自適應(yīng)變權(quán)重的經(jīng)濟時間序列組合預(yù)測模型研究[J].理論探討,2013,27(1).
[10]Yu H K.Weighted Fuzzy Time Series Model for TAIEX Forecasting[J].Physica A,2005,(349).
[11]Cheng C H,Chen Y S,Wu Y L.Forecasting Innovation Diffusion of products Using Trend Weighted Fuzzy Time Series Model[J].Ex?pert System With Applications,2009,(36).
[12]Cheng C H,Chen T L,Chiang C H.Trend-weighted Fuzzy Time Se?ries Model for TAIEX Forecasting[J].ICONIP,2006,(4234).
[13]邱望仁.模糊時間序列模型理論及應(yīng)用研究[M].天津:天津大學(xué)出版社,2013.
[14]王慶林,楊志輝.基于GA的廣義模糊時間序列建模及其在旅游需求預(yù)測中的應(yīng)用[J].江西科學(xué),2015,33(5).
[15]Zadeh L A.Fuzzy Sets[J].Information and Control,1965,8(3).
[16]劉林等.應(yīng)用模糊數(shù)學(xué)[M].西安:陜西科學(xué)技術(shù)出版社,2008.
[17]周春楠,黃少濱等.基于譜聚類的高階模糊時序自適應(yīng)預(yù)測方法[J].通信學(xué)報,2016,2(37).