劉曉旭, 曲智林
(東北林業(yè)大學(xué) 理學(xué)院, 黑龍江 哈爾濱 150040)
自從Zadeh[1]發(fā)表關(guān)于模糊集的開創(chuàng)性論文之后,模糊數(shù)學(xué)的理論和應(yīng)用均得到了廣泛而深入的研究.模糊回歸分析由Tanaka等[2]引入,其認(rèn)為模糊數(shù)據(jù)是一種可能性分布,觀測值與估計(jì)值之間的偏差由于系統(tǒng)結(jié)構(gòu)的模糊性所致.之后D’urso等[3]、Jiang等[4]和Güler[5]以模糊集理論為基礎(chǔ)研究了不同的模糊回歸模型.Li等[6]和Chen等[7]給出模糊線性模型參數(shù)估計(jì)的2種方法:線性規(guī)劃法及最小二乘法.這些模糊回歸模型往往用于處理語言變量這類的模糊數(shù).
模糊非參平滑技術(shù)近年來也取得了顯著的發(fā)展,平滑技術(shù)對于處理非參數(shù)回歸問題特別有效.Petit-Renaud等[8]運(yùn)用模糊數(shù)的信念函數(shù)進(jìn)行非參回歸分析;Cheng等[9]和Choi等[10]將k近鄰和平滑方法擴(kuò)展到模糊非參回歸,然而在統(tǒng)計(jì)中這2種方法嚴(yán)重受到邊界效應(yīng)的影響.
半?yún)⒉糠志€性模型是參數(shù)模型和非參數(shù)模型之間的一種折中.Hesamian[11]將半?yún)⒉糠志€性模型擴(kuò)展到模糊環(huán)境中,利用有約束的線性規(guī)劃對模糊系數(shù)進(jìn)行估計(jì),但卻沒有給出模糊系數(shù)估計(jì)的顯式表達(dá)式;并采用k近鄰的方法對模糊光滑函數(shù)進(jìn)行估計(jì),但是眾所周知k近鄰嚴(yán)重受到邊界效應(yīng)的影響.所以本文基于此對上述模糊半?yún)⒉糠志€性模型進(jìn)行改進(jìn),提出了含有精確輸入、模糊輸出、模糊系數(shù)、模糊光滑函數(shù)的模糊半?yún)⒉糠志€性模型.
式中L,R:+→[0,1]都是左連續(xù)非增函數(shù),則稱為LR型模糊數(shù).L(x)和R(x)分別稱為左右形狀函數(shù),a∈叫作的中心值,la,ra∈+分別叫做的左、右擴(kuò)散,記LR模糊數(shù)為
定義4 如果一個(gè)矩陣中的元素都是LR模糊數(shù)的形式,稱這個(gè)矩陣為LR模糊矩陣.
定義5 2個(gè)LR模糊矩陣和一個(gè)實(shí)數(shù)矩陣t:
1) 模糊矩陣加減定義為
2) 實(shí)數(shù)矩陣乘模糊矩陣定義為
式中ωm,ωl,ωr>0為權(quán)重.
為了確定模型的權(quán)重,常常采用以下2種核函數(shù):
1) Gauss[16]核
2) Epanechnikov[16]核
(1)
估計(jì)出的模糊輸出的隸屬函數(shù)應(yīng)該盡可能接近相應(yīng)觀察到的模糊數(shù)的隸屬函數(shù).從這點(diǎn)出發(fā),采用模糊數(shù)之間的距離測度來間接地表示模糊輸出的估計(jì)值與實(shí)際觀測值的差異.
(2)
式(2)等價(jià)于
(3)
為了方便推導(dǎo)將其轉(zhuǎn)化成為矩陣的形式,
(4)
式中:
式(4)L()對未知參數(shù)求導(dǎo),令其為0,得到在x0鄰域內(nèi)的估計(jì)值為
則3組待估參數(shù)(c(x0),c′(x0)),(l(x0),l′(x0)),(r(x0),r′(x0))的估計(jì)值可以表示為
令
H(x0;h)=(XT(x0)W(x0;h)X(x0))-1XT(x0)W(x0;h).
(6)
為了推導(dǎo)方便,將式(6)轉(zhuǎn)化成矩陣形式
式中:
則有
式中D=eTH(X;h).
(7)
式中:P=tTDt+tTDTt-tTt-tTDTDt;S=tTDT+tTD-tTDTD-tT.
同理,令x0分別為設(shè)計(jì)點(diǎn)x1,x2,…,xn,就可以得到各點(diǎn)處模糊光滑函數(shù)估計(jì)值.
在經(jīng)典的統(tǒng)計(jì)問題中,常用來確認(rèn)帶寬h的方法有廣義交叉驗(yàn)證GCV[17],風(fēng)險(xiǎn)估計(jì)[18],Bootstrap[19]等,在本文中采用模糊環(huán)境下的留一交叉驗(yàn)證方法.
模糊回歸問題中模糊非參項(xiàng)擬合程度的度量采用GOF和BIAS 2種方法[20]:
二者的值越小,代表模糊非參項(xiàng)的擬合效果越好.RBIAS相對于RGOF的取值要更加精確,因?yàn)樗簧婕暗搅四:菂㈨?xiàng),但是此方法只適用于模擬的情況下.
為了評價(jià)本文模型整體的擬合情況,給出幾種評測模型擬合度的指標(biāo)[20].
1) 均方誤差(MSEe):
2) 平均百分比誤差(MPEe):
3) 平均絕對百分比誤差(MAPEe):
4) 對稱平均絕對百分比誤差(SMAPEe):
這4種擬合度的指標(biāo)都是關(guān)于模型整體擬合程度的一種測量,通過計(jì)算模糊響應(yīng)變量的估計(jì)值與其觀測值之間的差別來度量整體的擬合程度.
假設(shè)模型中含有3個(gè)解釋變量t1,t2,x.
所估計(jì)的模糊光滑函數(shù)應(yīng)該盡可能地接近上述函數(shù).
一共產(chǎn)生25 組樣本數(shù)據(jù),響應(yīng)變量的數(shù)據(jù)構(gòu)造形式為
yi=g(xi)+1.103 1ti1+0.321 5ti2+rand[-0.5,0.5].
rand[a,b]為在(a,b)區(qū)間上的隨機(jī)數(shù).
本文為了方便構(gòu)造樣本數(shù)據(jù),假設(shè)模糊輸出為對稱的三角模糊數(shù),表現(xiàn)形式為(yi,yi-σi,yi+σi)T,其中
σi代表的是觀測值的左右擴(kuò)散,這樣形成的25組具有精確輸入模糊輸出的樣本數(shù)據(jù)如表1所示.
表1 模糊樣本數(shù)據(jù)Table 1 Data of Fuzzy samples
為了評測本文的估計(jì)方法,對25組樣本數(shù)據(jù)的擬合度,給出評判標(biāo)準(zhǔn)的計(jì)算結(jié)果如表2所示.
表2 擬合度的計(jì)算結(jié)果Table 2 Calculation results of goodness of fit
由表2可見,本文所提出的模型以及兩步估計(jì)的參數(shù)估計(jì)方法對模型的擬合程度是比較高的.
本文將經(jīng)典的半?yún)⒉糠志€性模型推廣到了具有精確輸入、模糊系數(shù)、模糊光滑函數(shù)、模糊輸出的模糊環(huán)境下的模糊半?yún)⒉糠志€性模型.運(yùn)用2步估計(jì)法對模糊光滑函數(shù)以及模糊參數(shù)進(jìn)行估計(jì),為此在模糊環(huán)境中采用了局部線性光滑技術(shù)對模糊光滑函數(shù)進(jìn)行估計(jì),有效避免了邊緣效應(yīng)的產(chǎn)生;采用基于歐氏距離下的模糊最小二乘方法對模糊系數(shù)進(jìn)行估計(jì).基于以上的2步估計(jì)法,成功地推導(dǎo)出模糊光滑函數(shù)及模糊系數(shù)的顯性表達(dá)式.采用交叉驗(yàn)證的方法選擇最佳帶寬,運(yùn)用的核函數(shù)及模糊距離公式在模擬數(shù)據(jù)集上得到了較好的回歸結(jié)果.本文提出了評判模型擬合優(yōu)度的一些標(biāo)準(zhǔn),模擬分析的結(jié)果表明該模型在仿真研究基礎(chǔ)上是可靠的,因此為實(shí)際研究的發(fā)展提供了更加靈活的模型.