周德強(qiáng)
(長江大學(xué) 信息與數(shù)學(xué)學(xué)院,湖北 荊州 434023)
直接離散GM(1,1)模型參數(shù)估計(jì)的最小一乘法
周德強(qiáng)
(長江大學(xué) 信息與數(shù)學(xué)學(xué)院,湖北 荊州 434023)
研究表明直接離散GM(1,1)模型對(duì)嚴(yán)格服從非齊次指數(shù)規(guī)律的原始數(shù)據(jù)進(jìn)行建模,所得到的模型具有完全相同的指數(shù)規(guī)律,而當(dāng)數(shù)據(jù)為近似非齊次指數(shù)規(guī)律時(shí),直接離散GM(1,1)模型擬合效果較差。主要原因是直接離散GM(1,1)模型采用最小二乘法估計(jì)參數(shù),穩(wěn)健性不好造成的。針對(duì)這一情況,文章提出利用最小一乘法估計(jì)直接離散GM(1,1)模型參數(shù)改進(jìn)上述不足。對(duì)比實(shí)驗(yàn)表明,采用最小一乘法估計(jì)參數(shù)得到的直接離散GM(1,1)模型具有很好的精度和穩(wěn)健性,使得直接離散GM(1,1)模型的適用范圍得到進(jìn)一步擴(kuò)大。
直接離散GM(1,1)模型;參數(shù)估計(jì);最小一乘法;最小二乘法;線性規(guī)劃
GM(1,1)模型是灰色系統(tǒng)預(yù)測(cè)模型及拓展模型中的基礎(chǔ)和核心方法[1,2],應(yīng)用它的前提是要求原始數(shù)據(jù)序列符合或基本符合指數(shù)規(guī)律變化[3]。但許多文獻(xiàn)[4,5]研究表明當(dāng)利用GM(1,1)模型對(duì)純指數(shù)序列進(jìn)行擬合時(shí),在預(yù)測(cè)精度上有時(shí)仍不能取得滿意的擬合效果,對(duì)于傳統(tǒng)GM(1,1)中存在預(yù)測(cè)精度上的缺陷[6,7],文獻(xiàn)[2]分析了傳統(tǒng)灰色GM(1, 1)模型本身結(jié)構(gòu)上存在的問題,從離散到離散的觀點(diǎn),提出了DGM(1,1)模型,對(duì)GM(1,1)模型做出了實(shí)質(zhì)性的改進(jìn),用DGM(1,1)對(duì)純指數(shù)增長序列進(jìn)行預(yù)測(cè)模擬,結(jié)果完全符合增長規(guī)律。
但是實(shí)際生活中完全具有純齊次指數(shù)特征的數(shù)據(jù)是極少的,相對(duì)而言,更多的原始序列是更符合近似非齊次指數(shù)規(guī)律的序列[8,9]。針對(duì)齊次或者近似非齊次灰色指數(shù)序列的灰色建模,眾多學(xué)者做了相應(yīng)研究,其中文獻(xiàn)[8]提出的DGM(1,1)模型的直接建模法(直接離散GM(1, 1),針對(duì)小樣本下具有近似非齊次指數(shù)特點(diǎn)的序列,構(gòu)建了一種簡單的預(yù)測(cè)模型,能較好模擬原始序列的非齊次指數(shù)特征。
在利用灰色模型進(jìn)行預(yù)測(cè)時(shí),通常模型中參數(shù)估計(jì)的好壞會(huì)直接影響到模型的預(yù)測(cè)精度[10,11]。和傳統(tǒng)的GM(1, 1)模型類似,DDGM(1,1)模型仍采用的是最小二乘法進(jìn)行參數(shù)估計(jì),盡管最小二乘方法參數(shù)估計(jì)存在許多優(yōu)點(diǎn),但是其穩(wěn)健性較差,在模型求解中往往會(huì)造成嚴(yán)重的病態(tài)問題[12]。實(shí)驗(yàn)表明當(dāng)原始數(shù)據(jù)嚴(yán)格服從非齊次指數(shù)規(guī)律,DDGM(1, 1)建模法所得到的模型具有完全相同的指數(shù)規(guī)律,然而當(dāng)非齊次指數(shù)規(guī)律的數(shù)據(jù)含有奇異數(shù)據(jù),褪變?yōu)榻品驱R次指數(shù)規(guī)律時(shí),DDGM(1,1)模型擬合效果較差,這與DDGM (1,1)模型利用最小二乘法進(jìn)行參數(shù)估計(jì)的方法有很大關(guān)系。
因此,利用DDGM(1,1)模型對(duì)含有異常的數(shù)據(jù)進(jìn)行建模和參數(shù)估計(jì)時(shí),應(yīng)該盡量選擇較為穩(wěn)健的準(zhǔn)則以減少奇異數(shù)據(jù)對(duì)模型預(yù)測(cè)的影響[13]。最小一乘準(zhǔn)則受異常點(diǎn)的影響較小,穩(wěn)健性比最小二乘準(zhǔn)則的穩(wěn)健性好[14-17]。其次,最小二乘準(zhǔn)則需要假定數(shù)據(jù)分布服從正態(tài)分布,并且該方法基于殘差平方和最小尋優(yōu),很容易陷入局部最小,對(duì)于非線性較強(qiáng)的序列,應(yīng)用最小二乘法得到的結(jié)果會(huì)產(chǎn)生很大的偏差[18]。而最小一乘準(zhǔn)則對(duì)數(shù)據(jù)分布沒有嚴(yán)格要求,理論證明:對(duì)于誤差不服從正態(tài)性的問題中,最小一乘估計(jì)的統(tǒng)計(jì)性能優(yōu)于最小二乘估計(jì)[14]。
在對(duì)實(shí)際生活中符合近似非齊次指數(shù)規(guī)律的具有貧信息的序列進(jìn)行建模時(shí),由于所用數(shù)據(jù)不多,數(shù)據(jù)總體特征不夠明顯,往往還會(huì)含有異常數(shù)據(jù),針對(duì)傳統(tǒng)的DDGM( 1,1)模型參數(shù)估計(jì)方法上的缺陷,同時(shí)鑒于最小一乘法優(yōu)越的統(tǒng)計(jì)性能,本文將用最小一乘準(zhǔn)則對(duì)DGM(1,1)模型參數(shù)進(jìn)行估計(jì),求解模型時(shí),通過函數(shù)變換將優(yōu)化問題轉(zhuǎn)化為一個(gè)線性規(guī)劃問題[19],以克服最小二乘法容易陷入局部最小的問題。最后,用數(shù)據(jù)模擬仿真,通過對(duì)比分析證實(shí)了該方法的有效性。
1.1DDGM(1,1)建模法[8]
定義1:設(shè) X(0)=(x(0)(1),x(0)(2),···,x(0)(n))為一單調(diào)遞增序列,若對(duì)于:
①k=1,2…,n-1,x(0)(k)=ceak,c,a≠0,
則稱 X(0)為齊次指數(shù)序列。
②k=1,2…,n-1,x(0)(k)=ceak+b,c,a,b≠0,則稱X(0)為非齊次指數(shù)序列。
定義2:設(shè)序列X(0)=(x(0)(1),x(0)(2),···,x(0)(n)),稱:
為直接DGM(1,1),簡稱DDGM(1,1)模型。
則灰色微分方程(1)中參數(shù)的最小二乘估計(jì)為:
令:
則:
文獻(xiàn)[8]的研究表明,利用DDGM(1,1)建模法,對(duì)于原始數(shù)據(jù)序列嚴(yán)格服從非齊次指數(shù)規(guī)律時(shí),所得到的模型具有完全相同的指數(shù)規(guī)律。
1.2DDGM(1,1)建模法參數(shù)估計(jì)缺陷分析
DDGM(1,1)模型本質(zhì)上是用自回歸模型方法建立修正指數(shù)模型[8],由式(3)知該自回歸模型采用的是基于大樣本數(shù)據(jù)的最小二乘法估計(jì)參數(shù),即:
當(dāng)原始數(shù)據(jù)存在奇異數(shù)據(jù)時(shí),平方會(huì)放大奇異值對(duì)可信度的影響,導(dǎo)致DDGM(1,1)模型的預(yù)測(cè)效果不好[11]。雖然DDGM(1,1)建模法對(duì)嚴(yán)格服從非齊次指數(shù)規(guī)律的數(shù)據(jù)能夠完全擬合,但是,實(shí)際生活中完全具有純齊次指數(shù)特征的數(shù)據(jù)是極少的。同時(shí),DDGM(1,1)模型是針對(duì)小樣本建模的方法,當(dāng)收集的數(shù)據(jù)較少,并且數(shù)據(jù)中夾雜有異常點(diǎn)時(shí),用最小二乘準(zhǔn)則所得的結(jié)果就令人難以接受,在此情況下應(yīng)用所得到的回歸方程或模型進(jìn)行預(yù)測(cè)、擬合等,則預(yù)測(cè)或擬合的精度相當(dāng)?shù)?,甚至根本不能使用[15-17]。因此針對(duì)此種情況,利用DDGM(1,1)模型進(jìn)行預(yù)測(cè)時(shí),不宜用最小二乘法估計(jì)模型參數(shù)。
相對(duì)于傳統(tǒng)DDGM(1,1)模型,優(yōu)化問題(6)的目標(biāo)函數(shù)含有絕對(duì)值,因此引入變換[19]:
其中
uk≥0,vk≥0,代入式(7)得:
從而,估計(jì)DDGM(1,1)模型的參數(shù)歸結(jié)為如下線性規(guī)劃問題:
可利用單純形法求解上述線性規(guī)劃問題,得到基于最小一乘法準(zhǔn)則的最優(yōu)參數(shù)β1,β2。
為了驗(yàn)證基于最小一乘法估計(jì)DDGM(1,1)模型的可行性和有效性,以下模擬近似非齊次指數(shù)序列進(jìn)行驗(yàn)證。取兩組數(shù)據(jù)[20]:
上述數(shù)據(jù)為完全的非齊次指數(shù)序列。
將第一組數(shù)據(jù)的第三和第四個(gè)數(shù)據(jù)交換位置得到第二組數(shù)據(jù):
第二組數(shù)據(jù)相對(duì)第一組數(shù)據(jù)為有異常的近似非齊次指數(shù)序列。
首先驗(yàn)證兩種準(zhǔn)則下,DDGM(1,1)模型對(duì)完全的非齊次指數(shù)序列的擬合和預(yù)測(cè)情況。以前6個(gè)數(shù)據(jù)建模,最后一個(gè)數(shù)據(jù)作為預(yù)測(cè)值,利用DDGM(1,1)模型建模,分別采用最小二乘準(zhǔn)則和最小一乘準(zhǔn)則對(duì)模型參數(shù)進(jìn)行估計(jì)。對(duì)第一組數(shù)據(jù)有:
(1)最小二乘準(zhǔn)則
(2)最小一乘準(zhǔn)則
由于上述數(shù)據(jù)不存在異常,所以兩種準(zhǔn)則下估計(jì)的參數(shù)較為接近。根據(jù)兩個(gè)準(zhǔn)則得到模擬和預(yù)測(cè)結(jié)果見表1,表中結(jié)果表明,對(duì)于原始數(shù)據(jù)嚴(yán)格服從非齊次指數(shù)規(guī)律,建立DDGM(1,1)模型,使用兩種準(zhǔn)則估計(jì)參數(shù),排除計(jì)算誤差,所得到的模型均具有完全相同的指數(shù)規(guī)律。
表1 不同準(zhǔn)則下模擬計(jì)算結(jié)果比較
用第二組數(shù)據(jù)進(jìn)行最小一乘穩(wěn)健性的測(cè)試。仍然以前6個(gè)數(shù)據(jù)建模,最后一個(gè)數(shù)據(jù)作為預(yù)測(cè)值,利用DDGM (1,1)模型建模,分別采用最小二乘準(zhǔn)則和最小一乘準(zhǔn)則對(duì)模型參數(shù)進(jìn)行估計(jì)。
(1)最小二乘準(zhǔn)則
(2)最小一乘準(zhǔn)則
由以上結(jié)果可以看出,當(dāng)原始數(shù)據(jù)有異常時(shí),對(duì)于DDGM(1,1)模型,應(yīng)用最小二乘準(zhǔn)則所得到的參數(shù)系數(shù)與無異常點(diǎn)時(shí)差異甚大,而對(duì)最小一乘準(zhǔn)則,異常點(diǎn)的有無對(duì)求得的參數(shù)影響很小。根據(jù)兩個(gè)準(zhǔn)則得到模擬和預(yù)測(cè)的結(jié)果見表2,從表中數(shù)據(jù)可見,用最小二乘準(zhǔn)則所得的DDGM(1,1)模型進(jìn)行擬合和預(yù)測(cè)精度相當(dāng)差,模型已根本不能使用。而用最小一乘準(zhǔn)則所得的DDGM(1,1)模型進(jìn)行擬合和預(yù)測(cè),精度仍然很高,進(jìn)一步說明了最小一乘準(zhǔn)則能夠克服數(shù)據(jù)較少且存在異常點(diǎn)時(shí)最小二乘準(zhǔn)則出現(xiàn)的病態(tài)問題,穩(wěn)健性較好。
表2 不同準(zhǔn)則下模擬計(jì)算結(jié)果比較(含異常數(shù)據(jù))
圖1不同準(zhǔn)則下模擬結(jié)果
圖1顯示了對(duì)第二組數(shù)據(jù)利用DDGM(1,1)模型進(jìn)行建模,分別基于最小二乘法和最小一乘法估計(jì)DDGM(1,1)模型的參數(shù)得到的模型擬合和預(yù)測(cè)值。由圖像擬合情況可見,對(duì)于含有異常點(diǎn)的近似非齊次指數(shù)序列,基于最小一乘法估計(jì)DDGM(1,1)模型的參數(shù),效果遠(yuǎn)遠(yuǎn)好于最小二乘法。
兩組數(shù)據(jù)的實(shí)驗(yàn)結(jié)果充分表明,基于最小一乘法估計(jì)DDGM(1,1)模型的參數(shù)具有可行性和有效性。
最小二乘法具有良好的解析性,易于求解,使得該方法在DDGM(1,1)模型中成為普遍采用的參數(shù)估計(jì)方法。本文從分析最小二乘法對(duì)DDGM(1,1)模型參數(shù)估計(jì)容易造成的缺陷入手,提出基于最小一乘法估計(jì)DDGM(1,1)模型的參數(shù),理論上可以克服最小二乘法估計(jì)模型參數(shù)的缺陷,利用給出的線性規(guī)劃法使得基于最小一乘法估計(jì)DDGM(1,1)模型的參數(shù)在應(yīng)用中成為可能,實(shí)例表明基于最小一乘準(zhǔn)則估計(jì)DDGM(1,1)模型的參數(shù),DDGM(1,1)模型能更好地?cái)M合近似非齊次指數(shù)規(guī)律的數(shù)據(jù),有效擴(kuò)充了DDGM(1,1)模型的適用范圍。
[1]鄧聚龍.灰色系統(tǒng)理論教程[M].武漢:華中理工大學(xué)出版社,1990.
[2]謝乃明,劉思峰.離散GM(1,1)模型與灰色預(yù)測(cè)模型建模機(jī)理[J].系統(tǒng)工程理論與實(shí)踐,2005,(1).
[3]穆勇.無偏灰色GM(1,1)模型的直接建模法[J].系統(tǒng)工程與電子技術(shù),2003,25(9).
[4]羅黨,劉思峰,黨耀國.灰色模型GM(1,1)優(yōu)化[J].中國工程科學(xué), 2003,5(8).
[5]劉斌,劉思峰,翟振杰,黨耀國等.GM(1,1)模型時(shí)間響應(yīng)函數(shù)的最優(yōu)化[J].中國管理科學(xué),2003,11(4).
[6]何文章,宋國鄉(xiāng).基于遺傳算法估計(jì)灰色模型中的參數(shù)[J].系統(tǒng)工程學(xué)報(bào),2005,20(4).
[7]張大海,汪世芳,史開泉.灰色預(yù)測(cè)公式的理論缺陷及改進(jìn)[J].系統(tǒng)工程理論與實(shí)踐,2002,22(8).
[8]曾波.近似非齊次指數(shù)序列的DGM(1,1)直接建模法[J].系統(tǒng)工程理論與實(shí)踐,2011,31(2).
[9]崔杰,黨耀國,劉思峰.一種新的灰色預(yù)測(cè)模型及其建模機(jī)理[J].控制與決策,2009,24(11).
[10]鄭照寧,劉德順.基于遺傳算法的改進(jìn)GM(1,1)模型IGM(1,1)直接建模[J].系統(tǒng)工程理論與實(shí)踐,2003,23(5).
[11]何霞,劉衛(wèi)鋒.灰色GM(1,1)模型中參數(shù)估計(jì)的幾種方法比較[J].統(tǒng)計(jì)與決策,2011,(20).
[12]鄭照寧,武玉英,程小輝,包涵齡.灰色模型的病態(tài)性問題[J].系統(tǒng)工程理論方法應(yīng)用,2001,10(2).
[13]董建,謝開貴.基于最小一乘準(zhǔn)則的非線性回歸模型研究[J].重慶師范學(xué)院學(xué)報(bào)(自然科學(xué)版),2001,18(4).
[14]BATES D M.非線性回歸分析及其應(yīng)用[M].韋博成譯.北京:中國統(tǒng)計(jì)出版社,1997.
[15]謝開貴,何斌,楊萬年.組合預(yù)測(cè)權(quán)重系數(shù)的確定[J].預(yù)測(cè),1998,7 (7).
[16]董祺.“殘差絕對(duì)值和最小”準(zhǔn)則的松馳算法[J].預(yù)測(cè),1990,9(2).
[17]袁修貴.“殘差絕對(duì)值和最小”準(zhǔn)則的目標(biāo)規(guī)劃法[J].預(yù)測(cè),1994, 13(1).
[18]安德洪,韓文秀,岳毅宏.組合預(yù)測(cè)法的改進(jìn)及其在負(fù)荷預(yù)測(cè)中的應(yīng)用[J].系統(tǒng)工程與電子技術(shù),2006,26(6).
[19]楊桂元.殘差絕對(duì)值之和最小準(zhǔn)則下回歸方程的求解[J].運(yùn)籌與管理,2001,10(1).
[20]戰(zhàn)立青,施化吉.近似非齊次指數(shù)數(shù)據(jù)的灰色建模方法與模型[J].系統(tǒng)工程理論與實(shí)踐,2013,33(3).
(責(zé)任編輯/易永生)
O21
A
1002-6487(2016)22-0015-03
湖北省自然科學(xué)基金資助項(xiàng)目(2013CFA053);長江大學(xué)基礎(chǔ)學(xué)科研究發(fā)展基金資助項(xiàng)目(2014JCY002)
周德強(qiáng)(1974—),男,湖北襄陽人,碩士,副教授,研究方向:機(jī)器學(xué)習(xí)、模式識(shí)別、系統(tǒng)建模。