繆燕子 王志銘 李守軍 代 偉
灰色預測模型(Grey model,GM)是灰色系統(tǒng)理論的基礎(chǔ)和核心內(nèi)容,其研究重點在于解決小樣本、貧信息的不確定性問題,且灰色預測模型在眾多領(lǐng)域都得到了廣泛的運用[1].GM(1,1)模型是灰色預測的核心內(nèi)容,是最簡單、應用最廣泛的單變量灰色預測模型.但GM(1,1)模型只包含一個因變量,不考慮外部其他因素對系統(tǒng)發(fā)展的影響,大量研究表明GM(1,1)模型的性能不夠穩(wěn)定,模擬精度不理想[2-5].因此提出了一種具有一個因變量和N-1個相關(guān)因素變量的多維灰色預測GM(1,N)模型[6].但傳統(tǒng)的GM(1,N)模型由于背景值表達式構(gòu)造的不精確,導致模型預測誤差較大,且當取N=1時,其不能轉(zhuǎn)化為對應的GM(1,1)模型,說明傳統(tǒng)的GM(1,N)與GM(1,1)模型在結(jié)構(gòu)上是不相容的[7].因此,在某些情況下GM(1,N)模型的預測精度甚至會低于GM(1,1)模型.在考慮多變量預測的同時,為了提高GM(1,N)模型的預測精度,國內(nèi)外學者針對模型的結(jié)構(gòu)、參數(shù)優(yōu)化、背景值的優(yōu)化等方面進行了相關(guān)研究分析[8-9].
針對背景值優(yōu)化的問題,主要有插值法和擬合法等改進措施.為提高預測精度,文獻[10] 通過Goldfeld-Quandt 檢驗區(qū)分GM(1,1)模型的異方差性,并采用插值法對背景值進行了優(yōu)化,以此最小化原始序列平方誤差之和的函數(shù)來構(gòu)建其模型;文獻[11]利用一次累加具有非齊次灰指數(shù)規(guī)律,構(gòu)建動態(tài)序列模型,從積分幾何意義的視角,利用函數(shù)逼近的思想,結(jié)合復化梯形公式改進模型背景值;文獻[12]提出了一種優(yōu)化背景值和調(diào)整初始系統(tǒng)參數(shù)的組合優(yōu)化方法,通過優(yōu)化灰色微分方程中的背景值來模擬和預測無偏指數(shù)分布的序列;文獻[13]提出一種尋找模型平均擬合誤差(ARPE)最小值的方法,采用粒子群優(yōu)化算法對模型背景值系數(shù)進行優(yōu)化,當ARPE 最小時的背景值系數(shù)取值即是模型的最優(yōu)解,但其優(yōu)化是針對傳統(tǒng)背景值表達式,在背景值表達式構(gòu)造上仍存在一定誤差.
針對模型結(jié)構(gòu)缺陷問題,主要有基于智能算法的結(jié)構(gòu)選擇及參數(shù)和結(jié)構(gòu)融合優(yōu)化等方法.文獻[14-16]對初始條件、累加生成順序、發(fā)展系數(shù)和背景值分布系數(shù)進行了參數(shù)優(yōu)化,研究結(jié)果表明上述參數(shù)的優(yōu)化對提高多維灰色預測模型的性能有積極的作用,但當N=1 時,GM(1,N)模型仍然不能等價于GM(1,1)模型,意味著這些改進的灰色預測模型在結(jié)構(gòu)相容性上仍存在缺陷;文獻[17] 提出了一種基于數(shù)據(jù)算法自適應選擇模型結(jié)構(gòu)的灰色預測模型,稱為離散灰色多項式模型,該模型具有代表最普遍的同構(gòu)和非同構(gòu)離散灰色模型的能力,并且可以歸納出一些其他新穎的模型,從而突出了模型與其結(jié)構(gòu)之間的關(guān)系;文獻[18]在模型中加入了相鄰變量滯后項、線性校正項和隨機擾動項,其中線性校正項反映了因變量和自變量之間的線性關(guān)系,消除了解釋變量之間的多重共線性問題,使模型的預測性能得到了顯著的提高.
基于現(xiàn)有的文獻我們發(fā)現(xiàn)傳統(tǒng)GM(1,N)、GM(1,1)模型在構(gòu)造背景值表達式時存在一定誤差,且模型結(jié)構(gòu)單一,從而導致模型預測精度不高,結(jié)構(gòu)相容性不強等問題.因此,本文對以上兩個問題進行了深入研究.
首先針對模型背景值的構(gòu)造方法不準確,考慮傳統(tǒng)模型背景值表達式固定用幾何梯形面積近似方程來表示,而現(xiàn)有文獻中的工作亦是基于該公式對參數(shù)進行優(yōu)化,未能從根本上減小誤差.本文從背景值函數(shù)表達式的幾何意義出發(fā),構(gòu)造了一個新的背景值表達式,并采用MATLAB 數(shù)值分析對背景值系數(shù)的取值進行優(yōu)化,使背景值系數(shù)的取值更靈活,減小了系統(tǒng)參數(shù)計算的誤差,進而提高模型的預測精度.其次針對模型結(jié)構(gòu)的缺陷,考慮傳統(tǒng)灰色預測模型結(jié)構(gòu)單一,結(jié)構(gòu)相容性弱,泛化性能差,雖然現(xiàn)有文獻中對各種系統(tǒng)參數(shù)及結(jié)構(gòu)參數(shù)有所改進,但仍不能使模型具有較好的結(jié)構(gòu)相容性.本文在預測模型中加入了灰色作用量,以反映自變量數(shù)據(jù)變換關(guān)系,改善了模型的結(jié)構(gòu)相容性,提高模型的泛化能力,使模型預測性能得到顯著提高.
本文所提的改進背景值及結(jié)構(gòu)相容性的多維灰色預測模型(Improved background value and structure compatibility of grey prediction model,IBSGM(1,N))解決了傳統(tǒng)多變量灰色預測模型預測性能不穩(wěn)定的問題,該模型結(jié)構(gòu)泛化能力強,魯棒性好,適用于大部分多變量灰色預測系統(tǒng).同時,本文突破了傳統(tǒng)的模型改進思想,有效解決了對系統(tǒng)參數(shù)優(yōu)化的同時使模型結(jié)構(gòu)泛化性提高的問題,對多維灰色預測模型的改進方法上提供了新的思路.
灰色預測方法是一種用來對灰色系統(tǒng)進行預測的方法.通過對系統(tǒng)因素發(fā)展趨勢之間的相關(guān)性分析,生成和處理原始數(shù)據(jù),以找出系統(tǒng)的變化規(guī)律,生成一組有更明顯規(guī)律的數(shù)據(jù)序列,并基于該數(shù)據(jù)序列建立微分方程模型,對事物的未來發(fā)展狀態(tài)進行預測.
單變量GM(1,1)預測模型的基本原理是:對某一數(shù)據(jù)序列使用累加的方法生成一組變化趨勢明顯的新序列,對新的數(shù)據(jù)序列建立模型并進行預測,然后利用累減方法逆向計算,使其恢復為原始序列,得出預測模型結(jié)果[19].
多變量GM(1,N)預測模型的預測原理與單變量GM(1,1)預測模型類似,不同之處在于輸入數(shù)據(jù)變量是N個.
GM(1,N)模型的建模過程如下:
設(shè)系統(tǒng)有特征數(shù)據(jù)序列:
為簡化建模過程,傳統(tǒng)GM(1,N)預測模型的背景值表達式固定為幾何面積近似方程,致使模型參數(shù)估計產(chǎn)生誤差;其次,模型結(jié)構(gòu)單一,泛化性能不強,導致模型預測魯棒性較差.因此,本文從改進背景值表達式及模型結(jié)構(gòu)方面入手,提出一種新的多維灰色預測模型.
根據(jù)對構(gòu)建灰色GM(1,N)預測模型的研究發(fā)現(xiàn),參數(shù)a和b是影響模型預測精度的重要因素,而a和b的取值取決于背景值的參數(shù)估計公式,因此,提高背景值表達式構(gòu)造的準確性,將直接提高模型的預測精度.
稱Z(1)={Z(1)(2),Z(1)(3),···,Z(1)(n)} 為序列改進后的背景值序列,式(3)為改進的背景值表達式,其中參數(shù)λ為背景值函數(shù)的調(diào)節(jié)因子,稱為背景值系數(shù),且背景值系數(shù)的選取將會直接影響系統(tǒng)參數(shù)a和b的計算值,進而影響模型預測性能.
定理 1.對于給定的原始數(shù)據(jù)序列,定義1所給的優(yōu)化背景值表達式(3)存在的誤差小于傳統(tǒng)背景值表達式存在的誤差.即
圖1 背景值幾何示意圖1Fig.1 Schematic diagram 1 of the background value
圖2 背景值幾何示意圖2Fig.2 Schematic diagram 2 of the background value
定理 2.對于定義2 中的IBSGM(1,N)模型,時間響應函數(shù)為
在灰色系統(tǒng)理論中,有許多常見的單變量或多變量預測模型,如GM(1,1)、GM(1,N),不同的模型具有不同的結(jié)構(gòu)和表達式,其對應的適用場景也有所差異.從傳統(tǒng)GM(1,N)預測模型表達式中不難看出,當N=1 時,該模型并不能等價于GM(1,1)預測模型,因此,GM(1,N)與GM(1,1)模型結(jié)構(gòu)不相容,即傳統(tǒng)GM(1,N)模型泛化能力弱,適用性較差.而本文所提出的IBSGM(1,N)模型在滿足一定條件時可以等價為傳統(tǒng)GM(1,1)、GM(1,N)模型,具有較好的結(jié)構(gòu)相容性.
命題 1.對于所提出的IBSGM(1,N)模型與傳統(tǒng)的GM(1,1)模型,不考慮對背景值所做的優(yōu)化改進,當N=1,a·b·γ0 時,IBSGM(1,N)模型即為GM(1,1)模型.
證明.對于所提IBSGM(1,N)模型,當N=1,a·b·γ0時,式(23)變?yōu)?/p>
根據(jù)定義1 提出的改進背景值表達式:
IBSGM(1,N)模型表達式可寫為:
顯然,式(34)即為GM(1,1)模型表達式,也就是說當N=1,a·b·γ0 時,不考慮對背景值所做的優(yōu)化改進,IBSGM(1,N)模型可以等價為GM(1,1)模型,稱其與GM(1,1)模型具有結(jié)構(gòu)相容性.□
命題 2.對于所提出的IBSGM(1,N)模型與傳統(tǒng)的GM(1,N)模型,不考慮對背景值所做的優(yōu)化改進,當N>1,a·b0,γ=0 時,IBSGM(1,N)模型即為GM(1,N)模型.
證明.對于IBSGM(1,N)預測模型,當N>1,a·b0,γ=0 時,式(23)變?yōu)?/p>
根據(jù)定義1 提出的改進背景值表達式:
IBSGM(1,N)模型表達式可寫為:
顯然,式(37)即為GM(1,N)模型表達式,也就是說當N>1,a·b0,γ=0 時,不考慮背景值所做的優(yōu)化改進,IBSGM(1,N)模型可以等價為GM(1,N)模型,稱其與原GM(1,N)模型具有結(jié)構(gòu)相容性.
為了確定背景值系數(shù)的取值,采用MATLAB對多維灰色預測模型進行數(shù)值分析,通過窮舉法計算在不同λ取值下IBSGM(1,N)模型的平均擬合誤差ε,使ε達到最小值時的λ取值即為改進多維灰色預測模型的最優(yōu)背景值系數(shù).
具體步驟如下:
步驟 1.輸入原始特征序列及相關(guān)因素序列在MATLAB 中建立IBSGM(1,N)預測模型;
步驟 2.初始化背景值系數(shù)λ=0;
步驟 3.λ以步長0.01 增加至1 迭代計算模型平均擬合誤差ε;
由定理2 可得一次累加序列模擬值:
步驟 4.求得使平均擬合誤差ε取得最小值時的λ值即為IBSGM(1,N)預測模型的最優(yōu)背景值系數(shù)解.
表1 寸草塔煤礦日均瓦斯?jié)舛燃坝绊懸蛩豑able 1 Daily average gas concentration and influencing factors in Cuncaota Coal Mine
利用MATLAB 仿真實驗,當λ∈[0,1] 時,λ從0 開始以0.01 的精度逐漸增大,求得模型擬合誤差最小值?=0.0337,此時λ=1.由此可得,在該組實驗數(shù)據(jù)下,當背景值系數(shù)λ=1 時,模型擬合誤差最小、預測精度最高,且IBSGM(1,N)模型擬合誤差為3.37%,較傳統(tǒng)GM(1,N)預測模型擬合精度有顯著提高.IBSGM(1,N)與GM(1,N)模型預測模擬值對比見表2.
表2 IBSGM(1,N)與GM(1,N)模型預測模擬值誤差對比Table 2 Comparison of prediction and simulation errors between IBSGM(1,N)and GM(1,N)model
為了檢驗所提出的IBSGM(1,N)模型的性能,本文進行了三個實例研究,計算了IBSGM(1,N)多維灰色預測模型分別在三組實驗數(shù)據(jù)下的模擬值和預測結(jié)果誤差,并與其他常用的單變量和多變量灰色預測模型的擬合情況及預測性能進行了對比分析.
例 1.文獻[22]提出了一種可以構(gòu)造出自變量與因變量之間函數(shù)關(guān)系預測模型,稱為OGM(1,N)預測模型,利用該模型對一種材料在400℉至1100℉溫度范圍內(nèi)的抗拉強度和布氏硬度的實驗數(shù)據(jù)進行了實驗,實驗數(shù)據(jù)如表3 所示,由于溫度條件的限制,該組樣本只有400℉至1100℉范圍內(nèi)的8 組數(shù)據(jù),具有小樣本數(shù)據(jù)集特征.本文采用同樣的數(shù)據(jù)比較了IBSGM(1,N)模型與其他灰色預測模型的模擬和預測性能.
表3 一種熱處理鋼在400℉至1100℉的抗拉強度及布氏硬度Table 3 The tensile strength and Brinell hardness of a heat-treated steel from 400°F to 1100°F
示例實驗數(shù)據(jù)中有三個變量,其中為特征序列抗拉強度(MPa),相關(guān)因素序列為布氏硬度(HBW),為溫度(℉).取前七組數(shù)據(jù)作為建模樣本,第八組數(shù)據(jù)作為測試樣本,利用MATLAB建立的IBSGM(1,N)模型進行計算,得到模型參數(shù)值 [a,b1,b2,γ,λ]T結(jié)果如表4 所示,模型預測結(jié)果及誤差對比如表5 所示.
表4 IBSGM(1,N)模型的參數(shù)值Table 4 Parameter values of IBSGM(1,N)model
表5 四種模型下預測結(jié)果和誤差對比Table 5 Comparison of prediction results and errors under the four models
由表4 可以看出,針對該組數(shù)據(jù),IBSGM(1,N)模型平均擬合誤差為0.0573%,GM(1,1)模型擬合誤差小于1%,但預測誤差接近5%,GM(1,N)模型擬合及預測誤差較大,預測性能不穩(wěn)定.相較于傳統(tǒng)GM(1,1)和GM(1,N)灰色預測模型,IBSGM(1,N)模型的平均擬合誤差及預測結(jié)果相對誤差均要小得多,且相較于文獻[22]中提出的OGM(1,N)模型,IBSGM(1,N)模型的模擬及預測性能也更勝一籌.
四種模型的模擬預測結(jié)果如圖3 所示,可以看出IBSGM(1,N)模型實現(xiàn)了高精度預測,且GM(1,N)模型擬合性能較GM(1,1)更差,驗證了GM(1,N)模型缺陷分析的準確性,OGM(1,N) 與IBSGM(1,N)模型曲線均貼合實際值曲線,但IBSGM(1,N)模型的模擬和預測性能更好.
圖3 例1 中四種模型的模擬預測結(jié)果曲線圖Fig.3 Curves of simulated prediction results of the four models in Example 1
例 2.文獻[13]提出了一種改進動態(tài)背景值系數(shù)OBGM(1,N)模型,通過粒子群算法尋找系統(tǒng)相對誤差最小值以此求解背景值系數(shù),利用該模型對文獻[23]中給出的中國無線通信用戶人數(shù)和其他影響因素的數(shù)據(jù)進行了模擬預測,實驗數(shù)據(jù)如表6所示,該文獻只公布了2000 年至2010 年相關(guān)數(shù)據(jù),屬于小樣本數(shù)據(jù)集.本文采用同樣的數(shù)據(jù)比較了IBSGM(1,N)模型與其他灰色預測模型的模擬和預測性能.
表6 中國無線通信用戶數(shù)量和相關(guān)因素Table 6 Number of wireless communication users and related factors in China
表7 IBSGM(1,N)模型的參數(shù)值Table 7 Parameter values of IBSGM(1,N)model
由表8 可以看出,IBSGM(1,N)預測模型在該組實驗數(shù)據(jù)下的平均擬合誤差為0.25%,而傳統(tǒng)GM(1,N)模型的擬合誤差高達21.59%,相較于傳統(tǒng)GM(1,1)和GM(1,N)灰色預測模型,IBSGM(1,N)模型的平均擬合誤差及預測結(jié)果相對誤差均要小得多,且IBSGM(1,N)模型的模擬及預測性能比文獻[10]中的OBGM(1,N)模型性能更好.
表8 四種模型下預測結(jié)果和誤差對比Table 8 Comparison of prediction results and errors under the four models
四種模型的模擬預測結(jié)果如圖4 所示,可以看到在四種模型中IBSGM(1,N)預測模型具有最高的預測精度,與實際數(shù)據(jù)擬合度最高,擬合誤差明顯小于GM(1,N)與GM(1,1)模型,雖然OBGM(1,N)模型也取得了較高的精度,但IBSGM(1,N)模型由于背景值取值更加靈活,結(jié)構(gòu)相容性更強,預測性能更好.
圖4 例2 中四種模型的模擬預測結(jié)果曲線圖Fig.4 Curves of simulation prediction results of the four models in Example 2
例 3.文獻[24]提出了一種改進的多變量時滯GM(1,N)預測模型,利用該模型對浙江省經(jīng)濟總產(chǎn)值與固定資產(chǎn)投資額進行預測,實驗數(shù)據(jù)如表9所示,由于所用數(shù)據(jù)時《浙江省統(tǒng)計年鑒》只公布了2003~ 2011 年的固定資產(chǎn)投資額數(shù)據(jù),具有小樣本數(shù)據(jù)集特征.本文采用同樣的數(shù)據(jù)樣本比較了IBSGM(1,N)模型與其他灰色預測模型的模擬和預測性能.
表9 2003-2011 年浙江省經(jīng)濟總產(chǎn)值與固定資產(chǎn)投資額Table 9 2003-2011 Zhejiang province′s total economic output value and fixed asset investment
表10 IBSGM(1,N)模型的參數(shù)值Table 10 Parameter values of IBSGM(1,N)model
由表11 可以看出,IBSGM(1,N)模型在該組實驗數(shù)據(jù)下的平均擬合誤差為1.52%,而傳統(tǒng)GM(1,N)模型的擬合誤差高達11.01%,傳統(tǒng)GM(1,1)模型擬合誤差為2.22%,且相較于文獻[24]中提出的時滯GM(1,N)預測模型,本文所提出的IBSGM(1,N)預測模型在擬合效果及預測精度上都有更優(yōu)的表現(xiàn),對比三種模型的預測結(jié)果,IBSGM(1,N)模型的預測相對誤差為0.66%,實現(xiàn)了高精度預測.
表11 四種模型下預測結(jié)果和誤差對比Table 11 Comparison of prediction results and errors under the four models
四種模型的模擬預測結(jié)果如圖5 所示,可以看到在四種模型中IBSGM(1,N)預測模型具有最高的預測精度,與實際數(shù)據(jù)擬合度最高,擬合誤差明顯小于傳統(tǒng)的GM(1,N)、GM(1,1)預測模型及時滯GM(1,N)預測模型.分析實驗結(jié)果表明,IBSGM(1,N)模型由于背景值取值更加靈活,結(jié)構(gòu)相容性更強,使模型預測性能顯著提高.
現(xiàn)有的傳統(tǒng)GM(1,N)多維灰色預測模型在實際預測領(lǐng)域中應用并不廣泛,主要由于其背景值表達式的構(gòu)造存在較大誤差及模型結(jié)構(gòu)上存在缺陷.傳統(tǒng)灰色預測模型為簡化建模過程,其背景值表達式固定用幾何梯形面積近似方程來表示,本文從背景值函數(shù)的幾何意義出發(fā),構(gòu)造了一個新的背景值表達式,采用MATLAB 數(shù)值分析對背景值系數(shù)的取值進行優(yōu)化,并從理論上證明了新的背景值函數(shù)相較傳統(tǒng)模型背景值函數(shù)的誤差更小.考慮到傳統(tǒng)GM(1,N)預測模型在結(jié)構(gòu)上與GM(1,1)等基礎(chǔ)預測模型不兼容的問題,在模型中加入了灰色作用量,以反映自變量數(shù)據(jù)變換關(guān)系.通過理論證明,改進的IBSGM(1,N)模型具有與傳統(tǒng)單變量和多變量灰色預測模型的結(jié)構(gòu)相容性.本文通過對三個實驗案例的研究,計算了IBSGM(1,N)的模擬值和預測誤差,并與其他常見的灰色預測模型進行了對比分析,可以看出,由于本文所提IBSGM(1,N)模型背景值取值更加靈活,結(jié)構(gòu)相容性更強,使模型預測性能有顯著提高.
本文提出的結(jié)合背景值優(yōu)化與改進模型結(jié)構(gòu)相容性方法,在理論證明和實驗分析中均取得了較好的結(jié)果.本文在對多維灰色預測模型的改進方法上進行了創(chuàng)新,所提出的IBSGM(1,N)模型在預測精度和結(jié)構(gòu)相容性方面有較強的優(yōu)勢,適用于常規(guī)條件下的多變量灰色預測,為灰色預測模型提供了新的改進思路.在未來進一步的研究中可采用不同參數(shù)優(yōu)化及模型結(jié)構(gòu)改進方法相結(jié)合,針對不同應用環(huán)境選取最優(yōu)的預測模型.
在研究中發(fā)現(xiàn),對于文中實驗案例給出的三組數(shù)據(jù),IBSGM(1,N)模型的背景值系數(shù)取值僅取了0 和1,未作背景值系數(shù)取值的定性分析.因此,探究在更多不同實驗數(shù)據(jù)下,背景值系數(shù)的取值差異及規(guī)律是未來需要繼續(xù)展開的工作.