李志鵬 李 薇 劉志杰,3
(1.貴州師范大學貴州省信息與計算科學重點實驗室,貴州 貴陽 550001;2.貴州省發(fā)展和改革委員會,貴州 貴陽 550001;3.貴州師范大學網絡與信息中心,貴州 貴陽 550001)
基于組合預測模型的產業(yè)總產值的預測研究
李志鵬1李 薇2劉志杰1,3
(1.貴州師范大學貴州省信息與計算科學重點實驗室,貴州 貴陽 550001;2.貴州省發(fā)展和改革委員會,貴州 貴陽 550001;3.貴州師范大學網絡與信息中心,貴州 貴陽 550001)
對于預測復雜的經濟數(shù)據來說,選取合適的預測模型將是提高預測精度的關鍵。本文采用灰色模型與回歸模型的組合預測模型對貴州省高技術產業(yè)總產值進行預測,利用了組合模型可以改善線性回歸模型中沒有考慮指數(shù)增長以及灰色模型中沒有考慮線性因素的不足,從而達到提高預測精度的目的。并進行了計算機數(shù)值仿真實驗表明了組合預測模型的有效性。
經濟數(shù)據;預測;組合預測模型
用數(shù)據挖掘的方法與模型對經濟數(shù)據中有趣知識[1]的挖掘是一項非常復雜的工作,但它卻可以為我們的政府、企業(yè)及有關行業(yè)把握未來的經濟發(fā)展趨勢、判斷各個行業(yè)的發(fā)展前景并制定發(fā)展目標及發(fā)展戰(zhàn)略等提供具有科學依據的指導。在二十世紀六十年代以來,世界經濟的飛速發(fā)展致使了國內外大量的學者對經濟預測進行了各方面的研究,提出了很多預測方法和模型[2],有定量和定性預測方法、線性和非線性的預測模型,以期達到預測經濟動態(tài)的目的。對于預測動態(tài)的影響因子較多的經濟數(shù)據來說,其預測的質量和其所用的數(shù)據以及預測采用的方式是密不可分的。而經濟數(shù)據具有很強的非線性性,各數(shù)據之間的相互影響關系沒有明確的表達式,且呈動態(tài)波動的發(fā)展趨勢。因此我們選擇什么樣的預測方法和模型來處理數(shù)據將是我們所要進行的預測的關鍵。本文所采用的線性組合預測模型[3,4]就是將不同的預測模型通過一定的方法進行組合,優(yōu)化兩種模型的不足[5],以期達到取長補短的目的,從而提高預測結果的準確性。并對貴州省高技術產業(yè)發(fā)展統(tǒng)計數(shù)據集進行知識挖掘,最后對此模型做出分析和模擬評估。
2.1 灰色預測模型
若有一原始數(shù)據序列樣本為x(0)={x(0)(1),x(0)(2)…x(0)(n)},定義其累加生成序列公式為x(1)(k)=∑ki=1x(0)(i)(k=1,2…n),經過累加生成的序列為{x(0)(1),x(0)(1)+x(0)(2)…x(0)(1)+x(0)(2)+…x(0)(n)},累加生成后的序列可以弱化原序列的隨機性。經累加后的數(shù)據序列通過下述式(1)一階微分方程的演化即可得到灰色預測模型[6]:
其中a稱為發(fā)展灰數(shù),u稱為內生控制灰數(shù)。
可以將式(1)轉化成為差分方程:
則有Y=Bb,根據微分方程的解的形式可以求得b=(BTB)-1BTY,將此值代入(1)式中得出灰色預測模型:
可求得還原值
其中k=0,1,2,…
2.2 線性回歸模型
對于一元的線性回歸模型其形式為y=β0+β1x+ε其中β0,β1是未知的真實回歸系數(shù),ε是誤差項,多元回歸模型是對一元回歸模型的擴展,其形式為:
將
(2)式簡化為Y=XB+ε,其中Y=y,X=[1,x1,x2,…xn],B=[β0,β1,β2,…βn]T。
若考慮一個容量為m組的數(shù)據集X1,X2,…Xm,則令Xi= [1,x1i,x2i,…xni],i=1,2…m。則有Y=[y1y2… ym]T,X為有m組數(shù)據的矩陣,B=[β0,β1,β2,…βn]T,ε=[ε1,ε2,…εm]T。ε是誤差項,對其做出如下假設[7]:ε是一個期望為零的隨機變量,ε的方差σ2是常數(shù)且與x1,x2,…xn的值無關,ε是一個正態(tài)隨機變量且是相互獨立的。根據上述誤差項假設可以推導出目標變量y的分布:
1)E(y)=E(β0+β1x1+β2x2+…+βnxn+ε)=E(β0)+E(β1x1)+ E(β2x2)+…+E(βnxn)+E(ε)=β0+β1x1+β2x2+…+βnxn即對于任意的x1,x2,…xn取值,擬合值y的均值落在擬合回歸線上。
2)對于任意的x1,x2,…xn取值,目標變量y的方差不變。
3)對于任意的x1,x2,…xn取值,目標變量y的值是相互獨立的且是一個正態(tài)隨機變量。
對于β0,β1,β2,…βn模型參數(shù),其真實值可通過最小二乘法來估計。設目標變量的觀察值為yi,經回歸模型求得的擬合值為y'i=xiB',令e=[ε1,ε2,…εm]T,殘差為觀察值與擬合值之差,記為ei=yi-y'i,則有e=Y-XB',可以求得eTe=(Y-XB')T(YXB')=YTY-2B'TXTY+B'TXTXB'。根據最小二乘法要求得一個使得YTY-2B'TXTY+B'TXTXB'最小的一個B',即求得一個使YTY-2B'TXTY+B'TXTXB'式中對B'求偏導為0時成立的一個B'的值,化簡偏導方程可得參數(shù)為B'=(XTX)-1XTY。
2.3 組合預測模型
自上個世紀中葉,Schmitt第一次用組合預測的方法對人口數(shù)量進行了預測以來,世界各國的科學家、學者紛紛對各模型的組合進行了大量的研究,提出了許多有效的組合方法和新的組合模型。組合預測模型的原理就是將不同的預測模型采用某種特定的方式將他們結合起來,以達到取長補短的目的,從而提高預測結果的準確性的目的。本文所采用的灰色模型與線性回歸模型的組合模型正是利用了這兩個模型的組合可以改善線性回歸模型以及灰色模型中所存在的不足并可以提高預測精度。
組合預測模型一般可以分為兩種類型:線性組合和非線性組合。各界學者對于線性組合預測模型是研究很多,其應用也較廣泛。建立線性組合預測模型的一個關鍵問題是對組合權重進行優(yōu)化,且組合預測模型的精度僅與組合權重有關[8],因此本文應該根據回歸預測模型以及灰色預測模型各自的特點,對組合權重進行選取,以期達到充分結合兩種模型的優(yōu)勢的目的。本文采用加權算術平均組合將灰色模型和回歸模型兩種預測模型的預測結果進行組合,從而得到新的組合預測模型。對兩種模型的線性組合預測模型的描述如下:
設某預測問題的實際值序列為Y(tt=1,2,…n),灰色預測模型與回歸預測模型的預測值分別為Y'1t、Y'(2tt=1,2,…n),加權系數(shù)記為ω1、ω2且滿足條件ω1+ω2=1和ω1,ω2≥0,將組合預測值記為Y('tt=1,2,…n),即要使得Y't對于預測值Y'1t、Y'2t越逼近越好。設加權算術平均組合預測模型的性能指標為:min Jt=∑2j=1ωj(Y't-Y'jt)2t=1,2,…n;令整理可得:Y't=ω1Y'1t+ω2Y'2tt=1,2,…n
模型中Y'1t、Y'2t都為預測之后的確定值,可以建立二次規(guī)劃模型來確定ω1、ω2,其中要符合以下幾條規(guī)則:min J't=∑2t=1(Yt-Y't)2、ω1+ω2=1、ω1,ω2≥0。
本文以貴州省高技術產業(yè)發(fā)展主要經濟指標發(fā)展數(shù)據來檢驗通過上述步驟建立的組合預測模型,分別利用回歸預測模型、灰色預測模型以及線性組合模型優(yōu)化兩個單項預測模型來進行預測。以2006-2010年的數(shù)據為基礎來預測2011-2013年的貴州省高技術產業(yè)總產值。貴州省高技術產業(yè)主要經濟指標數(shù)據表(部分)見表1。
表1 貴州省高技術產業(yè)主要經濟指標數(shù)據表(部分) 單位:萬元
3.1 灰色預測模型的實例建模
3.2 回歸預測模型的實例建模
將表1中的數(shù)據化為億元單位,利用上述的B'=(XTX)-1XTY公式求得多元回歸預測模型的參數(shù)。得到預測模型為:y=-7.3791+0.1121x1+2.8659x2+1.2584x3
3.3 組合預測模型的實例建模
根據上述組合預測模型y=ω1y1+ω2y2以及權重系數(shù)的求解方法和約束條件求得權重系數(shù)ω1,ω2為(0.0637,0.9363)則可得到組合預測模型為y=0.5793 y1+0.4207y2
利用上述的三個模型進行數(shù)據預測,結果見下表2,本文采用相對誤差百分比絕對值來作為評價指標。
表2 預測結果比較 單位:萬元
從表2中的結果可以看出本文提出的線性組合模型對于優(yōu)化灰色模型與回歸模型的單項預測方法起到了積極的作用,組合預測模型的預測結果較任一單項模型的預測結果在精度上有了明顯改善。
任一單項的預測模型在某個特定的預測數(shù)據集上都有其優(yōu)勢,也存在一定的局限性[9],灰色預測模型主要適用于單一的指數(shù)增長數(shù)序列,對其中出現(xiàn)的數(shù)據突變及異常的情況并不能作出很好的處理;回歸模型是早期的發(fā)展的比較成熟的理論,它根據數(shù)據序列本身的連續(xù)性、相關性以及規(guī)律性等,在各影響因素相對平穩(wěn)的情況下進行的預測,卻考慮不到指數(shù)增長趨勢,對長期的數(shù)據預測往往效果不理想。二者的組合模型綜合了二個單項預測的優(yōu)勢,取長補短改善了改善線性回歸模型中并不能顧及的指數(shù)增長以及灰色模型中沒有線性因素的不足。本文采用灰色預測與回歸預測的組合模型對貴州省高技術產業(yè)的總產值進行了預測,實例預測數(shù)據表明:二者的組合預測明顯優(yōu)于單獨的預測模型的預測精度,在預測高技術產業(yè)發(fā)展總產值方面有實際的應用意義。
[1]Jiawei Han,Micheline Kamber.數(shù)據挖掘:概念與技術.范明,孟小峰譯[M].北京:機械工業(yè)出版社,2012.
[2]唐小我.預測理論及其應用[M].成都:電子科技大學出版社,1992.
[3]Bates.J.M,Granger.C.W.J.The Combination of Forecasts.Operations Research Quarterly,1969, 20(4):451-468.
[4]甘健勝,陳國龍.線性組合預測模型及其應用[J].計算機科學,2006, 33(9):191-194.
[5]Bann.D.W.Forecasting with More than one Model.Journal of Forecasting.1989,8(3):161-166.
[6]鄧聚龍.灰色系統(tǒng)經濟與社會[M].北京:國防工業(yè)出版社,1985.
[7]Daniel T.Larose.數(shù)據挖掘方法與模型.劉燕權,胡塞全,馮新平等譯[M].北京:高等教育出版社,2011.
[8]馬永開,唐小我.線性組合預測模型優(yōu)化問題研究[J].系統(tǒng)工程理論與實踐,1998,18(9):110-114.
[9]許秀莉,羅鍵.一種新的組合灰色神經網絡預測模型[J].廈門大學學報,2002,41(2):164-167.
Industrial Output Prediction Research Based on Combination Forecasting Model
Li Zhipeng1Li Wei2Liu Zhijie1,3
(1.Key Laboratory of Information and Computing Science of Guizhou Province,Guizhou Normal University,Guiyang 550001,Guizhou; 2.Guizhou Province Development and Reform Commission,Guiyang 550001,Guizhou; 3.Network and Information Center of Guizhou Normal University,Guiyang 550001,Guizhou)
act】For predicting complex economic data,selecting suitable prediction model is the key to improve the prediction accuracy.This paper uses the combination of grey model and regression model to predict the high technology industry output in Guizhou. Taking the advantages of this combination model can improve the linear regression model by considering the exponential growth and improve the grey model by considering the linear factor,so as to achieve the goal of improving the prediction accuracy.And the computer numerical simulation results show the effectiveness of the combination forecasting model.
economic data;prediction;combination forecasting model
TP39
A
:1008-6609(2015)03-0062-03
李志鵬,男,湖南雙峰人,碩士研究生,研究方向:計算機應用。
基于U-系列標準的電子政務應用解決方案,項目編號:2011BAH14B04。