楊世娟,盧維學(xué),方輝平(黃山學(xué)院 數(shù)學(xué)與統(tǒng)計學(xué)院,安徽黃山245041)
灰色系統(tǒng)與BP神經(jīng)網(wǎng)絡(luò)組合模型及其應(yīng)用
楊世娟,盧維學(xué),方輝平
(黃山學(xué)院 數(shù)學(xué)與統(tǒng)計學(xué)院,安徽黃山245041)
影響財政收入的因素有很多,各因素之間信息重疊的現(xiàn)象較嚴(yán)重,文章通過逐步回歸選擇了影響財政收入的幾個顯著因素。又鑒于灰色系統(tǒng)對小樣本數(shù)據(jù)預(yù)測的優(yōu)良特性,對每個選定的影響因素建立灰色預(yù)測GM(1,1)模型,得到各因素2015年、2016年的預(yù)測值。運用BP神經(jīng)網(wǎng)絡(luò)模型對1995—2014年數(shù)據(jù)進行訓(xùn)練,將灰色預(yù)測得到的預(yù)測值代入訓(xùn)練好的網(wǎng)絡(luò)中,預(yù)測出2015年、2016年的安徽省的財政收入。
逐步回歸;灰色預(yù)測GM(1,1);BP神經(jīng)網(wǎng)絡(luò)模型
財政收入的有效預(yù)測是加強宏觀經(jīng)濟管理和提高決策水平的前提與基礎(chǔ)。且財政收入會受一般收入、政府性基金收入、經(jīng)濟發(fā)展?fàn)顩r、政府的相關(guān)政策以及征收管理等眾多因素的影響,因此要想科學(xué)有效地預(yù)測財政收入,就必須綜合考慮各種影響因素,建立科學(xué)的預(yù)測體系。
鑒于灰色模型在小樣本量數(shù)據(jù)預(yù)測中的優(yōu)勢,本文采用灰色預(yù)測模型對樣本的數(shù)量進行擴張,再基于BP神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)進行訓(xùn)練、測試,預(yù)測出2015年、2016年的安徽省的財政收入,以供相應(yīng)部門進行分析、決策。
1.1 灰色GM(1,1)模型
GM(1,1)具體步驟如下:
(1)累加生成
將原始數(shù)據(jù)X(0)=(x(0)(1),x(0)(2),…,x(0)(n))通過一階累加生成得到新的序列:
X(1)=(x(1)(1),x(1)(2),…,x(1)(n)),其中,
(2)灰導(dǎo)數(shù)與近鄰均值生成序列
x(1)的灰導(dǎo)數(shù)為:
定義近鄰均值生成序列:
(3)建立灰微分方程
一階累加生成序列X(1)具有指數(shù)增長規(guī)律,滿足微分方程:
其中,a與b為常數(shù)。
得到(2)式的解為:
(4)解白化微分方程
相對于灰微分方程,稱(1)式為白化微分方程,其解得結(jié)構(gòu)如下:
還原后的序列值為:
1.2 BP神經(jīng)網(wǎng)絡(luò)模型
設(shè)BP網(wǎng)絡(luò)輸入層m個神經(jīng)元,輸出層n個神經(jīng)元,隱層有p個神經(jīng)元,輸入層節(jié)點記為d(i),i=1,2,…,m,隱層節(jié)點為d(j),j=1,2,…,p,輸出層節(jié)點為d(k),j=1,2,…,n。xi為d(i)的輸入值或輸出值,Hj、hj;Yk,yk分別為d(j)、d(k)的輸入或者輸出,y*k為d(k)的期望輸出。d(i),d(j)、d(j),d(k)之間的連接權(quán)分別記作ωij、ωjk。對于網(wǎng)絡(luò)隱層,有:
對于網(wǎng)絡(luò)輸出層,有
對此采用tan-sigmoid函數(shù)作為BP算法的的轉(zhuǎn)換函數(shù),其特點是將(-∞,+∞)的輸入分別映射到區(qū)間(-1, 1),其中的輸入與輸出的關(guān)系正好可以反映單個神經(jīng)元的響應(yīng)特性,可以有效減少隱層的節(jié)點數(shù)、加快收斂速度和提高收斂精度。
2.1 灰色預(yù)測模型
灰色預(yù)測模型精度的檢驗一般有三種不同的方法,即殘差檢驗、關(guān)聯(lián)度檢驗和后驗差檢驗,對此運用殘差檢驗。
計算原始數(shù)列 x(0)(k)與模型計算值 x^(0)(k)的殘差δ(0)(k)和相對誤差M(0)(k),殘差δ(0)(k)=x(0)(k)-x^(0)(k),相對誤差M(0)(k)=δ(0)(k)/x(0)(k),一般認(rèn)為M(0)(k)<0.2時,模型殘差檢驗是合格的。
2.2 BP神經(jīng)網(wǎng)絡(luò)模型
BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練后的實際輸出值與期望值直接的誤差E定義如下:
從(10)式知,調(diào)整權(quán)值可以改變誤差E,調(diào)整權(quán)數(shù)的目的是使誤差不斷減小,則有:Δwjk=-η?E/?wjk,Δwij=-η?E/?wij其中η∈(0,1)為反映學(xué)習(xí)速率的常數(shù)。
3.1 數(shù)據(jù)與指標(biāo)選擇
從1994年開始,我國的財政體制發(fā)生了重大改革,開始實行分稅制財政體制,影響了財政收入數(shù)據(jù)的一致性,由此1994年前后的數(shù)據(jù)是有差異的,而且沒有找到合適的方法對前后數(shù)據(jù)進行量度統(tǒng)一,對此選擇安徽省1995—2014年數(shù)據(jù)。
影響財政收入的因素有很多,在諸多學(xué)者研究的基礎(chǔ)上,初步選取以下變量為影響因素:稅收收入X1、非稅收收入X2、地區(qū)生產(chǎn)總值X3、第一產(chǎn)業(yè)生產(chǎn)總值X4、第二產(chǎn)業(yè)生產(chǎn)總值X5、第三產(chǎn)業(yè)生產(chǎn)總值X6、全社會固定資產(chǎn)投資X7、就業(yè)人數(shù)X8、居民消費水平X9、城鎮(zhèn)居民人均可支配收入X10。
(1)相關(guān)分析
在定量數(shù)據(jù)預(yù)測過程中,相關(guān)系數(shù)可以用來描述變量之間的關(guān)系,可以初步判斷因變量與各個解釋變量之間的線性關(guān)系是否存在。如表1所示。
表1 財政收入及影響因子之間的相關(guān)系數(shù)
由表1發(fā)現(xiàn),各變量與財政收入線性關(guān)系顯著,且呈現(xiàn)高度正相關(guān)關(guān)系,即所有變量暫時保留。由于各個影響因素之間都是高度相關(guān),違背了回歸分析的基本假設(shè),會導(dǎo)致一系列的錯誤,模型不通過。對此下面進行逐步回歸進行變量選擇。
(2)基于逐步回歸的變量選取
自變量的選擇涉及的計算量比較大,且過程繁瑣,利用逐步回歸法建立不同的模型,依據(jù)每個回歸系數(shù)的 p值,逐個剔除不顯著變量,直到模型中的指標(biāo)變量都是影響預(yù)測對象的顯著因素為止。經(jīng)過檢驗,通過檢驗的模型結(jié)果如表2所示。
表2 財政收入與各個影響因素的逐步回歸結(jié)果
由表2的結(jié)論,在逐步回歸過程中,變量X2、X3、X6、X7、X8、X9、X10被剔除,綜上,預(yù)測模型的變量選擇為X1、X4、X5。
(3)灰色預(yù)測模型
基于灰色預(yù)測模型理論,分別構(gòu)建變量X1、X4、X5的預(yù)測模型。以X1為例,有:
利用該模型,可得出原序列擬合值,通過檢驗發(fā)現(xiàn)它們的殘差值均比較小,說明模型的精度較高。在此基礎(chǔ)上分別對2015年與2016年的變量X1、X4、X5進行預(yù)測,預(yù)測值與擬合圖如表3和圖1所示。
表3 各變量2015年與2016年預(yù)測值
圖1 X1、X4、X5預(yù)測值與真實值對比圖
3.2 BP神經(jīng)網(wǎng)絡(luò)模型
由于BP神經(jīng)網(wǎng)絡(luò)可以任意逼近非線性函數(shù)的特性,可以用來作經(jīng)濟預(yù)測,下面就以財政收入作為研究數(shù)據(jù),預(yù)測2015年、2016年的值。
(1)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)
由于影響財政收入的指標(biāo)為X1、X4、X5三個,預(yù)測指標(biāo)為財政收入一個,故選擇輸入節(jié)點為3,輸出節(jié)點為1。節(jié)點的作用函數(shù)選取Sigmoid型函數(shù),模型采用三層網(wǎng)絡(luò)模型,其中隱層神經(jīng)元12個,輸出神經(jīng)元4個。
(2)數(shù)據(jù)處理
將原序列數(shù)據(jù)分成兩組,前組數(shù)據(jù)用來訓(xùn)練,后組數(shù)據(jù)用來檢驗。但是為了使網(wǎng)絡(luò)權(quán)值都在[-1,1]之間,首先,必須把輸入數(shù)據(jù)進行規(guī)一化處理,歸一化公式為:其中xmax,xmin分別為原序列中的最大、最小值。
(3)網(wǎng)絡(luò)訓(xùn)練
通過計算機編程不斷的模擬,得出最佳的模型設(shè)置。選擇自適應(yīng)調(diào)整學(xué)習(xí)速率附加動量因子梯度下降反向傳播算法訓(xùn)練函數(shù),設(shè)置最大訓(xùn)練步數(shù)1000步,訓(xùn)練目標(biāo)最小誤差為0.001,學(xué)習(xí)速率0.05,訓(xùn)練效果顯示:經(jīng)過1000步的訓(xùn)練,網(wǎng)絡(luò)的均方誤差MSE=0.00833341小于0.01,達到了網(wǎng)絡(luò)的訓(xùn)練要求。且網(wǎng)絡(luò)的收斂速度是先下降,后又開始增加,之后一直速度平穩(wěn),這說明BP神經(jīng)網(wǎng)絡(luò)的中間層的神經(jīng)數(shù)目選擇非常合適。下面就采用該種設(shè)置的模型作為預(yù)測的網(wǎng)絡(luò)模型,對此通過訓(xùn)練給出財政收入2008—2014的預(yù)測值,并與真實值進行比較,如表4所示,并對其作圖(圖2)進行比較。
表4 真實值與預(yù)測值比較
圖2財政收入真實值與預(yù)測值對比
由表4發(fā)現(xiàn),各年份真實值與擬合值之間的誤差都比較小,可以說明模型精度較高,對此預(yù)測出2015年、2016年財政收入的值分別為32940164.15、37820068.38。
本文應(yīng)用了小樣本情景下預(yù)測效果優(yōu)良的灰色預(yù)測模型來擴充樣本容量,再采用BP神經(jīng)網(wǎng)絡(luò)給出各年份的擬合值,發(fā)現(xiàn)擬合效果較好,并對2015年、2016年的財政收入進行了預(yù)測。盡管上述模型對目標(biāo)值的預(yù)測效果不錯,也對每個影響指標(biāo)的預(yù)測值進行了合理的檢驗,但是否符合今后財政收入的實際還有待于實踐的檢驗。
[1]Liu S F,Forrest J.The Current Development Status on Grey System Theory[J].Journal of Grey System,2007,19(2).
[2]Guo B L,Guo L.A New APP Roaehto Visua lMotion Computation[J]. Joumal of Xidian University,1994,21(4).
[3]梅虎,朱金福,汪俠.基于灰色關(guān)聯(lián)分析的旅游景區(qū)顧客滿意度測評研究[J].旅游科學(xué),2005,19(5).
[4]陳秀蓮.泛珠三角國際旅游產(chǎn)業(yè)結(jié)構(gòu)實證分析——基于次區(qū)域理論和灰色關(guān)聯(lián)度的探討[J].國際經(jīng)貿(mào)探索,2007,23(7).
[5]洪涓,張楠.北京市旅游服務(wù)貿(mào)易發(fā)展影響因素灰色關(guān)聯(lián)分析[J].經(jīng)濟論壇,2008,(8).
[6]鄧聚龍.灰理論基礎(chǔ)[M].武漢:華中科技大學(xué)出版社,2002.
(責(zé)任編輯/易永生)
F222;C812
A
1002-6487(2016)24-0082-03
國家自然科學(xué)基金資助項目(11201088);安徽省高校優(yōu)秀青年人才重點項目(gxyqZD2016300);安徽省教育廳自然科學(xué)研究項目(KJHS2016B04);黃山學(xué)院自然科學(xué)研究項目(2015xkj004;2015xkj005)
楊世娟(1988—),女,安徽安慶人,助教,研究方向:應(yīng)用統(tǒng)計。
(通訊作者)盧維學(xué)(1989—),男,黑龍江依安人,助教,研究方向:數(shù)理統(tǒng)計。