黃 浩,尹杰杰,王浩華
(海南大學(xué)信息科學(xué)技術(shù)學(xué)院,海南???70228)
隨著《國務(wù)院關(guān)于推進(jìn)海南國際旅游島建設(shè)發(fā)展的若干意見》的正式頒布,海南省正在全面啟動國際旅游島建設(shè)各項(xiàng)工作,其目標(biāo)是逐步將海南建成旅游國際化程度高、生態(tài)環(huán)境優(yōu)美、文化魅力獨(dú)特、社會文明祥和的開放之島、綠色之島、文明之島、和諧之島.海南國際旅游島建設(shè),不僅描繪出海南未來發(fā)展的藍(lán)圖,而且也為國內(nèi)外有志之士投資海南旅游建設(shè)創(chuàng)造了前所未有的良好契機(jī).海南的旅游資源極其豐富,如合理規(guī)劃、正確地預(yù)測預(yù)報旅游需求,對促進(jìn)本地區(qū)的經(jīng)濟(jì)發(fā)展和文化交流有著重要意義.旅游需求很大程度上由旅游人數(shù)來度量,如何準(zhǔn)確地預(yù)測旅游人數(shù)已成為決策部門的重要依據(jù).袁柳[2]、柏宏斌[3]等利用灰色理論對旅游人數(shù)進(jìn)行了預(yù)測,但是在灰色模型中沒有考慮季節(jié)性和周期性等相關(guān)因素的影響.涂雄苓[6]在結(jié)合季節(jié)性等相關(guān)因素影響下以桂林市為樣本,運(yùn)用時間序列分析方式對桂林市的旅游人口進(jìn)行了預(yù)測.本文在收集相關(guān)部門數(shù)據(jù)的基礎(chǔ)上,綜合考慮了旅游資源、環(huán)境、交通、費(fèi)用和服務(wù)質(zhì)量因素對旅游需求的影響,運(yùn)用時間序列分析法,建立了SARIMA(3,1,2)(1,1,1)12模型,并通過神經(jīng)網(wǎng)絡(luò)算法預(yù)測了海南省年旅游人數(shù),結(jié)果表明,預(yù)測值符合實(shí)際人數(shù).
1.1 建立多元線性回歸模型 在考慮旅游資源、環(huán)境、交通、費(fèi)用和服務(wù)質(zhì)量因素的影響時,筆者對其影響因素進(jìn)行了量化.在某一地區(qū)旅游資源一般變化不大,可以設(shè)為常數(shù)k.環(huán)境可用森林覆蓋率來表示;交通用旅客周轉(zhuǎn)量來表示;費(fèi)用用在海南旅游平均消費(fèi)來表示;服務(wù)質(zhì)量用第三產(chǎn)業(yè)來表示.在進(jìn)行年預(yù)測時,不用考慮季節(jié)對其影響,可建立多元線性回歸模型.通過數(shù)據(jù)的收集和整理得到表1(來源:海南省統(tǒng)計局[1]).
旅游資源是在對旅游需求進(jìn)行預(yù)測的決定性因素,但是由于每個地方的旅游資源在短期內(nèi)變化不大,因此,可以看作是常量.旅游資源用k來表示,建立的模型如下所示
其中,旅游人數(shù)為y,人均消費(fèi)為x1,第三產(chǎn)業(yè)為x2,旅客周轉(zhuǎn)量為x3,森林覆蓋率為x4.可建立一個多元線性回歸模型,將式(1)表示出來,即為
表1 2002—2011年海南省旅游各種統(tǒng)計數(shù)據(jù)
于是,對于某年海南省的旅游總?cè)藬?shù)的計算式應(yīng)為
根據(jù)Matlab計算,可得到該模型的回歸系數(shù)估計值以及置信區(qū)間(置信水平取0.005),檢驗(yàn)統(tǒng)計量為R2=0.998 4,F(xiàn)=780.233 1,P=0.000 0,結(jié)果如表2 所示 .
表2 統(tǒng)計量
于是,就得到多元線性回歸模型
多元線性回歸方程(2)反映了海南省的旅游資源、費(fèi)用、交通和服務(wù)質(zhì)量對當(dāng)年的旅游人數(shù)的影響.從模型中可以看出,旅游資源作為k隱含在各因素中,當(dāng)k發(fā)生變化時,每一項(xiàng)因素都會發(fā)生改變.
1.2 基于GM(1,1)和神經(jīng)網(wǎng)絡(luò)的旅游人數(shù)預(yù)測 由于來海南旅游的人數(shù)受到了旅游資源、費(fèi)用、交通和服務(wù)質(zhì)量等因素的影響,因此,在預(yù)測下一年的旅游人數(shù)時,就要考慮這些因素的影響.首先,根據(jù)已有的數(shù)據(jù),以及 GM(1,1)模型[2-3],分別將各因素在 2012 年的值預(yù)測出來,然后再通過神經(jīng)網(wǎng)絡(luò)[4-5],預(yù)測出2012年海南省旅游人數(shù).通過Matlab軟件計算得到表3.
表3 2012年海南省旅游各因素的預(yù)測值
運(yùn)用Matlab神經(jīng)網(wǎng)絡(luò)工具箱對2002—2011年海南省旅游的數(shù)據(jù)進(jìn)行仿真,得到圖1和圖2的結(jié)果.
從圖1和圖2可以看出,原始數(shù)據(jù)與仿真數(shù)據(jù)非常接近,誤差極小.借助Matlab求解程序,最后預(yù)測2012年海南省旅游人數(shù)為3 437.7萬人.
圖1 原始數(shù)據(jù)與仿真數(shù)據(jù)對比
圖2 網(wǎng)絡(luò)的學(xué)習(xí)曲線
1.3 建立SARIMA模型 多元線性回歸模型以及神經(jīng)網(wǎng)絡(luò)算法,反映了海南省的年旅游人數(shù)與各因素之間的關(guān)系,并且做出了預(yù)測,但是并不能反映出每個月的旅游人數(shù)變化.因此,不僅要對年旅游人數(shù)進(jìn)行預(yù)測,還要對月旅游人數(shù)進(jìn)行預(yù)測,這樣才能使得相關(guān)部門和單位為應(yīng)對旅游人數(shù)的變化提前做好準(zhǔn)備.本文通過建立SARIMA模型進(jìn)行預(yù)測,通過數(shù)據(jù)的收集和整理得到表4(來源:海南省統(tǒng)計局[1]).
表4 月旅游人數(shù) 萬人
圖3 原始數(shù)據(jù)圖
利用Matlab得到圖3,4,5和6.
圖4 取對數(shù)后的數(shù)據(jù)圖
圖5 對數(shù)、一階差分
圖6 對數(shù)、一階差分再季節(jié)差分
由圖3可知,數(shù)據(jù)呈明顯的非平穩(wěn)性和季節(jié)性,并伴隨一定的周期性波動.為了消除趨勢的影響,而且同時要求減少序列的波動,因此需對原序列y取對數(shù),并命名為ly.由圖4可見,序列依然不平穩(wěn),所以再將序列l(wèi)y做一階差分后命名為dly,然后做出圖像.由圖5可見,序列的趨勢已經(jīng)基本消除.圖7是序列dly的自相關(guān)(AC)與偏自相關(guān)(PAC)分析圖,其12倍數(shù)的滯后期,自相關(guān)系數(shù)與偏自相關(guān)系數(shù)的顯著性均為0,說明序列存在顯著的季節(jié)性,因此,需要再對序列dly做季節(jié)性差分,并得到序列sdly.由圖7可知,序列sdly已經(jīng)基本平穩(wěn),此時做出序列sdly的自相關(guān)(AC)與偏自相關(guān)(PAC)分析圖.由圖8可看出,序列sdly的自相關(guān)系數(shù)與偏自相關(guān)系數(shù)分別在3和2滯后數(shù)之后就迅速落入隨機(jī)區(qū)域,表明序列dly的季節(jié)性已經(jīng)基本消除[6].
圖7 序列dly的自相關(guān)(AC)與偏自相關(guān)(PAC)
圖8 序列sdly的自相關(guān)(AC)與偏自相關(guān)(PAC)
為了進(jìn)一步檢驗(yàn)序列是否平穩(wěn),對序列sdly進(jìn)行ADF單位根檢驗(yàn),結(jié)果見表5.
從表5可以看出,t統(tǒng)計量的值為-7.963 990,比顯著性水平為1%的臨界值還要小,因此拒絕原假設(shè),說明序列sdly不存在單位根,該序列是平穩(wěn)的.sdly的樣本平均數(shù)為 -0.000 693 087 1,均值標(biāo)準(zhǔn)誤差為0.005 804 797 773,該序列均值與0無顯著性差異,表明序列可以進(jìn)行SARIMA模型.
由于序列經(jīng)過一階差分后,趨勢才基本消除,因此d=1,再經(jīng)過一階季節(jié)差分后,季節(jié)性才基本消除,D=1,所以選用的模型為 SARIMA(p,d,q)(P,D,Q)12模型.由圖8中的偏自相關(guān)(PAC)圖可知,p=4或3比較適合;自相關(guān)(AC)圖顯示 q=2,3或4比較適合,因此可供選擇的(p,q)組合有(3,1),(3,2),(3,3),(4,1),(4,2),(4,3),(4,4).將這些模型分別檢驗(yàn),再根據(jù) AIC,SC 和 MAPE 對模型的階數(shù)進(jìn)行判定[6],結(jié)果如表6 所示 .
表5 序列sdly的ADF單位根檢
表6 各模型的檢驗(yàn)結(jié)果
由表6可知,SARIMA(3,1,2)(1,1,1)12模型的 AIC,SC 和 MAPE 值最小,因此最終選擇該模型作為最理想的旅游需求預(yù)測模型,估計該模型的參數(shù),并對模型進(jìn)行相關(guān)檢驗(yàn).結(jié)果如表7所示.
表7 模型的參數(shù)估計
表7結(jié)果表明,模型SARIMA(3,1,2)(1,1,1)12的參數(shù)估計值具有統(tǒng)計意義,其模型的表達(dá)式為
SARIMA(3,1,2)(1,1,1)12是最理想的模型,但是該模型進(jìn)行預(yù)測時,還要考慮其殘差是否滿足白噪聲,因此,要對該模型的殘差序列進(jìn)行相關(guān)檢驗(yàn).如果殘差序列是白噪聲,表明所建立的模型已經(jīng)包含了原始序列y的所有趨勢,信息已經(jīng)提取完全,所以,模型應(yīng)用于海南省旅游預(yù)測是合適的.如果殘差序列不是白噪聲,說明信息還未提取完全,需要對模型做改進(jìn).對SARIMA(3,1,2)(1,1,1)12模型進(jìn)行殘差序列的ADF單位根檢驗(yàn)(如表8所示),并做出殘差序列的自相關(guān)(AC)與偏自相關(guān)(PAC)分析圖,如圖9所示.
由表8可以看出,t統(tǒng)計量值為-9.649 184,比顯著性水平為1%的臨界值還要小,說明殘差序列是平穩(wěn)序列.
表8 殘差序列的ADF單位根檢驗(yàn)
圖9 殘差序列的自相關(guān)(AC)與偏自相關(guān)(PAC)
由圖9可見,殘差序列的自相關(guān)系數(shù)(AC)和偏自相關(guān)系數(shù)(PAC)迅速落進(jìn)了隨機(jī)區(qū)域,因此,該序列平穩(wěn),這與上述結(jié)果相吻合.綜合考慮,殘差序列是服從正態(tài)分布的,即SARIMA(3,1,2)(1,1,1)12模型可以較好地模擬時間序列的變化趨勢.
利用SARIMA(3,1,2)(1,1,1)12模型對2012年8月至12月海南旅游人數(shù)進(jìn)行預(yù)測,結(jié)果如圖10所示.從圖10中可以看出,預(yù)測值與實(shí)際值基本吻合,這表明模型選擇是正確的,且擬合效果比較好.
圖10 2002—2012年海南省月旅游人數(shù)預(yù)測結(jié)果
表9 2012年8月至12月海南旅游人數(shù)預(yù)測結(jié)果 萬人
利用SARIMA(3,1,2)(1,1,1)12模型,給出了2012年8月至12月海南省旅游人數(shù)預(yù)測值(見表9).這一模型對海南省旅游人數(shù)的預(yù)測和分析具有顯著的參考價值.筆者選取了2003年1月到2012年7月的數(shù)據(jù)進(jìn)行預(yù)測,大量的數(shù)據(jù)保證了模型的精度.本文建立的SARIMA(3,1,2)(1,1,1)12能較好地反映海南省月旅游人數(shù)的發(fā)展規(guī)律,對海南省旅游的相關(guān)部門提供了可靠的參考依據(jù).
海南省是我國惟一的熱帶島嶼省份,是旅游愛好者最受歡迎的熱帶海濱度假勝地.海南建省辦經(jīng)濟(jì)特區(qū)24年來,旅游業(yè)取得了長足的發(fā)展,現(xiàn)已經(jīng)成為國民經(jīng)濟(jì)的支柱產(chǎn)業(yè)和龍頭產(chǎn)業(yè),也是最具特色與潛力的外向型產(chǎn)業(yè).本文利用旅游人數(shù)來刻畫旅游需求,并對此進(jìn)行了分析和預(yù)測,同時探討了各因素對旅游需求的影響,為海南省的旅游需求提供了參考依據(jù).
[1]海南省統(tǒng)計局,海南省旅游數(shù)據(jù)統(tǒng)計[EB/OL].[2012 -08 -10]http://www.hi.stats.gov.cn/hnstjj/index.html.
[2]袁柳,賈博儒,許松林,等.基于灰色理論的旅游需求預(yù)測算法分析[J].科技創(chuàng)新導(dǎo)報,2010(17):232-233.
[3]柏宏斌,李川江.基于灰色系統(tǒng)理論的旅游需求預(yù)測[J].旅游教育管理,2011(11):232-233.
[4]陳俊,陳兆雄,幸林,等.基于BP神經(jīng)網(wǎng)絡(luò)的云南國際旅游需求預(yù)測[J].昆明師范高等??茖W(xué)校學(xué)報,2005,27(4):89-91.
[5]張郴,張捷.中國入境旅游需求預(yù)測的神經(jīng)網(wǎng)絡(luò)集成模型研究[J].地理科學(xué),2011,31(10):1208-1213.
[6]涂雄苓,黃月玲.旅游需求預(yù)測的ARIMA乘積季節(jié)模型構(gòu)建及實(shí)證分析—以桂林市為例[J].廣西財經(jīng)學(xué)院學(xué)報,2011,24(1):112 -117.