張居營,張 鏑,趙宣凱
(1.河北金融學(xué)院 金融與投資學(xué)院,河北 保定 071051;2.中信建投證券股份有限公司,北京 100010;3.中央財經(jīng)大學(xué)a.經(jīng)濟學(xué)院;b.中國互聯(lián)網(wǎng)經(jīng)濟研究院,北京 100081)
宏觀經(jīng)濟預(yù)測對政府、企業(yè)、居民等部門具有重要的信號指示作用,有助于及時決策,更好地進行經(jīng)濟預(yù)判和防范風(fēng)險。但數(shù)據(jù)采集和整理需要時間,數(shù)據(jù)發(fā)布往往具有滯后性,例如我國年度、季度GDP 數(shù)據(jù)通常滯后一個多月發(fā)布,現(xiàn)實情況突發(fā)變化可能導(dǎo)致決策陷入被動。近年來,由于受到全球競爭格局重塑、地緣沖突加劇以及重大公共衛(wèi)生事件等一系列因素的影響,各國經(jīng)濟波動愈加劇烈,趨勢反轉(zhuǎn)概率加大,促使決策者更加注重宏觀經(jīng)濟預(yù)判,以提前布局、制定合理決策來化解風(fēng)險,這便產(chǎn)生了實時預(yù)測(Nowcasting)的方法。目前,實時預(yù)測仍面臨兩大障礙:一是數(shù)據(jù)統(tǒng)計方面,宏觀經(jīng)濟變量門類眾多,項目繁雜,且方法不斷更新,統(tǒng)計指標(biāo)與統(tǒng)計口徑紛繁復(fù)雜,頻率各不相同,時常面臨日、周、旬、月、季度、年度等混頻數(shù)據(jù)問題,且存在數(shù)據(jù)缺失問題,如何高質(zhì)量地從多維數(shù)據(jù)中提取有效信息,并進行精準(zhǔn)、及時預(yù)測是一大難題;二是預(yù)測方法方面,采用單一指標(biāo)的預(yù)測方法,如ARMA、GARCH 等容納的信息量相對有限,預(yù)測的波動性較大,采用多指標(biāo)預(yù)測方法中以VAR 為代表的傳統(tǒng)模型存在“維度詛咒”問題,變量個數(shù)較多時參數(shù)難以估計,而采用稀疏建模的高維數(shù)據(jù)處理方法篩選部分變量參與預(yù)測的過程中必定會損失一部分信息,同時對于混頻數(shù)據(jù)缺失值過多的問題也缺少合理辦法進行有效填補,導(dǎo)致其使用存在限制。
動態(tài)因子模型在一定程度上能解決上述問題,它將宏觀變量視為“公共因子”和“特質(zhì)擾動項”兩個部分,通過信息組合和噪聲過濾,提取主要因素,在假設(shè)宏觀經(jīng)濟不同部門的波動是由若干“公共因子”共同驅(qū)動的條件下,對相應(yīng)變量進行預(yù)測[1]。動態(tài)因子模型可以表示為狀態(tài)空間的形式,應(yīng)用卡爾曼濾波構(gòu)造似然函數(shù),并用極大似然估計法來估計參數(shù),從而處理不規(guī)則混頻數(shù)據(jù),但是估計過程中會用到非線性的數(shù)值優(yōu)化算法,對高維度的數(shù)據(jù)處理能力有限。后期Stock 和Watson(2002)[2]、Forni 等(2005)[3]通過放松假定條件,在允許特質(zhì)擾動項滿足一定條件時應(yīng)用主成分分析法提取因子。Doz等(2011)[4]進一步應(yīng)用卡爾曼濾波算法對主成分估計的各因子初始值進行修正,得到了較為穩(wěn)健而準(zhǔn)確的因子估計值,形成了卡爾曼濾波算法兩步估計框架。目前動態(tài)因子模型的實時預(yù)測得到廣泛應(yīng)用,劉漢和劉金全(2011)[5]對我國季度GDP 進行實時預(yù)測,取得了較好的預(yù)測效果,Allan 等(2014)[6]用實時預(yù)測方法估計了部分數(shù)據(jù)沒有專門發(fā)布的蘇格蘭的GDP 增長,為地區(qū)經(jīng)濟實時預(yù)報提供了借鑒。
基于動態(tài)因子模型的實時預(yù)測方法雖然能夠解決混頻數(shù)據(jù)發(fā)布不同步、數(shù)據(jù)缺失的問題,但是,在不確定性沖擊下,宏觀預(yù)測仍存在效果不佳、時滯性等問題,如不確定性沖擊導(dǎo)致經(jīng)濟先下降再回升的“V”型反轉(zhuǎn)加大了實時預(yù)測難度[7]。尚泰等(2016)[8]提出了基于卡爾曼濾波的三階段固定區(qū)間平滑算法,指出該算法能夠循環(huán)多次使用卡爾曼濾波,提高估計精度,并在初始狀態(tài)未知的情況下具有較強應(yīng)用價值,但是該方面尚未應(yīng)用到宏觀經(jīng)濟實時預(yù)測方法中。鑒于此,本文在動態(tài)因子模型實時預(yù)測的參數(shù)估計中改進卡爾曼濾波的固定區(qū)間平滑算法,引入再次前向濾波平滑過程的三階段算法,探討其預(yù)測效果,并驗證改進算法是否能夠更有效地利用先驗信息,提升預(yù)測精度,在經(jīng)濟運行非常規(guī)狀態(tài)下是否也能快速響應(yīng),改善預(yù)測時滯性問題。
動態(tài)因子模型假設(shè)n個變量在t期的觀測向量yt=(yi,t,…,yn,t)T可以由r個難以觀測到的動態(tài)公共因子向量ft=(fi,t,…,fr,t)T以及特異因子et=( ei,t,…,en,t)T來描述,形式如下:式(1)為測量方程,描述了數(shù)據(jù)yt和動態(tài)因子ft之間的關(guān)系,其中C 為n×r 的因子載荷矩陣(通常r ?n)。ft、et分別為不同變量序列之間的共同成分、特異成分,并且假定et~N(0,R)。 R 是測量噪聲協(xié)方差,實際操作中一般可以觀測到,是濾波器的已知條件。式(2)為轉(zhuǎn)移方程,假定隱含的動態(tài)因子向量服從VAR(1)過程,A 為r×r 的VAR 過程轉(zhuǎn)移稀疏矩陣。 μt為r 維列向量且μt~N(0,Q)。式(1)和式(2)共同構(gòu)成了一個狀態(tài)空間模型,ft、et都是未觀測到的狀態(tài)。通過計算主成分初始化模型的待估參數(shù),將主成分視為真正的公共因子。用yt對ft的初始估計值做最小二乘回歸,即可得到C 的初始估計和et向量,計算et的協(xié)方差矩陣即得到R 的初始估計。將ft的協(xié)方差矩陣記為P ,根據(jù)ft的初始值計算出P 的初始估計。
在得到所有未知參數(shù)的初始估計后,就可以使用基于卡爾曼濾波的兩階段固定區(qū)間平滑算法進行參數(shù)估計和數(shù)據(jù)更新,主要分為前向濾波和后向平滑過程。
前向濾波過程將ft與P 的初始估計記為對C 、A、R、Q 分別賦予初始值然后利用t-1 期的數(shù)據(jù)來預(yù)測t 期的參數(shù),這一步對ft與P 的預(yù)測結(jié)果分別記為,通過計算卡爾曼增益:并設(shè)定閾值,來實現(xiàn)對第1期到第t 期的預(yù)測更新,從和開始迭代循環(huán)得到和,完成前向濾波的過程。后向平滑過程是將正向濾波最后得到的和按時間t 逆向倒推,t 依次取N-1,N-2,…,0,每一步的平滑步驟如下:首先,計算平滑增益矩陣其次,進行平滑估計fs,k=ff,k+Hs,k(fs,k+1-ff,k+1/k);最后,計算平滑協(xié)方差矩陣變量下標(biāo)f 和s 分別代表該時刻的正向濾波結(jié)果和平滑結(jié)果。其中,為系統(tǒng)狀態(tài)轉(zhuǎn)移矩陣。
尚泰等(2016)[8]提出了基于卡爾曼濾波的三階段固定區(qū)間平滑算法,相比兩階段平滑算法,用第二階段后向平滑過程得到的作為濾波初始值,再次從頭到尾處理觀測值,并得到最終的狀態(tài)估計,即為三階段固定區(qū)間平滑估計的輸出。與兩階段固定區(qū)間平滑算法相比,三階段算法由于多次使用卡爾曼濾波,理論上使得穩(wěn)定性獲得進一步提升,充分利用了現(xiàn)有數(shù)據(jù)中公共因子與特異因子信息的先驗信息,并做了變化趨勢上的再次平滑,因此更接近經(jīng)濟實際運行狀態(tài)。
考慮到宏觀經(jīng)濟中的統(tǒng)計變量門類的復(fù)雜性、變量間信息交叉性,本文在構(gòu)建數(shù)據(jù)集時,將宏觀經(jīng)濟分為經(jīng)濟運行、景氣與信心、工業(yè)、投資、消費與價格、勞動力、金融與貨幣七大門類。不同門類混頻指標(biāo)的選取見下頁表1和下文表2,共計81 個指標(biāo),其中月度指標(biāo)66 個,季度指標(biāo)15 個,時間跨度為2005 年1 月1 日至2022 年11 月31日,數(shù)據(jù)來自國家統(tǒng)計局官網(wǎng)季度與月度公開數(shù)據(jù)、CEIC數(shù)據(jù)庫、Wind數(shù)據(jù)庫等。考慮到預(yù)測對象的不同,參考唐曉彬等(2022)[9]在對宏觀經(jīng)濟進行實時預(yù)測時選取的指標(biāo),對于季度GDP同比增速的預(yù)測,主要從投資、消費、貿(mào)易、就業(yè)以及相關(guān)行業(yè)、工業(yè)運行、金融狀況等方面選取變量;對于月度CPI的預(yù)測,主要考慮整體經(jīng)濟運行狀況、景氣指數(shù)、貨運物流、消費與價格、金融貨幣等與價格有關(guān)的變量,具體見表1和表2的第5列。
表1 數(shù)據(jù)集變量選擇情況表(2)
數(shù)據(jù)處理主要包括缺失值填補、標(biāo)準(zhǔn)化處理、季節(jié)性調(diào)整等,在將季度指標(biāo)數(shù)據(jù)視為同時期對應(yīng)月度數(shù)據(jù)最后一期的數(shù)據(jù)時,其余時期的數(shù)據(jù)將視為缺失值,獲取的宏觀數(shù)據(jù)中還有一些月份也存在缺失值,如“春節(jié)效應(yīng)”導(dǎo)致部分指標(biāo)缺少1月份的數(shù)據(jù)等。缺失值填補、標(biāo)準(zhǔn)化處理都納入動態(tài)因子模型初始環(huán)節(jié)中,標(biāo)準(zhǔn)化處理則在主成分的因子提取中。缺失值填補是基于卡爾曼濾波進行的,引入實時估計得到的動態(tài)因子對缺失值進行動態(tài)補充,將缺失值視為上一期觀測值與權(quán)重的乘積,再加上動態(tài)因子的和,然后根據(jù)卡爾曼濾波估計結(jié)果進行更新。本文還對除比率、增長率之外的指數(shù)數(shù)據(jù)采用X-12-ARIMA 等進行季節(jié)性調(diào)整。
按照上述步驟,利用本文所提及的兩階段、三階段平滑方法,分別以我國實際GDP 同比增速、CPI 同比增速為被預(yù)測變量,納入動態(tài)因子模型中進行實時預(yù)測,每月預(yù)測一次,將得到的擬合值與實際值,以及與單指標(biāo)預(yù)測方法ARMA、ARMA-GARCH 的結(jié)果進行比對。參照以往做法,采用均方根預(yù)測誤差(RMSFE)、平均絕對百分比誤差(MAPE)、對稱平均絕對百分比誤差(SMAPE)評價采用兩階段與三階段固定區(qū)間平滑算法的實時預(yù)測效果。
下頁圖1為GDP同比增速的預(yù)測值與實際值比較,每月實際值是將該季度GDP按月填充。2020年以前經(jīng)濟處于平穩(wěn)發(fā)展階段,宏觀經(jīng)濟各部門、各要素保持慣性運行狀態(tài),因此,2018—2019年兩階段與三階段固定區(qū)間平滑算法的預(yù)測值、實際值的偏差較小,且兩個預(yù)測值的差別也不大,而ARMA、ARMA-GARCH 雖然保持了GDP 增長趨勢,但預(yù)測值與實際值仍有較大偏差。2020 年以后重大公共衛(wèi)生事件對經(jīng)濟的結(jié)構(gòu)性沖擊導(dǎo)致GDP增長呈現(xiàn)“V”型反轉(zhuǎn)與不穩(wěn)定波動,非常規(guī)情況下兩階段與三階段算法實時預(yù)測均出現(xiàn)偏差,體現(xiàn)了預(yù)測的時滯性,如2020年第一季度的“V”型反轉(zhuǎn)、2021年第一季度的“倒V”型反轉(zhuǎn),當(dāng)期均無法直接捕捉到,相比較而言,三階段算法響應(yīng)速度較快,體現(xiàn)了對經(jīng)濟增長“V”型反轉(zhuǎn)的更快預(yù)測,因為對先驗信息利用更充分以及前次的前向濾波平滑,對月度頻率數(shù)據(jù)提取因子的再次平滑可以較好地預(yù)測季度數(shù)據(jù)值,所以使得3月、6月、9月、12月的預(yù)測值更接近實際值,兩階段算法則具有1 期的滯后性。ARMA、ARMA-GARCH 則會出現(xiàn)5 期以上的滯后性,只是趨勢上的預(yù)測,難以提取更多信息,因此效果較差。
圖1 不同方法GDP同比增速預(yù)測值與實際值比較
下頁表3 顯示了采用RMSFE、MAPE、SMAPE 三個指標(biāo)評價不同方法的預(yù)測效果的結(jié)果??梢钥吹剑浅R?guī)狀態(tài)下各方法的預(yù)測誤差均變大,但相比較而言,三階段算法預(yù)測誤差最低,因此,其預(yù)測精度最高,兩階段算法次之,ARMA、ARMA-GARCH的預(yù)測精度遠低于前兩者。
表3 GDP同比增速預(yù)測的效果評價
下頁圖2和表4為CPI同比增速的實時預(yù)測結(jié)果與效果評價結(jié)果。可以看到,經(jīng)濟平穩(wěn)運行狀態(tài)時CPI增速在較窄區(qū)間內(nèi)波動,兩階段、三階段算法能夠較好地預(yù)測其走勢,非常規(guī)狀態(tài)下CPI增速波動區(qū)間變大,“V”型反轉(zhuǎn)出現(xiàn)較為頻繁,導(dǎo)致部分時點兩階段、三階段算法預(yù)測具有滯后性,如2020年5月、2021年5月、2022年1月,由于CPI是月度發(fā)布指標(biāo),三階段算法也無法做到對反轉(zhuǎn)信號的快速響應(yīng),因此需要更高頻的周度、日度數(shù)據(jù)來實現(xiàn)有效實時預(yù)測。另外,在預(yù)測精度上,三階段算法也是最高的,ARMA、ARMA-GARCH的預(yù)測精度都相對較低。
圖2 不同方法CPI預(yù)測值與實際值比較
表4 CPI同比增速預(yù)測的效果評價
本文將基于卡爾曼濾波算法改進的三階段固定區(qū)間平滑算法引入高維混頻數(shù)據(jù)的動態(tài)因子模型參數(shù)估計過程,令其替代傳統(tǒng)的兩階段平滑算法,并應(yīng)用于我國宏觀經(jīng)濟預(yù)測中以探討該種估計方法的優(yōu)勢與不足。實證結(jié)果表明:(1)實時預(yù)測能夠較好地預(yù)測經(jīng)濟平穩(wěn)狀態(tài)下的發(fā)展趨勢,預(yù)測偏差較小,但是當(dāng)經(jīng)濟處于非常規(guī)情況下,針對“V”型反轉(zhuǎn)的預(yù)測會出現(xiàn)時滯性;(2)基于卡爾曼濾波的三階段固定區(qū)間平滑算法能夠?qū)崿F(xiàn)對現(xiàn)有數(shù)據(jù)的再次平滑,相比兩階段平滑算法,有效利用了現(xiàn)有數(shù)據(jù)中的公共因子與特異因子的先驗信息,并通過再次前向濾波平滑,預(yù)測精度進一步提升,針對“V”型反轉(zhuǎn)走勢也能快速響應(yīng),應(yīng)用月度指標(biāo)能夠較好預(yù)測當(dāng)季GDP增速,但面對月度CPI 增速預(yù)測時實時響應(yīng)能力不足,因此,需要結(jié)合更高頻的周度、日度數(shù)據(jù)等,應(yīng)用三階段固定區(qū)間平滑算法才能實現(xiàn)對宏觀經(jīng)濟的多層面、高質(zhì)量的監(jiān)測與預(yù)警。