王寧寧
(上海工程技術(shù)大學(xué) 管理學(xué)院, 上海2016020)
上海作為世界著名的金融中心之一,有著龐大的人口規(guī)模和發(fā)達(dá)的經(jīng)濟(jì)水平[1]。 所以研究上海的經(jīng)濟(jì)發(fā)展水平具有一定的代表意義。 勞動(dòng)工資是收入的重要組成部分,是衡量收入、分配與勞動(dòng)力發(fā)展水平的重要指標(biāo)。 職工工資水平可以由職工平均工資體現(xiàn),而和職工平均工資相關(guān)的指標(biāo)與職工的利益息息相關(guān),這項(xiàng)指標(biāo)對(duì)未來人口的影響和引導(dǎo)就業(yè)非常重要。 除此之外,員工的平均工資水平對(duì)社會(huì)保障繳費(fèi)的基數(shù)、對(duì)公積金的繳費(fèi)基數(shù)及退休員工的基本養(yǎng)老金都存在一定影響。 因?yàn)槁毠さ钠骄べY水平關(guān)系到每個(gè)員工的利益,所以對(duì)職工給的平均工資進(jìn)行預(yù)測(cè)具有深刻的意義。 比如,職工工資的最低標(biāo)準(zhǔn)等都要依據(jù)參考社會(huì)平均工資水平進(jìn)行制定[2]。 目前,很多專家學(xué)者運(yùn)用多種方法對(duì)工資進(jìn)行預(yù)測(cè),如線性回歸法、指數(shù)平滑法、Logistic模型等。 將職工的平均工資按年份排序,就構(gòu)成了一個(gè)時(shí)間序列,可以用時(shí)間序列分析的方法對(duì)職工平均工資的時(shí)間序列進(jìn)行建模和預(yù)測(cè)[3]。
時(shí)間序列預(yù)測(cè)方法主要是根據(jù)等時(shí)間內(nèi)隨機(jī)變量的變化,推測(cè)潛在的趨勢(shì),并對(duì)未來的變化做出合理的估計(jì)[4]。 因?yàn)闀r(shí)間單位存在差異,序列中關(guān)于時(shí)間的變量可以是各種形式,并不局限于日月年等[5]。 在對(duì)涉及時(shí)間序列問題的分析中,一般通過建立有關(guān)時(shí)間序列的模型對(duì)數(shù)據(jù)隨時(shí)間的變化趨勢(shì)進(jìn)行量化[6]。 本文嘗試運(yùn)用時(shí)間序列數(shù)據(jù)分析中常用的ARIMA 模型對(duì)上海市職工平均工資進(jìn)行分析,同時(shí)對(duì)未來職工工資水平做出一定的預(yù)測(cè)。
(1)ARIMA 模型。 ARIMA 模型是通過自身的變動(dòng)情況,結(jié)合差分方程,對(duì)未來的變化趨勢(shì)進(jìn)行線性預(yù)測(cè)的一種精度較高、擬合性較強(qiáng)的自回歸求和滑動(dòng)平均模型[7]。
(2)數(shù)據(jù)來源及預(yù)處理。 通過查閱統(tǒng)計(jì)年鑒,可以得到上海市1978 至2017 年度職工平均工資統(tǒng)計(jì)表,利用SAS 處理得到上海職工平均工資時(shí)序,如圖1 所示。
從時(shí)序圖可以看出,上海市職工平均工資在過去的38 年中,總體呈指數(shù)上升趨勢(shì),尤其是在后面幾年增速突飛猛進(jìn)。 由此可以判斷,這個(gè)時(shí)間序列具有非平穩(wěn)性,是一個(gè)非平穩(wěn)時(shí)間序列。
圖1 上海歷年職工平均工資時(shí)序圖Fig. 1 Timing chart of average salary of employees over the years in Shanghai
(3)模型的初步建立與檢驗(yàn)。 由圖1 可以看出,時(shí)間序列是非平穩(wěn)的。 而非平穩(wěn)的時(shí)間序列不能直接用來建立時(shí)間序列模型。 所以,需要對(duì)上海市歷年職工平均工資序列進(jìn)行平穩(wěn)化處理,對(duì)原始數(shù)據(jù)進(jìn)行一定的變換是必要的。 通過對(duì)這個(gè)序列進(jìn)行取對(duì)數(shù),把它的指數(shù)趨勢(shì)轉(zhuǎn)變?yōu)榫€性的趨勢(shì),再對(duì)這個(gè)序列進(jìn)行差分處理[8]。通過對(duì)原始數(shù)據(jù)進(jìn)行取對(duì)數(shù),就可以獲得如圖2 所示的時(shí)序圖。
圖2 上海平均工資取對(duì)數(shù)后的時(shí)序圖Fig. 2 Timing chart of average wages in Shanghai after taking logarithm
由圖2 可見,取對(duì)數(shù)后的序列還是不平穩(wěn)的,但可通過該序列的原始數(shù)據(jù)趨勢(shì)圖大致了解這個(gè)序列的平穩(wěn)性。 為了進(jìn)一步了解上海平均工資取對(duì)數(shù)后序列的性質(zhì),下面給出ls 序列的自相關(guān)系數(shù)。 自相關(guān)圖表現(xiàn)為自相關(guān)函數(shù)并未快速下降到零,也沒有在零附近收斂。
圖3 上海平均工資取對(duì)數(shù)后的自相關(guān)系數(shù)Fig. 3 Autocorrelation coefficient of the logarithm of the average wage in Shanghai
由圖3 可知,由于自相關(guān)函數(shù)的衰減速度明顯變得緩慢,從而可以推斷1s 序列具有非平穩(wěn)的性質(zhì),這個(gè)結(jié)論與ls 序列圖上觀察到的結(jié)果相同,對(duì)其取完對(duì)數(shù)后的時(shí)間序列依舊具有線性趨勢(shì),但也不平穩(wěn)。 因此,可以利用一階差分運(yùn)算對(duì)存在的這種線性趨勢(shì)進(jìn)行消除,使該序列平穩(wěn)。 所以要對(duì)1s變量差分操作后的序列展開平穩(wěn)性識(shí)別檢驗(yàn)。 進(jìn)行一階差分后,檢驗(yàn)過程如下:
(1)觀察樣本自相關(guān)系數(shù)。 如果一個(gè)平穩(wěn)序列的自相關(guān)函數(shù)呈現(xiàn)截尾性質(zhì),而呈現(xiàn)偏自相關(guān)函數(shù)拖尾性,就可用MA 模型擬合該序列。 從圖4 可以看出:對(duì)其完成一階差分后的樣本自相關(guān)系數(shù)在1步以后具有截尾的性質(zhì),由此可以初步判定為MA(1)模型,然后再對(duì)其展開參數(shù)估計(jì),同時(shí)對(duì)參數(shù)展開T 檢驗(yàn)。 之后,對(duì)進(jìn)一步得到的結(jié)果展開白噪聲檢驗(yàn)。 因?yàn)榧冸S機(jī)序列指的是對(duì)以前值沒有記憶,對(duì)將來值也沒有影響的序列,所以這種序列不存在分析價(jià)值。 因此,為了確定一個(gè)序列是否具有繼續(xù)研究的價(jià)值和必要,在決定對(duì)其建立模型前要進(jìn)行白噪聲檢驗(yàn),并進(jìn)行參數(shù)估計(jì)[9]。
圖4 進(jìn)行一階差分后的樣本自相關(guān)系數(shù)Fig. 4 Sample autocorrelation coefficient after first difference
圖5 MA(1)模型參數(shù)估計(jì)和檢驗(yàn)結(jié)果Fig. 5 MA (1) model parameter estimation and test results
圖6 MA(1)模型白噪聲檢驗(yàn)結(jié)果Fig. 6 White noise test results of MA (1) model
從圖5、圖6 可以看出:在5%的顯著性水平下,MA(1)的模型通過了白噪聲檢驗(yàn),說明擬合比較充分,參數(shù)也通過了T 檢驗(yàn),模型是比較理想的。
(2)觀察樣本偏向關(guān)系數(shù)。 如果AR(p)模型是平穩(wěn)的,那么它的偏自相關(guān)函數(shù)就有p 步截尾的性質(zhì)。 從圖7 可以看出:經(jīng)過一階差分之后樣本的偏相關(guān)系數(shù)在1 步后具有截尾的性質(zhì),所以可以將它初始認(rèn)定為AR(1)模型。 然后再對(duì)其進(jìn)行參數(shù)估計(jì),同時(shí)對(duì)參數(shù)展開T 檢驗(yàn),對(duì)檢驗(yàn)所得結(jié)果再一次進(jìn)行白噪聲檢驗(yàn)和參數(shù)估計(jì)。
圖7 進(jìn)行一階差分后的樣本偏相關(guān)系數(shù)Fig. 7 Partial correlation coefficient of samples after first difference
從圖8、圖9 可以看出:在顯著性水平為5%的情況下,AR(1)模型也通過了白噪聲檢驗(yàn),說明擬合的效果是比較充分的;參數(shù)均通過了T 檢驗(yàn),此模型是比較理想的。
圖8 AR(1)模型參數(shù)估計(jì)和檢驗(yàn)結(jié)果Fig. 8 AR (1) model parameter estimation and test results
圖9 AR(1)模型白噪聲檢驗(yàn)結(jié)果Fig. 9 White noise test results of AR (1) model
從上述分析中可以看到:經(jīng)過對(duì)原始數(shù)據(jù)取對(duì)數(shù),變換之后數(shù)據(jù)相對(duì)比較理想的模型是MA(1)模型和AR(1)模型。 接著,再依據(jù)AIC 信息準(zhǔn)則對(duì)比較理想的這兩個(gè)模型進(jìn)行優(yōu)選。 根據(jù)AIC 準(zhǔn)則,可以確定模型擬合度是否優(yōu)良。 盡管根據(jù)AIC,數(shù)據(jù)擬合度越優(yōu)良越好,但還是要避免擬合度過猶不及的情況。 因此選擇模型時(shí),應(yīng)優(yōu)先考慮AIC 值最小的。
從圖5、圖8 可以看到:MA(1)模型的AIC 值為-112.382,AR(1)模型的AIC 值為-115.81,即AR(1)模型的AIC 值較小。 因此把AR(1)模型選為擬合原始數(shù)據(jù)經(jīng)過變換后數(shù)據(jù)的最終模型,進(jìn)一步選ARIMA(1,0,1)作為擬合原始數(shù)據(jù)最終模型。
結(jié)合前述AR(1)模型的分析過程, AR(1)模型的分析結(jié)果如下:
圖10 AR(1)模型的結(jié)果Fig. 10 Results of AR (1) model
根據(jù)此模型,利用ARIMA(1,0,1)模型對(duì)上海市2018— 2027 年職工平均工資進(jìn)行預(yù)測(cè),同時(shí)再對(duì)預(yù)測(cè)值進(jìn)行一定的改變,目的是為了獲得在原始度量下的預(yù)測(cè)值。 預(yù)測(cè)結(jié)果如圖11 所示。
圖11 預(yù)測(cè)結(jié)果Fig. 11 Forecast
從圖11 中可知, 2018-2027 年上海市職工平均工資預(yù)測(cè)值增長符合社會(huì)發(fā)展規(guī)律,說明建立的ARIMA(1,0,1)是科學(xué)合理的。 除此之外,從表中可以看出上海市的經(jīng)濟(jì)狀況良好,上海市職工的生活水平將會(huì)越來越高,且還將繼續(xù)以較快的速度發(fā)展。 本文通過這個(gè)模型對(duì)上海市職工工資進(jìn)行預(yù)測(cè),同時(shí)預(yù)測(cè)結(jié)果表明精度較好。 因此,可以根據(jù)這門技術(shù)為有關(guān)部門制定或者相應(yīng)調(diào)整社保繳費(fèi)基數(shù)、公積金繳費(fèi)基數(shù)、以及與退休人員利益相關(guān)的政策的制定提供一定的科學(xué)依據(jù)和參考。 同時(shí)有助于推動(dòng)上海市職工與雇主之間的關(guān)系良好健康發(fā)展,對(duì)維持社會(huì)的健康穩(wěn)定具有一定意義。
當(dāng)使用ARIMA 模型對(duì)有時(shí)間相關(guān)性的數(shù)據(jù)進(jìn)行預(yù)測(cè)時(shí),要依據(jù)所面臨問題的特點(diǎn),對(duì)其量體裁衣并選擇最適合的模型。 同時(shí),需要注意這種模型屬于精度較高的時(shí)間序列短期預(yù)測(cè)模型,對(duì)預(yù)測(cè)短期的數(shù)據(jù)比較精確,如果延長預(yù)測(cè)期,預(yù)測(cè)誤差也會(huì)隨之相應(yīng)的增大。