朱辰超,劉雅雅
(上海理工大學(xué) 管理學(xué)院,上海 200093)
中國(guó)老齡化問(wèn)題日益突出,家庭養(yǎng)老的形式難以滿足老年人的養(yǎng)老需求。李林潼經(jīng)過(guò)調(diào)查研究,發(fā)現(xiàn)解決現(xiàn)狀的重要方法是采用機(jī)構(gòu)養(yǎng)老的形式,但機(jī)構(gòu)養(yǎng)老在現(xiàn)階段的實(shí)施中存在床位供需失衡的問(wèn)題。關(guān)于養(yǎng)老床位需求的研究,余瑩等人運(yùn)用系統(tǒng)聚類方法分析上海市各個(gè)區(qū)的養(yǎng)老區(qū)域劃分。徐佩等人用時(shí)間序列模型對(duì)上海市的機(jī)構(gòu)養(yǎng)老床位供給量進(jìn)行預(yù)測(cè)。除了針對(duì)某一個(gè)具體省份分析外,曹稀哲等人用多元回歸的方法來(lái)預(yù)測(cè)未來(lái)六年中國(guó)整體的機(jī)構(gòu)床位需求量。王子鑫等人分析了城市和鄉(xiāng)村老年人的養(yǎng)老床位需求。大部分關(guān)于養(yǎng)老機(jī)構(gòu)床位的研究都只是分析整體的需求量、或者城鄉(xiāng)的需求量,很少細(xì)化到各個(gè)省份來(lái)探討分析。雖然高巍等人基于31 個(gè)省份的數(shù)據(jù),運(yùn)用多目標(biāo)規(guī)劃來(lái)分析養(yǎng)老服務(wù)運(yùn)營(yíng)模式,但是最終并沒(méi)有提出各個(gè)省份具體的養(yǎng)老服務(wù)運(yùn)營(yíng)策略。近年來(lái),很多學(xué)者采用聚類分析與判別分析結(jié)合的方法研究區(qū)域化和老年人能力等級(jí)的分類問(wèn)題。但是判別分析有很多種方法,選擇不同方法,得到的判別函數(shù)也不同,有誤判的現(xiàn)象發(fā)生。
綜上所述,現(xiàn)階段對(duì)于機(jī)構(gòu)養(yǎng)老床位的需求分析并沒(méi)有細(xì)化到各個(gè)省份,只是停留在城鄉(xiāng)的階段?;诖耍疚闹饕捎肂P 神經(jīng)網(wǎng)絡(luò)和灰色預(yù)測(cè)模型,地區(qū)化分析31 個(gè)省份養(yǎng)老機(jī)構(gòu)床位的需求量,力圖實(shí)現(xiàn)省份間的合理分配,解決機(jī)構(gòu)養(yǎng)老床位供需失衡的問(wèn)題。同時(shí)將判別分析與BP 神經(jīng)網(wǎng)絡(luò)的精確度進(jìn)行對(duì)比分析,以期減少誤判現(xiàn)象,實(shí)現(xiàn)地區(qū)的準(zhǔn)確分類。選用65 歲及以上人口數(shù)、城鎮(zhèn)單位就業(yè)人員數(shù)、城鎮(zhèn)居民消費(fèi)水平、城鎮(zhèn)人口數(shù)、基本養(yǎng)老保險(xiǎn)基金支出、老年人口撫養(yǎng)比這6 個(gè)指標(biāo),考慮到養(yǎng)老床位需求受到歷史數(shù)據(jù)的影響,故收集歷年中國(guó)31 個(gè)省份的指標(biāo)數(shù)據(jù),運(yùn)用K 均值聚類的方法將歷年省份分為3 類,分別為養(yǎng)老床位需求高、中、低的地區(qū),并將分類結(jié)果用于BP 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。再采用灰色預(yù)測(cè)模型和差分整合移動(dòng)平均自回歸模型來(lái)預(yù)測(cè)2022 年各指標(biāo)值,對(duì)2022 年中國(guó)各省養(yǎng)老床位的需求進(jìn)行分類。最后,基于2022 年的分類結(jié)果,通過(guò)熵權(quán)法對(duì)各類中各省的養(yǎng)老床位需求程度打分,根據(jù)分?jǐn)?shù)的高低提出一種地區(qū)化分配養(yǎng)老床位的方案,為養(yǎng)老床位供需失衡問(wèn)題提供解決方案支持。同時(shí),用判別分析對(duì)2022 年31 個(gè)省份進(jìn)行分類,將判別分析的結(jié)果與BP 神經(jīng)網(wǎng)絡(luò)的結(jié)果進(jìn)行對(duì)比,實(shí)現(xiàn)誤判最小化。
BP 神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network)采用誤差的反向傳播和信號(hào)的正向傳播來(lái)確定權(quán)值,誤差按照負(fù)梯度的方向不斷傳播,直至誤差達(dá)到一個(gè)極小值時(shí)停止,或者在模型的學(xué)習(xí)次數(shù)達(dá)到初始設(shè)定的最大學(xué)習(xí)次數(shù)時(shí)停止,得到最終的完整網(wǎng)絡(luò)。在BP 神經(jīng)網(wǎng)絡(luò)中,最常見(jiàn)的是3 層反饋網(wǎng)絡(luò),分別為輸入層、隱含層、輸出層。在BP 神經(jīng)網(wǎng)絡(luò)中,隱含層神經(jīng)細(xì)胞的數(shù)量由式(1)來(lái)求得:
其中,N是輸入層中神經(jīng)元的數(shù)量;N是輸出層神經(jīng)元的數(shù)量;是調(diào)節(jié)常數(shù),其范圍在[1,10] 之間。
隱含層神經(jīng)元的數(shù)量需要根據(jù)過(guò)去的數(shù)據(jù)逐步訓(xùn)練BP 神經(jīng)網(wǎng)絡(luò),直至得到預(yù)測(cè)誤差最小的網(wǎng)絡(luò),從而確定隱含層神經(jīng)元數(shù)量。
在計(jì)算過(guò)程中,本文擬采用函數(shù)作為隱含層的激活函數(shù),線性傳遞函數(shù)作為輸出層的激活函數(shù)。設(shè)輸入層的輸入為分類后的2008~2017 年各省的65 歲及以上人口數(shù)、城鎮(zhèn)單位就業(yè)人員數(shù)、城鎮(zhèn)居民消費(fèi)水平、城鎮(zhèn)人口數(shù)、基本養(yǎng)老保險(xiǎn)基金支出、老年人口撫養(yǎng)比,該層使用函數(shù),對(duì)此可表示為:
其中,t為隱含層第個(gè)神經(jīng)元的輸出;W為隱含層神經(jīng)元與輸入層神經(jīng)元i 的權(quán)值; α為隱含層神經(jīng)元的閾值;()為隱含層神經(jīng)元的激活函數(shù)。
將高、中、低三個(gè)需求類別作為輸出層神經(jīng)元的3 個(gè)輸出值,神經(jīng)元運(yùn)用激活函數(shù)將激活后的輸入值輸出,函數(shù)的數(shù)學(xué)形式可表示為:
其中,W為隱含層神經(jīng)元到輸出層神經(jīng)元的權(quán)值;α為輸出層神經(jīng)元的閾值;()為輸出層神經(jīng)元的激活函數(shù)。
判別分析要求每類中至少有一個(gè)樣本,且解釋變量必須是可測(cè)量的,才能計(jì)算每類的均值和方差,用于判別函數(shù)的具體表達(dá)式與計(jì)算。判別分析的計(jì)算步驟如下:
(1)計(jì)算各組類別中各判別變量的均值和協(xié)方差陣。
(2)計(jì)算協(xié)方差陣的估計(jì)值的逆矩陣。
(3)運(yùn)用逆矩陣和均值確定判別函數(shù)的具體表達(dá)式。
(4)運(yùn)用判別函數(shù)對(duì)已有樣本進(jìn)行回判,計(jì)算精確度。
(5)運(yùn)用判別函數(shù)對(duì)待判別樣本進(jìn)行分類。
本文從國(guó)家統(tǒng)計(jì)局中收集2008~2017 年中國(guó)31 個(gè)省份的6 個(gè)指標(biāo)值作為樣本數(shù)據(jù)。首先,運(yùn)用數(shù)據(jù)分析軟件SPSS(Statistical Product and Service Solutions)對(duì)數(shù)據(jù)進(jìn)行歸一化處理,去除量綱對(duì)于聚類結(jié)果的影響;其次,采用K 均值聚類的方法將樣本分為3 類,分別為:床位需求最多、床位需求適中和床位需求最少,最終的聚類結(jié)果見(jiàn)表1 和表2,最終聚類中心表示各類別中各指標(biāo)數(shù)據(jù)的均值。
表1 最終聚類中心Tab.1 Final clustering center
表2 各類中的樣本數(shù)Tab.2 Number of samples in each category
由表1 的數(shù)值可知,第一類對(duì)應(yīng)的是床位需求適中的地區(qū),第二類對(duì)應(yīng)的是床位需求最少的地區(qū),第三類對(duì)應(yīng)的是床位需求最多的地區(qū)。因每年養(yǎng)老床位的需求都受到過(guò)去情況的影響,具有連續(xù)性,不是獨(dú)立于歷史存在的離散值,故本文以歷史樣本數(shù)據(jù)的分類結(jié)果為后續(xù)模型預(yù)測(cè)的基礎(chǔ)樣本,結(jié)果見(jiàn)表2,所有收集的樣本均實(shí)現(xiàn)分類,并不存在一個(gè)樣本屬于多個(gè)類別的情況。
依據(jù)K 均值聚類方法的分類結(jié)果,將每個(gè)類別的70%樣本作為訓(xùn)練集,30%樣本作為測(cè)試集。由于輸入變量為6 個(gè),輸出變量為3 個(gè),根據(jù)公式(1),隱含層個(gè)數(shù)確定在[4,13]內(nèi)。在該區(qū)間內(nèi)選取不同的隱含層個(gè)數(shù),訓(xùn)練BP 神經(jīng)網(wǎng)絡(luò),對(duì)比各個(gè)隱含層個(gè)數(shù)下BP 神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度,選擇精度最高的網(wǎng)絡(luò)對(duì)應(yīng)的隱含層個(gè)數(shù),最終確定為10。養(yǎng)老床位需求BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示,分類誤差直方圖如圖2 所示。
圖1 養(yǎng)老床位需求BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 The BP neural network structure of pension service beds demand
圖2 分類誤差直方圖Fig.2 Histogram of classification error
在神經(jīng)網(wǎng)絡(luò)訓(xùn)練的過(guò)程中,需要重視過(guò)擬合問(wèn)題。當(dāng)訓(xùn)練集的精確度極高,而測(cè)試集的精確度低時(shí),就會(huì)產(chǎn)生過(guò)擬合現(xiàn)象。由圖2 可以看出,訓(xùn)練集和測(cè)試集的誤差均在0.025 附近,即訓(xùn)練集和測(cè)試集的預(yù)測(cè)精確度基本均接近于100%,本文的養(yǎng)老床位需求BP 神經(jīng)網(wǎng)絡(luò)并不存在過(guò)擬合現(xiàn)象。
判別分析是對(duì)已知樣本數(shù)據(jù)進(jìn)行計(jì)算得到判別函數(shù),選擇不同方法得到的判別函數(shù)也不相同,常用的判別方法有最大似然法、距離判別法、Fisher 判別法、Bayes 判別法。本文將K 均值聚類方法的分類結(jié)果作為基礎(chǔ)樣本,以Fisher 判別法為例,通過(guò)判別函數(shù)對(duì)基礎(chǔ)樣本進(jìn)行回判,從而求得判別分析的精確度。與養(yǎng)老床位需求BP 神經(jīng)網(wǎng)絡(luò)的精確度相比,判別分析的精確度較低,故本文選用BP 神經(jīng)網(wǎng)絡(luò)的方法來(lái)實(shí)現(xiàn)養(yǎng)老床位需求的分類。
本文采用灰色預(yù)測(cè)模型和差分整合移動(dòng)平均自回歸模型,根據(jù)2008~2017 年31 個(gè)省份的6 個(gè)指標(biāo)值,預(yù)測(cè)2022 年的指標(biāo)值。灰色預(yù)測(cè)模型是運(yùn)用少量數(shù)據(jù)進(jìn)行短期預(yù)測(cè),在計(jì)算殘差的方差和指標(biāo)數(shù)據(jù)的方差后,將兩者的比值稱為后驗(yàn)差比值,進(jìn)行后驗(yàn)差比檢驗(yàn)。當(dāng)后驗(yàn)差比值大于0.65 時(shí),則表明灰色預(yù)測(cè)模型的預(yù)測(cè)結(jié)果對(duì)于該指標(biāo)數(shù)據(jù)而言不合格,需要選用其他方法進(jìn)行預(yù)測(cè)。差分整合移動(dòng)平均自回歸模型是對(duì)平穩(wěn)的時(shí)間序列數(shù)據(jù)進(jìn)行中短期預(yù)測(cè),當(dāng)數(shù)據(jù)不平穩(wěn)時(shí),需要對(duì)數(shù)據(jù)進(jìn)行差分,使其變成平穩(wěn)序列。在本文的指標(biāo)預(yù)測(cè)的過(guò)程中,對(duì)每個(gè)指標(biāo)都先運(yùn)用灰色預(yù)測(cè)模型進(jìn)行預(yù)測(cè)和檢驗(yàn),當(dāng)檢驗(yàn)結(jié)果顯示不合格、即精確度過(guò)低時(shí),將采用差分整合移動(dòng)平均自回歸模型進(jìn)行預(yù)測(cè),最終的預(yù)測(cè)結(jié)果見(jiàn)表3。
表3 2022 年6 個(gè)指標(biāo)31 個(gè)省份的預(yù)測(cè)值Tab.3 Predicted values of six indicators in 31 provinces of China in 2022
根據(jù)差分整合移動(dòng)平均自回歸模型和灰色預(yù)測(cè)模型預(yù)測(cè)得到的2022 年各個(gè)省份的指標(biāo)值,運(yùn)用訓(xùn)練好的養(yǎng)老床位需求BP 神經(jīng)網(wǎng)絡(luò),得到最終2022年31 個(gè)省份的類別情況,見(jiàn)表4。
由表4 可知,在面對(duì)中國(guó)整體的機(jī)構(gòu)養(yǎng)老床位需求量增加的情況下,關(guān)于床位的增加量應(yīng)按照第三類、第一類、第二類的先后順序進(jìn)行分配。優(yōu)先增加第三類地區(qū)的養(yǎng)老床位,其次增加第一類地區(qū)的養(yǎng)老床位,最后增加第二類地區(qū)的養(yǎng)老床位。
表4 2022 年31 個(gè)省份預(yù)測(cè)類別Tab.4 China′s 31 provinces forecast categories in 2022
本文根據(jù)2022 年中國(guó)31 個(gè)省份對(duì)應(yīng)的6 個(gè)指標(biāo)預(yù)測(cè)值,采用熵權(quán)法計(jì)算各個(gè)指標(biāo)的權(quán)重,最終得出各類中每個(gè)地區(qū)的評(píng)分,評(píng)分越高則相應(yīng)地區(qū)對(duì)于床位的需求越急切。
由于運(yùn)用SPSS 軟件對(duì)該組數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化時(shí)發(fā)現(xiàn)有負(fù)值,故重新采用另一種標(biāo)準(zhǔn)化方法,保證標(biāo)準(zhǔn)化結(jié)果在[0,1]之間,列出公式見(jiàn)如下:
其中,r表示2022 年31 個(gè)省份對(duì)應(yīng)的各指標(biāo)預(yù)測(cè)值。
熵權(quán)法是根據(jù)指標(biāo)的離散程度來(lái)分配權(quán)重,具有較強(qiáng)的客觀性。熵權(quán)法需先對(duì)標(biāo)準(zhǔn)化矩陣v計(jì)算其對(duì)應(yīng)的概率矩陣;其次,根據(jù)概率矩陣求各指標(biāo)的信息熵和信息效用值;最后,將信息效用值歸一化,得到各個(gè)指標(biāo)的熵權(quán)。熵權(quán)與標(biāo)準(zhǔn)化矩陣的元素進(jìn)行加權(quán)求和,即為各個(gè)樣本的評(píng)分結(jié)果。評(píng)分結(jié)果是各個(gè)地區(qū)養(yǎng)老床位需求程度的評(píng)分,評(píng)分越高表示該地區(qū)對(duì)養(yǎng)老床位的需求程度越高,見(jiàn)表5。
表5 2022 年31 個(gè)省份每類的評(píng)分(每類中評(píng)分按降序)Tab.5 The score of each category of China′s 31 provinces in 2022(descending order)
本文主要采用BP 神經(jīng)網(wǎng)絡(luò)和灰色預(yù)測(cè)模型來(lái)預(yù)測(cè)分析2022 年31 個(gè)省份的養(yǎng)老床位需求增加量的情況,并且針對(duì)床位供需失衡的問(wèn)題提出相應(yīng)的解決方法:
(1)對(duì)2022 年的養(yǎng)老床位需求增加量,應(yīng)按照第三類(需求最多)、第一類(需求適中)、第二類(需求最少)地區(qū)的順序來(lái)增加養(yǎng)老床位的供給,先在整體上解決養(yǎng)老床位供需失衡的問(wèn)題。
(2)在各組類別中,各地區(qū)按照熵權(quán)法的評(píng)分結(jié)果,先分配評(píng)分高的地區(qū),再分配評(píng)分低的地區(qū),即各類中按照各個(gè)地區(qū)對(duì)于養(yǎng)老床位需求程度的高低進(jìn)行分配。
(3)在2022 年,在第三類地區(qū)中,按照廣東、江蘇、山東、浙江、河北、遼寧、四川、湖北、安徽、河南的順序依次增加養(yǎng)老床位供給量;對(duì)于第一類地區(qū),按照上海、黑龍江、吉林、內(nèi)蒙古、北京、湖南、陜西、江西、山西、重慶、廣西、天津、甘肅、新疆、福建、貴州、云南、海南、寧夏的順序依次增加床位供給量;針對(duì)第二類地區(qū),則是按照青海、西藏的順序增加床位供給量。
本文針對(duì)中國(guó)養(yǎng)老床位供需失衡的問(wèn)題,通過(guò)分類、預(yù)測(cè)、評(píng)分這3 個(gè)步驟提出一種地區(qū)化分配養(yǎng)老床位的方案。首先,運(yùn)用K 均值聚類方法將2008~2017 年31 個(gè)省份分為3 類作為樣本數(shù)據(jù),分別為養(yǎng)老床位需求最少、適中、最多。運(yùn)用BP 神經(jīng)網(wǎng)絡(luò)對(duì)樣本數(shù)據(jù)進(jìn)行訓(xùn)練,同時(shí)運(yùn)用判別分析對(duì)樣本數(shù)據(jù)進(jìn)行回判,比較2 個(gè)方法的精確度,確定BP神經(jīng)網(wǎng)絡(luò)更適用于養(yǎng)老床位需求的分類預(yù)測(cè)。通過(guò)灰色預(yù)測(cè)模型和差分整合移動(dòng)平均自回歸模型求出2022 年各個(gè)指標(biāo)的預(yù)測(cè)值,輸入BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行分類預(yù)測(cè)。運(yùn)用熵權(quán)法對(duì)各類地區(qū)按養(yǎng)老床位的需求程度進(jìn)行評(píng)分,提出具體的養(yǎng)老床位地區(qū)化分配方案。政府在分配養(yǎng)老床位時(shí),需要先對(duì)養(yǎng)老床位需求最多的類別進(jìn)行分配,在每組類別中,需要對(duì)養(yǎng)老床位需求最緊迫的地區(qū)進(jìn)行分類;在養(yǎng)老床位供給量有限的情況下,優(yōu)先解決養(yǎng)老床位需求最多的地區(qū),力圖實(shí)現(xiàn)養(yǎng)老床位在各省間的合理分配。