陳 愛(ài)
(南京財(cái)經(jīng)大學(xué) 應(yīng)用數(shù)學(xué)學(xué)院, 江蘇 南京 210046)
?
基于主成分回歸的我國(guó)居民主要蔬菜人均年消費(fèi)量的預(yù)測(cè)
陳愛(ài)
(南京財(cái)經(jīng)大學(xué) 應(yīng)用數(shù)學(xué)學(xué)院, 江蘇 南京 210046)
摘要:基于SAS軟件,通過(guò)建立主成分回歸模型對(duì)我國(guó)主要蔬菜的人均年消費(fèi)量進(jìn)行了估計(jì).首先從影響蔬菜人均年消費(fèi)量的因素出發(fā),通過(guò)主成分分析,構(gòu)造主成分關(guān)于時(shí)間T的函數(shù),預(yù)測(cè)城鎮(zhèn)、鄉(xiāng)村居民蔬菜的總?cè)司晗M(fèi)量.再通過(guò)假定主要蔬菜品種的人均年消費(fèi)量與所有蔬菜的總?cè)司晗M(fèi)量的比例等于主要蔬菜品種的年產(chǎn)量與所有蔬菜的總年產(chǎn)量的比例,擬合預(yù)測(cè)該比例的變化形勢(shì),得到主要蔬菜品種的人均年消費(fèi)量占總?cè)司晗M(fèi)量的比例,從而預(yù)測(cè)了主要蔬菜品種2015-2020年的人均年消費(fèi)量.
關(guān)鍵詞:蔬菜; 主成分回歸; 擬合預(yù)測(cè)
2001年國(guó)務(wù)院頒發(fā)的《中國(guó)食物與營(yíng)養(yǎng)發(fā)展綱要(2001-2010)》中確定了2010年食物與營(yíng)養(yǎng)發(fā)展總體目標(biāo),并就城鄉(xiāng)居民人均每年主要食物攝入量進(jìn)行了明確要求.2003年11月,國(guó)家食物與營(yíng)養(yǎng)咨詢(xún)委員會(huì)又提出了食物消費(fèi)的階段性目標(biāo)及質(zhì)量要求,分別對(duì)2003年、2010年和2020年的具體情況進(jìn)行了規(guī)定.由此可見(jiàn),營(yíng)養(yǎng)安全已經(jīng)成為我國(guó)新時(shí)期下“食物安全”的重點(diǎn)議題[1].自改革開(kāi)放以來(lái),我國(guó)居民的生活水平大幅度提高,營(yíng)養(yǎng)和健康狀況已經(jīng)得到很大改善,而居民的營(yíng)養(yǎng)健康狀態(tài)直接取決于人們的飲食習(xí)慣和飲食結(jié)構(gòu).因此,如何在滿(mǎn)足居民身體健康所需營(yíng)養(yǎng)均衡的條件下,進(jìn)行適度的蔬菜消費(fèi),是目前一項(xiàng)重要課題[2].
1主成分回歸模型簡(jiǎn)介
1.1主成分分析
(1)
它是一個(gè)p階非負(fù)定矩陣.按照主成分分析的思想,我們首先構(gòu)造X1,X2,…,Xp的線性組合
Y1=aT1X=a11X1+a12X2+…+a1pXp
(2)
(3)
若第一主成分Y1在a1方向上的分散性還不足以反映原變量的分散性,則再構(gòu)造X1,X2,…,Xp的線性組合
Y2=aT2X=a21X1+a22X2+…+a2pXp
(4)
為使Y1和Y2所反映的原變量的信息不相重疊,要求Y1和Y2不相關(guān),即
(5)
一般地,若Y1,Y2,…,Yk-1還不足以反映原變量的信息,則進(jìn)一步構(gòu)造X1,X2,…,Xp的線性組合
Yk=aTkX=ak1X1+ak2X2+…+akpXP
(6)
(7)
各主成分的總方差為
(8)
1.2主成分回歸模型
主成分回歸模型就是利用少數(shù)幾個(gè)主成分的得分作為新的自變量進(jìn)行回歸建模[4].
2主要蔬菜人均年消費(fèi)量的主成分回歸預(yù)測(cè)
2.1人均蔬菜量消費(fèi)狀況分析
以下數(shù)據(jù)來(lái)自2014年全國(guó)研究生數(shù)學(xué)建模大賽D題[5].
改革開(kāi)放以來(lái),中國(guó)蔬菜消費(fèi)呈現(xiàn)出有規(guī)律的變化[6].從圖1中可以看出,蔬菜人均消費(fèi)量逐漸降低,在2012年,城鄉(xiāng)蔬菜人均消費(fèi)量分別是112.3kg和84.7kg.
圖1 城鄉(xiāng)居民蔬菜年平均消費(fèi)量趨勢(shì)值
從居民生活費(fèi)用支出方面來(lái)看,由于農(nóng)村居民的蔬菜消費(fèi)基本達(dá)到自給自足[7],所以本文僅用城鎮(zhèn)居民的生活費(fèi)用支出數(shù)據(jù)進(jìn)行分析.2012年城鎮(zhèn)居民的恩格爾系數(shù)為36.2%,而蔬菜的消費(fèi)支出占當(dāng)年食品消費(fèi)支出的9.8%[8].
從表1中可以看出,蔬菜消費(fèi)支出在城鎮(zhèn)居民的食品消費(fèi)支出中所占比重較大,處在第二位,約為肉類(lèi)消費(fèi)支出的一半.而且值得注意的是,中國(guó)城鎮(zhèn)居民的蔬菜消費(fèi)支出已經(jīng)超過(guò)居民糧食消費(fèi)支出.這表明,中國(guó)城鎮(zhèn)居民生活水平趨高,人們將眼光投向滿(mǎn)足身體所需的其他營(yíng)養(yǎng)成分.
表12012年城鎮(zhèn)居民家庭人均年消費(fèi)支出
項(xiàng)目金額/元結(jié)構(gòu)/%食品糧食干豆類(lèi)及豆制品油脂類(lèi)肉禽及制品蛋類(lèi)水產(chǎn)品類(lèi)菜類(lèi)糖類(lèi)其他6040.85458.5372.68161.481183.59119408.92591.9755.062989.621007.591.202.6719.591.976.779.800.9149.49
從2004-2012年中國(guó)蔬菜消費(fèi)支出金額所占比例(表2)來(lái)看,蔬菜消費(fèi)金額不斷上升,而圖1中顯示人均蔬菜年消費(fèi)量卻呈現(xiàn)遞減的趨勢(shì),除了物價(jià)上漲的因素外,也從相當(dāng)程度上說(shuō)明,城鎮(zhèn)居民蔬菜消費(fèi)品質(zhì)的不斷提高.
表22004-2012年中國(guó)城鎮(zhèn)居民蔬菜消費(fèi)支出金額在食品結(jié)構(gòu)中所占的比重
項(xiàng)目200420052006200720082009201020112012蔬菜金額/元256.51276.61298.53348.61409.31446.57501.65527.32591.97食品支出/元2709.62908.63111.936284259.84478.54804.75506.36040.9結(jié)構(gòu)比重/%9.479.519.599.619.619.9710.449.589.8
2.2影響人均蔬菜消費(fèi)量的主要因素分析
2.2.1收入因素
收入的高低直接影響人們的消費(fèi)支出金額和結(jié)構(gòu).根據(jù)圖2發(fā)現(xiàn)城鎮(zhèn)居民可支配收入與蔬菜消費(fèi)量之間存在密切關(guān)系.已有研究表明,蔬菜的收入彈性為正數(shù),其大于糧食,小于肉類(lèi)、水產(chǎn)品與蛋類(lèi)[9].這說(shuō)明隨著收入水平的提高,城鎮(zhèn)居民也相應(yīng)地增加蔬菜的消費(fèi).
圖2 1990-2012年城鎮(zhèn)居民可支配收入與蔬菜消費(fèi)量散點(diǎn)圖
從圖2中可以看出,城鎮(zhèn)居民可支配收入與人均年蔬菜消費(fèi)量之間存在負(fù)相關(guān)性(-0.4712).這說(shuō)明在解決溫飽問(wèn)題之后,城鎮(zhèn)居民會(huì)將更多的購(gòu)買(mǎi)力用于其他高檔食品的消費(fèi).
2.2.2價(jià)格因素
除了收入作為主要的影響因素外,各類(lèi)食物的價(jià)格之間也存在相互影響.根據(jù)理論得知,糧食和蔬菜對(duì)中國(guó)居民來(lái)講是基礎(chǔ)性食物,需求量受價(jià)格的影響沒(méi)有其他的食物強(qiáng),但是作為副食品,蔬菜和其他食物之間有一定的替代關(guān)系[9].從表3可以發(fā)現(xiàn),蔬菜的消費(fèi)價(jià)格指數(shù)相對(duì)其他食品價(jià)格指數(shù)的波動(dòng)率在-0.2~0.2之間,這說(shuō)明在多數(shù)年份里,蔬菜與肉禽、蛋類(lèi)和水產(chǎn)的價(jià)格變動(dòng)幅度處于一種競(jìng)爭(zhēng)關(guān)系.這也從一定程度上說(shuō)明其他食品的價(jià)格對(duì)蔬菜的人均消費(fèi)量是有一定影響的.
表3蔬菜與其他食品消費(fèi)價(jià)格指數(shù)變化幅度
年份蔬菜∶糧食蔬菜∶肉禽蔬菜∶蛋類(lèi)蔬菜∶水產(chǎn)品1994-0.1155-0.05860.15910.10811995-0.06940.00710.11080.112819960.11830.13970.02230.123619970.0977-0.05210.2610-0.002019980.02790.0957-0.01290.060719990.04230.11360.10260.082520000.18170.06290.23910.029520010.0161-0.0069-0.04810.03912002-0.0010-0.0131-0.04290.015520030.15050.13940.19370.17352004-0.2476-0.1913-0.2088-0.156220050.07590.06440.04300.030220060.05360.11430.12710.069220070.0151-0.1807-0.11410.026620080.0374-0.08790.0642-0.028020090.07580.24420.11810.108320100.05990.15160.09420.09622011-0.0989-0.1754-0.1147-0.098120120.09330.11360.17100.0528
除了蔬菜相對(duì)于其他食品的價(jià)格指數(shù)波動(dòng)之外,蔬菜本身的消費(fèi)價(jià)格指數(shù)也作為一項(xiàng)重要的影響因素.從蔬菜價(jià)格對(duì)人均年蔬菜消費(fèi)量的總體影響來(lái)看,蔬菜價(jià)格的上升會(huì)制約蔬菜的消費(fèi)量.從兩者的關(guān)系可以看出,兩者之間具有負(fù)相關(guān),說(shuō)明蔬菜價(jià)格的確是影響其人均消費(fèi)量的重要因素.
2.2.3恩格爾系數(shù)
恩格爾系數(shù)是食品支出總額占個(gè)人消費(fèi)支出總額的比重.恩格爾系數(shù)是用來(lái)反映居民生活水平的一項(xiàng)重要指標(biāo).生活水平直接影響消費(fèi)結(jié)構(gòu),而消費(fèi)結(jié)構(gòu)對(duì)于消費(fèi)量又有較大影響[6].因此,為了直接而全面地考察城鎮(zhèn)居民人均蔬菜消費(fèi)量變化的因果關(guān)系,本文將恩格爾系數(shù)也作為影響變量.
綜上,本文把可支配收入與總收入之比、蔬菜價(jià)格指數(shù)分別相對(duì)糧食、肉類(lèi)、蛋類(lèi)、水產(chǎn)品的價(jià)格指數(shù)之比、蔬菜價(jià)格指數(shù)、恩格爾系數(shù)等作為影響變量,并分別記為X1~X7.
2.3模型建立
2.3.1建模思路
本文從影響人均年蔬菜消費(fèi)量的影響因素出發(fā),通過(guò)主成分分析,構(gòu)造主成分關(guān)于時(shí)間T的函數(shù),預(yù)測(cè)城鎮(zhèn)、鄉(xiāng)村居民蔬菜的總?cè)司晗M(fèi)量.再通過(guò)假定主要蔬菜品種的人均年消費(fèi)量與所有蔬菜的總?cè)司晗M(fèi)量的比例等于主要蔬菜品種的年產(chǎn)量與所有蔬菜的總年產(chǎn)量的比例,擬合預(yù)測(cè)該比例的變化形勢(shì),得到主要蔬菜品種的人均年消費(fèi)量占總?cè)司晗M(fèi)量的比例,從而預(yù)測(cè)主要蔬菜品種的人均年消費(fèi)量.其中蔬菜的總?cè)司晗M(fèi)量=0.5×城鎮(zhèn)居民的人均年蔬菜消費(fèi)量+0.5×農(nóng)村居民的人均年蔬菜消費(fèi)量(0.5為近年來(lái)的城鎮(zhèn)、農(nóng)村人口比例).
2.3.2建立模型
1) 因素間相關(guān)性分析—皮爾遜相關(guān)系數(shù)
根據(jù)皮爾遜相關(guān)系數(shù)
得到相關(guān)系數(shù)表4.
表4影響城鎮(zhèn)居民人均年蔬菜消費(fèi)量各因素的相關(guān)系數(shù)表
X1X2X3X4X5X6X7X11X2-0.86861X3-0.05470.27391X40.0331-0.13250.07431X50.1907-0.04230.29150.66881X6-0.13070.21610.43410.65170.56261X7-0.25370.27150.66450.56720.75610.59411
2) 主成分分析
從相關(guān)系數(shù)表4中不難發(fā)現(xiàn),某些變量之間相關(guān)系數(shù)較大,這說(shuō)明這些影響因素之間可能存在共線性.因此我們采用主成分分析解決共線性的問(wèn)題.
3) 各主成分對(duì)城鎮(zhèn)居民人均年蔬菜消費(fèi)量C1的擬合
因?yàn)?個(gè)影響變量都是0~1之間的數(shù),而城鎮(zhèn)居民人均年蔬菜消費(fèi)量特別大,使得方程兩邊的數(shù)相差太大.為了得到更好的擬合效果,這里對(duì)年消費(fèi)量取對(duì)數(shù)后再進(jìn)行擬合回歸.考慮表達(dá)的簡(jiǎn)潔與擬合的優(yōu)度,我們采用一次線性擬合方式.由SAS軟件得到
(9)
4) 預(yù)測(cè)城鎮(zhèn)居民人均年蔬菜消費(fèi)量C1
(1)對(duì)3個(gè)主成分進(jìn)行關(guān)于時(shí)間T的擬合預(yù)測(cè)
(2)利用上面的擬合函數(shù)可以預(yù)測(cè)到各年的主成分?jǐn)?shù)值,再把它們代入回歸方程(9),即可預(yù)測(cè)到城鎮(zhèn)居民人均年蔬菜消費(fèi)量C1.綜上,主成分回歸預(yù)測(cè)方程為
lnC1=4.745704-0.001171sin0.933T+
0.002397cos0.2426T+0.001291T
(10)
5) 預(yù)測(cè)農(nóng)村居民人均年蔬菜消費(fèi)量C2
各主成分對(duì)年消費(fèi)量擬合以及3個(gè)主成分關(guān)于時(shí)間T的擬合結(jié)果如下:
(11)
利用上面擬合函數(shù)可以預(yù)測(cè)到各年的主成分?jǐn)?shù)值,再把它們代入回歸方程(11),即可預(yù)測(cè)農(nóng)村居民人均年蔬菜消費(fèi)量C2.綜上,主成分回歸預(yù)測(cè)方程為
lnC2=4.410474-0.001085sin0.8701T-
0.003755cos0.4843T-0.002591T
(12)
6) 綜合考慮城鎮(zhèn)、農(nóng)村人均年蔬菜消費(fèi)量,得出我國(guó)人均年蔬菜消費(fèi)量C
C=0.5C1+0.5C2
(13)
7)確定主要蔬菜品種
本文選取中國(guó)1994-2012年間各種蔬菜的年產(chǎn)量進(jìn)行了分析,認(rèn)為年產(chǎn)量占比靠前并且能夠每年出現(xiàn)在前幾名的蔬菜種類(lèi)極有可能是主要的蔬菜品種.理由如下:
(1)自1994-2012年,產(chǎn)量比重占據(jù)前4位的分別為紅薯、土豆、根及塊莖當(dāng)量、以及西紅柿,這說(shuō)明,這幾種蔬菜的產(chǎn)量較高,并且相對(duì)較為穩(wěn)定.
(2)隨著時(shí)間的推移,根及塊莖當(dāng)量逐漸退出蔬菜種類(lèi)的前3,而西紅柿卻逐漸進(jìn)入到蔬菜種類(lèi)的前3中.這說(shuō)明隨著經(jīng)濟(jì)進(jìn)步,營(yíng)養(yǎng)知識(shí)的普及,人們?cè)絹?lái)越認(rèn)識(shí)到,相較于根及塊莖當(dāng)量,西紅柿可能更滿(mǎn)足人們的健康需求,這也解釋了西紅柿產(chǎn)量逐年遞增的原因.
(3)隨著時(shí)間的推移,土豆的年產(chǎn)量逐漸從第3上升到第2,并最終躍居第1,這說(shuō)明人們對(duì)土豆?fàn)I養(yǎng)成分認(rèn)識(shí)的變化,同時(shí)也因?yàn)橥炼挂资?、方便、營(yíng)養(yǎng)成分均衡.
這幾種蔬菜種類(lèi)同時(shí)也是日常生活中常見(jiàn)的種類(lèi),側(cè)面反映了居民的消費(fèi)習(xí)慣及對(duì)生活必需品的購(gòu)買(mǎi)習(xí)慣,從而我們可以認(rèn)為這些蔬菜品種可以滿(mǎn)足日常人體健康需求.因此,我們選擇主要的蔬菜品種為:土豆、根及塊莖當(dāng)量、紅薯以及西紅柿,并分別記為第1~4種蔬菜.
8) 對(duì)主要蔬菜品種的消費(fèi)率進(jìn)行模擬預(yù)測(cè)
考慮土豆、根及其塊莖、西紅柿的消費(fèi)率關(guān)于時(shí)間T呈現(xiàn)線性趨勢(shì),所以對(duì)它們進(jìn)行線性擬合,擬合方程分別為:
r1=0.1492868-0.0024325T
r2=0.059649-0.000563T
r4=0.04266+0.25467T
紅薯的消費(fèi)率關(guān)于時(shí)間T呈線性遞減趨勢(shì),若擬合線性回歸方程,雖模型顯著,但從2015年開(kāi)始預(yù)測(cè)值均為負(fù)數(shù),與事實(shí)不符.考慮到短時(shí)間預(yù)測(cè),轉(zhuǎn)而采用移動(dòng)平均法,經(jīng)多次嘗試,三步移動(dòng)平均擬合效果最佳,故采用三步移動(dòng)平均法來(lái)預(yù)測(cè)紅薯的消費(fèi)率r3,從2015到2020年其值依次為0.077235,0.077232,0.077467,0.077311,0.077336,0.077372.
9) 擬合預(yù)測(cè)主要的蔬菜品種人均年消費(fèi)量—基于主成分的回歸估計(jì)模型
通過(guò)上面的步驟,我們可以建立最終的模型,即
(14)
其中Ci是第i種蔬菜的人均年消費(fèi)量.
3模型結(jié)果分析
利用式(14)預(yù)測(cè)2015-2020年主要蔬菜品種的人均年消費(fèi)量,結(jié)果見(jiàn)表5.
表52015-2020年居民主要蔬菜品種的人均年消費(fèi)量kg
年份土豆根及塊莖當(dāng)量紅薯西紅柿201510.68064.03996.51327.5834201610.50833.99606.48347.5812201710.38333.93286.34837.5837201810.26083.88306.26197.5901201910.12623.83716.19847.5986202010.00223.79186.12827.6066
預(yù)測(cè)的結(jié)果顯示,主要品種的蔬菜消費(fèi)量只有西紅柿呈現(xiàn)逐漸遞增的趨勢(shì),而土豆、紅薯的人均年消費(fèi)量逐年遞減,這可能是由于隨著經(jīng)濟(jì)水平的提高,人們對(duì)于蔬菜類(lèi)食品消費(fèi)減少,轉(zhuǎn)而消費(fèi)動(dòng)物性食物,或轉(zhuǎn)向消費(fèi)一些高品質(zhì)的水果類(lèi)型.
參考文獻(xiàn):
[1]常平凡.我國(guó)糧食供求形勢(shì)淺析[J].中國(guó)食物與營(yíng)養(yǎng),2004(10):9-12.
[2]譚向勇.中國(guó)主要農(nóng)產(chǎn)品市場(chǎng)分析[M].北京:中國(guó)農(nóng)業(yè)出版社,2001:256-266.
[3]梅長(zhǎng)林,范金城.數(shù)據(jù)分析方法[M].北京:高等教育出版社,2010:113-125.
[4]侯媛媛,王禮力.基于主成分分析基礎(chǔ)上的中國(guó)蔬菜家庭消費(fèi)預(yù)測(cè)[J].統(tǒng)計(jì)與決策,2010(23):91-93.
[5]2014年全國(guó)研究生數(shù)學(xué)建模競(jìng)賽題目[EB/OL].(2014-09-18)[2014-09-19].http://www.shumo.com/home/html/2396.html.
[6]王選選,劉娟英.中國(guó)農(nóng)村居民省際間消費(fèi)結(jié)構(gòu)差異分析[J].數(shù)理統(tǒng)計(jì)與管理,2007,26(5):846-851.
[7]陳鐵飛.我國(guó)蔬菜產(chǎn)業(yè)供需狀況及其走向[J].重慶社會(huì)科學(xué),2013(2):84-93.
[8]張峭,王克.中國(guó)蔬菜消費(fèi)現(xiàn)狀分析與預(yù)測(cè)[J].農(nóng)業(yè)展望,2006,2(10):28-31.
[9]王方舟.河北省農(nóng)村居民蔬菜消費(fèi)量的因素分析[J].廣東農(nóng)業(yè)科學(xué),2012,39(5):225-228.
[10]李瑾,馮獻(xiàn),韓瑞娟.北京市城鎮(zhèn)居民蔬菜消費(fèi)現(xiàn)狀及趨勢(shì)預(yù)測(cè)[J].北方園藝,2015(6):197-202.
(編輯:郝秀清)
較大,戰(zhàn)略整合對(duì)企業(yè)績(jī)效影響最小,這與文中選擇的企業(yè)績(jī)效指標(biāo)有較大關(guān)系,考慮到數(shù)據(jù)的準(zhǔn)確性,本文主要選取的運(yùn)行指標(biāo)和財(cái)務(wù)指標(biāo),表征企業(yè)競(jìng)爭(zhēng)力的定性指標(biāo)選擇較少所致,文化整合能力對(duì)企業(yè)績(jī)效影響位居中間.此外,由于IT能力內(nèi)部結(jié)構(gòu)之間的關(guān)系,戰(zhàn)略整合能力、業(yè)務(wù)與IT系統(tǒng)整合能力、文化整合能力也對(duì)企業(yè)績(jī)效有著間接的正向影響.戰(zhàn)略整合能力對(duì)企業(yè)績(jī)效影響為0.232;業(yè)務(wù)與IT系統(tǒng)整合能力為0.424;文化整合能力為0.411.從綜合影響系數(shù)數(shù)值上看,業(yè)務(wù)與IT系統(tǒng)整合對(duì)企業(yè)績(jī)效影響為最大,戰(zhàn)略整合對(duì)企業(yè)績(jī)效影響最小.
A forecast based on principal component regression of the main vegetable consumption per person in residents in China
CHEN Ai
(Department of Applied Mathematics, Nanjing University of Financeand Economics, Nanjing 210046, China)
Abstract:This article estimated annual per capita consumption through the establishment of the principal component regression model of the main vegetables based on SAS software. Firstly, considering the influence factors of affect vegetables per capita annual consumption, through the principal component analysis,we constructed the principal component of a function of time T, predicted the total annual per capita consumption of rural and town residents′ vegetables. Secondly,we assumed that the main vegetable varieties of annual per capita consumption and the proportion of total annual per capita consumption of all vegetables was equal to the main vegetable varieties of production and the proportion of the total annual output of all vegetables, fitting to predict the percentage changes in the situation, and got the main vegetable varieties of annual per capita consumption accounts for the proportion of the total annual per capita consumption, so as to predict the main vegetable varieties from 2015 to 2020, the per capita annual consumption.
Key words:vegetables; principal component regression; fitting prediction
中圖分類(lèi)號(hào):F222.1
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1672-6197(2016)02-0067-06
作者簡(jiǎn)介:陳愛(ài),女,1571308214@qq.com
收稿日期:2015-05-10