吳云霞, 康 娜, 陳紅娟, 劉 靜
(1.河北地質大學, 河北 石家莊 050031;2.安徽省地質礦產勘察局322地質隊, 安徽 馬鞍山 243000)
?
基于主成分分析法的河北省人口文化素質綜合評估
吳云霞1,康娜1,陳紅娟1,劉靜2
(1.河北地質大學, 河北 石家莊050031;2.安徽省地質礦產勘察局322地質隊, 安徽 馬鞍山243000)
摘要:采用主成分分析方法對河北省的11個設區(qū)市進行人口文化素質綜合評估。石家莊、秦皇島、唐山、廊坊高中以上教育較好,專業(yè)技術人員的比例較高。而邯鄲、邢臺、滄州、衡水這四個城市高學歷人才要相對少一些。衡水、邢臺、保定、石家莊9年義務教育推行實現(xiàn)的相對更好,張家口、承德、邯鄲的基礎教育發(fā)展較為薄弱。綜合評估結果與河北省11個設區(qū)市的經濟、社會等綜合發(fā)展水平基本相一致。
關鍵詞:主成分分析; 人口文化素質;spss軟件; 綜合評估
0引言
人口文化素質是衡量人口素質的重要標志之一[1]。目前,國內對于人口文化素質的綜合評估方法都借鑒人口素質PQLI及HDI的構建方法構建人口文化素質綜合評估模型[2-6]。文中采用主成分分析方法,在選取指標相類似的情況下對河北省人口文化素質進行綜合評估,試圖找到文化素質高低的原因,并進行聚類分析,對11個設區(qū)市進行歸類,針對不同類別人口文化素質發(fā)展存在的問題指出對策。
1主成分分析的原理和步驟
主成分分析就是把原有的多個指標轉化成少數(shù)幾個代表性較好的綜合指標,這少數(shù)幾個指標能夠反映原來指標大部分的信息(85%以上),并且各個指標之間保持獨立,避免出現(xiàn)重疊信息。它們通常表示為原始變量的某種線性組合。主成分分析主要起著降維和簡化數(shù)據(jù)結構的作用[7-10]。
設有p個指標,把這p個指標看作p個隨機變量,記為x1,x2,…,xp,主成分分析就是要把這p個指標的問題轉變?yōu)橛懻搈個新的指標F1,F2,…,Fm(m
使其滿足每個主成分的系數(shù)平方和為1,主成分之間相互獨立且方差依次遞減,重要性依次遞減。在SPSS中,主成分分析經常被嵌入到因子分析過程之中。
主成分系數(shù)計算方法為成分矩陣中的數(shù)據(jù)除以主成分相對應的特征值開平方根,便得到主成分中每個指標所對應的系數(shù)。
2指標選擇與數(shù)據(jù)來源
人口文化素質各因素指標的選擇從國際通用的人口素質的評估模型來看,關于文化素質方面一般都是以文化普及率或識字率來反映,而在HDI模型中,則增加了平均受教育年限指標來反映知識變量。因此,選取文盲率來反映文盲人口比例,選取研究生及以上文化程度、大學生、高中、初中及小學文化程度的人口比例來反映人口的文化結構狀況;此外,從人口文化素質的涵義及構成來看,構建的指標體系還必須包含技術方面的因素,因此,選取各級各類專業(yè)技術人口的比例來反映人口的技術狀況。這些指標基本上能從三個不同的方面較全面地反映人口的文化素質狀況[2-3]。
文中數(shù)據(jù)來自河北省統(tǒng)計局第六次人口普查辦公室,所選指標見表1[11]。
表1 河北省11個設區(qū)市人口文化素質各因素指標數(shù)據(jù) %
注:小學、初中、高中、大學??啤⒋髮W本科、研究生文化程度比例分別是占全省6歲以上總人口的比例;文盲率是文盲和半文盲人口占15歲及15歲以上人口的比例;各級各類專業(yè)技術人口比例指各級各類專業(yè)技術人口占16歲及16歲以上就業(yè)人口的比例。
3計算結果
利用SPSS19.0 軟件首先將原始數(shù)據(jù)進行標準化處理
對標準化后的數(shù)據(jù)作統(tǒng)計分析,提取了相關系數(shù)矩陣中兩個主成分,它們對方差的貢獻率分別是65.986% 和23.402%,見表2。
表2 特征值及主成分貢獻率和累計貢獻率 %
表2中,總貢獻率高達89.388%, 超過85%, 適合用主成分分析法。其中第一主成分對應的特征值為5.279,第二主成分對應的特征值為1.872,因子載荷矩陣見表3。
表3 因子載荷矩陣
由成分系數(shù)矩陣得主成分表達式為:
(1)
(2)
利用SPSS軟件分析可知,f1和f2的貢獻率分別是65.986%和23.402%,因此可以得加權得分公式為:
(3)
4綜合分析
從因子載荷矩陣(見表3)可知,利用SPSS19.0提取了2 個主要成分。高中文化程度比例(x3)、大學??莆幕潭缺壤?x4)、大學本科文化程度比例(x5)、研究生文化程度比例(x6)、專業(yè)技術人員比例(x8)標準化后的變量在f1上都有較大的載荷,而其他的文化素質指標在f1上的載荷較小,即f1主要反映高中及高中以上教育和專業(yè)技術人員比例對文化素質的影響,分值越高反映的文化素質越高;在f2上小學文化程度比例(x1),初中文化程度比例(x2),文盲率(x7)載荷較大,即在f2上主要反映初中及初中以下教育對文化素質的影響,分值越低文化素質越高。
根據(jù)式(1)~式(3)計算得到各地區(qū)主成分得分及因子排名情況見表5。
表5 各地區(qū)因子得分排名情況
注:第一主成分(f1)和加權綜合按得分從高到低排序,第二主成分(f2)按得分從低到高排序。
從表5我們發(fā)現(xiàn),石家莊、秦皇島、唐山、廊坊在f1得分較高,排名靠前,說明這些區(qū)市高中以上教育較好,專業(yè)技術人員的比例較高。而邯鄲、邢臺、滄州、衡水這四個城市在f1排名較為靠后,說明這些設區(qū)市的高學歷人才要相對較少。衡水、邢臺、保定、石家莊在f2上排名靠前,說明河北省這幾個設區(qū)市9年義務教育推行實現(xiàn)的相對更好,張家口、承德、邯鄲的基礎教育發(fā)展較為薄弱。
2005年6月6日,河北省委、省政府正式出臺的《關于實施“一線兩廂”區(qū)域經濟發(fā)展戰(zhàn)略的指導意見》,意見的核心是抓“一線”,推“兩廂”。抓“一線”,就是充分利用石家莊、保定、廊坊、唐山、秦皇島五市經濟基礎比較雄厚的優(yōu)勢,發(fā)揮“領跑”作用;推“兩廂”,就是積極推進南部邯鄲、邢臺、衡水、滄州四市這一廂,大力扶持北部張家口、承德這一廂,逐步形成“一線兩廂”區(qū)域經濟共同發(fā)展的大格局。把表5與“一線兩廂”政策中的城市劃分相比較,發(fā)現(xiàn)其與f的排名不謀而合,f排名前四位城市屬于“一線兩廂”的一線城市,f排名后四位城市與南廂的四個城市相一致,張家口與承德在f排名中處于中間位置,屬于北廂的兩個城市。由此發(fā)現(xiàn)基于主成分分析方法進行的河北省人口文化素質的綜合評估與河北省的區(qū)域經濟發(fā)展戰(zhàn)略是相一致的,吻合的較好,說明文中的評估方法具有實際應用價值。
特別關注一下保定,保定屬于“一線兩廂”的一線城市,但是其人口文化素質在f上排在承德之后,人口文化素質與其經濟發(fā)展不一致,也就是其人口文化發(fā)展與其經濟、社會發(fā)展相比是相對滯后的[12]。
5聚類分析
平均聯(lián)接(組間)的樹狀圖如圖1所示。
利用平均距離聚類分析方法對河北省11個設區(qū)市作合理的聚類,根據(jù)聚類分析結果(見表1)將河北省11個設區(qū)市分為四類:
第1類,人口文化素質綜合水平較高型:石家莊、秦皇島,在河北省屬于人口文化素質最高的水平。
第2類,環(huán)京津經濟型:唐山、廊坊,在河北省屬于人口文化素質較高的水平,是河北省人口文化素質中等偏上的城市。
第3類,地理區(qū)位限制型:張家口、承德,屬于河北省人口文化素質中等水平。
第4類,高學歷人才發(fā)展滯后型:邢臺、滄州、邯鄲、保定、衡水是河北省人口文化素質水平相對較低的城市。
圖1平均聯(lián)接(組間)的樹狀圖
6結語
1)所選指標對人口文化素質的影響主要體現(xiàn)在兩個方面,即高中及高中以上教育和專業(yè)技術人員比例對文化素質的影響,分值越高反映的文化素質越高;初中及初中以下教育對文化素質的影響,分值越低文化素質越高。
2)石家莊、秦皇島、唐山、廊坊高中以上教育較好,專業(yè)技術人員的比例較高。這些城市分別是省會、沿海和環(huán)京津城市,屬于人口文化素質綜合水平較高型。衡水、邢臺、保定、石家莊在9年義務教育推行實現(xiàn)的相對更好[13]。
3)衡水、滄州、邢臺、邯鄲高學歷人才和專業(yè)技術人才要相對較少。屬于高學歷人才發(fā)展滯后型。張家口、承德的基礎教育發(fā)展較為薄弱,屬于地理區(qū)位限制型。保定人口文化素質發(fā)展滯后與經濟、社會發(fā)展,屬于人口文化素質與經濟發(fā)展不協(xié)調型[14-15]。
4)采用主成分分析方法對河北省人口文化素質進行綜合評估的結果與河北省區(qū)域經濟發(fā)展戰(zhàn)略相一致,吻合度高,說明文中的評估方法具有實際應用價值,在其他省市以及全國可以嘗試進行數(shù)據(jù)分析,找到不同地區(qū)人口文化素質發(fā)展的癥結。
7建議
人口文化素質綜合排名基本由第一主成分決定,即河北省如果想進一步提升人口文化素質需要加大教育投入力度,全面提升教育水平,特別是提高高中及高中以上和專業(yè)技術人員的教育。
針對高學歷人才發(fā)展滯后型,河北省需優(yōu)化區(qū)域布局結構,支持這些地區(qū)發(fā)展高等教育,發(fā)揮省屬重點骨干大學的示范、輻射和帶動作用,對口支援薄弱高校。同時通過產學結合的辦學模式大力發(fā)展職業(yè)技術教育[16]。
針對地理區(qū)位限制型地方政府應加大基礎教育投入力度,克服地理區(qū)位的問題,制定符合當?shù)匦枨蟮恼?,鞏固“普及九年制義務教育”,不斷提高農村地區(qū)適齡人口的小學和初中入學率、畢業(yè)率,減少青少年文盲半文盲比例,解決好當?shù)厝丝诘南乱淮芙逃龁栴}[17]。
文中是主成分分析方法在人口文化素質綜合評價中的首次應用,研究結果清晰反映了河北省不同地區(qū)人口文化素質的優(yōu)勢和劣勢,特別是存在的問題,有助于河北省教育、人才管理部門從總體設計層面,到具體的教育階段制定合理的人口文化素質提高計劃,綜合提高河北省的人口文化素質。
參考文獻:
[1]景躍軍,謝喆.中國人口文化程度的影響因素研究.人口學刊,1995(1):26-29.
[2]張霞,蘇為華.人口文化素質綜合評估[J].統(tǒng)計應用,2004(1):37-40.
[3]張鳴宇,李輝.吉林省人口文化素質研究[D].長春:吉林大學,2011.
[4]段力剛.基于群決策:層次分析和PQLI法的人口素質與經濟發(fā)展問題研究[D].保定:河北大學,2009.
[5]趙秋成.PQLI法的不足及其改進[J].上海統(tǒng)計,1998(1):32-34.
[6]朱計生,錢金平.人口素質的綜合評判方法[J].系統(tǒng)工程理論與實踐,1992(5):45-50.
[7]葉曉楓,王志良.主成分分析法在水資源評價中的應用[J].河南大學學報:自然科學版,2007,37(3):276-279.
[8]漆勇方.主成分分析法在環(huán)境污染評估中的應用[J].萍鄉(xiāng)高等??茖W校學報,2012,29(3):40-44.
[9]劉濤.基于主成分分析的山東省產業(yè)結構變動影響因素研究[J].山東大學學報:哲學社會科學版,2011(3):107-112.
[10]楊賓峰,寧欣.主成分分析在數(shù)字圖像特征提取中的應用[J].微計算機信息,2007,23(6):282-283.
[11]河北省統(tǒng)計局.河北省2010年第六次全國人口普查主要數(shù)據(jù)公報[EB/OL].(2011-05-08)[2015-01-13].http://www.hetj.gov.cn/hetj/tjgbtg/101374627640719.html.
[12]申亞民.陜西人口素質與經濟發(fā)展[J].西安文理學院學報:自然科學版,2003,18(2):51-55.
[13]賈玲玲.河北省城市化水平綜合評價研究[D].太原:山西師范大學,2010.
[14]李生志,張水龍,常春平,等.河北省人口素質與環(huán)境關系的研究[J].河北師范大學學報:自然科學版,1996(1):89-97.
[15]王霞,張連瑞.河北省人口文化素質淺析[J].河北成人教育學院學報,2005,7(4):70-71.
[16]張志強.我國人口素質水平的統(tǒng)計分析[J].山西財經大學學報,2001,23(2):102-104.
[17]李亞麗,于懷昌.GIS支持下的河南省人口素質空間動態(tài)特征研究[J].南陽師范學院學報,2007(6):61-64.
Evaluationofpopulationculturequalitybasedonprincipalcomponentanalysismethod
WUYunxia,KANGNa,CHENHongjuan,LIUJing
(1.HebeiGEOUniversity,Shijiazhuang050031,China;2.BureauofGeologyandMineralExplorationofAnhuiProvince-322GeologicalTeam,Ma’anshan243000,China)
Abstract:Principalcomponentanalysisisusedtomakethecomprehensiveassessmentofpopulationculturalqualityinelevenmunicipal-levelcitiesinHebeiProvince.High-schooleducationlevelishigherinShijiazhuang,Qinhuangdao,TangshanandLangfangwithhigherproportionofprofessionalandtechnicalpersonnel.ThenumberofpeoplewithhigheracademicqualificationsisrelativelylowerinHandan,Xingtai,CangzhouandHengshui.Nine-yearcompulsoryeducationiswellcarriedoutinHengshui,Xingtai,BaodingandShijiazhuang,butrelativelyweakinZhangjiakou,ChengdeandHandan.Theassessmentresultsarematchedwiththeeconomicandsocialdevelopmentinthecorrespondingareas.
Keywords:principalcomponentanalysis;demographicandculturalquality;spsssoftware;comprehensiveassessment.
收稿日期:2016-01-13
基金項目:2015年度河北省社會科學發(fā)展研究重點課題(2015020211); 河北省第六次全國人口普查招標課題(RKPC-HY05)
作者簡介:吳云霞(1978-),女,漢族,河北石家莊人,河北地質大學講師,碩士,主要從事人口與地理信息系統(tǒng)方面的研究,E-mail:wuyunxia2006@163.com.
DOI:10.15923/j.cnki.cn22-1382/t.2016.3.04
中圖分類號:C922
文獻標志碼:A
文章編號:1674-1374(2016)03-0224-06