李 乾,李 彬,劉婷婷,薛曉燕
(1.華北水利水電大學(xué),河南鄭州450011;2.中國(guó)水電顧問(wèn)集團(tuán)元江開(kāi)發(fā)有限公司,云南昆明650051)
可拓聚類方法在水庫(kù)移民后期扶持效果評(píng)價(jià)中的應(yīng)用
李 乾1,李 彬2,劉婷婷1,薛曉燕1
(1.華北水利水電大學(xué),河南鄭州450011;2.中國(guó)水電顧問(wèn)集團(tuán)元江開(kāi)發(fā)有限公司,云南昆明650051)
在分析影響水庫(kù)移民生產(chǎn)生活水平多種因素的基礎(chǔ)上,結(jié)合移民實(shí)際生活狀況,選取敏感性評(píng)價(jià)指標(biāo),應(yīng)用物元和可拓集合理論建立移民生活水平評(píng)價(jià)的可拓聚類分析模型,將移民生活水平劃分為貧困、溫飽、小康、富裕和最富裕5個(gè)等級(jí),通過(guò)可拓聚類分析得到水庫(kù)移民生活水平評(píng)價(jià)結(jié)果。河南省某2個(gè)縣實(shí)例分析表明,可拓聚類方法應(yīng)用于水庫(kù)移民生活水平評(píng)價(jià)中是可行的,評(píng)價(jià)結(jié)果是合理的、有效的。
水庫(kù)移民;生產(chǎn)生活水平;可拓聚類方法;聚類分析;物元模型
在移民后期扶持政策實(shí)施監(jiān)測(cè)評(píng)估中,監(jiān)測(cè)評(píng)估人員通常根據(jù)人均純收入、生活消費(fèi)支出、家電擁有量等單個(gè)量化指標(biāo)做出評(píng)價(jià),但指標(biāo)的多樣性、復(fù)雜性會(huì)影響評(píng)價(jià)結(jié)果的準(zhǔn)確性和合理性??赏鼐垲惙治鍪且晕镌碚摵涂赏貙W(xué)為基礎(chǔ),以物元變換成定性工具,關(guān)聯(lián)函數(shù)定為定量工具,并采取定性和定量相結(jié)合的方法進(jìn)行評(píng)估,保證評(píng)價(jià)結(jié)果的準(zhǔn)確性和合理性。
本文從后扶政策實(shí)施對(duì)移民生活水平影響程度的角度,結(jié)合監(jiān)測(cè)評(píng)估調(diào)查問(wèn)卷設(shè)計(jì)指標(biāo),構(gòu)建了移民生產(chǎn)生活水平評(píng)價(jià)的指標(biāo)體系,并采用可拓聚類分析方法,以物元變換為定性工具,使所調(diào)查指標(biāo)能高效利用,從而確保獲得科學(xué)、合理的評(píng)價(jià)結(jié)果。
可拓聚類分析方法首先通過(guò)聚類分析約簡(jiǎn)屬性與劃分集合P的子集,構(gòu)造它們的經(jīng)典域物元與節(jié)域物元,同時(shí)確定待測(cè)物元。選用比重權(quán)數(shù)方法與主觀經(jīng)驗(yàn)方法確定權(quán)重系數(shù),之后再根據(jù)關(guān)聯(lián)函數(shù)值來(lái)確定待測(cè)樣本隸屬哪一個(gè)子集,從而可得到聚類分析結(jié)果。
1.1 確定經(jīng)典域和節(jié)域
設(shè)Ii(i=1,2,…,m)是p的m個(gè)子集,Ii?P,對(duì)于待測(cè)地點(diǎn)p∈P,然后判斷p屬于哪個(gè)子集Ii,并計(jì)算p屬于任一子集Ii的程度。設(shè)Ri(i=1,2,…,m)為m個(gè)同征物元,便可建立m個(gè)同征物元體,組成同征物元陣。令
式中,C1,C2,…,Cn為Ii的n個(gè)不同的特征;而Xi1,Xi2,…,Xin分別為Ii關(guān)于特征C1,C2,…,Cn的取值范圍,即經(jīng)典域并且有Xij=〈aij,bij〉,(j=1,2,…,n)。為表示特征C1,C2,…,Cn的取值范圍,引入節(jié)域的概念,即
待測(cè)樣本形成的物元Rx為
式中,x1,x2,…,xn分別是待測(cè)樣本的n個(gè)因子觀測(cè)值。
確定關(guān)聯(lián)函數(shù)值待測(cè)樣本各類影響因子與各類關(guān)聯(lián)度Ki(xj)為
(1)
式中,ρ(xj,Xij)=|xj-(aij+bij)/2|-(bij-aij)/2;|Xij|=|aij-bij|;ρ(xj,Xpj)=|xj-(apj+bpj)/2|-(bpj-apj)/2(j=1,2,…,n;i=1,2,…,m)。
把實(shí)變函數(shù)中的距離概念拓展為距概念,將點(diǎn)與區(qū)間的位置關(guān)系采用定量的形式以精確刻畫(huà)。當(dāng)點(diǎn)在區(qū)間內(nèi)時(shí),經(jīng)典數(shù)學(xué)體系認(rèn)為點(diǎn)與區(qū)間的距離為0。而可拓集合利用距的概念,通過(guò)用距的取值不同來(lái)表示點(diǎn)在區(qū)間內(nèi)的各個(gè)位置的不同。在距的基礎(chǔ)上建立相應(yīng)關(guān)聯(lián)函數(shù),將“具有性質(zhì)I”的事物從定性的描述拓展為 “具有性質(zhì)的程度”的量化描述。
1.2 權(quán)系數(shù)的確定
待測(cè)樣本歸屬于哪一類,需要根據(jù)待測(cè)樣本影響程度的不同,以權(quán)系數(shù)表示各類的重要程度,在[0,1]區(qū)間內(nèi)取值。一般情況下,可根據(jù)實(shí)際采用比重權(quán)數(shù)、專家評(píng)價(jià)、層次分析等方法來(lái)確定權(quán)系數(shù)。本文選用比重權(quán)數(shù)法。
比重權(quán)數(shù)方法是根據(jù)某個(gè)指標(biāo),以所有被評(píng)價(jià)對(duì)象觀測(cè)值的比重大小來(lái)確定的一種數(shù)量權(quán)數(shù),采用該指標(biāo)的比重差異信息不同來(lái)衡量其重要性的大小。對(duì)每個(gè)要進(jìn)行判別的類來(lái)說(shuō),待測(cè)樣本每一個(gè)因子的權(quán)系數(shù)λij都是由其與之相對(duì)應(yīng)的特征經(jīng)典域的最大值的比值所占這一類中各個(gè)因子,與其相對(duì)應(yīng)的特征值經(jīng)典域的最大值的比值之和的比例來(lái)確定。即
(2)
式中, j為因子,j=1,2,…,n;i為類別,i=1,2,…,m。
待測(cè)樣本p為i類等級(jí)的隸屬度為
(3)
式中,Ki(p)為待測(cè)樣本各個(gè)指標(biāo)關(guān)于各個(gè)等級(jí)的關(guān)聯(lián)程度在考慮指標(biāo)重要程度情況下的組合值。
根據(jù)最大關(guān)聯(lián)原則來(lái)確定所屬類別,若Ki=maxKi(p),i=1,2,…,m,則可判定樣本p屬于i類。
目前,全國(guó)都在積極開(kāi)展后期扶持政策實(shí)施監(jiān)測(cè)評(píng)估工作。結(jié)合具體工作實(shí)踐,本文選取了河南省的2個(gè)重點(diǎn)監(jiān)測(cè)評(píng)估縣進(jìn)行實(shí)例分析,以驗(yàn)證可拓聚類方法在水庫(kù)移民后期扶持效果評(píng)價(jià)中的適用性。
2.1 指標(biāo)選擇與等級(jí)劃分
以河南省2012年2個(gè)移民后扶監(jiān)測(cè)評(píng)估縣為例,根據(jù)系統(tǒng)性、科學(xué)性、可操作性等原則建立生產(chǎn)生活水平指標(biāo)體系。結(jié)合移民生產(chǎn)生活水平具體情況,將生活水平評(píng)估指標(biāo)從高到低水平依次劃分為一級(jí)(最富裕)、二級(jí)(富裕)、三級(jí)(小康)、四級(jí)(溫飽)、五級(jí)(貧困)等5個(gè)等級(jí)。
結(jié)合該縣水庫(kù)移民的實(shí)際情況,影響生產(chǎn)生活水平的主要因素有土地資源擁有量、水利配套設(shè)施、居住水平、基礎(chǔ)設(shè)施水平、教育醫(yī)療、經(jīng)濟(jì)收入水平等。本文選取人均耕地面積C1、耕地產(chǎn)量水平C2、可灌溉比例C3、人均住房面積C4、基礎(chǔ)設(shè)施水平C5、衛(wèi)生醫(yī)療水平C6、義務(wù)教育普及率C7、人均純收入C8、恩格爾系數(shù)C9作為評(píng)價(jià)指標(biāo)。具體情況見(jiàn)表1。
表1 水庫(kù)移民生活水平評(píng)價(jià)指標(biāo)及劃分標(biāo)準(zhǔn)
表2 待測(cè)物元影響因子的取值
選取的指標(biāo)包括定量和定性指標(biāo),定量指標(biāo)通過(guò)實(shí)際統(tǒng)計(jì)分析得出,如人均純收入C8根據(jù)2012年國(guó)家貧困線為2 300元,2012年的河南省農(nóng)村人口人均純收入為7 525元,全國(guó)農(nóng)村人口人均純收入為7 917元建立物元模型。對(duì)于定性指標(biāo),如基礎(chǔ)設(shè)施水平,結(jié)合調(diào)查當(dāng)?shù)匾泼駥?duì)其滿意度所占比例分為5個(gè)等級(jí):一級(jí)為非常滿意人數(shù)占90%以上,二級(jí)為滿意人數(shù)在70%~90%之間,三級(jí)為基本滿意人數(shù)在50%~70%之間,四級(jí)為不滿意人數(shù)在30%~50%之間,五級(jí)為不做評(píng)價(jià)人數(shù)在0%~30%之間。
2.2 可拓物元模型的建立
根據(jù)移民生活水平等級(jí)劃分,建立物元經(jīng)典域一級(jí)R1、二級(jí)R2、三級(jí)R3、四級(jí)R4和五級(jí)R5。從表1可以看出,影響等級(jí)取值和生活水平的最高級(jí)與最低級(jí)相對(duì)應(yīng)的為大于或小于某個(gè)值,這就給可拓聚類的分析帶來(lái)了不方便。根據(jù)大量實(shí)踐和文獻(xiàn)資料分析,將指標(biāo)影響等級(jí)的最大值與最小值的取值論域來(lái)進(jìn)行處理。待測(cè)物元影響因子的取值見(jiàn)表2。則經(jīng)典物元為
根據(jù)關(guān)聯(lián)函數(shù)定義,計(jì)算待測(cè)樣本對(duì)于5個(gè)等級(jí)的綜合關(guān)聯(lián)度,即隸屬度。將各個(gè)等級(jí)的隸屬度進(jìn)行比較,隸屬度最大的等級(jí)記為待測(cè)點(diǎn)的生產(chǎn)生活水平等級(jí)。選擇以第1個(gè)待測(cè)樣本數(shù)據(jù)1為例,運(yùn)用公式(1)計(jì)算待測(cè)樣本與各類關(guān)聯(lián)度矩陣K
式中,K11=-1.350、K12=-0.9、K13=0.5、K14=-0.329、K15=-0.375、K16=0.2、K17=0.1、K18=-0.473、K19=-0.238;K21=-1.525、K22=-0.85、K23=-0.2、K24=-0.117、K25=-0.2、K26=-0.25、K27=0.25、K28=-0.370、K29=0.09;K31=-2.050、K32=-0.550、K33=-0.1、K34=0.325、K35=0.5、K36=0.25、K37=-0.167、K38=-0.032、K39=-0.030;K41=0、K42=0.45、K43=0.25、K44=-0.216、K45=-0.2、K46=-0.1、K47=-0.5、K48=0.06、K49=-0.273;K51=0.323、K52=-0.500、K53=-0.250、K54=-0.347、K55=-0.429、K56=-0.357、K57=-0.643、K58=-0.340、K59=-0.418。
根據(jù)公式(2),計(jì)算各類別對(duì)應(yīng)的每個(gè)因子的權(quán)系數(shù)λij(i=1,2,…,5,j=1,2,…,9)
式中,λ11=0.054、λ12=0.072、λ13=0.110、λ14=0.093、λ15=0.110、λ16=0.100、λ17=0.137、λ18=0.087、λ19=0.238;λ21=0.061、λ22=0.073、λ23=0.116、λ24=0.119、λ25=0.116、λ26=0.107、λ27=0.145、λ28=0.092、λ29=0.170;λ31=0.063、λ32=0.081、λ33=0.097、λ34=0.134、λ35=0.130、λ36=0.119、λ37=0.162、λ38=0.095、λ39=0.118;λ41=0.057、λ42=0.093、λ43=0.100、λ44=0.150、λ45=0.133、λ46=0.122、λ47=0.166、λ48=0.107、λ49=0.072;λ51=0.047、λ52=0.082、λ53=0.105、λ54=0.142、λ55=0.139、λ56=0.128、λ57=0.174、λ58=0.144、λ59=0.039。
2.3 計(jì)算待測(cè)樣本對(duì)各類的關(guān)聯(lián)度
根據(jù)公式(3),計(jì)算出待測(cè)樣本p對(duì)各類別i=1,2,…,5之關(guān)聯(lián)度Ki(p):K1(1)=-0.454 6、K2(1)=-0.225 4、K3(1)=-0.079 7、K4(1)=-0.100 5、K5(1)=-0.383 7。根據(jù)最大關(guān)聯(lián)原則Ki=maxKi(p)確定所屬類別,得出待測(cè)點(diǎn)1生產(chǎn)生活水平屬于三級(jí)(小康)。
同理,可計(jì)算出待測(cè)點(diǎn)2的關(guān)聯(lián)度Ki(p):K1(2)=-0.418 4、K2(2)=-0.073 9、K3(2)=-0.039 9、K4(2)=-0.230 5、K5(2)=-0.527 0,得出待測(cè)點(diǎn)2生產(chǎn)生活水平也屬于三級(jí)(小康)。
2.4 結(jié)果分析
(1)從計(jì)算結(jié)果可以看出,待測(cè)樣本1中關(guān)聯(lián)度K3(1)與K4(1),兩者絕對(duì)值為0.02,表明該監(jiān)測(cè)評(píng)估縣移民的生產(chǎn)生活剛從溫飽到小康,后期扶持效果良好。
(2)比較2個(gè)監(jiān)測(cè)評(píng)估縣的第3級(jí)關(guān)聯(lián)度K3(2)=-0.039 9>K3(1)=-0.079 7,說(shuō)明待測(cè)點(diǎn)2的生產(chǎn)生活水平比待測(cè)點(diǎn)1要高,與監(jiān)測(cè)評(píng)估實(shí)際調(diào)查情況相符,說(shuō)明該方法用來(lái)評(píng)價(jià)分析水庫(kù)移民后扶實(shí)施效果是可行的。
水庫(kù)移民后期扶持監(jiān)測(cè)評(píng)估涉及經(jīng)濟(jì)、社會(huì)、環(huán)境等多個(gè)方面,本文采用可拓聚類方法對(duì)水庫(kù)移民后期扶持效果評(píng)價(jià)是可行的。在等級(jí)取值與生活水平的最高級(jí)和最低級(jí)對(duì)應(yīng)的是大于或小于某個(gè)數(shù)值時(shí),文中采用指標(biāo)影響等級(jí)的最大值和最小值作為取值論域的處理方法,對(duì)其實(shí)用性尚需進(jìn)一步研究及改進(jìn)。
[1]蔡文, 楊春燕, 林偉初. 可拓工程方法[M]. 北京: 科學(xué)出版社, 1999.
[2]蔡文. 物元模型及其應(yīng)用[M]. 北京: 科學(xué)技術(shù)文獻(xiàn)出版社, 1999.
[3]唐志航. 可拓?cái)?shù)據(jù)挖掘方法及其應(yīng)用研究[D]. 上海: 東華大學(xué)博士學(xué)位論文, 2009.
[4]鄭茂杰. 煤與瓦斯突出預(yù)測(cè)及應(yīng)急響應(yīng)機(jī)制研究[D]. 北京: 中國(guó)礦業(yè)大學(xué), 2009.
[5]李臨杰. 移民生產(chǎn)生活水平監(jiān)評(píng)指標(biāo)體系構(gòu)成研究[J]. 人民黃河, 2003, 25(12): 39- 41.
[6]胡寶柱, 宋向陽(yáng), 趙靜. 水利工程移民后期扶持研究[J]. 海河水利, 2004(5): 7- 10.
(責(zé)任編輯 楊 健)
Application of Extension Clustering Method in the Evaluation of Reservoir Resettlement Post Supporting Effect
LI Qian1, LI Bin2, LIU Tingting1, XUE Xiaoyan1
(1. North China University of Water Resources and Electric Power, Zhengzhou 450011, Henan, China;2. HydroChina Yuanjiang Development Co., Ltd., Kunming 650051, Yunnan, China)
Based on the influence factor analyses of resettlement living level and combined with the actual living conditions of resettlement, the sensitive index are chosen to evaluate resettlement productivity and living standard. Then the extension clustering model for evaluating the resettlement productivity and living standard is established with the matter element and extension theory. The resettlement living levels are divided into five grades of poverty, hunger, well-off, wealthy and richest, and a life evaluation result of reservoir resettlement is got by extension clustering analyses. Taking two counties in Henan Province as example, the results show that the application of extension cluster method in reservoir resettlement living level evaluation is feasible and the results are reasonable and effective.
reservoir resettlement; productivity and living standard; extension clustering method; clustering analysis; matter element model
2015- 04- 17
河南省高??萍紕?chuàng)新團(tuán)隊(duì)支持計(jì)劃(14IRTSTHN028);河南省基礎(chǔ)與前沿技術(shù)研究項(xiàng)目(122300410029);河南省教育廳青年骨干教師資助項(xiàng)目(2013GGJS-086)
李乾(1986—),男,河南虞城人,助教,碩士,主要從事工程管理、水庫(kù)移民等方面的教學(xué)和研究工作.
D632.4
A
0559- 9342(2015)08- 0005- 04