劉 群,馮長(zhǎng)煥
(西華師范大學(xué) 數(shù)學(xué)與信息學(xué)院,四川 南充 637009)
?
*1組合賦權(quán)法在聚類(lèi)分析中的應(yīng)用
劉群,馮長(zhǎng)煥
(西華師范大學(xué) 數(shù)學(xué)與信息學(xué)院,四川 南充 637009)
〔摘要〕文章選取了四川省某縣(區(qū))公安局對(duì)當(dāng)?shù)?8個(gè)鎮(zhèn)基于“一標(biāo)三實(shí)”部分項(xiàng)目的考核得分,采用加權(quán)聚類(lèi)分析的統(tǒng)計(jì)方法對(duì)數(shù)據(jù)進(jìn)行分析.綜合考慮各種賦權(quán)法的優(yōu)缺點(diǎn),最后采用組合賦權(quán)法對(duì)各項(xiàng)指標(biāo)進(jìn)行賦權(quán).通過(guò)分析,將該市18個(gè)鎮(zhèn)做了一個(gè)很好的歸類(lèi).
〔關(guān)鍵詞〕聚類(lèi)分析;加權(quán)歐氏距離;組合賦權(quán)法
0引言
“一標(biāo)三實(shí)”是指全面核查和采集全區(qū)標(biāo)準(zhǔn)地址信息、實(shí)有人口信息、實(shí)有房屋信息和實(shí)有單位信息.“一標(biāo)三實(shí)” 基礎(chǔ)信息采集錄入,著力破解人、房、業(yè)等基礎(chǔ)管理底數(shù)不清、情況不明的難題,以實(shí)現(xiàn)“以房找人、以人找房、查房知人、查人知房”的總體目標(biāo),提高公安機(jī)關(guān)對(duì)基本治安要素的管控能力,夯實(shí)公安工作和社會(huì)管理基礎(chǔ),為公安實(shí)戰(zhàn)、社會(huì)管理、黨政決策、服務(wù)民生提供基礎(chǔ)信息支撐,以此逐步建立起與經(jīng)濟(jì)社會(huì)發(fā)展水平、人民群眾需求相適應(yīng)的基礎(chǔ)信息管理新體系.完善好“一標(biāo)三實(shí)” 基礎(chǔ)信息的錄入對(duì)公安機(jī)關(guān)是十分有必要的.而在實(shí)際的信息采集中,每個(gè)鎮(zhèn)并不是百分之百地落實(shí)了該項(xiàng)工作,完成的好壞程度不同,基于這些因素,公安機(jī)關(guān)對(duì)此制定了“一標(biāo)三實(shí)”考核得分表,對(duì)每項(xiàng)考核項(xiàng)目都有相應(yīng)的得分和扣分細(xì)則,最后通過(guò)每月考核得到各鎮(zhèn)對(duì)應(yīng)的得分表.通過(guò)對(duì)各鎮(zhèn)“一標(biāo)三實(shí)”的得分情況,本文采用加權(quán)聚類(lèi)分析的統(tǒng)計(jì)方法對(duì)此進(jìn)行分析,最后對(duì)18鎮(zhèn)進(jìn)行了科學(xué)合理的分類(lèi).
1聚類(lèi)分析
聚類(lèi)分析[1](Cluster Analysis)是根據(jù)“物以類(lèi)聚”的原則,研究對(duì)象的個(gè)體特征,把個(gè)體特征比較接近的樣本聚集成一類(lèi)的方法.聚類(lèi)分析在經(jīng)濟(jì)、管理、社會(huì)學(xué)、醫(yī)學(xué)等領(lǐng)域都有著廣泛應(yīng)用.聚類(lèi)方法有很多,其中最常用同時(shí)也是比較成熟的一種聚類(lèi)方法是系統(tǒng)聚類(lèi)法.系統(tǒng)聚類(lèi)法[2]的基本思想是:設(shè)共有n個(gè)樣品,開(kāi)始將每個(gè)樣品單獨(dú)成一類(lèi).先求出類(lèi)與類(lèi)即樣品與樣品之間的距離,找出距離最近的兩類(lèi),將他們合并成一類(lèi),構(gòu)成n-1類(lèi).然后在求出類(lèi)與類(lèi)之間的距離,將距離最近的兩類(lèi)合并成一類(lèi)……這樣一直下去,每次類(lèi)別減少1個(gè),直到所有樣品合為一類(lèi)為止.
2求解最優(yōu)組合權(quán)重系數(shù)
傳統(tǒng)的聚類(lèi)分析在分類(lèi)過(guò)程中假設(shè)待分類(lèi)樣本的指標(biāo)對(duì)聚類(lèi)結(jié)果的貢獻(xiàn)相同.而B(niǎo)ezdek[3]指出由于對(duì)每個(gè)樣本的特征提取不夠完善,所以每個(gè)分量對(duì)樣本聚類(lèi)的貢獻(xiàn)程度是不均的.在實(shí)際應(yīng)用中我們也發(fā)現(xiàn),各指標(biāo)間具有差異性,對(duì)聚類(lèi)結(jié)果的影響程度不同,所以在聚類(lèi)分析過(guò)程中對(duì)指標(biāo)進(jìn)行加權(quán)是有必要的[4].目前確定權(quán)重系數(shù)的方法有主觀賦權(quán)法、客觀賦權(quán)法[5].其中常用的主觀賦權(quán)法有層次分析法(AHP法)、TACTIC法、特爾斐法(Delphi法)、最小平方法等.常用的客觀賦權(quán)法有夾角余弦法、主成分分析法、熵技術(shù)法等.主觀賦權(quán)法的隨意性較大,受主觀因素影響較大,而客觀賦權(quán)法需要通過(guò)數(shù)學(xué)理論知識(shí)計(jì)算而得,遵循嚴(yán)格的計(jì)算規(guī)則,但有時(shí)計(jì)算結(jié)果沒(méi)有實(shí)際意義,無(wú)法解釋?zhuān)疄榱俗寵?quán)重系數(shù)更合理、更科學(xué),許多學(xué)者提出了綜合主、客觀賦權(quán)法的組合賦權(quán)法[6].本文運(yùn)用不同賦權(quán)法得到的權(quán)重系數(shù)按照離差平方和最大的優(yōu)化原則[7]對(duì)指標(biāo)進(jìn)行賦權(quán),使得評(píng)價(jià)結(jié)果更加科學(xué)、合理.
2.1數(shù)據(jù)標(biāo)準(zhǔn)化處理
對(duì)m個(gè)樣品的n個(gè)評(píng)價(jià)指標(biāo)測(cè)得的數(shù)據(jù)記作:A=[aij]m×n,其中,aij表示第i個(gè)樣本第j個(gè)評(píng)價(jià)指標(biāo)的值,評(píng)級(jí)指標(biāo)一般分為成本型、效益型.成本型指標(biāo)是指數(shù)值越小越好的指標(biāo),效益型指標(biāo)是指數(shù)值越大越好的指標(biāo).對(duì)于矩陣A對(duì)其進(jìn)行如下無(wú)量綱化處理:
(1)
(2)
2.2組合權(quán)重系數(shù)
設(shè)n個(gè)評(píng)價(jià)指標(biāo)有l(wèi)種不同賦權(quán)方法對(duì)指標(biāo)進(jìn)行賦權(quán),記第k種賦權(quán)方法給出的權(quán)系數(shù)向量為:Wk=(wk1,wk2,…,wkn)T,k=1,2,…,l.
綜合考慮各個(gè)賦權(quán)方法的優(yōu)缺點(diǎn),采用組合權(quán)系數(shù)向量:
(3)
令矩陣Wn×l=(W1,W2,…,Wl),Θl×1=(θ1,θ2,…,θl)T,W為l個(gè)權(quán)系數(shù)向量組成的矩陣.
則(3)式可表示W(wǎng)*=WΘ.由組合賦權(quán)法得到的權(quán)重計(jì)算出第i個(gè)方案的綜合評(píng)價(jià)值為:
(4)
一般而言,Di越大表示i第個(gè)方案越優(yōu).
2.3確定最優(yōu)組合權(quán)重系數(shù)
采用各決策方案的綜合評(píng)價(jià)值的離差平方和最大優(yōu)化原則[8],求得W*的最優(yōu)解.其基本思路為:記第i1個(gè)方案的綜合評(píng)價(jià)值Di1與第i2個(gè)方案的綜合評(píng)價(jià)值Di2的離差為:
設(shè)表示第i個(gè)方案的綜合評(píng)價(jià)值與其他各指標(biāo)綜合評(píng)價(jià)值的離差平方和,即:
則m個(gè)方案的離差平方和可表示為:
若令n×n階矩陣B1為:
由此可將目標(biāo)函數(shù)表示為:J(W*)=W*TB1W*=(WΘ)TB1(WΘ)=ΘTWTB1WΘ,目標(biāo)函數(shù)轉(zhuǎn)換成了和Θ有關(guān)的函數(shù),可記為F(Θ).基于m個(gè)方案總的離差平方和最大化優(yōu)化原則,上述問(wèn)題轉(zhuǎn)換成如下優(yōu)化問(wèn)題:
maxF(Θ)=ΘTWTB1WΘ
3加權(quán)聚類(lèi)的實(shí)證分析
3.1數(shù)據(jù)獲取與分析
四川省某縣(區(qū))公安局基于“一標(biāo)三實(shí)”,從2013年10月到2014年4月,對(duì)當(dāng)?shù)?8個(gè)鎮(zhèn)的標(biāo)準(zhǔn)地址、實(shí)有單位、實(shí)有人口、質(zhì)量考核這4個(gè)指標(biāo)每月進(jìn)行一次考核, 矩陣A是獲取的考核成績(jī),其中各項(xiàng)考核指標(biāo)總分均為10分.
3.2對(duì)數(shù)據(jù)規(guī)范化處理
根據(jù)(1)式和(2)式求出規(guī)范化屬性矩陣B=(bij)18×4,
3.3求解最優(yōu)權(quán)重系數(shù)
對(duì)于多指標(biāo)評(píng)價(jià)問(wèn)題,指標(biāo)權(quán)重的確定有不同的方法,并且不同的方法存在各自的優(yōu)點(diǎn)和缺點(diǎn).主觀賦權(quán)法體現(xiàn)了評(píng)價(jià)者的知識(shí)經(jīng)驗(yàn)和主觀愿望,但隨意性較強(qiáng).而客觀賦權(quán)法運(yùn)用了嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)理論知識(shí),但不能體現(xiàn)主觀信息,有時(shí)甚至無(wú)法解釋?zhuān)疚倪x取一種主觀賦權(quán)法和一種客觀賦權(quán)法,綜合二者考慮,運(yùn)用離差平方和最大優(yōu)化原則,確定最終的權(quán)重系數(shù).
根據(jù)定義并運(yùn)用MATLAB求出矩陣B1=(b1ij)4×4如下:
評(píng)價(jià)者給出的主觀權(quán)重向量為W1=(0.30,0.15, 0.20, 0.35)T,運(yùn)用夾角余弦賦權(quán)法[10]求出的客觀權(quán)重向量為W2=(0.31, 0.12, 0.19, 0.38)T,由W1,W2組成4×2的分塊矩W=[W1,W2].
3.4基于組合賦權(quán)法進(jìn)行加權(quán)聚類(lèi)分析
圖1 使用平均聯(lián)接(組間)的樹(shù)狀圖
通過(guò)圖1可以看出,將8個(gè)鎮(zhèn)分成四類(lèi)較為合理.其中第一類(lèi)是會(huì)龍、長(zhǎng)樂(lè)、青居、走馬、龍門(mén);第二類(lèi)是都京、航空港、青松、浸水、闕家、白塔、東觀;第三類(lèi)是江陵、小龍、老君、江東、勝觀;第四類(lèi)是安漢.至此,我們已經(jīng)對(duì)18個(gè)鎮(zhèn)進(jìn)行了比較科學(xué)合理的分類(lèi),但還不能確定哪一類(lèi)最好,哪一類(lèi)最差,因此還需要對(duì)這四類(lèi)進(jìn)行優(yōu)劣評(píng)價(jià).根據(jù)(4)式求出各鎮(zhèn)的綜合評(píng)價(jià)值,得到了綜合評(píng)價(jià)值矩陣:
通過(guò)計(jì)算得到這四類(lèi)的綜合評(píng)價(jià)值的均值分別為:第一類(lèi):0.90;第二類(lèi):0.68;第三類(lèi):0.57;第四類(lèi):0.22.
3.5聚類(lèi)結(jié)果分析
通過(guò)上述分析可以得出聚類(lèi)分析的結(jié)果:第一類(lèi)會(huì)龍、長(zhǎng)樂(lè)、青居、走馬、龍門(mén),綜合評(píng)價(jià)值的均值為0.90,是四類(lèi)中評(píng)價(jià)值最高的一類(lèi),說(shuō)明這幾個(gè)鎮(zhèn)在“一標(biāo)三實(shí)”這項(xiàng)工作中發(fā)揮最為出色;第二類(lèi)是都京、航空港、青松、浸水、闕家、白塔、東觀,綜合評(píng)價(jià)值的均值為:0.68,是僅次于最好的一類(lèi),說(shuō)明這幾個(gè)鎮(zhèn)認(rèn)真完成了這項(xiàng)工作;第三類(lèi)是江陵、小龍、老君、江東、勝觀,綜合評(píng)價(jià)值的均值為0.57,屬于較差類(lèi),可以對(duì)這幾個(gè)鎮(zhèn)予以提醒;第三類(lèi)安漢,綜合評(píng)價(jià)值為0.22,屬于最差一類(lèi),應(yīng)該對(duì)此進(jìn)行批評(píng).這些數(shù)據(jù)可以為各鎮(zhèn)評(píng)優(yōu)評(píng)獎(jiǎng)做一定的參考.
4結(jié)論
本文基于四川省某縣(區(qū))公安局基于“一標(biāo)三實(shí)”對(duì)當(dāng)?shù)?8個(gè)鎮(zhèn)部分指標(biāo)進(jìn)行的考核得分進(jìn)行實(shí)證分析,由于每個(gè)評(píng)價(jià)指標(biāo)對(duì)評(píng)價(jià)結(jié)果的貢獻(xiàn)程度不同,本文對(duì)評(píng)價(jià)指標(biāo)進(jìn)行了加權(quán)處理,使得評(píng)價(jià)結(jié)果更加科學(xué)合理.綜合考慮各種賦權(quán)方法的優(yōu)缺點(diǎn),選擇組合賦權(quán)法對(duì)評(píng)價(jià)指標(biāo)進(jìn)行賦權(quán),在此基礎(chǔ)上進(jìn)行加權(quán)聚類(lèi)分析,最后將這18個(gè)鎮(zhèn)將他們分成了四類(lèi).通過(guò)對(duì)這四類(lèi)的綜合評(píng)價(jià)值的均值比較,對(duì)它們進(jìn)行了優(yōu)劣判斷.通過(guò)對(duì)指標(biāo)的加權(quán)處理,使得聚類(lèi)分析結(jié)果更加科學(xué)、合理.
參考文獻(xiàn):
[1]馬慶國(guó).管理統(tǒng)計(jì)[M].北京:科學(xué)出版社,2002:261
[2]劉劍平,朱坤平,陸元鴻.應(yīng)用數(shù)理統(tǒng)計(jì)[M].上海:華東理工大學(xué)出社,2012:213
[3]BEZDEK J C.Pattern recognition with fuzzy objective function algorithms[M].New York:Plenum Press,1981
[4]高新波.模糊聚類(lèi)分析及其應(yīng)用[M].西安:西安電子科技大學(xué)出版社,2004
[5]葉義成,柯麗華,黃德育.系統(tǒng)綜合評(píng)價(jià)技術(shù)及其應(yīng)用[M].北京:冶金工業(yè)出版社,2006:30-45
[6]張峰.謝振華.程江濤,等.基于向量皮爾森相關(guān)系數(shù)的組合賦權(quán)法[J].火力與指揮控制,2015(5):63-64
[7]王應(yīng)明.離差平方和的多指標(biāo)決策方法及其應(yīng)用[J].中國(guó)軟科學(xué),2000(3):110-113
[8]李永賓,張鳳鳴,李俊濤.基于組合賦權(quán)方法的多目標(biāo)威脅排序[J].空軍工程大學(xué)學(xué)報(bào)(自然科學(xué)版),2007,8(2):7-9
[9]陳華友.多屬性決策中的一種最優(yōu)組合賦權(quán)方法研究[J].運(yùn)籌與管理,2003(2):8-9
[10]戴秋亮.基于夾角余弦賦權(quán)的地區(qū)經(jīng)濟(jì)發(fā)展的模糊綜合評(píng)價(jià)研究[J].商丘職業(yè)技術(shù)學(xué)院學(xué)報(bào),2010(1):49-50
Empirical Analysis of Weighted Euclidean Distance Correction
LIU Qun,FENG Changhuan
(College of Mathematics and Information, China West Normal University, Nanchong 637009, China)
〔Abstract〕This paper selects the Sichuan Province(District) Public Security Bureau of the 18 local towns assessment score that based on "standarized address and three facts" part of the project.Analysis of the data using statistical method of weighted clustering analysis.The advantages and disadvantages of various weighting methods are considered.Finally, the combination weighting method is used to weight the indicators.Through analysis, the city 18 towns to do a very good classification.
〔Key words〕cluster analysis; weighted euclidean distance; cosine weighting method
*收稿日期:2015-09-20
基金項(xiàng)目:西華師范大學(xué)基本科研業(yè)務(wù)費(fèi)專(zhuān)項(xiàng)資金資助(14C004);南充市社科規(guī)劃一般規(guī)劃(NC2013B027).
作者簡(jiǎn)介:劉群(1989-),女,四川資陽(yáng)人,西華師范大學(xué)數(shù)學(xué)與信息學(xué)院在讀碩士研究生,主要從事概率論與數(shù)理統(tǒng)計(jì).
〔文章編號(hào)〕1672-2027(2016)01-0001-05〔中圖分類(lèi)號(hào)〕O213.9
〔文獻(xiàn)標(biāo)識(shí)碼〕A
太原師范學(xué)院學(xué)報(bào)(自然科學(xué)版)2016年1期