王波,羅楊,王亮,胡靜蕾
(1.國網(wǎng)寧夏電力有限公司吳忠供電公司,寧夏 吳忠 751100;2.國網(wǎng)寧夏電力有限公司,寧夏 銀川 750001;3.濟南銀華信息技術(shù)有限公司,寧夏 銀川 750001)
目前,利用因子分析進行綜合分析評價的研究很多:楊帆[1]等建立的供電營業(yè)廳運營效率[2-3]模型實現(xiàn)了對營業(yè)廳整體服務(wù)資源[4]及運營效率的評估;王磊[5]等針對電能質(zhì)量綜合評估的特點,采用因子分析方法,提出了基于因子分析法的電能質(zhì)量綜合評估模型;宋新甫[6]等基于主成分分析法將電網(wǎng)精準(zhǔn)投資影響因素進行降維分析,得到新的綜合影響因素。本文構(gòu)建基于主成分、因子分析法建立的綜合分析評價模型,其評價結(jié)果能客觀地評估營業(yè)廳的綜合業(yè)務(wù)水平。
主成分分析過程是一種數(shù)學(xué)降維的過程,從多個原始變量中提取出幾個綜合變量,并且這幾個綜合變量能夠涵蓋原始變量的絕大多數(shù)信息,且彼此之間沒有相關(guān)性。
假設(shè)有n個樣品,每個樣品有p項指標(biāo),即X1,X2,…,Xp,這p個指標(biāo)構(gòu)成的p維隨機向量記為X=(X1,X2,…,XP),得到如下原始數(shù)據(jù)矩陣:
主成分分析就是將p個觀測變量綜合成為p個新的綜合變量的過程,即:
簡化為Fj=aj1x1+aj2x2+…+ajpxp。
式中:j=1,2,……p。
式(2)要求模型滿足以下條件:
①Fi,Fj互不相關(guān)(i≠j,i,j=1,2,…,p)
②F1的方差大于F2的方差大于F3的方差,依次類推。
F1為第一主成分,F(xiàn)2為第二主成分,依此類推,F(xiàn)p為第p個主成分。
因子分析是主成分分析的一種延伸和應(yīng)用,利用降維的思想研究原始變量相關(guān)矩陣內(nèi)部的依賴關(guān)系,把一些錯綜復(fù)雜的變量歸結(jié)為少數(shù)綜合因子的統(tǒng)計分析方法。
假設(shè)有n個樣品,p個指標(biāo),要求所選取的p個指標(biāo)間有很強的相關(guān)性。將樣本觀測值構(gòu)成的數(shù)據(jù)陣進行標(biāo)準(zhǔn)化處理,數(shù)據(jù)陣標(biāo)準(zhǔn)化后的矩陣均用X表示,用C1,C2,…,Cm(m
1)X=(X1,X2,…,Xp)T是可觀測隨機向量,且E(X)=0,協(xié)方差矩陣S=cov(X),并且協(xié)差陣S與相關(guān)陣R相等;
2)C=(C1,C2,…,Cm)T(m
ε=(ε1,ε2,…,εp)與W相互獨立,E(ε)=0,ε的協(xié)方差矩陣Sε是對角陣:
即ε的各分量之間也是相互獨立的。
則式(4)成為因子模型:
由模型及其假設(shè)前提可知,公共因子C1,C2,…,Cm(m
以營業(yè)廳前臺人員優(yōu)化調(diào)配為目標(biāo),依據(jù)跨行業(yè)數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程(cross-industry standard process for data mining,CRISP-DM)數(shù)據(jù)分析方法論,以電力營銷業(yè)務(wù)系統(tǒng)[7]營業(yè)廳線上7類業(yè)務(wù)17項指標(biāo)數(shù)據(jù)為基礎(chǔ)數(shù)據(jù),構(gòu)建營業(yè)廳分析評價指標(biāo)體系,如圖1所示。
2.2.1 選擇指標(biāo)數(shù)據(jù)并進行標(biāo)準(zhǔn)化處理
(5)
圖1 營業(yè)廳綜合評價指標(biāo)體系
2.2.2 充分性與相關(guān)性檢驗
在做主成分、因子分析前要判斷他們之間是否有較強相關(guān)性,如果指標(biāo)彼此互相獨立或相關(guān)性較小,則無法從中提取公共因子,判斷能否進行主成分、因子分析的檢驗是KMO(Kaiser-Meyer-Olkin)檢驗[8]和Bartlett(巴特利)球體檢驗[8]。
KMO檢驗是Kaiser,Meyer和Olkin提出的抽樣適合性檢驗,是對原始變量之間的簡相關(guān)系數(shù)和偏相關(guān)系數(shù)的相對大小進行檢驗,取值在0~1之間,值越接近1,變量間相關(guān)性越強,偏相關(guān)性越弱,因子分析效果越好。計算公式為
(6)
式中:E—KMO檢驗;
巴特利球體檢驗主要用于檢驗相關(guān)陣中各變量間的相關(guān)性是否為單位陣,即檢驗各個變量是否各自獨立。
(7)
R—全體的均方誤差MSE。
2.2.3 確定因子個數(shù)
因子個數(shù)的確定可以根據(jù)因子方差和累計方差貢獻率來決定,只取方差大于1(或特征值大于1)的因子,按照因子的累計方差貢獻率來確定,一般要達到60%才能符合要求。
2.2.4 計算因子得分和綜合排名
利用最大方差旋轉(zhuǎn)法對上一步中提出的公共因子進行旋轉(zhuǎn),使得各因子的方差差異達到最大,并計算公因子得分。
因子總得分=因子1×權(quán)重1+因子2×權(quán)重2+…+因子n×權(quán)重n
式中的權(quán)重計算方法,通??梢岳斫鉃橐呀?jīng)提取的各因子的方差貢獻率占累積方差貢獻率的百分比,即累計方差占比。
本文使用Python分析工具,用factor_analyzer包進行主成分、因子分析。分析前,先對采集到的17類原始指標(biāo)數(shù)據(jù)進行標(biāo)準(zhǔn)化處理,這17類指標(biāo)分別為X1-低壓工單數(shù),X2-低壓時戶數(shù),X3-低壓平均工單時長,X4-居民工單數(shù),X5-居民時戶數(shù),X6-居民平均工單時長,X7-退費筆數(shù),X8-退費金額,X9-人工繳費筆數(shù),X10-變更工單數(shù),X11-其他類工單數(shù),X12-發(fā)票數(shù)量,X13-已沖紅數(shù)量,X14-已開具數(shù)量,X15-合同簽訂戶數(shù),X16-變更數(shù)量,X17-新簽類數(shù)量。標(biāo)準(zhǔn)化處理部分結(jié)果如表1所示。
表1 數(shù)據(jù)標(biāo)準(zhǔn)化處理部分結(jié)果
3.2.1 充分性與相關(guān)性檢驗
經(jīng)KMO檢驗,值為0.622,大于0.5;經(jīng)巴特利球形度檢驗值p(Sig值)為0,拒絕原假設(shè),因此適合做主成分及因子分析。
3.2.2 獲取公共因子
這一步用主成分分析法來繪制碎石圖,求解特征值,碎石圖的橫坐標(biāo)指的是因子數(shù)量,縱坐標(biāo)為因子特征值(可以理解為因子對樣本整體的貢獻),此碎石圖顯示特征值在第六個主分量之后開始形成直線,因此,剩余的主分量在變異性中所占比率非常小(接近于零),并且可能不重要。所以選擇特征值大于1的6個因子(FAC1_1、FAC1_2、FAC1_3、FAC1_4、FAC1_5、FAC1_6)作為公共因子,也就是說剩下的因子都能由這6個來涵蓋。其因子數(shù)與因子特征值如圖2所示。
圖2 因子數(shù)與因子特征值
3.2.3 計算綜合得分及排名
以各公因子所對應(yīng)的方差貢獻率比例作為權(quán)重計算綜合得分及排名。
綜合得分Q=FAC1_1×33.041/83.12+FAC2_1×23.794/83.12+FAC3_1×9.445/83.12+FAC4_1×6.57/83.12+FAC5_1×5.61/83.12+FAC6_1×4.665/83.12。
對得出的綜合主成分值,根據(jù)實際結(jié)果、經(jīng)驗與原始數(shù)據(jù)進行了檢驗,符合實際情況。根據(jù)綜合得分公式計算營業(yè)廳得分及排名情況,營業(yè)廳綜合得分及排名后20名見表2,營業(yè)廳綜合得分及排名前10名見表3。
表2 營業(yè)廳綜合得分及排名后20名
續(xù)表2
表3 營業(yè)廳綜合得分及排名前10名
本文以主成分及因子分析方法為基礎(chǔ),通過構(gòu)建營業(yè)廳分析評價模型,并將其運用于營業(yè)廳綜合得分排名實證研究中。該模型從原始指標(biāo)出發(fā),尋找少數(shù)幾個主成分[9]或共同因子作為新的評價指標(biāo),從而降低評價指標(biāo)的維數(shù),可以在信息量損失盡量少的情況下減少評價工作量。該方法具有客觀性,評價數(shù)據(jù)來源于原始指標(biāo),不是人為確定,因此減少了人為判斷因素造成評價結(jié)果的偏差。分析過程完成了去量綱、去相關(guān)性、降維、定權(quán)數(shù)等工作,最后建立1個營業(yè)廳綜合評價模型,并計算出綜合得分和排名。
通過分析營業(yè)廳綜合得分及排名情況,業(yè)務(wù)部門可以結(jié)合實際情況,因地制宜地制定相關(guān)措施進行營業(yè)廳資源的合理配置[10],如條件成熟,可考慮撤并,在確保服務(wù)質(zhì)量的前提下,實現(xiàn)營業(yè)廳工作提質(zhì)增效。
本文充分利用電力營銷業(yè)務(wù)系統(tǒng)營業(yè)廳線上指標(biāo)數(shù)據(jù),獲取需要評價的各營業(yè)廳與工作量指標(biāo)相關(guān)的17類指標(biāo)數(shù)據(jù),構(gòu)建基于因子分析法的供電營業(yè)廳分析評價模型,計算營業(yè)廳得分及綜合排名。通過分析評價結(jié)果,給出了排名較高及排名較低營業(yè)廳列表,為資源優(yōu)化配置提供借鑒,能夠在一定程度上反映營業(yè)廳資源效率的配置情況。