黃子航
華南師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院
基于主成分分析法對(duì)廣東工業(yè)企業(yè)效益指標(biāo)的評(píng)價(jià)
黃子航
華南師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院
工業(yè)企業(yè)發(fā)展是工業(yè)的重中之重,以其強(qiáng)大的資金、技術(shù)實(shí)力和產(chǎn)品研發(fā)能力,引領(lǐng)著工業(yè)的發(fā)展方向,引導(dǎo)工業(yè)企業(yè)的發(fā)展對(duì)我國(guó)的工業(yè)發(fā)展具有促進(jìn)作用,本文先對(duì)多元統(tǒng)計(jì)中的主成分分析方法進(jìn)行介紹,推導(dǎo)具體的求解過(guò)程,再運(yùn)用主成分分析方法對(duì)所搜集的相關(guān)數(shù)據(jù)進(jìn)行分析,對(duì)年廣東省個(gè)城市的工業(yè)企業(yè)效益指標(biāo)進(jìn)行分析,把多個(gè)指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)綜合指標(biāo),構(gòu)建指標(biāo)之間的聯(lián)系,結(jié)合不同的企業(yè)發(fā)展影響因素,對(duì)這些指標(biāo)的影響和發(fā)展進(jìn)行合理的評(píng)價(jià),通過(guò)對(duì)這些指標(biāo)的評(píng)價(jià),為當(dāng)?shù)仄髽I(yè)在企業(yè)管理的各方面提出建議,促進(jìn)當(dāng)?shù)仄髽I(yè)的有效管理與發(fā)展,利于加快當(dāng)?shù)仄髽I(yè)的發(fā)展和企業(yè)效益的提高。
主成分分析;工業(yè)企業(yè);效益指標(biāo)
(一)主成分分析的原理
主成分分析是一種無(wú)監(jiān)督學(xué)習(xí)的統(tǒng)計(jì)方法,將原始變量中的大部分變量(即指標(biāo))轉(zhuǎn)化為少數(shù)幾個(gè)變量,得到的變量能代表原始數(shù)據(jù)中的大部分信息,稱為主成分。這種方法的核心思想在于降低模型的維度,減少變量的個(gè)數(shù),這些主成分彼此不相關(guān),每個(gè)主成分都是由原來(lái)的所有指標(biāo)線性組合而成,方差越大的主成分包含的原始信息越多,在解決實(shí)際問(wèn)題時(shí)我們一般選取幾個(gè)能包含原始變量大部分信息(方差較大)的主成分作為新的變量,這樣就達(dá)到了降低維數(shù)的目的,更有利于問(wèn)題后續(xù)的分析與處理。
(二)主成分分析的幾何意義
設(shè)原始變量X是P維隨機(jī)變量,主成分指的是這些原始變量的線性組合所生成的變量,但從幾何的角度看,主成分是原始變量在P維空間中旋轉(zhuǎn)的結(jié)果,使坐標(biāo)軸經(jīng)過(guò)樣品的最大方差處,例如二元變量:
n個(gè)樣品點(diǎn)的分布大約成一個(gè)橢圓, 原始變量為X1, X2, 經(jīng)過(guò)旋轉(zhuǎn)后生成的新變量為F1, F2, 顯然,F(xiàn)1所在直線為樣品點(diǎn)方差最大處,由于F2與F1垂直, 樣品點(diǎn)在F1上的波動(dòng)最大, 在F2上的波動(dòng)最小,因此在研究時(shí)可以忽略F2, 從而達(dá)到簡(jiǎn)化變量的目的。
(三)主成分分析模型的建立與求解
1、主成分分析模型的建立
根據(jù)主成分分析的原理, 求出的主成分之間互不相關(guān), 因此主成分之間的協(xié)方差矩陣是一個(gè)對(duì)角矩陣, 即
根據(jù)第一列的齊次方程的系數(shù)矩陣的行列式為0得出
(2)高校教師數(shù)據(jù)道德水平有待提高。部分教師通過(guò)非法渠道獲取數(shù)據(jù),在提倡保護(hù)知識(shí)產(chǎn)權(quán)的時(shí)代的今天,數(shù)據(jù)同樣受到法律的保護(hù)。通過(guò)非法方式獲取數(shù)據(jù)既受到道德的譴責(zé),也是違法行為。同時(shí)數(shù)據(jù)道德水平的有待提高也從側(cè)面反映出部分教師缺乏數(shù)據(jù)意識(shí),收集數(shù)據(jù)的能力不足,無(wú)法獲取有效數(shù)據(jù)。
至此便建立了一個(gè)完整的主成分分析模型。
2、主成分分析模型的分析與求解
我們運(yùn)用主成分分析模型后可得到p個(gè)主成分,各個(gè)主成分的方差呈遞減趨勢(shì),各個(gè)主成分所包含的信息量也在逐漸減少,因此方差最小的幾個(gè)主成分(如)包含的信息相對(duì)于總體信息來(lái)說(shuō)所占比例很小,可忽略不計(jì)。因此在實(shí)際問(wèn)題的分析中,一般選取部分方差大的主成分,當(dāng)該部分主成分包含的信息量與原有信息量的比值達(dá)到a時(shí),可直接忽略之后的主成分,只選取前面部分的主成分進(jìn)行研究。
我們指定某個(gè)主成分的方差占總方差的比例為該主成分的貢獻(xiàn)率Li,即該特征值占全部特征值的比重,則易得貢獻(xiàn)率越大,說(shuō)明該主成分包含的原始變量的信息越多。主成分個(gè)數(shù)的選取主要取決于累積貢獻(xiàn)率與閥值a的大小,一般取a=80%,即累計(jì)貢獻(xiàn)率至少要達(dá)到80%,這樣就能保證所選取的主成分包含了原始變量的絕大部分信息。
在選取了主成分后,根據(jù)標(biāo)準(zhǔn)化后的原始數(shù)據(jù),分別代入各主成分的代表式,就能得到主成分在各個(gè)樣品中的數(shù)據(jù),稱為主成分得分,根據(jù)主成分的得分再做研究。
(一) 數(shù)據(jù)的收集和預(yù)處理
本文接下來(lái)將用上文介紹的主成分分析模型來(lái)對(duì)廣東省各市在2014年工業(yè)企業(yè)方面的效益指標(biāo)進(jìn)行評(píng)價(jià), 現(xiàn)從廣東統(tǒng)計(jì)年鑒中收集到廣東省各市在2014年工業(yè)企業(yè)方面的效益指標(biāo)數(shù)據(jù),進(jìn)行數(shù)據(jù)預(yù)處理得出如下信息:該數(shù)據(jù)有六個(gè)變量, 其中有五項(xiàng)經(jīng)濟(jì)指標(biāo), 分別為總資產(chǎn)貢獻(xiàn)率, 資產(chǎn)負(fù)債率, 成本費(fèi)用利潤(rùn)率,全員勞動(dòng)生產(chǎn)率, 產(chǎn)品銷售率, 分別記為X1, X2, X3, X4, X5,則xi(x=1,2,3,4,5)為原始變量, 為了方便之后理解分析, 先給出這五項(xiàng)指標(biāo)的大致含義:
(二)模型的應(yīng)用與求解
現(xiàn)運(yùn)用統(tǒng)計(jì)軟件SPSS對(duì)原始數(shù)據(jù)進(jìn)行主成分分析,得到有關(guān)方差和累積貢獻(xiàn)率的數(shù)據(jù),得出前三項(xiàng)主成分的累計(jì)率就已達(dá)到90.086%,大于80%,因此選前三項(xiàng)作為新變量,再觀察輸出的成分矩陣:(見表1)
該矩陣稱為成分矩陣, 也稱為初始因子載荷矩陣, 其中的載荷量表示的是對(duì)應(yīng)的原始變量與主成分之間的相關(guān)系數(shù), 反映了原始變量與主成分之間的密切程度, 從這三列中可以得到如下信息: 第一列中的總資產(chǎn)貢獻(xiàn)率系數(shù)很高, 說(shuō)明第一主成分反映的是企業(yè)的總體運(yùn)作情況, 第二列中的資產(chǎn)負(fù)債率, 全員勞動(dòng)生產(chǎn)率的系數(shù)較高, 說(shuō)明第二主成分主要反映了企業(yè)對(duì)外債務(wù)管理和企業(yè)內(nèi)部生產(chǎn)的情況, 第三列中的資產(chǎn)負(fù)債率, 全員勞動(dòng)生產(chǎn)率, 產(chǎn)品銷售率較高,說(shuō)明第三主成分反映了企業(yè)對(duì)外債務(wù)管理和企業(yè)內(nèi)部生產(chǎn)以及對(duì)外銷售的情況,通過(guò)對(duì)三種主成分的指標(biāo)分析, 我們可以大概得出三種主成分在工業(yè)企業(yè)管理上主要影響的方面。
表1 成份矩陣a
我們把三種主成分分別記為Y1, Y2, Y3, 再由成分得分系數(shù)矩陣:(見表2)
表2 成份得分系數(shù)矩陣
得:
在評(píng)價(jià)主成分的效益時(shí), 主成分的效益指標(biāo)評(píng)價(jià)是基于主成分的實(shí)際經(jīng)濟(jì)意義的, 而主成分的實(shí)際意義是由其線性組合中的系數(shù)大的原始變量所主要決定的, 經(jīng)過(guò)觀察主成分得分系數(shù)矩陣, 第一主成分Y1中的X1系數(shù)最大, 反映的是企業(yè)的綜合實(shí)力, 第二主成分Y2的X2系數(shù)最大, 反映的是企業(yè)對(duì)外的資產(chǎn)流動(dòng)情況, 第三主成分Y3的X4,反映的是企業(yè)對(duì)外銷售能力的情況。(見表3)
表3 成份得分協(xié)方差矩陣
顯然,Y1, Y2, Y3互不相關(guān), 符合主成分分析模型的性質(zhì), 則主成分分析的求解完成。
(三)結(jié)果的分析與評(píng)價(jià)
我們由主成分的方差分析矩陣可以得出總值Y與各主成分之間的關(guān)系:
表4
其中λ1, λ2, λ3分別為Y1, Y2, Y3對(duì)應(yīng)的方差所占的比例, 求得
在求得主成分得分矩陣為后,通過(guò)比較不同主成分Y1, Y2, Y3和總值Y在不同城市中的得分, 并對(duì)新變量進(jìn)行排序:(見表4)
由表4中可看出:茂名和湛江的主成分值很高,而且比其他城市的明顯高出很多,因此屬于高經(jīng)濟(jì)效益城市,陽(yáng)江,廣州,云浮,佛山,肇慶,揭陽(yáng),順德,韶關(guān),梅州,惠州,潮州,珠海,深圳的總主成分值中等偏上,屬于中等經(jīng)濟(jì)效益城市,清遠(yuǎn),河源,江門,中山,汕頭,東莞,汕尾的主成分值偏低,屬于低經(jīng)濟(jì)效益城市。
我們?cè)賹?duì)具體的主成分指標(biāo)進(jìn)行分析,對(duì)于高經(jīng)濟(jì)效益的城市而言,茂名的第二主成分得分較低,說(shuō)明茂名市企業(yè)的對(duì)外資產(chǎn)流動(dòng)運(yùn)作需要加強(qiáng),而對(duì)外銷售能力和企業(yè)的綜合盈利能力很強(qiáng).湛江市企業(yè)的綜合實(shí)力不夠強(qiáng),但在資產(chǎn)流動(dòng)和對(duì)外銷售方面做得不錯(cuò)。
對(duì)于中等經(jīng)濟(jì)效益城市而言,大部分運(yùn)作的不錯(cuò),但有部分城市的部分指標(biāo)存在較大的上升空間,例如揭陽(yáng),梅州,惠州,潮州等市企業(yè)的資產(chǎn)流動(dòng)能力,說(shuō)明城市企業(yè)需加強(qiáng)資金轉(zhuǎn)換,同時(shí)提升人員勞動(dòng)力,做好企業(yè)內(nèi)部建設(shè),對(duì)內(nèi)多鼓勵(lì)員工,完善制度,把企業(yè)多余的資金進(jìn)行有效合理的投資運(yùn)作和利用.順德,梅州,潮州,云浮,珠海等市企業(yè)的對(duì)外銷售能力需加強(qiáng),需花費(fèi)足夠的精力進(jìn)行銷售方面的運(yùn)作,對(duì)產(chǎn)品的效益進(jìn)行評(píng)估,尋找市場(chǎng),大力發(fā)展適銷對(duì)路的產(chǎn)品。
對(duì)于低經(jīng)濟(jì)效益城市而言,如清遠(yuǎn),河源,江門,中山,汕尾,汕頭,東莞等市的企業(yè),應(yīng)提升企業(yè)的綜合實(shí)力,提升企業(yè)員工的素養(yǎng)和技能,鼓勵(lì)員工們的積極性,提升人員勞動(dòng)生產(chǎn)率,培育良好的企業(yè)文化,提升服務(wù)能力,積極推廣自身的產(chǎn)品,從而帶動(dòng)企業(yè)整體實(shí)力的建設(shè)與發(fā)展。
[1]薛毅.統(tǒng)計(jì)建模與R軟件[M].北京:清華大學(xué)出版社,2006.7.
[2] http://www.doc88.com/p-287362953103.html
黃子航,男,1996年,漢族,廣東增城人,華南師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院,2014級(jí)本科生。