魏 威,王詩雨
(1.鄭州鐵路職業(yè)技術(shù)學(xué)院,河南 鄭州 450052;2.大眾汽車變速器有限公司,天津 300462)
SPSS(Statistical Product and Service Solutions)是由SPSS 公司于1968 年開發(fā)的一款數(shù)據(jù)分析軟件,它擁有易于操作的圖形界面,包含有標(biāo)準(zhǔn)的數(shù)據(jù)分析方法和多個進(jìn)行統(tǒng)計數(shù)據(jù)和指標(biāo)制圖系統(tǒng),如因子分析(factor analysis)、回歸分析(regression analysis)等。
因子分析是一種用于檢查基本結(jié)構(gòu)如何影響一些需要測量變量結(jié)果的方法集合,它可將同類因子整合在一起,減少整體數(shù)據(jù)量。目前,使用SPSS 軟件進(jìn)行因子分析多用于經(jīng)濟(jì)和社會層面,例如:消費者習(xí)慣研究、市場調(diào)查研究、產(chǎn)品分類等,通過因子分析可將多個復(fù)雜的數(shù)據(jù)整合在一起,縮減成不同因子,得出重要指標(biāo),為管理者在短時間內(nèi)找到問題所在,做出決策提供依據(jù)。
進(jìn)行因子分析一般需要50~1000 個樣本數(shù)據(jù),但經(jīng)驗表明,有10 個以上樣本數(shù)據(jù)也可進(jìn)行因子分析。本文以德國16 個城市(Stadt)的垃圾(Müll)、街道(Straβe)、水(Wasser)、天 然 氣(Gas)、電 力(Strom)和地稅(Steuer)數(shù)據(jù)為案例,利用SPSS 軟件數(shù)據(jù)視圖(dataview)和變量視圖(variableview),對案例進(jìn)行因子分析。表1 是用數(shù)據(jù)視圖顯示的案例數(shù)據(jù),表2 是用變量視圖顯示的案例數(shù)據(jù),表2 標(biāo)簽(label)一欄,是變量單位。
表1 數(shù)據(jù)視圖顯示的案例數(shù)據(jù)
表2 變量視圖顯示的案例數(shù)據(jù)
使用SPSS 數(shù)據(jù)分析軟件進(jìn)行因子分析,重點是對最后生成的若干表格進(jìn)行分析,從而將屬于同一分子下的因素整合在一起。做因子分析的前提是要做KMO 和巴特利特球形檢驗來判斷所得結(jié)果是否適合做因子分析。
KMO 是檢驗統(tǒng)計量,它可用來比較變量間簡單相關(guān)系數(shù)和偏相關(guān)系數(shù)指標(biāo)。檢驗統(tǒng)計量取值一般應(yīng)在0~1 之間,它是一個檢查因子分析合適性的指標(biāo)。統(tǒng)計量越接近1,就越適合做因子分析,0.6 是建議的最低值。在此案例中KMO 值為0.601(見表3),雖然不是很適合做因子分析,但屬于中等偏下。
表3 KMO 和巴特利特球形測試
巴特利特球形檢驗是以相關(guān)矩陣為基礎(chǔ),來判斷相關(guān)數(shù)矩陣對角線的所有元素是否為1,所有非對角線上的元素是否均為零。當(dāng)Sig.(Significance)數(shù)值小于0.05 時,則不適合做因子分析。而表3 中Sig.的數(shù)值為0.505,可進(jìn)行因子分析,但數(shù)值偏小。經(jīng)KMO 和巴特利球形檢驗分析,此案例數(shù)據(jù)量少,不適合做因子分析,這樣就需要通過用其它方法來完成因子分析,如描述性統(tǒng)計表、共同性和旋轉(zhuǎn)后成分矩陣等方法。
描述統(tǒng)計表可顯示各個變量的平均值和標(biāo)準(zhǔn)差,通過SPSS 數(shù)據(jù)分析軟件的菜單功能生成(如表4)。在此表格中如果行列式為0,則說明可能在因子分析中存在計算問題,SPSS 軟件就會發(fā)出警告信息或者無法完成因子分析。另外,變量水價的標(biāo)準(zhǔn)差為1.11490,是6 個變量中的最小標(biāo)準(zhǔn)差,這就意味著16 個德國城市的水價是最相似的。
表4 描述統(tǒng)計表
共同性是一個變量與其他被考慮變量分享的方差集。表5 顯示了每個可解釋因子變量的方差比例。從表中可見,第二列每個變量方差的比例,即每個變量的初值都為1,這種提取方法是主成分分析法,所提取的值應(yīng)該小于或者等于0。當(dāng)值為0 時,表示非常不適合做因子分析,而這里的值都大于0。另外,第三列提取值表示丟失信息的百分比,如變量天然氣價格提取值為0.843,相當(dāng)于84.3%,約85%,代表這個變量中有15%的信息值丟失,共有85%的因素可以解釋變量天然氣價格,其它變量依此類推。
表5 共同性
旋轉(zhuǎn)成分矩陣能夠?qū)⒔Y(jié)果更清晰地表達(dá)出來,在因子分析中運用旋轉(zhuǎn)后成分矩陣非常重要,表6是因子模式矩陣,顯示變量是如何加權(quán)給每個因子和變量的。表6 中的4 列數(shù)值是已提取的旋轉(zhuǎn)因子,這4 個因子代表著變量間的相關(guān)性,取值范圍在-1~+1 之間,值越接近1,做因子分析越有意義,通過因子間的比較人們可以決定每個變量歸屬于哪個因子。如“垃圾價”和“電價”在第一個因子下載荷度很高,分別為0.881 和0.780,“水價”和“天然氣價”在第二個因子下載荷度高,分別為-0.918 和0.739,“道路清洗價格”在第三個因子下載荷度高,為-0.925,“地稅”在第四個因子下載荷度高,為-0.879。根據(jù)6 個變量可知公共變量為價格,只有價格與人們的生活成本有關(guān)。第一個因子中因子得分最高的是垃圾價格和電價,說明這兩個變量與人們生活息息相關(guān),以此類推,地稅與其他變量相比對人們的生活影響最小。因此,可將這4 個因子給出如下建議:因子1,與人們生活質(zhì)量息息相關(guān);因子2,與人們的生活密切相關(guān);因子3,對人們的生活有影響;因子4,可能與人們生活有關(guān)聯(lián)。
表6 旋轉(zhuǎn)成份矩陣
本文介紹了通過SPSS 軟件生成表格來進(jìn)行因子分析,其前提條件是要做KMO 和巴特利特球形檢驗,當(dāng)KMO 值超過0.6,同時巴特利特球形測試顯著性不小于0.05,就可以做因子分析。此案例因數(shù)據(jù)庫中樣本量少,變量彼此相對獨立,只能采用描述性統(tǒng)計、共同性和旋轉(zhuǎn)后成分矩陣方法來完成因子分析,最終將6 個變量劃分成為不同的因子,這些因子構(gòu)成了與人們生活相關(guān)的幾個方面。
[1]Jamie DeCoster,Overview of Factor Analysis,August 1,1998.
[2]Stevens,J.P.(1992).Applied Multivariate Statistics for the Social Sciences (2nd edition).
[3]Wegener,D.T.,& Fabrigar,L.R.(in press).Analysis and design for non experimental data:Addressing causal and non causal hypotheses.In R.T.Reis & C.M.Judd(Eds.),Handbook of research methods in social psychology.London:Cambridge University Press.
[4]王楠,苗迪.SPSS 因子分析在企業(yè)社會責(zé)任評價中的應(yīng)用[J].價值工程,2012(3):112-113.