王二院, 李 俠
(中國人民公安大學(xué)公安管理學(xué)院, 北京 100038)
T檢驗在公安決策中的應(yīng)用
王二院, 李 俠
(中國人民公安大學(xué)公安管理學(xué)院, 北京 100038)
隨著大數(shù)據(jù)時代的到來,警務(wù)工作的數(shù)字化趨勢進一步加強,應(yīng)用統(tǒng)計技術(shù)完善傳統(tǒng)的警務(wù)定性判斷成為警務(wù)改革的重要環(huán)節(jié)。論述3種T檢驗技術(shù)在公安決策中的應(yīng)用:(1)單樣本T檢驗,比較單一樣本均值與已知數(shù)值的差異性;(2)兩個獨立樣本T檢驗,比較兩個獨立樣本均值的差異性;(3)兩個配對樣本T檢驗,比較兩個配對樣本均值的差異性。
T檢驗; 單樣本; 獨立樣本; 配對樣本; 公安決策
T檢驗是用t分布理論來推論差異發(fā)生的概率,從而比較兩個平均數(shù)的差異是否顯著。它與Z檢驗、卡方檢驗并列。T檢驗是戈斯特為了觀測釀酒質(zhì)量而發(fā)明的。戈斯特于1908年在《Biometrika》期刊上公布T檢驗,但因其老板認(rèn)為其為商業(yè)機密而被迫使用筆名student。
2016年9月19日作者利用中國知網(wǎng)檢索“T檢驗”篇名關(guān)鍵詞,2013年以來的全部文獻(xiàn)共有97篇。其中最近一篇論文為“應(yīng)用t分布統(tǒng)計量和t檢驗統(tǒng)計量介紹假設(shè)檢驗原理”(秦國友; 趙耐青;中國衛(wèi)生統(tǒng)計, Chinese Journal of Health Statistics, 2016年04期)。檢索“公安T檢驗”篇名關(guān)鍵詞,2013年以來的全部文獻(xiàn)共有23篇,但缺乏T檢驗的內(nèi)容。檢索“警察T檢驗”篇名關(guān)鍵詞,2013年以來的全部文獻(xiàn)共有4篇,同樣缺乏T檢驗的內(nèi)容。
1.1 基本概念
T檢驗就是利用假設(shè)檢驗的思想,對平均數(shù)的差異進行檢驗。鑒于T檢驗技術(shù)的主要理論基礎(chǔ)是T檢驗,本文認(rèn)為公安T檢驗技術(shù)是T檢驗在公安實踐中的具體應(yīng)用。當(dāng)然,方差已知時用Z檢驗法和多個總體T檢驗的F檢驗是T檢驗技術(shù)的另外兩種情形。
T檢驗技術(shù)可以檢驗定性警務(wù)分析的結(jié)論,增強警務(wù)工作的可信度,指明警務(wù)工作的方向。本文研究的T檢驗技術(shù)包括3種:①單樣本T檢驗;②兩個獨立樣本T檢驗;③兩個配對樣本T檢驗。
T檢驗的一般步驟是:建立假設(shè);計算統(tǒng)計量;查標(biāo)準(zhǔn)值;作出判斷。
1.2T檢驗的軟件操作過程
在“IBM SPSS Statistics 21”(后文簡稱為SPSS)環(huán)境下T檢驗的操作過程基本包括3個步驟。
(1)建立數(shù)據(jù)文件。
(2)打開對話框。選擇菜單欄中的【Analyze(分析)】→【Compare Means(比較均值)】,打開“T檢驗”主對話框,如圖1所示。
圖1 “T檢驗”主對話框
根據(jù)實踐需要分別選擇以下4種模塊實現(xiàn)T檢驗過程:(a)One-SampleTTest;(b)Independent-SampleTTest;(c)Paired-SampleTTest;(d)One-Way ANOVA。
(3)結(jié)果分析。統(tǒng)計軟件會直接給出P值,其檢驗判斷規(guī)則如下(雙側(cè)檢驗):
如果概率P值小于或等于顯著性水平α,則拒絕零假設(shè)H0;
如果概率P值大于顯著性水平α,則接受零假設(shè)H0;
如果將以上理論應(yīng)用于公安實踐則可以將公安定性決策分析升華為公安定量決策分析。
2.1 問題描述
2016年5月13日國家統(tǒng)計局發(fā)布《2015年全國平均工資統(tǒng)計》,數(shù)據(jù)顯示,2015年全國城鎮(zhèn)非私營單位就業(yè)人員年平均工資62 029元;年平均工資最高行業(yè)是金融業(yè)114 777元;年平均工資最低行業(yè)是農(nóng)林牧漁業(yè)31 947元。
某市公安局從全局民警中隨機抽取了30人,核算其2015年工資,數(shù)據(jù)如表1。請問某市公安局民警的工資與全國金融業(yè)、農(nóng)林牧漁業(yè)的年平均工資有無顯著差異。
2.2 理論分析
單樣本T檢驗是比較某一樣本的平均數(shù)與某一確定總體均值是否有統(tǒng)計學(xué)意義上的差異。例如,前文“2.1”某市公安局30名民警平均工資與城鎮(zhèn)非私營單位就業(yè)人員年平均工資是否有顯著性差異?可以運用單樣本T檢驗來解決這個問題。
2.3 軟件操作
首先解決某市公安局民警的工資與全國的年平均工資有無顯著差異的問題,后兩個問題可類推。進行如下假設(shè)檢驗:H0:μ=62 029;H1:μ≠62 029。
(1)打開對話框。根據(jù)表1建立數(shù)據(jù)文件“1.sav”,選擇菜單欄中的【Analyze】→【Compare Means】→【One-Sample T Test】命令,彈出【One-Sam-ple T Test】對話框。
表1 某市公安局30名民警2015年工資
(2)選擇檢驗變量和樣本檢驗值。
(3)設(shè)置顯著性水平。
圖2 “單樣本T檢驗”主對話框
(4)結(jié)束操作。單擊【OK】按鈕,完成操作。此時,軟件輸出結(jié)果出現(xiàn)在結(jié)果瀏覽窗口中。
表2 One-Sample Statistics
表3 One-Sample Test
2.4 公安決策
(1)描述性統(tǒng)計量表
表2呈現(xiàn)了單個樣本的描述性統(tǒng)計量的值,包括參與統(tǒng)計的單個樣本的個案數(shù)(N)、均值、標(biāo)準(zhǔn)差和均值的標(biāo)準(zhǔn)誤。
(2)單樣本T檢驗結(jié)果報表
表3呈現(xiàn)了單樣本T檢驗的結(jié)果,包括T值、自由度(df)、檢驗的概率(Sig.)、均值差值,以及差分的95%置信區(qū)間。如表3所示,本案例T檢驗的T值為-24.855,自由度df=29,雙側(cè)T檢驗的概率Sig.(雙側(cè))=0.000。由于顯著性水平為0.05,而0.000<0.05,因此拒絕零假設(shè),即某市公安局民警的工資與全國的年平均工資相比有顯著差異, 且顯著偏低。
(3)某市公安局民警的工資與金融業(yè)、農(nóng)林牧漁業(yè)的年平均工資有無顯著差異。
(4)某市公安局民警的工資與金融業(yè)的年平均工資有無顯著差異。
參照前述2.3步驟,結(jié)論如下:因為t=-144.100, Sig. (2-tailed)=0.000,所以某市公安局民警的工資與金融業(yè)的年平均工資有顯著差異,且顯著偏低。
(5)某市公安局民警的工資與農(nóng)林牧漁業(yè)的年平均工資有無顯著差異。
參照前述2.3步驟,結(jié)論如下:因為t=43.150, Sig. (2-tailed)=0.000,所以某市公安局民警的工資與農(nóng)林牧漁業(yè)的年平均工資有顯著差異,且顯著偏高。
3.1 問題描述
隨機抽選30名行人對十字路口的交通管理水平進行評分,滿分10分。甲組30人對交警張三負(fù)責(zé)的十字路口A進行評分;乙組30人對交警李四負(fù)責(zé)的十字路口B進行評分;兩個小組評分結(jié)果如表4所示。請問十字路口A和十字路口B的管理水平有無顯著差異。
3.2 理論分析
本例要檢驗兩個樣本的均值是否有顯著性差異。兩獨立樣本T檢驗就是用來檢驗兩個獨立樣本的均值之間是否顯著差異,即檢驗兩樣本所代表的總體的均值是否相同。兩個樣本平均數(shù)差異檢驗要考慮兩個樣本所代表的總體是否正態(tài)分布,總體方差是否已知,還要考慮兩個總體的方差是否齊性,兩個樣本是獨立樣本還是相關(guān)樣本,兩個樣本的容量是否相同等問題。根據(jù)具體的條件還可以運用如下檢驗:Cochran-Cox-test、非參數(shù)檢驗、Z′檢驗。
表4 十字路口A和十字路口B的管理水平評分
3.3 軟件操作
在SPSS中進行兩獨立樣本T檢驗的操作過程如下。
設(shè)十字路口A和十字路口B的管理水平評分均值分別為μ1,μ2建立如下假設(shè)檢驗:
H0:μ1=μ2H1:μ1≠μ2。
圖3 獨立樣本T檢驗主對話框
(1)打開對話框。根據(jù)表4建立數(shù)據(jù)文件“4.sav”,選擇菜單欄中的【Analyze】 →【Compare Means】→【Independent-Sample T Test】命令,彈出【Independent-Sample T Test】對話框。這里變量sco表示兩個交警的得分;變量x是不同交警的標(biāo)志變量,1表示交警張三,2表示交警李四。
(2)選擇檢驗變量和分組變量。
(3)定義組別名稱。(4)完成操作。單擊【OK】按鈕,完成操作。此時,軟件輸出結(jié)果出現(xiàn)在結(jié)果瀏覽窗口中。
表5 Group Statistics
表6 Independent Samples Test
3.4 公安決策
(1)描述性統(tǒng)計量表
表5分別呈現(xiàn)了分組變量的簡單描述性統(tǒng)計量,包括參與檢驗數(shù)據(jù)的個案數(shù)(N)、均值、標(biāo)準(zhǔn)差和均值的標(biāo)準(zhǔn)誤。
(2)獨立樣本T檢驗結(jié)果報表
表6呈現(xiàn)的是對兩獨立樣本進行T檢驗的結(jié)果,包括方差齊性檢驗的F值和概率,T檢驗的t值、自由度(df)和檢驗的概率,均值的差值,標(biāo)準(zhǔn)誤差值和差分的95%置信區(qū)間。
表6中“Levene’s Test for Equality of Variances”下呈現(xiàn)的是檢驗方差齊性的F值(17.246)和顯著性概率p(0.000)。因為P<0.05,拒絕F檢驗的零假設(shè),即兩總體的方差有顯著性差異。所以以下皆參照“Equal variances not assumed”所對應(yīng)的一行數(shù)據(jù)。
兩獨立樣本T檢驗的值為t=-1.651,自由度df=45.045,雙側(cè)檢驗顯著性概率P=0.106>0.05,因此接受兩獨立樣本T檢驗的零假設(shè),即兩個樣本所代表的總體的平均數(shù)相同,十字路口A和十字路口B的管理水平?jīng)]有顯著性差異。
4.1 問題描述
為加強人口管理,某市公安分局對下轄的20個派出所分別進行調(diào)研,收集了相應(yīng)的常住人口和流動人口數(shù)據(jù)(單位:人),
如表7所示。試檢驗派出所常住人口和流動人口數(shù)是否存在顯著差異。
表7 派出所常住人口和流動人口數(shù)據(jù)
4.2 理論分析
兩配對樣本T檢驗的目的是利用來自兩個總體的配對樣本,推斷兩個總體的均值是否存在顯著差異。進行配對樣本檢驗要滿足3個要求:(1)兩組樣本的樣本容量要相同;(2)兩組樣本的觀察值一一對應(yīng);(3)總體服從正態(tài)分布。對兩配對樣本進行平均數(shù)差異檢驗,需要考慮數(shù)據(jù)的各種條件,從而選擇合適的檢驗方法。
4.3 軟件操作
數(shù)據(jù)類型屬于配對樣本的類型,故利用配對樣本T檢驗來分析。
圖4 配對樣本T檢驗主對話框
(1)打開對話框。根據(jù)表7建立數(shù)據(jù)文件
“7.sav”,選擇【Analyze】 →【Compare Means】→【Paired-Sample T Test】命令,彈出【Paired-Sample T Test】對話框。
(2)選擇配對變量。
(3)完成操作。單擊【OK】按鈕,完成操作。此時,軟件輸出結(jié)果出現(xiàn)在結(jié)果瀏覽窗口中。
表8 Paired Samples Statistics
表9 Paired Samples Correlations
表10 Paired Samples Test
4.4 公安決策
(1)描述性統(tǒng)計量表
表8呈現(xiàn)了兩配對樣本的相關(guān)描述性統(tǒng)計量,包括:均值、樣本容量(N)、標(biāo)準(zhǔn)差和均值的標(biāo)準(zhǔn)誤。
(2)相關(guān)性檢驗結(jié)果報表
表9顯示相關(guān)系數(shù)為0.804,顯著性概率p<0.05,因此在95%的置信水平上差異顯著,即常住人口和 流動人口人數(shù)顯著相關(guān),符合用配對樣本T檢驗的前提條件。
(3) 配對樣本T檢驗結(jié)果報表
表10呈現(xiàn)的是配對樣本T檢驗的結(jié)果,包括兩配對樣本差分的均值、標(biāo)準(zhǔn)差、均值的標(biāo)準(zhǔn)95%的置信區(qū)間,還有T檢驗的t值、自由度(df)和顯著性概率(Sig.)。配對樣本T檢驗的t值為-0.752,自由度(df)為19,顯著性概率p=0.461>0.05,因此在95%的置信水平上差異不顯著,即各派出所常住人口和流動人口人數(shù)無顯著差異。
在公安實踐中應(yīng)用T檢驗技術(shù)時應(yīng)注意以下5點:
(1)注意適用條件
可以通過觀察數(shù)據(jù)的分布或進行正態(tài)性檢驗估計數(shù)據(jù)的正態(tài)假設(shè)。方差齊性的假設(shè)可進行F檢驗,或進行更有效的Levene檢驗。由于公安實際數(shù)據(jù)很難獲得,本文所有公安數(shù)據(jù)僅有參考價值,請讀者關(guān)注數(shù)據(jù)處理方法即可。
(2)選取檢驗區(qū)間
單側(cè)檢驗的界值小于雙側(cè)檢驗的界值,因此更容易拒絕,犯第Ⅰ錯誤的可能性大。T檢驗中的P值是接受兩均值存在差異這個假設(shè)可能犯錯的概率。
(3)區(qū)分判別規(guī)則
當(dāng)一個統(tǒng)計量的值落在臨界域內(nèi),這個統(tǒng)計量是統(tǒng)計上顯著的,拒絕零假設(shè)。反之是統(tǒng)計上不顯著的,不拒絕零假設(shè)。
(4)結(jié)合公安實際
P越小,不是說明實際差別越大,而是說越有理由拒絕零假設(shè),越有理由說明兩者有差異;然而差別有無統(tǒng)計學(xué)意義和有無公安實踐上的實際意義并不完全相同。
(5)慎用方差分析
進行兩組以上T檢驗,需要用方差分析進行比較,方差分析被認(rèn)為是T檢驗的推廣,但原始數(shù)據(jù)必須滿足復(fù)雜的條件。
[1] CLEVELAND M,F(xiàn)AVO C M,F(xiàn)RECKA T J,et al. Trends in the International Fight Against Bribery and Corruption[J]. Journal of Business Ethics,2009:199-244.
[2] WOO H,WON S,CHANG K Y,et al. Comparison of muscle activity between two adult groups according to the number of Shaker exercise[J]. Journal of Oral Rehabilitation,2014,41(6):409-415.
[3] 梁鐵成.警察心理健康狀況之調(diào)查[J].中國健康心理學(xué)雜志,2007(11).
[4] 王飛,鄒舒.刑警與監(jiān)管民警的個性心理特質(zhì)比較研究[J].四川警官高等專科學(xué)校學(xué)報,2007(4).
[5] 王璐,王沁,等.SPSS統(tǒng)計分析基礎(chǔ)、應(yīng)用與實戰(zhàn)精粹[M].北京:化學(xué)工業(yè)出版社,2012:74-99.
[6] 賈俊平.統(tǒng)計學(xué)[M].北京:清華大學(xué)出版社,2006:264-297.
[7] 張文彤,鐘云飛.IBM SPSS數(shù)據(jù)分析與挖掘?qū)崙?zhàn)案例精粹[M]. 北京:清華大學(xué)出版社, 2013:102-116.
[8] 佚名. 去年各行業(yè)年平均工資出爐. http:∥edu.gmw.cn/newspaper/2016-05/15/content_112453410.htm.
(責(zé)任編輯 陳小明)
王二院(1972—),男,安徽宿州人,副教授,碩士研究生導(dǎo)師。研究方向為公安管理學(xué)。
D035.39