• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      無序多分類資料統(tǒng)計分析方法的選擇及在SPSS上的實現(xiàn)

      2024-01-15 10:00:12張蓼紅馮孟潛包國章張曉君白春艷丁雪梅
      長春師范大學(xué)學(xué)報 2023年12期
      關(guān)鍵詞:無序分類變量

      張蓼紅,馮孟潛,包國章,張曉君,白春艷,丁雪梅

      (1.吉林大學(xué)組織部,吉林 長春 130012;2.吉林大學(xué)中日聯(lián)誼醫(yī)院,吉林 長春 130033;3.吉林大學(xué)新能源與環(huán)境學(xué)院,吉林 長春 130012;4.吉林大學(xué)教務(wù)處,吉林 長春 130012;5.吉林大學(xué)動物科學(xué)學(xué)院,吉林 長春 130062)

      在自然科學(xué)和社會科學(xué)研究中,經(jīng)常需要對無序多分類資料進(jìn)行統(tǒng)計分析。例如,研究患某病仔兔的一個基因(3個基因型)和另一個基因(3個基因型)的分布情況,以及豌豆遺傳性狀實驗中研究豌豆桿的3個性狀和果實的3個性狀的對應(yīng)關(guān)系。再如,通過問卷調(diào)查,研究不同社區(qū)和不同性別居民獲取健康知識途徑(傳統(tǒng)大眾媒介、網(wǎng)絡(luò)、社區(qū)宣傳)是否相同,或者研究不同學(xué)習(xí)階段的學(xué)生(本科生、碩士研究生、博士研究生)學(xué)習(xí)黨的二十大報告內(nèi)容更喜歡的學(xué)習(xí)方式(自學(xué)、專家作報告、小組學(xué)習(xí))等。對于無序多分類資料的統(tǒng)計分析,要考慮變量的數(shù)量、分析目的、統(tǒng)計分析方法的前提條件等。如何快速、準(zhǔn)確地選擇正確的統(tǒng)計分析方法、如何在SPSS上實現(xiàn)統(tǒng)計分析以及如何解讀SPSS輸出結(jié)果,本研究選取典型案例,對上述問題進(jìn)行逐一解答。

      1 基于無序多分類資料的常用的統(tǒng)計分析方法

      通過簡單易懂的典型案例分析和流程圖,厘清和展示針對無序多分類資料的常用的統(tǒng)計分析方法的選擇思路。

      1.1 典型案例分析

      1.1.1 案例描述

      為了提高大學(xué)生學(xué)習(xí)營養(yǎng)健康知識的學(xué)習(xí)效果,對3個學(xué)院(動物科學(xué)學(xué)院、動物醫(yī)學(xué)學(xué)院、植物科學(xué)學(xué)院)的大學(xué)生偏好的學(xué)習(xí)方式(自學(xué)、小組、上課)進(jìn)行問卷調(diào)查,結(jié)果見表1。

      表1 三種學(xué)習(xí)方式在不同學(xué)院和不同性別學(xué)生中的分布情況

      問題1:針對大學(xué)生偏好的學(xué)習(xí)方式進(jìn)行對應(yīng)分析。

      問題2:不同學(xué)院的大學(xué)生偏好的學(xué)習(xí)方式構(gòu)成比有沒有差異?學(xué)院和學(xué)生偏好的學(xué)習(xí)方式之間是否有關(guān)聯(lián)?

      問題3:分析學(xué)院和性別對學(xué)生學(xué)習(xí)方式偏好的影響。

      1.1.2 思路分析

      問題1涉及2個變量,行變量“學(xué)院”有3個水平,列變量“學(xué)生偏好的學(xué)習(xí)方式”有3個水平。行變量和列變量均為無序多分類資料,研究2個變量之間的對應(yīng)關(guān)系,可以采用簡單對應(yīng)分析。

      問題2要求比較三個樣本構(gòu)成比之間的差異,可以采用χ2檢驗;研究2個無序多分類資料的變量之間是否有關(guān)聯(lián),可以采用關(guān)聯(lián)性檢驗。

      問題3涉及3個變量,其中原因變量有2個,為“學(xué)院”和“性別”;結(jié)果變量有1個,為“學(xué)生偏好的學(xué)習(xí)方式”。若要分析2個原因變量對結(jié)果變量的影響以及影響程度,可采用無序多分類Logistic回歸分析。

      1.2 統(tǒng)計分析方法選擇流程

      無序多分類資料統(tǒng)計分析方法選擇的流程圖,如圖1和圖2所示,其中R和C分別表示行數(shù)和列數(shù),且都大于等于3。

      圖1 基于無序多分類資料的R×2、2×C、屬性不同的R×C型常用的統(tǒng)計分析方法選擇的流程圖

      圖2 基于無序多分類資料的常用的多元統(tǒng)計分析方法選擇的流程圖

      2 基于無序多分類資料的常用的統(tǒng)計分析方法在SPSS 19.0上的實現(xiàn)

      2.1 簡單對應(yīng)分析在SPSS 19.0上的實現(xiàn)

      (1)簡單對應(yīng)分析實現(xiàn)步驟。①數(shù)據(jù)錄入和數(shù)據(jù)加權(quán)。數(shù)據(jù)錄入時,在“變量視圖”中為行變量“學(xué)院”和列變量“大學(xué)生偏好的學(xué)習(xí)方式”每個水平賦值(動物醫(yī)學(xué)、植物科學(xué)、動物科學(xué)分別賦值為1、2、3;自學(xué)、小組、上課分別賦值為1、2、3)。加權(quán)步驟:數(shù)據(jù)→加權(quán)個案,加權(quán)個案(W)→頻率變量(F):頻數(shù)→確定。②簡單對應(yīng)分析。分析→降維→對應(yīng)分析,學(xué)院→行,定義范圍(最小值為1,最大值為3)→更新→繼續(xù);偏好的學(xué)習(xí)方式→列,定義范圍(最小值為1,最大值為3)→更新→繼續(xù)→確定。

      (2)結(jié)果解讀。針對問題1的對應(yīng)分析結(jié)果見表2。第一維慣量值為0.038,第二維慣量值為0.003,其相對應(yīng)的百分比分別解釋了總信息量的93.1%和6.9%,前兩個維度累計解釋了總信息量的100%,即二維圖形可以完全表示兩變量間的信息,并且觀察時以第一維度為主。列聯(lián)表行列獨立性的χ2檢驗結(jié)果為χ2=29.981,P=0.000<0.01,表明列聯(lián)表的行列之間有較強(qiáng)的相關(guān)性。

      表2 對應(yīng)分析結(jié)果匯總表

      對應(yīng)分析圖(圖3)表明,維度1區(qū)分度好,維度2區(qū)分度差,動物醫(yī)學(xué)學(xué)院、植物科學(xué)學(xué)院、動物科學(xué)學(xué)院的大學(xué)生分別傾向于選擇上課、自學(xué)、小組學(xué)習(xí)的學(xué)習(xí)方式。

      2.2 χ2檢驗和關(guān)聯(lián)性檢驗在SPSS 19.0上的實現(xiàn)

      (1)χ2檢驗和關(guān)聯(lián)性檢驗步驟。①數(shù)據(jù)錄入和數(shù)據(jù)加權(quán)。數(shù)據(jù)錄入形式和加權(quán)步驟同“2.1”。②χ2檢驗和關(guān)聯(lián)性檢驗。分析→描述統(tǒng)計→交叉表,學(xué)院→行,偏好的學(xué)習(xí)方式→列,統(tǒng)計量→卡方,相依系數(shù)→繼續(xù);單元格→觀察值,期望值,行→繼續(xù)→確定。

      (2)結(jié)果解讀。根據(jù)n(總數(shù))和T(理論頻數(shù))的大小選擇P值[1]。χ2檢驗(表3)的結(jié)果表明,χ2=29.981,n=741,最小期望計數(shù)為51.65,P=0.000<0.01,即3個學(xué)院學(xué)生偏好的學(xué)習(xí)方式構(gòu)成比有極顯著差異。進(jìn)一步對每2個學(xué)院之間的學(xué)生偏好的學(xué)習(xí)方式構(gòu)成比作差異性比較,χ2檢驗的結(jié)果表明,動物醫(yī)學(xué)學(xué)院和植物科學(xué)學(xué)院,χ2=19.322,n=533,最小期望計數(shù)為59.05,P=0.000<0.01,即2個學(xué)院學(xué)生偏好的學(xué)習(xí)方式構(gòu)成比有極顯著差異;動物醫(yī)學(xué)學(xué)院和動物科學(xué)學(xué)院,χ2=23.622,n=483,最小期望計數(shù)為45.22,P=0.000<0.01,即2個學(xué)院學(xué)生偏好的學(xué)習(xí)方式構(gòu)成比有極顯著差異;植物科學(xué)學(xué)院和動物科學(xué)學(xué)院,χ2=2.561,n=466,最小期望計數(shù)為56.69,P=0.278>0.05,即2個學(xué)院學(xué)生偏好的學(xué)習(xí)方式構(gòu)成比沒有差異。

      表3 χ2檢驗結(jié)果

      對稱度量表中關(guān)聯(lián)性檢驗結(jié)果表明,P=0.000<0.05,Pearson列聯(lián)系數(shù)為0.197,表明學(xué)院和學(xué)生偏好的學(xué)習(xí)方式之間有一定關(guān)聯(lián)。

      2.3 無序多分類Logistic回歸分析在SPSS 19.0上的實現(xiàn)

      (1)無序多分類Logistic回歸分析步驟。①數(shù)據(jù)錄入和數(shù)據(jù)加權(quán)。數(shù)據(jù)錄入時,在“變量視圖”中為自變量“學(xué)院”“性別”和因變量“學(xué)生偏好的學(xué)習(xí)方式”的每個水平賦值(動物醫(yī)學(xué)、植物科學(xué)、動物科學(xué)分別賦值為1、2、3;男生、女生分別賦值為1、2;自學(xué)、小組、上課分別賦值為1、2、3)。加權(quán)步驟同2.1。②無序多分類Logistic回歸分析。分析→回歸→多項Logistic回歸,偏好的學(xué)習(xí)方式→因變量,學(xué)院、性別→因子→確定。

      (2)結(jié)果解讀。模型擬合(表4)的結(jié)果表明,似然比卡方檢驗結(jié)果P=0.000<0.01,說明至少有一個自變量系數(shù)不為0,模型有意義。似然比檢驗(表5)的結(jié)果表明,學(xué)院似然比檢驗結(jié)果P=0.000<0.01,性別似然比檢驗結(jié)果P=0.000<0.01,表明學(xué)院和性別對模型的作用都有統(tǒng)計學(xué)意義。參數(shù)估計(表6)的結(jié)果表明(動物科學(xué)學(xué)院和女生為參照,因此其參數(shù)默認(rèn)為0,無法估計),自學(xué)與上課兩種學(xué)習(xí)方式相比,動物醫(yī)學(xué)學(xué)院的學(xué)生比動物科學(xué)學(xué)院的學(xué)生更傾向于選擇上課的學(xué)習(xí)方式(χ2=19.147,P=0.000<0.01,優(yōu)勢比OR值為0.348),而植物科學(xué)學(xué)院與動物科學(xué)學(xué)院的學(xué)生的選擇沒有差別(χ2=0.316,P=0.574>0.05);男生比女生更傾向于選擇自學(xué)的學(xué)習(xí)方式(χ2=7.205,P=0.007<0.01,優(yōu)勢比OR值為1.647,置信區(qū)間為[1.144, 2.370],置信區(qū)間不包括1)。小組學(xué)習(xí)與上課兩種學(xué)習(xí)方式相比,動物醫(yī)學(xué)學(xué)院的學(xué)生比動物科學(xué)學(xué)院的學(xué)生更傾向于選擇上課的學(xué)習(xí)方式(χ2=8.966,P=0.003<0.01,優(yōu)勢比OR值為0.512),而植物科學(xué)學(xué)院與動物科學(xué)學(xué)院的學(xué)生的選擇沒有差別(χ2=2.829,P=0.093>0.05);男生比女生更傾向于選擇小組學(xué)習(xí)的學(xué)習(xí)方式(χ2=10.526,P=0.001<0.01,優(yōu)勢比OR值為1.804,置信區(qū)間為[1.263,2.576],置信區(qū)間不包括1)。由此得出兩個廣義Logit模型:

      表4 模型擬合信息

      表5 似然比檢驗

      表6 參數(shù)估計

      其中,X1指動物醫(yī)學(xué)學(xué)院;X2指植物科學(xué)學(xué)院;X3指男性;ps指各變量組合選擇自學(xué)學(xué)習(xí)方式的概率;pc指各變量組合選擇上課學(xué)習(xí)方式的概率;pt指各變量組合選擇小組學(xué)習(xí)方式的概率。

      表5中,χ2統(tǒng)計量是最終模型與簡化后模型之間在-2倍對數(shù)似然值中的差值。通過從最終模型中省略效應(yīng)而形成簡化后的模型。零假設(shè)就是該效應(yīng)的所有參數(shù)均為0。

      3 結(jié)語

      對于經(jīng)常出現(xiàn)在R×2、2×C、屬性不同的R×C二維列聯(lián)表中的無序多分類資料,χ2檢驗可以進(jìn)行兩個或多個樣本率或構(gòu)成比之間的差異比較,如果R×2或不同屬性的R×C類型之間樣本率或構(gòu)成比有顯著差異,還要利用χ2檢驗進(jìn)一步對每兩個行變量做進(jìn)一步差異比較。χ2檢驗的前提條件是:通常各格的理論頻數(shù)不應(yīng)小于1,且1≤T≤5的格子數(shù)不宜超過格子總數(shù)的1/5[2]。對于不同屬性的R×C類型,如果是雙向無序多分類資料還可以進(jìn)行關(guān)聯(lián)性檢驗。χ2檢驗只能進(jìn)行兩個或多個樣本率或構(gòu)成比之間的差異比較,不能夠進(jìn)行等級強(qiáng)度的差異比較;如果對分組變量無序、指標(biāo)變量有序的單向無序的屬性不同的R×C類型進(jìn)行等級強(qiáng)度差異的比較,例如比較三種藥物的治療效果(顯效、好轉(zhuǎn)、無效),須采用秩和檢驗或Ridit分析或有序Logistic回歸分析,其中非參數(shù)檢驗方法秩和檢驗和Ridit分析兩種統(tǒng)計分析方法結(jié)果是等價的,不受總體分布限制,適用面廣,但不能充分利用信息,檢驗效能低[3-4]。

      無序多分類資料的多元統(tǒng)計分析中,常用對應(yīng)分析和無序多分類Logistic回歸分析。其中,對應(yīng)分析利用降維思維,以二維效應(yīng)圖簡潔、直觀地揭示屬性變量之間以及屬性變量各種狀態(tài)之間的相互關(guān)系[5]。針對兩個變量的簡單對應(yīng)分析是通過SPSS軟件的“降維”下的“對應(yīng)分析”子模塊來完成,三個或者三個以上變量則需要通過“最優(yōu)尺度”子模塊來完成多元對應(yīng)分析(多重對應(yīng)分析)。變量個數(shù)越多,各個變量的類別取值越多時,對應(yīng)分析的優(yōu)勢就越明顯[6]。簡單對應(yīng)分析能夠輸出對應(yīng)分析圖,無序多分類Logistic回歸分析能夠獲得優(yōu)勢比(OR值)以及回歸方程。無序多分類Logistic回歸分析,要求因變量必須是無序多分類資料(自變量資料類型不限),對樣本量也有較高的要求,變量的個數(shù)愈多需要的例數(shù)相應(yīng)也愈大,樣本至少大于100,大于500比較合適,一般每一個自變量至少需要10例結(jié)局[7-9]。本研究案例中,利用SPSS軟件進(jìn)行無序多分類Logistic回歸分析時,無序多分類變量“學(xué)院”、二分類變量“性別”,這2個變量都進(jìn)入到“因子”中,如果再增加一個因素:不同學(xué)習(xí)階段學(xué)生(本科生、碩士生、博士生),則此有序變量也要進(jìn)入到“因子”中,但如果增加的因素是年齡,則此連續(xù)變量就要進(jìn)入到“協(xié)變量”中。進(jìn)行無序多分類Logistic回歸分析,SPSS軟件默認(rèn)因變量的水平中賦值最高即最后一個作為參考類別,也可以手動設(shè)置參考類別,為了方便,最關(guān)心哪個水平就賦值最高、選擇系統(tǒng)默認(rèn)即可。此外,無序多分類Logistic回歸分析還可以考察因素之間的交互作用,只需在點擊“模型”模塊時,將系統(tǒng)默認(rèn)的“主效應(yīng)”改為“全因子”,或者選擇“設(shè)定/步進(jìn)式”,將要考察交互作用的因素選入。

      猜你喜歡
      無序分類變量
      車身無序堆疊零件自動抓取系統(tǒng)
      分類算一算
      抓住不變量解題
      也談分離變量
      分類討論求坐標(biāo)
      數(shù)據(jù)分析中的分類討論
      張博庭:煤電不能再這么無序發(fā)展下去了
      能源(2017年11期)2017-12-13 08:12:30
      教你一招:數(shù)的分類
      高速路上右行規(guī)則與無序行駛規(guī)則的比較研究
      無序體系中的國際秩序
      英吉沙县| 乐山市| 曲松县| 庄河市| 朝阳区| 富宁县| 会宁县| 泗阳县| 元阳县| 潜山县| 黑山县| 嘉兴市| 林芝县| 武功县| 前郭尔| 天长市| 凌源市| 九台市| 云林县| 平远县| 贵溪市| 河北省| 广安市| 富蕴县| 河北省| 芜湖县| 东乌| 平湖市| 乌什县| 镇赉县| 孟连| 二手房| 简阳市| 通城县| 海宁市| 贵溪市| 永川市| 祁门县| 梓潼县| 曲阳县| 尼木县|