IRT框架下的大學生自卑感問卷單維性檢驗

2013-07-24 18:43:52韓雪吳銳陳藝心

赤峰學院學報·自然科學版 2013年21期

關鍵詞：自卑感量表問卷

韓雪，吳銳，陳藝心

（貴州師范大學教育科學學院，貴州貴陽550001）

IRT框架下的大學生自卑感問卷單維性檢驗

韓雪，吳銳，陳藝心

（貴州師范大學教育科學學院，貴州貴陽550001）

本文以大學生自卑感問卷為例，采用項目反應理論框架下的等級反應模型對其進行參數(shù)估計和項目分析，對分析得出的問卷進行模型-數(shù)據(jù)擬合分析.結(jié)果表明：該問卷符合單維性假設和局部獨立性假設條件，該問卷在模型-數(shù)據(jù)擬合分析中，單項目完全擬合，項目對于項目組部分擬合.

項目反應理論；單維性檢驗；局部獨立性檢驗；模型——數(shù)據(jù)擬合

項目反應理論（ItemResponseTheory,IRT）已成為當今心理測量理論的核心發(fā)展內(nèi)容，IRT在測驗編制和測驗質(zhì)量分析中，很大程度地彌補了經(jīng)典測量理論（ClassicalTest Theory,CTT）所存在的缺點，針對0、1計分的學績測驗以及多級計分的人格、態(tài)度等量表，研究者開發(fā)出了不同類型的模型.通常，研究者通過項目特征曲線（ItemCharacteristic Curve,ICC）和項目信息函數(shù)曲線（ItemInformationCurve, IIC），修訂或刪除未達理論要求的項目.分析具有順序性的多級評分量表的主要有三種IRT模型，即分部計分模型[1]、廣義分部計分模型[2]以及等級反應模型（GradedResponse Model,GRM）[3].因此，本文采用等級反應模型對大學生自卑感問卷進行參數(shù)估計.

在IRT測量框架中，有兩條基本假設，也是量表得以運用IRT進行分析的先驗條件，即潛在特質(zhì)空間的單維性假設和局部獨立性假設.單維性是指被試在作答一個量表中所有項目的反應只受到單一因素，即所測潛在特質(zhì)的影響.主成分分析用于檢驗量表的單維性，檢驗數(shù)據(jù)包括碎石圖，因子特征根以及所有項目在提取的單一因子上的載荷.局部獨立性是相同能力水平的被試在各個項目上的答對機率是獨立的，即影響被試作答反應的唯一因素是量表所測的潛在特質(zhì)，當排除這個因素的影響后，不同項目間的作答反應不會有任何關系.對于多級計分的量表進行局部獨立性假設檢驗，一般采用驗證性因素分析，模型擬合后，所得到的所有項目間殘差協(xié)方差均值接近于零，說明該量表符合局部獨立性假設[6].問卷符合這兩個假設，才能夠選擇IRT模型對其進行分析.然而，國內(nèi)大多數(shù)運用IRT修訂問卷的研究當中，多數(shù)研究者只對問卷進行單維性檢驗，忽略了局部獨立性這一理論假設，認為只要驗證了問卷單維性就可以直接進行IRT分析[7-9].這種分析的結(jié)果有待進一步驗證.

本文將首先對大學生自卑感問卷進行單維性和局部獨立性檢驗，然后采用等級反應模型進行項目分析，刪除無效項目，探討項目選項的合理性，最后再對修正后的問卷進行模型擬合檢驗.從多個方面討論問卷的單維性.

1 方法

1.1 研究工具

本文的測量工具是由賈遠娥編制的大學生自卑心理問卷.問卷共29個項目.量表包括交往自卑、素養(yǎng)自卑、形象自卑、家庭自卑和學業(yè)自卑5個維度，問卷采用4級評分，選項從非常不符合到非常符合.整個問卷內(nèi)部一致信度為0.93，通過探索性和驗證性因素分析均表明問卷具有較好的效度[10].

1.2 被試

采用隨機抽樣方法，從貴州大學、貴州師范大學、貴陽醫(yī)學院、貴陽交通職業(yè)學院4所院校抽取學生400人，發(fā)放問卷400份，回收試卷389，其中剔除無效試卷49，獲得有效被試340人，有效試卷回收率85%.

2 結(jié)果與分析

2.1 問卷的單維性檢驗和局部獨立性檢驗

采用SPSS16.0對數(shù)據(jù)進行處理，對整個問卷進行主成分分析，得出因子碎石圖，如圖1所示.

圖1 因子碎石圖

分析中所提取出的第一個因子特征根為9.06，第二個因子特征根為2.46，第一個因子與第二個因子特征根比值為3.68，大于3，說明該問卷符合單維性假設[11].除項目1外，第一個因子在所有項目上的載荷均在在[0.356,0.744]之間.其中，除項目1、3、23、24、25之外，其余項目均在第一因子上的載荷最高.

對單一因子的模型進行驗證性因素分析的結(jié)果得到模型擬合值：χ2/df=2.34，GFI=0.85，CFI=0.85，RMSEA=0.063，說明模型基本達到擬合標準.擬合后所得29個項目間的殘差協(xié)方差均值為0.01，說明該問卷符合局部獨立性假設[12].

因此，該問卷達到IRT的先驗條件，可采用等級反應模型（GRM）對其進行分析.

2.2 項目參數(shù)分析

通過MULTILOG7.03軟件中的GRM對大學生自卑感問卷進行項目分析，得到各項目參數(shù)值.

項目1區(qū)分度（α）為0.3，說明該項目沒有良好的區(qū)分度.一般來說，0.3＜α≤3為可接受的區(qū)分度范圍[13].從各項目閾值來看，項目1與項目23的閾值估計較為極端（絕對值大于4[14]）.從項目最大信息量來看，項目1的信息量最低僅達到0.03，第12題信息量最高達到了1.42.因此，根據(jù)參數(shù)指標，考慮刪除項目1.

2.3 MODFIT模型——數(shù)據(jù)擬合指數(shù)

采用等級反應模型（GRM）對刪除項目1后的大學生自卑感問卷進行擬合分析，得到單項目、項目對、項目組的矯正χ2/df指標.該指標小于3.0，顯示模型與數(shù)據(jù)擬合度良好[16].經(jīng)統(tǒng)計，28個單項目的矯正χ2/df均小于3，符合擬合要求；30個項目對中有12個項目對符合擬合要求；12個項目組中只有兩個項目組符合擬合要求.至今為止，采用單項目、項目對和項目組矯正χ2/df統(tǒng)計量來評價模型對數(shù)據(jù)的絕對擬合時，多數(shù)研究結(jié)果顯示項目對和項目組矯正χ2/df很難達到完全小于3的標準[17-19].

＜11＜22＜33＜44＜55＜7＞7平均值標準差單項目261100000.160.522項目對64225564.4654.057項目組10124225.8874.616

3 討論

自卑感是由于個人對自我評價不當而產(chǎn)生的一類消極的心理體驗.個體心理學理論中將自卑心理描述為自我評價偏低，當個體面對一個他無法適當應付的問題時，他表示他絕對無法解決這個問題[20].對于大學生來說，自卑感更可能的是某一特定情境的產(chǎn)物，由小環(huán)境到大環(huán)境的過度過程中，與大環(huán)境下不斷出現(xiàn)的“優(yōu)秀個體”對比受挫經(jīng)歷，可能是引起這個情境性自卑感的最大原因，而這種自卑感可能是暫時的，階段性的體驗.挫折經(jīng)歷帶來的負性體驗越消極，個體越傾向于選擇自卑感越強烈的作答結(jié)果.IRT模型假設當被試心理特質(zhì)水平在特質(zhì)尺度上的位置高于題目的位置時，被試會贊同題目；當被試位置低于題目的位置時，被試則會不贊同題目[21].通過等級反應模型分析數(shù)據(jù)來看，該問卷大多數(shù)項目有著良好的區(qū)分度，閾值跨度較為寬泛，用于測量大學生群體所獲取的信息量也基本達到標準.其中，項目1的區(qū)分度，閾值以及最大信息量都未能達到測量學要求.從該項目內(nèi)容來看，即“英語不如其他人好”，英語單科成績用于測試被試整個學業(yè)因子的自卑感過于片面，并且，對貴州學生來說，英語成績不良是普遍現(xiàn)象，不論是自卑傾向高的被試還是自卑傾向低的被試均易于選擇英語不好的選項.因此，該項目對于區(qū)分被試自卑感高低的意義不大.因此，結(jié)合項目內(nèi)容和項目分析的數(shù)據(jù)結(jié)果將項目1刪除.其余信息量較小的項目，即項目3、23、24、25、27最大信息量均在[0.2,0.3]之間，根據(jù)已有研究[15]，這些項目應該在內(nèi)容上加以改動，以便獲得更高的信息量.

本文用MODFIT模型—數(shù)據(jù)擬合指標首先對原問卷進行了分析，模型—數(shù)據(jù)擬合是專屬于IRT理論框架下的數(shù)據(jù)與模型是否擬合的分析方法，是相較于常用的主成分分析和驗證性因素分析更為嚴格的單維性檢驗方法.本文所探討的問卷當中，只有單項目的χ2/df均達到擬合標準，項目對和項目組的χ2/df未達到擬合標準的較多，目前為止關于模型—數(shù)據(jù)擬合的研究中只有少部分存在絕對擬合的情況.無論是人格、態(tài)度還是其他一些心理體驗，從其內(nèi)容上來說，都是復雜多向度的.盡管有學者提出過測量學意義上的單維性與心理學意義上的單維性存在差異，但是這種嚴格的單維性標準所產(chǎn)生的分析是否能夠全方面的驗證出量表所測量的這一單一心理特質(zhì)本身涵蓋的多個方面，是值得研究者們深入探討的問題.近年來，關于多維IRT的發(fā)展和研究日益熱烈，多維IRT認為項目和特質(zhì)之間不是一種簡單的線性關系，而是非線性.因此，未來在對自卑感這類心理體驗的測量研究中，可以考慮運用多維IRT的理論和方法，這或許可以得到更為理想的模型—數(shù)據(jù)擬合.

此外，本文所測被試數(shù)為340人，被試數(shù)較少，且僅限于測試貴州的大學生群體.這在一定程度上影響了IRT對項目參數(shù)估計的精確性.在以后的研究過程中，可以盡可能廣泛的尋找更多大學生進行施測，以便得到更有效的結(jié)果.

〔1〕MastersGN.ARaschmodelforpartialcreditscoring [J].Psychometrika.1982,47:149-174.

〔2〕MurakiE.Ageneralizedpartialcreditmodel:ApplicationofanEM-algorithm[J].AppliedPsychological Measurement.1992,16:159.

〔3〕SamejimaF.Estimationoflatentabilityusingaresponse patternofgradedscores[J].PsychometrikaMonograph Supplement.1969,17.

〔4〕MariaOrlandoEdelenBBR.Applyingitemresponse theory(IRT)modelingtoquestionnairedevelopment,evaluation,andrefinement[J].QualityofLifeResearch. 2007,16(1):5-18.

〔5〕薛雯.用項目反應理論分析人際親密能力量表[J].經(jīng)營管理者,2010(6):2-5.

〔6〕范曉玲，吳志勇，韓喆.IRT展開模型在“大學生學習自主性量表”中的應用[J].中國臨床心理學雜志,2009(3):333-336.

〔7〕楊業(yè)兵苗丹民田建全肖利軍.應用項目反應理論對＜中國士兵人格問卷>的項目分析[J].心理學報,2008,40(5): 611-617.

〔8〕賈遠娥.大學生的自卑心理[D].廣西師范大學,2008.

〔9〕LindenWHRK.HandbookofModernItemResponseTheory[M].NewYork:SpringerVerlagIne, 1997.向：心理測量與咨詢.

B841.7

1673-260X（2013）11-0091-02