呂 晶
(華東師范大學(xué)教育學(xué)部,上海 200062)
回溯教育科學(xué)的發(fā)展歷程,其每一次重大突破,都離不開研究方法的發(fā)展。教育調(diào)查方法的進(jìn)步,使教育調(diào)查受到重視并逐步走向規(guī)范;教育測(cè)量方法的進(jìn)步,使各種客觀標(biāo)準(zhǔn)化測(cè)量迅速興起;教育統(tǒng)計(jì)方法的進(jìn)步,使教育研究向定量化、科學(xué)化跨進(jìn)了一大步?!肮び破涫拢叵壤淦鳌?,要提高教育科研水平,就必須掌握合適的研究方法。定量和質(zhì)性研究方法是教育科學(xué)研究中最主要的兩大類研究方法。其中,定量研究方法主要服務(wù)于教育實(shí)證研究中的定量研究或混合研究,是對(duì)實(shí)驗(yàn)性數(shù)據(jù)、觀察數(shù)據(jù)和挖掘數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,對(duì)理論假設(shè)進(jìn)行檢驗(yàn)的過程中所應(yīng)用的一系列數(shù)學(xué)、統(tǒng)計(jì)學(xué)方法的統(tǒng)稱。建立在實(shí)證數(shù)據(jù)基礎(chǔ)上的定量研究方法具有客觀性、準(zhǔn)確性和可預(yù)測(cè)性,為教育研究走向科學(xué)化奠定了基礎(chǔ),也越來越受到國(guó)內(nèi)外教育研究者的重視。
定量研究方法被越來越廣泛地應(yīng)用于教育實(shí)證研究中是符合社會(huì)科學(xué)的一般發(fā)展規(guī)律的。社會(huì)科學(xué)是研究并闡述各種社會(huì)現(xiàn)象的特征及其發(fā)展規(guī)律的科學(xué)。而探索社會(huì)現(xiàn)象的特征及其發(fā)展規(guī)律又需要依靠反映社會(huì)現(xiàn)象量的概念抽象和反映社會(huì)現(xiàn)象質(zhì)的概念抽象。相比于質(zhì)的概念抽象,量的概念抽象更直觀、客觀和具體,且往往為質(zhì)的概念抽象提供科學(xué)基礎(chǔ)。換句話說,在沒有量的事實(shí)依據(jù)情況下所進(jìn)行的質(zhì)的研究往往不會(huì)被人們當(dāng)作科學(xué)論斷所接受。雖然不是所有的社會(huì)現(xiàn)象都可以定量地描述,但總體上,相較于質(zhì)性描述,定量描述能更客觀、科學(xué)地反映社會(huì)現(xiàn)象的特征和發(fā)展規(guī)律。由于量的概念抽象需要依靠定量方法來實(shí)現(xiàn),現(xiàn)代社會(huì)科學(xué)研究正在完成一個(gè)由以質(zhì)性研究方法為主向定量研究方法為主且質(zhì)性、定量研究方法相結(jié)合的過渡,社會(huì)科學(xué)發(fā)展的一般規(guī)律也是隨著研究的深入,其定量化水平越來越高(佟慶偉,2004)。
定量研究方法在20 世紀(jì)30 年代被引入中國(guó)教育領(lǐng)域后,逐漸引起重視。尤其是2015 年華東師范大學(xué)教育學(xué)部、北京師范大學(xué)教育學(xué)部、全國(guó)教育科學(xué)規(guī)劃領(lǐng)導(dǎo)小組辦公室、光明日?qǐng)?bào)教育研究中心共同在全國(guó)范圍內(nèi)發(fā)起教育實(shí)證研究論壇后,定量方法作為教育實(shí)證研究的主要方法學(xué)范式之一被更多地應(yīng)用在中國(guó)教育實(shí)證研究中。袁振國(guó)(2017)在《實(shí)證研究是教育學(xué)走向科學(xué)的必要途徑》一文中更是強(qiáng)調(diào)了定量研究方法、手段和技術(shù)是促進(jìn)教育科學(xué)取得突破性進(jìn)展的關(guān)鍵。然而,目前我國(guó)教育科研中使用定量研究方法的頻率、水平還是遠(yuǎn)遠(yuǎn)低于美國(guó)。例如,在美國(guó)教育技術(shù)領(lǐng)域,結(jié)構(gòu)方程模型、元分析等定量方法被廣泛應(yīng)用在遠(yuǎn)程教學(xué)理論建構(gòu)、理論綜述等方面。相對(duì)而言,我國(guó)教育技術(shù)領(lǐng)域多采用質(zhì)性方法輔以現(xiàn)代教育媒體技術(shù)的研究范式去建構(gòu)、探索教學(xué)理論。另一方面,由于我國(guó)很多教育科研人員沒有系統(tǒng)地學(xué)習(xí)過定量研究方法,還沒有對(duì)教育實(shí)證研究中定量方法的應(yīng)用形成全面客觀的認(rèn)識(shí),所以在應(yīng)用定量方法時(shí)顯得力不從心,甚至誤用、錯(cuò)用。針對(duì)這些問題,劉建設(shè)(1999)、黎荷芳(2001)提出定量方法的應(yīng)用要與研究問題相切合、與質(zhì)性方法結(jié)合使用。有研究更是指出我國(guó)教育研究中對(duì)定量方法的重視還是不夠,還有待加強(qiáng)(謝美華,2005,第33—34 頁(yè))。Yue &Xu(2020)隨后通過對(duì)自1978 年改革開放以來我國(guó)教育實(shí)證研究中有關(guān)定量方法研究的分析,總結(jié)出定量研究方法在我國(guó)教育領(lǐng)域發(fā)展的四個(gè)主要階段,肯定了我國(guó)教育研究中定量方法的發(fā)展進(jìn)步,建議再進(jìn)一步關(guān)注教育測(cè)量與評(píng)價(jià)、提高大數(shù)據(jù)的挖掘和利用率、增強(qiáng)研究人員的協(xié)作和資源共享。然而,這些研究述評(píng)多是對(duì)統(tǒng)計(jì)數(shù)據(jù)的簡(jiǎn)單描述與概括分析,針對(duì)應(yīng)用中遇到的具體問題的詳細(xì)分析幾乎沒有,更沒有針對(duì)實(shí)際方法誤用的糾正,無法切實(shí)幫助到具體方法的應(yīng)用者。
因此,詳細(xì)梳理、分析定量研究方法在我國(guó)的實(shí)際應(yīng)用情況,并嘗試對(duì)其不足給出較為具體的建議,對(duì)定量研究方法在教育領(lǐng)域的發(fā)展與成熟具有重要價(jià)值。借鑒相關(guān)研究,通過綜合運(yùn)用頻率統(tǒng)計(jì)法、關(guān)系網(wǎng)絡(luò)法、比較研究法、內(nèi)容分析法,本文以11 本教育綜合類中文社會(huì)科學(xué)引文索引(CSSCI)期刊在2015—2019 年間發(fā)表的應(yīng)用定量方法的論文(僅應(yīng)用了最基本的頻次統(tǒng)計(jì)的排除在外)為研究對(duì)象,分析總結(jié)定量研究方法五年來在我國(guó)教育實(shí)證研究中的應(yīng)用現(xiàn)狀,并針對(duì)具體問題提出對(duì)策與建議;整理了一些常見的定量研究方法的誤用情況,并針對(duì)這些誤用給出正確應(yīng)用建議;分析了定量方法在教育實(shí)證研究中的使用趨勢(shì)。
本研究隨機(jī)選取了11 本影響因子高于1.00 且排名前25%的教育綜合類中文社會(huì)科學(xué)引文索引(CSSCI)期刊,以這些期刊在2015—2019 年間發(fā)表的使用定量方法的論文為研究對(duì)象(頻次統(tǒng)計(jì)除外)。這些期刊包括《華東師范大學(xué)學(xué)報(bào)(教育科學(xué)版)》《教育研究》《清華大學(xué)教育研究》《中國(guó)教育學(xué)刊》《北京大學(xué)教育評(píng)論》《復(fù)旦教育論壇》《教育發(fā)展研究》《教育學(xué)報(bào)》《教育科學(xué)》《教育研究與實(shí)驗(yàn)》和《湖南師范大學(xué)教育科學(xué)學(xué)報(bào)》(如表1 所示)。選取綜合類期刊是為了從總體角度比較分析教育科學(xué)各領(lǐng)域的情況,而排名靠前的CSSCI 論文可以代表目前我國(guó)教育領(lǐng)域較優(yōu)秀的研究成果,更有利于分析定量方法在我國(guó)教育實(shí)證研究中應(yīng)用的成熟度和先進(jìn)度。
表1 選取期刊簡(jiǎn)介
1. 文獻(xiàn)篩選
本研究先后進(jìn)行三次文獻(xiàn)篩選。第一輪篩選是在中國(guó)知網(wǎng)(CNKI)數(shù)據(jù)庫(kù)高級(jí)檢索設(shè)置的檢索條件中設(shè)置“定量”“量化”“統(tǒng)計(jì)”“問卷”“量表”“測(cè)量”“實(shí)驗(yàn)數(shù)據(jù)”“觀測(cè)數(shù)據(jù)”“挖掘數(shù)據(jù)”“數(shù)據(jù)分析”“樣本”為關(guān)鍵詞、篇名、摘要和全文的共同檢索詞,即只要論文的關(guān)鍵詞、篇名、摘要或全文中出現(xiàn)這些檢索詞的任何一個(gè)就會(huì)被檢索出來。把發(fā)表時(shí)間設(shè)定為從2015 年1 月1 日到2019 年12 月31 日,初步篩選出4722 篇論文。批量下載這些文章的PDF 版;在第二輪篩選中,粗略地查看第一輪篩選的4722 篇論文,留下有數(shù)據(jù)的文章,共余2669 篇;在第三輪篩選中,再一次查看2669 篇論文的方法論部分,剔除掉沒有應(yīng)用定量方法的和只應(yīng)用了頻次統(tǒng)計(jì)或百分比的論文,剩余1018 篇論文。
2. 數(shù)據(jù)采集
在CNKI 的4722 篇論文中選擇篩選出的1018 篇論文,導(dǎo)出數(shù)據(jù),數(shù)據(jù)導(dǎo)出類型設(shè)為“Reworks”。將導(dǎo)出數(shù)據(jù)上傳到CiteSpace,并將“題目、作者、發(fā)文機(jī)構(gòu)、關(guān)鍵詞、期刊、年份”數(shù)據(jù)導(dǎo)出為.csv 文件。
本研究采用的具體文獻(xiàn)分析方法如圖1 所示。由于定量研究方法的種類很多且很少被列在目標(biāo)文獻(xiàn)的標(biāo)題或關(guān)鍵詞中,單靠工具軟件記錄不同方法的應(yīng)用頻率等統(tǒng)計(jì)方式,會(huì)出現(xiàn)較大偏誤。因此,本研究依次瀏覽1018 篇目標(biāo)文獻(xiàn)的“研究方法”和“研究結(jié)果”部分,人工記錄具體定量方法和分析工具的使用次數(shù)。教育學(xué)各領(lǐng)域和署名機(jī)構(gòu)出現(xiàn)的頻次則依賴CiteSpace 對(duì)關(guān)鍵詞和機(jī)構(gòu)的計(jì)量分析。作者合作網(wǎng)絡(luò)也通過CiteSpace 分析完成。2015 年到2019 年各年段的發(fā)文量通過Excel 進(jìn)行統(tǒng)計(jì)。
圖1 文獻(xiàn)分析流程圖
根據(jù)對(duì)目標(biāo)文獻(xiàn)的分析,發(fā)現(xiàn)全國(guó)教育實(shí)證研究論壇的召開對(duì)重視定量研究方法的應(yīng)用具有一定的推動(dòng)作用,這五年來定量方法在我國(guó)教育領(lǐng)域的應(yīng)用越來越廣泛。然而,我國(guó)教育科學(xué)領(lǐng)域在定量研究方法的應(yīng)用上取得一定進(jìn)展的同時(shí)也存在著諸多問題,并呈現(xiàn)出以下特點(diǎn)。
如圖2 所示,應(yīng)用定量研究方法的目標(biāo)文獻(xiàn)數(shù)量逐年增加,且每年較上一年的增率都大于3%(2016—2019 年增率分別為4.28%、3.59%、5.45%、3.76%)。由于“全國(guó)首屆教育實(shí)證研究論壇”的召開是在2015 年10 月,所以2015 年的文獻(xiàn)量可以當(dāng)作實(shí)證論壇召開前的基準(zhǔn)量。由此可見,定量方法的應(yīng)用比率有一定提高,“教育實(shí)證論壇”的開展也加速了學(xué)界對(duì)定量研究范式的重視。然而,根據(jù)朱軍文和馬銀琦(2020)《教育實(shí)證研究這五年:特征、趨勢(shì)及展望》一文中的表6 統(tǒng)計(jì),11 本目標(biāo)期刊五年間的發(fā)文總量為6994 篇,其中實(shí)證文獻(xiàn)為2434 篇。那么,應(yīng)用定量方法的研究只占了總發(fā)文量的14.56%、占實(shí)證發(fā)文量的41.82%。作為教育科學(xué)研究的主要方法學(xué)范式之一,14.56%的總占比說明定量方法在我國(guó)教育研究者中的普及度還有待加強(qiáng),并且將會(huì)有很大的提升空間。
圖2 應(yīng)用定量方法的論文數(shù)量
圖3 左半邊展示了完整的作者合作網(wǎng)絡(luò),除了少數(shù)團(tuán)體間存在著密集的合作網(wǎng)絡(luò)外,大多數(shù)團(tuán)體網(wǎng)絡(luò)聯(lián)結(jié)密度小、溝通性和互動(dòng)性差,尤似一盤散沙。圖3 右半邊展示了隨機(jī)選取的200 篇論文作者的合作網(wǎng)絡(luò),核心作者周邊會(huì)有些較小較弱的聯(lián)結(jié),但核心作者之間很少存在聯(lián)結(jié)。說明核心作者傾向于和不同的人合作,但這種合作并不是長(zhǎng)期穩(wěn)定的,且強(qiáng)強(qiáng)聯(lián)合的研究合作十分匱乏。由此可見,我國(guó)教育科學(xué)領(lǐng)域研究團(tuán)隊(duì)之間的溝通交流不夠,知識(shí)的傳播和分享較差,長(zhǎng)久下來將不利于促進(jìn)整個(gè)領(lǐng)域的發(fā)展。因此,各大研究機(jī)構(gòu)需要鼓勵(lì)團(tuán)隊(duì)間的合作,爭(zhēng)取通過大團(tuán)隊(duì)作戰(zhàn)獲得更突出的成果。
如表2 所示,在目標(biāo)論文中,最常用的統(tǒng)計(jì)分析方法是描述性統(tǒng)計(jì)、回歸分析、相關(guān)分析、方差分析、差異檢驗(yàn)等傳統(tǒng)定量研究方法。少部分研究運(yùn)用了結(jié)構(gòu)方程模型(SEM)、因子分析(FA)、多層線性模型(MLM)、元分析(MA)等較為先進(jìn)成熟的定量方法。元分析結(jié)構(gòu)方程模型(MASEM)、多層結(jié)構(gòu)方程模型(MSEM)、多層元分析(MLMA)等在國(guó)際教育科研中運(yùn)用越來越多的新方法更是沒有出現(xiàn)在目標(biāo)文獻(xiàn)中。在輔助分析的工具軟件上,絕大多數(shù)研究(94.18%)使用了統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案(SPSS)和AMOS 軟件;極少的研究(5.49%)用到了Mplus 軟件、STATA 軟件及統(tǒng)計(jì)分析系統(tǒng)(SAS)等功能性軟件。極個(gè)別的研究(0.33%)用到了R 語(yǔ)言、Python 語(yǔ)言等這些國(guó)際流行的開源工具。而SPSS 與AMOS 都屬于易學(xué)易用但處理前沿統(tǒng)計(jì)能力相對(duì)較差的工具,比如AMOS 由于采用最大似然估計(jì)(maximum likelihood estimation,MLE)或加權(quán)最小二乘法(WLS)或未加權(quán)最小二乘法(ULS)等估計(jì)導(dǎo)致處理類別數(shù)據(jù)、類別潛變量的功能不夠完善。如果使用Mplus 就可以較好地處理類別潛變量、類別數(shù)據(jù),并提供穩(wěn)健估計(jì)。此外,利用數(shù)據(jù)挖掘技術(shù)(0.27%)、大型調(diào)查數(shù)據(jù)庫(kù)(4.13%)收集數(shù)據(jù)的研究也非常少。這在一定程度上說明了我國(guó)教育科學(xué)研究中方法涉及面廣,大多數(shù)成熟的方法都有應(yīng)用,但新方法、新技術(shù)的引進(jìn)、推介速度慢,遠(yuǎn)遠(yuǎn)落后于美國(guó)等教育強(qiáng)國(guó)。研究方法的落后又制約著我國(guó)教育科學(xué)的發(fā)展。因此,各高校教育學(xué)院和教育科研院所要更多地吸收、培養(yǎng)專門從事定量研究的人才,開設(shè)相關(guān)課程,普及量化知識(shí)。不僅要吸納借鑒國(guó)際上先進(jìn)的技術(shù)和分析方法,更要融合其他學(xué)科的方法、技術(shù)作為輔助,在本土、本學(xué)科內(nèi)結(jié)合實(shí)際應(yīng)用不斷改進(jìn)新技術(shù)、研發(fā)新方法。
圖3 核心作者合作網(wǎng)絡(luò)圖
表2 定量方法和分析工具應(yīng)用情況
表3 列出了一些國(guó)際上常用的但目標(biāo)論文中較少或從未出現(xiàn)的定量研究方法供教育研究者參考。比如,MLMA、MASEM 和MSEM 這三種在國(guó)際上被認(rèn)為是很有前途的分析方法就沒有出現(xiàn)在目標(biāo)文獻(xiàn)中。其中,MLMA 特別適用于總結(jié)層次結(jié)構(gòu)數(shù)據(jù),它能夠檢查研究之間的差異、揭示組間異質(zhì)效應(yīng)(van den Noortgate & Onghena,2008)。鑒于基于層次結(jié)構(gòu)數(shù)據(jù)的已發(fā)表研究越來越多,使用MLMA 變得越來越重要(van den Noortgate & Onghena,2003)。在目標(biāo)文獻(xiàn)中,有一篇是運(yùn)用MA 綜合不同研究的效應(yīng)量來分析課外輔導(dǎo)對(duì)學(xué)生學(xué)業(yè)成績(jī)的影響效應(yīng)。有時(shí),一個(gè)研究可能既報(bào)告每個(gè)學(xué)生的成績(jī),也會(huì)報(bào)告不同班級(jí)的整體成績(jī),那么采用MA 就會(huì)忽略文獻(xiàn)中可用的一部分研究數(shù)據(jù)。而MLMA 則能夠總結(jié)不同班級(jí)和學(xué)生個(gè)體的特定效應(yīng)大小,在樣本量足夠的情況下,會(huì)給出更詳盡的分析。MASEM 結(jié)合了MA 和SEM 的優(yōu)點(diǎn),是一種強(qiáng)大的方法學(xué)工具(Lv & Maeda,2020)。它不僅可以幫助研究者利用SEM 進(jìn)行理論的定量綜述、增強(qiáng)結(jié)論的可概括性,還可以幫助研究者測(cè)試在單個(gè)研究中無法測(cè)量的復(fù)雜模型。這種方法的應(yīng)用正在逐年增加(Lv & Maeda,2020),研究人員越來越有興趣將該方法應(yīng)用于實(shí)證研究。著名期刊《研究綜合方法》(Research Synthesis Methods)在2016 年還特別出版了一期關(guān)于MASEM 的??懻摿水?dāng)前MASEM 遇到的問題和對(duì)未來研究的建設(shè)性意見。相似的,MSEM 是一種廣泛應(yīng)用于多層次研究的先進(jìn)的SEM 技術(shù)(Ryu,2014),用來彌補(bǔ)MLM 和SEM 的缺憾。很多方法論研究也闡述了如何將MSEM 應(yīng)用在不同的SEM 模型中,如驗(yàn)證性因子分析(Geldhof,Preacher,& Zyphur,2014)、測(cè)量和結(jié)構(gòu)模型(Rabe-Hesketh,Skrondal,& Zheng,2007)、中介模型(MacKinnon & Valente,2014)和調(diào)解模型(Preacher,Zhang,& Zyphur,2016),并且將其實(shí)現(xiàn)方法編碼到已有的工具軟件中,如Mplus version 5 和Stata version 8,進(jìn)而引入到社會(huì)科學(xué)領(lǐng)域的實(shí)證研究中。隨著其理論和軟件包的發(fā)展,如今的MSEM 在社會(huì)科學(xué)領(lǐng)域的使用也越來越普遍(Ryu,2014)。
表3 國(guó)際上常用但目標(biāo)論文中較少或從未出現(xiàn)的定量研究方法
續(xù)表3
目標(biāo)文獻(xiàn)中有些研究未能根據(jù)實(shí)際情況來正確選擇更合適的定量方法。如某作者收集到的是逐月的追蹤數(shù)據(jù),在因素回歸時(shí)把時(shí)間當(dāng)作一個(gè)自變量來分析,以預(yù)測(cè)某學(xué)生群體未來成績(jī)。事實(shí)上,使用時(shí)間序列分析可能就會(huì)更合適該研究。需要注意的是,并不是復(fù)雜的方法就比簡(jiǎn)單的方法好,有時(shí)復(fù)雜的方法不但費(fèi)時(shí)費(fèi)力,還可能在解決舊偏誤、甚至未能解決舊偏誤的同時(shí)增加新的偏誤。分析方法的選擇是要以完成研究主題、目的為出發(fā)點(diǎn),在保證分析結(jié)果具有高信效度的基礎(chǔ)上,盡可能選擇相對(duì)簡(jiǎn)單、易于操作的定量分析方法。
另一方面,相當(dāng)多的目標(biāo)研究沒有對(duì)其所用定量方法的適用條件進(jìn)行考量,而是直接將采集到的實(shí)證數(shù)據(jù)用來跑數(shù)學(xué)模型、進(jìn)行統(tǒng)計(jì)檢驗(yàn)等。從方法論層面講,所有定量研究方法都有其適用條件,并且不同方法的適用條件存在一定差別。例如,對(duì)多元回歸而言,當(dāng)自變量之間的相關(guān)性較強(qiáng)時(shí),回歸系數(shù)的估計(jì)就會(huì)出現(xiàn)很大偏差、甚至無法進(jìn)行。只有當(dāng)回歸模型的自變量之間沒有密切關(guān)系時(shí),多元回歸分析的結(jié)果才有效。而應(yīng)用多元回歸的幾乎所有目標(biāo)文獻(xiàn)都沒有完成自變量之間的獨(dú)立性檢驗(yàn)。同樣地,目標(biāo)文獻(xiàn)中應(yīng)用了MLM 的研究也沒有對(duì)觀測(cè)數(shù)據(jù)做任何獨(dú)立性檢驗(yàn)。在MLM 中,雖然數(shù)據(jù)的嵌套結(jié)構(gòu)并不遵循回歸的獨(dú)立性假設(shè),觀測(cè)數(shù)據(jù)的聚類可以有較強(qiáng)相關(guān)性,但其也是一種基于回歸的分析方法,因而應(yīng)用MLM 需要對(duì)每一層次的觀測(cè)數(shù)據(jù)的獨(dú)立性進(jìn)行檢驗(yàn)。同樣情況也普遍存在于其他定量方法的應(yīng)用中,如方差分析時(shí)缺少對(duì)觀測(cè)數(shù)據(jù)分布狀態(tài)的檢驗(yàn)、修正等。
其他方面的誤用導(dǎo)致分析結(jié)果出錯(cuò)的情況也同樣存在,如使用錯(cuò)誤的估計(jì)方法,忘記給不同樣本數(shù)據(jù)做加權(quán)平均而直接用了平均數(shù),或選擇錯(cuò)誤的數(shù)據(jù)收集和處理方法等。再如,在應(yīng)用FA、SEM 等依賴于大樣本量方法的文獻(xiàn)中,卻發(fā)現(xiàn)了小樣本量(小于200,且未使用貝葉斯等方法)的存在等。此外,絕大多數(shù)存在缺失數(shù)據(jù)的目標(biāo)文獻(xiàn)都沒有在統(tǒng)計(jì)分析前對(duì)缺失數(shù)據(jù)進(jìn)行預(yù)處理。然而,由于絕大多數(shù)數(shù)理運(yùn)算、估計(jì)都是建立在完整數(shù)據(jù)的前提下,對(duì)缺失數(shù)據(jù)的檢測(cè)和正確處理是保證分析結(jié)果具有高可信度和有效度的前提。
由此可見,在應(yīng)用特定定量方法前,必須在考慮其適用條件的情況下對(duì)實(shí)證數(shù)據(jù)進(jìn)行檢驗(yàn),并盡量避免因方法的誤用而得出錯(cuò)誤的結(jié)論。因此,教育研究者應(yīng)努力加強(qiáng)自身定量分析的專業(yè)素養(yǎng),在提高統(tǒng)計(jì)分析知識(shí)水平的基礎(chǔ)上多與定量方法論專家交流合作,以避免在方法設(shè)計(jì)和應(yīng)用上出現(xiàn)漏洞、偏差。期刊還應(yīng)專門邀請(qǐng)從事定量方法論研究的專家參與方法設(shè)計(jì)等方面的審稿工作,以保證期刊質(zhì)量,避免錯(cuò)誤信息對(duì)讀者的誤導(dǎo)。
我國(guó)教育研究的各個(gè)領(lǐng)域?qū)Χ糠椒ǖ闹匾暢潭扔兴煌?,?yīng)用頻率、成熟度也差別較大。如表4所示,在目標(biāo)文獻(xiàn)中,教育經(jīng)濟(jì)學(xué)、教育社會(huì)學(xué)、教育心理學(xué)這些偏實(shí)驗(yàn)的、收集數(shù)據(jù)較多的交叉學(xué)科領(lǐng)域應(yīng)用定量方法較多,在方法的掌握上也更為成熟。教師教育、職業(yè)技術(shù)教育等專業(yè)領(lǐng)域?qū)Χ糠椒ǖ膽?yīng)用非常少。教育技術(shù)、高等教育等領(lǐng)域雖然對(duì)定量研究方法的重視程度不如教育經(jīng)濟(jì)學(xué)等學(xué)科,但也有一定占比,尤其是教育技術(shù)領(lǐng)域研究的定量化程度在五年內(nèi)呈現(xiàn)逐步上升的趨勢(shì)。此外,在應(yīng)用定量研究方法的目標(biāo)文獻(xiàn)中,幾乎看不到如教育學(xué)原理、教育史等教育基礎(chǔ)理論領(lǐng)域的研究。
表4 各教育領(lǐng)域每年發(fā)文量
教育學(xué)各領(lǐng)域間在應(yīng)用定量研究方法上的這些差異在一定程度上是與各領(lǐng)域的性質(zhì)相關(guān)聯(lián)的。教育經(jīng)濟(jì)學(xué)、教育社會(huì)學(xué)、教育心理學(xué)是教育學(xué)與數(shù)學(xué)、經(jīng)濟(jì)學(xué)、社會(huì)學(xué)、心理學(xué)交叉的學(xué)科領(lǐng)域。經(jīng)濟(jì)學(xué)、社會(huì)學(xué)和心理學(xué)的量化程度相對(duì)較高,定量研究方法在這些學(xué)科發(fā)展的也更成熟,導(dǎo)致教育學(xué)與這些學(xué)科的交叉學(xué)科領(lǐng)域的定量化程度要比純教育的學(xué)科領(lǐng)域好很多。相反,教師教育、職業(yè)技術(shù)教育是教育學(xué)本身衍生出的學(xué)科領(lǐng)域,基于定量研究和混合研究在教育學(xué)領(lǐng)域的發(fā)展較其他社會(huì)科學(xué)(如心理學(xué)、經(jīng)濟(jì)學(xué))領(lǐng)域的發(fā)展更為緩慢,這些教育學(xué)領(lǐng)域在定量方法的應(yīng)用上也會(huì)與其他教育學(xué)領(lǐng)域(如教育心理學(xué)、教育經(jīng)濟(jì)學(xué))有所差距。而教育學(xué)原理、教育史這些更偏重哲學(xué)思辨的人文領(lǐng)域,往往很難實(shí)施測(cè)量和收集大量數(shù)字化數(shù)據(jù),因而更加難以廣泛地應(yīng)用定量方法。
事實(shí)上,在定量方法的應(yīng)用上,這種教育領(lǐng)域間的差距在歐美等國(guó)家也是存在的。我國(guó)教育學(xué)各領(lǐng)域間存在這樣的差異也說明定量研究方法的實(shí)際應(yīng)用中雖然存在很多問題,但也沒有嚴(yán)重到“濫用”定量方法的地步。我們需要提高教師教育、職業(yè)技術(shù)教育領(lǐng)域的研究人員的量化素質(zhì),同時(shí)鼓勵(lì)教育學(xué)原理、教育史等領(lǐng)域采用量化分析輔助哲學(xué)思辨,使相關(guān)研究更客觀、科學(xué)。
目標(biāo)文獻(xiàn)中鮮有定量與質(zhì)性研究方法的綜合運(yùn)用,多是單一定量研究方法的應(yīng)用或多元定量研究方法的嵌套應(yīng)用,很少輔以質(zhì)性數(shù)據(jù)的收集和嚴(yán)謹(jǐn)?shù)馁|(zhì)性分析。這說明我國(guó)教育研究者在方法的使用上常常是把定量和質(zhì)性研究方法明確劃分開的,認(rèn)為有了定量方法就不需要考慮質(zhì)性方法,而往往不去關(guān)心選定的研究方法對(duì)具體研究主題的貢獻(xiàn)大小。在某種程度上也說明有些研究者甚至可能是基于研究方法而選擇研究主題,而不是基于研究主題進(jìn)而選擇研究方法,本末倒置了研究主題和研究方法的關(guān)系。另一方面,絕大多數(shù)研究采用定量研究方法的單獨(dú)應(yīng)用,從側(cè)面表明了我國(guó)教育實(shí)證研究有流于表面、研究深度不夠的缺憾。
由于定量研究方法是建立在大量實(shí)證數(shù)據(jù)基礎(chǔ)上的、針對(duì)教育現(xiàn)象的本質(zhì)或因果關(guān)系等做出概括性分析的研究范式,其統(tǒng)計(jì)分析結(jié)果往往強(qiáng)調(diào)教育現(xiàn)象的本質(zhì)或因果關(guān)系等在特定群體中的“普遍性”。然而,教育是一種錯(cuò)綜復(fù)雜的人文現(xiàn)象(付瑛,周誼,2004),許多個(gè)體或小樣本群體具有特殊性。雖然定量研究方法邏輯嚴(yán)謹(jǐn)、客觀科學(xué),但很難對(duì)大樣本中的少數(shù)特征做精確測(cè)量與分析,無法進(jìn)一步深入研究教育現(xiàn)象。相反,定性研究著重觀察、描述個(gè)體或少數(shù)群體的行為(Mcintyre,2003,p. 15)、感知和交互活動(dòng),可以幫助研究者發(fā)現(xiàn)教育現(xiàn)象中蘊(yùn)含的復(fù)雜規(guī)律。因此,在實(shí)際應(yīng)用中,很多定量研究方法是和質(zhì)性研究方法混合著使用的,即從定量角度研究教育現(xiàn)象的一般性規(guī)律,再?gòu)馁|(zhì)性角度對(duì)教育現(xiàn)象進(jìn)行深入探究。
例如,某目標(biāo)研究應(yīng)用多元回歸分析探究了自信心、父母期待、同伴競(jìng)爭(zhēng)等因素對(duì)學(xué)生考試成績(jī)的影響。然而,只進(jìn)行多元回歸分析,研究者僅能知道自信心幫助學(xué)生提高學(xué)習(xí)成績(jī),卻無法了解到自信心讓學(xué)生對(duì)學(xué)習(xí)產(chǎn)生興趣從而愿意花更多時(shí)間來學(xué)習(xí)。其實(shí),研究者可以采用收斂并行設(shè)計(jì)補(bǔ)充信息量,研究過程的同一階段分別使用定量和定性方法,對(duì)兩類方法進(jìn)行同等優(yōu)先級(jí)排序,并在分析過程中保持兩類方法獨(dú)立性,然后在分析完成后混合結(jié)果、整體解釋、得出結(jié)論(Creswell & Clark,2018,pp.69?71),即在一個(gè)學(xué)期里,研究者通過調(diào)查問卷收集到有關(guān)學(xué)生自信心、父母期待、同伴競(jìng)爭(zhēng)等量化數(shù)據(jù),以該學(xué)期中的某次綜合考試成績(jī)?yōu)橐蜃兞?,?yīng)用多元回歸分析測(cè)出這些因素對(duì)學(xué)生成績(jī)的影響;并在同一學(xué)期中,研究者對(duì)部分學(xué)生進(jìn)行焦點(diǎn)小組訪談,以探究自信心、父母期待、同伴競(jìng)爭(zhēng)等因素是如何具體影響學(xué)生成績(jī)的;最后,研究者把多元回歸分析結(jié)果與對(duì)焦點(diǎn)群體進(jìn)行的質(zhì)性分析結(jié)果相融合,得到相對(duì)全面的研究結(jié)論。
這種混合應(yīng)用在美國(guó)教育研究中獲得了廣泛的關(guān)注、認(rèn)可和運(yùn)用(唐涌,2015)。例如,Greene(2012)闡述了混合研究方法比僅使用純定量或純質(zhì)性研究方法進(jìn)行研究產(chǎn)生了更有意義的結(jié)果。Teddlie & Tashakkori(2012)概述了教育研究者在使用混合研究方法前應(yīng)考慮的問題。Creswell(2015)出版了有關(guān)混合研究方法的工具書。甚至還有諸如《混合方法研究雜志》(Journal of Mixed Methods Research)這種專門發(fā)表應(yīng)用了混合研究法論文的期刊。而定量和質(zhì)性方法的混合使用雖然被我國(guó)不少學(xué)者提議(如,高瀟怡,2010;向榮,2019;田虎偉,2007;張東輝,2013;鄧猛,潘劍芳,2002;張繪,2012),但在實(shí)際教育實(shí)證研究中的應(yīng)用范圍還有待擴(kuò)大。建議我國(guó)各高校教育學(xué)院和教育科研院所以教育研究成果的質(zhì)量評(píng)估為基礎(chǔ)和出發(fā)點(diǎn),在政策上鼓勵(lì)教育研究的深入,從而促進(jìn)混合研究方法在教育實(shí)證領(lǐng)域的應(yīng)用。
正確使用定量研究方法對(duì)教育實(shí)證研究至關(guān)重要,倘若誤用,即便是成熟、科學(xué)的方法和技術(shù),也會(huì)導(dǎo)致結(jié)論的錯(cuò)誤。本研究通過閱讀分析目標(biāo)文獻(xiàn)發(fā)現(xiàn),定量研究論文中存在著諸多定量研究方法誤用的現(xiàn)象,如忽略定量研究設(shè)計(jì)、忽略統(tǒng)計(jì)學(xué)方法的應(yīng)用條件、盲目使用統(tǒng)計(jì)軟件、分析方法不恰當(dāng)?shù)龋绊懷芯拷Y(jié)論的正確性。為改善定量方法誤用的現(xiàn)狀,下文對(duì)目標(biāo)文獻(xiàn)中出現(xiàn)頻率較高的方法誤用情況進(jìn)行梳理、分析。
在教育實(shí)證研究中,回歸分析這種研究因變量和自變量關(guān)系的預(yù)測(cè)性建模技術(shù)常常受到研究者青睞,不同回歸建模方法在目標(biāo)文獻(xiàn)中有所涉及,如多分類logistic 回歸、二元logistic 回歸和分層回歸等。雖然很多研究者能夠根據(jù)研究目標(biāo)和自變量、因變量類型等選擇較為合適的回歸分析方法,但由于忽略回歸分析的條件限制,仍然存在方法的誤用。
例如,某目標(biāo)研究收集了2473 份關(guān)于學(xué)生每周花在學(xué)生工作與社團(tuán)活動(dòng)的時(shí)間、是否擔(dān)任學(xué)生干部、大學(xué)學(xué)業(yè)成績(jī)對(duì)大學(xué)學(xué)業(yè)排名影響的研究數(shù)據(jù)。在沒有對(duì)原始數(shù)據(jù)進(jìn)行任何檢查和預(yù)處理的情況下直接進(jìn)行多元線性回歸分析,且未進(jìn)行殘差分析就得出回歸模型構(gòu)建較好的結(jié)論。
繆誤1:沒有對(duì)數(shù)據(jù)的異常值(包括缺失數(shù)據(jù))進(jìn)行任何預(yù)處理?;貧w分析對(duì)異常值(包括缺失數(shù)據(jù))較為敏感,如果有異常值存在,不對(duì)異常值做任何預(yù)處理的話,可能會(huì)使估計(jì)結(jié)果產(chǎn)生偏差。
糾正1:在回歸分析前可通過散點(diǎn)圖、箱線圖、正態(tài)圖、描述統(tǒng)計(jì)等檢驗(yàn)數(shù)據(jù)中是否有異常值(包括缺失數(shù)據(jù))的存在。若存在異常值,一般要先把異常值剔除。但如果考慮到實(shí)際情況確實(shí)無法剔除異常值,則應(yīng)考慮應(yīng)用穩(wěn)健回歸建模。
繆誤2:沒有對(duì)自變量的共線性情況進(jìn)行分析。在實(shí)際分析中,自變量之間彼此相關(guān)的現(xiàn)象很容易出現(xiàn)在線性回歸中。如果一個(gè)或多個(gè)自變量和其他自變量之間顯著相關(guān),則可能存在共線性問題。雖然適度的共線性不會(huì)對(duì)回歸分析造成大的問題,但是嚴(yán)重共線性會(huì)導(dǎo)致分析結(jié)果不穩(wěn)定,導(dǎo)致本該顯著的自變量不顯著、本該不顯著的自變量顯著,甚至導(dǎo)致回歸系數(shù)的正負(fù)估計(jì)與實(shí)際完全相反情況。
值得注意的是,本例是應(yīng)用回歸模型檢測(cè)多個(gè)自變量對(duì)學(xué)業(yè)成績(jī)的影響情況,因此研究者需要考慮是否處理共線性問題。倘若某個(gè)回歸模型只是用來預(yù)測(cè),那么只要模型擬合指標(biāo)好,共線性問題通常不會(huì)影響預(yù)測(cè)結(jié)果,也不必處理。
繆誤3:沒有進(jìn)行殘差分析。由于回歸模型中的預(yù)測(cè)值和觀測(cè)值的差異是隨機(jī)且不可預(yù)測(cè)的,那么回歸殘差(即真實(shí)誤差的估計(jì))也應(yīng)該是隨機(jī)且不可預(yù)測(cè)的。如果在殘差中發(fā)現(xiàn)有可預(yù)測(cè)的信息,則說明回歸模型中缺少了某些可預(yù)測(cè)信息。由此可見,殘差分析是回歸分析中非常重要的部分。若殘差的正態(tài)性、獨(dú)立性及方差齊性假設(shè)不能滿足,說明回歸模型的構(gòu)建差,回歸估計(jì)結(jié)果不準(zhǔn)確。
糾正3:回歸分析過程中保留殘差項(xiàng)。然后,對(duì)殘差的正態(tài)性、獨(dú)立性及方差齊性依次進(jìn)行檢驗(yàn)。殘差的正態(tài)性可使用正態(tài)圖等進(jìn)行檢測(cè),若殘差整體上滿足正態(tài)性,說明模型構(gòu)建好,若殘差正態(tài)性差,說明模型構(gòu)建差,需要重新構(gòu)建回歸模型。殘差的獨(dú)立性可使用德賓—沃森(D—W)自相關(guān)性檢驗(yàn),若D—W 值介于1.7 到2.3 之間(接近2),說明殘差獨(dú)立,模型構(gòu)建好,若D—W 值小于1.7 或大于2.3(明顯偏離2),說明殘差自相關(guān),模型構(gòu)建差,需要重新構(gòu)建回歸模型。殘差的方差齊性可通過分別與自變量或因變量作散點(diǎn)圖進(jìn)行檢測(cè),若散點(diǎn)沒有規(guī)律性,說明方差齊性,模型構(gòu)建好,若散點(diǎn)有明顯規(guī)律性,說明方差異質(zhì),模型構(gòu)建差,需要重新構(gòu)建回歸模型。
在目標(biāo)文獻(xiàn)中,常用獨(dú)立樣本t 檢驗(yàn)或配對(duì)t 檢驗(yàn)來比較兩組數(shù)據(jù)間的差異(幾乎很少出現(xiàn)應(yīng)用了單樣本t 檢驗(yàn)的研究)。即便大多數(shù)研究能夠根據(jù)比較樣本等具體情況適當(dāng)選擇獨(dú)立樣本t 檢驗(yàn)(兩比較組樣本量不同)或配對(duì)t 檢驗(yàn)(兩比較組樣本量相同),但不少研究在t 檢驗(yàn)過程中仍存在問題,影響分析結(jié)果的可靠性。
例如,某目標(biāo)研究采用t 檢驗(yàn)(未說明t 檢驗(yàn)的類型)比較不同類型學(xué)校支持對(duì)抑郁大學(xué)生心理健康干預(yù)的差異。在該研究中,實(shí)驗(yàn)組有男生24 人,女生26 人,實(shí)驗(yàn)組干預(yù)前的總體均分是189.72(SD=58.07),實(shí)驗(yàn)組干預(yù)后的總體均分是165.18(SD=47.73),且不存在干預(yù)后對(duì)同一被試得分的重復(fù)測(cè)量。該研究用t 檢驗(yàn)對(duì)比了實(shí)驗(yàn)組干預(yù)前和干預(yù)后的總體得分情況。
繆誤1:沒有交代清楚所應(yīng)用t 檢驗(yàn)的類型。不同類型t 檢驗(yàn)過程是不同的。如獨(dú)立樣本t 檢驗(yàn)是以t 分布為基礎(chǔ),用于檢驗(yàn)兩個(gè)獨(dú)立樣本總體均值是否相等,即H0: μ1=μ2是否成立;而配對(duì)t 檢驗(yàn)用于檢驗(yàn)兩個(gè)關(guān)聯(lián)樣本的總體差值均值是否為0,即H0: dˉ=0是否成立。因此,兩種檢驗(yàn)方式得出的結(jié)果也會(huì)有些許差別。
糾正1:在本例中,實(shí)驗(yàn)組干預(yù)前和干預(yù)后的樣本都是實(shí)驗(yàn)組原樣本(自身配對(duì)),實(shí)際上兩個(gè)樣本的個(gè)體是兩兩配對(duì)的,只有50 個(gè)獨(dú)立個(gè)體。只有采用配對(duì)t 檢驗(yàn),把每組配對(duì)當(dāng)作一個(gè)單位進(jìn)行統(tǒng)計(jì)檢驗(yàn),才能確保結(jié)果的可靠。而原文中未交代清楚具體t 檢驗(yàn)的使用情況,降低了分析結(jié)果的信度。
例如,某目標(biāo)研究采用獨(dú)立樣本t 檢驗(yàn)比較大學(xué)生直系親屬中是否有人吸毒對(duì)貝克抑郁量表(BDI)得分的影響的差異。在該研究中,直系親屬中有人吸毒的樣本量為10,BDI 得分均值為5.20(SD=4.39);直系親屬中無人吸毒的樣本量為2778,BDI 得分均值為5.83(SD=6.31)。除了平均數(shù)、標(biāo)準(zhǔn)差外,在獨(dú)立樣本t 檢驗(yàn)前,研究者未對(duì)兩組數(shù)據(jù)做其他統(tǒng)計(jì)學(xué)分析。
繆誤1:忽略了獨(dú)立樣本t 檢驗(yàn)對(duì)樣本正態(tài)性的要求。在本例中,直系親屬中有人吸毒的樣本量為10,對(duì)獨(dú)立樣本t 檢驗(yàn)而言,若是小樣本,則要求樣本的總體必須服從或近似正態(tài)分布。由于本例中直系親屬中有人吸毒的樣本量過小,僅靠提供的均值與標(biāo)準(zhǔn)差無法判斷該樣本的總體是否服從或近似正態(tài)分布(t 檢驗(yàn)對(duì)正態(tài)性穩(wěn)?。?。
糾正1:鑒于本例中的樣本量較小,在進(jìn)行獨(dú)立樣本t 檢驗(yàn)前先要檢驗(yàn)樣本的正態(tài)性。如果數(shù)據(jù)不呈正態(tài)或近似正態(tài)分布,可以使用非參數(shù)檢驗(yàn)?;蚩梢韵韧ㄟ^算法轉(zhuǎn)換把原始數(shù)據(jù)轉(zhuǎn)換,使之服從正態(tài)或近似正態(tài)分布后再進(jìn)行獨(dú)立樣本t 檢驗(yàn)。如果原始數(shù)據(jù)轉(zhuǎn)換后仍不能呈正態(tài)或近似正態(tài)分布,再使用非參數(shù)檢驗(yàn)替換獨(dú)立樣本t 檢驗(yàn),來分析數(shù)據(jù)。但數(shù)據(jù)轉(zhuǎn)換可能引起B(yǎng)DI 得分和對(duì)直系親屬中是否有人吸毒關(guān)系的估計(jì)偏誤,因此不建議使用數(shù)據(jù)轉(zhuǎn)換法。
繆誤2:忽略了獨(dú)立樣本t 檢驗(yàn)對(duì)方差齊性的要求。獨(dú)立樣本t 檢驗(yàn)要求兩組樣本的總體方差齊性。在本例中,直系親屬中有人吸毒的BDI 得分均值為5.20(SD=4.39),直系親屬中沒人吸毒的BDI得分均值為5.83(SD=6.31)。兩樣本的標(biāo)準(zhǔn)差有一定差別,可能出現(xiàn)方差不齊現(xiàn)象。
糾正2:在本例中,兩樣本的總體可能出現(xiàn)方差不齊現(xiàn)象,因而需要對(duì)兩樣本數(shù)據(jù)進(jìn)行方差齊性檢驗(yàn)。如果方差不齊,則采用Wilcoxon 秩和檢驗(yàn)、或近似t 檢驗(yàn)方法替代獨(dú)立樣本t 檢驗(yàn),進(jìn)行分析。
三組或三組以上樣本的差異性檢驗(yàn)需要用到方差分析這種重要的處理多元信息的分析方法。但在部分目標(biāo)文獻(xiàn)中,不同的方差分析方法卻被混淆誤用,致使所采用的方差分析模型與研究設(shè)計(jì)不匹配,得出的結(jié)論出現(xiàn)較大偏誤。
例如,某目標(biāo)研究采用多個(gè)單因素方差分析分別比較我國(guó)不同區(qū)域幼兒園物質(zhì)條件、師幼互動(dòng)、健康與安全及幼兒發(fā)展的差異。在該研究中,各地區(qū)個(gè)案數(shù)及分析結(jié)果如表5 所示。研究者對(duì)東中西部地區(qū)的數(shù)據(jù)進(jìn)行了方差齊性檢驗(yàn)、事后檢驗(yàn),但未做正態(tài)性檢驗(yàn)。
表5 不同區(qū)域幼兒園的比較分析結(jié)果
繆誤1:未檢驗(yàn)方差分析的適用條件。在本例中,東部樣本量10 個(gè)、中部5 個(gè)、西部7 個(gè),雖然是三個(gè)獨(dú)立樣本且方差齊性,但樣本量過小,各種數(shù)據(jù)很可能不服從正態(tài)或近似正態(tài)分布(方差分析對(duì)正態(tài)性穩(wěn)?。?,可能不滿足方差分析的適用條件。
糾正1:在進(jìn)行方差分析前,應(yīng)先對(duì)各個(gè)樣本數(shù)據(jù)進(jìn)行正態(tài)性檢驗(yàn)。但由于每組樣本量過小,很難直接對(duì)每組因變量進(jìn)行正態(tài)性檢測(cè),研究者可以選擇合并檢驗(yàn)因變量殘差的正態(tài)性。如果殘差不呈正態(tài)或近似正態(tài)分布,可以轉(zhuǎn)換數(shù)據(jù)使其殘差服從正態(tài)或近似正態(tài)分布,或使用非參數(shù)檢驗(yàn)替換單因素方差分析。
繆誤2:方差分析方法選擇有誤。多個(gè)因變量可能是相關(guān)的,可能更適合應(yīng)用多元方差分析。在本例中,幼兒園物質(zhì)條件、師幼互動(dòng)、健康與安全及幼兒發(fā)展間很可能存在相關(guān)關(guān)系,本例更適合使用多元方差分析。
糾正2:類似本例情況,鑒于方法的簡(jiǎn)便性,大多數(shù)目標(biāo)研究都應(yīng)用了單因素方差分析。但是,如果因變量間存在相關(guān),使用單因素方差分析會(huì)忽略因變量之間的相關(guān)關(guān)系,導(dǎo)致犯Ⅰ型錯(cuò)誤的概率變大、檢驗(yàn)效率低,即拒絕了實(shí)際上成立的、正確的假設(shè)。尤其當(dāng)各個(gè)因變量的單因素方差分析結(jié)果不一致時(shí),難以對(duì)分析結(jié)果下總體結(jié)論。因此,本例應(yīng)先檢查各因變量(幼兒園物質(zhì)條件、師幼互動(dòng)、健康與安全及幼兒發(fā)展)之間是否具有顯著的相關(guān)性,如果相關(guān),推薦采用多元方差分析,如果不相關(guān),則可采用單因素方差分析。
例如,某目標(biāo)研究采用重復(fù)測(cè)量方差分析探索學(xué)生從小學(xué)到大學(xué)元認(rèn)知控制的準(zhǔn)確性和一致性是否隨著年級(jí)升高而逐漸提高。在該研究中,研究者采用2(時(shí)間:前、后測(cè))×6(學(xué)段:小學(xué)一、三、五年級(jí),初中、高中、大學(xué))混合實(shí)驗(yàn)設(shè)計(jì)。樣本量為345 名不同學(xué)段的學(xué)生,時(shí)間和學(xué)段為自變量,重讀選擇為因變量。在進(jìn)行重復(fù)測(cè)量方差分析前未對(duì)數(shù)據(jù)進(jìn)行任何檢驗(yàn)。
繆誤1:沒有進(jìn)行一般方差分析的條件檢驗(yàn),更沒有檢驗(yàn)協(xié)方差矩陣的球?qū)ΨQ性。重復(fù)測(cè)量方差分析除了要滿足一般方差分析的條件(即獨(dú)立性、正態(tài)性、方差齊性)外,還需要滿足協(xié)方差矩陣球?qū)ΨQ性。如果協(xié)方差矩陣球?qū)ΨQ性得不到滿足,會(huì)增大犯Ⅰ型錯(cuò)誤的概率。
糾正1:在確定數(shù)據(jù)滿足獨(dú)立性、正態(tài)性和方差齊性后,用Mauchly 方法檢驗(yàn)協(xié)方差矩陣的球?qū)ΨQ性。如果協(xié)方差矩陣的球?qū)ΨQ性得不到滿足,則需要對(duì)與時(shí)間有關(guān)的F 統(tǒng)計(jì)量的自由度進(jìn)行調(diào)整,以降低犯Ⅰ型錯(cuò)誤的概率。一般采用Greenhouse-Geisser(G-G)法、Huynh-Feldt(H-F)法和Lower-Bound(L-B 下界)法對(duì)自由度進(jìn)行調(diào)整。最后根據(jù)原F 值和調(diào)整后的自由度,判斷時(shí)間或?qū)W段的主效應(yīng)、時(shí)間和學(xué)段的交互效應(yīng)是否顯著。
卡方檢驗(yàn)在目標(biāo)文獻(xiàn)中的應(yīng)用也十分廣泛,其使用頻率僅次于回歸分析、t 檢驗(yàn)和方差分析、結(jié)構(gòu)方程模型、因子分析,主要用于分類資料間的比較。雖然對(duì)分類變量的統(tǒng)計(jì)常常需要用到卡方檢驗(yàn),但卡方檢驗(yàn)在對(duì)分類變量的頻數(shù)分布分析上并不是萬(wàn)能的,因此目標(biāo)文獻(xiàn)中也或多或少地出現(xiàn)了誤用、亂用卡方檢驗(yàn)的情況。
例如,某目標(biāo)研究采用卡方檢驗(yàn)比較分析不同辦園體制下幼兒園的教師資質(zhì)。其分析結(jié)果如表6所示。研究者得出“不同辦園體制普惠性幼兒園在教師學(xué)歷、教學(xué)年限、職稱上均呈現(xiàn)出顯著差異,且普惠性他辦園的師資水平在多個(gè)維度上優(yōu)于教辦園和普惠性民辦園”的結(jié)論。
表6 不同辦園體制幼兒園教師資質(zhì)的比較分析結(jié)果
繆誤1:誤用卡方檢驗(yàn)分析數(shù)據(jù)。在本例中,研究者想要比較不同辦園體制普惠性幼兒園在不同師資水平維度上是否有差異,并判斷出孰優(yōu)孰劣。然而,運(yùn)用卡方檢驗(yàn)僅能回答不同辦園體制普惠性幼兒園在不同維度師資水平“分布”上的差異是否在統(tǒng)計(jì)學(xué)上呈現(xiàn)顯著狀態(tài),無法判斷出“他辦園的師資水平在多個(gè)維度上優(yōu)于教辦園和普惠性民辦園”。
糾正1:由于本例中的因變量是等級(jí)變量,因此可以使用非參數(shù)檢驗(yàn),如秩和檢驗(yàn)或Ridit 分析,來比較不同辦園體制普惠性幼兒園在師資水平的不同維度上是否有差異和孰優(yōu)孰劣。
例如,某目標(biāo)研究采用卡方檢驗(yàn)考察不同性別和民族大一新生的抑郁狀態(tài)等級(jí)構(gòu)成的分布是否有差別。其分析結(jié)果如表7 所示。
表7 大一新生抑郁情況
糾正1:每個(gè)2×4 列聯(lián)表中都有兩個(gè)格子的理論頻數(shù)小于5 且大于1,應(yīng)該使用Fisher 確切概率法替換卡方檢驗(yàn)。
例如,某目標(biāo)研究采用卡方檢驗(yàn)探究在就業(yè)和創(chuàng)業(yè)兩種情境下,不同調(diào)節(jié)定向被試決策偏好的差異。其分析結(jié)果如表8 所示。進(jìn)一步對(duì)數(shù)據(jù)卡方檢驗(yàn)后得出,預(yù)防定向被試的就業(yè)選擇顯著高于促進(jìn)定向被試的就業(yè)選擇( χ2=4.30,p<0.05),促進(jìn)定向被試的創(chuàng)業(yè)選擇顯著高于預(yù)防定向被試的創(chuàng)業(yè)選擇( χ2=8.73,p<0.01),促進(jìn)定向被試在就業(yè)和創(chuàng)業(yè)選擇中不存在顯著差異( χ2=1.00,p<0.05),預(yù)防定向被試的就業(yè)選擇顯著高于其他創(chuàng)業(yè)選擇( χ2=33.64,p<0.001)。
表8 兩種情境下不同調(diào)節(jié)定向被試的決策偏好差異
繆誤1:濫用卡方檢驗(yàn)或卡方分布分析數(shù)據(jù)。不論是用卡方對(duì)擬合度進(jìn)行檢驗(yàn),還是對(duì)變量的獨(dú)立性(即分布的差異)進(jìn)行檢驗(yàn),都不適用于本例。在本例中,研究者試圖比較同一決策情境下不同調(diào)節(jié)定向的優(yōu)劣,無法應(yīng)用卡方檢驗(yàn)得出。更嚴(yán)重的問題是,一般情況下,僅靠?jī)山M實(shí)際頻數(shù)(理論頻數(shù))算不出卡方檢驗(yàn)值。因此,本例中的研究者具體應(yīng)用了什么方法得出的卡方值還有待商榷。
糾正1:根據(jù)本例的數(shù)據(jù)情況,只能得出同一決策情境下不同調(diào)節(jié)定向的數(shù)理頻數(shù)孰高孰低,無法在統(tǒng)計(jì)檢驗(yàn)層面上得出有關(guān)差異的顯著性結(jié)論。
探索性因子分析(EFA)主要用來探索觀測(cè)數(shù)據(jù)的基本結(jié)構(gòu),多應(yīng)用在量表開發(fā)的過程中。EFA 在目標(biāo)文獻(xiàn)中的應(yīng)用也有一定的占比(約5%),且越來越成熟。然而,研究者誤用EFA 的情況卻時(shí)有發(fā)生,導(dǎo)致其研究結(jié)果缺乏可信度、甚至錯(cuò)誤。
例如,某目標(biāo)研究采用EFA 對(duì)《博士生學(xué)術(shù)經(jīng)歷量表》進(jìn)行探索性因子分析,以提煉出構(gòu)念維度。在本例中,測(cè)量工具《博士生學(xué)術(shù)經(jīng)歷量表》采用4 級(jí)計(jì)分方式,共收集到有效問卷188 份,應(yīng)用SPSS 軟件分析數(shù)據(jù)。在探索性因子分析過程中,研究者“使用‘最大方差法’進(jìn)行正交旋轉(zhuǎn),項(xiàng)目選取標(biāo)準(zhǔn)為因子負(fù)荷大于0.45,因子提取標(biāo)準(zhǔn)為特征值大于1。最終在刪除5 道題后得到一個(gè)包含5 個(gè)因子的穩(wěn)定因子結(jié)構(gòu)(KMO=0.82,累積解釋變異量為72.1%)”。其分析結(jié)果如表9 所示,該研究并未做出有關(guān)該探索性因子分析過程的其他描述。
表9 因子提取結(jié)果
繆誤1:忽略EFA 的適用條件。EFA 很重要的一個(gè)應(yīng)用前提是要求觀測(cè)變量之間存在模式化關(guān)系,且不存在多重共線性問題。這就需要研究者在分析前,首先獲得所有變量的相關(guān)矩陣(或協(xié)方差矩陣),以檢驗(yàn)是否有變量缺少模式化關(guān)系,或是否存在問題項(xiàng)導(dǎo)致多重共線性問題,并通過Bartlett 球形檢驗(yàn)確定變量間的模式化關(guān)系,及KMO 測(cè)度確定是否適合應(yīng)用EFA。但在本例中,研究者并沒有進(jìn)行這些分析,而是直接報(bào)告EFA 分析后的KMO 值(KMO 測(cè)度應(yīng)當(dāng)在EFA 分析前進(jìn)行)。
糾正1:在正式分析前,先算出所有變量的相關(guān)矩陣(或協(xié)方差矩陣)。如果存在變量具有大量低相關(guān)系數(shù)(?0.30<r<0.30),則表示這些變量缺少模型化關(guān)系,需要進(jìn)行刪除處理。如果相關(guān)矩陣中存在r>0.90 或r<?0.90 的情況,說明數(shù)據(jù)可能存在共線性問題,需要使用Haitovsky 檢測(cè)是否存在多重共線性問題。如果存在多重共線性問題,則需要確定導(dǎo)致多重共線性問題的變量并將其刪除。然后,通過Bartlett 球形檢驗(yàn)來確定變量(剩余變量)間確實(shí)存在模式化關(guān)系。最后,通過KMO 測(cè)度進(jìn)一步確定EFA 是否可應(yīng)用于本例。如果KMO 值大于0.50,則表示EFA 可適用于本例。如果KMO 值小于0.50,則意味著數(shù)據(jù)無法產(chǎn)生顯著而可靠的因素,EFA 不適用于本例。
繆誤2:忽略因子提取方法的選擇。在SPSS 中有七種因子提取方法供選擇,包括“主成份法”“未加權(quán)最小二乘法(ULS)”“廣義最小二乘法(GLS)”“最大似然法(ML)”“主軸因子提取法”“ α因子提取法”和“映像因子提取法”,且這些因子提取方法提供的結(jié)果稍有不同。需要注意的是,“主成份法”不是一種探索性因素分析方法,而是一種減少拒絕測(cè)量誤差維度的方法,一般用于主成分分析(PCA)中,不應(yīng)用于EFA 分析中。研究者需要根據(jù)研究目的、數(shù)據(jù)的基本情況及對(duì)采用擬合優(yōu)度指數(shù)的興趣,選擇合適的因子提取方法。在本例中,研究者沒有交代使用了具體哪種方法來提取因子。
糾正2:在該例中,測(cè)量工具《博士生學(xué)術(shù)經(jīng)歷量表》采用4 級(jí)計(jì)分方式,屬于類別變量(5 點(diǎn)或以上的李克特量表的變量才可當(dāng)作等距變量處理)。ULS 或加權(quán)最小二乘均值和方差調(diào)整(WLSMV)都可用在基于類別變量的EFA 分析中,且WLSMV 是更優(yōu)的選擇(Muthén,du Toit,& Spisic,1997)。由于SPSS 中沒有WLSMV 方法的設(shè)置,因此,在SPSS 中,對(duì)于類別變量,建議使用ULS 方法。如果研究者應(yīng)用Mplus 作分析,則最好使用WLSMV 方法。
繆誤3:忽略選擇正交旋轉(zhuǎn)的前提條件。正交旋轉(zhuǎn)的前提條件是因子間不相關(guān),而斜交旋轉(zhuǎn)則允許因子間存在相關(guān)。在本例中,研究者并未給出因子之間的相關(guān)關(guān)系,因而無法判斷因子間是否存在相關(guān)。如果“項(xiàng)目參與”與“前沿涉獵”“跨學(xué)科學(xué)習(xí)”“導(dǎo)師交流”間存在相關(guān),那么進(jìn)行正交旋轉(zhuǎn)會(huì)忽視這些因子間的相關(guān),對(duì)分析結(jié)果造成影響。
糾正3:首先檢查一種常用的斜交旋轉(zhuǎn)方法產(chǎn)生的解。斜交旋轉(zhuǎn)后,會(huì)得到三個(gè)基本結(jié)果,即因子模式矩陣、因子結(jié)構(gòu)矩陣和因子相關(guān)性矩陣。如果因子相關(guān)性矩陣中因子間的相關(guān)較低,那么可以進(jìn)行最大方差法正交旋轉(zhuǎn)。如果發(fā)現(xiàn)其中一些因子相互關(guān)聯(lián),那么應(yīng)當(dāng)采用斜交旋轉(zhuǎn)。需要注意的是,當(dāng)采用斜交旋轉(zhuǎn)后,若發(fā)現(xiàn)因子間的相關(guān)較高(r>0.60),那么因子模式矩陣和因子結(jié)構(gòu)矩陣可能會(huì)有顯著差異。在這種情況下,建議報(bào)告兩種矩陣結(jié)果,或者明確說明報(bào)告的載荷是因子模式系數(shù)還是因子結(jié)構(gòu)系數(shù)。
另外,在本例中還存在著其他缺陷。本例沒有交代是否具有或如何處理極端值(包括缺失數(shù)據(jù))。也沒有交代清楚刪除5 個(gè)觀測(cè)變量的原因,是因子載荷小于0.45 或是有顯著交叉載荷的存在,應(yīng)明確說明的信息沒有完整提供,會(huì)降低研究結(jié)果的說服力。
結(jié)構(gòu)方程模型,包括驗(yàn)證性因子分析(CFA),是一種基于變量的協(xié)方差矩陣來分析變量間關(guān)系的多元統(tǒng)計(jì)方法。近五年在目標(biāo)文獻(xiàn)中的應(yīng)用逐年增多,2015 年占比約8.5%到2019 年占比約12.3%。但是,部分研究者由于對(duì)SEM 的基本原理理解不夠透徹而誤用了該統(tǒng)計(jì)方法,導(dǎo)致結(jié)論出錯(cuò)。
例如,某目標(biāo)研究采用SEM 分析教師滿意度、教育期望、政府保障和學(xué)校支持的關(guān)系。在該研究中,樣本量為8150(并未對(duì)數(shù)據(jù)進(jìn)行檢驗(yàn)),測(cè)量工具采用7 點(diǎn)量表,估計(jì)方法選用極大似然(ML)估計(jì),分析軟件是AMOS17.0,初始模型建立如圖4。
圖4 初始模型
初始分析得到27 個(gè)題目的路徑系數(shù)均顯著??傮w來看,模型擬合度較好,但是部分?jǐn)M合指數(shù)未達(dá)基本要求。根據(jù)模型修改建議,研究者通過增加[e12~e13]、[e15~e16]、[e16~e17]、[e6~e7]這些M.I.值大于20 的殘差路徑,最終得到擬合度更好的模型。模型修正前后擬合度情況如表10 所示。
表10 模型修正前后擬合度情況
繆誤1:忽略多元正態(tài)分布的前提條件。為獲取準(zhǔn)確的參數(shù)估計(jì)值和穩(wěn)定可靠的分析結(jié)果,SEM 要求樣本量足夠大且觀測(cè)變量應(yīng)當(dāng)服從多元正態(tài)分布。如果數(shù)據(jù)違背多元正態(tài)分布假設(shè),那么采用ML 估計(jì)方法就會(huì)增大犯Ⅰ型錯(cuò)誤的概率,更可能拒絕實(shí)際上建構(gòu)良好的模型。在本例中,雖然樣本量足夠大,但仍不能保證所有觀測(cè)變量服從多元正態(tài)分布,研究者未作數(shù)據(jù)分布檢驗(yàn)是不恰當(dāng)?shù)摹?/p>
糾正1:在本例中,7 點(diǎn)量表數(shù)據(jù)可以當(dāng)作是連續(xù)數(shù)據(jù)處理。在進(jìn)行SEM 分析前,應(yīng)首先對(duì)數(shù)據(jù)進(jìn)行多元正態(tài)性分布檢驗(yàn),諸如R 語(yǔ)言、SAS 軟件、Python 語(yǔ)言、STATA 軟件均提供了多元正態(tài)性分布檢驗(yàn)。如果數(shù)據(jù)不符合多元正態(tài)性可使用任意分布估計(jì)方法、或用S-B 調(diào)整法調(diào)整基于正態(tài)理論的模型檢驗(yàn)統(tǒng)計(jì)量和參數(shù)標(biāo)準(zhǔn)誤、或通過數(shù)據(jù)轉(zhuǎn)換使數(shù)據(jù)分布正態(tài)化。但是數(shù)據(jù)轉(zhuǎn)換后再分析得到的因子載荷不再是原觀測(cè)變量的數(shù)據(jù)載荷,對(duì)估計(jì)參數(shù)的解釋應(yīng)當(dāng)按照新的測(cè)度進(jìn)行。
繆誤2:模型存在局部過飽和問題。模型的局部過飽和現(xiàn)象是指模型局部的自由度為負(fù)值。當(dāng)模型局部存在過飽和現(xiàn)象時(shí),模型局部的參數(shù)估計(jì)隨意性大且不可信,卻往往能在模型的總體擬合指數(shù)上得出不錯(cuò)的結(jié)果。而在本例中,潛變量“教育期望”下只有兩個(gè)觀測(cè)變量,其局部自由度為?1(3?4=?1),存在模型局部過飽和問題。
糾正2:為了保證SEM 分析結(jié)果的高可靠性,研究者需要對(duì)原始模型進(jìn)行修改,即增加潛變量“教育期望”下面的觀測(cè)變量數(shù)目,使其不少于3 個(gè)。
繆誤3:修正模型存在較嚴(yán)重的測(cè)量誤差相互關(guān)聯(lián)問題。在本例中,作者通過增加[e12~e13]、[e15~e16]、[e16~e17]、[e6~e7]這些M.I.值大于20 的殘差路徑,得到擬合度更好的模型。但是,這種允許測(cè)量誤差在事后關(guān)聯(lián)的理由是不合理的。出現(xiàn)誤差相關(guān)聯(lián)的情況實(shí)際上是由于有誤差相關(guān)聯(lián)的潛變量中仍然存在潛在的分離,即觀測(cè)變量還有遺漏,或相關(guān)的觀測(cè)變量存在問題。況且[e16~e17]是兩個(gè)潛變量“學(xué)校支持”和“政府保障”下觀測(cè)變量測(cè)量誤差的關(guān)聯(lián),更是不能出現(xiàn)在模型中的。因此,出現(xiàn)較嚴(yán)重的測(cè)量誤差相互關(guān)聯(lián)的情況說明初始模型的結(jié)構(gòu)存在問題,初始模型成立理論不充分,需要增加或減少觀測(cè)變量。
糾正3:[e12~e13]、[e15~e16]、[e6~e7]這些測(cè)量誤差存在相互關(guān)聯(lián)說明初始的假設(shè)模型中遺漏了觀測(cè)變量,研究者可以根據(jù)理論分離這些觀測(cè)變量中的部分變量(即補(bǔ)充遺漏觀測(cè)變量),或者分別刪掉e12 和e13、e15 和e16、e6 和e7 中因子載荷較小的那個(gè)觀測(cè)變量。[e16~e17]屬于不同潛變量中的觀測(cè)變量的誤差相關(guān)聯(lián),研究者應(yīng)當(dāng)根據(jù)理論重新檢查初始模型,決定是刪掉目標(biāo)觀測(cè)變量或是修正相關(guān)觀測(cè)變量的題目。依據(jù)修正指數(shù),在該例中,“學(xué)11”這個(gè)觀測(cè)變量可能存在較大問題。不論如何修正初始模型,建立新的模型后,建議研究者用新的獨(dú)立數(shù)據(jù)測(cè)試新模型。
需要注意的是,SEM 只是一種檢驗(yàn)理論的工具,通常在沒有充分理論支持的情況下,不建議研究者輕易遵照修正指數(shù)調(diào)整初始模型。此外,因?yàn)樵摾臉颖玖孔銐虼?,而卡方值容易受樣本量的影響,即?dāng)樣本量足夠大時(shí)卡方值也會(huì)較大,所以卡方值在本例中對(duì)判斷模型的擬合優(yōu)度沒有太大的意義。
由于定量研究方法起源于自然科學(xué)領(lǐng)域,那么其在教育實(shí)證研究中的應(yīng)用除了受到教育學(xué)本身發(fā)展的影響,也會(huì)受到數(shù)學(xué)、計(jì)算機(jī)科學(xué)等學(xué)科發(fā)展的影響,將會(huì)呈現(xiàn)出跨學(xué)科、多元化的發(fā)展趨勢(shì)。以下就從教育科學(xué)的發(fā)展角度,結(jié)合自然科學(xué)、技術(shù)的發(fā)展趨勢(shì)及國(guó)內(nèi)諸多學(xué)者的分析,對(duì)定量研究方法在我國(guó)教育實(shí)證研究領(lǐng)域中的應(yīng)用進(jìn)行初步的展望。
1. 定量研究方法將更廣泛地被應(yīng)用
從對(duì)五年來定量方法的應(yīng)用特點(diǎn)的分析可知,定量方法的應(yīng)用率雖然是在逐年穩(wěn)步地增加,但是總占比還是很低,未來還有很大的上升空間。因此,隨著“教育實(shí)證論壇”的繼續(xù)召開,有關(guān)定量方法的普及會(huì)繼續(xù)擴(kuò)大,必然會(huì)有更多教育研究會(huì)使用定量方法。
2. 機(jī)構(gòu)間的合作將更頻繁和深入
從對(duì)五年來作者合作網(wǎng)絡(luò)的分析可知,我國(guó)教育科學(xué)領(lǐng)域研究團(tuán)隊(duì)之間的合作交流還有待提高。由于本身團(tuán)隊(duì)間的合作基數(shù)小、合作網(wǎng)絡(luò)較疏散,所以只要各大研究機(jī)構(gòu)鼓勵(lì)、重視團(tuán)隊(duì)間的合作,未來學(xué)者間合作的比例會(huì)有較大上升。并且隨著研究深入,核心作者間的合作也會(huì)逐漸增多,形式也會(huì)趨于長(zhǎng)久、穩(wěn)定,團(tuán)隊(duì)間的合作網(wǎng)絡(luò)也會(huì)更牢固。
3. 定量研究方法的應(yīng)用將更成熟
從對(duì)五年來定量研究方法應(yīng)用特點(diǎn)的分析可知,新方法、新技術(shù)的引進(jìn)速度慢,且方法誤用屢見不鮮。而“教育實(shí)證論壇”的召開和中國(guó)教育實(shí)證研究“這五年??钡呐e動(dòng)意味著我國(guó)各高校教育學(xué)院和教育科研院所已經(jīng)開始重視普及量化知識(shí),未來也會(huì)更加重視吸收、培養(yǎng)專門從事定量研究的人才。學(xué)者們一旦對(duì)定量方法的應(yīng)用重視起來,新方法、新技術(shù)的引進(jìn)和研發(fā)速度也會(huì)增快,方法的誤用也會(huì)有所改善,其應(yīng)用也將會(huì)更成熟。
1. 定量研究方法趨向跨學(xué)科交叉應(yīng)用
教育現(xiàn)象本身涵蓋的內(nèi)容會(huì)涉及經(jīng)濟(jì)、生理、心理等多個(gè)學(xué)科領(lǐng)域,如有條件的現(xiàn)金轉(zhuǎn)移支付承諾可以改善我國(guó)農(nóng)村貧困學(xué)生高中完成情況(易紅梅,何婧,張林秀,2019)。教育科學(xué)研究要有效地揭示教育現(xiàn)象的本質(zhì)、解決教育實(shí)踐中的問題,就需要在跨學(xué)科的基礎(chǔ)上進(jìn)行研究與合作。因此,針對(duì)教育現(xiàn)象的跨學(xué)科研究是教育科學(xué)發(fā)展與進(jìn)步的必然趨勢(shì)。而定量方法在各個(gè)學(xué)科領(lǐng)域中又都是相通的,它的應(yīng)用是屬于交叉學(xué)科范疇。只要研究主題和數(shù)據(jù)符合要求,一種定量方法可以應(yīng)用在不同學(xué)科中,如回歸分析可以應(yīng)用在研究心理現(xiàn)象上,也可以應(yīng)用在研究影響經(jīng)濟(jì)效應(yīng)的因素上。在美國(guó),不論自然科學(xué)界還是社會(huì)科學(xué)界對(duì)定量研究方法的應(yīng)用已經(jīng)相當(dāng)普遍,并且定量研究方法已經(jīng)成為跨學(xué)科研究的重要工具和媒介。由于我國(guó)教育科學(xué)領(lǐng)域目前正處在提升研究深度和廣度、鼓勵(lì)學(xué)科融合、吸收交叉人才的階段,那么隨著跨學(xué)科研究的逐漸增多,定量方法也會(huì)被更加廣泛地應(yīng)用在跨學(xué)科和交叉學(xué)科的教育實(shí)證研究中。
2. 定量研究方法趨向多元化、混合化應(yīng)用
隨著教育科學(xué)的發(fā)展,單一的定量方法很難處理較復(fù)雜的教育研究問題,也不容易得到準(zhǔn)確客觀的研究結(jié)論。為了更好地研究教育問題,研究者往往需要多元化應(yīng)用定量研究方法,而計(jì)算機(jī)科學(xué)技術(shù)、統(tǒng)計(jì)學(xué)、心理學(xué)等學(xué)科的飛速進(jìn)步又為定量研究方法的多元化應(yīng)用提供了工具、方法論和研究范式。如李憲印等人(2019)在研究大學(xué)生創(chuàng)新行為的構(gòu)成因素時(shí)綜合運(yùn)用了項(xiàng)目分析、探索性因子分析、驗(yàn)證性因子分析、信度檢驗(yàn)和方差分析。更進(jìn)一步,為適應(yīng)社會(huì)科學(xué)發(fā)展的需要、深入具體地分析問題,將質(zhì)性和定量方法相結(jié)合的混合研究也逐漸在國(guó)際學(xué)術(shù)界流行起來。比如Lv et al.(2020)在研究正念對(duì)抑郁的干預(yù)效果的研究中就混合了元分析和敘述性綜述兩類方法。“全國(guó)首屆教育實(shí)證研究論壇”的召開標(biāo)志著我國(guó)教育科學(xué)將進(jìn)入一個(gè)新的歷史發(fā)展階段,教育研究將更加關(guān)注實(shí)證,也更趨向于科學(xué)、規(guī)范和多元化,教育研究方法的應(yīng)用也將會(huì)更加多元且有混合化趨向。
1. 定量研究方法趨向大樣本化、大數(shù)據(jù)化應(yīng)用
云計(jì)算、互聯(lián)網(wǎng)和物聯(lián)網(wǎng)技術(shù)的發(fā)展使得社會(huì)信息化的程度不斷加深,研究者可以利用網(wǎng)絡(luò)挖掘、大型調(diào)查數(shù)據(jù)庫(kù)等方式獲得大量數(shù)據(jù)。大樣本的使用,既能提高定量分析結(jié)果的準(zhǔn)確度,又能減少重復(fù)工作、節(jié)約科研成本,已經(jīng)被越來越多的學(xué)者所青睞,也成為定量研究方法應(yīng)用的一大趨勢(shì)。另一方面,隨著大規(guī)模并行處理數(shù)據(jù)庫(kù)、數(shù)據(jù)挖掘、云計(jì)算平臺(tái)、分布式文件系統(tǒng)等技術(shù)的出現(xiàn),使得通過對(duì)全樣本進(jìn)行定量分析從而得到相對(duì)理想的分析結(jié)果成為可能。同時(shí),我國(guó)又將大數(shù)據(jù)的研究和發(fā)展視為新的國(guó)家戰(zhàn)略之一(何哲,2015),使得教育大數(shù)據(jù)的應(yīng)用成為必然趨勢(shì)。因此,定量方法會(huì)越來越多地被用來輔助大數(shù)據(jù)技術(shù)分析教育大數(shù)據(jù)。需要注意的是,雖然大數(shù)據(jù)彌補(bǔ)了傳統(tǒng)數(shù)據(jù)的很多缺陷,但是也有其局限性。如由大數(shù)據(jù)方法獲得的總體本身往往存在偏差,會(huì)導(dǎo)致分析產(chǎn)生系統(tǒng)性偏誤等,因此大數(shù)據(jù)分析也不能完全取代抽樣分析。
2. 定量研究方法趨向“AI+教育”的應(yīng)用
伴隨著人工智能(AI)的不斷發(fā)展,其在教育領(lǐng)域的應(yīng)用也愈加廣泛,如伴讀機(jī)器人走入課堂、智能閱卷開始出現(xiàn)等。在2017 年國(guó)務(wù)院印發(fā)的《新一代人工智能發(fā)展規(guī)劃》中明確提出,“實(shí)施全民智能教育項(xiàng)目”(國(guó)務(wù)院,2017),全方位地實(shí)現(xiàn)“AI+教育”成為教育領(lǐng)域的理想和目標(biāo)(吳站杰,秦健,2003)。而將定量方法應(yīng)用到AI 領(lǐng)域不僅能推動(dòng)“AI+教育”的發(fā)展,還能促進(jìn)新的定量方法的產(chǎn)生。如研究者可以運(yùn)用深度學(xué)習(xí)方法設(shè)計(jì)并訓(xùn)練出多款輔助教學(xué)機(jī)器人,把其分給具有相同學(xué)習(xí)基礎(chǔ)和條件的學(xué)生使用,然后收集相關(guān)數(shù)據(jù),通過定量分析找出輔助學(xué)習(xí)效果最佳的機(jī)器人并投入教育市場(chǎng)。再如,分布式計(jì)算和AI 技術(shù)的發(fā)展使得基于Agent 的建模方法應(yīng)運(yùn)而生,并越來越多地應(yīng)用在社會(huì)科學(xué)領(lǐng)域,通過模擬個(gè)體或團(tuán)體的行為和交互來評(píng)估其對(duì)整個(gè)系統(tǒng)的影響。目前,我國(guó)的“AI+教育”尚處在發(fā)展的初始階段(余勝泉,2018,第106 頁(yè)),在政策和市場(chǎng)的影響下,有關(guān)“AI+教育”的研究會(huì)迅速增多,定量方法被廣泛應(yīng)用到“AI+教育”研究中也是必然趨勢(shì)。
由于受到研究對(duì)象、研究方法、研究工具的制約,本研究存在一定的局限性。一方面,本研究的11 本期刊并不能全完無偏的代表所有的中文期刊,定量研究方法在某些非核心期刊的應(yīng)用情況可能更糟,或者在一些專業(yè)性較強(qiáng)的期刊的應(yīng)用情況可能更好。另一方面,受專業(yè)性和評(píng)價(jià)體系的影響,某些學(xué)者會(huì)更傾向于把文章發(fā)表在專業(yè)性期刊上,或者一部分中國(guó)學(xué)者會(huì)把質(zhì)量較高的文章發(fā)表在SSCI 期刊上。這樣有些方法的誤用情況就可能會(huì)被忽略;同樣,有些應(yīng)用了新方法、新技術(shù)的文章也會(huì)被忽略。因此,后續(xù)研究者可以嘗試把研究樣本擴(kuò)大到這些期刊范圍,進(jìn)行更加深入的分析。
華東師范大學(xué)學(xué)報(bào)(教育科學(xué)版)2020年9期