胡德鑫, 王耀榮
(天津大學(xué)教育學(xué)院, 天津 300350)
進(jìn)入21世紀(jì)以來(lái),全球正處于百年未有之大變局,隨著以人工智能技術(shù)為代表的新科技革命不斷發(fā)展,全球資源配置形態(tài)、工業(yè)生產(chǎn)模式和人類生活方式正發(fā)生急遽變革。人工智能技術(shù)亟需在國(guó)家高科技戰(zhàn)略與前沿行業(yè)發(fā)展領(lǐng)域發(fā)揮引領(lǐng)與支撐作用,當(dāng)前人工智能已經(jīng)成為賦能學(xué)校教育治理現(xiàn)代化的關(guān)鍵工具,受到學(xué)術(shù)界和社會(huì)公眾的廣泛關(guān)注。尤其是2020年以來(lái),關(guān)于人工智能技術(shù)在教育教學(xué)領(lǐng)域應(yīng)用的研究快速增加,主要集中在輔助學(xué)生學(xué)習(xí)的智能分析技術(shù)、教師智能技術(shù)運(yùn)用能力提升、教學(xué)資源開(kāi)發(fā)與共享機(jī)制、教學(xué)管理與評(píng)價(jià)智能平臺(tái)建設(shè)、學(xué)習(xí)環(huán)境技術(shù)支持與升級(jí)等諸多領(lǐng)域。人工智能進(jìn)一步賦能智慧教學(xué)、泛在學(xué)習(xí)、監(jiān)測(cè)評(píng)價(jià)等教育教學(xué)改革場(chǎng)域,為“人工智能+教育”的多場(chǎng)景、多模態(tài)、多時(shí)空運(yùn)用奠定堅(jiān)實(shí)技術(shù)基礎(chǔ)。
通過(guò)梳理發(fā)現(xiàn),目前學(xué)術(shù)界對(duì)人工智能技術(shù)是否影響學(xué)生的學(xué)習(xí)效果主要持有以下兩類觀點(diǎn)。諸多學(xué)者通過(guò)實(shí)驗(yàn)證明人工智能技術(shù)對(duì)學(xué)生的學(xué)習(xí)效果有顯著影響。諸如,Abbasi等通過(guò)開(kāi)發(fā)部署一個(gè)帶有面向?qū)ο缶幊陶Z(yǔ)言知識(shí)庫(kù)的聊天機(jī)器人系統(tǒng),使用谷歌搜索引擎和聊天機(jī)器人系統(tǒng)進(jìn)行實(shí)驗(yàn)比較,實(shí)驗(yàn)結(jié)果表明聊天機(jī)器人系統(tǒng)對(duì)學(xué)生的記憶保持和學(xué)習(xí)成績(jī)有顯著影響[1];Zafar等通過(guò)設(shè)計(jì)和開(kāi)發(fā)一種智能輔導(dǎo)技術(shù),對(duì)在真實(shí)環(huán)境中計(jì)算機(jī)科學(xué)專業(yè)的研究生用SQL進(jìn)行測(cè)試,結(jié)果顯示該智能輔導(dǎo)系統(tǒng)對(duì)學(xué)生學(xué)習(xí)結(jié)果產(chǎn)生積極的影響[2];Julià等通過(guò)實(shí)驗(yàn)組和對(duì)照組對(duì)比的視角,討論和分析教育機(jī)器人在培養(yǎng)12歲學(xué)生空間能力方面的效果,結(jié)果顯示機(jī)器人課程參與者對(duì)空間能力的積極變化大于未參加課程的學(xué)生的變化[3]。然而也有一些實(shí)證研究結(jié)果表明,人工智能技術(shù)并不能提升學(xué)生的學(xué)習(xí)效果。如Calvo-Ferrer通過(guò)前、后和延遲測(cè)試探究智能教育游戲?qū)W(xué)生詞匯習(xí)得和感知學(xué)習(xí)收益的激勵(lì)效應(yīng),結(jié)果顯示智能教育游戲?qū)W(xué)生的學(xué)習(xí)結(jié)果沒(méi)有影響[4],該作者認(rèn)為智能教育游戲作為教育環(huán)境中的一種創(chuàng)新技術(shù)工具,可能會(huì)讓學(xué)生過(guò)度興奮,進(jìn)而可能導(dǎo)致學(xué)生對(duì)教育內(nèi)容分心;Wrzesien等采用準(zhǔn)實(shí)驗(yàn)設(shè)計(jì)對(duì)比虛擬班級(jí)(采用E-Junior智能程序以幫助學(xué)生理解自然科學(xué)的虛擬世界)和傳統(tǒng)類型的班級(jí)對(duì)學(xué)習(xí)效果的影響,結(jié)果顯示虛擬班級(jí)和傳統(tǒng)班級(jí)在學(xué)習(xí)效果上沒(méi)有統(tǒng)計(jì)學(xué)上的顯著差異[5-6]。
總的來(lái)看,目前學(xué)術(shù)界針對(duì)人工智能技術(shù)對(duì)學(xué)習(xí)效果影響這一論題仍未達(dá)成統(tǒng)一共識(shí),人工智能對(duì)學(xué)習(xí)效果的影響尚不清楚。鑒于此,本研究采用元分析研究法,對(duì)2010至2022年國(guó)際權(quán)威數(shù)據(jù)庫(kù)中關(guān)于人工智能影響學(xué)生學(xué)習(xí)效果的實(shí)證研究文獻(xiàn)進(jìn)行篩選并分析。本研究試圖回答以下問(wèn)題:1)與傳統(tǒng)學(xué)習(xí)方式相比,人工智能技術(shù)整體上能否提升學(xué)生學(xué)習(xí)效果?2)人工智能對(duì)學(xué)生學(xué)習(xí)效果在認(rèn)知層面和非認(rèn)知層面各維度的影響程度如何?對(duì)學(xué)生認(rèn)知和非認(rèn)知的學(xué)習(xí)效果有無(wú)差異?3)不同類型的人工智能技術(shù)應(yīng)用對(duì)學(xué)習(xí)效果的影響有沒(méi)有差異?4)人工智能在不同學(xué)科、學(xué)段和規(guī)模下是否會(huì)影響學(xué)習(xí)效果,影響程度有沒(méi)有差異?
本研究主要探究人工智能技術(shù)對(duì)學(xué)生學(xué)習(xí)效果的潛在影響與基本特征。借鑒蔣鑫等學(xué)者對(duì)美國(guó)教育中的人工智能熱點(diǎn)分類,結(jié)合本研究所梳理的文獻(xiàn),把教育領(lǐng)域內(nèi)常用的人工智能技術(shù)劃分為可穿戴技術(shù)(Wearable Technology)、教育機(jī)器人(Educational Robot)、智能教育游戲(Smart Educational Games)和智能學(xué)習(xí)系統(tǒng)(Intelligent Learning System)四種類型[7]。本研究中的學(xué)習(xí)效果指基于人工智能技術(shù)的運(yùn)用,學(xué)生在學(xué)習(xí)過(guò)程中產(chǎn)生的心理與行為上的變化。研究借鑒顧小清等學(xué)者將學(xué)習(xí)效果分為認(rèn)知和非認(rèn)知兩個(gè)層面,結(jié)合納入本研究的樣本文獻(xiàn),認(rèn)知層面劃分為創(chuàng)造性思維、問(wèn)題解決能力、學(xué)習(xí)收獲、認(rèn)知能力和空間能力五個(gè)維度,非認(rèn)知層面主要包括學(xué)習(xí)意志、學(xué)習(xí)態(tài)度、學(xué)習(xí)參與、學(xué)習(xí)興趣和學(xué)習(xí)動(dòng)機(jī)五個(gè)維度[8]。
本研究中選取的樣本文獻(xiàn)主要通過(guò)對(duì)Web of Science、Springer Link、ScienceDirect、ERIC、IEEE等國(guó)際權(quán)威文獻(xiàn)數(shù)據(jù)庫(kù)中2010—2022年間發(fā)表的論文進(jìn)行大范圍交叉檢索,檢索時(shí)用人工智能技術(shù)關(guān)鍵詞包括:人工智能(Artificial Intelligence)、教育(Education)、智能學(xué)習(xí)系統(tǒng)(Intelligent Learning System)、機(jī)器人(Robot)、可穿戴技術(shù)(Wearable Technology)、智能教育游戲(Smart Educational Games)等。學(xué)習(xí)效果相關(guān)關(guān)鍵詞有:學(xué)習(xí)成就(Learning Achievement)、學(xué)習(xí)表現(xiàn)(Learning Performance)、學(xué) 習(xí) 收 獲(Learning Gains)、學(xué)習(xí)結(jié)果(Learning Outcome)、學(xué)習(xí)影響(Learning Effect)等。首輪檢索結(jié)束后,為獲取更多相關(guān)研究權(quán)威文獻(xiàn),對(duì)相關(guān)研究的參考文獻(xiàn)進(jìn)行第二輪回溯檢索。
為保證研究的嚴(yán)謹(jǐn)性和有效性,本研究對(duì)文獻(xiàn)納入標(biāo)準(zhǔn)制定了以下規(guī)則:第一,研究主題必須為人工智能技術(shù)影響學(xué)生學(xué)習(xí)效果的高度相關(guān)研究;第二,研究必須為實(shí)證研究,排除非實(shí)證研究;第三,研究必須包括實(shí)驗(yàn)組和對(duì)照組,實(shí)驗(yàn)組學(xué)生使用人工智能技術(shù),對(duì)照組采用傳統(tǒng)學(xué)習(xí)方式,或者是實(shí)驗(yàn)采取前測(cè)和后測(cè),前測(cè)為人工智能技術(shù)干預(yù)前,后測(cè)為人工智能技術(shù)干預(yù)后;第四,研究必須包括能夠計(jì)算出效應(yīng)值的各項(xiàng)統(tǒng)計(jì)原始數(shù)據(jù)。經(jīng)過(guò)篩選后,最終完全符合元分析標(biāo)準(zhǔn)的文獻(xiàn)共有40篇,共計(jì)包含72個(gè)效應(yīng)值,具體流程如圖1所示[9-44]。
圖1 樣本文獻(xiàn)篩選Prisma流程
根據(jù)納入元分析樣本文獻(xiàn)的特點(diǎn),對(duì)樣本文獻(xiàn)的特征值進(jìn)行編碼,從符合文件篩選要求的文獻(xiàn)中提取以下變量:作者、出版年、樣本量、學(xué)段、學(xué)科、技術(shù)應(yīng)用類型以及學(xué)習(xí)效果等信息,編碼標(biāo)準(zhǔn)如表1所 示[45]。為保證編碼的準(zhǔn)確性,本研究由兩位研究人員進(jìn)行雙重編碼,兩者編碼的Kappa值為0.913,說(shuō)明編碼結(jié)果可信。
表1 文獻(xiàn)編碼標(biāo)準(zhǔn)
本研究采用的基本方法是元分析,元分析法是通過(guò)采用特定的測(cè)量與統(tǒng)計(jì)分析技術(shù)對(duì)諸多同一類主題的多項(xiàng)獨(dú)立的量化研究進(jìn)行再分析,避免單個(gè)研究結(jié)果可能帶來(lái)的結(jié)論偏差,從而得出一個(gè)具有普遍性意義的結(jié)論。目前可用于元分析的主流工具包括R語(yǔ)言、Stata、SAS、Review Manager和Comprehensive Meta-Analysis(CMA)等。結(jié)合研究實(shí)際情況,本研究采用CMA 3.0作為技術(shù)分析工具開(kāi)展研究。在元分析研究中,常用的效應(yīng)量有Cohen’sd和Hedges’g,綜合對(duì)比分析這兩種效應(yīng)量,結(jié)合本研究中有部分文獻(xiàn)的研究對(duì)象樣本量小于20的實(shí)際情況,本研究采用Hedges’g作為效應(yīng)量指標(biāo)[46]。在解釋效應(yīng)量大小時(shí),研究使用了科恩的效應(yīng)值分類:當(dāng)效應(yīng)值位于0.8左右時(shí),有顯著的影響效果,且影響很大;當(dāng)效應(yīng)值位于0.5左右時(shí),有中等程度的影響;當(dāng)效應(yīng)值在0.2左右時(shí),通常認(rèn)為影響相對(duì)較小,效果不顯著[47]。除探究人工智能技術(shù)對(duì)學(xué)生學(xué)習(xí)效果的總體影響外,本研究還引入樣本規(guī)模、學(xué)科、學(xué)段和技術(shù)應(yīng)用類型4類調(diào)節(jié)變量,從不同層面來(lái)評(píng)價(jià)人工智能技術(shù)對(duì)學(xué)習(xí)效果的影響,框架設(shè)計(jì)如圖2所示。
圖2 元分析框架設(shè)計(jì)路線
在元分析中,當(dāng)選擇樣本不能代表該領(lǐng)域的研究總體時(shí),就有可能出現(xiàn)發(fā)表偏倚問(wèn)題,從而影響研究結(jié)果的準(zhǔn)確性。為檢驗(yàn)本研究是否存在發(fā)表偏倚現(xiàn)象, 評(píng)估采用漏斗圖和失安全系數(shù)(Fail-safe N)的綜合評(píng)價(jià)方法加以判定。圖3漏斗圖中橫坐標(biāo)表示平均標(biāo)準(zhǔn)差效應(yīng)值,縱坐標(biāo)表示效應(yīng)值的標(biāo)準(zhǔn)差。使用漏斗圖對(duì)發(fā)表偏倚進(jìn)行可視化,可以看出72項(xiàng)獨(dú)立研究效應(yīng)量絕大部分位于漏斗圖的上半部分,且分布在平均效應(yīng)值的兩側(cè),說(shuō)明存在發(fā)表偏倚的可能性很小。失安全系數(shù)是評(píng)估發(fā)表偏倚是否發(fā)生的另一個(gè)有效指標(biāo),該系數(shù)強(qiáng)調(diào)在元分析結(jié)果有統(tǒng)計(jì)意義時(shí),系數(shù)值越大,結(jié)論逆轉(zhuǎn)的可能性越低,即發(fā)表偏倚出現(xiàn)的概率越小。其具體評(píng)價(jià)標(biāo)準(zhǔn)為如果失安全系數(shù)小于5K+10,其中K代表納入元分析的樣本文獻(xiàn)數(shù)量,則存在發(fā)表偏倚。本研究中失安全系數(shù)為4 655,遠(yuǎn)超過(guò)210(即5×40+10),說(shuō)明此研究存在發(fā)表偏倚的可能性很小。根據(jù)上述兩種評(píng)價(jià)方法綜合判斷,本研究的基本結(jié)果較為可靠,能夠得出較為穩(wěn)定的結(jié)論。
圖3 效應(yīng)值分布漏斗圖
異質(zhì)性檢驗(yàn)主要用于測(cè)量研究中效應(yīng)值的變異程度,目的是確定各獨(dú)立研究結(jié)果是否具有可合并性。本研究中主要采用Q和I2來(lái)進(jìn)行檢驗(yàn),結(jié)果顯示Q為731.741(p<0.001),說(shuō)明研究的樣本間存在異質(zhì)性;I2的值為90.297%,大于75%,說(shuō)明90%的異質(zhì)性是來(lái)自于效應(yīng)值的真實(shí)差異,僅有10%是由系統(tǒng)誤差導(dǎo)致的。納入研究中樣本文獻(xiàn)的發(fā)表時(shí)間、來(lái)源國(guó)家、樣本規(guī)模、研究對(duì)象等多種因素可能是導(dǎo)致出現(xiàn)異質(zhì)性的原因。I2值反映異質(zhì)性部分在效應(yīng)量總的變異中所占的比重,其數(shù)值越大,表明異質(zhì)性越強(qiáng)。本研究采用隨機(jī)效應(yīng)模型進(jìn)行解析,以保證研究結(jié)果的有效性和可靠性,從而有效消除異質(zhì)性[48-49]。
將40項(xiàng)研究(共含72個(gè)效應(yīng)量)的實(shí)驗(yàn)組和對(duì)照組或前測(cè)和后測(cè)的樣本量、均值和標(biāo)準(zhǔn)差等數(shù)據(jù)導(dǎo)入到元分析軟件CMA3.0中,人工智能對(duì)學(xué)習(xí)效果影響的整體效應(yīng)檢驗(yàn)如表2所示。整體效應(yīng)值Hedges’g為0.845,且p<0.001,說(shuō)明人工智能技術(shù)能夠顯著提升學(xué)生的學(xué)習(xí)效果。
表2 人工智能對(duì)學(xué)習(xí)效果影響的整體效應(yīng)檢驗(yàn)
本研究將學(xué)習(xí)效果分為認(rèn)知層面和非認(rèn)知層面。通過(guò)表3可知,人工智能技術(shù)對(duì)學(xué)習(xí)效果認(rèn)知層面的效 應(yīng) 值Hedges’g為0.915,達(dá) 到 統(tǒng) 計(jì) 顯 著 水 平(p<0.001),效應(yīng)值大于0.8,說(shuō)明人工智能技術(shù)對(duì)認(rèn)知層面的學(xué)習(xí)效果有顯著影響。非認(rèn)知層面的效應(yīng)值Hedges’g為0.783,達(dá) 到 統(tǒng) 計(jì) 意 義 上 的 顯 著 水 平(p<0.001),效應(yīng)值大于0.5且小于0.8,說(shuō)明人工智能技術(shù)對(duì)學(xué)生學(xué)習(xí)效果的影響在非認(rèn)知層面上有中等偏上程度的影響。組間效應(yīng)Q=0.739,沒(méi)有達(dá)到統(tǒng)計(jì)意義上的顯著水平(p>0.05),說(shuō)明人工智能技術(shù)對(duì)學(xué)生學(xué)習(xí)效果在認(rèn)知層面和非認(rèn)知層面不存在顯著差異。研究結(jié)果表明人工智能技術(shù)對(duì)學(xué)生認(rèn)知層面和非認(rèn)知層面的學(xué)習(xí)效果均具有較高的提升效果。
表3 人工智能對(duì)認(rèn)知與非認(rèn)知層面學(xué)習(xí)效果影響的差異分析
人工智能技術(shù)對(duì)認(rèn)知和非認(rèn)知層面各個(gè)維度的影響如表4所示。在認(rèn)知層面,學(xué)習(xí)收獲效應(yīng)值為1.049,認(rèn)知能力效應(yīng)值為0.992,且都具有統(tǒng)計(jì)顯著性(p<0.001),表明人工智能技術(shù)對(duì)學(xué)生認(rèn)知能力和學(xué)習(xí)收獲有積極正向的影響。問(wèn)題解決能力的效應(yīng)值為0.650(p<0.05),說(shuō)明人工智能技術(shù)對(duì)學(xué)生問(wèn)題解決能力有中等程度的積極正向影響。人工智能技術(shù)對(duì)學(xué)生創(chuàng)造性思維和空間能力影響方面,不具有統(tǒng)計(jì)學(xué)的顯著意義(p>0.05)。在非認(rèn)知層面,學(xué)習(xí)參與的效應(yīng)值為1.148,學(xué)習(xí)態(tài)度的效應(yīng)值為0.896,學(xué)習(xí)動(dòng)機(jī)的效應(yīng)值為0.814,學(xué)習(xí)意志的效應(yīng)值為0.803,且都具有統(tǒng)計(jì)顯著性(p<0.05),說(shuō)明人工智能對(duì)學(xué)生學(xué)習(xí)效果在這4個(gè)方面都具有積極正向的顯著影響,其中在學(xué)習(xí)參與方面影響最大。學(xué)習(xí)興趣的效應(yīng)值為0.562,具有統(tǒng)計(jì)顯著性(p<0.001),說(shuō)明人工智能技術(shù)對(duì)學(xué)習(xí)興趣有中等程度的正向促進(jìn)作用。
表4 人工智能對(duì)各維度學(xué)習(xí)效果影響的差異分析
(1) 不同類型的人工智能技術(shù)應(yīng)用對(duì)學(xué)習(xí)效果影響的差異分析。本研究將人工智能技術(shù)的應(yīng)用類型分為教育機(jī)器人、可穿戴技術(shù)、智能教育游戲和智能學(xué)習(xí)系統(tǒng)。從表5可以看出,教育機(jī)器人效應(yīng)值為0.828,可穿戴技術(shù)效應(yīng)值為0.739,智能教育游戲效應(yīng)值為0.811,智能學(xué)習(xí)系統(tǒng)的效應(yīng)值為0.991,且都具有統(tǒng)計(jì)顯著性(p<0.001),說(shuō)明四種不同類型的人工智能應(yīng)用對(duì)學(xué)生學(xué)習(xí)效果都具有積極正向的促進(jìn)作用。組間效應(yīng)Q=1.371,沒(méi)有達(dá)到統(tǒng)計(jì)意義上的顯著水平(p>0.05),表明不同技術(shù)應(yīng)用類型在促進(jìn)學(xué)生學(xué)習(xí)效果上不存在顯著差異。
表5 不同技術(shù)應(yīng)用類型對(duì)學(xué)習(xí)效果影響的差異分析
(2) 人工智能技術(shù)對(duì)不同學(xué)段學(xué)生學(xué)習(xí)效果影響的差異分析。將納入研究的樣本文獻(xiàn)中的學(xué)段分為幼教、小學(xué)、中學(xué)和大學(xué)4個(gè)學(xué)段。由表6結(jié)果可得,在大學(xué)階段的效應(yīng)值為1.207,幼教階段效應(yīng)值為1.382,效應(yīng)值均大于0.8,且達(dá)到統(tǒng)計(jì)學(xué)意義的顯著水平(p<0.05),說(shuō)明在大學(xué)階段和幼教階段人工智能技術(shù)對(duì)學(xué)習(xí)效果的影響達(dá)到積極正向的顯著效果;小學(xué)階段效應(yīng)值為0.652,中學(xué)階段效應(yīng)值為0.625,且都具有統(tǒng)計(jì)學(xué)的顯著意義(p<0.001),說(shuō)明人工智能技術(shù)在小學(xué)和中學(xué)階段有中等程度的正向影響。組間效應(yīng)Q=11.83,達(dá)到統(tǒng)計(jì)學(xué)意義的顯著水平(p<0.05),說(shuō)明人工智能技術(shù)對(duì)不同學(xué)段學(xué)生的學(xué)習(xí)效果存在顯著差異。
表6 人工智能對(duì)不同學(xué)段學(xué)生學(xué)習(xí)效果影響的差異分析
(3) 人工智能技術(shù)對(duì)不同學(xué)科學(xué)習(xí)效果影響的差異分析。本研究將人工智能所應(yīng)用的學(xué)科領(lǐng)域劃分為英語(yǔ)、數(shù)學(xué)、物理、計(jì)算機(jī)、科學(xué)和生物6個(gè)學(xué)科,探究人工智能對(duì)學(xué)習(xí)效果的影響在不同學(xué)科間的差異。結(jié)果見(jiàn)表7所示,組間效應(yīng)Q=37.00,達(dá)到統(tǒng)計(jì)學(xué)意義的顯著水平(p<0.05),說(shuō)明人工智能技術(shù)對(duì)不同學(xué)科的學(xué)習(xí)效果存在顯著差異。對(duì)計(jì)算機(jī)這一學(xué)科的影響最大,效應(yīng)值為1.334,其次生物學(xué)科效應(yīng)值為1.230,英語(yǔ)學(xué)科效應(yīng)值為0.919,這三個(gè)學(xué)科的效應(yīng)值都達(dá)到0.8以上,且均具有統(tǒng)計(jì)顯著性(p<0.001),說(shuō)明人工智能對(duì)計(jì)算機(jī)、生物和英語(yǔ)學(xué)科的學(xué)習(xí)效果具有積極正向的顯著作用。數(shù)學(xué)學(xué)科效應(yīng)值為0.500,科學(xué)學(xué)科效應(yīng)值為0.501,數(shù)學(xué)和科學(xué)的效應(yīng)值在0.5~0.8之間,且都具有統(tǒng)計(jì)學(xué)的顯著意義(p<0.001),表明人工智能對(duì)數(shù)學(xué)和科學(xué)學(xué)科的學(xué)習(xí)效果具有中等程度的正向影響。而人工智能對(duì)物理學(xué)科影響的效應(yīng)值僅為0.119(p>0.05),不具有統(tǒng)計(jì)顯著性。
表7 人工智能對(duì)不同學(xué)科學(xué)習(xí)效果影響的差異分析
(4) 不同樣本規(guī)模下人工智能技術(shù)對(duì)學(xué)習(xí)效果影響的差異分析。不同樣本規(guī)模是否會(huì)影響到人工智能對(duì)學(xué)生的學(xué)習(xí)效果,研究結(jié)果如表8所示,組間效應(yīng)Q=15.866,達(dá)到了統(tǒng)計(jì)學(xué)意義的顯著水平(p<0.05),說(shuō)明在不同樣本量下人工智能技術(shù)對(duì)學(xué)習(xí)效果的影響存在顯著差異。其中樣本量在50~100時(shí)效應(yīng)值為1.066,樣本量小于50時(shí),效應(yīng)值為0.981,兩者效應(yīng)值都大于0.8,且都具有統(tǒng)計(jì)顯著性(p<0.001),說(shuō)明人工智能在樣本量小于50和位于50到100之間都能達(dá)到積極正向的顯著作用。樣本量大于100時(shí),效應(yīng)值為0.485,具有統(tǒng)計(jì)顯著性(p<0.001),表明人工智能在樣本量大于100時(shí)有較低的作用。
表8 人工智能對(duì)不同樣本規(guī)模學(xué)習(xí)效果影響的差異分析
研究通過(guò)運(yùn)用元分析方法對(duì)2010至2022年間國(guó)際上關(guān)于人工智能技術(shù)對(duì)學(xué)習(xí)效果影響的40篇文獻(xiàn)(共含72個(gè)效應(yīng)量)進(jìn)行梳理分析。研究結(jié)果表明人工智能技術(shù)對(duì)學(xué)生學(xué)習(xí)效果影響的整體效應(yīng)值達(dá)0.845,說(shuō)明人工智能技術(shù)能夠積極促進(jìn)學(xué)生的學(xué)習(xí)效果,不僅體現(xiàn)在認(rèn)知層面,也體現(xiàn)在非認(rèn)知層面;不同技術(shù)應(yīng)用類型之間不存在顯著差異,均能夠有效提升學(xué)生的學(xué)習(xí)效果。此外,從總體來(lái)看,人工智能技術(shù)在不同學(xué)段、學(xué)科和樣本規(guī)模下對(duì)學(xué)生的學(xué)習(xí)效果均能產(chǎn)生不同程度的積極影響?;诖?,從政策設(shè)計(jì)、教學(xué)改革和技術(shù)推廣三個(gè)層面提出未來(lái)人工智能技術(shù)促進(jìn)學(xué)生學(xué)習(xí)效果的行動(dòng)路徑與提升策略。
(1) 政策設(shè)計(jì):積極推動(dòng)人工智能與教育的深度融合。由元分析結(jié)果可知,人工智能技術(shù)對(duì)學(xué)習(xí)效果影響的整體總效應(yīng)(g=0.845,p<0.001),說(shuō)明人工智能技術(shù)對(duì)學(xué)生學(xué)習(xí)效果的影響有積極正向的顯著作用。在認(rèn)知層面(g=0.915)和非認(rèn)知層面(g=0.783),結(jié)果顯示在認(rèn)知層面和非認(rèn)知層面沒(méi)有顯著差異(p>0.05),表明人工智能不僅能促進(jìn)學(xué)生在認(rèn)知層面的學(xué)習(xí)效果,也能促進(jìn)非認(rèn)知層面的學(xué)習(xí)效果。研究結(jié)果表明,人工智能與教育的深度融合有利于學(xué)生的學(xué)習(xí)效果提升,人工智能技術(shù)的發(fā)展對(duì)教育系統(tǒng)性改革起著內(nèi)驅(qū)源動(dòng)力的作用。如何塑造與技術(shù)互動(dòng)中的未來(lái)教育新模態(tài),進(jìn)而推動(dòng)學(xué)生自主學(xué)習(xí)向自適應(yīng)學(xué)習(xí)的新范式轉(zhuǎn)型,是人工智能技術(shù)賦能教育改革應(yīng)關(guān)注的核心內(nèi)容。聚焦人工智能技術(shù)驅(qū)動(dòng)下教育變革的政策設(shè)計(jì),應(yīng)從教育教學(xué)模式創(chuàng)新、大規(guī)模個(gè)性化學(xué)習(xí)、重塑知識(shí)價(jià)值觀念、未來(lái)教師培訓(xùn)與發(fā)展等維度推進(jìn)系統(tǒng)性改革。
(2) 教學(xué)改革:人機(jī)協(xié)同引領(lǐng)未來(lái)學(xué)習(xí)新方式。為研究人工智能不同技術(shù)應(yīng)用類型對(duì)學(xué)習(xí)效果的影響,我們分析了4種不同類型的人工智能技術(shù)應(yīng)用類型,分別為教育機(jī)器人(g=0.828)、可穿戴技術(shù)(g=0.739)、智能教育游戲(g=0.811)和智能學(xué)習(xí)系統(tǒng)(g=0.991),結(jié)果表明不同的應(yīng)用類型之間沒(méi)有顯著差異(p>0.05),都可以提升學(xué)生的學(xué)習(xí)效果。從本研究中可看出未來(lái)將會(huì)有更多更深層次的人工智能技術(shù)應(yīng)用到教育領(lǐng)域,學(xué)校未來(lái)將會(huì)是更加智能化、個(gè)性化和系統(tǒng)化的生態(tài)圖景,人機(jī)協(xié)同將成為學(xué)校教育的新常態(tài)。在人機(jī)協(xié)同的管控下有效開(kāi)展教學(xué)活動(dòng),讓人工智能技術(shù)更好輔助教育教學(xué)活動(dòng),代替教師更多機(jī)械的任務(wù),從而讓教師更多地投入到教學(xué)過(guò)程中的互動(dòng)、參與等需要自主建構(gòu)的教學(xué)活動(dòng)中。
(3) 技術(shù)推廣:推進(jìn)人工智能多學(xué)段、多學(xué)科和差異化應(yīng)用。從學(xué)段來(lái)看,人工智能在各個(gè)學(xué)段都有正向的促進(jìn)作用,但在不同學(xué)段的應(yīng)用效果不同(p<0.05)。由于幼教階段樣本量較少,主要比較小學(xué)、中學(xué)和大學(xué)階段學(xué)生的應(yīng)用效果。相比大學(xué)階段(g=1.207),人 工 智 能 在 小 學(xué)(g=0.652)和 中 學(xué)(g=0.625)階段的應(yīng)用效果相對(duì)較低。相比大學(xué)生,中學(xué)生和小學(xué)生自我控制能力相對(duì)較弱,自我管理方面能力不足,不具備良好的主動(dòng)學(xué)習(xí)能力,所以對(duì)他們來(lái)說(shuō)維持學(xué)習(xí)動(dòng)機(jī)和學(xué)習(xí)意志比較困難,因此在人工智能運(yùn)用到不同學(xué)段時(shí),應(yīng)結(jié)合各學(xué)段學(xué)生的特征和差異來(lái)進(jìn)行設(shè)計(jì),引入提高學(xué)生學(xué)習(xí)動(dòng)機(jī)、學(xué)習(xí)意志、學(xué)習(xí)注意力等方面的元素。
從學(xué)科來(lái)看,人工智能對(duì)統(tǒng)計(jì)中的各個(gè)學(xué)科學(xué)習(xí)效果都有正向的影響,但影響程度有明顯區(qū)別(p<0.05)。根據(jù)實(shí)驗(yàn)結(jié)果可看出,人工智能在英語(yǔ)(g=0.919)、計(jì)算機(jī)(g=1.334)和生物(g=1.230)這些科目上表現(xiàn)出更大的優(yōu)越性,說(shuō)明這些學(xué)科長(zhǎng)期以來(lái)在教學(xué)過(guò)程中善于借助信息技術(shù)手段。然而對(duì)于數(shù)學(xué)(g=0.500)、物理(g=0.119)和科學(xué)(g=0.501)學(xué)科,今后則需要更多借助人工智能技術(shù)開(kāi)展教育教學(xué)活動(dòng),這些學(xué)科在借助人工智能技術(shù)提升學(xué)習(xí)效果方面仍有很大的發(fā)展空間。
從樣本量來(lái)看,不同樣本量對(duì)學(xué)習(xí)效果的影響是顯著的,樣本量在小于50和位于50~100之間時(shí)(g>0.8),人工智能技術(shù)對(duì)學(xué)習(xí)效果有積極的正向作用,而樣本量在大于100時(shí)(g<0.5),人工智能技術(shù)對(duì)學(xué)習(xí)效果的作用較小。斯滕貝格·胡與庫(kù)珀在研究時(shí)發(fā)現(xiàn)了類似的樣本量過(guò)大效應(yīng)量降低的情況,他提出當(dāng)樣本量過(guò)大時(shí),開(kāi)展實(shí)驗(yàn)的過(guò)程中實(shí)驗(yàn)條件一般情況下很難得到保證,可能對(duì)實(shí)驗(yàn)結(jié)果造成一定的影 響[50]。由于樣本規(guī)模過(guò)大時(shí)學(xué)生之間個(gè)體差異較大,同時(shí)實(shí)驗(yàn)過(guò)程中也會(huì)有教師的參與輔助,可能會(huì)對(duì)實(shí)驗(yàn)結(jié)果造成一定程度的影響。
綜合人工智能在不同學(xué)段、學(xué)科和樣本量這幾個(gè)調(diào)節(jié)因素上的結(jié)果來(lái)看,人工智能技術(shù)在各個(gè)方面都有提升的空間。未來(lái)人工智能應(yīng)朝著多學(xué)段、多學(xué)科和差異化應(yīng)用的方向邁進(jìn),推動(dòng)人工智能技術(shù)在教育領(lǐng)域應(yīng)用的供給側(cè)結(jié)構(gòu)性改革,依據(jù)不同學(xué)段、學(xué)科及規(guī)模的特征和差異,探究適合各層次學(xué)生的方案和設(shè)計(jì),以滿足不同層次學(xué)生的需要,從而促進(jìn)人工智能在各學(xué)段、學(xué)科和規(guī)模的廣泛應(yīng)用。
本研究基于2010至2022年國(guó)際權(quán)威數(shù)據(jù)庫(kù)中關(guān)于人工智能對(duì)學(xué)習(xí)效果影響的實(shí)證研究文獻(xiàn),采用元分析方法探究人工智能技術(shù)對(duì)學(xué)生學(xué)習(xí)效果的影響,并基于樣本規(guī)模、學(xué)科、學(xué)段和技術(shù)應(yīng)用類型4類調(diào)節(jié)變量分析其影響差異。該研究突出當(dāng)前人工智能技術(shù)應(yīng)用于教育教學(xué)過(guò)程中出現(xiàn)的問(wèn)題與挑戰(zhàn),從而為人工智能技術(shù)在教育場(chǎng)域的廣泛應(yīng)用奠定基礎(chǔ)??傊?,從研究結(jié)果來(lái)看,人工智能技術(shù)對(duì)學(xué)生學(xué)習(xí)效果的提升還有很大的發(fā)展空間,未來(lái)應(yīng)在各階段教育中增加人工智能學(xué)習(xí)技術(shù)的開(kāi)發(fā),在人工智能學(xué)習(xí)技術(shù)的開(kāi)發(fā)過(guò)程中應(yīng)更多考慮學(xué)生自主學(xué)習(xí)能力的培養(yǎng),此外應(yīng)對(duì)教師進(jìn)行持續(xù)培訓(xùn),以增強(qiáng)教師應(yīng)用人工智能技術(shù)的信心和熟練程度。本研究在樣本文獻(xiàn)的收集和納入時(shí)依照嚴(yán)格的標(biāo)準(zhǔn)選取,并對(duì)數(shù)據(jù)進(jìn)行了量化分析,因此研究結(jié)果具有一定的可靠性和有效性。然而,這項(xiàng)研究還有一定局限性與進(jìn)一步完善的空間。首先,本研究只有40篇文獻(xiàn)符合元分析標(biāo)準(zhǔn),因此在研究結(jié)果的推廣方面應(yīng)謹(jǐn)慎。未來(lái)的研究應(yīng)擴(kuò)大數(shù)據(jù)來(lái)源,以獲得更多的研究,更好地了解人工智能對(duì)學(xué)習(xí)效果的影響。其次,目前的研究只分析了4個(gè)調(diào)節(jié)變量的影響,未來(lái)的研究應(yīng)考慮加入其他可能對(duì)學(xué)生學(xué)習(xí)效果產(chǎn)生影響的調(diào)節(jié)變量。最后,本研究分析框架尚有待進(jìn)一步完善,分類還需要更加細(xì)致,后續(xù)應(yīng)結(jié)合人工智能技術(shù)對(duì)學(xué)生學(xué)習(xí)效果影響相關(guān)研究的不斷增加,展開(kāi)更深入的元分析量化研究,以得出更加全面、客觀與細(xì)致的科學(xué)論斷。