摘" "要:近期,美國(guó)OpenAI公司推出的生成式人工智能工具(ChatGPT)在全球范圍內(nèi)引起了各行各業(yè)的興趣,特別是關(guān)于大型語(yǔ)言模型的應(yīng)用與教育的利害關(guān)系引發(fā)了格外關(guān)注。而隨著生成式人工智能技術(shù)的推廣,關(guān)于其影響的辯論在歐洲以及世界各地已持續(xù)了數(shù)月。在教育領(lǐng)域,有觀點(diǎn)認(rèn)為這種新技術(shù)的推廣將引發(fā)顛覆性變革,也有觀點(diǎn)認(rèn)為技術(shù)創(chuàng)新可以影響教育,但卻沒(méi)有改變它最基本的模式和規(guī)則。因此,教育界亟需了解和掌握此次技術(shù)變革的總體趨勢(shì)和發(fā)展方向,以應(yīng)對(duì)未來(lái)教育的變革。通過(guò)總結(jié)歐洲及大多數(shù)西方國(guó)家在教育數(shù)字化轉(zhuǎn)型中面臨的挑戰(zhàn)和應(yīng)對(duì)之策,及其對(duì)生成式人工智能技術(shù)的理解,提出在教育領(lǐng)域引入大型語(yǔ)言模型的機(jī)會(huì)、風(fēng)險(xiǎn)和挑戰(zhàn)。首先,大型語(yǔ)言模型提供了學(xué)習(xí)機(jī)會(huì),可以幫助教師改善教學(xué)質(zhì)量,而這些機(jī)會(huì)因?qū)W習(xí)者不同而存在差異;其次,大型語(yǔ)言模型有可能徹底改變教學(xué)方式,并輔助教學(xué)過(guò)程,特別是在個(gè)性化學(xué)習(xí)、教學(xué)設(shè)計(jì)、語(yǔ)言學(xué)習(xí)專(zhuān)業(yè)發(fā)展等領(lǐng)域;再次,需要從不同視角來(lái)探索大型語(yǔ)言模型在教育中的應(yīng)用,如學(xué)習(xí)者視角、教師視角、行政及管理者視角、研究者視角、雇主視角等;最后,大型語(yǔ)言模型也為教育帶來(lái)了風(fēng)險(xiǎn)和挑戰(zhàn),如版權(quán)問(wèn)題、偏見(jiàn)和公平、學(xué)習(xí)者對(duì)該模型過(guò)分依賴、教師對(duì)該模型過(guò)分依賴、缺乏深度學(xué)習(xí)和專(zhuān)業(yè)知識(shí)、模型生成結(jié)果與學(xué)生作答難以區(qū)分等。
關(guān)鍵詞:生成式人工智能;大型語(yǔ)言模型;ChatGPT;教育人工智能;教育評(píng)估
中圖分類(lèi)號(hào):G434" " " " "文獻(xiàn)標(biāo)志碼:A" " " " "文章編號(hào):1673-8454(2023)06-0008-09
一、引言
當(dāng)被問(wèn)及“教育數(shù)字化轉(zhuǎn)型”的定義時(shí),ChatGPT(Chat Generative Pre-trained Transformer)的回答為:“教育數(shù)字化轉(zhuǎn)型指的是將數(shù)字技術(shù)整合到教育系統(tǒng)的各個(gè)方面,包括教學(xué)過(guò)程與教學(xué)活動(dòng),旨在改善學(xué)生的學(xué)習(xí)效果、提高管理效率并優(yōu)化整體的教育體驗(yàn)。這一過(guò)程涉及對(duì)傳統(tǒng)教學(xué)方法的重新思考和重新設(shè)計(jì),以充分利用技術(shù)的潛力來(lái)推動(dòng)教育的創(chuàng)新、參與和發(fā)展。”在不到一秒鐘的時(shí)間里,ChatGPT就提供了上述定義,從目前來(lái)看,基本符合“教育數(shù)字化轉(zhuǎn)型”的公認(rèn)含義。
同樣,ChatGPT也能夠非??焖俚刈珜?xiě)本文的“引言”部分:“近年來(lái),數(shù)字化轉(zhuǎn)型一直是一個(gè)備受爭(zhēng)議的話題,特別是關(guān)于其對(duì)學(xué)校教育的影響。本文旨在研究ChatGPT,一種由OpenAI開(kāi)發(fā)的大型語(yǔ)言模型在歐洲教育數(shù)字化轉(zhuǎn)型中的作用。數(shù)字化轉(zhuǎn)型指將數(shù)字技術(shù)融入某一個(gè)行業(yè)或某一機(jī)構(gòu)所涉的全部領(lǐng)域,使其在運(yùn)作方式和價(jià)值供給方面產(chǎn)生根本的變化。本文將重點(diǎn)討論ChatGPT對(duì)學(xué)校教育所帶來(lái)的負(fù)面影響,包括教學(xué)的過(guò)程、評(píng)估方法和教育機(jī)會(huì)。此外,這里還將深入探討ChatGPT用于學(xué)校教育中所帶來(lái)的挑戰(zhàn)和機(jī)遇,及其對(duì)未來(lái)教育所產(chǎn)生的潛在影響。”
ChatGPT是基于大型語(yǔ)言模型(Large Language Models, LLM)的生成式預(yù)訓(xùn)練轉(zhuǎn)換器,于2022年11月30日正式對(duì)公眾開(kāi)放。在2023年初,來(lái)自教育界及許多其他社會(huì)領(lǐng)域的大量報(bào)道陸續(xù)涌現(xiàn),匯集了對(duì)這個(gè)新工具所表達(dá)的支持和反對(duì)的聲音,而這些不同聲音的差異取決探討該現(xiàn)象時(shí)所選擇的角度。有些人熱情地接受了這項(xiàng)新技術(shù),而有些人則建議全面禁止,以維持現(xiàn)有的教育體系。
以前從未有過(guò)任何信息通信技術(shù)(Information and Communication Technology, ICT)工具可以像ChatGTP一樣迅速吸引超1億的用戶,并且當(dāng)時(shí)它僅作為一個(gè)測(cè)試產(chǎn)品。ChatGPT的成功引起巨大轟動(dòng),使其他的大型科技公司不得不重新安排研發(fā)計(jì)劃。2023年2月6日,谷歌發(fā)布了其自主研制的聊天機(jī)器人Bard,它是“由LaMDA支持的實(shí)驗(yàn)性對(duì)話AI服務(wù)”,且基于谷歌的大型語(yǔ)言模型。2月7日,西方媒體宣布,百度將推出一個(gè)比ChatGPT規(guī)模更大的生成型人工智能聊天機(jī)器人——“這個(gè)雙語(yǔ)機(jī)器人在中國(guó)境外被稱為ERNIE,在中國(guó)境內(nèi)則被稱為‘文心一言’(The Register[1])。” 隨后,3月13日,OpenAI公司宣布GPT-4已在其付費(fèi)服務(wù)ChatGPT Plus上可用,并宣布增加API接口的插件支持,供開(kāi)發(fā)人員在其基礎(chǔ)之上構(gòu)建應(yīng)用程序和服務(wù)。
本文旨在總結(jié)歐洲及大多數(shù)西方國(guó)家在教育數(shù)字化轉(zhuǎn)型中面臨的挑戰(zhàn)和應(yīng)對(duì)之策,為教育領(lǐng)域“痛點(diǎn)”問(wèn)題的解決提供建議,也為未來(lái)可能的挑戰(zhàn)提供啟示。教育作為社會(huì)最基本的文化組織,其進(jìn)步即使不是顛覆性的變革,也是必須保持能夠進(jìn)一步發(fā)展。本文最后從全球觀點(diǎn)討論潛在的研究重點(diǎn)和具體行動(dòng)。
二、生成式人工智能帶來(lái)的驚嘆和擔(dān)憂
生成式人工智能技術(shù)席卷市場(chǎng)已有一段時(shí)間。在此期間,公眾爭(zhēng)論的焦點(diǎn)集中于技術(shù)的藝術(shù)創(chuàng)作能力,或者更確切地說(shuō),這些技術(shù)能否根據(jù)文本的提示,創(chuàng)作出仿照著名藝術(shù)家風(fēng)格的創(chuàng)意作品。OpenAI公司所推出的ChatGPT在此基礎(chǔ)上有了更進(jìn)一步的發(fā)展:通過(guò)簡(jiǎn)單的文本對(duì)話或文本提示,整合來(lái)自互聯(lián)網(wǎng)和其他數(shù)字資源中嵌入在大量信息中的相關(guān)知識(shí)。ChatGPT使用的大型語(yǔ)言模型不需要?jiǎng)討B(tài)連接互聯(lián)網(wǎng)來(lái)預(yù)測(cè)問(wèn)題的答案,僅依據(jù)2021年9月之前所獲得的信息來(lái)推測(cè)。值得注意的是,2023年3月,最新版本模型GPT-4的推出,體現(xiàn)了這一技術(shù)領(lǐng)域的飛速發(fā)展——該版本的工具已開(kāi)始與同步網(wǎng)絡(luò)搜索進(jìn)行交互。
ChatGPT通過(guò)與用戶的精彩對(duì)話,呈現(xiàn)出令專(zhuān)業(yè)人士與普通用戶都感到驚訝的答案。有報(bào)道稱,ChatGPT可輕松通過(guò)大學(xué)許多學(xué)科的考試,如法律、自然科學(xué)、生命科學(xué)等;計(jì)算機(jī)科學(xué)家發(fā)現(xiàn),ChatGPT可以應(yīng)用多種計(jì)算機(jī)語(yǔ)言生成完美的代碼;教師發(fā)現(xiàn),可以應(yīng)用ChatGPT撰寫(xiě)教學(xué)設(shè)計(jì)、批改學(xué)生論文,并通過(guò)生成優(yōu)秀的討論要點(diǎn)和推薦學(xué)習(xí)資源來(lái)提升授課質(zhì)量;科研人員發(fā)現(xiàn),ChatGPT可以在幾秒鐘內(nèi)生成他們計(jì)劃撰寫(xiě)研究論文的初稿。總之,許多專(zhuān)業(yè)人士認(rèn)為,ChatGPT具有顯著改變其原有工作流程的潛力,同時(shí)他們開(kāi)始擔(dān)心這項(xiàng)新技術(shù)的潛在缺陷和負(fù)面影響。
在教育領(lǐng)域,ChatGPT應(yīng)用的最直接反響是對(duì)考試作弊的強(qiáng)烈譴責(zé),及其對(duì)評(píng)估方式構(gòu)成的實(shí)質(zhì)性威脅。ChatGPT并非直接復(fù)制粘貼已發(fā)布的信息作為答案,而是會(huì)不斷地生成全新的文本,傳統(tǒng)的檢測(cè)考試作假工具已經(jīng)無(wú)法發(fā)揮作用。因此,人們開(kāi)始進(jìn)行新工具的研發(fā),以便能夠識(shí)別出哪些文本是由ChatGPT生成的。此外,包括高校在內(nèi)的各類(lèi)學(xué)校也發(fā)布了緊急規(guī)定,禁止在測(cè)試和考試中使用類(lèi)似ChatGPT的生成式人工智能技術(shù),甚至在此期間禁用相關(guān)網(wǎng)絡(luò)。同時(shí),一些批判性文章也開(kāi)始出現(xiàn),對(duì)這項(xiàng)技術(shù)的局限性進(jìn)行分析,如它在回答問(wèn)題時(shí)缺乏常識(shí)和可信度(ChatGPT容易給出錯(cuò)誤、無(wú)意義的答案,有些答案并無(wú)參考來(lái)源)。其中不乏深層次的反對(duì)意見(jiàn),如技術(shù)缺乏同理心、對(duì)數(shù)據(jù)的需求和電力的巨大消耗等問(wèn)題[2-4]。
隨著備受矚目的生成式人工智能技術(shù)的推廣,關(guān)于其影響的辯論在歐洲以及世界各地已持續(xù)了數(shù)月。如今,我們見(jiàn)證了一場(chǎng)更為系統(tǒng)和深入的討論,探討這種新技術(shù)對(duì)社會(huì)不同領(lǐng)域的沖擊。教育領(lǐng)域有一種觀點(diǎn)認(rèn)為,這種新技術(shù)的推廣將引發(fā)顛覆性變革;但另一種觀點(diǎn)認(rèn)為,技術(shù)創(chuàng)新可以影響教育,但卻沒(méi)有改變它最基本的模式和規(guī)則。因此,教育界亟需了解和掌握此次技術(shù)變革與以往的不同之處,以及其發(fā)展的總體趨勢(shì)和方向。本文將詳細(xì)介紹面對(duì)ChatGPT這類(lèi)新技術(shù),歐洲教育界所采取的應(yīng)對(duì)措施。
西方國(guó)家關(guān)于ChatGPT的公開(kāi)辯論多是關(guān)于其呈現(xiàn)知識(shí)的優(yōu)勢(shì),以及不斷出現(xiàn)嚴(yán)重錯(cuò)誤的案例。從全球角度來(lái)看,更有趣的是仔細(xì)觀察ChatGPT的“知識(shí)”有多大代表性,即ChatGPT采用何種類(lèi)型的數(shù)據(jù)來(lái)訓(xùn)練其底層模型。OpenAI公司在這個(gè)問(wèn)題上并未完全公開(kāi),但是該公司相關(guān)研究人員[5]指出,GPT-3訓(xùn)練數(shù)據(jù)集主要由過(guò)濾后的Webcrawl數(shù)據(jù)集(開(kāi)放的PB級(jí)大數(shù)據(jù)集),具有超過(guò)8年時(shí)間的網(wǎng)絡(luò)爬?。?0%)、用戶評(píng)價(jià)的美國(guó)新聞和討論論壇Webtext2(22%)、兩組在線圖書(shū)庫(kù)(16%)和維基百科(3%)組成。OpenAI公司的Webcrawl數(shù)據(jù)集主要使用“.com”域名,且語(yǔ)料庫(kù)中超過(guò)50%的內(nèi)容是美式英語(yǔ)。雖然書(shū)籍語(yǔ)料庫(kù)的具體內(nèi)容不為人所知(可能存在版權(quán)問(wèn)題),但其中一些基于互聯(lián)網(wǎng)的圖書(shū)可能是自行出版的,因此質(zhì)量存在不確定性。英文版的維基百科則是一個(gè)廣為人知、廣泛使用的字典類(lèi)型信息來(lái)源,但其提供的信息存在偏見(jiàn)(如大部分詞條來(lái)自未婚年輕男性的撰寫(xiě)和編輯)。
聊天機(jī)器人只能呈現(xiàn)它所接受訓(xùn)練的數(shù)據(jù),因此OpenAI公司的布朗(Brown)等人于2020年提出了一些ChatGPT的現(xiàn)存問(wèn)題與擔(dān)憂:①性別:男性通常被描繪為強(qiáng)壯和了不起,而女性則被描繪為美麗、懷孕和隨和。②種族:與“亞洲人”和“白人”相比,“黑人”常被與消極的情感聯(lián)系在一起。③宗教:基督教中沒(méi)有消極的詞匯,而伊斯蘭教則與“恐怖主義”聯(lián)系在一起。盡管OpenAI公司在使用GPT-3模型創(chuàng)建聊天機(jī)器人時(shí)試圖糾正一些偏見(jiàn),但從多元文化和全球知識(shí)視角來(lái)看,訓(xùn)練模型所使用的數(shù)據(jù)中存在偏見(jiàn)是該技術(shù)面臨的重大問(wèn)題。
三、歐洲教育界
對(duì)生成式人工智能的理解
加拿大在線資源中心“teachonline.ca”將ChatGPT描述為一款“革命性的人工智能聊天機(jī)器人,可以為復(fù)雜問(wèn)題提供長(zhǎng)篇回答。它經(jīng)過(guò)訓(xùn)練,可以理解人類(lèi)提出問(wèn)題的意圖,可能是自現(xiàn)代搜索引擎以來(lái)最具影響力的工具”。ChatGPT的第一個(gè)版本基于大型語(yǔ)言模型GPT-3,不久后升級(jí)為GPT-3.5;從2023年3月開(kāi)始,產(chǎn)品的Plus版本已升級(jí)至GPT-4。在GPT-3和GPT-3.5中,用戶輸入僅限于文本提示,而在GPT-4中,圖片也可以啟動(dòng)該工具的應(yīng)答。借助OpenAI公司的插件架構(gòu),可以在大型語(yǔ)言模型之上構(gòu)建各種各樣的應(yīng)用程序,實(shí)現(xiàn)實(shí)時(shí)網(wǎng)絡(luò)搜索,將輸出端嵌入其他工具以執(zhí)行后續(xù)一系列流程。然而,無(wú)論過(guò)程多么復(fù)雜,大型語(yǔ)言模型隨機(jī)性的本質(zhì)仍保持不變。
當(dāng)回答問(wèn)題時(shí),GPT模型會(huì)根據(jù)先前的詞匯預(yù)測(cè)下一個(gè)詞匯,就像“填空題”一樣。這種簡(jiǎn)單的基于統(tǒng)計(jì)學(xué)的工作機(jī)制,幾乎與智能無(wú)關(guān)。因此,有學(xué)者建議使用“人工預(yù)測(cè)”這個(gè)術(shù)語(yǔ)來(lái)更準(zhǔn)確地描述這項(xiàng)新技術(shù)的預(yù)期效果[6]。ChatGPT試圖產(chǎn)生一個(gè)“合理的延續(xù)”,無(wú)論是對(duì)于文本還是其他輸入。其中,“合理”是指在看到數(shù)十億個(gè)網(wǎng)頁(yè)中人們已經(jīng)寫(xiě)過(guò)的內(nèi)容后,就可能預(yù)測(cè)其他人會(huì)寫(xiě)的內(nèi)容。這里的潛在問(wèn)題在于,這種技術(shù)變成了所謂的“隨機(jī)鸚鵡”,因?yàn)檎Z(yǔ)言模型是一種“隨機(jī)拼接語(yǔ)言形式序列的系統(tǒng),按照語(yǔ)言組合的概率信息隨意拼接,但不考慮其含義,類(lèi)似于一個(gè)隨機(jī)學(xué)舌的鸚鵡?!盵7]
ChatGPT如果只能做出猜測(cè),就無(wú)法被稱作智能,智能需要以自主性(Agency)為前提。失去自主性往往是引發(fā)教育工作者對(duì)這項(xiàng)技術(shù)恐懼和抵制的根本原因。教育工作者不希望被人工智能機(jī)器人取代,代替其進(jìn)行工作或職位。而“具有前瞻性自主能力”的角色設(shè)定,將人類(lèi)置于中心地位,技術(shù)則成為助手——僅在學(xué)習(xí)者或教師需要時(shí)使用并且服務(wù)于明確的目的。這種話語(yǔ)框架在歐洲正變得越來(lái)越普及,其目的是嘗試超越對(duì)新事物禁止的傾向。
值得注意的是,OpenAI公司并不試圖將ChatGPT定位為“智能圣人”或“真理者”。該公司意識(shí)到,識(shí)別由人工智能生成的文本,已經(jīng)成為教育工作者討論的重點(diǎn)話題。而同等重要的是,需要認(rèn)識(shí)到人工智能編寫(xiě)不同類(lèi)型文本時(shí)的局限性和影響,尤其是在課堂中[8]。為了應(yīng)對(duì)批評(píng),OpenAI公司開(kāi)發(fā)了一項(xiàng)用于教育工作者使用ChatGPT的輔助資源——用于區(qū)分人工智能生成文本和人類(lèi)編寫(xiě)文本的分類(lèi)器。該工具的可靠性目前還未被完全論證,并且許多學(xué)者對(duì)其未來(lái)應(yīng)用的可信程度也存有疑慮。2023年2月,OpenAI公司與教育工作者取得聯(lián)系,以進(jìn)一步了解其并不完善的“作弊檢測(cè)器”,在一定程度上是否有效。
(一)對(duì)教育評(píng)估的干擾
在教育領(lǐng)域應(yīng)用ChatGPT的最大擔(dān)憂之一,是其引起的考試作弊和文本抄襲。一些學(xué)校已經(jīng)開(kāi)始禁用與之相關(guān)的設(shè)備并屏蔽關(guān)聯(lián)的網(wǎng)絡(luò)。如上文所述,OpenAI公司發(fā)布了人工智能識(shí)別工具以部分解決這些問(wèn)題,然而其提供的文本分類(lèi)器并不能實(shí)質(zhì)用于防止作弊。目前,教育工作者可以采取的唯一措施是鼓勵(lì)學(xué)生更加誠(chéng)實(shí)透明地使用聊天機(jī)器人。以上內(nèi)容引發(fā)了一場(chǎng)關(guān)于教育評(píng)估更高層次的辯論:評(píng)估的作用究竟是什么?應(yīng)當(dāng)如何恰當(dāng)使用評(píng)估來(lái)支持學(xué)習(xí)?正如挪威一所大學(xué)的五位管理者所說(shuō):“對(duì)我們而言,新的聊天機(jī)器人所帶來(lái)的挑戰(zhàn)與我們已面臨的問(wèn)題實(shí)際上具有相似性,即如何找到既公正又能適當(dāng)推動(dòng)學(xué)生學(xué)習(xí)的評(píng)估方式?”[9]
與此同時(shí),一些教師正在絞盡腦汁思考這些問(wèn)題,并將聊天機(jī)器人與體育中的興奮劑進(jìn)行比較:“聊天機(jī)器人就像興奮劑注射一樣——隨著更新迭代,它們?cè)絹?lái)越不易被識(shí)別。ChatGPT僅僅是一個(gè)開(kāi)端,幾個(gè)月后它也將更加先進(jìn)。那時(shí)我們便必須考慮,如何讓學(xué)生在沒(méi)有聊天機(jī)器人的支持下展示其所掌握的知識(shí)。[10]”這些教師認(rèn)為,他們可能不需要再應(yīng)用“家庭測(cè)評(píng)”(讓學(xué)生在家中完成一篇文章并在截止日期前提交),并在大學(xué)里實(shí)施可控條件下的高風(fēng)險(xiǎn)(high stake)測(cè)試。相關(guān)報(bào)道如圖1所示。
除了組織有關(guān)新形勢(shì)的講座和會(huì)議外,挪威的大學(xué)管理者似乎將更多資源投入到培訓(xùn)負(fù)責(zé)不同學(xué)科的關(guān)鍵教師中——如何更好地制定考試中的問(wèn)題和任務(wù),以及如何進(jìn)一步設(shè)計(jì)可替代考試的評(píng)估過(guò)程。有觀點(diǎn)表明,聊天機(jī)器人是可用于工作環(huán)境中的人工智能工具,而學(xué)生需要為通過(guò) “可信度測(cè)試”做好準(zhǔn)備以真正加入工作。正如上述提及的挪威大學(xué)管理者得出的結(jié)論:“聊天機(jī)器人可以回答提問(wèn)者有關(guān)兒童語(yǔ)言發(fā)展的問(wèn)題,但如果回答需要與提問(wèn)者在幼兒園實(shí)踐中的經(jīng)驗(yàn)、在課程中看到的視頻以及課程大綱中涉及的內(nèi)容聯(lián)系起來(lái),聊天機(jī)器人并不能提供出色的答案。因此,一種解決方案是創(chuàng)設(shè)更加復(fù)雜的任務(wù)形式,即與學(xué)習(xí)成果明確相關(guān)的、可替代傳統(tǒng)評(píng)估的形式,以及可激勵(lì)學(xué)生在完整學(xué)期中持續(xù)付出的學(xué)習(xí)動(dòng)機(jī)。而多元化評(píng)估方式限制了機(jī)器人提供的作弊可能,如口試?!?/p>
這些管理者認(rèn)為作弊是錯(cuò)誤的學(xué)習(xí)和教學(xué)方法的表現(xiàn)。他們認(rèn)為,“應(yīng)該集中精力預(yù)防作弊的出現(xiàn),而不是僅在測(cè)試后揭露不當(dāng)行為。采用反思、循環(huán)反饋、個(gè)人經(jīng)驗(yàn)和工作生活緊密結(jié)合的評(píng)估形式,既能激勵(lì)學(xué)習(xí),又能加大應(yīng)用聊天機(jī)器人實(shí)現(xiàn)抄襲的難度。與教學(xué)人員保持密切聯(lián)系、在學(xué)習(xí)過(guò)程中能夠得到反饋、對(duì)學(xué)習(xí)環(huán)境感到滿意的學(xué)生,往往能夠?qū)W習(xí)到更多,并少有作弊行為。故意作弊往往是因?yàn)閷W(xué)生對(duì)學(xué)習(xí)失去希望,如學(xué)生的學(xué)習(xí)任務(wù)重、成績(jī)壓力大以及看不到學(xué)習(xí)的目的。”
(二)對(duì)學(xué)術(shù)誠(chéng)信帶來(lái)的潛在風(fēng)險(xiǎn)
2023年1月30日,英國(guó)高等教育質(zhì)量保障機(jī)構(gòu)(UK Quality Assurance Agency for Higher Education, QAA)發(fā)布《人工智能軟件的興起和學(xué)術(shù)誠(chéng)信的潛在風(fēng)險(xiǎn):高等教育提供者的QAA簡(jiǎn)報(bào)》(The Rise of Artificial Intelligence Software and Potential Risks for Academic Integrity: A QAA Briefing Paper for Higher Education Providers, 以下簡(jiǎn)稱QAA簡(jiǎn)報(bào))[11],旨在向高等教育機(jī)構(gòu)表明人工智能對(duì)學(xué)術(shù)誠(chéng)信可能帶來(lái)的潛在風(fēng)險(xiǎn)。QAA簡(jiǎn)報(bào)指出,基于大型語(yǔ)言模型的生成方式,所有基于文本的評(píng)估都可能受到影響?!耙赃@種方式創(chuàng)建的作品可能很難被識(shí)別,并且傳統(tǒng)的抄襲識(shí)別工具也無(wú)法檢測(cè)出來(lái)”。
QAA簡(jiǎn)報(bào)提出了支持考核誠(chéng)信、維護(hù)標(biāo)準(zhǔn)和引導(dǎo)未來(lái)實(shí)踐的建議。這些建議相較而言比較溫和,并間接警示人們不要恐慌,如不必要在考試期間禁止使用互聯(lián)網(wǎng)、在大學(xué)中禁用人工智能工具等。QAA簡(jiǎn)報(bào)還建議盡早與學(xué)生溝通,更新學(xué)生聲明并修訂政策、優(yōu)化實(shí)踐;在設(shè)計(jì)考核時(shí),應(yīng)與學(xué)生和教師共同探討,使他們了解真實(shí)且創(chuàng)新的考核形式及其益處,而不是將資源耗費(fèi)在通過(guò)軟件檢測(cè)由大型語(yǔ)言模型和其他人工智能工具生成的文本。QAA簡(jiǎn)報(bào)指出:“這是一個(gè)與學(xué)生合作并使其信任評(píng)估過(guò)程的機(jī)會(huì),這些評(píng)估過(guò)程是共同創(chuàng)建、迭代和支持批判性思維的?!?/p>
關(guān)于促進(jìn)學(xué)術(shù)誠(chéng)信的實(shí)踐,QAA簡(jiǎn)報(bào)倡導(dǎo)強(qiáng)調(diào)以學(xué)生學(xué)習(xí)作為核心,與學(xué)生進(jìn)行真誠(chéng)的對(duì)話,討論不經(jīng)審辨地使用人工智能工具的危害,并擴(kuò)展所在機(jī)構(gòu)現(xiàn)有的數(shù)字素養(yǎng)戰(zhàn)略,以包含人工智能素養(yǎng)。此外,QAA簡(jiǎn)報(bào)還提到其他的軟性方法,如傳達(dá)誠(chéng)信的價(jià)值觀、討論何為學(xué)術(shù)不端行為、識(shí)別可提供支持的網(wǎng)絡(luò)、形成對(duì)結(jié)果的責(zé)任意識(shí)、強(qiáng)調(diào)信息更新以及參與建議和指導(dǎo)等。
OpenAI公司也意識(shí)到ChatGPT存在瑕疵。該公司已發(fā)布簡(jiǎn)要概述[12],告知教育工作者在使用ChatGPT時(shí)應(yīng)主要考慮的問(wèn)題,包括:①它可能會(huì)產(chǎn)生并延續(xù)有害的、有偏見(jiàn)的內(nèi)容。②它通常會(huì)輸出不準(zhǔn)確的信息。③它不應(yīng)該被視為一種可靠的評(píng)估工具。④它可能在回答自然科學(xué)或社會(huì)科學(xué)的復(fù)雜問(wèn)題上表現(xiàn)不佳。⑤驗(yàn)證人工智能的建議通常需要高水平的專(zhuān)業(yè)知識(shí)。⑥人工智能并不能代替學(xué)生進(jìn)行學(xué)習(xí)。
四、在教育中引入大型語(yǔ)言模型的
機(jī)會(huì)、風(fēng)險(xiǎn)和挑戰(zhàn)
以上內(nèi)容介紹了以ChatGPT為例的大型語(yǔ)言模型在教育中應(yīng)用的爭(zhēng)論,并明確表明需要更多信息來(lái)解讀其對(duì)于教育的影響。雖然引入大型語(yǔ)言模型可能會(huì)為學(xué)習(xí)者提供更多元化的機(jī)會(huì),甚至有可能徹底改革教與學(xué)的過(guò)程,但這些應(yīng)用同時(shí)也會(huì)帶來(lái)較高風(fēng)險(xiǎn)和嚴(yán)峻挑戰(zhàn)。大型語(yǔ)言模型在教育領(lǐng)域應(yīng)用是具有復(fù)雜性的,以下是梳理與凝練后的一些觀點(diǎn):
(一)提供學(xué)習(xí)機(jī)會(huì)
大型語(yǔ)言模型提供了學(xué)習(xí)機(jī)會(huì),可以幫助教師改善教學(xué)質(zhì)量,包括:①提高閱讀和寫(xiě)作技能(練習(xí)不同的寫(xiě)作風(fēng)格)。②生成問(wèn)題和提示。③發(fā)展批判性思維技能。④通過(guò)向?qū)W生提供對(duì)復(fù)雜文本的總結(jié)和解釋?zhuān)瑤椭浒l(fā)展閱讀理解技能。⑤幫助學(xué)生學(xué)習(xí)一種語(yǔ)言及基于這種語(yǔ)言風(fēng)格的各種主題寫(xiě)作。⑥提升解決問(wèn)題的能力。⑦生成文本摘要和提綱。⑧提高研究技能。⑨促進(jìn)小組討論。⑩提高學(xué)生在協(xié)作寫(xiě)作活動(dòng)中的投入度和參與度。{11}提供更多開(kāi)放的研究問(wèn)題。{12}改善特定領(lǐng)域的語(yǔ)言技能。{13}提升學(xué)生程序編寫(xiě)、報(bào)告撰寫(xiě)、項(xiàng)目管理、決策制定、解決問(wèn)題等技能。
(二)存在差異
上述機(jī)會(huì)因?qū)W習(xí)者不同而存在差異,如小學(xué)生、初中與高中學(xué)生、大學(xué)生、遠(yuǎn)程學(xué)習(xí)的學(xué)生、殘疾學(xué)習(xí)者、專(zhuān)業(yè)培訓(xùn)的參與者等。
(三)可能徹底改變教學(xué)方式的領(lǐng)域
ChatGPT使用的大型語(yǔ)言模型有可能徹底改變教學(xué)方式,并輔助教學(xué)過(guò)程,特別是在以下領(lǐng)域:個(gè)性化學(xué)習(xí)、教學(xué)設(shè)計(jì)、語(yǔ)言學(xué)習(xí)、研究和寫(xiě)作、專(zhuān)業(yè)發(fā)展、測(cè)量與評(píng)價(jià)、人工智能倫理等。
(四)從不同視角進(jìn)行探索
需要從不同視角來(lái)探索大型語(yǔ)言模型在教育中的應(yīng)用,如學(xué)習(xí)者視角、教師視角、行政及管理者視角、教學(xué)設(shè)計(jì)和內(nèi)容開(kāi)發(fā)者視角、研究者視角、雇主視角。
(五)風(fēng)險(xiǎn)和挑戰(zhàn)
大型語(yǔ)言模型也為教育帶來(lái)了風(fēng)險(xiǎn)和挑戰(zhàn)[2],包括:版權(quán)問(wèn)題、偏見(jiàn)和公平、學(xué)習(xí)者對(duì)該模型過(guò)分依賴、教師對(duì)該模型過(guò)分依賴、缺乏深度學(xué)習(xí)和專(zhuān)業(yè)知識(shí)、模型生成結(jié)果與學(xué)生作答難以區(qū)分、模型訓(xùn)練和維護(hù)的高成本、數(shù)據(jù)隱私和安全的威脅、不可持續(xù)使用、驗(yàn)證信息和維護(hù)完整性的高成本、難以區(qū)分真正的知識(shí),以及雖然令人信服的但未經(jīng)實(shí)證的模型輸出結(jié)果、缺乏適應(yīng)性、缺乏適當(dāng)?shù)慕涌冢ú煌M件或系統(tǒng)之間交互的方式和規(guī)范)、缺乏對(duì)多語(yǔ)種和公平獲取的支持。
事實(shí)上,許多問(wèn)題并非僅存在于教育領(lǐng)域。在歐洲,人們普遍感覺(jué)教育人工智能應(yīng)用的收益相對(duì)滯后。若要改變這種狀況,就需要對(duì)教育的具體問(wèn)題進(jìn)行更多研究和開(kāi)發(fā),從而獲得能夠立即轉(zhuǎn)化為課堂教學(xué),以及大型講座中可以實(shí)際應(yīng)用的知識(shí)。因此,與教育相關(guān)的問(wèn)題應(yīng)優(yōu)先考慮,并從不同視角,針對(duì)不同角色,對(duì)新技術(shù)在教育中的應(yīng)用進(jìn)行研討。
五、大型語(yǔ)言模型在中國(guó)教育中的應(yīng)用探討
OpenAI公司沒(méi)有在中國(guó)推出大型語(yǔ)言模型服務(wù)是有原因的。中國(guó)用戶需要基于中文數(shù)據(jù)訓(xùn)練的大型語(yǔ)言模型,而不是像ChatGPT那樣主要基于美國(guó)的英語(yǔ)數(shù)據(jù)。歐洲各界均意識(shí)到:“最成功的人工智能語(yǔ)言模型會(huì)來(lái)自美國(guó)和中國(guó)”(OpenGPT-X[13])。因此,歐洲正在建立和訓(xùn)練針對(duì)歐洲經(jīng)濟(jì)和文化需求的大型語(yǔ)言模型,如德國(guó)的OpenGPT-X項(xiàng)目和瑞典的GPT-SW3項(xiàng)目[14](基于北歐語(yǔ)系建立的大型語(yǔ)言模型)。
許多中國(guó)開(kāi)發(fā)的生成式人工智能工具已面市,還有更多正在研發(fā)中,這為推進(jìn)教育創(chuàng)新提供了巨大機(jī)遇。總體來(lái)說(shuō),中國(guó)教師對(duì)教育中的人工智能應(yīng)用持有積極態(tài)度。然而,為了在該背景下進(jìn)一步作好規(guī)劃和實(shí)施,有必要深入了解人工智能工具在不同教育背景下的整合方式。例如,韓國(guó)最近研究表明,持有建構(gòu)主義理念的教師(學(xué)習(xí)者并非知識(shí)的被動(dòng)接受者,而是在與其他學(xué)習(xí)者的互動(dòng)中共同構(gòu)建的知識(shí)),比以傳輸知識(shí)為主的傳統(tǒng)行為主義導(dǎo)向的教師,更有可能在日常教學(xué)中融入人工智能工具[15]。考慮到目前以知識(shí)灌輸為主的教學(xué)方法在中國(guó)更為普遍,這一觀察結(jié)果可能激發(fā)人們?cè)谥袊?guó)的學(xué)校和大學(xué)中,嘗試與其他國(guó)家不同的人工智能支持學(xué)習(xí)設(shè)計(jì)。
無(wú)論是中國(guó)還是西方國(guó)家的教育工作者,此時(shí)都面臨著共同的挑戰(zhàn),即如何將大型語(yǔ)言模型應(yīng)用于最新的、已經(jīng)證實(shí)有效的教與學(xué)方法中。在2023年2月6日舉行的GRAILE網(wǎng)絡(luò)研討會(huì)上,澳大利亞莫納什大學(xué)的德拉甘·加塞維奇(Dragan Gaevi)教授提出了三個(gè)重要問(wèn)題:一是如何與能夠提供所有問(wèn)題答案、進(jìn)行流暢聊天的聊天機(jī)器人進(jìn)行交互?教育研究表明,過(guò)度的流暢性可能會(huì)對(duì)學(xué)習(xí)產(chǎn)生負(fù)面影響——會(huì)滯后師生元認(rèn)知的發(fā)展,而學(xué)生通過(guò)解決困惑來(lái)學(xué)習(xí),其學(xué)習(xí)過(guò)程中也存在著積極帶來(lái)的失敗。那么,教師應(yīng)該如何教導(dǎo)學(xué)生識(shí)別這些新工具的弱點(diǎn),并讓其更聰明地提出有效問(wèn)題并避免得到無(wú)用的回答。二是如何利用人工智能機(jī)器人獲得有效的反饋?目前這些工具似乎無(wú)法在自主學(xué)習(xí)中提供反饋。那么,教師應(yīng)該如何與其進(jìn)行互動(dòng),以創(chuàng)造深度學(xué)習(xí)所必需的更深層次參與。三是如何使聊天機(jī)器人能夠支持更有效的學(xué)習(xí)過(guò)程?聊天機(jī)器人專(zhuān)注于答案的生成,而不是呈現(xiàn)學(xué)習(xí)過(guò)程。那么,教師應(yīng)該如何通過(guò)與其互動(dòng),以支持更有效的學(xué)習(xí)過(guò)程。
六、結(jié)論與展望
直至ChatGPT問(wèn)世,已經(jīng)許久未見(jiàn)一項(xiàng)新技術(shù),能夠在短時(shí)間內(nèi)引起教育領(lǐng)域?qū)Ξ?dāng)前和未來(lái)教學(xué)方法的思考與質(zhì)疑。尤其是,這種現(xiàn)象是由一項(xiàng)試用產(chǎn)品(還在征求和回應(yīng)市場(chǎng)意見(jiàn)的測(cè)試服務(wù))帶來(lái)的。ChatGPT只是眾多建立在相似底層技術(shù)之上的工具之一,這系列工具發(fā)展變革之快,甚至我們都無(wú)法預(yù)見(jiàn)一年后這些工具可能提供給公眾的功能。但無(wú)法忽略的是,國(guó)際社會(huì)正在逐漸達(dá)成共識(shí):ChatGPT的升級(jí)版模型GPT-4僅僅是一個(gè)開(kāi)端,相關(guān)技術(shù)的發(fā)展必將顛覆傳統(tǒng)教育模式。
從一個(gè)觀察者的角度來(lái)看,生成式人工智能對(duì)未來(lái)中國(guó)教育的影響非常不清晰。需要新技術(shù)在實(shí)際使用中測(cè)試的數(shù)據(jù)和結(jié)論,同時(shí)也需要建立相關(guān)的研究和開(kāi)發(fā)項(xiàng)目,以便教師和教育系統(tǒng)的其他專(zhuān)業(yè)人員,能夠更容易地就如何使用作出正確決策。例如,基于多重視角設(shè)計(jì)的跨文化項(xiàng)目或可有效促進(jìn)這種知識(shí)建構(gòu)。本文僅是一個(gè)初步嘗試,旨在說(shuō)明重要的事情即將發(fā)生,需要教育決策者、參與者的更多關(guān)注。
我們需要嘗試依據(jù)證據(jù)作出回應(yīng),回答教育領(lǐng)域各個(gè)層面可能提出的問(wèn)題。首先,教師會(huì)提出問(wèn)題。例如,對(duì)于“懂得使用人工智能工具并愿意花費(fèi)幾分鐘調(diào)整其生成答案”的學(xué)生,教師如何知道其是否進(jìn)行了學(xué)習(xí)?又如何測(cè)評(píng)其學(xué)到了什么?以及當(dāng)教師準(zhǔn)備擁抱人工智能,并對(duì)其為教育可能帶來(lái)的改變感到興奮時(shí),卻不知道該去哪里學(xué)習(xí)相關(guān)知識(shí)。其次,教育管理者會(huì)提出問(wèn)題。例如,應(yīng)用人工智能工具進(jìn)行教育管理,是否會(huì)擾亂正常的工作秩序?再次,學(xué)生會(huì)提出問(wèn)題。例如,當(dāng)學(xué)生可以使用新的人工智能工具時(shí),是否還需要參加學(xué)校的教育活動(dòng)?最后,家長(zhǎng)會(huì)提出問(wèn)題。例如,在人工智能的大環(huán)境下,家長(zhǎng)應(yīng)該如何指導(dǎo)孩子進(jìn)行學(xué)習(xí)?
2022年末,生成式人工智能技術(shù)取得突破性進(jìn)展,有關(guān)如何運(yùn)用學(xué)習(xí)技術(shù)促進(jìn)教育變革的討論發(fā)生了重大轉(zhuǎn)變,而對(duì)該話題論述的廣度和深度也日益增強(qiáng),亟需教育工作者在這場(chǎng)辯論中發(fā)揮領(lǐng)航作用。雖然未來(lái)難以預(yù)測(cè),但回歸技術(shù)與教育的本質(zhì)進(jìn)行思考,會(huì)為解決現(xiàn)有困惑提供清晰的思路。
參考文獻(xiàn):
[1]OpenAi. China’s Baidu reveals generative AI chatbot based on language model bigger than GPT-3[EB/OL].(2023-02-07)[2023-04-18]. https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text/.
[2]KASNECI E, SEBLER K, KUCHEMANN S, et al. ChatGPT for Good? On Opportunities and Challenges of Large Language Models for Education[J/OL].(2023-02-23)[2023-04-18]. https://doi.org/10.35542/osf.io/5er8f.
[3]SUSNJAK T. ChatGPT: The End of Online Exam Integrity?[EB/OL].(2022-12-19)[ 2023-04-18]. https://doi.org/10.48550/arxiv.2212.09292.
[4]AHMED T. What if the devil is my guardian angel: ChatGPT as a case study of using chatbots in education[J]. Smart Learning Environments, 2023(1):15.
[5]BROWN T, MANN B, RYDER N. Language models are few-shot learners[J]. Proceedings of the 34th International Conference on Neural Information Processing Systems, 2021,33:1877-1901.
[6]JOHNSON M. AI, Technical architecture and the future of education[EB/OL].(2023-01-30)[2023-04-18]. http://dailyimprovisation.blogspot.com/2023/01/ai-technical-architecture-and-future-of.html.
[7]BENDER E M, GEBRU T, SHMITCHELL S, et al. On the dangers of stochastic parrots: can Language models be too big[C]. Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency, 2021: 610-623[2023-04-18]. https://doi.org/10.1145/3442188.3445922.
[8]OpenAI. New AI classifier for indicating AI-written text[EB/OL].(2023-01-31)[2023-04-18]. https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text/.
[9]KHRONO. Robotfusk-nye og gamle problemer[EB/OL].(2023-01-30)[2023-04-18]. https://khrono.no/robotfusk-nye-og-gamle-problemer/754671.
[10]KHRONO. Fagl?覸rer om samtalerobot: Dette er som doping[EB/OL].(2023-02-01)[2023-04-18]. https://khrono.no/faglaerer-om-samtalerobot-dette-er-som-doping/755479.
[11]QAA. The rise of artificial intelligence software and potential risks for academic integrity: A QAA briefing paper for higher education providers[EB/OL].(2023-01-30)[2023-04-18]. https://www.qaa.ac.uk/docs/qaa/members/the-rise-of-artificial-intelligence-software-and-potential-risks-for-academic-integrity.pdf?sfvrsn=ebb0a981_6.
[12]OpenAI. Educator considerations for ChatGPT[EB/OL].(2023)[2023-04-18]. https://platform.openai.com/docs/chatgpt-education.
[13]The OpenGPT-X project[EB/OL].(2023)[2023-04-18]. https://opengpt-x.de/en/project.
[14]Pre-release of GPT-SW3[EB/OL].(2023-01-23)[2023-04-18]. https://www.ai.se/en/news/pre-release-gpt-sw3.
[15]CHOI S, JANG Y, KIM H. Influence of pedagogical beliefs and perceived trust on teachers’ acceptance of educational artificial intelligence tools[J]. International Journal of Human-Computer Interaction, 2023,39(4):910-922.
Generative AI Based on Large Language Models Disrupts European Education
Tore HOEL1,2, Siqi LI1, Bo SUN1
(1.College of Education for the Future, Beijing Normal University, Zhuhai 519087, Guangdong;
2.Media and Academic Research Unit, Oslo Metropolitan University, Oslo NO-0130, Norway)
Abstract: The recent launch of generative AI technologies has prompted a worldwide interest in how large language models could enhance or disrupt education. With the promotion of generative artificial intelligence technology, the debate about its impact has been ongoing for several months in Europe and around the world. In the field of education, there is a view that the promotion of this new technology will trigger disruptive change, while another view regards that technological innovation can affect education, but it has not changed the most basic educational patterns and rules. Therefore, the education community urgently needs to understand and grasp the overall trend and development direction of this technological change in order to cope with future educational changes. By summarizing the challenges and countermeasures faced by Europe and most western countries in the Digital transformation, as well as their understanding of generative AI technology, suggestions are provided for solving the “pain points” in the field of education. Firstly, large-scale language models provide learning opportunities that can help teachers improve teaching quality, and these opportunities vary depending on learners; Secondly, large-scale language models may completely change teaching methods and assist the teaching process, especially in areas such as personalized learning, instructional design, and professional development of language learning; Thirdly, it is necessary to explore the application of large-scale language models in education from different perspectives, such as learner’s perspective, teacher’s perspective, administrative and managerial perspective, researcher’s perspective, employer’s perspective, etc; Finally, large-scale language models also bring risks and challenges to education, such as copyright issues, bias and fairness, learners’ excessive reliance on models, teachers’ excessive reliance on models, lack of deep learning and professional knowledge, and difficulty in distinguishing model generation results from student responses.
Keywords: Generative artificial intelligence; Large language models; ChatGPT; AI in education; Education evaluation
編輯:王曉明" "校對(duì):李曉萍
DOI: 10.3969/j.issn.1673-8454.2023.06.002
作者簡(jiǎn)介:托雷·霍爾(Tore Hoel)北京師范大學(xué)未來(lái)教育學(xué)院特聘研究員,奧斯陸城市大學(xué)高級(jí)研究員(挪威奧斯陸 NO-0130);李思琦,共同第一作者、同等貢獻(xiàn)者,北京師范大學(xué)未來(lái)教育學(xué)院講師(廣東珠海 519087);孫波,通訊作者,北京師范大學(xué)珠海校區(qū)副教務(wù)長(zhǎng)、未來(lái)教育學(xué)院副院長(zhǎng)、人工智能與未來(lái)網(wǎng)絡(luò)研究院教授(廣東珠海 519087)
基金項(xiàng)目:2022年國(guó)家自然科學(xué)基金青年科學(xué)基金項(xiàng)目“區(qū)域經(jīng)濟(jì)社會(huì)文化畫(huà)像下的教育資源精準(zhǔn)分配研究——基于地理信息系統(tǒng)的大數(shù)據(jù)分析” (編號(hào):62107004);2023年廣東省教育科學(xué)“十四五”規(guī)劃項(xiàng)目“核心素養(yǎng)導(dǎo)向的高等師范院校職前科學(xué)教師培養(yǎng)研究” (編號(hào):2022GXJK420)