吳豐華 韓文龍
(1. 西北大學(xué) 經(jīng)濟(jì)管理學(xué)院,陜西 西安 710127;2. 西南財(cái)經(jīng)大學(xué) 經(jīng)濟(jì)學(xué)院,四川 成都 610074)
以GPT(Generative Pre-Trained Transformer)為代表的大型語(yǔ)言模型(Large Language Model,LLM)的橫空出世①,其用戶增長(zhǎng)至1 億人所用的時(shí)間遠(yuǎn)遠(yuǎn)少于其他熱門應(yīng)用,其強(qiáng)大功能和迭代速度遠(yuǎn)遠(yuǎn)超過(guò)了包括其開發(fā)者在內(nèi)的從業(yè)者、社會(huì)大眾和相關(guān)領(lǐng)域科學(xué)家的估計(jì)。 比爾·蓋茨認(rèn)為其是“平生見識(shí)過(guò)兩次令我印象深刻、革命性的技術(shù)演示”之一②。 GPT 是一種基于Transformer 架構(gòu)的,經(jīng)過(guò)預(yù)訓(xùn)練的、生成性的模型。 本質(zhì)上,這類語(yǔ)言模型的功能是對(duì)文本進(jìn)行“合理的延續(xù)”,即預(yù)測(cè)下一個(gè)詞該說(shuō)什么,其中“合理”的意思是“在查看了數(shù)十億個(gè)網(wǎng)頁(yè)等人類編寫的文本之后,我們可能會(huì)期望某個(gè)人會(huì)寫下這樣的內(nèi)容”[1]。 其中Transformer 架構(gòu)發(fā)揮了關(guān)鍵作用,而訓(xùn)練GPT 的主要方法就是無(wú)監(jiān)督學(xué)習(xí),即不需要對(duì)素材進(jìn)行標(biāo)注的學(xué)習(xí)方法。 已投入商業(yè)應(yīng)用的最新一代GPT——GPT-4 的性能十分強(qiáng)大,在美國(guó)各項(xiàng)主流考試中的成績(jī)均較GPT-3.5 模型有了大幅進(jìn)步。 著名計(jì)算機(jī)科學(xué)家、物理學(xué)家沃爾夫勒姆在新書《ChatGPT 在做什么……以及它為什么好使》中分析認(rèn)為,GPT 更像人腦,而不像一般的計(jì)算機(jī)程序。
正如比爾·蓋茨所言,人工智能的發(fā)展與微處理器、個(gè)人電腦、互聯(lián)網(wǎng)和移動(dòng)電話的誕生一樣意義重大。 它將改變?nèi)藗児ぷ鳌W(xué)習(xí)、旅行、獲得醫(yī)療保健以及交流的方式。 整個(gè)行業(yè)將圍繞人工智能重新洗牌,企業(yè)也將根據(jù)其利用人工智能技術(shù)的程度來(lái)區(qū)分優(yōu)劣[2]。 同樣,包括高校在內(nèi)的教育部門也將受到人工智能和LLM 的巨大沖擊,根據(jù)OpenAI 的一份研究報(bào)告,教育行業(yè)受GPT的影響在全部行業(yè)中排在中等偏上水平③。
實(shí)際上這種沖擊已經(jīng)發(fā)生:在美國(guó),紐約市教育部2023 年1 月初宣布禁止學(xué)生在其學(xué)校的設(shè)備和網(wǎng)絡(luò)上使用ChatGPT,以預(yù)防學(xué)生的作弊行為。 據(jù)《紐約時(shí)報(bào)》報(bào)道,包括喬治·華盛頓大學(xué)在內(nèi)的多所高校,教授們正在逐步淘汰更易受到ChatGPT 影響的開放式作業(yè),作為替代,他們更多選擇課堂作業(yè)、手寫論文、小組作業(yè)和口試等方法。 在歐洲,巴黎政治學(xué)院在2023 年1 月末發(fā)出通知,禁止全體學(xué)生及教職工利用ChatGPT 完成教學(xué)任務(wù)。 在澳大利亞,新南威爾士州、昆士蘭州等多個(gè)州已宣布禁止在校內(nèi)使用ChatGPT[3]。 在國(guó)內(nèi),《暨南學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版)》發(fā)表聲明暫不接受任何大型語(yǔ)言模型工具(如ChatGPT)單獨(dú)或聯(lián)合署名的文章,《天津師范大學(xué)學(xué)報(bào)(基礎(chǔ)教育版)》也發(fā)布相關(guān)聲明,建議作者在參考文獻(xiàn)、致謝等文字中對(duì)使用人工智能寫作工具(如Chat-GPT 等)的情況予以說(shuō)明。 然而,將ChatGPT 徹底從教育領(lǐng)域清除并不是所有高等教育者達(dá)成的共識(shí)。 英國(guó)劍橋大學(xué)副校長(zhǎng)B.Vira 教授表示,人工智能是一種供人們使用的工具,大學(xué)禁用像ChatGPT 這樣的人工智能軟件并不“明智”。 他說(shuō),大學(xué)應(yīng)該對(duì)學(xué)習(xí)、教學(xué)和考試過(guò)程進(jìn)行相應(yīng)的調(diào)整,以確保學(xué)生在使用該工具的同時(shí)保持學(xué)術(shù)誠(chéng)信[3]。 面對(duì)教育界的巨大爭(zhēng)論,OpenAI 首席執(zhí)行官S.Altman 近期表示,OpenAI 正在研發(fā)幫助學(xué)校識(shí)別人工智能參與作弊的技術(shù)[3]。
智能化時(shí)代,社會(huì)對(duì)人才提出了正確價(jià)值觀、多學(xué)科交叉能力、人工智能專業(yè)素養(yǎng)和創(chuàng)新決策能力的需求[4]。 利用數(shù)字化技術(shù)創(chuàng)新高教模式已成為全球共識(shí)。 2022 年12 月召開的世界慕課與在線教育大會(huì)上,《無(wú)限的可能——世界高等教育數(shù)字化發(fā)展報(bào)告》獲得廣泛共識(shí),報(bào)告提出,“新一輪科技革命和產(chǎn)業(yè)變革帶來(lái)了前所未有的發(fā)展機(jī)遇,數(shù)字化的知識(shí)、信息和數(shù)據(jù)已成為關(guān)鍵生產(chǎn)要素。 ……利用現(xiàn)代信息技術(shù),高等教育將在育人方式、辦學(xué)模式等方面產(chǎn)生系統(tǒng)變革”。我國(guó)也認(rèn)識(shí)到了發(fā)展人工智能的重要性,2023 年4 月28 日,中央政治局會(huì)議首次提出要發(fā)展通用人工智能并提出要辯證對(duì)待,“要重視通用人工智能發(fā)展,營(yíng)造創(chuàng)新生態(tài),重視防范風(fēng)險(xiǎn)?!保?]2022 年全國(guó)教育工作會(huì)議也提出要實(shí)施教育數(shù)字化戰(zhàn)略行動(dòng),把教育信息化作為發(fā)展的戰(zhàn)略制高點(diǎn),加快推進(jìn)教育信息化和教育資源數(shù)字化建設(shè)。 面對(duì)LLM 給高等教育所帶來(lái)客觀的、巨大的挑戰(zhàn)和機(jī)遇,我們應(yīng)該積極應(yīng)對(duì),深入研究以GPT為代表的大型語(yǔ)言模式與高等教育結(jié)合的可能性、對(duì)我國(guó)高等教育產(chǎn)生的短期和長(zhǎng)期影響以及帶來(lái)的挑戰(zhàn)等問(wèn)題,并給出中國(guó)的應(yīng)對(duì)方案。
第一,基于超大模型和預(yù)訓(xùn)練的強(qiáng)大生成性。GPT 中的“G”(Generative)就是生成性的。 作為超大型語(yǔ)言模型的代表,GPT-4 通過(guò)對(duì)含有1.8萬(wàn)億參數(shù)④的GPT 模型進(jìn)行無(wú)監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)⑤和大規(guī)模的分布式訓(xùn)練⑥,在海量語(yǔ)料庫(kù)⑦中獲得了強(qiáng)大的自然語(yǔ)言理解和生成能力。 這樣,ChatGPT 和GPT-4 表現(xiàn)出極強(qiáng)的自組織能力,通過(guò)思維鏈(Chain-of-Thought)機(jī)制,出現(xiàn)積少成多的開悟時(shí)刻,即“涌現(xiàn)”。 可以說(shuō),強(qiáng)大的生成性奠定了GPT 最基礎(chǔ)也是最有力的生產(chǎn)力屬性。
第二,基于多模態(tài)算法和相關(guān)領(lǐng)域情境學(xué)習(xí)和微調(diào)的高行業(yè)滲透性。 “多模態(tài)、推理能力、預(yù)測(cè)擴(kuò)展性”是GPT-4 的三大亮點(diǎn)[6],其中以多模態(tài)對(duì)教育行業(yè)的影響最為直觀。 多模態(tài)算法即融合文字、圖片、音視頻等多種內(nèi)容形式的AI 算法。具體來(lái)說(shuō),給定由穿插文本和圖像組成的輸入,GPT-4 可以生成文本輸出(自然語(yǔ)言、代碼等)⑧。 不論是AI,抑或其高級(jí)形態(tài)——通用人工智能(Artificial general intelligence,AGI)要滲透到各個(gè)行業(yè),向多模態(tài)發(fā)展是必然趨勢(shì),畢竟現(xiàn)實(shí)世界中的數(shù)據(jù)天然就是多模態(tài)的,必然需要有能感知和理解多模態(tài)數(shù)據(jù)的能力。 進(jìn)一步,針對(duì)各個(gè)應(yīng)用場(chǎng)景需要交互的輸入、輸出各不相同的情況,多模態(tài)的大模型可以且必須通過(guò)細(xì)分領(lǐng)域的數(shù)據(jù)和指令微調(diào)以及少樣本的情境學(xué)習(xí)⑨,才能高效地應(yīng)用到各個(gè)領(lǐng)域和行業(yè)之中⑩,形成很強(qiáng)的任務(wù)通用性,可廣泛使用于下游任務(wù)(生成、預(yù)測(cè)、判別等)。 同樣的,基于對(duì)不同教育場(chǎng)景的針對(duì)性微調(diào),大型語(yǔ)言模型在高等教育領(lǐng)域的多任務(wù)執(zhí)行和多場(chǎng)景應(yīng)用才成為可能。
第三,基于思維鏈產(chǎn)生的復(fù)雜推理能力。GPT-4 具備極強(qiáng)的推理機(jī)制,無(wú)論是復(fù)雜的邏輯推理、編程推導(dǎo)或者是密集型內(nèi)容幫助,GPT-4皆表現(xiàn)不俗。 這意味著GPT-4 可處理未知問(wèn)題,即沒(méi)有現(xiàn)成答案的問(wèn)題。 其原因在于GPT-4 是通過(guò)思維鏈,即通過(guò)合適的提示,將邏輯較為復(fù)雜的問(wèn)題拆解為多個(gè)簡(jiǎn)單的子問(wèn)題來(lái)“解答”問(wèn)題,這里不是搜索答案而是回答問(wèn)題。 如此,GPT-4會(huì)對(duì)編程、內(nèi)容審核等場(chǎng)景產(chǎn)生深遠(yuǎn)影響。 特別的,以GPT-4 為代表的AI 對(duì)問(wèn)題的回答思路或提出的解決方案,大部分時(shí)候符合人類回答或解題的理性思路,但有時(shí)也會(huì)發(fā)現(xiàn)其并非人類的理性思路或套路,它能找到并采取人理解范圍之外的解決方案。 這意味著,高等教育中最重要的目標(biāo)之一——?jiǎng)?chuàng)新,就有可能在師生與以GPT 為代表的LLM 的互動(dòng)中產(chǎn)生。
第一,LLM 的使用過(guò)程更接近學(xué)習(xí)的最本源模式。 人與大型語(yǔ)言模型的交互模式更接近對(duì)話式學(xué)習(xí),正所謂“真?zhèn)饕痪湓挘賯魅f(wàn)卷書”。 學(xué)生可以通過(guò)與大型語(yǔ)言模型不斷的問(wèn)答和追問(wèn)式的互動(dòng),以最快的方式獲得知識(shí),而且能夠有針對(duì)性地彌補(bǔ)自身知識(shí)的短板。 更進(jìn)一步,可以通過(guò)對(duì)LLM 的針對(duì)性訓(xùn)練(如“喂給”特定知識(shí)領(lǐng)域的語(yǔ)料),實(shí)現(xiàn)像某領(lǐng)域、某學(xué)派甚至某位學(xué)者那樣回答問(wèn)題。 這樣,大型語(yǔ)言模型就有極大可能成為一種高效的學(xué)習(xí)方式。 當(dāng)然,這種對(duì)話式學(xué)習(xí)也存在一定挑戰(zhàn):它可能會(huì)把知識(shí)講錯(cuò),可能會(huì)憑空編造知識(shí),特別是冷門知識(shí)。 這就需要提高訓(xùn)練LLM 的語(yǔ)料庫(kù)的更新頻次,但更為重要的是要通過(guò)提高算法,識(shí)別并屏蔽編造知識(shí)的行為。
第二,基于LLM 的AI 助手將極大解放并賦能教學(xué)雙方,實(shí)現(xiàn)以學(xué)生為中心的教學(xué)。 一旦擁有一位教育領(lǐng)域的大型語(yǔ)言模型AI 助手,那將是對(duì)師生雙方的共同解放和賦能,極大地提高效率。作為教師的教學(xué)助手,AI 助手可以用自然語(yǔ)言打破各種語(yǔ)言障礙,如外語(yǔ)、編程語(yǔ)言等,深度賦能教師;AI 助手還可以幫助教師和管理者評(píng)估學(xué)生對(duì)某一學(xué)科的理解,以提供有針對(duì)性、個(gè)性化的學(xué)習(xí)方案;AI 助手還可以就學(xué)生的職業(yè)規(guī)劃提供建議。 目前,一些國(guó)外教師已經(jīng)在使用ChatGPT 這樣的工具來(lái)生成對(duì)學(xué)生寫作的評(píng)語(yǔ)。 作為學(xué)生的學(xué)習(xí)助手,通過(guò)一段時(shí)間的使用,AI 助手會(huì)了解學(xué)生的興趣、學(xué)習(xí)風(fēng)格和長(zhǎng)板短板,從而為學(xué)生量身定制內(nèi)容,保持每位學(xué)生的參與度和學(xué)習(xí)效果;它會(huì)衡量學(xué)生的理解能力,注意到學(xué)生何時(shí)失去興趣,并了解不同的學(xué)生傾向于哪種激勵(lì)方式;AI助手還能給出即時(shí)反饋,以解決高等教育中的最大難題之一——學(xué)習(xí)過(guò)程中的及時(shí)教學(xué)評(píng)估。 這些變化已經(jīng)發(fā)生,在不久的將來(lái),AI 助手將最終改革高校的教學(xué)方式。
第三,LLM 更豐富的輸出形式為教學(xué)活動(dòng)提供了更多可能。 前文分析了多模態(tài)所帶來(lái)的諸多好處。 未來(lái),如果基于LLM 的教學(xué)AI 能夠提供除自然語(yǔ)言外更為豐富的輸出形式,如圖像、音頻,甚至是視頻等?,那么其輔助教學(xué)的能力和效果必將明顯提升,其中,尤其以視頻形式最為重要,因?yàn)榈侥壳盀橹梗曨l被認(rèn)為是講授演示的首選媒體。 一旦基于LLM 的視頻輸出成為可能,那么將明顯區(qū)別于現(xiàn)在單純依靠教師設(shè)計(jì)內(nèi)容、撰寫腳本進(jìn)行錄制的視頻類課程。 很顯然,慕課等大規(guī)模網(wǎng)絡(luò)課程和在線課程的效果之所以沒(méi)有達(dá)到預(yù)期,其原因就在于課程內(nèi)容從設(shè)計(jì)策劃到生成制作,都是教師“居高臨下”地對(duì)學(xué)生進(jìn)行單向度傳輸,并沒(méi)有充分圍繞學(xué)生這一中心展開,難以滿足學(xué)生個(gè)性化、動(dòng)態(tài)化的學(xué)習(xí)要求。
第四,中國(guó)高等教育的巨量規(guī)模為大型語(yǔ)言模型在高教領(lǐng)域的拓展應(yīng)用提供了數(shù)據(jù)基礎(chǔ)和廣闊前景。 經(jīng)過(guò)多年發(fā)展,我國(guó)建成了世界上最大規(guī)模的高等教育體系,在學(xué)總?cè)藬?shù)超過(guò)4 430 萬(wàn)人,高等教育毛入學(xué)率從2012 年的30%提高至2021 年的57.8%[7]。 此外,我國(guó)慕課建設(shè)與應(yīng)用在課程數(shù)量、應(yīng)用范圍、多模式應(yīng)用和促進(jìn)高校教學(xué)改革等方面取得了顯著成就[8]。 截至2022 年11 月,慕課數(shù)量超過(guò)6.19 萬(wàn)門,注冊(cè)用戶4.02億,學(xué)習(xí)人數(shù)達(dá)9.79 億人次,中國(guó)慕課數(shù)量和學(xué)習(xí)人數(shù)均居世界第一[9]。 世界第一的高教規(guī)模背后是世界第一的高等教育大數(shù)據(jù)庫(kù),海量的數(shù)據(jù)將為L(zhǎng)LM 的訓(xùn)練提供最為豐富的語(yǔ)料資源,也將為L(zhǎng)LM 的應(yīng)用提供最為廣闊的用戶群體,前者將大大加速LLM 針對(duì)中國(guó)高等教育的拓展應(yīng)用的開發(fā),后者將大大降低在中國(guó)高教領(lǐng)域應(yīng)用或開發(fā)LLM 的相關(guān)應(yīng)用的成本,為其商業(yè)化應(yīng)用和大規(guī)模推廣奠定基礎(chǔ)。
大型語(yǔ)言模型對(duì)高等教育的影響可以從短期的直接影響和長(zhǎng)期的間接影響兩個(gè)維度來(lái)分析,前者主要體現(xiàn)在對(duì)教學(xué)模式、教學(xué)方法、線上教學(xué)、教學(xué)助手等方面的影響,后者則主要體現(xiàn)在對(duì)我國(guó)高校學(xué)科建設(shè)與發(fā)展、拔尖人才培養(yǎng)、高校結(jié)構(gòu)變革等方面。
第一,LLM 可以幫助創(chuàng)設(shè)教學(xué)情境、創(chuàng)新教學(xué)模式。 當(dāng)前高等教育面臨的嚴(yán)重問(wèn)題之一便是課堂教學(xué)單通道、單向度,師生互動(dòng)層次低、停留在表層,而且受限于教師的時(shí)間與精力,難以向課前、課后延伸。 雨課堂、學(xué)習(xí)通等教學(xué)輔助軟件的誕生和使用,雖然有所緩解上述問(wèn)題,但是難以從根本上改變這一狀況。 而在LLM 上,可以實(shí)現(xiàn)大師、學(xué)者、老師和學(xué)生之間,以角色互換、多角色Cosplay 等方式進(jìn)行深度互動(dòng)。 各學(xué)科、專業(yè)的老師也可圍繞LLM 創(chuàng)設(shè)多種教學(xué)情境,如在基礎(chǔ)學(xué)科的專業(yè)課程上,通過(guò)LLM 復(fù)活那些已經(jīng)逝去的偉大科學(xué)家、先賢先哲,讓學(xué)生和他們直接對(duì)話;在編程課上,可以由LLM 模擬某種特定的計(jì)算機(jī)語(yǔ)言,對(duì)學(xué)生進(jìn)行編程訓(xùn)練;在論文寫作課上,可以讓LLM 來(lái)?yè)?dān)任編輯、編審或?qū)徃迦说慕巧瑢?duì)學(xué)生開展寫作、投稿和返修指導(dǎo);在新聞?lì)愓n程上,可以讓LLM 出任記者、編輯等不同崗位,幫助學(xué)生充分體驗(yàn)新聞創(chuàng)作和采編過(guò)程。 可以發(fā)現(xiàn),這種互動(dòng)完全可以在教師相當(dāng)有限的指導(dǎo)和監(jiān)督下展開,并向課前和課后充分延伸,這在突破學(xué)習(xí)的物理時(shí)空限制,大大提高學(xué)生學(xué)習(xí)的個(gè)性化、自主性的同時(shí),也能充分解放教師,有助于他們投入更富創(chuàng)造力的教學(xué)和科研工作中。 這種運(yùn)用LLM 的教學(xué)情境創(chuàng)設(shè)和模式創(chuàng)新,既充分彰顯了“以學(xué)生發(fā)展為中心”的教育理念,大大緩解學(xué)習(xí)者的焦慮和畏難情緒,提高學(xué)生學(xué)習(xí)效果和學(xué)習(xí)興趣,也高度契合了“兩性一度”的金課標(biāo)準(zhǔn)。
第二,基于LLM 開發(fā)的各類教學(xué)小程序?qū)⒋蠓嵘虒W(xué)和科研效率。 隨著LLM 不斷迭代并逐漸成熟,其算法也將不斷優(yōu)化,算力也將逐漸節(jié)省,并向高校、高教管理機(jī)構(gòu)和教育類公司開源,基于LLM 開發(fā)的各類教學(xué)或?qū)W習(xí)輔助小程序?qū)⒋罅砍霈F(xiàn)。 目前,我國(guó)主流的幾款輔助教學(xué)軟件——雨課堂、學(xué)習(xí)通等,都在進(jìn)行相關(guān)人工智能程序的嵌入式開發(fā)。 可以想象,未來(lái)將會(huì)有大量的教學(xué)助手出現(xiàn),它們能夠幫助教師完成學(xué)生形式靈活的課前預(yù)習(xí)、及時(shí)的課后答疑、快捷的隨堂和課后測(cè)評(píng)、輔助課堂討論、教學(xué)材料和案例的自動(dòng)生成、全周期的教學(xué)數(shù)據(jù)分析等多種任務(wù);或者幫助學(xué)生完成課前預(yù)習(xí)、課后復(fù)習(xí)、學(xué)習(xí)效果自測(cè)、課程作業(yè)協(xié)同創(chuàng)作?等多種任務(wù)。 這還僅僅是在教學(xué)層面。 實(shí)際上,科研層面的應(yīng)用前景將更加廣泛,如基于LLM 開發(fā)的能夠閱讀和初步提煉歸納文獻(xiàn)內(nèi)容的文獻(xiàn)管理軟件、寫作輔助插件、特定領(lǐng)域的編程工具、統(tǒng)計(jì)分析、計(jì)量分析和大數(shù)據(jù)分析的插件,等等。 一個(gè)可供參照的實(shí)例是,隨著開發(fā)ChatGPT 的公司OpenAI 把API?流量?jī)r(jià)格降低90%之后,短短幾天內(nèi)就涌現(xiàn)出11 個(gè)基于ChatGPT 的小應(yīng)用程序和應(yīng)用插件上線應(yīng)用——實(shí)現(xiàn)了PDF 文檔分析、復(fù)雜計(jì)算、調(diào)用瀏覽器等LLM 模型自身并不具備的擴(kuò)展性新功能。
第三,LLM 為高校大規(guī)模、個(gè)性化在線學(xué)習(xí)提供了極大的想象空間。 LLM 在高等教育領(lǐng)域的使用,使基于問(wèn)題導(dǎo)向的線上教學(xué)、教師幫助、學(xué)生自主學(xué)習(xí)乃至人工智能助教變得技術(shù)可行且成本可控;線上課程開發(fā)、建設(shè)和內(nèi)容更新都將更為方便,在線課程的呈現(xiàn)形式也將大大豐富。 未來(lái)可能出現(xiàn)的情況是,雖然所有學(xué)生都在學(xué)習(xí)同一門在線課程,但是伴隨著課程開始前對(duì)學(xué)生的知識(shí)基礎(chǔ)和能力的評(píng)估,以及課程進(jìn)行中不斷與LLM 的交互,實(shí)際上每位學(xué)生學(xué)習(xí)的課程內(nèi)容、進(jìn)行的課程練習(xí)、課程的進(jìn)度安排、被推薦的教學(xué)資源,乃至所采用的教學(xué)方法和教學(xué)模式都是不一樣的,真正實(shí)現(xiàn)了“千人千面”式的個(gè)性化在線學(xué)習(xí)。 當(dāng)然,LLM 還需要大量的訓(xùn)練和進(jìn)一步發(fā)展,才能理解某個(gè)學(xué)生學(xué)習(xí)的最佳方式或其學(xué)習(xí)的驅(qū)動(dòng)因素。 即使技術(shù)十分完善,創(chuàng)造性學(xué)習(xí)仍將取決于師生之間的良好關(guān)系。 它將助力但永遠(yuǎn)不會(huì)取代學(xué)生和老師在課堂上共同完成的工作。
第四,LLM 將助力虛擬仿真課程開發(fā)和虛擬教研室建設(shè)。 LLM 與AR(增強(qiáng)現(xiàn)實(shí))、VR(虛擬現(xiàn)實(shí))技術(shù)和設(shè)備的匹配與融合,是LLM 在高等教育領(lǐng)域的又一重要應(yīng)用方向。 受制于無(wú)法進(jìn)行人機(jī)交互,現(xiàn)有的虛擬仿真課程,包括國(guó)家級(jí)虛擬仿真實(shí)驗(yàn)教學(xué)一流課程,帶給學(xué)生的體驗(yàn)感和學(xué)習(xí)效果都不盡如人意。 隨著LLM 及其在基于高等教育各專業(yè),特別是在新工科、新醫(yī)科、新農(nóng)科專業(yè)不斷深入的課程內(nèi)容建設(shè)和開發(fā),虛擬仿真、虛擬實(shí)驗(yàn)的內(nèi)容質(zhì)量,師生的沉浸式體驗(yàn)感和逼真感,以及學(xué)習(xí)效果都將大幅提升。 同樣,教育部正在推進(jìn)的虛擬教研室建設(shè),也將隨著LLM 的應(yīng)用,打破不同院校之間的空間限制和教育上下級(jí)之間的體制限制,開展充分的跨區(qū)域和跨級(jí)交流,甚至可提供一個(gè)類似于第二大腦的教研交流對(duì)象。 每一個(gè)虛擬教研室都將擁有一個(gè)類似于教學(xué)指導(dǎo)委員會(huì)或?qū)W科建設(shè)指導(dǎo)委員會(huì)一樣的交流和咨詢對(duì)象,以實(shí)現(xiàn)對(duì)每個(gè)虛擬教研室富有針對(duì)性的教學(xué)指導(dǎo)和幫助。
第一,LLM 將有力助推新工科、新醫(yī)科、新農(nóng)科與新文科建設(shè)。 “四新”建設(shè)旨在從教育思想、發(fā)展理念、質(zhì)量標(biāo)準(zhǔn)、技術(shù)方法、質(zhì)量評(píng)價(jià)等方面推進(jìn)相關(guān)學(xué)科人才培養(yǎng)范式的全方位改革。 就賦能新工科而言,LLM 建設(shè)及其應(yīng)用將有力助推組織模式創(chuàng)新、內(nèi)容方式創(chuàng)新和實(shí)踐體系創(chuàng)新,助力構(gòu)建產(chǎn)學(xué)研用多要素融合、多主體協(xié)同的育人機(jī)制,將有助于支撐本科院校與企業(yè)深度合作,將賦能建設(shè)一批示范性微電子學(xué)院、網(wǎng)絡(luò)安全學(xué)院、現(xiàn)代產(chǎn)業(yè)學(xué)院、特色化示范性軟件學(xué)院、未來(lái)技術(shù)學(xué)院等,推動(dòng)工程教育深層次變革。 就賦能新醫(yī)科而言,LLM 建設(shè)及其應(yīng)用將助力復(fù)合型高層次醫(yī)學(xué)拔尖創(chuàng)新人才培養(yǎng),推動(dòng)“醫(yī)學(xué)+X”復(fù)合型人才培養(yǎng)改革走向深入。 就賦能新農(nóng)科而言,LLM 建設(shè)及其應(yīng)用將助力設(shè)立更多創(chuàng)新形式的新農(nóng)科實(shí)踐項(xiàng)目,促進(jìn)“大國(guó)三農(nóng)”系列在線開放課程和耕讀教育相關(guān)國(guó)家級(jí)一流課程提質(zhì)升級(jí),賦能耕讀教育實(shí)踐基地建設(shè),有力支撐新農(nóng)業(yè)、新農(nóng)村、新農(nóng)民和新生態(tài)建設(shè)。 就賦能新文科而言,新文科建設(shè)的要義之一是促進(jìn)學(xué)科交叉融合,2012—2022 年間,教育部統(tǒng)籌推進(jìn)在全國(guó)高校新增三千多個(gè)文理、文工等學(xué)科交叉融合專業(yè)點(diǎn)[10]。 LLM的發(fā)展與建設(shè),將有助于文科背景的教師和管理者更好理解和推進(jìn)文理、文工等交叉學(xué)科的建設(shè),并加快涉外法治、國(guó)際傳播、國(guó)際組織等相關(guān)人才培養(yǎng),推進(jìn)文科教育與社會(huì)實(shí)務(wù)緊密結(jié)合。
第二,LLM 將賦能基礎(chǔ)學(xué)科拔尖人才培養(yǎng)。在百年未有之大變局下,為貫徹習(xí)近平總書記“加強(qiáng)基礎(chǔ)學(xué)科拔尖學(xué)生培養(yǎng),在數(shù)理化生等學(xué)科建設(shè)一批基地,吸引最優(yōu)秀的學(xué)生投身基礎(chǔ)研究”[11]的重要指示,2018 年教育部全面啟動(dòng)基礎(chǔ)學(xué)科拔尖學(xué)生培養(yǎng)計(jì)劃2.0(簡(jiǎn)稱“珠峰計(jì)劃”),在77 所高校布局建設(shè)了288 個(gè)學(xué)生培養(yǎng)基地,累計(jì)吸引1 萬(wàn)余名優(yōu)秀學(xué)生投身基礎(chǔ)學(xué)科[10]。 其中,涉及190 個(gè)左右的理科基地、60 個(gè)左右的文科基地以及10 個(gè)左右的醫(yī)科基地。 LLM 建設(shè)及其AI 智能應(yīng)用,將有利于發(fā)現(xiàn)、選拔和培養(yǎng)上述基礎(chǔ)學(xué)科領(lǐng)域的天才、偏才和怪才。 從學(xué)生能力角度考量,基本技能中的初級(jí)寫作、編程等最容易被LLM 代替或至少輔助完成,而批判性思維、創(chuàng)新能力和綜合運(yùn)用理論解釋、解決現(xiàn)實(shí)問(wèn)題的能力就變得更為重要;從教育者角度考量,通過(guò)LLM 得到的是相對(duì)碎片化的知識(shí),而對(duì)拔尖人才的培養(yǎng),應(yīng)重點(diǎn)引導(dǎo)啟發(fā)學(xué)生提問(wèn)能力、獨(dú)立思考能力、創(chuàng)新思維的涌現(xiàn)。 可以說(shuō),LLM 的廣泛應(yīng)用,將助力國(guó)家形成基礎(chǔ)學(xué)科拔尖人才的梯隊(duì)網(wǎng)絡(luò),探索基礎(chǔ)學(xué)科拔尖人才培養(yǎng)的中國(guó)范式,為建設(shè)世界重要人才中心和創(chuàng)新高地筑牢基礎(chǔ)。
第三,LLM 將促進(jìn)高校進(jìn)行以學(xué)生能力為核心的結(jié)構(gòu)性變革。 包括我國(guó)在內(nèi)的世界高校教學(xué)的現(xiàn)行組織方式都是以專業(yè)為基礎(chǔ),圍繞“專業(yè)+年級(jí)”或“學(xué)科大類+年級(jí)”的核心單元進(jìn)行組織。未來(lái),在LLM 及其與之相匹配的AI 教學(xué)的加持下,高校教學(xué)有極大可能充分基于學(xué)生的不同能力水平,打破專業(yè)、班級(jí)教學(xué)的整齊劃一,圍繞“專業(yè)+能力”或“學(xué)科大類+能力”的核心單元進(jìn)行組織,在知識(shí)習(xí)得和掌握的基礎(chǔ)上,以多維能力和綜合素質(zhì)提升為最終目標(biāo),組織師生、教學(xué)資源和學(xué)習(xí)空間,大幅提升高校針對(duì)學(xué)生情況開展個(gè)性化教學(xué)的可能性。 這樣,學(xué)校將實(shí)現(xiàn)從圍繞年級(jí)展開的“年級(jí)進(jìn)階”向圍繞能力提升展開的“能力進(jìn)階”轉(zhuǎn)型升級(jí)[12]。
第一,LLM 在高等教育領(lǐng)域的使用可能引發(fā)國(guó)家安全風(fēng)險(xiǎn)。 這種安全風(fēng)險(xiǎn)主要來(lái)自三個(gè)方面:一是數(shù)據(jù)泄露風(fēng)險(xiǎn)。 一旦LLM 在高等教育領(lǐng)域大規(guī)模使用,其背后的海量教育數(shù)據(jù),包括但不限于學(xué)科數(shù)據(jù)、專業(yè)數(shù)據(jù)、教師數(shù)據(jù)、學(xué)生數(shù)據(jù)、學(xué)習(xí)數(shù)據(jù)、師生互動(dòng)和人機(jī)互動(dòng)數(shù)據(jù)等,以及背后巨量的個(gè)體參數(shù),包括但不限于聲音、語(yǔ)言、思維模式和學(xué)習(xí)習(xí)慣等,一旦被GPT 自動(dòng)收集并分析上述敏感信息,既有可能侵害個(gè)人隱私,又很有可能被敵視我國(guó)的國(guó)家所掌握,存在一定的隱患風(fēng)險(xiǎn)[13]29。 二是意識(shí)形態(tài)風(fēng)險(xiǎn)。 LLM 技術(shù)領(lǐng)先的某些西方霸權(quán)國(guó)家,有可能利用其LLM 在中國(guó)高等教育中的大規(guī)模應(yīng)用,針對(duì)我國(guó)進(jìn)行潛移默化的意識(shí)形態(tài)滲透和制度破壞,這種隱蔽的、持續(xù)性的輸出可能會(huì)影響師生,特別是青年學(xué)生的政治判斷和選擇。 三是技術(shù)依賴風(fēng)險(xiǎn)。 目前,幾款主流的LLM 都是由美國(guó)公司開發(fā),美國(guó)又在算力、算法、芯片等關(guān)鍵領(lǐng)域擁有較大優(yōu)勢(shì),在中美科技競(jìng)爭(zhēng)的背景下,LLM 在高等教育領(lǐng)域的應(yīng)用,很可能加劇我國(guó)對(duì)美國(guó)的依賴,從而對(duì)我國(guó)高教安全和獨(dú)立自主發(fā)展構(gòu)成嚴(yán)重影響。
第二,LLM 的使用可能帶來(lái)新的高等教育“智能鴻溝”。 雖然教育信息化、教育資源數(shù)字化建設(shè)在我國(guó)高等教育中的發(fā)展和應(yīng)用已經(jīng)有十余年時(shí)間?,但是仍存在區(qū)域之間、城鄉(xiāng)之間、不同層級(jí)學(xué)校之間和家庭之間等多維度的發(fā)展不平衡:東、中、西部在互聯(lián)網(wǎng)基礎(chǔ)設(shè)施與數(shù)字化學(xué)習(xí)資源方面差異明顯[14];城鄉(xiāng)學(xué)生在基本硬件條件、網(wǎng)絡(luò)條件和場(chǎng)地條件方面存在顯著差異[15],有網(wǎng)絡(luò)問(wèn)題的農(nóng)村學(xué)生比例達(dá)37.63%,高于城鎮(zhèn)學(xué)生[16];一項(xiàng)基于全國(guó)12 所高校學(xué)生的調(diào)查表明,相對(duì)于重點(diǎn)大學(xué)的本科生,普通院校本科生和高職院校學(xué)生擁有互聯(lián)網(wǎng)設(shè)備的可能性要分別低82%和93%[17];中上經(jīng)濟(jì)水平家庭安裝互聯(lián)網(wǎng)的概率較劣勢(shì)家庭高出1.4 ~4.4 倍,而父親學(xué)歷是小學(xué)及以下的家庭安裝互聯(lián)網(wǎng)的概率僅為專科及以上的40%[18]。 面對(duì)即將到來(lái)的LLM,可以想見的是,上述教育“數(shù)字鴻溝”尚未彌合,新的區(qū)域、群體和家庭的教育“智能鴻溝”又會(huì)出現(xiàn),LLM 及其衍生的高等教育工具很有可能被優(yōu)先提供給有能力購(gòu)買的高?;蛑攸c(diǎn)院校,但我們需要確保這些工具也會(huì)被提供給全國(guó)各類型、各層次的高校使用。 但是這個(gè)美好的均等化愿景的實(shí)現(xiàn)并不樂(lè)觀。
第三,LLM 存在被少數(shù)大企業(yè)高度壟斷的極大可能性。 LLM 的開發(fā)和不斷更新,需要持續(xù)的巨大算力的投入,這背后又是巨大的資金和智力投入,一般企業(yè)難以企及?。 而一旦被少數(shù)企業(yè)掌握,勢(shì)必導(dǎo)致寡頭壟斷。 那么,一旦個(gè)別企業(yè)掌握這種超級(jí)生產(chǎn)力,對(duì)整個(gè)行業(yè)的生態(tài)將造成什么樣的影響? 對(duì)高等教育管理者、高校教師和學(xué)生將產(chǎn)生什么樣的影響? 如果上述問(wèn)題處理不當(dāng),不僅會(huì)對(duì)LLM 的使用者產(chǎn)生不良影響,也會(huì)影響LLM 及其相關(guān)應(yīng)用的使用和推廣,最終反噬少數(shù)壟斷企業(yè)。
第一,開發(fā)自身的LLM。 面對(duì)上述數(shù)據(jù)安全、意識(shí)形態(tài)、技術(shù)依賴等方面的風(fēng)險(xiǎn),根本性方法是要發(fā)展中國(guó)自己的LLM 及其在高等教育領(lǐng)域的拓展應(yīng)用和軟件。 只有擁有國(guó)產(chǎn)自主可控的LLM,才能既保證我國(guó)享有LLM 及其拓展應(yīng)用帶來(lái)的各項(xiàng)便利,又能規(guī)避被人卡脖子以及風(fēng)險(xiǎn)不可控等問(wèn)題[13]33。 這就需要我們用好市場(chǎng)和國(guó)家兩種力量,以市場(chǎng)力量為核心,適當(dāng)發(fā)揮科技攻關(guān)舉國(guó)體制的作用,加快開發(fā)中國(guó)的LLM。 進(jìn)一步,高等教育主管部門應(yīng)主動(dòng)加強(qiáng)與LLM 類公司的深度合作,開展聯(lián)合研發(fā),并開發(fā)適配高等教育場(chǎng)景,具備對(duì)話輔導(dǎo)、技能訓(xùn)練、講授演示、協(xié)同創(chuàng)作、交互評(píng)價(jià)等功能的LLM 應(yīng)用軟件或插件。 實(shí)際上,我國(guó)已經(jīng)具備研發(fā)LLM 的技術(shù)基礎(chǔ)和智力儲(chǔ)備,在全球人工智能高等院校排名中,我國(guó)的清華大學(xué)、北京大學(xué)位居第二、三位。 同時(shí),中國(guó)企業(yè)在人工智能領(lǐng)域也取得了較好的成績(jī),Gartner公布的人工智能報(bào)告中,有三家企業(yè)(阿里巴巴、百度、騰訊)進(jìn)入前十名[13]34。 未來(lái),即使是我國(guó)的LLM 成功開發(fā)并在高等教育領(lǐng)域大規(guī)模應(yīng)用,也需要高度關(guān)注數(shù)據(jù)安全問(wèn)題。
第二,多措并舉促進(jìn)LLM 均等化可達(dá)并使用。 在LLM 的研發(fā)階段,就需要將LLM 在不同的數(shù)據(jù)集和語(yǔ)料庫(kù)上進(jìn)行訓(xùn)練,確保其不含城鄉(xiāng)、區(qū)域、民族、群體等方面的偏見。 在基于LLM 的高等教育課程開發(fā)、師資培訓(xùn)、推廣應(yīng)用階段,可設(shè)立專門的教學(xué)改革研究項(xiàng)目,劃撥專項(xiàng)教育經(jīng)費(fèi),向中西部高校、地方高校進(jìn)行傾斜性支持。 如此,數(shù)字鴻溝和智能鴻溝才有可能逐漸彌合,來(lái)自農(nóng)村地區(qū)、廣大中西部地區(qū)、偏遠(yuǎn)地區(qū)、低收入家庭的學(xué)生才不會(huì)掉隊(duì)。
第三,提升教師數(shù)字教學(xué)素養(yǎng)和學(xué)生數(shù)字學(xué)習(xí)能力。 教師數(shù)字素養(yǎng)是指教師適當(dāng)利用數(shù)字技術(shù)獲取、加工、使用、管理和評(píng)價(jià)數(shù)字信息和資源,發(fā)現(xiàn)、分析和解決教育教學(xué)問(wèn)題,優(yōu)化、創(chuàng)新和變革教育教學(xué)活動(dòng)而具有的意識(shí)、能力和責(zé)任[19]。提升高校教師數(shù)字素養(yǎng)需重點(diǎn)圍繞高校教師的數(shù)字化意識(shí)、數(shù)字技術(shù)知識(shí)與技能、數(shù)字化應(yīng)用、數(shù)字社會(huì)責(zé)任和專業(yè)發(fā)展五方面展開培訓(xùn),并對(duì)教師運(yùn)用LLM 和相關(guān)拓展工具開展專項(xiàng)培訓(xùn),最終整體提升教師數(shù)字化教學(xué)勝任力[20]。 提升學(xué)生數(shù)字學(xué)習(xí)能力主要從三方面展開。 一是提高數(shù)字化技能。 提升學(xué)生正確、主動(dòng)運(yùn)用數(shù)字技術(shù)改進(jìn)學(xué)習(xí)的意識(shí)和能力,提升學(xué)生數(shù)字化學(xué)習(xí)力、適應(yīng)力與創(chuàng)造力。 二是營(yíng)造數(shù)字化學(xué)習(xí)氛圍。 構(gòu)建數(shù)字化、智能化學(xué)習(xí)環(huán)境,探索基于LLM、VR 的沉浸式、體驗(yàn)式學(xué)習(xí)模式,并配套建設(shè)相應(yīng)數(shù)字化教育基礎(chǔ)設(shè)施。 整合校內(nèi)外學(xué)習(xí)資源,為學(xué)生提供充分、完備、便捷的學(xué)習(xí)支持。 三是養(yǎng)成數(shù)字化責(zé)任規(guī)范。 加強(qiáng)學(xué)生信息道德、網(wǎng)絡(luò)誠(chéng)信、數(shù)據(jù)倫理、數(shù)據(jù)安全教育,倡導(dǎo)并規(guī)范學(xué)生安全、合法、健康、負(fù)責(zé)地使用LLM 及其衍生工具,提高學(xué)生信息和隱私保護(hù)能力[21]43。
第四,夯實(shí)數(shù)字化教學(xué)支撐環(huán)境。 一是創(chuàng)建優(yōu)質(zhì)高效的數(shù)字化教學(xué)環(huán)境。 依循“以學(xué)生發(fā)展為中心”的原則,創(chuàng)建高質(zhì)量、可觸及的數(shù)字化教學(xué)和研學(xué)的環(huán)境空間。 既要建設(shè)新的基于智能信息技術(shù)的多元教學(xué)場(chǎng)域[22],更要充分挖掘各高校原有數(shù)字化平臺(tái)和學(xué)習(xí)空間的潛力,并適當(dāng)進(jìn)行更新改造,促進(jìn)服務(wù)育人全過(guò)程的數(shù)字化轉(zhuǎn)變,實(shí)現(xiàn)數(shù)字化教學(xué)應(yīng)用常態(tài)化。 二是構(gòu)建多網(wǎng)融合的高校新基建。 構(gòu)建高速率、大容量、高效率的高校骨干網(wǎng)絡(luò),推進(jìn)以IPv6、WIFI6 和5G 等為基礎(chǔ)的“多網(wǎng)融合”的校園基礎(chǔ)網(wǎng)絡(luò)教學(xué)環(huán)境建設(shè)。 進(jìn)一步整合全校計(jì)算資源、存儲(chǔ)資源,推進(jìn)綠色、集約的教育系統(tǒng)數(shù)據(jù)中心建設(shè)和多云模式。 三是提高教學(xué)數(shù)據(jù)治理水平。 各高校要運(yùn)用云計(jì)算、大數(shù)據(jù)、LLM 等新技術(shù),為高校教師、行政管理人員和決策者提供及時(shí)、全面、精準(zhǔn)的數(shù)據(jù)支持。 將教學(xué)數(shù)據(jù)與LLM 及其拓展應(yīng)用充分對(duì)接,實(shí)現(xiàn)相互打通的教學(xué)數(shù)據(jù)在高校教學(xué)和育人各環(huán)節(jié)的充分有效應(yīng)用,推進(jìn)數(shù)據(jù)、教學(xué)和個(gè)性化培養(yǎng)的深度融合[21]45。
雖然LLM 在高等教育領(lǐng)域的應(yīng)用作為一項(xiàng)通用技術(shù),尚處于點(diǎn)解決方案和一定的應(yīng)用解決方案的階段。 但是,新紀(jì)元的大門已經(jīng)打開了一條縫隙,隨著機(jī)器學(xué)習(xí)和超強(qiáng)計(jì)算能力的飛速發(fā)展,通用人工智能正在成為現(xiàn)實(shí)。 面對(duì)這種形勢(shì),信息時(shí)代、智能時(shí)代的高校應(yīng)積極擁抱AI、LLM等智能技術(shù),高等教育主管部門也十分有必要根據(jù)中國(guó)式現(xiàn)代化對(duì)高等教育的發(fā)展需要、世界高等教育的發(fā)展趨勢(shì)和中國(guó)高校的實(shí)際發(fā)展情況,進(jìn)一步謀劃發(fā)展我國(guó)自身的LLM 及其在高教領(lǐng)域的應(yīng)用,開展相關(guān)教學(xué)體系重構(gòu)、硬件建設(shè)、師資培訓(xùn)、風(fēng)險(xiǎn)防范等系統(tǒng)性工作。 唯有如此,我們才能以LLM 賦能高等教育不斷創(chuàng)新升級(jí),培養(yǎng)更具有問(wèn)題意識(shí)、學(xué)習(xí)能力、協(xié)作能力、創(chuàng)新能力的,堪當(dāng)推進(jìn)中國(guó)式現(xiàn)代化重任的卓越人才。
注釋:
①“橫空出世”這個(gè)詞并不準(zhǔn)確,早在2017 年,A.Vaswani 等人發(fā)表了Attention is All you Need,就推出了一個(gè)超越RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))的新型神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),即Transformer。 之后的兩年里,機(jī)器學(xué)習(xí)領(lǐng)域的從業(yè)者們?cè)赥ransformer 的基礎(chǔ)上提出了一系列具有里程碑意義的模型,包括GPT、BERT、GPT-2 等及其改進(jìn)版,如ChatGPT、GPT-4 等。 這些模型把機(jī)器處理文本的能力提升到了前所未有的高度,因此很快被產(chǎn)業(yè)界接受并得到了廣泛引用。
②另一項(xiàng)是1980 年出現(xiàn)的圖形用戶界面,是包括Windows 在內(nèi)的所有現(xiàn)代操作系統(tǒng)的前身。
③衡量某個(gè)行業(yè)受GPT 影響的水平是Exposure 指標(biāo),衡量的是在保證完成質(zhì)量相同的情況下,GPT 是否能夠?qū)⑼瓿晒ぷ骱腿蝿?wù)的時(shí)間縮短至少50%以上。 具體可參見http:/ /openai.com/research/gpts-are-gpts/.
④這比它的上一代GPT-3.5 中包含的1 750 億個(gè)參數(shù)整整多了一個(gè)數(shù)量級(jí)。
⑤無(wú)監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)是兩種流行神經(jīng)算法網(wǎng)絡(luò),另外一種是監(jiān)督學(xué)習(xí)。 監(jiān)督學(xué)習(xí)需要標(biāo)注素材,無(wú)監(jiān)督學(xué)習(xí)不需要標(biāo)注素材,強(qiáng)化學(xué)習(xí)是在動(dòng)態(tài)環(huán)境中開展,AI 每執(zhí)行一步都要獲得反饋的學(xué)習(xí)。
⑥分布式訓(xùn)練具有極強(qiáng)的擴(kuò)展性,允許更大的模型在更大的數(shù)據(jù)上進(jìn)行更久的訓(xùn)練。 這種訓(xùn)練需要大量的計(jì)算資源和存儲(chǔ)資源來(lái)支持,因此其訓(xùn)練成本高達(dá)1 200 萬(wàn)美元。
⑦GPT-4 使用更多樣化和更大的1PB 數(shù)據(jù)集,而GPT-3 使用較小的45TB 的文本數(shù)據(jù)集。
⑧在多模態(tài)技術(shù)出現(xiàn)之前,AI 模型只能專注于單一領(lǐng)域,例如自然語(yǔ)言處理或計(jì)算機(jī)視覺等,多模態(tài)技術(shù)出現(xiàn)后,模型已經(jīng)從單一的自然語(yǔ)言處理和機(jī)器視覺發(fā)展成自動(dòng)生成圖畫、圖像文字、音視頻等多模態(tài)內(nèi)容,極大地推動(dòng)了AIGC(AI generated content,翻譯為“生成式AI”,即利用人工智能技術(shù)來(lái)生成內(nèi)容的一種新型技術(shù))的內(nèi)容多樣性和通用性。
⑨即給出少量的任務(wù)示例,大型語(yǔ)言模型從給定情境中學(xué)習(xí)并解決新任務(wù)。
⑩例如AI 繪畫從輸入圖像或者文字得到圖像,PalM-E 同時(shí)處理視覺、語(yǔ)言和傳感器,極可能應(yīng)用到工業(yè)生產(chǎn)中。 PalM-E 是由谷歌與柏林工業(yè)大學(xué)的人工智能研究小組,于2023 年3 月推出的一個(gè)多模態(tài)具象化視覺語(yǔ)言模型(VLM),取名為PaLME,該模型的參數(shù)規(guī)模達(dá)到了5 620 億個(gè)。
?OpenAI 公司開發(fā)的最新一代GPT-4,可以實(shí)現(xiàn)文字(上限為25 000 字)和圖片的單獨(dú)或混合輸入,文本輸出(含自然語(yǔ)言、代碼)。
?這里的創(chuàng)作是廣義的,包括論文、研究報(bào)告、讀書筆記、程序代碼編寫、活動(dòng)方案設(shè)計(jì)等多種形式。 學(xué)生向LLM 陳述題目或主題、內(nèi)容要件、編程需求、制作說(shuō)明等任務(wù)要求,LLM 會(huì)生成初始版本(或者方案),學(xué)生進(jìn)一步向LLM 提出修改要求,LLM給出新版本,……在多輪迭代后,生成一個(gè)作品或者方案。 正是這一點(diǎn)讓廣大教師頭疼不已,卻讓一些學(xué)生歡欣鼓舞。 因?yàn)榻處熀凸芾碚邿o(wú)法判斷這個(gè)過(guò)程中學(xué)生和LLM 各發(fā)揮了多少作用,所以已經(jīng)有部分高校和學(xué)術(shù)期刊明確表態(tài)禁止使用LLM參與作業(yè)和學(xué)術(shù)創(chuàng)作。
?API(Application Programming Interface,應(yīng)用程序編程接口)是一些預(yù)先定義的函數(shù),目的是提供應(yīng)用程序與開發(fā)人員基于某軟件或硬件的以訪問(wèn)一組例程的能力,而又無(wú)需訪問(wèn)源碼,或理解內(nèi)部工作機(jī)制的細(xì)節(jié)。
?2018 年4 月,教育部實(shí)施《教育信息化2.0 行動(dòng)計(jì)劃》,明確到2022 年基本實(shí)現(xiàn)“三全兩高一大”的發(fā)展目標(biāo)。 隨后,教育部等部門相繼出臺(tái)《高等學(xué)校人工智能創(chuàng)新行動(dòng)計(jì)劃》《教育部關(guān)于實(shí)施全國(guó)中小學(xué)教師信息技術(shù)應(yīng)用能力提升工程2.0 的意見》《教育部等十一部門關(guān)于促進(jìn)在線教育健康發(fā)展的指導(dǎo)意見》,全面提升教育信息化能力。
?根據(jù)國(guó)盛證券計(jì)算機(jī)分析師劉高暢、楊然發(fā)布的報(bào)告《ChatG-PT,需要多少算力》(2023-02-12)中估算,GPT-3 訓(xùn)練一次的成本約為140 萬(wàn)美元,對(duì)于一些更大的LLM 模型,訓(xùn)練成本介于200 萬(wàn)~1 200 萬(wàn)美元之間。 2023 年1 月,平均每天約有1 300萬(wàn)獨(dú)立訪客使用ChatGPT,對(duì)應(yīng)芯片需求為3 萬(wàn)多片英偉達(dá)A100GPU,初始投入成本約為8 億美元,每日電費(fèi)在5 萬(wàn)美元左右。