人工智能教育大腦模型構(gòu)建及實(shí)踐路徑

2022-08-03 03:02:10郭勝男吳永和

開放教育研究 2022年4期

郭勝男吳永和張治

（1.華東師范大學(xué) 教育學(xué)部教育信息技術(shù)學(xué)系，上海 200062；2.上海市寶山區(qū)教育局，上海 201999）

一、問題提出

人工智能技術(shù)發(fā)揮作用的三要素為數(shù)據(jù)、算法和算力。正如人工智能專家周志華（2020）所言，“今天的人工智能熱潮是由于機(jī)器學(xué)習(xí)，尤其是深度學(xué)習(xí)技術(shù)在大數(shù)據(jù)、大算力的支持下發(fā)揮出了巨大威力”。這些均需建立在數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全及算法合乎倫理的基礎(chǔ)上，因此，如何進(jìn)行有效的教育數(shù)據(jù)治理成為教育數(shù)字化轉(zhuǎn)型的必經(jīng)之路。人工智能教育大腦系統(tǒng)整合了教育數(shù)據(jù)、智能算法和算力資源，以保證最大限度地挖掘大數(shù)據(jù)的潛在價(jià)值，為教育數(shù)據(jù)精準(zhǔn)治理提供新路向。

“智能大腦”最早由雷·庫(kù)茲韋爾（Ray Kurzweil）提出，指借助海量數(shù)據(jù)和算法，模擬人腦思考和判斷（何懷宏，2018）。之后在城市治理領(lǐng)域，有研究者提出城市大腦概念，指在互聯(lián)網(wǎng)大腦架構(gòu)的基礎(chǔ)上，以云神經(jīng)網(wǎng)絡(luò)和云反射弧為建設(shè)重點(diǎn)，為解決城市治理難題提供全新工具（胡堅(jiān)波，2021）。在教育領(lǐng)域，顧小清等（2021）以“人工智能教育大腦”為隱喻，將智能技術(shù)與教育融合，致力于解決高等教育數(shù)據(jù)治理和教學(xué)創(chuàng)新問題。張治等（2022）將人工智能本質(zhì)和人腦特質(zhì)結(jié)合，構(gòu)建教育大腦生態(tài)架構(gòu)，強(qiáng)調(diào)基于人工智能的教育大腦是實(shí)現(xiàn)教育數(shù)字化轉(zhuǎn)型的關(guān)鍵基礎(chǔ)設(shè)施。由此可見，人工智能等新一代信息技術(shù)支撐的“教育大腦”具備規(guī)范化整合數(shù)據(jù)資源和算法模型、提高數(shù)據(jù)質(zhì)量和保障隱私安全的強(qiáng)大能力。

數(shù)據(jù)作為新的生產(chǎn)要素，在滲入教育治理結(jié)構(gòu)時(shí)，必然會(huì)引發(fā)一系列新的問題，如數(shù)據(jù)質(zhì)量參差不齊、隱私泄露、算法失衡。現(xiàn)階段教育領(lǐng)域尚缺乏有效的教育數(shù)據(jù)治理方案。為了提高教育數(shù)據(jù)質(zhì)量，保障算法安全，打破數(shù)據(jù)孤島之間的壁壘，充分挖掘教育大數(shù)據(jù)的潛在價(jià)值，教育治理亟需更寬廣的視野和更強(qiáng)大、靈敏的治理工具。本研究遵循“問題解構(gòu)→方法模型→實(shí)踐路徑”的邏輯思路，在解構(gòu)教育數(shù)據(jù)治理的內(nèi)涵、困境及成因的基礎(chǔ)上，構(gòu)建人工智能教育大腦模型，提出教育大腦賦能教育數(shù)據(jù)治理的實(shí)踐路徑。

二、概念闡釋、困境與成因

（一）概念闡釋

數(shù)據(jù)治理（data governance）是數(shù)字化技術(shù)和治理理論融合形成的新概念，學(xué)界尚未給出統(tǒng)一的定義。國(guó)際數(shù)據(jù)管理協(xié)會(huì)（DAMA International，2009）認(rèn)為，數(shù)據(jù)治理指在管理和使用層面對(duì)數(shù)據(jù)進(jìn)行規(guī)劃、監(jiān)督和控制。國(guó)際著名數(shù)據(jù)治理專家桑尼爾·索瑞斯（2014）認(rèn)為數(shù)據(jù)治理是制定與大數(shù)據(jù)相關(guān)的數(shù)據(jù)優(yōu)化、隱私保護(hù)與數(shù)據(jù)變現(xiàn)等政策。國(guó)內(nèi)學(xué)者梁芷銘（2015）認(rèn)為數(shù)據(jù)治理是為了應(yīng)對(duì)大數(shù)據(jù)帶來(lái)的種種不安、困難與威脅，運(yùn)用技術(shù)工具對(duì)大數(shù)據(jù)進(jìn)行管理、整合、分析并挖掘其價(jià)值的行為。有學(xué)者將數(shù)據(jù)治理等同于數(shù)據(jù)管理，認(rèn)為二者均指采取必要的步驟、度量和策略管理數(shù)據(jù)的整個(gè)生命周期，涉及數(shù)據(jù)識(shí)別、收集、準(zhǔn)備、組織、分類、處理、分析、存儲(chǔ)、發(fā)布、管理和重用等（Gajbe et al., 2021）。事實(shí)上，數(shù)據(jù)治理蘊(yùn)含明確相關(guān)角色、工作職責(zé)和工作流程等含義，是過程性概念，強(qiáng)調(diào)做出哪些決策以及由誰(shuí)做出決策（Abraham et al.,2019）。數(shù)據(jù)管理是目標(biāo)性概念，強(qiáng)調(diào)決策是數(shù)據(jù)執(zhí)行的一部分。從本質(zhì)上講，數(shù)據(jù)治理是對(duì)數(shù)據(jù)管理進(jìn)程行使權(quán)利和控制，指導(dǎo)組織內(nèi)和跨組織的數(shù)據(jù)和算法整個(gè)生命周期的正常運(yùn)行，強(qiáng)調(diào)數(shù)據(jù)資產(chǎn)的價(jià)值和數(shù)據(jù)安全管控（Carretero et al., 2016）。

隨著教育信息化的發(fā)展，教育領(lǐng)域積聚了海量數(shù)據(jù)，呈現(xiàn)“大數(shù)據(jù)”形態(tài)，“教育數(shù)據(jù)治理”概念應(yīng)運(yùn)而生。教育數(shù)據(jù)治理作為嶄新的研究領(lǐng)域，其概念一直是學(xué)界討論的議題。教育數(shù)據(jù)治理涵蓋教育的數(shù)據(jù)治理和數(shù)據(jù)驅(qū)動(dòng)的教育治理兩層內(nèi)涵，數(shù)據(jù)治理為教育治理提供技術(shù)和程序，教育治理為數(shù)據(jù)治理提供目標(biāo)（劉金松,2018）。兩者交叉融合、密不可分，共同服務(wù)于教育發(fā)展需求，提升教育治理水平和治理能力。

（二）現(xiàn)實(shí)困境及成因

研究發(fā)現(xiàn)，現(xiàn)有教育治理體系與大數(shù)據(jù)算法系統(tǒng)的耦合度不高（Janssen et al., 2020），教育數(shù)據(jù)治理在數(shù)據(jù)質(zhì)量、安全風(fēng)險(xiǎn)、算法倫理等方面面臨難題，未能充分發(fā)揮大數(shù)據(jù)的價(jià)值，嚴(yán)重阻礙了教育數(shù)字化轉(zhuǎn)型的現(xiàn)代化進(jìn)程。

1.教育數(shù)據(jù)質(zhì)量不高，限制了數(shù)據(jù)價(jià)值釋放

教育大數(shù)據(jù)在科學(xué)決策、支持多樣化教學(xué)場(chǎng)景、創(chuàng)新教學(xué)服務(wù)和提升教學(xué)效率等方面蘊(yùn)含巨大的教育價(jià)值，正如徐宗本院士（2017）所言，“大數(shù)據(jù)可以帶來(lái)超凡應(yīng)用價(jià)值”。在教育領(lǐng)域，只有切實(shí)將數(shù)據(jù)應(yīng)用于解決教育發(fā)展問題，才能真正彰顯數(shù)據(jù)的價(jià)值。但實(shí)際境況與理論設(shè)想“相距甚遠(yuǎn)”，“雖然大數(shù)據(jù)在教育領(lǐng)域的熱度日趨增加，真正利用大數(shù)據(jù)解決教育問題的成功案例卻很少”（祝智庭，2017）。究其原因，數(shù)據(jù)質(zhì)量是影響數(shù)據(jù)價(jià)值發(fā)揮的重要因素。

質(zhì)量是教育數(shù)據(jù)的靈魂，是大數(shù)據(jù)發(fā)揮價(jià)值的基礎(chǔ)和保障，涉及數(shù)據(jù)規(guī)范性、準(zhǔn)確性、完備性和一致性等。在智慧教育時(shí)代，人工智能、云計(jì)算、虛擬現(xiàn)實(shí)和物聯(lián)網(wǎng)等智能技術(shù)擴(kuò)展了教學(xué)管理和實(shí)踐的時(shí)空邊界，政府部門、社會(huì)組織及各類院校等產(chǎn)生的海量數(shù)據(jù)在數(shù)據(jù)規(guī)模、結(jié)構(gòu)類型、數(shù)據(jù)收集和存儲(chǔ)工具、時(shí)效價(jià)值等方面存在很大差異，教育數(shù)據(jù)的規(guī)范性、準(zhǔn)確性、完備性、一致性等數(shù)據(jù)質(zhì)量問題疊出，導(dǎo)致難以充分發(fā)揮數(shù)據(jù)的價(jià)值。這可歸因?yàn)橐韵聨c(diǎn)：其一，各教育主體間的“煙囪效應(yīng)”。人工智能技術(shù)賦能多元化數(shù)據(jù)生產(chǎn)主體和治理主體，但各主體間因業(yè)務(wù)需求不同往往“各自為政”，未能形成統(tǒng)一的數(shù)據(jù)規(guī)范標(biāo)準(zhǔn)。在這種“煙囪式”治理模式下，數(shù)據(jù)冗余、數(shù)據(jù)片面、死數(shù)據(jù)等問題頻出，導(dǎo)致教育決策科學(xué)性不高。其二，學(xué)習(xí)分析技術(shù)與數(shù)據(jù)之間的“弱耦合性”。區(qū)別于一般大數(shù)據(jù)，教育大數(shù)據(jù)是在教育場(chǎng)景中產(chǎn)生的數(shù)據(jù)，結(jié)構(gòu)多樣（結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化），模態(tài)豐富（行為、生理、心理），格式繁雜（視頻、音頻、文本、平臺(tái)日志、生物傳感）（吳永和等，2021），現(xiàn)有學(xué)習(xí)分析技術(shù)難以捕獲數(shù)據(jù)之間的關(guān)聯(lián)性和一致性。此外，高效的學(xué)習(xí)分析工具推廣不易，如果沒有利益相關(guān)者的批準(zhǔn)和監(jiān)管，高效的學(xué)習(xí)分析技術(shù)不會(huì)被教育系統(tǒng)采納。可見，學(xué)習(xí)分析技術(shù)與數(shù)據(jù)之間的“弱耦合”極大地限制了數(shù)據(jù)價(jià)值釋放。其三，從技術(shù)角度看，機(jī)器學(xué)習(xí)算法偏好“好數(shù)據(jù)”。教育領(lǐng)域可視為數(shù)據(jù)驅(qū)動(dòng)下的智能算法的運(yùn)行場(chǎng)域（趙磊磊等，2021）。流行的機(jī)器學(xué)習(xí)算法，如K-最近鄰（KNN）、樸素貝葉斯（NB）、支持向量機(jī)（SVM）和深度學(xué)習(xí)等對(duì)特征空間的變化非常敏感，高質(zhì)量的訓(xùn)練數(shù)據(jù)集才能形成高性能的特征向量，進(jìn)而將機(jī)器學(xué)習(xí)算法訓(xùn)練成“好”的模型（Singh et al., 2022）。然而，教育實(shí)踐中通常存在降低數(shù)據(jù)質(zhì)量的因素，如噪聲、缺失值、數(shù)據(jù)不一致或異常值等，嚴(yán)重影響機(jī)器學(xué)習(xí)算法的學(xué)習(xí)性能，造成模型訓(xùn)練數(shù)據(jù)的欠擬合或過擬合，進(jìn)而導(dǎo)致決策失誤。

2.開放共享程度擴(kuò)大，加劇數(shù)據(jù)安全風(fēng)險(xiǎn)

2017年，國(guó)務(wù)院印發(fā)《國(guó)家教育事業(yè)發(fā)展“十三五”規(guī)劃》指出，要加快推進(jìn)教育大數(shù)據(jù)建設(shè)與開放共享，形成教育數(shù)據(jù)資源開放共享機(jī)制（教育部，2017）。人工智能時(shí)代，教育系統(tǒng)內(nèi)部自組織、自生產(chǎn)形成的“熵減”現(xiàn)象和自我加強(qiáng)的“馬太效應(yīng)”均蘊(yùn)含著教育數(shù)據(jù)開放共享的迫切訴求。開放共享對(duì)數(shù)據(jù)資源的快速流轉(zhuǎn)與價(jià)值挖掘至關(guān)重要（陳雅云等，2021）。擴(kuò)大教育數(shù)據(jù)的開放共享空間有利于促進(jìn)教育數(shù)據(jù)的整合、流轉(zhuǎn)，打破各教育子系統(tǒng)之間的數(shù)據(jù)壁壘，提升數(shù)據(jù)的應(yīng)用價(jià)值，形成相互支持的產(chǎn)業(yè)鏈。

移動(dòng)互聯(lián)網(wǎng)、區(qū)塊鏈、邊緣計(jì)算、人工智能等技術(shù)深度發(fā)展，各教育系統(tǒng)、平臺(tái)和信息門戶等的加強(qiáng)，為教育數(shù)據(jù)的開放和共享提供了強(qiáng)有力的技術(shù)支撐，開放數(shù)據(jù)獲取、傳輸、存儲(chǔ)、處理和應(yīng)用的力度不斷增強(qiáng)。在此過程中，數(shù)據(jù)泄露和數(shù)據(jù)破壞等數(shù)據(jù)安全風(fēng)險(xiǎn)問題不可忽視。一方面，教師、學(xué)生等數(shù)據(jù)生產(chǎn)者的隱私泄露風(fēng)險(xiǎn)加大。從宏觀上看，數(shù)據(jù)的開放共享具有高度復(fù)雜性和系統(tǒng)性，涉及各利益相關(guān)者的隱私。隨著數(shù)據(jù)開放共享力度的提升，學(xué)校、教師、學(xué)生等數(shù)據(jù)提供者的隱私空間被嚴(yán)重壓縮（田賢鵬，2020）。從技術(shù)視角看，學(xué)習(xí)分析系統(tǒng)的設(shè)計(jì)未能完全保證師生的隱私安全。隨著數(shù)據(jù)資源更加多模態(tài)，學(xué)習(xí)分析工具更加移動(dòng)，原本無(wú)法追蹤、統(tǒng)計(jì)和檢索的蹤跡變得有跡可循，隱私侵犯現(xiàn)象變得普遍。另一方面，數(shù)據(jù)在共享過程中被破壞的風(fēng)險(xiǎn)增大。其一，開放共享為不法之徒竊取、篡改、濫用數(shù)據(jù)提供了可能，尤其是一些教育機(jī)構(gòu)為了利益竊取開放共享的數(shù)據(jù)以換取商業(yè)報(bào)酬。其二，數(shù)據(jù)在傳輸和交換過程中會(huì)丟失。教育系統(tǒng)各組織間數(shù)字媒介和數(shù)據(jù)維度等不一致，使得數(shù)據(jù)在交換過程中易丟失或損壞，造成數(shù)據(jù)缺失或不完整?？偠灾瑪?shù)據(jù)安全治理是教育數(shù)據(jù)開放和共享過程中不可或缺的重要環(huán)節(jié)，也是教育數(shù)據(jù)治理亟需解決的核心問題。

3.人工智能技術(shù)帶來(lái)算法失衡風(fēng)險(xiǎn)

人工智能時(shí)代是一個(gè)讓數(shù)據(jù)“開口說(shuō)話”的時(shí)代，數(shù)據(jù)和算法是人工智能技術(shù)發(fā)揮作用的重要基石?！叭绻f(shuō)大數(shù)據(jù)是信息時(shí)代的石油，那么算法就是從中提煉衍生產(chǎn)品的煉油廠”（肖鳳翔等，2020）。大數(shù)據(jù)為算法提供底層支撐，算法從大數(shù)據(jù)中提煉知識(shí)和信息，可見，算法優(yōu)劣嚴(yán)重影響數(shù)據(jù)治理的效能。然而，隨著智慧學(xué)習(xí)、智慧課堂等人工智能新應(yīng)用的出現(xiàn)，算法在教育實(shí)踐中不可避免地遇到諸多困境，如算法失靈、算法偏好、算法濫用，給教育實(shí)踐帶來(lái)了不可預(yù)估的風(fēng)險(xiǎn)，嚴(yán)重限制了教育數(shù)據(jù)治理效能的發(fā)揮。

首先，機(jī)器學(xué)習(xí)算法在為數(shù)據(jù)治理提供強(qiáng)大算力的同時(shí)，其應(yīng)用存在算法失靈的風(fēng)險(xiǎn)，具體表現(xiàn)為算法運(yùn)行失序，背離教育德性倫理或者不利于教育正向發(fā)展。教育領(lǐng)域算法大多移植于其他領(lǐng)域，這些算法的數(shù)理邏輯并不完全適用于教育系統(tǒng)的技術(shù)架構(gòu)和教育邏輯，無(wú)法完全滿足教育的實(shí)際需求，有的會(huì)背離以“人的發(fā)展”為核心的目標(biāo)。其次，算法偏好風(fēng)險(xiǎn)?！霸俸玫乃惴ㄒ膊荒芡昝婪从晨陀^實(shí)在，其中必然存在諸多偏差與偏見”（譚維智，2019）。教育領(lǐng)域的算法應(yīng)用是將教育現(xiàn)象抽象成數(shù)據(jù)進(jìn)行表征，其中的程序設(shè)計(jì)和計(jì)算邏輯是人為設(shè)計(jì)的，不可避免存在偏見，從而導(dǎo)致算法結(jié)果出現(xiàn)偏差。機(jī)器學(xué)習(xí)算法以教育數(shù)據(jù)為支撐進(jìn)行模擬和診斷，診斷的準(zhǔn)確性往往與數(shù)據(jù)質(zhì)量相關(guān)，偏好“好數(shù)據(jù)”，造成“繭房效應(yīng)”。最后，算法的誤用和濫用風(fēng)險(xiǎn)。從教育實(shí)踐者的視角看，算法分析過程是個(gè)“黑匣子”，“知其然而不知其所以然”，這無(wú)疑增加了算法使用的盲目性，無(wú)法針對(duì)性地服務(wù)于教育教學(xué)。算法的濫用還模糊了公共領(lǐng)域和個(gè)人隱私邊界，可能侵犯師生的正當(dāng)權(quán)益。

三、模型構(gòu)建

數(shù)據(jù)質(zhì)量、安全風(fēng)險(xiǎn)和算法倫理是教育數(shù)據(jù)治理亟需解決的難題。人工智能教育大腦本質(zhì)上是類腦復(fù)雜教育系統(tǒng)，面對(duì)系統(tǒng)性和功能性如此復(fù)雜的教育大腦，本研究從結(jié)構(gòu)模型、輕量級(jí)信息模型和核心模塊三方面剖析人工智能教育大腦的整體結(jié)構(gòu)、信息流轉(zhuǎn)調(diào)度及核心功能，為教育數(shù)據(jù)治理實(shí)踐提供支架。

（一）人工智能教育大腦結(jié)構(gòu)模型

任何時(shí)期的教育變革都離不開物質(zhì)技術(shù)基礎(chǔ)的支持，新一代信息技術(shù)驅(qū)動(dòng)的教育新基建是支持教育大腦運(yùn)轉(zhuǎn)的“基石”和“底座”（見圖1）。教育大腦的底層支撐技術(shù)以人工智能為核心，通過與物聯(lián)網(wǎng)、5G、云計(jì)算、邊緣計(jì)算、大數(shù)據(jù)、數(shù)字孿生等新技術(shù)的疊加，為教育提供了一套全新的基礎(chǔ)設(shè)施——教育新基建。從功能性結(jié)構(gòu)來(lái)看，教育新基建主要包括信息基礎(chǔ)設(shè)施、融合基礎(chǔ)設(shè)施和創(chuàng)新基礎(chǔ)設(shè)施（祝智庭等，2022）。其中，信息基礎(chǔ)設(shè)施可細(xì)化為網(wǎng)絡(luò)通訊基礎(chǔ)設(shè)施、新技術(shù)基礎(chǔ)設(shè)施（如區(qū)塊鏈、數(shù)字孿生）和計(jì)算基礎(chǔ)設(shè)施。融合基礎(chǔ)設(shè)施指?jìng)鹘y(tǒng)教育基礎(chǔ)設(shè)施在人工智能等技術(shù)加持下形成的集時(shí)空、虛實(shí)環(huán)境于一體的融合型基礎(chǔ)設(shè)施。創(chuàng)新基礎(chǔ)設(shè)施指支持科技創(chuàng)新的基礎(chǔ)設(shè)施，可不斷為教育數(shù)字化轉(zhuǎn)型提供新型工具。

圖1 教育大腦結(jié)構(gòu)模型

正如城市神經(jīng)元網(wǎng)絡(luò)和云反射弧是城市大腦建設(shè)的重點(diǎn)內(nèi)容，教育神經(jīng)元網(wǎng)絡(luò)和教育云反射弧是教育大腦結(jié)構(gòu)的核心內(nèi)容。神經(jīng)元是教育神經(jīng)網(wǎng)絡(luò)的基本單元，每個(gè)神經(jīng)元代表具備一定數(shù)據(jù)收集、存儲(chǔ)、分析和決策功能的教育子系統(tǒng)。它從層級(jí)上可分為校級(jí)神經(jīng)元、區(qū)/縣級(jí)神經(jīng)元和市級(jí)神經(jīng)元，每個(gè)神經(jīng)元按照一定的功能標(biāo)準(zhǔn)和安全標(biāo)準(zhǔn)相互聯(lián)通、資源共享，形成教育神經(jīng)元網(wǎng)絡(luò)，為教育云反射弧提供統(tǒng)一的運(yùn)轉(zhuǎn)基礎(chǔ)。每條通過技術(shù)聯(lián)通的教育神經(jīng)元之間的鏈條通路便是一條教育云反射弧，對(duì)應(yīng)不同教育需求，包括個(gè)體級(jí)需求、學(xué)科級(jí)需求和管理級(jí)需求。

（二）輕量級(jí)教育大腦信息模型

教育大腦本質(zhì)上是一個(gè)類腦復(fù)雜智能教育系統(tǒng)，將大量的教育系統(tǒng)、子系統(tǒng)和平臺(tái)等神經(jīng)元鏈接起來(lái)，涉及眾多的復(fù)雜技術(shù)和因素。為了明晰教育大腦內(nèi)部的數(shù)據(jù)流轉(zhuǎn)和信息安全調(diào)度，本研究分別針對(duì)學(xué)生成長(zhǎng)管理、面向特定學(xué)科的自適應(yīng)學(xué)習(xí)管理和線上線下融合智慧教育模式的需求，構(gòu)建輕量級(jí)教育大腦信息模型（見圖2），以厘清數(shù)據(jù)和算法有效治理的交互機(jī)制。

圖2 輕量級(jí)教育大腦信息模型

教育大腦作為互聯(lián)網(wǎng)大腦的進(jìn)化產(chǎn)物，其構(gòu)建初衷是解決教育領(lǐng)域的重難點(diǎn)問題，響應(yīng)教育需求。輕量級(jí)教育大腦信息模型包括教育神經(jīng)元網(wǎng)絡(luò)、數(shù)據(jù)湖、數(shù)據(jù)倉(cāng)庫(kù)、智能處理器和智能服務(wù)等模塊，遵循“問題驅(qū)動(dòng)→數(shù)據(jù)輸入→數(shù)據(jù)共享→數(shù)據(jù)分析→數(shù)據(jù)服務(wù)→需求響應(yīng)”的邏輯，通過模擬生物的反射弧結(jié)構(gòu)，深度挖掘教育數(shù)據(jù)的潛藏價(jià)值，對(duì)教育問題或需求進(jìn)行及時(shí)且智能化的反饋。教育神經(jīng)元網(wǎng)絡(luò)由無(wú)數(shù)個(gè)相互聯(lián)結(jié)的教育神經(jīng)元構(gòu)成，每個(gè)教育神經(jīng)元信息由教育內(nèi)容、數(shù)據(jù)來(lái)源和數(shù)據(jù)集成規(guī)則等構(gòu)成。教育內(nèi)容可借助普適設(shè)備（如平板電腦等）、多模態(tài)傳感器、平臺(tái)日志、問卷和訪談等方式收集視頻、語(yǔ)音、文本、生物傳感等多模態(tài)數(shù)據(jù)（吳永和等，2021）。每個(gè)教育問題對(duì)應(yīng)的云反射弧均需要匯聚多個(gè)教育神經(jīng)元的數(shù)據(jù)，具體操作流程為：首先，將教育神經(jīng)元中產(chǎn)生的海量異構(gòu)數(shù)據(jù)像水一樣匯聚在數(shù)據(jù)湖中，數(shù)據(jù)湖以原始格式存儲(chǔ)數(shù)據(jù)，無(wú)需對(duì)數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理，保留數(shù)據(jù)之間自然形成的“血緣關(guān)系”，包括結(jié)構(gòu)化數(shù)據(jù)、半/非結(jié)構(gòu)化數(shù)據(jù)和二進(jìn)制數(shù)據(jù)（如視/音頻）；其次，教育神經(jīng)元之間的數(shù)據(jù)共享和融通嚴(yán)格遵循數(shù)據(jù)質(zhì)量、數(shù)據(jù)倫理和數(shù)據(jù)安全等規(guī)范和標(biāo)準(zhǔn)，以保障數(shù)據(jù)在開放共享過程中的質(zhì)量和安全；再次，數(shù)據(jù)共享和融通將數(shù)據(jù)按一定的規(guī)范和標(biāo)準(zhǔn)格式化處理后存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中，作為智能分析容器的數(shù)據(jù)原材料；智能分析容器是將數(shù)據(jù)原材料轉(zhuǎn)為智能服務(wù)的“工廠”，由自底向上的三部分組成，分別是底層算法/模型庫(kù)、中層算法/模型匹配器和頂層服務(wù)組件；最后，提供智能決策、智能服務(wù)推送和數(shù)據(jù)可視化等智能化服務(wù)，將反射響應(yīng)結(jié)果反饋給神經(jīng)元以完成云反射，同時(shí)響應(yīng)對(duì)應(yīng)的教育問題，實(shí)現(xiàn)教育的精準(zhǔn)化治理。

（三）教育大腦核心模塊

人工智能的發(fā)展是不斷模擬、擴(kuò)展人類智能的過程，反觀教育領(lǐng)域的現(xiàn)實(shí)境況，人工智能技術(shù)“有計(jì)算而無(wú)算計(jì)”“有智能而無(wú)智慧”“有感知而無(wú)認(rèn)知”。人工智能教育大腦要實(shí)現(xiàn)“眼觀六路、耳聽八方、融合思考”的教育發(fā)展愿景（顧小清等，2021），離不開人類群體智慧和機(jī)器群體智能的深度協(xié)作，更離不開智能算法和高質(zhì)量數(shù)據(jù)的底層支撐。具體而言，教育大腦主要包括智能分析和數(shù)據(jù)融通兩大模塊（見圖3），它們可類比為教育大腦的“左右腦”，左腦追求理解與認(rèn)知，右腦追求快速大量記憶和自動(dòng)處理機(jī)能，左右腦相互協(xié)調(diào)，提升教育大腦的“智商”和“數(shù)商”。

圖3 教育大腦的核心模塊

1.數(shù)據(jù)融通模塊

教育大腦的數(shù)據(jù)融通模塊是以數(shù)據(jù)中臺(tái)技術(shù)為架構(gòu)的數(shù)據(jù)匯聚中心，致力于實(shí)現(xiàn)教育數(shù)據(jù)的共享融通、規(guī)范統(tǒng)一和風(fēng)險(xiǎn)防范，主要功能包括：其一，基于區(qū)塊鏈、云計(jì)算和物聯(lián)網(wǎng)等技術(shù)構(gòu)建數(shù)據(jù)湖，在邏輯上聯(lián)通各神經(jīng)元以不同方式收集的多模態(tài)異構(gòu)數(shù)據(jù)，既保證數(shù)據(jù)的“進(jìn)化”和“血緣關(guān)系”可追蹤，又保障數(shù)據(jù)“物種”多樣性；其二，數(shù)據(jù)共享和流通需嚴(yán)格按照數(shù)據(jù)權(quán)限管理和風(fēng)險(xiǎn)防范制度，明確權(quán)責(zé)邊界，加強(qiáng)隱私保護(hù)，保障數(shù)據(jù)的安全流通；其三，嚴(yán)格遵循數(shù)據(jù)分類編碼標(biāo)準(zhǔn)、數(shù)據(jù)管理標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量評(píng)估標(biāo)準(zhǔn)和數(shù)據(jù)倫理標(biāo)準(zhǔn)，對(duì)數(shù)據(jù)生命周期全流程進(jìn)行規(guī)范和監(jiān)控，采用統(tǒng)一的標(biāo)準(zhǔn)化規(guī)則清洗、規(guī)范化、標(biāo)簽化數(shù)據(jù)，將滿足規(guī)則的數(shù)據(jù)存入數(shù)據(jù)倉(cāng)庫(kù)中，為后續(xù)智能分析持續(xù)提供“燃料”。顯然，數(shù)據(jù)融通模塊通過清洗、篩選、關(guān)聯(lián)多模態(tài)異構(gòu)數(shù)據(jù)，打通數(shù)據(jù)流通渠道，提升數(shù)據(jù)質(zhì)量，為教育數(shù)據(jù)的精細(xì)化治理奠定了基礎(chǔ)。

2.智能分析模塊

智能分析模塊是人工智能教育大腦的數(shù)據(jù)“加工廠”，它通過算法訓(xùn)練、情境匹配、決策服務(wù)等，充分發(fā)揮機(jī)器群體智能以挖掘教育數(shù)據(jù)的潛在價(jià)值。首先，智能分析模塊儲(chǔ)存了合理、科學(xué)、豐富的資源庫(kù)，包括算法庫(kù)、模型庫(kù)和教育情境庫(kù)。其中，人工智能模型是人工智能算法（移植的開源算法或教育領(lǐng)域的創(chuàng)新算法）根據(jù)教育情境產(chǎn)生的教育數(shù)據(jù)訓(xùn)練而得的。其次，智能時(shí)代的教育情境是多元變化的，只有在特定情境中選擇適切的人工智能算法/模型，才能提供精準(zhǔn)的決策服務(wù)。因此，智能分析模塊提供了算法集選擇器、模型集選擇器和教育情境計(jì)算器，保證教育大腦能夠自主提供適切的計(jì)算和決策服務(wù)，提升教育大腦的“智商”。再次，人工智能算法的監(jiān)管功能，通過設(shè)置算法的智能監(jiān)管組件監(jiān)督算法使用過程中的倫理問題，防止出現(xiàn)算法濫用、算法誤用和算法失靈等風(fēng)險(xiǎn)。最后，人工智能算法的創(chuàng)新功能，用于不斷迭代解決教育問題的人工智能算法，更新算法庫(kù)和模型庫(kù)，確保教育大腦的高效運(yùn)轉(zhuǎn)。

四、實(shí)踐路徑

教育數(shù)據(jù)治理是一個(gè)復(fù)雜且反復(fù)迭代的系統(tǒng)工程，目的是實(shí)現(xiàn)數(shù)據(jù)應(yīng)用價(jià)值和風(fēng)險(xiǎn)管控。本研究提出的人工智能教育大腦以新一代智能技術(shù)為基礎(chǔ)，充分整合數(shù)據(jù)、算法和算力，打通教育各部門的業(yè)務(wù)壁壘，為數(shù)據(jù)資源共享與規(guī)約整合、數(shù)據(jù)安全和隱私保障、算法“善治”、決策智能化等提供治理支架。因此，基于新一代智能技術(shù)，將智能治理的理念融入教育治理，在對(duì)數(shù)據(jù)和算法進(jìn)行治理的同時(shí)，將“冰冷”的數(shù)據(jù)和“呆板”的算法轉(zhuǎn)化為數(shù)據(jù)質(zhì)量和風(fēng)險(xiǎn)防范的“利器”，是智能時(shí)代擺脫教育數(shù)據(jù)治理困境的實(shí)踐邏輯（見圖4）。

圖4 教育大腦賦能數(shù)據(jù)治理的實(shí)踐路徑

（一）加強(qiáng)頂層設(shè)計(jì)，建立數(shù)據(jù)管理組織架構(gòu)

人工智能教育大腦為教育數(shù)據(jù)生命周期全流程提供了一系列質(zhì)量規(guī)范，如數(shù)據(jù)分類編碼、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量評(píng)估等，但我們?nèi)孕枰_展頂層設(shè)計(jì)和戰(zhàn)略規(guī)劃，建立權(quán)責(zé)明晰的數(shù)據(jù)管理組織架構(gòu)，配合教育大腦形成完備的管理體系。其一，建立科學(xué)合理的數(shù)據(jù)管理組織架構(gòu)。進(jìn)入智慧教育時(shí)代，教育數(shù)據(jù)管理模式已由“逐層上傳”的科層級(jí)模式逐步轉(zhuǎn)向“網(wǎng)格管理”的扁平化模式，各級(jí)教育部門需建立權(quán)責(zé)分明的數(shù)據(jù)管理中心，落實(shí)各級(jí)部門的權(quán)力和責(zé)任。這包括：一是確保數(shù)據(jù)生命周期的每一流程都“有人負(fù)責(zé)，有人監(jiān)督”，一旦發(fā)現(xiàn)數(shù)據(jù)質(zhì)量等問題能夠及時(shí)溯源；二是搭建各層級(jí)業(yè)務(wù)間的“溝通橋梁”，相互驗(yàn)證數(shù)據(jù)的真實(shí)性和有效性，保障數(shù)據(jù)的質(zhì)量和安全流轉(zhuǎn)。其二，完善數(shù)據(jù)生命周期全流程規(guī)范化制度。數(shù)據(jù)質(zhì)量參差不齊歸根究底是缺乏規(guī)范化的數(shù)據(jù)標(biāo)準(zhǔn)和流程。這就有必要從政策和制度著手，加強(qiáng)數(shù)據(jù)全生命周期的制度建設(shè)：1）以數(shù)據(jù)標(biāo)準(zhǔn)、質(zhì)量管控、數(shù)據(jù)共享權(quán)限等政策為依據(jù)，進(jìn)行整體性制度設(shè)計(jì)，制定通用的數(shù)據(jù)規(guī)范格式；2）全流程遵循“數(shù)據(jù)收集→數(shù)據(jù)存儲(chǔ)→數(shù)據(jù)處理→數(shù)據(jù)傳輸→數(shù)據(jù)交換→數(shù)據(jù)銷毀”的數(shù)據(jù)標(biāo)準(zhǔn)制度，各層級(jí)數(shù)據(jù)管理中心采用統(tǒng)一的規(guī)范進(jìn)行數(shù)據(jù)流通，保障數(shù)據(jù)的規(guī)范性、準(zhǔn)確性、完備性和一致性，提升數(shù)據(jù)的應(yīng)用價(jià)值。

（二）強(qiáng)化技術(shù)支撐，創(chuàng)新安全風(fēng)險(xiǎn)防范體系

人工智能時(shí)代，教育數(shù)據(jù)安全問題日益突出，如何利用技術(shù)手段防范安全風(fēng)險(xiǎn)成為教育數(shù)據(jù)治理的當(dāng)務(wù)之急。人工智能教育大腦通過教育神經(jīng)元網(wǎng)絡(luò)響應(yīng)教育需求的過程中，為規(guī)避數(shù)據(jù)治理的安全風(fēng)險(xiǎn)需設(shè)置防范措施，如共享數(shù)據(jù)權(quán)限管理、數(shù)據(jù)風(fēng)險(xiǎn)防范、數(shù)據(jù)安全加固和隱私安全保障等，這些措施以智能技術(shù)為依托，遵循“風(fēng)險(xiǎn)識(shí)別→風(fēng)險(xiǎn)預(yù)警→風(fēng)險(xiǎn)管控”的系統(tǒng)流程，將風(fēng)險(xiǎn)防范的“先手”與風(fēng)險(xiǎn)消解的“后招”有效結(jié)合。第一，建立數(shù)據(jù)安全風(fēng)險(xiǎn)智能識(shí)別機(jī)制。這需要明確數(shù)據(jù)安全風(fēng)險(xiǎn)類別，通過數(shù)據(jù)挖掘和特征提取等技術(shù)對(duì)風(fēng)險(xiǎn)源進(jìn)行特征提取，并建立數(shù)據(jù)安全風(fēng)險(xiǎn)模型準(zhǔn)確識(shí)別數(shù)據(jù)安全風(fēng)險(xiǎn)。第二，建立數(shù)據(jù)安全風(fēng)險(xiǎn)實(shí)時(shí)預(yù)警機(jī)制，即基于數(shù)據(jù)挖掘、物聯(lián)網(wǎng)、大數(shù)據(jù)和機(jī)器學(xué)習(xí)等技術(shù)，快速整合多源的多模態(tài)風(fēng)險(xiǎn)數(shù)據(jù)，構(gòu)建數(shù)據(jù)安全風(fēng)險(xiǎn)預(yù)警平臺(tái)，完善“快速感知、實(shí)時(shí)監(jiān)測(cè)、事先預(yù)警”的一體化流程，實(shí)現(xiàn)對(duì)數(shù)據(jù)安全風(fēng)險(xiǎn)的實(shí)時(shí)預(yù)警。第三，建立數(shù)據(jù)安全風(fēng)險(xiǎn)智能管控機(jī)制。風(fēng)險(xiǎn)管控指針對(duì)數(shù)據(jù)泄露和數(shù)據(jù)破壞等風(fēng)險(xiǎn)預(yù)先采取的挽救措施，如梳理數(shù)據(jù)湖中的數(shù)據(jù)來(lái)源，進(jìn)行數(shù)據(jù)血緣分析，對(duì)重要性和敏感程度不同的數(shù)據(jù)啟動(dòng)不同級(jí)別的數(shù)字加密等。

（三）凝智多元主體，構(gòu)建算法倫理監(jiān)管機(jī)制

人工智能技術(shù)嵌入教育系統(tǒng)帶來(lái)的不僅是技術(shù)問題，更多的是源于人類自身的人性和倫理問題。事實(shí)上，人們對(duì)技術(shù)應(yīng)用于教育的監(jiān)管能力遠(yuǎn)不及技術(shù)的革新速度（譚維智，2019）。因此，為了確保人工智能教育大腦的良性運(yùn)轉(zhuǎn)，我們需要凝聚多元教育主體的智慧，對(duì)算法/模型進(jìn)行倫理監(jiān)管，以保證其符合“以人為本”的教育價(jià)值觀。這包括：1）算法設(shè)計(jì)需符合教育邏輯。算法設(shè)計(jì)者需以“人的發(fā)展”為設(shè)計(jì)理念，根據(jù)“人的體驗(yàn)”不斷改善算法設(shè)計(jì)的影響因素。2）算法選擇需進(jìn)行評(píng)估。算法對(duì)大多數(shù)教師、學(xué)生或教育管理者等使用者來(lái)說(shuō)是“黑匣子”，這就需要對(duì)算法進(jìn)行質(zhì)量評(píng)估和風(fēng)險(xiǎn)評(píng)估。一方面，算法使用者應(yīng)根據(jù)具體教育情境進(jìn)行算法遷移、模型訓(xùn)練和算法更新，評(píng)估模型計(jì)算是否丟棄了數(shù)據(jù)攜帶的重要信息以及從其他領(lǐng)域遷移的算法是否符合教育情境需要；另一方面，算法使用者應(yīng)具備自主評(píng)估和管控算法風(fēng)險(xiǎn)的能力，厘清算法或模型的局限性及可能帶來(lái)的風(fēng)險(xiǎn)，預(yù)設(shè)風(fēng)險(xiǎn)應(yīng)對(duì)方案。3）算法應(yīng)用需先經(jīng)測(cè)試。智能產(chǎn)品進(jìn)入學(xué)校，需經(jīng)過情境測(cè)試和教育效果評(píng)估，接受家長(zhǎng)、教師、管理者和專家的審查。可見，人工智能教育大腦為凝聚教育管理者、教師、學(xué)生、家長(zhǎng)等的集體智慧提供了接口，從“算法設(shè)計(jì)、算法選擇、算法應(yīng)用”三個(gè)層面構(gòu)建算法倫理監(jiān)管機(jī)制，為教育數(shù)據(jù)治理提供算法倫理保障。

人工智能教育大腦模型構(gòu)建及實(shí)踐路徑

一、問題提出

二、概念闡釋、困境與成因