郭勝男 吳永和 張 治
(1.華東師范大學(xué) 教育學(xué)部教育信息技術(shù)學(xué)系,上海 200062;2.上海市寶山區(qū)教育局,上海 201999)
人工智能技術(shù)發(fā)揮作用的三要素為數(shù)據(jù)、算法和算力。正如人工智能專家周志華(2020)所言,“今天的人工智能熱潮是由于機(jī)器學(xué)習(xí),尤其是深度學(xué)習(xí)技術(shù)在大數(shù)據(jù)、大算力的支持下發(fā)揮出了巨大威力”。這些均需建立在數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全及算法合乎倫理的基礎(chǔ)上,因此,如何進(jìn)行有效的教育數(shù)據(jù)治理成為教育數(shù)字化轉(zhuǎn)型的必經(jīng)之路。人工智能教育大腦系統(tǒng)整合了教育數(shù)據(jù)、智能算法和算力資源,以保證最大限度地挖掘大數(shù)據(jù)的潛在價(jià)值,為教育數(shù)據(jù)精準(zhǔn)治理提供新路向。
“智能大腦”最早由雷·庫(kù)茲韋爾(Ray Kurzweil)提出,指借助海量數(shù)據(jù)和算法,模擬人腦思考和判斷(何懷宏,2018)。之后在城市治理領(lǐng)域,有研究者提出城市大腦概念,指在互聯(lián)網(wǎng)大腦架構(gòu)的基礎(chǔ)上,以云神經(jīng)網(wǎng)絡(luò)和云反射弧為建設(shè)重點(diǎn),為解決城市治理難題提供全新工具(胡堅(jiān)波,2021)。在教育領(lǐng)域,顧小清等(2021)以“人工智能教育大腦”為隱喻,將智能技術(shù)與教育融合,致力于解決高等教育數(shù)據(jù)治理和教學(xué)創(chuàng)新問題。張治等(2022)將人工智能本質(zhì)和人腦特質(zhì)結(jié)合,構(gòu)建教育大腦生態(tài)架構(gòu),強(qiáng)調(diào)基于人工智能的教育大腦是實(shí)現(xiàn)教育數(shù)字化轉(zhuǎn)型的關(guān)鍵基礎(chǔ)設(shè)施。由此可見,人工智能等新一代信息技術(shù)支撐的“教育大腦”具備規(guī)范化整合數(shù)據(jù)資源和算法模型、提高數(shù)據(jù)質(zhì)量和保障隱私安全的強(qiáng)大能力。
數(shù)據(jù)作為新的生產(chǎn)要素,在滲入教育治理結(jié)構(gòu)時(shí),必然會(huì)引發(fā)一系列新的問題,如數(shù)據(jù)質(zhì)量參差不齊、隱私泄露、算法失衡。現(xiàn)階段教育領(lǐng)域尚缺乏有效的教育數(shù)據(jù)治理方案。為了提高教育數(shù)據(jù)質(zhì)量,保障算法安全,打破數(shù)據(jù)孤島之間的壁壘,充分挖掘教育大數(shù)據(jù)的潛在價(jià)值,教育治理亟需更寬廣的視野和更強(qiáng)大、靈敏的治理工具。本研究遵循“問題解構(gòu)→方法模型→實(shí)踐路徑”的邏輯思路,在解構(gòu)教育數(shù)據(jù)治理的內(nèi)涵、困境及成因的基礎(chǔ)上,構(gòu)建人工智能教育大腦模型,提出教育大腦賦能教育數(shù)據(jù)治理的實(shí)踐路徑。
數(shù)據(jù)治理(data governance)是數(shù)字化技術(shù)和治理理論融合形成的新概念,學(xué)界尚未給出統(tǒng)一的定義。國(guó)際數(shù)據(jù)管理協(xié)會(huì)(DAMA International,2009)認(rèn)為,數(shù)據(jù)治理指在管理和使用層面對(duì)數(shù)據(jù)進(jìn)行規(guī)劃、監(jiān)督和控制。國(guó)際著名數(shù)據(jù)治理專家桑尼爾·索瑞斯(2014)認(rèn)為數(shù)據(jù)治理是制定與大數(shù)據(jù)相關(guān)的數(shù)據(jù)優(yōu)化、隱私保護(hù)與數(shù)據(jù)變現(xiàn)等政策。國(guó)內(nèi)學(xué)者梁芷銘(2015)認(rèn)為數(shù)據(jù)治理是為了應(yīng)對(duì)大數(shù)據(jù)帶來(lái)的種種不安、困難與威脅,運(yùn)用技術(shù)工具對(duì)大數(shù)據(jù)進(jìn)行管理、整合、分析并挖掘其價(jià)值的行為。有學(xué)者將數(shù)據(jù)治理等同于數(shù)據(jù)管理,認(rèn)為二者均指采取必要的步驟、度量和策略管理數(shù)據(jù)的整個(gè)生命周期,涉及數(shù)據(jù)識(shí)別、收集、準(zhǔn)備、組織、分類、處理、分析、存儲(chǔ)、發(fā)布、管理和重用等(Gajbe et al., 2021)。事實(shí)上,數(shù)據(jù)治理蘊(yùn)含明確相關(guān)角色、工作職責(zé)和工作流程等含義,是過程性概念,強(qiáng)調(diào)做出哪些決策以及由誰(shuí)做出決策(Abraham et al.,2019)。數(shù)據(jù)管理是目標(biāo)性概念,強(qiáng)調(diào)決策是數(shù)據(jù)執(zhí)行的一部分。從本質(zhì)上講,數(shù)據(jù)治理是對(duì)數(shù)據(jù)管理進(jìn)程行使權(quán)利和控制,指導(dǎo)組織內(nèi)和跨組織的數(shù)據(jù)和算法整個(gè)生命周期的正常運(yùn)行,強(qiáng)調(diào)數(shù)據(jù)資產(chǎn)的價(jià)值和數(shù)據(jù)安全管控(Carretero et al., 2016)。
隨著教育信息化的發(fā)展,教育領(lǐng)域積聚了海量數(shù)據(jù),呈現(xiàn)“大數(shù)據(jù)”形態(tài),“教育數(shù)據(jù)治理”概念應(yīng)運(yùn)而生。教育數(shù)據(jù)治理作為嶄新的研究領(lǐng)域,其概念一直是學(xué)界討論的議題。教育數(shù)據(jù)治理涵蓋教育的數(shù)據(jù)治理和數(shù)據(jù)驅(qū)動(dòng)的教育治理兩層內(nèi)涵,數(shù)據(jù)治理為教育治理提供技術(shù)和程序,教育治理為數(shù)據(jù)治理提供目標(biāo)(劉金松,2018)。兩者交叉融合、密不可分,共同服務(wù)于教育發(fā)展需求,提升教育治理水平和治理能力。
研究發(fā)現(xiàn),現(xiàn)有教育治理體系與大數(shù)據(jù)算法系統(tǒng)的耦合度不高(Janssen et al., 2020),教育數(shù)據(jù)治理在數(shù)據(jù)質(zhì)量、安全風(fēng)險(xiǎn)、算法倫理等方面面臨難題,未能充分發(fā)揮大數(shù)據(jù)的價(jià)值,嚴(yán)重阻礙了教育數(shù)字化轉(zhuǎn)型的現(xiàn)代化進(jìn)程。
1.教育數(shù)據(jù)質(zhì)量不高,限制了數(shù)據(jù)價(jià)值釋放
教育大數(shù)據(jù)在科學(xué)決策、支持多樣化教學(xué)場(chǎng)景、創(chuàng)新教學(xué)服務(wù)和提升教學(xué)效率等方面蘊(yùn)含巨大的教育價(jià)值,正如徐宗本院士(2017)所言,“大數(shù)據(jù)可以帶來(lái)超凡應(yīng)用價(jià)值”。在教育領(lǐng)域,只有切實(shí)將數(shù)據(jù)應(yīng)用于解決教育發(fā)展問題,才能真正彰顯數(shù)據(jù)的價(jià)值。但實(shí)際境況與理論設(shè)想“相距甚遠(yuǎn)”,“雖然大數(shù)據(jù)在教育領(lǐng)域的熱度日趨增加,真正利用大數(shù)據(jù)解決教育問題的成功案例卻很少”(祝智庭,2017)。究其原因,數(shù)據(jù)質(zhì)量是影響數(shù)據(jù)價(jià)值發(fā)揮的重要因素。
質(zhì)量是教育數(shù)據(jù)的靈魂,是大數(shù)據(jù)發(fā)揮價(jià)值的基礎(chǔ)和保障,涉及數(shù)據(jù)規(guī)范性、準(zhǔn)確性、完備性和一致性等。在智慧教育時(shí)代,人工智能、云計(jì)算、虛擬現(xiàn)實(shí)和物聯(lián)網(wǎng)等智能技術(shù)擴(kuò)展了教學(xué)管理和實(shí)踐的時(shí)空邊界,政府部門、社會(huì)組織及各類院校等產(chǎn)生的海量數(shù)據(jù)在數(shù)據(jù)規(guī)模、結(jié)構(gòu)類型、數(shù)據(jù)收集和存儲(chǔ)工具、時(shí)效價(jià)值等方面存在很大差異,教育數(shù)據(jù)的規(guī)范性、準(zhǔn)確性、完備性、一致性等數(shù)據(jù)質(zhì)量問題疊出,導(dǎo)致難以充分發(fā)揮數(shù)據(jù)的價(jià)值。這可歸因?yàn)橐韵聨c(diǎn):其一,各教育主體間的“煙囪效應(yīng)”。人工智能技術(shù)賦能多元化數(shù)據(jù)生產(chǎn)主體和治理主體,但各主體間因業(yè)務(wù)需求不同往往“各自為政”,未能形成統(tǒng)一的數(shù)據(jù)規(guī)范標(biāo)準(zhǔn)。在這種“煙囪式”治理模式下,數(shù)據(jù)冗余、數(shù)據(jù)片面、死數(shù)據(jù)等問題頻出,導(dǎo)致教育決策科學(xué)性不高。其二,學(xué)習(xí)分析技術(shù)與數(shù)據(jù)之間的“弱耦合性”。區(qū)別于一般大數(shù)據(jù),教育大數(shù)據(jù)是在教育場(chǎng)景中產(chǎn)生的數(shù)據(jù),結(jié)構(gòu)多樣(結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化),模態(tài)豐富(行為、生理、心理),格式繁雜(視頻、音頻、文本、平臺(tái)日志、生物傳感)(吳永和等,2021),現(xiàn)有學(xué)習(xí)分析技術(shù)難以捕獲數(shù)據(jù)之間的關(guān)聯(lián)性和一致性。此外,高效的學(xué)習(xí)分析工具推廣不易,如果沒有利益相關(guān)者的批準(zhǔn)和監(jiān)管,高效的學(xué)習(xí)分析技術(shù)不會(huì)被教育系統(tǒng)采納。可見,學(xué)習(xí)分析技術(shù)與數(shù)據(jù)之間的“弱耦合”極大地限制了數(shù)據(jù)價(jià)值釋放。其三,從技術(shù)角度看,機(jī)器學(xué)習(xí)算法偏好“好數(shù)據(jù)”。教育領(lǐng)域可視為數(shù)據(jù)驅(qū)動(dòng)下的智能算法的運(yùn)行場(chǎng)域(趙磊磊等,2021)。流行的機(jī)器學(xué)習(xí)算法,如K-最近鄰(KNN)、樸素貝葉斯(NB)、支持向量機(jī)(SVM)和深度學(xué)習(xí)等對(duì)特征空間的變化非常敏感,高質(zhì)量的訓(xùn)練數(shù)據(jù)集才能形成高性能的特征向量,進(jìn)而將機(jī)器學(xué)習(xí)算法訓(xùn)練成“好”的模型(Singh et al., 2022)。然而,教育實(shí)踐中通常存在降低數(shù)據(jù)質(zhì)量的因素,如噪聲、缺失值、數(shù)據(jù)不一致或異常值等,嚴(yán)重影響機(jī)器學(xué)習(xí)算法的學(xué)習(xí)性能,造成模型訓(xùn)練數(shù)據(jù)的欠擬合或過擬合,進(jìn)而導(dǎo)致決策失誤。
2.開放共享程度擴(kuò)大,加劇數(shù)據(jù)安全風(fēng)險(xiǎn)
2017年,國(guó)務(wù)院印發(fā)《國(guó)家教育事業(yè)發(fā)展“十三五”規(guī)劃》指出,要加快推進(jìn)教育大數(shù)據(jù)建設(shè)與開放共享,形成教育數(shù)據(jù)資源開放共享機(jī)制(教育部,2017)。人工智能時(shí)代,教育系統(tǒng)內(nèi)部自組織、自生產(chǎn)形成的“熵減”現(xiàn)象和自我加強(qiáng)的“馬太效應(yīng)”均蘊(yùn)含著教育數(shù)據(jù)開放共享的迫切訴求。開放共享對(duì)數(shù)據(jù)資源的快速流轉(zhuǎn)與價(jià)值挖掘至關(guān)重要(陳雅云等,2021)。擴(kuò)大教育數(shù)據(jù)的開放共享空間有利于促進(jìn)教育數(shù)據(jù)的整合、流轉(zhuǎn),打破各教育子系統(tǒng)之間的數(shù)據(jù)壁壘,提升數(shù)據(jù)的應(yīng)用價(jià)值,形成相互支持的產(chǎn)業(yè)鏈。
移動(dòng)互聯(lián)網(wǎng)、區(qū)塊鏈、邊緣計(jì)算、人工智能等技術(shù)深度發(fā)展,各教育系統(tǒng)、平臺(tái)和信息門戶等的加強(qiáng),為教育數(shù)據(jù)的開放和共享提供了強(qiáng)有力的技術(shù)支撐,開放數(shù)據(jù)獲取、傳輸、存儲(chǔ)、處理和應(yīng)用的力度不斷增強(qiáng)。在此過程中,數(shù)據(jù)泄露和數(shù)據(jù)破壞等數(shù)據(jù)安全風(fēng)險(xiǎn)問題不可忽視。一方面,教師、學(xué)生等數(shù)據(jù)生產(chǎn)者的隱私泄露風(fēng)險(xiǎn)加大。從宏觀上看,數(shù)據(jù)的開放共享具有高度復(fù)雜性和系統(tǒng)性,涉及各利益相關(guān)者的隱私。隨著數(shù)據(jù)開放共享力度的提升,學(xué)校、教師、學(xué)生等數(shù)據(jù)提供者的隱私空間被嚴(yán)重壓縮(田賢鵬,2020)。從技術(shù)視角看,學(xué)習(xí)分析系統(tǒng)的設(shè)計(jì)未能完全保證師生的隱私安全。隨著數(shù)據(jù)資源更加多模態(tài),學(xué)習(xí)分析工具更加移動(dòng),原本無(wú)法追蹤、統(tǒng)計(jì)和檢索的蹤跡變得有跡可循,隱私侵犯現(xiàn)象變得普遍。另一方面,數(shù)據(jù)在共享過程中被破壞的風(fēng)險(xiǎn)增大。其一,開放共享為不法之徒竊取、篡改、濫用數(shù)據(jù)提供了可能,尤其是一些教育機(jī)構(gòu)為了利益竊取開放共享的數(shù)據(jù)以換取商業(yè)報(bào)酬。其二,數(shù)據(jù)在傳輸和交換過程中會(huì)丟失。教育系統(tǒng)各組織間數(shù)字媒介和數(shù)據(jù)維度等不一致,使得數(shù)據(jù)在交換過程中易丟失或損壞,造成數(shù)據(jù)缺失或不完整??偠灾瑪?shù)據(jù)安全治理是教育數(shù)據(jù)開放和共享過程中不可或缺的重要環(huán)節(jié),也是教育數(shù)據(jù)治理亟需解決的核心問題。
3.人工智能技術(shù)帶來(lái)算法失衡風(fēng)險(xiǎn)
人工智能時(shí)代是一個(gè)讓數(shù)據(jù)“開口說(shuō)話”的時(shí)代,數(shù)據(jù)和算法是人工智能技術(shù)發(fā)揮作用的重要基石?!叭绻f(shuō)大數(shù)據(jù)是信息時(shí)代的石油,那么算法就是從中提煉衍生產(chǎn)品的煉油廠”(肖鳳翔等,2020)。大數(shù)據(jù)為算法提供底層支撐,算法從大數(shù)據(jù)中提煉知識(shí)和信息,可見,算法優(yōu)劣嚴(yán)重影響數(shù)據(jù)治理的效能。然而,隨著智慧學(xué)習(xí)、智慧課堂等人工智能新應(yīng)用的出現(xiàn),算法在教育實(shí)踐中不可避免地遇到諸多困境,如算法失靈、算法偏好、算法濫用,給教育實(shí)踐帶來(lái)了不可預(yù)估的風(fēng)險(xiǎn),嚴(yán)重限制了教育數(shù)據(jù)治理效能的發(fā)揮。
首先,機(jī)器學(xué)習(xí)算法在為數(shù)據(jù)治理提供強(qiáng)大算力的同時(shí),其應(yīng)用存在算法失靈的風(fēng)險(xiǎn),具體表現(xiàn)為算法運(yùn)行失序,背離教育德性倫理或者不利于教育正向發(fā)展。教育領(lǐng)域算法大多移植于其他領(lǐng)域,這些算法的數(shù)理邏輯并不完全適用于教育系統(tǒng)的技術(shù)架構(gòu)和教育邏輯,無(wú)法完全滿足教育的實(shí)際需求,有的會(huì)背離以“人的發(fā)展”為核心的目標(biāo)。其次,算法偏好風(fēng)險(xiǎn)?!霸俸玫乃惴ㄒ膊荒芡昝婪从晨陀^實(shí)在,其中必然存在諸多偏差與偏見”(譚維智,2019)。教育領(lǐng)域的算法應(yīng)用是將教育現(xiàn)象抽象成數(shù)據(jù)進(jìn)行表征,其中的程序設(shè)計(jì)和計(jì)算邏輯是人為設(shè)計(jì)的,不可避免存在偏見,從而導(dǎo)致算法結(jié)果出現(xiàn)偏差。機(jī)器學(xué)習(xí)算法以教育數(shù)據(jù)為支撐進(jìn)行模擬和診斷,診斷的準(zhǔn)確性往往與數(shù)據(jù)質(zhì)量相關(guān),偏好“好數(shù)據(jù)”,造成“繭房效應(yīng)”。最后,算法的誤用和濫用風(fēng)險(xiǎn)。從教育實(shí)踐者的視角看,算法分析過程是個(gè)“黑匣子”,“知其然而不知其所以然”,這無(wú)疑增加了算法使用的盲目性,無(wú)法針對(duì)性地服務(wù)于教育教學(xué)。算法的濫用還模糊了公共領(lǐng)域和個(gè)人隱私邊界,可能侵犯師生的正當(dāng)權(quán)益。
數(shù)據(jù)質(zhì)量、安全風(fēng)險(xiǎn)和算法倫理是教育數(shù)據(jù)治理亟需解決的難題。人工智能教育大腦本質(zhì)上是類腦復(fù)雜教育系統(tǒng),面對(duì)系統(tǒng)性和功能性如此復(fù)雜的教育大腦,本研究從結(jié)構(gòu)模型、輕量級(jí)信息模型和核心模塊三方面剖析人工智能教育大腦的整體結(jié)構(gòu)、信息流轉(zhuǎn)調(diào)度及核心功能,為教育數(shù)據(jù)治理實(shí)踐提供支架。
任何時(shí)期的教育變革都離不開物質(zhì)技術(shù)基礎(chǔ)的支持,新一代信息技術(shù)驅(qū)動(dòng)的教育新基建是支持教育大腦運(yùn)轉(zhuǎn)的“基石”和“底座”(見圖1)。教育大腦的底層支撐技術(shù)以人工智能為核心,通過與物聯(lián)網(wǎng)、5G、云計(jì)算、邊緣計(jì)算、大數(shù)據(jù)、數(shù)字孿生等新技術(shù)的疊加,為教育提供了一套全新的基礎(chǔ)設(shè)施——教育新基建。從功能性結(jié)構(gòu)來(lái)看,教育新基建主要包括信息基礎(chǔ)設(shè)施、融合基礎(chǔ)設(shè)施和創(chuàng)新基礎(chǔ)設(shè)施(祝智庭等,2022)。其中,信息基礎(chǔ)設(shè)施可細(xì)化為網(wǎng)絡(luò)通訊基礎(chǔ)設(shè)施、新技術(shù)基礎(chǔ)設(shè)施(如區(qū)塊鏈、數(shù)字孿生)和計(jì)算基礎(chǔ)設(shè)施。融合基礎(chǔ)設(shè)施指?jìng)鹘y(tǒng)教育基礎(chǔ)設(shè)施在人工智能等技術(shù)加持下形成的集時(shí)空、虛實(shí)環(huán)境于一體的融合型基礎(chǔ)設(shè)施。創(chuàng)新基礎(chǔ)設(shè)施指支持科技創(chuàng)新的基礎(chǔ)設(shè)施,可不斷為教育數(shù)字化轉(zhuǎn)型提供新型工具。
圖1 教育大腦結(jié)構(gòu)模型
正如城市神經(jīng)元網(wǎng)絡(luò)和云反射弧是城市大腦建設(shè)的重點(diǎn)內(nèi)容,教育神經(jīng)元網(wǎng)絡(luò)和教育云反射弧是教育大腦結(jié)構(gòu)的核心內(nèi)容。神經(jīng)元是教育神經(jīng)網(wǎng)絡(luò)的基本單元,每個(gè)神經(jīng)元代表具備一定數(shù)據(jù)收集、存儲(chǔ)、分析和決策功能的教育子系統(tǒng)。它從層級(jí)上可分為校級(jí)神經(jīng)元、區(qū)/縣級(jí)神經(jīng)元和市級(jí)神經(jīng)元,每個(gè)神經(jīng)元按照一定的功能標(biāo)準(zhǔn)和安全標(biāo)準(zhǔn)相互聯(lián)通、資源共享,形成教育神經(jīng)元網(wǎng)絡(luò),為教育云反射弧提供統(tǒng)一的運(yùn)轉(zhuǎn)基礎(chǔ)。每條通過技術(shù)聯(lián)通的教育神經(jīng)元之間的鏈條通路便是一條教育云反射弧,對(duì)應(yīng)不同教育需求,包括個(gè)體級(jí)需求、學(xué)科級(jí)需求和管理級(jí)需求。
教育大腦本質(zhì)上是一個(gè)類腦復(fù)雜智能教育系統(tǒng),將大量的教育系統(tǒng)、子系統(tǒng)和平臺(tái)等神經(jīng)元鏈接起來(lái),涉及眾多的復(fù)雜技術(shù)和因素。為了明晰教育大腦內(nèi)部的數(shù)據(jù)流轉(zhuǎn)和信息安全調(diào)度,本研究分別針對(duì)學(xué)生成長(zhǎng)管理、面向特定學(xué)科的自適應(yīng)學(xué)習(xí)管理和線上線下融合智慧教育模式的需求,構(gòu)建輕量級(jí)教育大腦信息模型(見圖2),以厘清數(shù)據(jù)和算法有效治理的交互機(jī)制。
圖2 輕量級(jí)教育大腦信息模型
教育大腦作為互聯(lián)網(wǎng)大腦的進(jìn)化產(chǎn)物,其構(gòu)建初衷是解決教育領(lǐng)域的重難點(diǎn)問題,響應(yīng)教育需求。輕量級(jí)教育大腦信息模型包括教育神經(jīng)元網(wǎng)絡(luò)、數(shù)據(jù)湖、數(shù)據(jù)倉(cāng)庫(kù)、智能處理器和智能服務(wù)等模塊,遵循“問題驅(qū)動(dòng)→數(shù)據(jù)輸入→數(shù)據(jù)共享→數(shù)據(jù)分析→數(shù)據(jù)服務(wù)→需求響應(yīng)”的邏輯,通過模擬生物的反射弧結(jié)構(gòu),深度挖掘教育數(shù)據(jù)的潛藏價(jià)值,對(duì)教育問題或需求進(jìn)行及時(shí)且智能化的反饋。教育神經(jīng)元網(wǎng)絡(luò)由無(wú)數(shù)個(gè)相互聯(lián)結(jié)的教育神經(jīng)元構(gòu)成,每個(gè)教育神經(jīng)元信息由教育內(nèi)容、數(shù)據(jù)來(lái)源和數(shù)據(jù)集成規(guī)則等構(gòu)成。教育內(nèi)容可借助普適設(shè)備(如平板電腦等)、多模態(tài)傳感器、平臺(tái)日志、問卷和訪談等方式收集視頻、語(yǔ)音、文本、生物傳感等多模態(tài)數(shù)據(jù)(吳永和等,2021)。每個(gè)教育問題對(duì)應(yīng)的云反射弧均需要匯聚多個(gè)教育神經(jīng)元的數(shù)據(jù),具體操作流程為:首先,將教育神經(jīng)元中產(chǎn)生的海量異構(gòu)數(shù)據(jù)像水一樣匯聚在數(shù)據(jù)湖中,數(shù)據(jù)湖以原始格式存儲(chǔ)數(shù)據(jù),無(wú)需對(duì)數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理,保留數(shù)據(jù)之間自然形成的“血緣關(guān)系”,包括結(jié)構(gòu)化數(shù)據(jù)、半/非結(jié)構(gòu)化數(shù)據(jù)和二進(jìn)制數(shù)據(jù)(如視/音頻);其次,教育神經(jīng)元之間的數(shù)據(jù)共享和融通嚴(yán)格遵循數(shù)據(jù)質(zhì)量、數(shù)據(jù)倫理和數(shù)據(jù)安全等規(guī)范和標(biāo)準(zhǔn),以保障數(shù)據(jù)在開放共享過程中的質(zhì)量和安全;再次,數(shù)據(jù)共享和融通將數(shù)據(jù)按一定的規(guī)范和標(biāo)準(zhǔn)格式化處理后存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中,作為智能分析容器的數(shù)據(jù)原材料;智能分析容器是將數(shù)據(jù)原材料轉(zhuǎn)為智能服務(wù)的“工廠”,由自底向上的三部分組成,分別是底層算法/模型庫(kù)、中層算法/模型匹配器和頂層服務(wù)組件;最后,提供智能決策、智能服務(wù)推送和數(shù)據(jù)可視化等智能化服務(wù),將反射響應(yīng)結(jié)果反饋給神經(jīng)元以完成云反射,同時(shí)響應(yīng)對(duì)應(yīng)的教育問題,實(shí)現(xiàn)教育的精準(zhǔn)化治理。
人工智能的發(fā)展是不斷模擬、擴(kuò)展人類智能的過程,反觀教育領(lǐng)域的現(xiàn)實(shí)境況,人工智能技術(shù)“有計(jì)算而無(wú)算計(jì)”“有智能而無(wú)智慧”“有感知而無(wú)認(rèn)知”。人工智能教育大腦要實(shí)現(xiàn)“眼觀六路、耳聽八方、融合思考”的教育發(fā)展愿景(顧小清等,2021),離不開人類群體智慧和機(jī)器群體智能的深度協(xié)作,更離不開智能算法和高質(zhì)量數(shù)據(jù)的底層支撐。具體而言,教育大腦主要包括智能分析和數(shù)據(jù)融通兩大模塊(見圖3),它們可類比為教育大腦的“左右腦”,左腦追求理解與認(rèn)知,右腦追求快速大量記憶和自動(dòng)處理機(jī)能,左右腦相互協(xié)調(diào),提升教育大腦的“智商”和“數(shù)商”。
圖3 教育大腦的核心模塊
1.數(shù)據(jù)融通模塊
教育大腦的數(shù)據(jù)融通模塊是以數(shù)據(jù)中臺(tái)技術(shù)為架構(gòu)的數(shù)據(jù)匯聚中心,致力于實(shí)現(xiàn)教育數(shù)據(jù)的共享融通、規(guī)范統(tǒng)一和風(fēng)險(xiǎn)防范,主要功能包括:其一,基于區(qū)塊鏈、云計(jì)算和物聯(lián)網(wǎng)等技術(shù)構(gòu)建數(shù)據(jù)湖,在邏輯上聯(lián)通各神經(jīng)元以不同方式收集的多模態(tài)異構(gòu)數(shù)據(jù),既保證數(shù)據(jù)的“進(jìn)化”和“血緣關(guān)系”可追蹤,又保障數(shù)據(jù)“物種”多樣性;其二,數(shù)據(jù)共享和流通需嚴(yán)格按照數(shù)據(jù)權(quán)限管理和風(fēng)險(xiǎn)防范制度,明確權(quán)責(zé)邊界,加強(qiáng)隱私保護(hù),保障數(shù)據(jù)的安全流通;其三,嚴(yán)格遵循數(shù)據(jù)分類編碼標(biāo)準(zhǔn)、數(shù)據(jù)管理標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量評(píng)估標(biāo)準(zhǔn)和數(shù)據(jù)倫理標(biāo)準(zhǔn),對(duì)數(shù)據(jù)生命周期全流程進(jìn)行規(guī)范和監(jiān)控,采用統(tǒng)一的標(biāo)準(zhǔn)化規(guī)則清洗、規(guī)范化、標(biāo)簽化數(shù)據(jù),將滿足規(guī)則的數(shù)據(jù)存入數(shù)據(jù)倉(cāng)庫(kù)中,為后續(xù)智能分析持續(xù)提供“燃料”。顯然,數(shù)據(jù)融通模塊通過清洗、篩選、關(guān)聯(lián)多模態(tài)異構(gòu)數(shù)據(jù),打通數(shù)據(jù)流通渠道,提升數(shù)據(jù)質(zhì)量,為教育數(shù)據(jù)的精細(xì)化治理奠定了基礎(chǔ)。
2.智能分析模塊
智能分析模塊是人工智能教育大腦的數(shù)據(jù)“加工廠”,它通過算法訓(xùn)練、情境匹配、決策服務(wù)等,充分發(fā)揮機(jī)器群體智能以挖掘教育數(shù)據(jù)的潛在價(jià)值。首先,智能分析模塊儲(chǔ)存了合理、科學(xué)、豐富的資源庫(kù),包括算法庫(kù)、模型庫(kù)和教育情境庫(kù)。其中,人工智能模型是人工智能算法(移植的開源算法或教育領(lǐng)域的創(chuàng)新算法)根據(jù)教育情境產(chǎn)生的教育數(shù)據(jù)訓(xùn)練而得的。其次,智能時(shí)代的教育情境是多元變化的,只有在特定情境中選擇適切的人工智能算法/模型,才能提供精準(zhǔn)的決策服務(wù)。因此,智能分析模塊提供了算法集選擇器、模型集選擇器和教育情境計(jì)算器,保證教育大腦能夠自主提供適切的計(jì)算和決策服務(wù),提升教育大腦的“智商”。再次,人工智能算法的監(jiān)管功能,通過設(shè)置算法的智能監(jiān)管組件監(jiān)督算法使用過程中的倫理問題,防止出現(xiàn)算法濫用、算法誤用和算法失靈等風(fēng)險(xiǎn)。最后,人工智能算法的創(chuàng)新功能,用于不斷迭代解決教育問題的人工智能算法,更新算法庫(kù)和模型庫(kù),確保教育大腦的高效運(yùn)轉(zhuǎn)。
教育數(shù)據(jù)治理是一個(gè)復(fù)雜且反復(fù)迭代的系統(tǒng)工程,目的是實(shí)現(xiàn)數(shù)據(jù)應(yīng)用價(jià)值和風(fēng)險(xiǎn)管控。本研究提出的人工智能教育大腦以新一代智能技術(shù)為基礎(chǔ),充分整合數(shù)據(jù)、算法和算力,打通教育各部門的業(yè)務(wù)壁壘,為數(shù)據(jù)資源共享與規(guī)約整合、數(shù)據(jù)安全和隱私保障、算法“善治”、決策智能化等提供治理支架。因此,基于新一代智能技術(shù),將智能治理的理念融入教育治理,在對(duì)數(shù)據(jù)和算法進(jìn)行治理的同時(shí),將“冰冷”的數(shù)據(jù)和“呆板”的算法轉(zhuǎn)化為數(shù)據(jù)質(zhì)量和風(fēng)險(xiǎn)防范的“利器”,是智能時(shí)代擺脫教育數(shù)據(jù)治理困境的實(shí)踐邏輯(見圖4)。
圖4 教育大腦賦能數(shù)據(jù)治理的實(shí)踐路徑
人工智能教育大腦為教育數(shù)據(jù)生命周期全流程提供了一系列質(zhì)量規(guī)范,如數(shù)據(jù)分類編碼、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量評(píng)估等,但我們?nèi)孕枰_展頂層設(shè)計(jì)和戰(zhàn)略規(guī)劃,建立權(quán)責(zé)明晰的數(shù)據(jù)管理組織架構(gòu),配合教育大腦形成完備的管理體系。其一,建立科學(xué)合理的數(shù)據(jù)管理組織架構(gòu)。進(jìn)入智慧教育時(shí)代,教育數(shù)據(jù)管理模式已由“逐層上傳”的科層級(jí)模式逐步轉(zhuǎn)向“網(wǎng)格管理”的扁平化模式,各級(jí)教育部門需建立權(quán)責(zé)分明的數(shù)據(jù)管理中心,落實(shí)各級(jí)部門的權(quán)力和責(zé)任。這包括:一是確保數(shù)據(jù)生命周期的每一流程都“有人負(fù)責(zé),有人監(jiān)督”,一旦發(fā)現(xiàn)數(shù)據(jù)質(zhì)量等問題能夠及時(shí)溯源;二是搭建各層級(jí)業(yè)務(wù)間的“溝通橋梁”,相互驗(yàn)證數(shù)據(jù)的真實(shí)性和有效性,保障數(shù)據(jù)的質(zhì)量和安全流轉(zhuǎn)。其二,完善數(shù)據(jù)生命周期全流程規(guī)范化制度。數(shù)據(jù)質(zhì)量參差不齊歸根究底是缺乏規(guī)范化的數(shù)據(jù)標(biāo)準(zhǔn)和流程。這就有必要從政策和制度著手,加強(qiáng)數(shù)據(jù)全生命周期的制度建設(shè):1)以數(shù)據(jù)標(biāo)準(zhǔn)、質(zhì)量管控、數(shù)據(jù)共享權(quán)限等政策為依據(jù),進(jìn)行整體性制度設(shè)計(jì),制定通用的數(shù)據(jù)規(guī)范格式;2)全流程遵循“數(shù)據(jù)收集→數(shù)據(jù)存儲(chǔ)→數(shù)據(jù)處理→數(shù)據(jù)傳輸→數(shù)據(jù)交換→數(shù)據(jù)銷毀”的數(shù)據(jù)標(biāo)準(zhǔn)制度,各層級(jí)數(shù)據(jù)管理中心采用統(tǒng)一的規(guī)范進(jìn)行數(shù)據(jù)流通,保障數(shù)據(jù)的規(guī)范性、準(zhǔn)確性、完備性和一致性,提升數(shù)據(jù)的應(yīng)用價(jià)值。
人工智能時(shí)代,教育數(shù)據(jù)安全問題日益突出,如何利用技術(shù)手段防范安全風(fēng)險(xiǎn)成為教育數(shù)據(jù)治理的當(dāng)務(wù)之急。人工智能教育大腦通過教育神經(jīng)元網(wǎng)絡(luò)響應(yīng)教育需求的過程中,為規(guī)避數(shù)據(jù)治理的安全風(fēng)險(xiǎn)需設(shè)置防范措施,如共享數(shù)據(jù)權(quán)限管理、數(shù)據(jù)風(fēng)險(xiǎn)防范、數(shù)據(jù)安全加固和隱私安全保障等,這些措施以智能技術(shù)為依托,遵循“風(fēng)險(xiǎn)識(shí)別→風(fēng)險(xiǎn)預(yù)警→風(fēng)險(xiǎn)管控”的系統(tǒng)流程,將風(fēng)險(xiǎn)防范的“先手”與風(fēng)險(xiǎn)消解的“后招”有效結(jié)合。第一,建立數(shù)據(jù)安全風(fēng)險(xiǎn)智能識(shí)別機(jī)制。這需要明確數(shù)據(jù)安全風(fēng)險(xiǎn)類別,通過數(shù)據(jù)挖掘和特征提取等技術(shù)對(duì)風(fēng)險(xiǎn)源進(jìn)行特征提取,并建立數(shù)據(jù)安全風(fēng)險(xiǎn)模型準(zhǔn)確識(shí)別數(shù)據(jù)安全風(fēng)險(xiǎn)。第二,建立數(shù)據(jù)安全風(fēng)險(xiǎn)實(shí)時(shí)預(yù)警機(jī)制,即基于數(shù)據(jù)挖掘、物聯(lián)網(wǎng)、大數(shù)據(jù)和機(jī)器學(xué)習(xí)等技術(shù),快速整合多源的多模態(tài)風(fēng)險(xiǎn)數(shù)據(jù),構(gòu)建數(shù)據(jù)安全風(fēng)險(xiǎn)預(yù)警平臺(tái),完善“快速感知、實(shí)時(shí)監(jiān)測(cè)、事先預(yù)警”的一體化流程,實(shí)現(xiàn)對(duì)數(shù)據(jù)安全風(fēng)險(xiǎn)的實(shí)時(shí)預(yù)警。第三,建立數(shù)據(jù)安全風(fēng)險(xiǎn)智能管控機(jī)制。風(fēng)險(xiǎn)管控指針對(duì)數(shù)據(jù)泄露和數(shù)據(jù)破壞等風(fēng)險(xiǎn)預(yù)先采取的挽救措施,如梳理數(shù)據(jù)湖中的數(shù)據(jù)來(lái)源,進(jìn)行數(shù)據(jù)血緣分析,對(duì)重要性和敏感程度不同的數(shù)據(jù)啟動(dòng)不同級(jí)別的數(shù)字加密等。
人工智能技術(shù)嵌入教育系統(tǒng)帶來(lái)的不僅是技術(shù)問題,更多的是源于人類自身的人性和倫理問題。事實(shí)上,人們對(duì)技術(shù)應(yīng)用于教育的監(jiān)管能力遠(yuǎn)不及技術(shù)的革新速度(譚維智,2019)。因此,為了確保人工智能教育大腦的良性運(yùn)轉(zhuǎn),我們需要凝聚多元教育主體的智慧,對(duì)算法/模型進(jìn)行倫理監(jiān)管,以保證其符合“以人為本”的教育價(jià)值觀。這包括:1)算法設(shè)計(jì)需符合教育邏輯。算法設(shè)計(jì)者需以“人的發(fā)展”為設(shè)計(jì)理念,根據(jù)“人的體驗(yàn)”不斷改善算法設(shè)計(jì)的影響因素。2)算法選擇需進(jìn)行評(píng)估。算法對(duì)大多數(shù)教師、學(xué)生或教育管理者等使用者來(lái)說(shuō)是“黑匣子”,這就需要對(duì)算法進(jìn)行質(zhì)量評(píng)估和風(fēng)險(xiǎn)評(píng)估。一方面,算法使用者應(yīng)根據(jù)具體教育情境進(jìn)行算法遷移、模型訓(xùn)練和算法更新,評(píng)估模型計(jì)算是否丟棄了數(shù)據(jù)攜帶的重要信息以及從其他領(lǐng)域遷移的算法是否符合教育情境需要;另一方面,算法使用者應(yīng)具備自主評(píng)估和管控算法風(fēng)險(xiǎn)的能力,厘清算法或模型的局限性及可能帶來(lái)的風(fēng)險(xiǎn),預(yù)設(shè)風(fēng)險(xiǎn)應(yīng)對(duì)方案。3)算法應(yīng)用需先經(jīng)測(cè)試。智能產(chǎn)品進(jìn)入學(xué)校,需經(jīng)過情境測(cè)試和教育效果評(píng)估,接受家長(zhǎng)、教師、管理者和專家的審查。可見,人工智能教育大腦為凝聚教育管理者、教師、學(xué)生、家長(zhǎng)等的集體智慧提供了接口,從“算法設(shè)計(jì)、算法選擇、算法應(yīng)用”三個(gè)層面構(gòu)建算法倫理監(jiān)管機(jī)制,為教育數(shù)據(jù)治理提供算法倫理保障。