李豫 張勇
(華中師范大學 武漢 430079)
近年來,不少題庫管理系統(tǒng)在教學上減輕了教師的工作壓力,但在出卷策略、自動化推薦以及個性化學習等方面上仍有改進空間。大多數(shù)在線題庫平臺只涉及向?qū)诫S機組卷和手動組卷,缺少智能化組卷策略和教學診斷機制。另外,MOOC教學考核模式已經(jīng)成為未來教育趨勢,但其教學互動環(huán)節(jié)仍有缺陷[1],例如一位老師在Coursera平臺上要教上萬的學生,難以監(jiān)測學習者的學習狀況并及時提供幫助。與此同時,網(wǎng)絡化教育和E-learning得到飛速的發(fā)展,知識載體也由書本逐漸轉(zhuǎn)變?yōu)槎喾N表達方式,而人類對知識的理解又往往趨向于結(jié)構(gòu)化和聯(lián)想式[2]。針對以上現(xiàn)象,本研究小組利用知識圖譜開發(fā)了一款多策略組卷系統(tǒng)。系統(tǒng)除傳統(tǒng)組卷方式外,還提出“基于知識圖譜的學習畫像和自動化組卷”的更新方案,旨在根據(jù)學生訓練情況自動推薦組卷,學生通過接收試卷再次訓練,此過程不斷迭代,直到學生對所要求的知識點基本都掌握。
知識圖譜是一種以圖的形式表達客觀世界中的概念、實體以及實體間關系的知識庫,是語義搜索、智能問答等服務的基礎技術之一[3],也用于對當前領域熱點和發(fā)展趨勢進行探索和研究[4]。目前谷歌、Facebook和IBM等都在以知識圖譜為基礎布局智能化發(fā)展戰(zhàn)略。在教育領域中建立學科知識圖譜能將書本里零散的知識點打通,先后形成脈絡化、模塊化、體系結(jié)構(gòu)化的知識網(wǎng)。知識圖譜與數(shù)字化教學的結(jié)合將有助于教師授課、督導學習,同時又可以使學生對碎片化知識查漏補缺和檢索資源。
本平臺采用面向開放域的抽取技術,以百度百科作為知識來源進行實體抽取、關系抽取和部分屬性抽取,使非結(jié)構(gòu)化的正文轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)[5]。將專家推薦的知識作為百度百科的主題詞條,后經(jīng)計量分析選取同一頁面中高頻率鏈接詞條,通過知識可取性評估、實體對齊[6]、實體命名等工作,最終得到知識圖譜。本系統(tǒng)構(gòu)造出了含2160個知識點和3064組聯(lián)系的“計算機學科知識圖譜”,以及含1225個知識點和1722組聯(lián)系的“物理學科知識圖譜”。
知識圖譜(記為O)可表示為O={N,E,V},N代表知識點集;E代表關系集;V代表屬性集[7]。屬性集中,靜態(tài)屬性包括外觀屬性、摘要屬性、級別屬性、聚類屬性;動態(tài)屬性包括學情屬性、權(quán)重屬性。系統(tǒng)利用結(jié)構(gòu)化數(shù)據(jù)文件規(guī)定存儲單位為“實體1-關聯(lián)-實體2”三元組,以及實體與其相關屬性-值對。系統(tǒng)通過Web技術制作知識地圖并使用Louvain算法[8]進行聚類。
本研究小組利用改進的黑板體系結(jié)構(gòu),構(gòu)造出知識圖譜可視化風格。黑板體系結(jié)構(gòu)模型由知識源、黑板數(shù)據(jù)結(jié)構(gòu)和控制器三部分構(gòu)成[9]。依據(jù)黑板風格制作的知識圖譜倉庫由“算法庫”、“結(jié)構(gòu)化文件”、“資源庫”以及內(nèi)控制器組成,如圖1所示。算法庫包含知識源對應的算法;結(jié)構(gòu)化文件是中央數(shù)據(jù)單元以及可視化的基礎;資源庫存放數(shù)字化教學資源;內(nèi)控制器調(diào)用內(nèi)部業(yè)務,當信息狀態(tài)變化且符合能由知識圖譜直接解決的問題時,執(zhí)行結(jié)果會立即反饋給用戶,當需要調(diào)用題庫業(yè)務時,內(nèi)控制器轉(zhuǎn)調(diào)外控制器,并依據(jù)B/S架構(gòu)處理。
圖1 知識圖譜可視化風格設計圖
系統(tǒng)所針對的用戶是計算機專業(yè)的教師和學生。除了完備的題庫管理功能以及多種組卷方式外,本平臺還提供了其他輔助模塊。具體劃分如圖2所示。
圖2 系統(tǒng)樹狀邏輯結(jié)構(gòu)圖
策略模式實現(xiàn)了多種組卷方式的融合。手動組卷依靠題庫檢索;向?qū)诫S機組卷在隨機概率下錄用試題;基于知識點的自動化組卷策略先后通過知識圖譜和組卷業(yè)務進行處理。
在真實的應試訓練中,成績的浮動是反映近期學習狀況最直接的數(shù)據(jù),但在實際學習分析中,學生對知識點的掌握程度變化才是衡量學習能力提升與否的重要指標[10]。即使采用知識圖譜的推薦策略也仍停留在知識本身,缺少對學生學習的觀察性。為此,本平臺增設學習畫像和自動化組卷機制,使系統(tǒng)在學生答題訓練后能自動化推薦知識路徑并生成下一張試卷。圖3是特定學生的學習畫像和知識推薦。
3.2.1 知識劃分
智能教學系統(tǒng)的一大優(yōu)勢在于系統(tǒng)設計之初,已經(jīng)對知識點做了比較詳細的規(guī)劃,各個題目會被事先標記相應的知識點集合用以知識跟蹤[11]。上述過程由對應學科領域的專家進行劃分。
圖3 學習畫像與知識推薦
3.2.2 重要節(jié)點的評估
為了針對特定的學生進行個性化的知識點重要程度評估,本文綜合考慮了兩個因素,一是學生對知識點的掌握程度,另一個是知識點自身在學科中的重要性。為此,本文引入了PageRank算法[12]來進行個性化的重要性評估。每個知識點包含有一個二元組屬性
3.2.3 關聯(lián)推薦
任何知識點都并非孤立而是彼此聯(lián)系的,往往某一知識的掌握程度會隨其他知識點的變化而改變。針對重要知識節(jié)點有如下策略。
表1 等級表
步驟1:劃分知識掌握等級(如表1),按對應顏色點亮知識地圖中的知識點。
步驟2:對生疏的知識點推薦一階前驅(qū)節(jié)點,對熟練的知識點適當推薦一階后繼節(jié)點。
步驟3:教師可對推薦得到的知識點增設或更改權(quán)重,也可參考其他輔助方式設權(quán)。
步驟4:系統(tǒng)依據(jù)知識點權(quán)重自動化出卷。
步驟5:學生訓練,更新權(quán)重,返回步驟1。
圖4 兩點間共詞分析結(jié)果
當面向龐大的知識網(wǎng)絡時,人工定義它們的邏輯聯(lián)系是低效的做法,準確性也難以保證。另外,在真實領域中存在大量關系模糊的知識點。共詞分析法是計量學的一種重要方法,也是內(nèi)容分析的方法之一[13]。系統(tǒng)以共詞分析方式來自動探測任意兩個知識點的內(nèi)容關聯(lián),用來輔助出卷,如圖4所示。
本文介紹了一種針對出卷的知識圖譜應用平臺,系統(tǒng)具備多種組卷策略并將知識圖譜與特征學習相結(jié)合。未來教育將會出現(xiàn)教師明星化,內(nèi)容模塊化,輔導分級化的趨向[14]。因此,在線考核、模塊化學習,以及師生互動等教學需求將會不斷優(yōu)化。本文提出的學習畫像與自動組卷機制在一定程度上將“基于知識點的教育知識圖譜”向“面向活動的教育事理圖譜”進行轉(zhuǎn)換,是教育大數(shù)據(jù)融入智能化處理[15]的一次研究嘗試。