劉 霖,劉 強,袁 勇
(國防科技大學 計算機學院,湖南 長沙 410073)
2002年,華盛頓特區(qū)伍德羅威爾遜國際學者中心發(fā)起“嚴肅教學計劃”,鼓勵開展可用于解決政策和管理相關問題的游戲設計與開發(fā)[1],由此衍生出嚴肅游戲(也稱應用游戲)的概念。在2012年的嚴肅游戲高峰會上[2],中國傳媒大學動畫與數(shù)字藝術學院教授、中視典數(shù)字科技首席戰(zhàn)略官費廣正圍繞應用游戲的基本概念、社會價值、如何促進應用以及設計原則、開發(fā)模式等問題進行闡述,認為應用游戲不是游戲的嚴肅化,而是游戲概念的擴大。應用游戲的行業(yè)范圍不應僅停留在娛樂行業(yè),而要擴大到各領域各行業(yè)的知識傳播、技能培訓、情趣培養(yǎng)等方面。數(shù)字游戲能夠模擬實操環(huán)境供學習者反復練習[3-4],具有安全和低學習成本的特點。許多教育工作者將游戲與教學相結合,研究如何通過游戲的多元感官環(huán)境充分調動學習者的動覺、聽覺和視覺,以提供更具強度、活力和新異性的活動刺激[5],使學習者能夠迅速地注意并接受學習內容。
近幾年,計算機教育游戲已經得到計算機教育科學研究人員越來越多的關注,包括SIGCSE在內的多個計算機教育頂級國際會議都有相關工作。雖然國際上一些學者近幾年就教育游戲做了很多嘗試性工作[6],例如Cyber-CIEGE[7]、CyberAware[8]、基于嚴肅類游戲的學習[9-10]等。但是,在大多數(shù)情況下,都是學生自主探索游玩。事實上,教育教學工作是在教師和學生良好融洽的配合下順利進行的,教師科學備課和學生自主學習的動力是教育教學工作開展的兩大關鍵性因素。目前,嚴肅類游戲教學在這兩大關鍵性因素上還存在如下問題:在教學初期,教師無法掌握學生的具體學習情況,難以實施針對性、個性化的教學;學生在學習知識時也容易在某個知識點的掌握上出現(xiàn)問題,嚴重影響后續(xù)知識學習,或造成學習積極性遭受嚴重挫傷。學情分析可為解決上述問題發(fā)揮重要作用,它是教學設計的關鍵環(huán)節(jié),也是設計并實施高質量教學活動的重要保障。在強調以學生為中心的改革理念下,學情分析更成為一個關鍵的教學要素,引導和推動著整個教學活動[11]。目前國內尚無權威的、面向嚴肅游戲的學情分析模型。因此,設計一個合理的學習者玩家學情分析模型,幫助施教者動態(tài)掌握受教者的學習情況,包括受教者群體的總體特征以及受教者個體的差異性特征,是基于嚴肅游戲的教育教學亟需解決的問題。
本文以嚴肅類教學游戲玩家學情分析為設計目標,提出一個基于聚類算法的學習者玩家學情分析模型。此模型主要描述嚴肅類教學游戲從數(shù)據(jù)采集到聚類分析算法的應用,幫助教學游戲開發(fā)人員在系統(tǒng)設計過程中完善教學反饋機制,使游戲結果產出能更有效地支撐常規(guī)的教育教學過程。
本模型以云服務器為基本條件,在嚴肅類教學游戲開發(fā)設計過程中,開展詳細的游戲反饋數(shù)據(jù)結構設計。另一方面,模型使用者在得到對應數(shù)據(jù)后,將數(shù)據(jù)從數(shù)據(jù)庫中取出,從數(shù)據(jù)中抽取特征,繼而分析數(shù)據(jù)。
玩家注冊模塊設計是訪問數(shù)據(jù)反饋的網頁,并將玩家注冊的基本信息發(fā)送到云服務器網頁中。云服務器在完成數(shù)據(jù)合法性校驗后將信息插入數(shù)據(jù)庫中。本地系統(tǒng)也針對這一功能設計登錄信息采集模塊,并提供反饋注冊結果的方式。本模型涉及的登錄信息采集流程見圖1。
Fig.1 Workflow of collecting login data圖1 登錄信息采集流程
同樣,嚴肅類教學游戲在設計的時候需統(tǒng)計玩家答題的信息以及玩家的游玩時間。這2個數(shù)據(jù)字段的設計是模型開展數(shù)據(jù)分析的基礎,也是客觀上玩家在參與嚴肅游戲教學時能反饋的核心數(shù)據(jù),采集此數(shù)據(jù)能讓后續(xù)數(shù)據(jù)分析更具有客觀性,減少玩家主觀性帶來的影響。而其采集模塊設計思想與上述類似,答題數(shù)據(jù)采集流程如圖2。
Fig.2 Workflow of collecting question answer data圖2 答題數(shù)據(jù)采集流程
最后,在數(shù)據(jù)庫獲取到用戶已填寫的反饋數(shù)據(jù)后,本模型針對玩家反饋數(shù)據(jù)開展數(shù)據(jù)分析,將所采集到的數(shù)據(jù)進行對象化處理并分類。依據(jù)所設計的題目信息與玩家答題情況,針對每道題目、每位玩家答題結果開展數(shù)值計算,以數(shù)值計算的結果選取特征,進一步進行模型訓練,并做出對應的可視化圖表供施教者了解信息。數(shù)據(jù)分析流程見圖3。
Fig.3 Workflow of data analysis圖3 數(shù)據(jù)分析流程
將前文的模型內容匯總,得到所設計的學習者玩家學情分析模型總體框架,如圖4。
Fig.4 Overall architecture of players' learning situation analysis model圖4 學習者玩家學情分析模型總體架構
本模型使用到的訓練數(shù)據(jù)按照模型設計中所規(guī)定的數(shù)據(jù)結構組織,在推廣公測后,由系統(tǒng)自動采集用戶在真實游戲游玩過程中的反饋數(shù)據(jù)。游戲反饋數(shù)據(jù)采集流程如圖5。
Fig.5 Workflow of collecting game feedback data圖5 游戲反饋數(shù)據(jù)采集流程
具體來講,游戲反饋數(shù)據(jù)的結構由表1所示內容構成。
Table 1 Data structure of game feedback data表1 游戲反饋數(shù)據(jù)結構
完成玩家反饋數(shù)據(jù)采集后,模型基于已有的數(shù)據(jù)開展數(shù)據(jù)預處理。數(shù)據(jù)信息從數(shù)據(jù)庫中取出后存入各字典中。經過數(shù)據(jù)預處理后的游戲反饋數(shù)據(jù)構成如表2。
Table 2 Data structure of game feedback data after preprocessing表2 數(shù)據(jù)預處理后的游戲反饋數(shù)據(jù)結構
2.2.1 主要思想
首先,通過收集到的題目數(shù)據(jù)計算每個題目難度系數(shù);通過玩家答題信息得到每位玩家在每個題目上嘗試的次數(shù);通過上述2個數(shù)據(jù)計算得到學習者玩家在每道題目上的綜合得分;最后將該玩家所有題目的綜合得分相加得到其綜合表現(xiàn)得分。
在上述工作基礎上,選取學習者玩家填寫的年級信息、每道題目的綜合得分以及玩家的綜合表現(xiàn)為聚類特征,開展基于聚類算法的數(shù)據(jù)分析。
2.2.2 具體流程
(1)難度系數(shù)(QW)為對題目難度的評估指標,后續(xù)用作玩家分數(shù)計算。其計算公式如下:
(2)通過玩家答題歷史記錄,得到每個題目每個玩家的嘗試次數(shù)N。
(3)每個題目難度系數(shù)越大,常數(shù)N越小表明玩家在此題目上的綜合得分較高。因此使用QW與1/N相乘,但實際上玩家答題一次便成功的得分與玩家兩次嘗試的得分之間的差距不應比兩次嘗試得分與十次才成功的差距要大,常數(shù)N取倒數(shù)會導致數(shù)據(jù)及其不平滑。對1/N采取雙曲正切激活函數(shù)處理,最終得到每個題目的得分:
(4)計算該玩家的綜合表現(xiàn)。
(5)考慮到專業(yè)年級對玩家知識能力掌握有著比較大的影響,故將玩家填寫的年級信息進行數(shù)值化處理,得到另一種特征Grade。
(6)對Score(i),TotalScore,Grade所有特征進行歸一化處理。這里采取兩種歸一化處理的方式,針對得分的數(shù)據(jù),采取標準差標準化,計算公式如下:
針對數(shù)值化處理后的年級信息采取線性歸一化。計算公式如下:
至此,數(shù)據(jù)處理過程基本結束,下一步即可采取聚類算法對學習者玩家進行分析。
使用文獻【12】中的網絡安全嚴肅游戲教學系統(tǒng)作為工作基礎,開展玩家學情分析模型應用效果分析。
根據(jù)題號將其對應的難度系數(shù)一一標注出來,部分結果如圖6,其中空值表明相應的題目不存在玩家回答錯誤。
Fig.6 Difficulty coefficient of questions(partial)圖6 題目難度系數(shù)(部分)
由式(2)計算玩家在每個題目上的得分,圖7展示的是某玩家的部分題目得分情況。
Fig.7 Single player's score(partial)圖7 單個玩家的題目得分情況(部分)
由式(3)—(6)計算每個玩家的綜合得分,得到玩家的綜合表現(xiàn)情況。圖8展示了部分玩家的綜合表現(xiàn)得分情況。
Fig.8 Players' scores of comprehensive performance(partial)圖8 玩家綜合表現(xiàn)得分(部分)
基于上述結果,使用不同的聚類算法開展聚類結果的對比分析,以初步驗證本文提出的學情分析模型的現(xiàn)實可行性。在制圖時,為方便展示,圖片僅展示學生年級(Grade)和玩家綜合表現(xiàn)得分(Score)兩個總體特征。
圖9展示了k-means、DBSCAN、AgglomerativeClustering和k-means++4種聚類算法的聚類結果。
Fig.9 Comparative results of different clustering algorithms with respect to real game feedback data圖9 基于實際采集到的教學游戲反饋數(shù)據(jù)的不同聚類算法分析結果
根據(jù)游戲玩家有無信息安全基礎的實際標簽情況,以不同形狀的數(shù)據(jù)點表示運行聚類算法后得到的不同數(shù)據(jù)類別,叉形數(shù)據(jù)點表示相應的游戲玩家是無信息安全基礎學習者,圓形數(shù)據(jù)點表示的是有信息安全基礎學習者。從結果可知,不同玩家之間的學習情況差異較大,具有明顯的聚集性特點。因此,通過綜合聚類結果和游戲玩家的答題對錯結果可以預測該玩家是否為信息安全專業(yè)學習者。
值得一提的是,雖然當前實際采集的數(shù)據(jù)樣本數(shù)量有限,但上述聚類結果初步表明,施教者在使用嚴肅類教學游戲系統(tǒng)開展教學活動時,可以通過玩家的游戲數(shù)據(jù)反饋情況來推斷其學科專業(yè)方向。在此基礎上,教師也可以為不同基礎玩家在后續(xù)學習中視具體情況提升或降低授課難度,或以此為標準自適應嚴肅游戲教學難度。同時,在使用模型進行分析時,也得到不同層次的學習者數(shù)據(jù)特點區(qū)別明顯的結果。而數(shù)據(jù)反饋字段還可以提取出玩家在每個知識領域的題目作答情況,綜合此信息,可以得到學習者不同研究領域的能力圖。嚴肅游戲在設計時也可以實現(xiàn)精準投送知識點,使嚴肅游戲使用者能夠有針對地補充知識。除此之外,模型使用者還可以根據(jù)字段進行更多針對性數(shù)據(jù)分析以提升教學效果。這也證明模型在學情分析方面具有現(xiàn)實可行性。
20多年來,來自教育界的理論和實踐研究表明,基于嚴肅游戲的教學效果明顯,未來發(fā)展空間廣闊。然而嚴肅游戲教學仍存在學情分析不足的問題,影響施教者對受教者的整體特征和差異性特征的掌握程度,也挫傷了受教者使用嚴肅游戲教學系統(tǒng)的積極性。
本文提出一個面向嚴肅游戲的學習者玩家學情分析模型。具體來講,首先從嚴肅游戲教學系統(tǒng)的反饋數(shù)據(jù)入手,設計了一系列游戲反饋數(shù)據(jù)的數(shù)據(jù)結構;基于此數(shù)據(jù)結構,設計并實現(xiàn)了一個學習者玩家數(shù)據(jù)分析流程;基于網絡空間安全虛擬仿真教學系統(tǒng),展示所提出模型的應用過程和效果。數(shù)據(jù)分析結果表明,本文設計的反饋數(shù)據(jù)結構特征具有明顯的聚集性,通過聚類能夠有效地將不同學科專業(yè)方向的玩家區(qū)別開來。
未來,嚴肅游戲教學系統(tǒng)開發(fā)者可以拓展本模型來實現(xiàn)更深層次的數(shù)據(jù)分析,以期根據(jù)不同學習者對不同知識領域的掌握情況來實施精準的知識單元推薦。此外,施教者可以拓展本模型來研究不同受教者之間的差異性特征,幫助其優(yōu)化教學過程。