黃丹霞 韓 英 焦怡博
北京電子科技學院,北京市 100070
在大數(shù)據(jù)時代,教學數(shù)據(jù)將成為大學的一項重要資產,應和其它有形資產一樣得到相應的重視和管理。 建設數(shù)據(jù)倉庫對于數(shù)據(jù)資產的整合、共享、分析、應用等具有基礎性的戰(zhàn)略意義,將成為學院在5G 時代的核心競爭力之一,為學院建設“智慧校園”打下堅實基礎。
國務院2015 年發(fā)布的《促進大數(shù)據(jù)發(fā)展行動綱要》(國發(fā)〔2015〕50 號)指出:“數(shù)據(jù)已成為國家基礎性戰(zhàn)略資源,大數(shù)據(jù)正日益對全球生產、流通、分配、消費活動以及經濟運行機制、社會生活方式和國家治理能力產生重要影響”。 邁爾-舍恩伯格在《大數(shù)據(jù)時代》中指出:“通過收集、處理、分析全體數(shù)據(jù)而不是抽樣數(shù)據(jù),發(fā)現(xiàn)事物的相關關系,大數(shù)據(jù)從根本上改變了人類探索世界的方法——從探尋‘為什么’到發(fā)現(xiàn)‘是什么’,因此大數(shù)據(jù)時代的思維變革、商業(yè)變革和管理變革比以往任何時候都更加深刻[1]”。
對于高等教育而言,借助大數(shù)據(jù)的支持構建高校教學質量評價體系既是必然趨勢,也是當務之急。 高等教育發(fā)達國家和地區(qū)的高校已經陸續(xù)建立了基于大數(shù)據(jù)的高校教學質量評價體系,如美國通過使用“學習管理系統(tǒng)”(Learningmanagement Systems)、“帆布”(Canvas)和“渴望學習”(Desire2 Learn)等教學系統(tǒng),對高校的教學管理與教學質量改進進行反饋與監(jiān)控[2]。 教育部從2016 年建立了“教育部高等教育質量監(jiān)測數(shù)據(jù)平臺”,高校各類數(shù)據(jù)通過網(wǎng)絡在平臺上報、在線即時生成數(shù)據(jù)分析報告,而不再采用人工報送紙質版的方式。
“信息技術與教育的深度融合,使得全方位、深度追蹤、量化學習過程,采集和匯聚教育場景中各類數(shù)據(jù)、乃至其它各種跨界數(shù)據(jù)成為可能”[5]。 因此,順應大數(shù)據(jù)時代發(fā)展趨勢,建立學院自有的數(shù)據(jù)倉庫,開展教學數(shù)據(jù)的規(guī)劃、采集、維護與利用工作,具有重要意義。
首先,通過持久收集多維度教學數(shù)據(jù),實現(xiàn)多維度教學反饋,可更加精準地分析課堂教學質量。 現(xiàn)有的教學質量評價,取決于學生期末教學評價、同行評價、專家聽課、管理干部聽課等階段性評價或終結性評價。 通過建立數(shù)據(jù)倉庫,持久收集多維度教學數(shù)據(jù),例如課堂到課率、師生課堂與網(wǎng)絡論壇互動情況等,結合學生的各類學習狀態(tài)數(shù)據(jù),如學生專業(yè)與班級排名、在線學習時長、圖書借閱記錄、論文閱讀與發(fā)表數(shù)量、參與項目研究等,借助大數(shù)據(jù)的數(shù)據(jù)分析與數(shù)據(jù)挖掘技術,可對課堂教學質量嘗試開展過程性評價,進一步提高評價的準確度。
其次,通過大數(shù)據(jù)的方式找到規(guī)律,可使學院教學質量監(jiān)控更加精準高效,實現(xiàn)“發(fā)現(xiàn)問題—反饋問題—改進相關保障制度與保障條件—解決問題”的教學質量保障閉環(huán)體系實時、有效運轉,為各類決策、精力投入、教學資源配置提供科學依據(jù)。 以圖形分析、報表等方式直觀展示數(shù)據(jù),實時計算和查詢各類數(shù)據(jù),可讓各個崗位的管理者更快、更準確地發(fā)現(xiàn)問題。 例如學生管理者可橫向對比班級之間的學生到課率、可隨時發(fā)現(xiàn)各類人群如某段時間缺課較多人群、不及格學分較高人群等,有針對性開展工作;例如教學投入決策時可橫向、縱向作大類比較,可計算人均投入、比較相關指標,可實時查詢各類明細等。
最后,在數(shù)據(jù)倉庫的基礎上建立數(shù)據(jù)應用平臺,可實現(xiàn)數(shù)據(jù)應用與共享,聯(lián)通“數(shù)據(jù)孤島”,使學院的管理工作更加精準高效、與兄弟院校的合作更加順暢。 數(shù)據(jù)共享包括高校之間、學院內部各部門之間的數(shù)據(jù)共享。 高校之間的數(shù)據(jù)共享,順應了慕課時代高校之間學分互認、教學資源開放共享的大趨勢,也可為高校管理者橫向對比各類數(shù)據(jù)提供參考;內部管理部門之間的數(shù)據(jù)共享,可在數(shù)據(jù)報送時免去大量的臨時統(tǒng)計工作,可免去跨部門業(yè)務辦理過程中管理人員大量的人工核對,同時也為辦事師生節(jié)省跑腿時間,從而把更多精力投放于教學。
學院當前的教學質量保障體系設計思路是一個動態(tài)運行的完整閉環(huán):“要通過質量監(jiān)控和自我評估,充分了解教學狀態(tài),科學分析和反饋質量信息,改進教學工作和管理機制,從而實現(xiàn)自我監(jiān)控和自我完善?!逼湓O計思想是在教學管理制度的運轉過程中,實現(xiàn)教學質量信息的分析、收集,把其中發(fā)現(xiàn)的問題反饋給教務處、人事處、財資處、后勤處、網(wǎng)信處、圖書館等相關職能部門,各部門聯(lián)動增強師資隊伍、教學設施、教學經費等各方面的保障;同時定期開展自我評估、完善教學質量標準體系,包括專業(yè)質量標準、課程質量標準、實踐教學質量標準等;相關標準的改進和完善又將反過來指導和作用于教學管理制度的改進。
目前學院已有教務系統(tǒng)、財務系統(tǒng)、人事管理系統(tǒng)、科研管理系統(tǒng)、學生管理系統(tǒng)、檔案管理系統(tǒng)、圖書查詢系統(tǒng)等多個單機版或網(wǎng)絡版的信息管理系統(tǒng),它們各自圍繞部門的核心業(yè)務需求量身打造,每天產生大量與教學相關的數(shù)據(jù);其中一部分系統(tǒng)如教務、科研等已經過多年運行使用,正在進行升級迭代工作,以整合原有系統(tǒng)功能、加入新的管理需求,通過系統(tǒng)架構與硬件的升級改造實現(xiàn)改進系統(tǒng)運行效率、加大數(shù)據(jù)共享力度、進一步提高管理效率與服務水平。
動態(tài)運行的教學質量反饋與改進機制,需要教學質量信息的即時分析與收集,需要即時、動態(tài)的數(shù)據(jù)支撐。 因此,要實現(xiàn)學院教學質量保障體系的動態(tài)運行,使教學質量保障閉環(huán)系統(tǒng)有效運轉,當前的信息化管理仍存在以下問題:一是缺少統(tǒng)一的規(guī)劃與數(shù)據(jù)管理機制。 各部門信息管理系統(tǒng)的數(shù)據(jù)格式根據(jù)各自業(yè)務需求規(guī)劃而成,缺少統(tǒng)一的數(shù)據(jù)字典,數(shù)據(jù)更新與維護機制更是依靠各崗位管理人員的管理水平,缺少統(tǒng)一管理。 二是尚未實現(xiàn)數(shù)據(jù)共享。 隨著數(shù)據(jù)報送業(yè)務的不斷增多、數(shù)據(jù)跨部門需求的不斷增強,數(shù)據(jù)聯(lián)通的管理需求日益強烈,數(shù)據(jù)孤島使得管理者在涉及跨部門數(shù)據(jù)、跨部門業(yè)務需要大量的人工核對。 三是在數(shù)據(jù)利用方面,目前只能對單一的教學數(shù)據(jù)開展數(shù)據(jù)分析。
因此,實現(xiàn)教學質量保障體系的閉環(huán)有效運轉,除了進一步加強基礎設施建設、完善教學質量監(jiān)控數(shù)據(jù)采集途徑之外,建設學院自有的數(shù)據(jù)倉庫是必不可少的措施。
在充分利用學院現(xiàn)有數(shù)字資源的基礎上,利用信息技術開展數(shù)據(jù)治理,把分散于各部門管理信息系統(tǒng)、格式不一的數(shù)據(jù)源加以整合,根據(jù)統(tǒng)一的數(shù)字字典轉換成需要的維度和,轉換成指標的集合,打通數(shù)據(jù)通道、聯(lián)通數(shù)據(jù)孤島、實現(xiàn)數(shù)據(jù)共享,打造統(tǒng)一的數(shù)據(jù)應用與展示平臺,為學院內部教學質量管理提供有力保障,實現(xiàn)以改進教學質量為目標的教學質量監(jiān)控;為學院領導與各部門的管理決策提供依據(jù);為教學相關的各類評估與日常業(yè)務提供數(shù)據(jù)呈現(xiàn)、實現(xiàn)數(shù)據(jù)共享。 整體構建邏輯架構如圖所示。 它涉及了數(shù)據(jù)倉庫建設的主要內容,筆者將在下個要點中展開闡述。
數(shù)據(jù)治理整體又可分解為數(shù)據(jù)標準、數(shù)據(jù)采集、數(shù)據(jù)整合與數(shù)據(jù)應用四方面的工作。
首先需要建立學院自有的本科教學數(shù)據(jù)管理規(guī)范。 建立了數(shù)據(jù)的標準化規(guī)范,就解決了“要讀取什么樣的數(shù)、各從哪里讀取”的問題;據(jù)此開展系統(tǒng)化的數(shù)據(jù)采集工作,解決“如何讀取數(shù)據(jù)”問題;搭建數(shù)據(jù)倉庫進行數(shù)據(jù)的加載、轉換和抽取,解決“數(shù)據(jù)如何進行規(guī)整存儲”問題;最后根據(jù)需求開發(fā)應用層的數(shù)據(jù)展示功能,解決“查詢哪些數(shù)據(jù)、展現(xiàn)哪些指標”的問題。
由此也可以看出,數(shù)據(jù)倉庫的建設不僅僅是簡單的信息技術問題,它同時也涉及到學院各管理層級的管理制度與相關指標體系。 日常教學管理、專業(yè)建設、課程建設、學生工作等各方面清晰的管理思路、順暢的管理流程,是開展數(shù)據(jù)治理、建設數(shù)據(jù)倉庫的重要前提,直接決定數(shù)據(jù)倉庫的建設成效。
除了鋪設、架構必要的數(shù)據(jù)采集設備外,以下幾項相關工作是數(shù)據(jù)倉庫建設的重要內容。
建立完善的數(shù)據(jù)管理制度,明確維護數(shù)據(jù)的業(yè)務崗位、職責人群、維護頻率、操作權限,落實每個相關崗位與數(shù)據(jù)的權責關系,保障所有本科教學元數(shù)據(jù)的唯一性和規(guī)范性;建立統(tǒng)一的數(shù)據(jù)標準與數(shù)據(jù)安全規(guī)范,明確數(shù)據(jù)的讀取、存儲、維護、修改、備份、使用、刪除、生命周期等各方面的規(guī)程。
建立統(tǒng)一的數(shù)據(jù)規(guī)范。
首先,明確數(shù)據(jù)范圍,解決“要讀取什么樣的數(shù)”的問題。 從數(shù)據(jù)源的層級來看,可分為教師與學生的個人狀態(tài)數(shù)據(jù)、校園教學活動數(shù)據(jù)等個體級數(shù)據(jù);與課程評價指標體系、課程建設情況相關的課程級數(shù)據(jù);與專業(yè)評價指標體系、專業(yè)建設相關的專業(yè)級數(shù)據(jù);反映學院基本情況的人、財、物、學、研、管等各類學院級數(shù)據(jù)。 從數(shù)據(jù)的類型來看,可分為結構化數(shù)據(jù)、半結構化數(shù)據(jù)與非結構化數(shù)據(jù)。
數(shù)據(jù)范圍與數(shù)據(jù)應用需求密不可分,范圍的確定可根據(jù)數(shù)據(jù)應用需求提前規(guī)劃設計。
其次,明確數(shù)據(jù)源,解決“數(shù)據(jù)各從哪里讀取”的問題。 根據(jù)數(shù)據(jù)范圍,確認相應的數(shù)據(jù)來源、維護者與維護周期,確保數(shù)據(jù)的唯一性、規(guī)范性與準確性。 這需要通過規(guī)章制度對把數(shù)據(jù)維護范圍與業(yè)務崗位相對應,從數(shù)據(jù)的源頭確保數(shù)據(jù)質量。
數(shù)據(jù)采集工作主要解決“如何讀取數(shù)據(jù)”問題。 數(shù)據(jù)的采集首先要有規(guī)律、保持一定的連續(xù)性,從而形成數(shù)據(jù)積累。 其次可運用一定的技術。 在線學習平臺、教務管理平臺以及科研、人事、學生、圖書館、資產等已有的管理系統(tǒng)是教育數(shù)據(jù)的重要來源,可通過接口定期導出或實時讀?。灰苿覣PP 技術可讀取學生使用移動終端通過移動網(wǎng)絡產生的學習數(shù)據(jù);對接一卡通數(shù)據(jù)可得到學生的在校活動、閱讀書籍等數(shù)據(jù);網(wǎng)絡爬蟲則可發(fā)現(xiàn)相關教學資源。 另外可在未來的基礎建設中鋪設相關數(shù)據(jù)采集設備,以補充現(xiàn)有數(shù)據(jù)源的不足。
數(shù)據(jù)的清洗、集成、變換和分類匯總主要解決“數(shù)據(jù)如何進行規(guī)整存儲”問題。 數(shù)據(jù)清洗解決通過一些途徑產生的不規(guī)范數(shù)據(jù);數(shù)據(jù)的集成和變換,則重點要遵守行業(yè)規(guī)范。 教育部于2012 年發(fā)布了《教育管理信息教育管理基礎代碼》等七項教育信息化行業(yè)標準,以提高數(shù)據(jù)的可訪問性、可共享性,解決高校內部、高校之間數(shù)據(jù)格式不兼容、不統(tǒng)一、無法共享的問題[3]。 此外,國際上一些通過標準也值得借鑒,如IMSQTI(問題與測試交互)標準、xAPI(學習體驗記錄)規(guī)范等[4]。 以此為前提,建立學院自有的數(shù)據(jù)字典,以規(guī)范學院后續(xù)的信息系統(tǒng)建設工作。
在數(shù)據(jù)存儲中,數(shù)據(jù)倉庫架構工作十分重要,可提高系統(tǒng)存儲的科學性與合理性。 將數(shù)據(jù)處理的要求涵蓋在系統(tǒng)處理架構設計標準中,按照系統(tǒng)處理的要求以及數(shù)據(jù)處理和調用的要求設計系統(tǒng)處理架;通過集群架構的設計,實現(xiàn)數(shù)據(jù)的分類存儲;此外,選擇合理的存儲方式提高數(shù)據(jù)存儲的安全穩(wěn)定性,例如當前應用廣泛的分布式存儲[6]。
數(shù)據(jù)應用與展示主要解決“查詢哪些數(shù)據(jù)、展現(xiàn)哪些指標”的問題。 可以考慮分為外部評估、自我評估、內部管理、服務師生(各類跨部門業(yè)務實現(xiàn)一站式整合)、數(shù)據(jù)上報、“駕駛艙數(shù)據(jù)”等展示模塊[7][8]。 “外部評估”與“自我評估”包括教學評估前、評估中需要向專家展示的學院、專業(yè)狀態(tài)數(shù)據(jù);“服務師生”通過數(shù)據(jù)整合實現(xiàn)跨部門數(shù)據(jù)和業(yè)務的一站式服務,如教師職稱評審、評優(yōu)推薦填表、本科研究生教學情況查詢等,一次登錄,全院查詢,免去師生多賬號多密碼登陸和辦事跨部門跑腿;“內部管理”可在日常教學檢查、教學督導中實時展示教室使用情況、教師與學生上課情況、實時查詢相關師生狀態(tài)數(shù)據(jù);“數(shù)據(jù)上報”包括教育部每年核定高校辦學條件的高基報表(高等院校的基本情況報表)、教育部每年通過“高等教育質量監(jiān)測國家數(shù)據(jù)平臺”向各高校征集的7 大類88 張反映高等學校教學基本狀態(tài)的數(shù)據(jù)表格等,實現(xiàn)相關表單直接導出核對,以日常工作中的數(shù)據(jù)積累,代替報送前的分工、臨時統(tǒng)計;另外可為學院各級管理人員設計相應的“駕駛艙”數(shù)據(jù),推送與崗位相對應的關鍵數(shù)據(jù),如院領導可查看辦學條件各類關鍵指標、學生管理者可收到學籍警告等各類學生信息。
數(shù)據(jù)展現(xiàn)是整個系統(tǒng)設計目標的體現(xiàn)。 在全院范圍內,由上至下開展系統(tǒng)的頂層設計,清晰規(guī)劃數(shù)據(jù)展現(xiàn)需求,可實現(xiàn)全院統(tǒng)一規(guī)劃,達到事半功倍的效果。
經過長時間的積累,存儲教學相關的海量數(shù)據(jù),既有利也有弊。 通過數(shù)據(jù)分析發(fā)現(xiàn)數(shù)據(jù)之間的關聯(lián)性,可為學院教學管理的智能決策提供參考。 反之,數(shù)據(jù)倉庫中的師生學習、工作記錄一旦被偵察,將會對信息安全產生巨大威脅。 結合學院的行業(yè)特色與上級部門的網(wǎng)絡安全管理要求,需要做到多方并舉,做好數(shù)據(jù)安全與保密工作。 一方面,需要設置嚴格的數(shù)據(jù)訪問控制策略,區(qū)分嚴格的數(shù)據(jù)訪問權限,實現(xiàn)強制訪問控制、自主訪問控制或基于用戶角色的訪問控制[9]。 另一方面,在選用數(shù)據(jù)倉庫和服務器時,盡量選用自主可控的國產化產品,可成為信息安全的有力保障。
搭建大學自有的數(shù)據(jù)倉庫,實現(xiàn)對本科教學全過程數(shù)據(jù)的采集、清洗、集成、變換、分類匯總與分析展示,可提高數(shù)據(jù)分析與利用效率,實現(xiàn)數(shù)據(jù)在高校之間與高校內部各部門間的共享,實現(xiàn)方便的教學數(shù)據(jù)報送,實現(xiàn)精準的教學質量監(jiān)控,實現(xiàn)數(shù)據(jù)展示與對比,為管理提供決策依據(jù)。在數(shù)據(jù)倉庫的搭建、運行與管理中,行業(yè)管理規(guī)范、數(shù)據(jù)管理制度與安全保密措施至關重要,必須貫穿數(shù)據(jù)倉庫建設的每一個環(huán)節(jié)。