李 煒 李 瀅
(1.浙江建設(shè)職業(yè)技術(shù)學(xué)院教育技術(shù)中心,浙江 杭州 310000;2.菲律賓國父大學(xué),菲律賓 馬尼拉 999005)
我國高校信息化發(fā)軔于20世紀(jì)80年代,前期十多年主要是校園網(wǎng)絡(luò)、CAI課件和分散獨(dú)立的管理信息系統(tǒng)建設(shè)。當(dāng)前,教育信息化已進(jìn)入2.0 時代,大數(shù)據(jù)、云計算、人工智能等新一代信息技術(shù)成為與教育共生融合的整體,高校正處于由“數(shù)字校園”向“智慧校園”轉(zhuǎn)變的關(guān)鍵節(jié)點(diǎn)[1],業(yè)務(wù)對技術(shù)的依賴逐日增長。然而因為各種因素,當(dāng)前高校的數(shù)據(jù)管理還存在著一些問題,這些問題阻礙了數(shù)據(jù)在智慧校園中發(fā)揮更大的作用,因此,需要探索一種適用于高校的數(shù)據(jù)治理路徑,推動智慧校園向縱深發(fā)展。
前期的高校信息化建設(shè),缺少統(tǒng)一的頂層設(shè)計[2],數(shù)據(jù)標(biāo)準(zhǔn)梳理時間滯后于系統(tǒng)的建設(shè)。行政部門、教輔部門、教學(xué)院系通常獨(dú)自購買或建設(shè)業(yè)務(wù)系統(tǒng),所采用的數(shù)據(jù)標(biāo)準(zhǔn)通常偏向于該業(yè)務(wù)領(lǐng)域的通用標(biāo)準(zhǔn),例如,人事系統(tǒng)通常采用企業(yè)的人力資源管理通用標(biāo)準(zhǔn),而科研系統(tǒng)通常采用科研管理領(lǐng)域的通用標(biāo)準(zhǔn),不同領(lǐng)域的標(biāo)準(zhǔn)風(fēng)格不同,導(dǎo)致校內(nèi)存在多種數(shù)據(jù)格式,同時,因為業(yè)務(wù)細(xì)化擴(kuò)展的緣故,這些領(lǐng)域的通用標(biāo)準(zhǔn)不一定完全適用于高校,甚至?xí)霈F(xiàn)“水土不服”,數(shù)據(jù)替代表示的情況也有出現(xiàn)。數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一,客觀上造成了數(shù)據(jù)孤島和數(shù)據(jù)打架,即使制定了紙質(zhì)的數(shù)據(jù)標(biāo)準(zhǔn),在推廣落地上還是存在效果不佳的問題。
“多頭錄入”現(xiàn)象較普遍,同一個數(shù)據(jù)在多個系統(tǒng)都存在錄入界面,數(shù)據(jù)使用需求方不清楚何為源頭,再者,目前高校工作人員的流動性增加,部門的工作職責(zé)范圍常有調(diào)整,數(shù)據(jù)錄入的工作人員崗位變動頻繁,這些源頭不清晰的情況導(dǎo)致數(shù)據(jù)責(zé)任不明確,更新公示不及時,數(shù)據(jù)的嚴(yán)謹(jǐn)程度、被重視程度不高,在問題數(shù)據(jù)出現(xiàn)時,各個部門之間互相推諉、爭論的情況時有發(fā)生,出現(xiàn)的問題往往無人認(rèn)領(lǐng),解決問題所花費(fèi)的時間成本非常高。
各個業(yè)務(wù)系統(tǒng)產(chǎn)生的數(shù)據(jù)質(zhì)量參差不齊,尤其是一些系統(tǒng)建設(shè)時以功能實現(xiàn)為主,缺少專業(yè)人員的系統(tǒng)嚴(yán)謹(jǐn)性驗證,部分?jǐn)?shù)據(jù)錄入頁面沒有進(jìn)行標(biāo)準(zhǔn)化、規(guī)范性、約束性的設(shè)計,如大量使用無約束的文本填寫框,引發(fā)了重要數(shù)據(jù)缺失、數(shù)據(jù)格式混亂、準(zhǔn)確性不高的質(zhì)量問題。
一些管理人員習(xí)慣于Excel管理各類數(shù)據(jù),存在數(shù)據(jù)錄入系統(tǒng)不及時的情況,導(dǎo)致共享給各個系統(tǒng)的數(shù)據(jù)存在滯后的問題。
結(jié)構(gòu)化數(shù)據(jù)庫之間的數(shù)據(jù)交換效率較低,傳統(tǒng)的技術(shù)如ODI數(shù)據(jù)交換平臺,在定時(T+1)的模式下工作比較穩(wěn)定,若采用CDC實時的模式,其穩(wěn)定性就要依賴于觸發(fā)器,觸發(fā)器對數(shù)據(jù)庫的業(yè)務(wù)性能有較大的影響,常有無規(guī)律停止的情況發(fā)生。此外,非結(jié)構(gòu)化數(shù)據(jù)如PDF、JPG文件的實時采集也是個難題。
過去,業(yè)務(wù)系統(tǒng)在建設(shè)時通常考慮的是錄入最后的結(jié)果數(shù)據(jù),并未貫徹過程化管理、伴隨式采集[3]的理念,這樣的斷點(diǎn)式數(shù)據(jù)蘊(yùn)藏的價值有限,在實時分析時無法利用數(shù)據(jù)的詳細(xì)演變過程來分析演變趨勢,從而無法做出準(zhǔn)確的決策。
為了進(jìn)一步提升智慧校園的數(shù)據(jù)服務(wù)能力,針對存在的數(shù)據(jù)管理問題,應(yīng)采取有效的治理措施,筆者所在高校探索了數(shù)據(jù)治理實現(xiàn)的路徑,主要思路是制定完整的數(shù)據(jù)發(fā)展規(guī)劃,基于數(shù)據(jù)的全生命周期管理理念,建立以數(shù)據(jù)標(biāo)準(zhǔn)為起點(diǎn)、數(shù)據(jù)應(yīng)用為終點(diǎn)、數(shù)據(jù)閉環(huán)治理為保障的大數(shù)據(jù)架構(gòu)體系,構(gòu)建了統(tǒng)一數(shù)據(jù)管理平臺,以期實現(xiàn)三大目標(biāo):責(zé)權(quán)清晰,優(yōu)化教育治理能力;數(shù)據(jù)驅(qū)動,提高信息服務(wù)的獲得感;精準(zhǔn)分析,以數(shù)據(jù)輔助學(xué)校管理決策。具體的治理工作是通過“五單一庫一指標(biāo)一通路”(圖1)來推進(jìn)實現(xiàn)的。
圖1 高校數(shù)據(jù)治理實現(xiàn)路徑
責(zé)任清單構(gòu)造了精確到數(shù)據(jù)項的數(shù)據(jù)責(zé)任體系,并實現(xiàn)了線上統(tǒng)一管理,明確告知各方每個數(shù)據(jù)項的源頭,其責(zé)任部門和唯一生產(chǎn)者,最終達(dá)到“一個數(shù)據(jù)一個部門一個人負(fù)責(zé)”,這個數(shù)據(jù)出了問題,就由這個責(zé)任部門和生產(chǎn)者來解釋。與傳統(tǒng)的紙質(zhì)標(biāo)準(zhǔn)相比,新版數(shù)據(jù)標(biāo)準(zhǔn)不再是空中樓閣,其使用效能大大提高,從技術(shù)和業(yè)務(wù)的角度均能真實落地,是全校的數(shù)據(jù)權(quán)威依據(jù),同時也為后續(xù)的數(shù)據(jù)核驗工作提供了技術(shù)規(guī)則依據(jù)和問題自動溯源的基礎(chǔ)。
責(zé)任分清楚之后,便開始技術(shù)和業(yè)務(wù)兩重審核,找出生產(chǎn)數(shù)據(jù)中所存在的問題,審核采用旁路監(jiān)督的方式,不影響數(shù)據(jù)的正常使用和流轉(zhuǎn)。技術(shù)審核是機(jī)器自動審核,系統(tǒng)利用完整性、規(guī)范性、一致性、準(zhǔn)確性、唯一性等技術(shù)性規(guī)則校驗數(shù)據(jù),并收集校驗未通過的問題數(shù)據(jù);業(yè)務(wù)審核是歸口部門人工審核,只有技術(shù)審核通過的數(shù)據(jù)才能按照數(shù)據(jù)審核流程自動流轉(zhuǎn)到對應(yīng)的業(yè)務(wù)工作人員的審核頁面中,審核人需要對業(yè)務(wù)的內(nèi)容進(jìn)行檢查,是否符合業(yè)務(wù)的真實情況,如有不符,標(biāo)記成問題數(shù)據(jù)。兩重審核的結(jié)果將匯總成問題清單。
任務(wù)清單旨在將傳統(tǒng)的少數(shù)人參與的階段式治理模式轉(zhuǎn)變成人人參與的常態(tài)化共治模式,數(shù)據(jù)治理是一項長期而又龐大的工程,任何一個部門、工作人員都無法獨(dú)立完成。因此只有借助責(zé)任清單和問題清單,打造針對生產(chǎn)者的任務(wù)清單,任務(wù)單自動智能分解,層層下發(fā),直接到具體的部門和具體的人,實現(xiàn)一條線閉環(huán)反饋,并為用戶提供每一個數(shù)據(jù)修改的快速跳轉(zhuǎn)入口,才能扎實推動數(shù)據(jù)質(zhì)量的提高,形成一項常態(tài)化、具體的工作,營造氛圍,使數(shù)據(jù)質(zhì)量的重要性深入人心。
填報清單是針對學(xué)校的主數(shù)據(jù),例如教職工、學(xué)生、專業(yè)等主體中最重要的基礎(chǔ)數(shù)據(jù),提供一站式錄入系統(tǒng),全面梳理教職工、學(xué)生涉及的人員類別,基于數(shù)據(jù)的全生命周期管理理念打造針對教職工、學(xué)生的全過程閉環(huán),聯(lián)合業(yè)務(wù)流程體系,實現(xiàn)伴隨式采集人這一主體的“進(jìn)?!薄白兓薄俺鲂!钡臄?shù)據(jù),從源頭控制住核心數(shù)據(jù)的質(zhì)量,實現(xiàn)“控重點(diǎn)、強(qiáng)骨架”的目標(biāo)。
為了消除數(shù)據(jù)相對封閉,開放機(jī)制尚未形成的問題,梳理了所有具備開放條件的數(shù)據(jù),以目錄清單的形式展現(xiàn),用戶能夠根據(jù)需用戶能夠根據(jù)需求勾選對應(yīng)的數(shù)據(jù)服務(wù),然后再發(fā)起申請。對接方式有基于HTTP方式,用機(jī)器碼、工號鑒別的方式來加強(qiáng)HTTP方式的安全性;基于數(shù)據(jù)庫接口方式,用戶可以使用數(shù)據(jù)服務(wù)的自帶標(biāo)準(zhǔn)直接在自管系統(tǒng)中快速完成正向工程。數(shù)據(jù)服務(wù)獲取支持基于最細(xì)粒度的數(shù)據(jù)共享接口:最小數(shù)據(jù)單元,即信息項,比如身份證、姓名等。以數(shù)據(jù)交換共享機(jī)制為依托,支持對信息項進(jìn)行無條件共享和條件共享,以及不予共享。
一庫就是“一庫一表”,為全校每個人建立一張成長記錄表,將散落在各個系統(tǒng)的數(shù)據(jù)圍繞人進(jìn)校全面梳理,并在數(shù)據(jù)中心匯集教師庫、學(xué)生庫,用戶不需要再登錄各個系統(tǒng)查詢本人的各類信息,在一個平臺內(nèi)就可以看到全部內(nèi)容,既能縱向看自己的關(guān)鍵時間線,也能橫向切片看細(xì)節(jié),在職稱評定資料準(zhǔn)備、畢業(yè)簡歷準(zhǔn)備中能夠為師生提供更好的服務(wù),提高用戶參與數(shù)據(jù)治理的獲得感。
一指標(biāo)是構(gòu)建數(shù)據(jù)質(zhì)量評價體系,針對全校、部門、業(yè)務(wù)系統(tǒng)、個人多個層次提供量化的質(zhì)量評價Q值,并進(jìn)行實時排名。Q值既是數(shù)據(jù)質(zhì)量狀態(tài)的晴雨表,Q值提高,說明問題不斷減少,數(shù)據(jù)質(zhì)量向好的方面發(fā)展,Q值也是各個部門治理工作績效的成績單,利用好Q值這個抓手,能夠?qū)崟r督促各方參與數(shù)據(jù)治理,配合詳細(xì)的質(zhì)量報告,各相關(guān)方可以查排名,知差距,找短板,從宏觀和微觀層面把握治理績效。
一通路是重新構(gòu)建數(shù)據(jù)流轉(zhuǎn)通路,針對高校的數(shù)據(jù)生態(tài)環(huán)境特點(diǎn),設(shè)計混合式的實時數(shù)據(jù)架構(gòu),首先利用OGG、Kafka、Spark等技術(shù)實現(xiàn)了基于日志的結(jié)構(gòu)化數(shù)據(jù)采集、計算和實時共享,在對源數(shù)據(jù)庫性能影響盡可能小的前提下,耗時從原來的平均1 h縮短到秒級;其次,針對存量業(yè)務(wù)系統(tǒng)中的非結(jié)構(gòu)化數(shù)據(jù),例如教師培訓(xùn)證書、科研論文、教師獲獎證書、學(xué)生獲獎證書等,開發(fā)采集軟件,連同關(guān)聯(lián)關(guān)系,抽取存儲到非結(jié)構(gòu)化存儲中,并規(guī)整統(tǒng)一的API訪問接口。最后,構(gòu)建學(xué)院的Hadoop大數(shù)據(jù)存儲中心,將過程性結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)統(tǒng)一存儲,為未來的大數(shù)據(jù)分析奠定基礎(chǔ)。
在治理工作啟動之前,首先制定了《學(xué)院數(shù)據(jù)管理辦法》,治理團(tuán)隊以“數(shù)說業(yè)務(wù)”、用數(shù)據(jù)推進(jìn)教育治理的出發(fā)點(diǎn),提高數(shù)據(jù)管理的站位,將需要學(xué)院決策層支持,各個部門配合的內(nèi)容和相關(guān)的考核辦法寫入制度,并提交學(xué)院審核發(fā)布執(zhí)行。制定了《數(shù)據(jù)質(zhì)量考核辦法》,明確了數(shù)據(jù)質(zhì)量的量化評價指標(biāo),所有工作有憑據(jù),公平公正推進(jìn)。
在實踐過程中,學(xué)校和企業(yè)研發(fā)人員共同研究,設(shè)計開發(fā)了一套針對高校特點(diǎn)的數(shù)據(jù)管理平臺,統(tǒng)一的大平臺將數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量、數(shù)據(jù)填報、數(shù)據(jù)開放、數(shù)據(jù)底盤分析中心、數(shù)據(jù)瀏覽、領(lǐng)導(dǎo)駕駛艙、數(shù)據(jù)融合管理各個模塊囊括其中,需要處理的事項一目了然,也提高了師生用戶的數(shù)據(jù)素養(yǎng),平臺各個模塊相互協(xié)調(diào)融合,實現(xiàn)了連通所有、管理所有、服務(wù)師生、立足當(dāng)下、預(yù)見未來的目標(biāo),切實提高數(shù)據(jù)支撐教學(xué)、管理的能力,充分發(fā)揮學(xué)院的數(shù)據(jù)內(nèi)在價值。
在對學(xué)院數(shù)據(jù)進(jìn)行地毯式的全面排查梳理中,發(fā)現(xiàn)了系統(tǒng)應(yīng)用的薄弱點(diǎn)改進(jìn)和補(bǔ)充列入了計劃,未來的升級、建設(shè)有據(jù)可依,在構(gòu)建責(zé)任清單時,各個部門各抒己見,將歷史遺留問題逐一協(xié)商,其中產(chǎn)生了較多有趣的想法和創(chuàng)新的應(yīng)用場景,例如過程式教學(xué)評價、專業(yè)群建設(shè)、師生發(fā)展、校園物聯(lián)感知[4]等方面,對于學(xué)院的發(fā)展大有意義。
數(shù)據(jù)治理是一項長期的、復(fù)雜的綜合性系統(tǒng)工程[5],不能一蹴而就,首先需要結(jié)合學(xué)校自身的業(yè)務(wù)需求及發(fā)展?fàn)顩r,設(shè)計完善的體系,制定必要的制度和考核辦法。在數(shù)據(jù)治理過程中,應(yīng)有優(yōu)先順序,合理設(shè)置數(shù)據(jù)治理的短期及長期目標(biāo),例如首先對最核心的主數(shù)據(jù)先進(jìn)行治理,然后再分階段逐步推進(jìn)各個業(yè)務(wù)主題的治理。同時,治理的評價指標(biāo)需是可量化的,以此對各個責(zé)任主體進(jìn)行有效的績效評價,提高各部門的重視和配合程度。
高校數(shù)據(jù)治理不能靠某一個部門完成,需要統(tǒng)籌協(xié)調(diào),多方參與,自上而下進(jìn)行推進(jìn)。因此,需要從體制機(jī)制建設(shè)、人員意識培養(yǎng)、組織職責(zé)劃分等多方面進(jìn)行綜合設(shè)計,才能確保數(shù)據(jù)治理達(dá)到理想效果。