房曉陽 肖長水
(蘇州市職業(yè)大學信息中心,江蘇蘇州 215000)
隨著疫情的不斷發(fā)展,高職院校常態(tài)化和持久化的防控對相關信息化建設提出了更高的要求,如何采用科技手段進行低成本和無感知的防控是擺在教育信息化工作者面前的一道難題[1-4]。疫情期間的信息化建設基于以往的智慧校園建設內(nèi)容,防疫應用并非是獨立于智慧校園體系之外的,而是與前期的建設相輔相成、密不可分的[5-8]。以蘇州市職業(yè)大學為例,前期已經(jīng)積累完成了學工、人事、一卡通、宿舍、輔導員(請假、考勤和查寢)系統(tǒng),對于人員信息的掌握已經(jīng)能夠達到常規(guī)的管理要求,不過,要能夠對單一人員的精準信息管理還需要融合多個系統(tǒng)的業(yè)務功能,就之前來說,實現(xiàn)的難度和代價都是較高的。
因此,本文結合蘇州市職業(yè)大學利用信息化手段輔助抗疫的例子,闡述了基于數(shù)據(jù)中臺構建疫情防控應用體系的工作,同時也總結了其中的不足之處,試圖深入挖掘數(shù)據(jù)中臺在其中發(fā)揮的價值和作用,為今后高職院校相關的應用實踐走向規(guī)范提供借鑒與參考。
信息中心作為統(tǒng)籌信息化建設的部門,在本次疫情防控中遇到的問題主要有:
疫情防控在高職院校內(nèi)是一種綜合性的應用,需要整合各個業(yè)務條線的數(shù)據(jù),教師和學生基礎信息、學生在校狀態(tài)、學生請假、人員人臉照片、上網(wǎng)數(shù)據(jù)、各種刷卡、打卡記錄。整合后的數(shù)據(jù)需要進行清洗和轉化,具體來說,數(shù)據(jù)整合存在一定困難,體現(xiàn)在幾個方面:
(1)不同系統(tǒng)存在架構不同,部署方式不同(本地、云端)、建設時期不同導致的文檔資料完備程度不同、提供數(shù)據(jù)的方式不同等。
(2)疫情期間上線了大量軟硬件項目,需要對這些軟硬件系統(tǒng)產(chǎn)生的數(shù)據(jù)進行采集;同時,這些系統(tǒng)也提出了數(shù)據(jù)的需求,例如校門、宿舍的門禁需要獲取高質量的學生、教師照片來進行人臉識別算法特征的獲取。
(3)數(shù)據(jù)標準不同,數(shù)據(jù)的質量差,如今數(shù)據(jù)作為一種資產(chǎn)已經(jīng)成為共識,但是要真正發(fā)揮數(shù)據(jù)價值,還需要提高數(shù)據(jù)的易用性,而易用性的基礎就是數(shù)據(jù)的質量。
數(shù)據(jù)的使用困難主要是數(shù)據(jù)的共享方式、來源過多和數(shù)據(jù)質量導致的:
(1)中間庫與ODI、定時任務。以往的系統(tǒng)與系統(tǒng)間的數(shù)據(jù)共享方式大多采用中間數(shù)據(jù)庫的方式,利用定時任務、ODI等集成的產(chǎn)品,進行數(shù)據(jù)庫到數(shù)據(jù)庫的同步,這種機制技術細節(jié)都掌握在廠商手中,院校的數(shù)據(jù)主管部門很難對這些同步作業(yè)去進行監(jiān)管,出現(xiàn)的問題如果沒有及時處理導致數(shù)據(jù)的不準確問題積壓,久而久之,使得數(shù)據(jù)變得不可信。
(2)同一個數(shù)據(jù)項,存在多個備份。由于數(shù)據(jù)的同步過程缺乏監(jiān)管,導致了同一個數(shù)據(jù)項可能在多個系統(tǒng)中都存在備份,會形成以哪方的數(shù)據(jù)為準的新問題。此外,由于早期數(shù)據(jù)孤島的存在,一些公共數(shù)據(jù)可能在很多系統(tǒng)中都存在備份,而這些備份可能是不完全相同的,這也會造成數(shù)據(jù)難以利用的問題。
(3)質量低下,錯誤多。以上兩點都會導致數(shù)據(jù)質量低下,數(shù)據(jù)難以利用的問題,另外一種常見問題就是手工導入導出,由于人工操作不可避免的疏忽,也會增加數(shù)據(jù)出錯的風險。
智慧校園建設以來,蘇州市職業(yè)大學積累了海量信息數(shù)據(jù),但現(xiàn)有數(shù)據(jù)相對分散、標準不完善、共享形式單一、質量較差、難以利用。為了提升數(shù)據(jù)共享和數(shù)據(jù)資產(chǎn)管理,我校于2019年啟動了數(shù)據(jù)中臺項目,將各個業(yè)務部門的數(shù)據(jù)進行匯聚,首先形成ODS(貼源層),經(jīng)過一定的數(shù)據(jù)清洗、加工后,再按照主題進行歸類,形成全校級的數(shù)據(jù)倉庫,最后根據(jù)業(yè)務場景細分,建成數(shù)據(jù)門戶。使用方在有數(shù)據(jù)需求的時候,可以瀏覽數(shù)據(jù)門戶,提出申請或需求,通過中臺提供的標準化的方式進行接入,方便獲取數(shù)據(jù)。數(shù)據(jù)中臺架構如圖1 所示,包含以下幾個功能模塊:
圖1 數(shù)據(jù)中臺架構Fig.1 Data center architecture
(1)交換平臺與數(shù)據(jù)湖:交換平臺負責交換作業(yè)的編排、部署、調(diào)度監(jiān)控、數(shù)據(jù)服務的定義、路由和監(jiān)控等功能;數(shù)據(jù)湖包含了通過集成得到的結構化、文件數(shù)據(jù)、日志數(shù)據(jù)等全量數(shù)據(jù)。
(2)資產(chǎn)平臺:資產(chǎn)平臺是對采集到的數(shù)據(jù)進行數(shù)據(jù)資產(chǎn)編目的過程、主要體現(xiàn)在對于元數(shù)據(jù)的采集和管理,數(shù)據(jù)編目后關聯(lián)到部門,形成數(shù)據(jù)資產(chǎn)。
(3)服務平臺:服務平臺主要是可以針對資產(chǎn)平臺和交換平臺形成數(shù)據(jù)接口服務,針對服務可以進行權限管理、版本管理、注冊管理和認證管理等。
(4)數(shù)據(jù)門戶:數(shù)據(jù)門戶是面向一般用戶可以開放的平臺,可以讓管理部門查看自己的數(shù)據(jù)資產(chǎn),也可以將數(shù)據(jù)申請、數(shù)據(jù)需求的流程放置在此平臺上,門戶的設計隱藏了技術細節(jié),使用更加能夠讓普通師生可以理解的設計方式。
(5)管理規(guī)范:數(shù)據(jù)中臺能夠發(fā)揮作用,最重要的是形成數(shù)據(jù)的管理規(guī)范,包含了數(shù)據(jù)標準、數(shù)據(jù)的質量規(guī)范、數(shù)據(jù)責任部門、共享規(guī)則,申請使用流程等內(nèi)容。
人臉識別由于其無接觸式的優(yōu)勢,在本次疫情期間被我校廣泛應用在校門和宿舍的出入門禁閘機系統(tǒng)上,取代了傳統(tǒng)的一卡通或人工驗證方式。在及時構建人臉識別應用系統(tǒng)中,數(shù)據(jù)中臺發(fā)揮了很大的作用,依賴于其賦能作用,將底層系統(tǒng)的基礎數(shù)據(jù)快速的共享下發(fā)給應用建設的廠商,而人臉識別最為關鍵的人員照片問題,也通過數(shù)據(jù)中臺的數(shù)據(jù)集成和數(shù)據(jù)處理得以實現(xiàn)。
以我校建設的防疫應用為例,整體架構如圖2所示,可以分為三個層次,分別為采集層、中臺層和應用層。
圖2 防疫應用整體架構Fig.2 Main architecture of epidemic prevention application
采集層主要負責對異構的數(shù)據(jù)源進行采集,涉及到的信息主要是來源于一卡通、學工、人事和教務系統(tǒng)的人員基本信息,采集方式主要是定時任務讀取數(shù)據(jù)庫的方式;而照片數(shù)據(jù)主要來源于各個系統(tǒng)中的照片文件,但是這些照片往往質量不佳,無法達到人臉系統(tǒng)算法讀取特征值的要求,因此在本次疫情期間,上線了照片采集器,可以讓師生自主去拍照傳入系統(tǒng),而采集器的后臺系統(tǒng)支持通過增量的API接口提供給數(shù)據(jù)中臺照片的數(shù)據(jù)。
首先,中臺層將獲取到的數(shù)據(jù)進行數(shù)據(jù)清洗、數(shù)據(jù)集成和數(shù)據(jù)歸約,通過定時任務和數(shù)據(jù)集成工具,綜合幾個系統(tǒng)提供的數(shù)據(jù)來源,采集到數(shù)據(jù)倉庫中。
其次,中臺層需要對數(shù)據(jù)倉庫中數(shù)據(jù)進行轉化,便于提供給應用層使用,照片數(shù)據(jù)可以轉化為文件、base64和二進制等多分辨率的多種形式;人員數(shù)據(jù)和住宿數(shù)據(jù)只保留在籍學生和在職教職工的數(shù)據(jù)。
最后,通過中臺層開放出去的數(shù)據(jù)接口,對于用戶(應用廠商)來說是不需要知道數(shù)據(jù)來源的,用戶只需要提出數(shù)據(jù)的需求即可,而中臺也可以對數(shù)據(jù)接口的調(diào)用情況、吞吐流量情況進行管理和監(jiān)控,對于出現(xiàn)問題的接口及時進行處理,從而保證業(yè)務的穩(wěn)定。
應用層的應用可以通過主動方式從接口獲取數(shù)據(jù),也可以提供接口或者數(shù)據(jù)源被動接受數(shù)據(jù)。人臉識別應用推薦接入采集器采集到的照片數(shù)據(jù),如果該人員未進行過照片采集,則自動降級為一卡通系統(tǒng)的照片,由于采用中臺架構,因此后期如果數(shù)據(jù)源發(fā)生變化,都可以很方便的進行無感知的切換;由于疫情防控要求,本地公安局要求自動推送在籍學生的基本信息,通過數(shù)據(jù)中臺已經(jīng)歸集到的數(shù)據(jù),得以快速實現(xiàn)此需求。
另一方面,門禁系統(tǒng)既是數(shù)據(jù)的消費方,也是數(shù)據(jù)的生產(chǎn)方,其本身產(chǎn)生的刷卡數(shù)據(jù)也會被數(shù)據(jù)中臺采集,而師生的進出數(shù)據(jù)可以用來作為判斷其是否在校、是否在宿的重要數(shù)據(jù)來源,結合其他刷卡設備、安防攝像頭識別,更是可以基于校園地理信息系統(tǒng)繪制出校內(nèi)人員的行動軌跡圖,為疫情防控提供重要信息化支持。
就本輪疫情以來的信息化實踐來說,從內(nèi)部和外部兩個方面來分析不足:
就數(shù)據(jù)中臺自身來說,首先,數(shù)據(jù)中臺能夠發(fā)揮多大作用,在于其匯聚的數(shù)據(jù)的數(shù)據(jù)編目有多大,更在于數(shù)據(jù)的質量的高低,也就是提供出來的數(shù)據(jù)是否是可用的,要保證這一點,需要有一個有效的數(shù)據(jù)管理規(guī)范和數(shù)據(jù)質量標準,而信息管理部門需要提升業(yè)務素質,畢竟數(shù)據(jù)離開了業(yè)務,也只是無源之水,無法發(fā)揮其價值;其次,作為上游應用所依賴的數(shù)據(jù)來源,數(shù)據(jù)中臺平臺自身的穩(wěn)定新毋庸置疑是擺在首位的,平臺自身的集成任務、交換任務包括所提供的數(shù)據(jù)接口都需要提升自我糾錯能力,能夠對發(fā)生的錯誤進行及時的反饋和預警,便于技術人員第一時間干預解決;最后,數(shù)據(jù)作為一種重要的資源,需要在使用過程中保障其安全性,防止數(shù)據(jù)泄露,所以數(shù)據(jù)接口需要有驗證機制,防止非法的訪問,同時在傳輸過程中,可以使用加簽機制,防止數(shù)據(jù)的意外篡改,另外,在一些敏感的隱私數(shù)據(jù)的處理上,可以采取脫敏的處理方法,加強對特定數(shù)據(jù)的防護。
對人員數(shù)據(jù)信息的把控還不夠全面和精細,目前校內(nèi)的認證系統(tǒng)主要有三種:(1)一卡通;(2)上網(wǎng)認證;(3)通道閘機(校門、宿舍、圖書館等樓宇),對于教職工或持有一卡通的其他類別人員來說,可以有效通過上述幾種認證方式關聯(lián)到其真實的信息,而對于其他類別的臨時人員,如快遞人員、臨時后勤物業(yè)人員,兼課與兼職人員,這些人員的管理主體在不同的業(yè)務條線上,缺乏統(tǒng)一的系統(tǒng)對其身份進行把控,這一點也凸顯出以往智慧校園統(tǒng)一身份認證的一個盲點,也就是對于一些不需要或少量使用校內(nèi)系統(tǒng)的人員,是沒有統(tǒng)一身份認證賬號的,他們的身份系統(tǒng)如果在將來能夠有效進行信息化管理,則可以大大加強學校對于人員管理的顆粒度。
隨著教育2.0行動的不斷深化,智慧校園建設也面臨著更精細化的需求,在這種背景之下,本次疫情如同一次測驗,真正考驗了高職院校的信息化建設水平。本文探討了基于數(shù)據(jù)中臺的疫情防控體系建設的必要性、具體實施和不足之處,從中可以看出,中臺架構提供了一種技術上的解決方案,有助于降低管理成本,實現(xiàn)精準施策,因此,在未來的規(guī)劃中,更應該側重于運用數(shù)據(jù)中臺的賦能作用,切實筑牢高職院校疫情防控銅墻鐵壁,同時也可以提升人員管理水平。