文/武漢大學(xué)人事部 楊芳 袁園(通訊作者)
我國高校信息化經(jīng)過30 多年的發(fā)展歷程,經(jīng)歷網(wǎng)絡(luò)設(shè)施建設(shè)、應(yīng)用系統(tǒng)建設(shè)和數(shù)字校園集成等階段,隨著信息技術(shù)的不斷發(fā)展和應(yīng)用創(chuàng)新,正從數(shù)字校園逐漸轉(zhuǎn)型成為智慧校園[1]。高校在信息化發(fā)展過程中,通過信息系統(tǒng)的建設(shè)使用,逐漸沉淀和積累了各類數(shù)據(jù)資源。這些數(shù)據(jù)資源是實(shí)現(xiàn)高效管理、優(yōu)質(zhì)服務(wù)和科學(xué)決策的重要基礎(chǔ),是支撐高??沙掷m(xù)發(fā)展的重要資產(chǎn)。而高校普遍在數(shù)據(jù)的質(zhì)量、共享、應(yīng)用、安全等方面存在不足和短板,影響數(shù)據(jù)效能的充分發(fā)揮。準(zhǔn)確把握數(shù)據(jù)管理的現(xiàn)狀問題,制定科學(xué)合理的數(shù)據(jù)治理策略,對高校信息化管理者具有重要的現(xiàn)實(shí)指導(dǎo)意義。
本文在與業(yè)務(wù)人員面對面訪談、查閱相關(guān)參考文獻(xiàn)的基礎(chǔ)上,深入分析高校信息化發(fā)展現(xiàn)狀,將高校數(shù)據(jù)管理方面存在的問題歸納為以下幾類:
(一)數(shù)據(jù)來源復(fù)雜多變。近年來,我國高等教育信息化的水平持續(xù)提升,面向教學(xué)、科研、管理、服務(wù)的各類業(yè)務(wù)系統(tǒng)紛紛出現(xiàn)。與此同時(shí),信息填報(bào)與業(yè)務(wù)辦理越來越普遍和頻繁,甚至出現(xiàn)多頭采集、重復(fù)填報(bào)數(shù)據(jù)等現(xiàn)象,占用了教職工和學(xué)生大量的時(shí)間和精力。數(shù)據(jù)來源途徑復(fù)雜而分散,數(shù)據(jù)從生成到利用的路徑不清晰。以教學(xué)科研成果數(shù)據(jù)為例,各類績效考核、職稱評(píng)審、項(xiàng)目申報(bào)都是重要的依據(jù),但普遍存在不同業(yè)務(wù)系統(tǒng)重復(fù)錄入的現(xiàn)象,產(chǎn)生數(shù)據(jù)重復(fù)、冗余、不一致等問題,在后繼的共享應(yīng)用中,沒有形成清晰的來源。尤其在部分系統(tǒng)的新舊更替中,數(shù)據(jù)的來源與去向頻繁變動(dòng),對高校數(shù)據(jù)管理帶來了很多潛在的問題。
(二)數(shù)據(jù)標(biāo)準(zhǔn)缺乏控制。高校信息化建設(shè)中缺少頂層設(shè)計(jì),數(shù)據(jù)標(biāo)準(zhǔn)滯后于系統(tǒng)建設(shè)的問題普遍存在。首先是規(guī)劃、制定、優(yōu)化數(shù)據(jù)標(biāo)準(zhǔn)的能力較為欠缺,其次,雖然制定了數(shù)據(jù)標(biāo)準(zhǔn),但執(zhí)行、落實(shí)的力度不夠,甚至在某種程度上形同虛設(shè)。業(yè)務(wù)系統(tǒng)的更替,往往數(shù)據(jù)標(biāo)準(zhǔn)要適應(yīng)業(yè)務(wù)系統(tǒng),而非業(yè)務(wù)系統(tǒng)建設(shè)時(shí)以數(shù)據(jù)標(biāo)準(zhǔn)為主的現(xiàn)象依然普遍[2]。學(xué)校各部門購置或者建設(shè)業(yè)務(wù)系統(tǒng)時(shí),往往采用符合本部門業(yè)務(wù)需求的數(shù)據(jù)標(biāo)準(zhǔn)。例如,人事資源管理系統(tǒng)可能采用人力資源管理領(lǐng)域的通用標(biāo)準(zhǔn),而科研管理系統(tǒng)可能采用科研管理領(lǐng)域的通用標(biāo)準(zhǔn),不同管理領(lǐng)域的差異導(dǎo)致業(yè)務(wù)系統(tǒng)數(shù)據(jù)格式不統(tǒng)一。由于數(shù)據(jù)的格式、內(nèi)容不固定,導(dǎo)致其在不同系統(tǒng)的不一致,在轉(zhuǎn)換格式后才能相互對接,甚至造成了部分舍棄,影響了數(shù)據(jù)的共享和整合。
(三)數(shù)據(jù)質(zhì)量難以保障。數(shù)據(jù)來源和標(biāo)準(zhǔn)的不足,也對數(shù)據(jù)質(zhì)量造成了直接的影響。由于各部門業(yè)務(wù)系統(tǒng)相互獨(dú)立,對數(shù)據(jù)質(zhì)量的要求也存在差異。很多業(yè)務(wù)系統(tǒng)在建設(shè)的過程中注重實(shí)現(xiàn)系統(tǒng)的功能,忽略數(shù)據(jù)質(zhì)量的控制,在錄入或?qū)霐?shù)據(jù)時(shí)缺乏必備性、標(biāo)準(zhǔn)性、規(guī)范性的約束,數(shù)據(jù)缺失、格式混亂、數(shù)值錯(cuò)誤、準(zhǔn)確率低等質(zhì)量問題較為普遍。管理人員不足、缺少信息化能力等原因,也可能成為影響數(shù)據(jù)質(zhì)量的因素。除了數(shù)據(jù)缺失、不符合格式等明顯錯(cuò)誤,還有很多是因?yàn)閿?shù)據(jù)錄入造成的隱性錯(cuò)誤,這些問題通過技術(shù)手段難以發(fā)現(xiàn),需要人工校對才能確認(rèn)并糾正,需要占用大量的人力和時(shí)間。
(四)數(shù)據(jù)共享交換不暢。高校很多的業(yè)務(wù)系統(tǒng)之間存在一定的依賴關(guān)系,需要數(shù)據(jù)的共享,暢通的數(shù)據(jù)交換對可靠的數(shù)據(jù)共享起著重要的作用。因一些崗位的人員變動(dòng)頻繁,更新也不及時(shí),對下游的共享帶來了不便。常見的數(shù)據(jù)共享交換有數(shù)據(jù)庫交換、文件傳輸交換、API接口交換等方式。數(shù)據(jù)庫交換方式在業(yè)務(wù)系統(tǒng)數(shù)量較少、數(shù)據(jù)庫類型一致時(shí)易于實(shí)現(xiàn),但在業(yè)務(wù)系統(tǒng)數(shù)量多、數(shù)據(jù)庫異構(gòu)時(shí),存在讀寫性能瓶頸與兼容性適配的局限。文件傳輸方式基于數(shù)據(jù)的導(dǎo)入導(dǎo)出,適合異構(gòu)數(shù)據(jù)庫之間的共享,但效率較低,難以滿足實(shí)效性的需求。API接口交換在實(shí)時(shí)性、異構(gòu)性上均有優(yōu)勢,但技術(shù)實(shí)現(xiàn)較為復(fù)雜,需要不同應(yīng)用廠商的配合。在數(shù)據(jù)共享交換上,高校往往選擇技術(shù)實(shí)現(xiàn)較為簡單、支持不同類型數(shù)據(jù)庫的方式?;趥鹘y(tǒng)ETL(抽取、轉(zhuǎn)換、加載)的數(shù)據(jù)庫交換目前在高校應(yīng)用中仍然比較常見,該方式在定時(shí)(如每天一次)模式下相對穩(wěn)定。若想實(shí)現(xiàn)實(shí)時(shí)模式的ETL,因?yàn)閿?shù)據(jù)傳輸量大大增加,需采用觸發(fā)器方式來實(shí)現(xiàn),對數(shù)據(jù)庫的讀寫性能造成較大負(fù)擔(dān),甚至導(dǎo)致數(shù)據(jù)庫服務(wù)的異常,進(jìn)而造成數(shù)據(jù)共享的中斷。因?yàn)檫@些原因,數(shù)據(jù)共享交換的滯后性、不穩(wěn)定性,造成了不同業(yè)務(wù)系統(tǒng)之間數(shù)據(jù)更新不通暢,在校園日常生活中較為常見,比如更換校園卡后第二天才能在門禁設(shè)備上正常使用、欠費(fèi)繳清后不能立即辦理相關(guān)手續(xù)等。
數(shù)據(jù)治理是指將數(shù)據(jù)作為資產(chǎn)而開展的一系列組織行為,貫穿數(shù)據(jù)管理的全生命周期。數(shù)據(jù)治理需要結(jié)合技術(shù)與管理的手段,形成標(biāo)準(zhǔn)化與持續(xù)改善的機(jī)制,實(shí)現(xiàn)提升數(shù)據(jù)質(zhì)量、保障數(shù)據(jù)可用性的主要目標(biāo),具體內(nèi)容包括組織架構(gòu)、政策制度、技術(shù)工具、數(shù)據(jù)標(biāo)準(zhǔn)、流程規(guī)范、監(jiān)督及考核等方面[3]?;趩栴}導(dǎo)向的原則,制定適合高校實(shí)際的數(shù)據(jù)治理策略,明確數(shù)據(jù)來源與部門責(zé)任,制定并落實(shí)數(shù)據(jù)標(biāo)準(zhǔn),建立用戶反饋與糾錯(cuò)機(jī)制,促進(jìn)數(shù)據(jù)質(zhì)量提升,優(yōu)化數(shù)據(jù)共享交換,更加充分發(fā)揮數(shù)據(jù)效能,總體框架如圖1所示。
圖1 基于問題導(dǎo)向的高校數(shù)據(jù)治理總體框架
因此,需要以問題為導(dǎo)向,針對性的解決數(shù)據(jù)管理中面臨的主要問題與挑戰(zhàn),制定數(shù)據(jù)治理的具體策略。
(一)落實(shí)“一數(shù)一源”機(jī)制?!耙粩?shù)一源”指的是高校信息化所需的每一條基礎(chǔ)數(shù)據(jù)有且只有一個(gè)對數(shù)據(jù)的真實(shí)性和準(zhǔn)確性負(fù)責(zé)的業(yè)務(wù)部門,對相關(guān)數(shù)據(jù)資產(chǎn)的唯一性、一致性和可用性負(fù)責(zé)。在明確數(shù)據(jù)源責(zé)任單位的基礎(chǔ)上,構(gòu)建數(shù)據(jù)資源的共享與保障體系,保障數(shù)據(jù)質(zhì)量和利用效率。通??筛鶕?jù)數(shù)據(jù)業(yè)務(wù)屬性和部門業(yè)務(wù)職責(zé),確定各類數(shù)據(jù)產(chǎn)生的歸屬部門為數(shù)據(jù)源單位。各數(shù)據(jù)源部門落實(shí)“一數(shù)一源”的機(jī)制要求,負(fù)責(zé)相關(guān)數(shù)據(jù)的采集、處理和質(zhì)量管理,保障數(shù)據(jù)的準(zhǔn)確性、完整性、及時(shí)性,避免對同一數(shù)據(jù)重復(fù)采集、多頭管理。
良性的數(shù)據(jù)循環(huán)機(jī)制的建立是十分有必要的,高校的人事、教務(wù)、學(xué)工等系統(tǒng)是數(shù)據(jù)采集的主要源頭,要在數(shù)據(jù)源頭補(bǔ)足短板,已有的要全量歸集,沒有的要及時(shí)補(bǔ)充。建設(shè)全校統(tǒng)一的共享數(shù)據(jù)庫基礎(chǔ)平臺(tái),已經(jīng)建立數(shù)據(jù)標(biāo)準(zhǔn)、確定數(shù)據(jù)源頭的業(yè)務(wù)數(shù)據(jù),應(yīng)采取適當(dāng)工具抽取并存儲(chǔ)到共享數(shù)據(jù)庫中,不能通過工具抽取的線下數(shù)據(jù)可通過填報(bào)工具錄入或文件導(dǎo)入。采集范圍可隨著數(shù)據(jù)責(zé)任、數(shù)據(jù)標(biāo)準(zhǔn)的推廣和落實(shí),逐步擴(kuò)展到各業(yè)務(wù)部門和業(yè)務(wù)系統(tǒng)。歷史數(shù)據(jù)應(yīng)該采取有效的存檔機(jī)制,記錄數(shù)據(jù)變更的過程。
(二)有效推行數(shù)據(jù)標(biāo)準(zhǔn)。標(biāo)準(zhǔn)被定義為“用來判斷其他事物質(zhì)量的好東西”或“由權(quán)威建立和確定。作為衡量數(shù)量、重量、范圍、價(jià)值或質(zhì)量的規(guī)則”。數(shù)據(jù)標(biāo)準(zhǔn)是指保障數(shù)據(jù)定義和使用的一致性、準(zhǔn)確性和完整性的規(guī)范性約束,是對數(shù)據(jù)的命名、數(shù)據(jù)類型、長度、業(yè)務(wù)含義、統(tǒng)計(jì)口徑、歸屬部門等,定義統(tǒng)一的規(guī)范,保證各業(yè)務(wù)部門、各業(yè)務(wù)系統(tǒng)對數(shù)據(jù)的統(tǒng)一理解、對數(shù)據(jù)定義和使用的一致性。數(shù)據(jù)規(guī)范體系的建設(shè)是數(shù)據(jù)治理目標(biāo)實(shí)現(xiàn)的保障,有助于數(shù)據(jù)在不同業(yè)務(wù)部門、系統(tǒng)的共享、交互和應(yīng)用。在高校數(shù)據(jù)治理實(shí)踐中,應(yīng)參考國家和教育部頒發(fā)的數(shù)據(jù)標(biāo)準(zhǔn),結(jié)合自身實(shí)際編制數(shù)據(jù)標(biāo)準(zhǔn),包括數(shù)據(jù)定義、數(shù)據(jù)格式以及數(shù)據(jù)應(yīng)用標(biāo)準(zhǔn),以及數(shù)據(jù)定義與應(yīng)用規(guī)則,建立標(biāo)準(zhǔn)化的代碼標(biāo)準(zhǔn)、元數(shù)據(jù)模型,實(shí)現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)的唯一性、實(shí)時(shí)性和擴(kuò)展性。代碼標(biāo)準(zhǔn)是各業(yè)務(wù)系統(tǒng)相應(yīng)字段需要參照的規(guī)范定義,通常有機(jī)構(gòu)代碼、學(xué)科代碼、課程代碼等[4]。在建立數(shù)據(jù)標(biāo)準(zhǔn)的過程中,收集、整理相關(guān)信息形成規(guī)范知識(shí)庫,例如通用型及業(yè)務(wù)型數(shù)據(jù)字典,數(shù)據(jù)間的邏輯關(guān)系,數(shù)據(jù)的轉(zhuǎn)換規(guī)則和數(shù)據(jù)的流轉(zhuǎn)路徑,表結(jié)構(gòu)定義、字段注釋和屬性等,用于治理后的數(shù)據(jù)共享交換、糾錯(cuò)修正等。
數(shù)據(jù)標(biāo)準(zhǔn)的制定應(yīng)遵循唯一、可擴(kuò)展、簡單、規(guī)范、易用的原則。高校數(shù)據(jù)治理涉及的業(yè)務(wù)數(shù)據(jù)種類多、數(shù)量大,將這些數(shù)據(jù)全部納入標(biāo)準(zhǔn)體系需要耗費(fèi)巨大的人力物力,難以在較短的時(shí)間內(nèi)實(shí)現(xiàn)。建議對與基礎(chǔ)信息相關(guān)、共享率高、使用頻次高的字段優(yōu)先建立標(biāo)準(zhǔn)。在推行數(shù)據(jù)標(biāo)準(zhǔn)的過程中,必定會(huì)遇到很多困難,例如一些老舊系統(tǒng)無法改造或者改造成本過高。需結(jié)合實(shí)際情況,采取差異性的推行策略。對目前的業(yè)務(wù)系統(tǒng),首先分析和整理其中存在不符合標(biāo)準(zhǔn)的問題,評(píng)估與整改相關(guān)的投入成本、潛在風(fēng)險(xiǎn)、時(shí)間周期等因素,制定科學(xué)合理的整改方案。易于整改的應(yīng)該立即整改,一時(shí)難以整改的可通過邏輯轉(zhuǎn)換方式實(shí)現(xiàn)與標(biāo)準(zhǔn)的兼容,即將更換淘汰的老舊系統(tǒng)可暫不整改,在替代系統(tǒng)中推行數(shù)據(jù)標(biāo)準(zhǔn)。對新建立的業(yè)務(wù)系統(tǒng),可統(tǒng)一要求執(zhí)行數(shù)據(jù)標(biāo)準(zhǔn),作為系統(tǒng)規(guī)劃、實(shí)施、驗(yàn)收的組成部分,上線前進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)評(píng)估,不合格要求的整改后再上線。
(三)加強(qiáng)數(shù)據(jù)質(zhì)量控制。實(shí)現(xiàn)有效的質(zhì)量控制是數(shù)據(jù)治理的主要目標(biāo),數(shù)據(jù)質(zhì)量是檢驗(yàn)數(shù)據(jù)治理成效的核心指標(biāo)。在落實(shí)數(shù)據(jù)責(zé)任的基礎(chǔ)上,伴隨數(shù)據(jù)規(guī)范的建設(shè),建立數(shù)據(jù)質(zhì)量相關(guān)制度,規(guī)范數(shù)據(jù)采集、處理、存儲(chǔ)、使用等環(huán)節(jié)的質(zhì)量控制要求,完善數(shù)據(jù)質(zhì)量的評(píng)估、糾錯(cuò)機(jī)制,保障數(shù)據(jù)準(zhǔn)確、真實(shí)、完整和規(guī)范。實(shí)現(xiàn)數(shù)據(jù)過程可視化和質(zhì)量可視化管理,便于管理者實(shí)時(shí)掌握數(shù)據(jù)質(zhì)量的整體情況,及時(shí)發(fā)現(xiàn)數(shù)據(jù)質(zhì)量面臨的各類問題,促進(jìn)數(shù)據(jù)質(zhì)量的不斷提升。
數(shù)據(jù)質(zhì)量評(píng)估是分析數(shù)據(jù)綜合特征、量化數(shù)據(jù)質(zhì)量的過程。在高校數(shù)據(jù)治理的實(shí)踐中,通常將數(shù)據(jù)質(zhì)量和規(guī)則維度相結(jié)合,根據(jù)已經(jīng)定好的數(shù)據(jù)標(biāo)準(zhǔn)以及業(yè)務(wù)特性對數(shù)據(jù)質(zhì)量配置相應(yīng)的監(jiān)控規(guī)則,及時(shí)發(fā)現(xiàn)有問題的數(shù)據(jù)并針對問題數(shù)據(jù)進(jìn)行重點(diǎn)排查,形成數(shù)據(jù)質(zhì)量報(bào)告,指明數(shù)據(jù)缺失、異常、錯(cuò)誤等各類問題并提供詳細(xì)列表,便于協(xié)同相關(guān)部門對問題數(shù)據(jù)進(jìn)行處理。
數(shù)據(jù)質(zhì)量的提升離不開長期的投入,需要形成持續(xù)監(jiān)測和錯(cuò)誤反饋的機(jī)制,及時(shí)將數(shù)據(jù)質(zhì)量問題反饋給數(shù)據(jù)源部門處理,建立數(shù)據(jù)修改審核機(jī)制,向師生用戶開放數(shù)據(jù)修改申請服務(wù),經(jīng)數(shù)據(jù)源部門審核后及時(shí)修改完善??梢詮囊韵聨讉€(gè)方面對數(shù)據(jù)質(zhì)量問題進(jìn)行反饋和跟進(jìn):通過事先定義好的規(guī)則、時(shí)間,自動(dòng)完成數(shù)據(jù)質(zhì)量檢查,對數(shù)據(jù)存在的問題及時(shí)反饋給數(shù)據(jù)源部門;面向業(yè)務(wù)部門提供全生命周期的數(shù)據(jù)管理工具,包括數(shù)據(jù)的規(guī)范標(biāo)準(zhǔn)、檢索查詢、質(zhì)量檢查和異常監(jiān)測等功能;建立師生個(gè)人數(shù)據(jù)中心,對師生開放其個(gè)人相關(guān)的數(shù)據(jù),對不正確、不完整的數(shù)據(jù)進(jìn)行有針對性的數(shù)據(jù)糾錯(cuò)、補(bǔ)錄,啟動(dòng)反饋機(jī)制,通知數(shù)據(jù)源單位及時(shí)數(shù)據(jù)審核和更新。
(四)優(yōu)化數(shù)據(jù)共享交換。高效數(shù)據(jù)治理的最終目的是實(shí)現(xiàn)數(shù)據(jù)資源在全校范圍內(nèi)高效率流轉(zhuǎn)和高水平共享。數(shù)據(jù)共享交換是實(shí)現(xiàn)整個(gè)學(xué)校的系統(tǒng)集成、解決信息孤島和信息共享問題的重要手段。通過數(shù)據(jù)共享交換,實(shí)現(xiàn)跨業(yè)務(wù)系統(tǒng)的數(shù)據(jù)集成、共享與協(xié)同。優(yōu)化數(shù)據(jù)供需系統(tǒng)的流程環(huán)節(jié),完善數(shù)據(jù)供需的溝通渠道和協(xié)調(diào)機(jī)制,充分發(fā)揮數(shù)據(jù)共享交換平臺(tái)的數(shù)據(jù)通道作用,消除數(shù)據(jù)共享交換的斷點(diǎn)、堵點(diǎn),實(shí)現(xiàn)數(shù)據(jù)“找得著、拿得到、用得上”。
近年來,不同數(shù)據(jù)源之間通過API 接口進(jìn)行數(shù)據(jù)的共享交換成為主流。實(shí)現(xiàn)高性能、高可靠、開放性強(qiáng)的數(shù)據(jù)采集、集成和共享交換平臺(tái),有效整合校內(nèi)各類數(shù)據(jù)資源,提供開放的應(yīng)用接入能力,打通不同業(yè)務(wù)數(shù)據(jù)共享,實(shí)現(xiàn)數(shù)據(jù)資源的一體化管理和科學(xué)治理,成為高校數(shù)據(jù)共享交換平臺(tái)建設(shè)的主要目標(biāo)。平臺(tái)需兼容常見的結(jié)構(gòu)化數(shù)據(jù)源,提供豐富的數(shù)據(jù)集成能力,支持對數(shù)據(jù)共享交換任務(wù)的配置和調(diào)度,實(shí)現(xiàn)自動(dòng)化、定時(shí)化、可視化的數(shù)據(jù)共享。
高校數(shù)據(jù)治理要取得實(shí)際成效,需要有效解決數(shù)據(jù)管理上存在的主要問題,形成數(shù)據(jù)產(chǎn)生、維護(hù)、應(yīng)用、收益的良性循環(huán)。按照“誰產(chǎn)生數(shù)據(jù),誰負(fù)責(zé)管理”的原則,推動(dòng)業(yè)務(wù)部門充分參與數(shù)據(jù)治理,加強(qiáng)跨部門協(xié)同,不斷完善質(zhì)量反饋與監(jiān)督機(jī)制,健全數(shù)據(jù)質(zhì)量提升體系,逐步推進(jìn)不同層次和不同維度的數(shù)據(jù)共享,為師生提供更優(yōu)質(zhì)的信息化服務(wù),以信息化促進(jìn)學(xué)校治理體系與治理能力的現(xiàn)代化。