劉萍 張蕊 趙文廣
摘? 要:隨著信息技術(shù)的發(fā)展,高校信息資源和應(yīng)用系統(tǒng)建設(shè)不斷豐富和完善,但也累積了眾多數(shù)據(jù)孤島,打破數(shù)據(jù)間的使用壁壘,建設(shè)一條信息高速公路勢在必行。文章對高校信息化數(shù)據(jù)資源管理現(xiàn)狀進(jìn)行了分析,對數(shù)據(jù)共享中心構(gòu)建的整體思路和解決方案、相關(guān)核心關(guān)鍵技術(shù)進(jìn)行了研究,提出了數(shù)據(jù)共享中心在高校的應(yīng)用模式,從而對數(shù)據(jù)孤島在智慧校園中的應(yīng)用提出積極建議。
關(guān)鍵詞:數(shù)據(jù)共享;智慧校園;信息化
中圖分類號:TP311.1? ? ? 文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2020)01-0104-03
Abstract:With the development of information technology,the construction of information resources and application systems in colleges and universities is constantly enriched and improved. However,a large number of data islands have been accumulated,breaking the barriers between the use of data,and it is imperative to build an information superhighway. This paper analyzes the current situation of information-based data resource management in colleges and universities,studies the overall idea and solution of data sharing center construction,and relevant key technologies,and puts forward the application mode of data sharing center in colleges and universities,so as to put forward positive suggestions for the application of data island in smart campus.
Keywords:data sharing;smart campus;informatization
0? 引? 言
中國人民大學(xué)從2004年開始建設(shè)數(shù)字校園,在過去十?dāng)?shù)年的建設(shè)過程中,學(xué)校的信息化建設(shè)和管理水平得到顯著提升,基于校園網(wǎng)的信息資源和應(yīng)用系統(tǒng)建設(shè)不斷豐富和完善,初步探索出了一條具有人大特色的教育信息化發(fā)展之路。
隨著信息技術(shù)的演進(jìn)和師生需求的不斷變化,學(xué)校信息化工作的定位也逐步從數(shù)字校園升級為智慧校園,為了體現(xiàn)信息化建設(shè)理念與文化的更新,在2012年,我校啟動“數(shù)字人大”三期建設(shè)工作,正式將“數(shù)字人大”更名為新一代的“微人大”智慧校園平臺,對信息系統(tǒng)的格局進(jìn)行了橫向的重新界定,通過對各個業(yè)務(wù)系統(tǒng)的重新梳理,抽象和提取通用功能,將“數(shù)字人大”的應(yīng)用群和其他第三方應(yīng)用群融入其中,形成立體化的智慧校園平臺。同時,嘗試使用統(tǒng)一的框架體系和服務(wù)標(biāo)準(zhǔn),力圖通過數(shù)據(jù)共享中心建設(shè),解決系統(tǒng)間的功能互訪和業(yè)務(wù)集成等問題,推進(jìn)新老系統(tǒng)的協(xié)同演進(jìn)。
1? 高校信息化數(shù)據(jù)資源管理現(xiàn)狀
如何利用信息技術(shù)有效推動教學(xué)和科研模式的變革,已經(jīng)成為學(xué)校信息化建設(shè)工作亟待研究的課題,對學(xué)校數(shù)據(jù)資源管理而言,存在管理數(shù)據(jù)分散、教育資源分散的現(xiàn)狀。
1.1? 管理數(shù)據(jù)分散
目前學(xué)校的各個管理機(jī)構(gòu)掌握著各自業(yè)務(wù)領(lǐng)域的數(shù)據(jù),雖然有些學(xué)校信息技術(shù)部門面向全校各業(yè)務(wù)系統(tǒng)建設(shè)了全局?jǐn)?shù)據(jù)庫,但這并不是實質(zhì)意義上的數(shù)據(jù)中心。因為這些全局?jǐn)?shù)據(jù)庫是建立在同一個Oracle數(shù)據(jù)庫實例下的不同表空間,數(shù)據(jù)共享完全依靠視圖來解決。
隨著學(xué)校教育體制改革的快速推進(jìn),以及教職工和學(xué)生對于管理公共服務(wù)要求的持續(xù)提高,跨部門之間的協(xié)同辦公對管理信息共享提出了迫切要求。新的需求要求各業(yè)務(wù)部門不斷地更新自己原有的業(yè)務(wù)系統(tǒng),但傳統(tǒng)全局?jǐn)?shù)據(jù)庫模式由于安全性、開放性等問題,已不能滿足學(xué)校建設(shè)數(shù)據(jù)中心及大數(shù)據(jù)分析系統(tǒng)的需求。
1.2? 教育資源分散
自2012年MOOC等網(wǎng)上學(xué)習(xí)平臺在國內(nèi)興起以來,高校普遍認(rèn)識到,信息技術(shù)已經(jīng)成為實現(xiàn)教學(xué)模式改革、提升學(xué)生學(xué)習(xí)自主性的重要手段,因此競相探索搭建適合本校特點的網(wǎng)上教學(xué)和科研平臺的方式,并把教學(xué)信息化和科研信息化建設(shè)提升到了戰(zhàn)略重要地位。但是,正如數(shù)據(jù)是管理信息化建設(shè)的根本,資源是教學(xué)信息化和科研信息化建設(shè)的根本,沒有資源的共建共享,就無法顯現(xiàn)網(wǎng)上學(xué)習(xí)平臺對教學(xué)模式改革、提升教學(xué)質(zhì)量的重要支撐作用。
學(xué)校各管理機(jī)構(gòu)不同程度地產(chǎn)生和積累了大量教育資源,例如黨校培訓(xùn)課程、黨校考試考卷、干部培訓(xùn)課程、教職工資格考試試題、教職工業(yè)務(wù)培訓(xùn)課程、消防安全教育課程、教職工和學(xué)生活動照片和音頻視頻,以及學(xué)校的宣傳片和宣傳手冊等。這些資源均分散在各自負(fù)責(zé)的部門或單位中,已經(jīng)在全校范圍內(nèi)形成了大小不等的幾十個“資源孤島”,這在一定程度上制約了學(xué)校應(yīng)用信息技術(shù)實現(xiàn)教學(xué)模式改革的發(fā)展步伐,也不利于學(xué)校整體提升所有教學(xué)單位的教學(xué)水平和教學(xué)質(zhì)量,以及教職工的業(yè)務(wù)和技術(shù)水平。
2? 高校數(shù)據(jù)共享中心設(shè)計
2.1? 重新梳理學(xué)校現(xiàn)有的數(shù)據(jù)標(biāo)準(zhǔn)
遵循教育部2012年最新頒布的《教育管理信息高等學(xué)校管理信息》建設(shè)數(shù)據(jù)標(biāo)準(zhǔn),對于沒有國家標(biāo)準(zhǔn)和行業(yè)標(biāo)準(zhǔn)的字段,參照省/市代碼標(biāo)準(zhǔn)規(guī)范。對于既沒有國家、又沒有省級行業(yè)標(biāo)準(zhǔn)的數(shù)據(jù)字段,建設(shè)學(xué)校信息標(biāo)準(zhǔn)。
2.2? 構(gòu)建學(xué)校共享數(shù)據(jù)庫
建立學(xué)校管理服務(wù)全局?jǐn)?shù)據(jù)庫,實現(xiàn)對人事、資產(chǎn)、學(xué)生、教學(xué)科研等信息數(shù)據(jù)以及感知數(shù)據(jù)的集中保存、開放共享。全局?jǐn)?shù)據(jù)庫數(shù)據(jù)的存儲分為:數(shù)據(jù)緩沖區(qū)、基礎(chǔ)數(shù)據(jù)庫和數(shù)據(jù)倉庫。這樣的架構(gòu)設(shè)計更能保證數(shù)據(jù)的安全和分布式存放需求。
2.3? 共享數(shù)據(jù)庫視圖建設(shè)
視圖在數(shù)據(jù)庫管理中舉足輕重。用視圖可以表示來自不同源的數(shù)據(jù),可以用一種不同于數(shù)據(jù)存儲在基表中的形式來表示數(shù)據(jù),也可以通過隱藏基表的實際結(jié)構(gòu)來簡化數(shù)據(jù)的表示方式,只顯示基表的一個限制子集給用戶。用視圖管理共享數(shù)據(jù)庫,方便、簡單、安全,邏輯數(shù)據(jù)具有獨立性,訪問的數(shù)據(jù)僅可查詢,不能修改,不會影響正式表的數(shù)據(jù)。
2.4? 建設(shè)數(shù)據(jù)接口管理系統(tǒng)
數(shù)據(jù)接口管理主要是利用數(shù)據(jù)集成交換工具對各類數(shù)據(jù)源中的數(shù)據(jù)進(jìn)行定時的數(shù)據(jù)抽取,基于信息標(biāo)準(zhǔn)進(jìn)行相應(yīng)的數(shù)據(jù)格式轉(zhuǎn)換,根據(jù)業(yè)務(wù)規(guī)則和約束借助數(shù)據(jù)質(zhì)量檢測工具進(jìn)行數(shù)據(jù)清洗,最終完成數(shù)據(jù)從數(shù)據(jù)源向共享數(shù)據(jù)庫裝載的全過程的管理,并利用數(shù)據(jù)接口管理,完成學(xué)校現(xiàn)有業(yè)務(wù)系統(tǒng)的應(yīng)用集成,實現(xiàn)數(shù)據(jù)集成過程的高效管理。
2.5? 建設(shè)數(shù)據(jù)校驗系統(tǒng)
數(shù)據(jù)校驗包括質(zhì)量檢測規(guī)則設(shè)定、規(guī)則執(zhí)行引擎、數(shù)據(jù)質(zhì)量報告、報告推送功能。規(guī)則設(shè)定是數(shù)據(jù)校驗的核心,建設(shè)較為全面的數(shù)據(jù)檢測規(guī)則庫,并提供圖形化的規(guī)則設(shè)定和管理功能;規(guī)則執(zhí)行引擎可以定時批量執(zhí)行檢測規(guī)則,及時發(fā)現(xiàn)數(shù)據(jù)質(zhì)量問題,系統(tǒng)可以自動形成數(shù)據(jù)質(zhì)量報告,推送給業(yè)務(wù)系統(tǒng)管理人員,有助于及時糾正問題數(shù)據(jù)。
3? 數(shù)據(jù)共享中心總體架構(gòu)
結(jié)合高校的實際情況,高校數(shù)據(jù)共享中心分為四個層次,從下往上分別是數(shù)據(jù)源層、數(shù)據(jù)交換層、數(shù)據(jù)治理層和數(shù)據(jù)服務(wù)層,如圖1所示。
數(shù)據(jù)源層是各個業(yè)務(wù)系統(tǒng)的數(shù)據(jù)庫,這個層次主要使用各類DBMS進(jìn)行管理。
數(shù)據(jù)交換層是將業(yè)務(wù)系統(tǒng)數(shù)據(jù)集中到數(shù)據(jù)共享緩沖區(qū)、數(shù)據(jù)標(biāo)準(zhǔn)區(qū)和數(shù)據(jù)倉庫區(qū)的中間層次,這個層次主要根據(jù)業(yè)務(wù)系統(tǒng)和數(shù)據(jù)需求的狀況采用實時視圖交換和定時ETL交換數(shù)據(jù)。
數(shù)據(jù)治理層含有一個數(shù)據(jù)共享緩沖區(qū)對外提供共享數(shù)據(jù)視圖服務(wù)和授權(quán)管理;一個數(shù)據(jù)標(biāo)準(zhǔn)區(qū)用于管理數(shù)據(jù)標(biāo)準(zhǔn),進(jìn)行數(shù)據(jù)治理,形成高質(zhì)量的標(biāo)準(zhǔn)數(shù)據(jù);一個數(shù)據(jù)倉庫區(qū)用于保存隨時間變化的、集成的、面向主題的數(shù)據(jù),并提供各種分析工具,進(jìn)行決策支持。
數(shù)據(jù)服務(wù)層是對外提供數(shù)據(jù)服務(wù)的層次,這個層次采用數(shù)據(jù)視圖方式和數(shù)據(jù)接口方式對外提供數(shù)據(jù)服務(wù)。主要包含數(shù)據(jù)服務(wù)申請的流程審批管理,數(shù)據(jù)視圖的管理發(fā)布以及數(shù)據(jù)接口的管理發(fā)布等。
3.1? 數(shù)據(jù)源層
數(shù)據(jù)源層的數(shù)據(jù)主要來自學(xué)校各業(yè)務(wù)部門建設(shè)的業(yè)務(wù)系統(tǒng)。因此,在進(jìn)行共享數(shù)據(jù)中心建設(shè)的過程中,需要數(shù)據(jù)中心建設(shè)方、學(xué)校信息技術(shù)部門以及業(yè)務(wù)部門,按照教育部的數(shù)據(jù)標(biāo)準(zhǔn),確定各個信息子集數(shù)據(jù)表的數(shù)據(jù)來源,以及每項數(shù)據(jù)的負(fù)責(zé)部門和負(fù)責(zé)人。在后面的數(shù)據(jù)服務(wù)申請流程中,數(shù)據(jù)的負(fù)責(zé)部門和負(fù)責(zé)人將對使用數(shù)據(jù)的請求申請進(jìn)行審批。
確定數(shù)據(jù)中心每個數(shù)據(jù)表的數(shù)據(jù)來源后,建設(shè)方將根據(jù)業(yè)務(wù)系統(tǒng)的數(shù)據(jù)狀況,開發(fā)并綁定數(shù)據(jù)抓取SQL,然后在數(shù)據(jù)標(biāo)準(zhǔn)區(qū)生成相應(yīng)的數(shù)據(jù)標(biāo)準(zhǔn)視圖。
3.2? 數(shù)據(jù)交換層
數(shù)據(jù)交換層主要由實時視圖交換和定時ETL交換兩部分組成。
3.2.1? 實時視圖交換
如果業(yè)務(wù)系統(tǒng)的數(shù)據(jù)庫在統(tǒng)一的全局?jǐn)?shù)據(jù)庫中,就采用視圖方式進(jìn)行數(shù)據(jù)交換。在同一個實例中以視圖的形式進(jìn)行數(shù)據(jù)交換,不僅能靈活地進(jìn)行數(shù)據(jù)定制,而且可以保證數(shù)據(jù)的實時性。但由于歷史原因,造成視圖管理困難、數(shù)據(jù)交換呈現(xiàn)網(wǎng)狀結(jié)構(gòu)、耦合度過高等問題。通過重新規(guī)劃建設(shè)實時視圖數(shù)據(jù)交換層,可以達(dá)到對共享視圖的靈活管理,變網(wǎng)狀結(jié)構(gòu)為星狀結(jié)構(gòu),實現(xiàn)數(shù)據(jù)解耦的目的。
3.2.2? 定時ETL交換
如果業(yè)務(wù)系統(tǒng)的數(shù)據(jù)庫不在統(tǒng)一的全局?jǐn)?shù)據(jù)庫中,或存在一些非結(jié)構(gòu)化的數(shù)據(jù),就采用定時ETL的方式進(jìn)行數(shù)據(jù)交換。
3.3? 數(shù)據(jù)治理層
數(shù)據(jù)治理層是數(shù)據(jù)中心進(jìn)行共享數(shù)據(jù)管理、數(shù)據(jù)標(biāo)準(zhǔn)控制、數(shù)據(jù)質(zhì)量管理的層次,主要分成三個部分:數(shù)據(jù)共享緩沖區(qū)、數(shù)據(jù)標(biāo)準(zhǔn)區(qū)和數(shù)據(jù)倉庫區(qū)。
3.3.1? 數(shù)據(jù)共享緩沖區(qū)
數(shù)據(jù)共享緩沖區(qū)是數(shù)據(jù)庫的一個共享區(qū)域,所有的共享視圖都建設(shè)在這個區(qū)域,這個區(qū)域的共享視圖管理主要通過數(shù)據(jù)服務(wù)層的共享視圖發(fā)布管理工具進(jìn)行操作。
盡量保證共享視圖的數(shù)據(jù)源來自于數(shù)據(jù)標(biāo)準(zhǔn)區(qū)的視圖,如果數(shù)據(jù)標(biāo)準(zhǔn)區(qū)沒有相關(guān)數(shù)據(jù),則可以考慮擴(kuò)展數(shù)據(jù)標(biāo)準(zhǔn)區(qū)的標(biāo)準(zhǔn)定義,如果無法擴(kuò)展標(biāo)準(zhǔn),則由視圖生成工具在數(shù)據(jù)共享緩沖區(qū)生成直接訪問業(yè)務(wù)系統(tǒng)數(shù)據(jù)源的共享視圖。
數(shù)據(jù)共享緩沖區(qū)是對外提供視圖訪問服務(wù)的唯一區(qū)域,在這個區(qū)域?qū)τ蓴?shù)據(jù)服務(wù)請求的目標(biāo)用戶進(jìn)行授權(quán)。
3.3.2? 數(shù)據(jù)標(biāo)準(zhǔn)區(qū)
數(shù)據(jù)標(biāo)準(zhǔn)區(qū)由一組按照教育部2012《教育管理信息高等學(xué)校管理信息》標(biāo)準(zhǔn)定義的視圖組成,這組視圖根據(jù)所屬子集的不同,分別分散到不同的數(shù)據(jù)庫用戶下面。數(shù)據(jù)標(biāo)準(zhǔn)在項目建設(shè)中,需要完成標(biāo)準(zhǔn)梳理,確定數(shù)據(jù)源,進(jìn)行數(shù)據(jù)集成的工作。
3.3.3? 數(shù)據(jù)倉庫區(qū)
數(shù)據(jù)倉庫區(qū)是一個面向主題的、集成的、隨時間變化的、相對穩(wěn)定的數(shù)據(jù)集合,用于支持管理決策。通過數(shù)據(jù)倉庫的建立,職能部門可對現(xiàn)有系統(tǒng)的數(shù)據(jù)進(jìn)行有效的集成并加以重組,建立面向聯(lián)機(jī)分析處理的系統(tǒng),以滿足學(xué)校對數(shù)據(jù)準(zhǔn)確掌握、統(tǒng)計分析上報的需求,并為數(shù)據(jù)挖掘和決策支持提供基礎(chǔ)數(shù)據(jù)。
數(shù)據(jù)倉庫區(qū)需要建設(shè)方參考教育部2012《教育管理信息高等學(xué)校管理信息》標(biāo)準(zhǔn)的子集進(jìn)行構(gòu)建,在系統(tǒng)部署時進(jìn)行相關(guān)數(shù)據(jù)模型創(chuàng)建、主題生成和相關(guān)數(shù)據(jù)集成,同時需要提供相關(guān)的管理工具。
3.4? 數(shù)據(jù)服務(wù)層
任何業(yè)務(wù)系統(tǒng)如果需要從數(shù)據(jù)中心獲取共享數(shù)據(jù),都需要通過數(shù)據(jù)中心的數(shù)據(jù)服務(wù)層。數(shù)據(jù)服務(wù)層主要由兩個部分組成:數(shù)據(jù)視圖服務(wù)和數(shù)據(jù)接口服務(wù)。
3.4.1? 數(shù)據(jù)視圖服務(wù)
數(shù)據(jù)視圖服務(wù)是通過使用視圖發(fā)布管理工具,針對通過流程審批的數(shù)據(jù)需求,進(jìn)行數(shù)據(jù)選取、加工處理、視圖生成、視圖授權(quán),進(jìn)而得到數(shù)據(jù)需求方可以訪問的數(shù)據(jù)視圖。
3.4.2? 數(shù)據(jù)接口服務(wù)
數(shù)據(jù)接口服務(wù)是通過接口發(fā)布管理工具,針對通過流程審批的數(shù)據(jù)需求,進(jìn)行數(shù)據(jù)選取、加工處理、接口生成、接口發(fā)布,進(jìn)而得到數(shù)據(jù)需求方可以訪問的數(shù)據(jù)接口。
4? 結(jié)? 論
通過數(shù)據(jù)共享中心的建設(shè),可以對學(xué)校多年信息化發(fā)展形成的數(shù)據(jù)進(jìn)行整合,重新梳理學(xué)?,F(xiàn)有的數(shù)據(jù)標(biāo)準(zhǔn)、構(gòu)建學(xué)校共享數(shù)據(jù)庫,保證數(shù)據(jù)的安全和分布式存放需求。而在數(shù)據(jù)共享中心的建設(shè)過程中,如何制定數(shù)據(jù)校驗規(guī)則,讓系統(tǒng)及時發(fā)現(xiàn)數(shù)據(jù)質(zhì)量問題并推送給業(yè)務(wù)系統(tǒng)管理人員,從而及時糾正問題數(shù)據(jù)還需要進(jìn)一步探索和研究。
參考文獻(xiàn):
[1] 唐連章,衛(wèi)建安,楊玉寶.ESB在數(shù)字化校園共享數(shù)據(jù)中心建設(shè)中的應(yīng)用 [J].廣州大學(xué)學(xué)報(自然科學(xué)版),2011,10(1):70-75.
[2] 俞春,袁芳,劉乃嘉,等.高校數(shù)據(jù)共享與交換技術(shù)的應(yīng)用研究 [J].實驗技術(shù)與管理,2012,29(11):109-112.
[3] 羅雅過,趙寧社.高校數(shù)字化校園數(shù)據(jù)中心平臺的研究與設(shè)計 [J].計算機(jī)技術(shù)與發(fā)展,2014,24(9):217-221.
作者簡介:劉萍(1975-),女,漢族,福建莆田人,副高級工程師,碩士研究生,研究方向:數(shù)據(jù)挖掘、智慧校園、教育信息化。