郭曉明 張巍
摘 要:公共數據平臺是高校信息化建設的重要內容之一。本文從目的作用、數據環(huán)境、信息標準建設等方面對高校的公共數據平臺展開探討,并結合已有的研究對平臺的未來發(fā)展進行了思考。
關鍵詞:高校;信息化建設;公共數據;數據平臺
中圖分類號:G203 文獻標志碼:A 文章編號:1673-8454(2015)19-0069-04
隨著信息技術的發(fā)展和其在高校各個層面的應用,制約高校信息化發(fā)展的因素在高校各類信息化需求落地過程中逐步凸顯。高校各個部門都以自身的業(yè)務需求出發(fā),各自開發(fā)了應用系統,這些系統各為所用,數據很難進行有效融合,難以提供綜合性的各類信息,由于信息化人才缺乏、資金配套問題和機制體制不健全等問題,導致業(yè)務系統的維護、更新、完善工作很難有效開展,系統則逐漸成為一個個的信息孤島。為了有效地開展高校的信息化工作,經過多年的研究和實踐,高校信息化建設者和研究者提出了“數字化校園”的理念,并把其定義為:數字化校園是以網絡為基礎,利用先進的信息化手段和工具,實現從環(huán)境(包括設備、教室等)、資源(如圖書、講義、課件等)到活動(包括教學、管理、服務、辦公等)的全部數字化,在傳統校園的基礎上,構建一個數字空間,拓展現實校園的時間和空間維度,提升傳統校園的效率,擴展傳統校園的功能,最終實現教育過程的全面信息化,從而達到提高教學質量、科研和管理水平的目的。[1]
高校數字化校園建設經歷了概念提出、概念推廣、應用建設、平臺建設及整體建設等多個階段,第三代整體建設的數字化校園實施框架結構包括網絡層、數據層、支撐層、業(yè)務層、表示層和綜合管理工具[2]。在社會信息化的大背景下,高校的教育信息化進入了新的階段,隨著物聯網、云計算和大數據等技術的逐步納入,第四代數字校園“智慧校園”納入建設規(guī)劃,智慧校園是數字校園的高端形態(tài),它能夠有效支持教與學,豐富學校的校園文化,真正拓展學校的時空維度,以面向服務為基本理念,基于新型通信網絡技術構建業(yè)務流程、資源共享、智能靈活的教育教學環(huán)境[3]。
無論高校信息化建設處于何種階段,數據都是基礎。一方面,就數據本身來說,它的生命力比軟件更持久,理由是程序可以不停地升級換代乃至退出,但保存數據的數據庫卻會繼續(xù)存在,其價值很可能與日俱增、日久彌新,美國軟件開源運動領袖Eric Raymond認為“一個好的數據結構和一個糟糕的代碼,比一個糟糕的數據結構和好的代碼要強得多”[4]。另一方面,高校網絡基礎實施建設已趨于完善,作為高校信息化基礎的“管理信息化”涉及的辦公自動化系統、教務管理系統、人事管理系統、財務管理系統和決策系統等[5]系統都是基于學校人、財、物等基礎數據開展的,這些數據是各個業(yè)務系統運行的基礎。
公共數據平臺是高校信息化建設的重要內容之一,本文從目的作用、數據環(huán)境、信息標準建設等方面對高校的公共數據平臺展開探討,并結合已有的研究對平臺的未來發(fā)展進行了思考。
一、公共數據平臺的目的和作用
1.解決高校信息孤島和數據異構問題
“信息孤島”指的是高校信息化中相互之間在功能上不關聯互助、信息不共享互換以及信息與業(yè)務流程和應用相互脫節(jié)的數字應用系統。它們猶如一個個相互獨立的島嶼,信息難以相互融通,無法實現業(yè)務協作。[6]“信息孤島”是高校信息化建設過程中的必然產物:一方面,最初高校各個部門之間的業(yè)務基本不交叉,系統建設需求和建設時期毫無關聯,信息化以小的MIS系統為主;另一方面,初期信息技術人才缺乏,在系統建設過程中校方人員基本沒有技術方案方面的主導權,隨著信息技術地不斷升級變化,各個系統之間的差別逐漸顯現出來,特別是數據異構情況嚴重。
公共數據平臺通過成熟的數據交換方式,可以從各個“信息孤島“中抽取基礎的可用數據,然后進行清洗、轉換、存儲,然后再利用,是解決高校信息化中“信息孤島”的有效方案之一。
2.在學校層面對高校數據進行統一規(guī)劃和管理
數據是高校信息化建設的重要資源,業(yè)務系統建設往往以實際業(yè)務需求出發(fā)考慮數據的存儲、管理,隨著業(yè)務的不斷的變革,數據被迫一直進行沿用,并根據業(yè)務變化進行增修、完善,實際上數據并不是業(yè)務部門關注的重點。業(yè)務部門也缺少相關信息技術人才關注數據層面的工作,為了更好地開展高校信息化建設,很多高校都成立了專門的信息部門來開展全局的信息化建設。高校全局信息化建設的一個重要目標即是通過對學校所有需求和供給數據信息進行統一的調研分析,然后形成校級的統一公共數據平臺。
借鑒信息資源規(guī)劃理論[7],可以通過以下步驟對高校的數據信息資源進行規(guī)劃和管理:
(1)采用“職能域——業(yè)務過程——業(yè)務活動”三層結構對全校進行業(yè)務分析;
(2)對全校進行數據分析和數據建模;
(3)建立數據信息資源管理標準;
(4)規(guī)劃設計主題數據庫。
3.對數據進行有效積累和存儲
公共數據平臺把不同源頭的數據進行統一匯總,統一存儲,為其他應用系統提供必要的數據共享,并對數據進行有效積累,形成學校歷史數據。在此基礎上,對業(yè)務數據清洗形成數據倉庫,為學校領導的各種決策提供數據支持。
4.更好地支持高校未來的信息化需求
高校信息化建設要兼顧以前,也要著力未來,公共數據平臺是為未來各類信息化需求開展的基礎,平臺建設的標準可以為以后的信息系統建設提供規(guī)范和指導,平臺積累的數據為更多信息化業(yè)務的開展提供了保障。
二、公共數據平臺的數據環(huán)境
數據采用什么樣的數據建設環(huán)境,基本上決定了數據的應用范圍,國際知名學者詹姆斯.馬?。↗ames Martin)提出的“數據環(huán)境”概念很好地說明了不同的數據模式的作用。他根據計算機應用由低級到高級的發(fā)展過程定義了四種數據環(huán)境:數據文件環(huán)境、應用數據庫環(huán)境、主題數據庫環(huán)境、信息檢索系統[8]。數據文件環(huán)境和應用數據庫環(huán)境是兩類較低層次的數據環(huán)境;主題數據庫環(huán)境是一個用以支持組織決策分析處理的、面向主題的、經過科學的規(guī)劃和設計、用DBMS建立起來的、具有共享性和一致性的、以主題數據庫為主的集成化數據環(huán)境,只有在這種數據環(huán)境中才能開發(fā)和運行集成化的信息系統;信息檢索系統是指對一些主題數據庫進行萃取和深加工,為高層查詢和輔助決策準備的數據環(huán)境。
高校早期的應用系統大多采用數據文件或應用數據庫的數據環(huán)境,其中的文件或數據基本上都是根據基于業(yè)務過程所需要的數據,需要什么數據產生什么數據,這種方式沒有在整體上考慮數據的規(guī)劃,容易產生數據冗余,無法有效適用未來,多個應用系統之間異構數據問題比較嚴重。
高校信息化中公共數據平臺是高校在校級層面綜合考慮的統一數據庫,是對學校業(yè)務數據進行合理規(guī)劃、組織、定義而建立的公共數據,范圍涉及學校學生、教師、圖書、資產等各類業(yè)務數據,其并不是針對某個具體的業(yè)務而建設。公共數據平臺有別于一般的業(yè)務應用數據庫,是以數據建設和未來應用為中心的數據庫建設模式,應該考慮更高級的數據環(huán)境。當前高校信息化普遍考慮的是采用主題數據庫環(huán)境完成建設[8]- [12],根據教育行業(yè)標準(編號“JY/T 1006——2012”)中“教育管理信息 高等學校管理信息”內容的指引,高??梢园压矓祿脚_中數據分為學校概況、學生管理、教學管理、教職工管理、科研管理、財務管理、資產與設備管理、辦公管理、外事管理、檔案管理等十個數據主題。
主題數據庫建設是以高校的已有和未來將使用的業(yè)務主題為主,以為各應用系統提供共享信息為目標[9],此數據環(huán)境是高校信息化過程中一個重要的階段,但并不是最終階段。2015年初,教育部強調了全國教育管理信息化的四條推進原則,其中特別強調了信息化建設要為管理人員、教師、學生和家長等各類人員提供各類信息化服務,把最終用戶的需求納入到了信息化建設之中作為重點考慮。用戶除了平常的業(yè)務辦理外,更多的是對各類信息進行檢索和查看,所以信息檢索系統將成為高校信息化下一階段建設的數據環(huán)境。
三、公共數據平臺的信息標準建設
公共數據平臺建設中涉及的信息標準主要是指在數據采集、傳輸、交換和處理時采用的統一規(guī)則、概念、格式和代碼等,是公共數據平臺建設的重要工作之一。高校信息化中普遍存在的信息孤島問題的一個重要原因,就是在各個應用系統建設初期采用的信息標準不一致。為了建立一個符合高校自身特點的有效信息標準體系,需要從下面幾個方面著手:
1.選擇一個基礎標準作為統一參照
公共數據平臺包含的數據范圍很廣闊,基本囊括了高校的各個層面,同時涉及的信息標準也很多,如果讓高校公共數據庫建設人員從頭開始編制這些信息標準,難度太大。雖然對于管理信息標準,各個高校之間存在很大的差別,不可能完全一致,但是經過相關高校之間的協作努力,制定了一個較通用的《高等學校管理信息》標準集,現有2002、2008、2009和2012四個版本??梢圆捎闷渲兄蛔鳛楣矓祿煨畔藴实膮⒄諛藴?。也可以借鑒國內高校已建成的信息標準。
2.對基礎標準進行合理、有效的修補
高校之間的信息化建設差別化比較明顯,各個高校信息化起步時間各不相同,選擇的基礎信息標準也不一樣,這些標準不一定能完全滿足學校的公共數據平臺建設要求,必須結合高?,F有的情況在所采用的基礎標準上進行調整、更新、修補。
《高等學校管理信息》標準集中所涉及的代碼基本上都是以國家標準(GB)、教育部標準(JB)和信息化分會標準(HB)為參照,這些代碼具有普遍性,但是并不一定適合高校的現狀,因為很多業(yè)務系統采用了不同的代碼字典,必須結合學校各個系統和相關應用的實際情況對基礎標準進行調整。
為了更好地消化和有針對性地制定好學校自身的信息標準集,就需要學校相關部門有效協調、通力合作,統一完成相應的編碼工作。對公共數據庫中使用的信息標準進行列表匯總,然后根據相關責任部門進行分解并下發(fā)到各個部門進行編碼核對、修補工作,最后由公共數據平臺建設部門進行匯總審核,最終形成針對學校的管理信息標準集。
3.推廣并有效貫徹執(zhí)行信息標準
制定信息標準,是為了統一學校各類信息系統的建設規(guī)范,使數據能有效地交換和共享。如果制定的標準不能得到有效推廣和普遍認可,則將難以執(zhí)行。在制定標準之日起,就應制定相應的推廣計劃,包括標準的使用范圍、使用時機和使用對象等的,使學校各個層面能在信息意識、信息習慣和信息素養(yǎng)上把標準當成一種規(guī)范遵照執(zhí)行。
4.制定標準的長效建設機制
標準不可能盡善盡美,有些標準在使用過程中會發(fā)現其不合理性,有些標準本身就是在不斷變化中的。所以為了能使建設的信息標準能最大化地適用學校未來的發(fā)展需求,必須制定標準建設的長效機制。比如:設立標準變化管理部門,負責協調標準變化時在各個部門通知、發(fā)布和維護協調工作;建立標準管理和維護平臺,能及時地對標準進行管理維護,同時過濾一些過時的信息標準;制定標準管理、維護和變更制度,做到“誰使用,誰維護”,確立源頭,并對標準的變更能及時地進行宣傳、發(fā)布。
四、公共數據平臺的思考
高校信息化本身發(fā)展的不平衡和高校自身未來的發(fā)展規(guī)劃的差異,導致高校公共數據平臺建設差異化比較明顯。公共數據平臺起到承前啟后的作用,但是現實中高校更多考慮的是對已有系統數據整合、共享和規(guī)范,對未來的需求考慮較少,一方面高校已有應用系統問題差異性很大,另一方面是高校未來的信息化需求不是很明晰,教育行業(yè)信息化未來的信息化需求往往以國家的政策導向為主。
當前國家教育管理信息系統把教育基礎數據庫首要任務[13],一方面要求高校立足解決高校自身基礎數據平臺所面臨的問題,另一方面也要求各個高校之間著力解決校與校之間的基礎數據共享問題,也就是要解決學校之間的“信息孤島”問題。
高校針對公共數據平臺的實踐和研究由來已久,從最初地以企業(yè)的多數據源集成啟發(fā)而提出的基于共享數據庫的多數據源集成方案[14],到學校數據中心平臺整體解決方案[15],還有高校針對學校自身情況采用了中心數據庫[16]或者統一數據庫[17]方案構建公共數據平臺。但是這些研究主要涉及高校內部,并未考慮高校之間的問題。從這個層面看,未來高校公共數據平臺的研究和實踐仍然任重而道遠。
參考文獻:
[1]萬里鵬,陳雅,鄭建明.中國高校數字化校園建設與思考[J].情報科學, 2004(3):356-362.
[2]許鑫,蘇新寧.新一代高校數字化校園建設[J].現代圖書情報技術,2005(1).
[3]黃榮懷,張進寶,胡永斌等.智慧校園:數字校園發(fā)展的必然趨勢[J].開放教育研究,2012(4).
[4]劉文奇.中國公共數據庫數據質量控制模型體系及實證[J].中國科學:信息科學, 2014(7):836-856.
[5]趙國棟,王婷婷,閻妍等.校園信息化應用與發(fā)展狀況分析——2010年高校信息化調研報告[J].遠程教育雜志,2011(6).
[6]唐沖,徐炯,葉姣云.高校信息化建設中“信息孤島”的成因和對策研究[J].浙江中醫(yī)藥大學學報, 2013(5):631-632.
[7]江錦祥,馬云飛.以數據為中心的高校信息資源規(guī)劃[J].浙江交通職業(yè)技術學院學報, 2007(1):38-41.
[8]楊威,楊海君,沈葉忠.高校信息化建設中主題數據庫的作用與開發(fā)[J].河海大學常州分校學報, 2003(4):36-39.
[9]李麗,王倩宜,歐陽榮彬等.高校信息化建設中主題數據庫的規(guī)劃設計[J].中山大學學報(自然科學版), 2009(S1):168-170.
[10]江錦祥.基于虛擬主題數據庫的系統整合初探[J].計算機時代, 2006(12):58-59.
[11]景雪琴,杜棟,霍永良.校園網主題數據庫的面向對象建模[J].管理信息系統, 2002(2):50-51.
[12]祖巧紅,劉勝祥. MIS開發(fā)中高級數據環(huán)境——主題數據庫的建立[J].武漢工程職業(yè)技術學院學報, 2001(04):16-19.
[13]蔣東興.國家教育管理信息系統總體設計[J].中國信息界, 2013(12).
[14]郭永生,陳祎祺,,徐立臻.基于共享數據庫的多數據源集成[J].微機發(fā)展,2004(2):49-51.
[15]王錢永.數字化校園中數據中心平臺的研究[J]. 中國教育信息化, 2007(21):14-17.
[16]張新華,梁正和,張國寶等.基于中心數據庫的數字校園應用框架的研究與設計[J].微型電腦應用, 2007(1):19-21.
[17]詹必勝,王宏賓,韓冰.統一數據庫與管理信息標準[J].中山大學學報(自然科學版),2009.
(編輯:楊馥紅)