朱 露,徐山林,潘 劍
(火箭軍工程大學,西安 710025)
信息孤島的最大問題是各個信息系統(tǒng)的數(shù)據(jù)不能共享與交換的問題。各信息系統(tǒng)雖然提供了數(shù)據(jù)字典供擴展系統(tǒng)時進行參考和使用,但各信息系統(tǒng)的建設時間、建設團隊、使用的技術手段不盡相同,難以保證對數(shù)據(jù)字典理解的準確性。而且新信息系統(tǒng)直接對其他信息系統(tǒng)的數(shù)據(jù)庫操作,無法保障其數(shù)據(jù)庫的完整性約束、數(shù)據(jù)庫使用的同步,大大增加了系統(tǒng)之間的耦合性,不利于系統(tǒng)的長期維護與擴展。
虛擬全局數(shù)據(jù)庫統(tǒng)一存取系統(tǒng)就是把各個信息系統(tǒng)的數(shù)據(jù)庫進行邏輯上的整合與集中管理,提供一個統(tǒng)一的數(shù)據(jù)訪問接口,打通各信息系統(tǒng)的數(shù)據(jù)交換壁壘,實現(xiàn)數(shù)據(jù)的整合,克服一些信息系統(tǒng)集成度低、互聯(lián)性差、信息管理分散,數(shù)據(jù)的完整性、準確性、及時性無法獲得保障的問題。同時,虛擬全局數(shù)據(jù)庫作為各個信息系統(tǒng)數(shù)據(jù)庫的集合體,又能保證原各信息系統(tǒng)的獨立實施與運行。
基于微服務的軟件架構體系恰好滿足這一要求,它要求各項服務盡可能的小、可以獨立部署、自動化部署和運維,通過網(wǎng)絡將各個信息系統(tǒng)的數(shù)據(jù)訪問層連通,再由統(tǒng)一標準的管理服務提供各業(yè)務數(shù)據(jù)的訪問服務列表與權限驗證,最終統(tǒng)一由業(yè)務數(shù)據(jù)訪問服務完成數(shù)據(jù)的存取操作。在這個過程中,應做到:
(1)底層數(shù)據(jù)結構是透明的。業(yè)務數(shù)據(jù)訪問服務提供了統(tǒng)一的接口,應用無需知道數(shù)據(jù)在哪里保存、源數(shù)據(jù)庫支持哪種訪問方式(XQuery,SQL)、數(shù)據(jù)的物理結構、網(wǎng)絡協(xié)議等。
(2)提供統(tǒng)一的數(shù)據(jù)視圖。數(shù)據(jù)整合的優(yōu)勢是可以保留數(shù)據(jù)庫的完整性約束,數(shù)據(jù)更加真實、準確、可靠。
校園網(wǎng)各教學信息系統(tǒng)中包含了大量的新聞資源、圖片資源、影視資源、軟件資源、應用資源和文獻資源,為獲得良好的用戶體驗(一鍵式全網(wǎng)檢索),實現(xiàn)這些資源的跨系統(tǒng)檢索功能,建立統(tǒng)一的數(shù)據(jù)檢索索引,就需要建設一套面向搜索主題的數(shù)據(jù)倉庫。
數(shù)據(jù)倉庫可以抽取多個數(shù)據(jù)源的歷史數(shù)據(jù),將各信息系統(tǒng)的數(shù)據(jù)集成在一個倉庫中進行加工處理,對目標關鍵詞進行細粒度的、多維度的分解,幫助應用使用者進行檢索數(shù)據(jù)的分析與決策,并且不改變原數(shù)據(jù)源的結構和屬性。其主要結構包括:
(1)數(shù)據(jù)采集功能。基于微服務架構的虛擬全局數(shù)據(jù)庫統(tǒng)一存取系統(tǒng)提供了數(shù)據(jù)訪問的接口,通過該接口,數(shù)據(jù)采集模塊可以定時輪詢的方式將指定的目標數(shù)據(jù)源放入數(shù)據(jù)倉庫的事實表內。
(2)數(shù)據(jù)的離線分析。離線分析是指運行分析程序的機器和運行業(yè)務訪問的機器是分開的,也就是說使用離線分析并不會影響線上正式數(shù)據(jù)的訪問性能。應用(檢索應用)接口?;诓煌臋z索維度,檢索應用接口提供了多種查詢的方式供校園網(wǎng)系統(tǒng)根據(jù)不同的場景使用。
信息管理部門需要對校園網(wǎng)的各信息系統(tǒng)的各項資源訪問情況進行監(jiān)控,通過運行數(shù)據(jù)的可視化實時了解這些運維數(shù)據(jù),才能更好的服務學校、服務師生、服務信息化教學需求,建設一套快速、直觀、準確的標桿性服務體系。只有將各信息系統(tǒng)的運行情況、各項資源的訪問情況進行可視化的監(jiān)控,才能更加有效的規(guī)劃網(wǎng)絡資源的負載均衡、提供各系統(tǒng)的高可用性。
數(shù)據(jù)可視化是指將大型數(shù)據(jù)集中的數(shù)據(jù)以圖形圖像形式表示,并利用數(shù)據(jù)分析和開發(fā)工具發(fā)現(xiàn)其中未知信息的處理過程,主要旨在借助于圖形化手段,清晰有效地傳達與溝通信息。數(shù)據(jù)可視化已經(jīng)提出了許多方法,這些方法根據(jù)其可視化的原理不同可以劃分為基于幾何的技術、面向像素技術、基于圖標的技術、基于層次的技術、基于圖像的技術等。信息管理部門需要的運行數(shù)據(jù)的可視化系統(tǒng)應包含以下幾個主要部分:
(1)運維數(shù)據(jù)的實時顯示。充分體現(xiàn)校園網(wǎng)的各信息系統(tǒng)運行情況、各項資源的訪問情況,運用地圖、圖標、圖表、色塊等展示形式實時顯示,并提供異常情況圖形提醒功能。
(2)應用和資源的即時管理。對校園網(wǎng)的各信息系統(tǒng)運行情況、各項資源的訪問情況監(jiān)控時,可以使用管理指令對各應用和資源進行即時管理,調整系統(tǒng)的運行。
(3)運維數(shù)據(jù)、管理指令的存儲與回放。動態(tài)回放運行數(shù)據(jù)可視化系統(tǒng)的運維數(shù)據(jù)、管理指令,可以有效審計管理指令的下達過程,同時通過動態(tài)回放可以發(fā)現(xiàn)新的探索維度。
在主題數(shù)據(jù)倉庫的基礎上,制定和統(tǒng)一資源標準,與目前學校多個教學資源系統(tǒng)實現(xiàn)資源匯集,統(tǒng)一存儲,提供一站式跨庫檢索,可同時檢索非結構化數(shù)據(jù)中心和圖書期刊資源庫。利用現(xiàn)有統(tǒng)一檢索功能,實現(xiàn)一站式跨庫檢索,對文檔的文件名、標簽、編目信息、文件內容進行全文檢索,一個入口可同時檢索校園網(wǎng)現(xiàn)有資源和現(xiàn)有圖書館資源庫。提供關鍵字檢索、圖譜檢索、人像檢索、地圖檢索等功能,利用AI 技術實現(xiàn)資源快速檢索。
采用微服務架構整合校園網(wǎng)教學資源,解決我校多年來各類教學資源存放分散,教學信息共享困難問題,知識信息統(tǒng)一管理和共享,研究針對不同結構、不同數(shù)據(jù)格式、不同查詢界面和查詢語法、不同存放位置的數(shù)據(jù)庫或網(wǎng)站的查詢需求,建立起統(tǒng)一的檢索入口和檢索語法,研究如何形成校園統(tǒng)一的教學資源大數(shù)據(jù)平臺,通過最簡單的操作,使用戶能夠一步到位地檢索到所需要的信息資源,從而實現(xiàn)對各種不同資源以及不同數(shù)據(jù)庫的高度、有效整合。實現(xiàn)數(shù)據(jù)的共享與交換與一站式數(shù)據(jù)檢索和資源發(fā)布,積累數(shù)據(jù)資產(chǎn),協(xié)助提高辦公效率和提升教學質量,為提升信息化教學作出積極的貢獻。