吳兆立
摘要
本文通過對建設(shè)高校共享數(shù)據(jù)中心進行了討論,從高校數(shù)據(jù)庫建模、共享數(shù)據(jù)庫優(yōu)化和安全技術(shù)三個方面,來對高校共享數(shù)據(jù)中心的關(guān)鍵技術(shù)進行了總結(jié)。
【關(guān)鍵詞】共享數(shù)據(jù)中心 數(shù)字化校園 關(guān)鍵技術(shù)
當今的時代數(shù)據(jù)共享是不可阻擋的大趨勢,數(shù)據(jù)共享的在教學(xué)輔助和信息管理上的優(yōu)勢也日漸明顯。但高校共享數(shù)據(jù)中心的建立很容易出現(xiàn)“信息孤島”現(xiàn)象,各個部門的數(shù)據(jù)不能很好地整合到一起,十分不利于高校信息化的進程。所以基于高校共享數(shù)據(jù)中心的需求,筆者對高校數(shù)據(jù)共享中心的關(guān)鍵技術(shù)進行了梳理,并對現(xiàn)有的高校數(shù)據(jù)共享中心進行了優(yōu)化和改進,極大的提升了系統(tǒng)的應(yīng)用價值。
1 高校數(shù)據(jù)庫建模
高校數(shù)據(jù)庫建模主要分為兩種,一種是實體關(guān)系建模,另一種是維度建模。
(1)實體關(guān)系建模又被稱為ERM建模,就是利用實體關(guān)系來對復(fù)雜系統(tǒng)環(huán)境中模糊數(shù)據(jù)的關(guān)系進行抽取。所謂實體關(guān)系就是模型中各個實體的相關(guān)性,通常為1對多關(guān)系,非常容易造成數(shù)據(jù)冗余,所以筆者所構(gòu)建的數(shù)據(jù)中心采用能夠最小化數(shù)據(jù)冗余的3NF關(guān)系模型。
(2)維度建模能夠?qū)?fù)雜的數(shù)據(jù)模型抽象成一般概念。數(shù)據(jù)抽取有兩種方式,一種是全量抽取,另一種是增量抽取。增量抽取效率比較高,但是抽取的過程相對比較復(fù)雜。全量抽取的優(yōu)點是簡單,卻效率非常低,并且對數(shù)據(jù)庫整體操作不被允許。增量抽取只是對數(shù)據(jù)庫發(fā)生的變化,進行抽取,所以進行維度建模是通常采用增量建模的方法,對各個維度做大量的預(yù)處理,圍繞業(yè)務(wù)模型做出維度建模。
2 共享數(shù)據(jù)庫優(yōu)化
共享數(shù)據(jù)庫的問題非常復(fù)雜且多種多樣,傳統(tǒng)的優(yōu)化方法是從系統(tǒng)的結(jié)構(gòu)設(shè)計、物理設(shè)計和運行三個方面進行全方位的優(yōu)化,但這樣優(yōu)化技術(shù)復(fù)雜,優(yōu)化程序繁瑣,所以筆者結(jié)合最新技術(shù),從以下幾個方向來對共享數(shù)據(jù)庫進行優(yōu)化,因為本數(shù)據(jù)庫的主體是Oracle數(shù)據(jù)庫,所以優(yōu)化措施也是基于Oracle數(shù)據(jù)庫來進行。
2.1 數(shù)據(jù)ETL機制
ETL機制主要是對數(shù)據(jù)轉(zhuǎn)換和加載組成。數(shù)據(jù)轉(zhuǎn)換是指根據(jù)目標數(shù)據(jù)系統(tǒng)所需的形式和業(yè)務(wù)需求,改變源數(shù)據(jù)系統(tǒng)對數(shù)據(jù)的需求過程,在轉(zhuǎn)變的過程中對數(shù)據(jù)的錯誤和不一致進行清除。
2.1.1 對數(shù)據(jù)的轉(zhuǎn)換、加工
對源數(shù)據(jù)庫的數(shù)據(jù)進行抽取后,這些數(shù)據(jù)會出現(xiàn)一系列的問題,例如:數(shù)據(jù)格式、數(shù)據(jù)編碼標準等,無法與原數(shù)據(jù)庫產(chǎn)生匹配,有時候也會產(chǎn)生數(shù)據(jù)抽取中有丟失的現(xiàn)象。通過使用ETL引擎和數(shù)據(jù)庫函數(shù)對數(shù)據(jù)進行加工、轉(zhuǎn)換。
2.1.2 數(shù)據(jù)的裝載
數(shù)據(jù)轉(zhuǎn)化和加工后,數(shù)據(jù)庫裝載需要使用上SQL語句,來對目標數(shù)據(jù)庫的數(shù)據(jù)進行更新。常用的SQL語句,如:insert、update、delete等。當有大量的數(shù)據(jù)需要對其進行處理時,需要用到sqldr,進行批量的處理。
2.2 DLL方法
DLL方法基于數(shù)據(jù)庫鏈接,在目標數(shù)據(jù)庫中建立對應(yīng)于源數(shù)據(jù)庫的表或視圖。數(shù)據(jù)同步可以采取時間戳更新、全表刪除插入、全表比較更新等。源數(shù)據(jù)庫與目標數(shù)據(jù)庫配置與之對應(yīng)的實例名,目標數(shù)據(jù)庫建立DBLink,建立和源數(shù)據(jù)庫對應(yīng)的數(shù)據(jù)庫表或者視圖。采用全表刪除插入、對比更新、時間戳更新進行對數(shù)據(jù)同步。
3 安全技術(shù)
3.1 通訊安全
本中心所使用的安全傳輸協(xié)議是安全套接協(xié)議(SSL協(xié)議),主要提供信息完整性、信息私密和相互認證三種基本安全服務(wù),分別基于不對稱型加密技術(shù)、對稱加密技術(shù)和不可逆加密技術(shù)來實現(xiàn)。
3.2 網(wǎng)絡(luò)安全
網(wǎng)絡(luò)系統(tǒng)的可靠運行是基于各個子系統(tǒng)安全運行的前提,所以網(wǎng)絡(luò)安全面對的主要對象有系統(tǒng)安全、數(shù)據(jù)庫安全、信息安全、設(shè)備安全和計算機病毒防治等。因此,本中心主要通過這幾種方法來實現(xiàn)網(wǎng)絡(luò)安全:
(1)及時升級高校網(wǎng)絡(luò)內(nèi)部系統(tǒng),并且定期使用安全掃描排查隱患,修補漏洞,從結(jié)構(gòu)上保護中心的網(wǎng)絡(luò)安全;
(2)設(shè)置防火墻和安全網(wǎng)關(guān),通過雙重保護來保護操作系統(tǒng),避免漏洞受到入侵和木馬攻擊;
(3)劃分VLAN提供必要的內(nèi)部安全措施,控制訪問用戶的權(quán)限大小和所在VLAN,從而提高交換式網(wǎng)絡(luò)整體安全性;
(4)進行入侵設(shè)備異常行為的監(jiān)測,禁止黑客和未授權(quán)使用者進入系統(tǒng);
(5)構(gòu)建一個立體完備的防病毒體系,保護系統(tǒng)不受病毒入侵;
(6)實行內(nèi)容監(jiān)管和過濾,杜絕不良信息的傳播。
3.3 共享數(shù)據(jù)安全
共享數(shù)據(jù)安全是建立高校共享數(shù)據(jù)中心的前提,共享數(shù)據(jù)安全主要是從以下兩個方面來進行:
3.3.1 備份管理
備份管理是可以有效地避免計算機軟件硬件故障、資源不足引起的計劃性停機和人為操作故障等原因?qū)е碌南到y(tǒng)運行故障。備份的對象通常為軟件環(huán)境、硬件設(shè)備、應(yīng)用系統(tǒng)和數(shù)據(jù)。
3.3.2 恢復(fù)策略
恢復(fù)策略是系統(tǒng)出現(xiàn)故障之后,為了使備份系統(tǒng)盡快恢復(fù)正常使用而采取的一種措施,主要是包括系統(tǒng)故障的恢復(fù)、事務(wù)故障的恢復(fù)和介質(zhì)故障的恢復(fù)。
本文通過對建設(shè)高校共享數(shù)據(jù)中心進行了討論,并對一些關(guān)鍵技術(shù)進行解讀,給出了相應(yīng)的觀點,希望可以給相關(guān)人士一些指導(dǎo)和幫助。
參考文獻
[1]王加年,徐晴.大數(shù)據(jù)時代的高校共享數(shù)據(jù)平臺研究[J].中國教育信息化,2015(10):10-12.
[2]俞春,袁芳,劉乃嘉,王茜.高校數(shù)據(jù)共享與交換技術(shù)的應(yīng)用研究[J].實驗技術(shù)與管理,2012,29(11):109-112+122.