嚴穎波
【摘 要】現階段,我國的科研工作受到越來越多的重視,伴隨著先進技術的快速發(fā)展,數據倉庫在科研管理中的應用也越來越廣泛。通過數據倉庫來實現對科研資源的整合、查閱及管理工作,同時,依靠數據倉庫也可以更好地實現科研檔案管理,以科研動態(tài)為基礎,及時更新數據倉庫,能夠保持數據倉庫的時效性。數據倉庫在科研管理中的應用,進一步優(yōu)化了我國科研管理工作,本文重點探究一下科研管理中,數據倉庫的具體應用。
【關鍵詞】數據倉庫;科研管理;應用
在科研項目質量管理中,科研數據以及科研資源的管理、科研檔案管理等等,都是其中的重要組成部分,通過數據庫,實現對科研管理的規(guī)范化、科學化,同時,也應當努力規(guī)范和提高科研管理運行機制,健全約束機制,完善科研項目的管理評標體系,這都是提高我國科研管理水平行之有效的途徑。
一、數據倉庫概述
數據采集是數據倉庫構建中的重要內容,從數據源中抽取所需要的數據,然后對抽取到的數據進行清洗,將其按照一定的數據倉庫的模型,放到數據倉庫中。數據采集中的數據抽取其實就是數據源接口,數據源接口從不同的系統(tǒng)中抽取所需要的數據,將其作為數據倉庫的輸入數據,數據轉換是對不同系統(tǒng)中生成的數據源進行處理,保證這些不同的數據源可以按照規(guī)定的要求輸入到數據倉庫中。數據清洗是對所有的數據進行處理,使得數據集中的所有數據值保持一致,并可以正確的對這些數據進行記錄。而數據的裝載是按照一定的模型將以上經過數據抽取、轉換、清除的所有數據裝入數據倉庫中,在數據進入數據倉庫的過程中還包括了將數據域清除、對數據進行有效的檢查等。
二、數據倉庫在科研管理中的應用研究
(一)數據倉庫的核心技術——ETL技術
在科研管理中,管理人員需要隨時獲取所需要的數據和信息,因此,通過數據倉庫,將外部數據和內部數據進行整理和儲存,并且為數據的查詢提供了極大的便利。但是這些數據信息有不同的來源,具有數量、不清潔等諸多不良特點,進而不能直接對這些數據進行使用,也不能直接將這些數據輸入到數據倉庫中,所以需要對這些數據先進行處理分析,然后再將這些數據以高質量輸入到數據倉庫中供用戶使用。因此,數據倉庫的核心技術——ETL技術負責對數據信息進行清洗、轉換等,保證數據信息質量的一種技術,ETL技術可以將數據分散、數據不清等問題進行解決,保證數據信息可以高質量的輸入到數據倉庫中供企業(yè)的各部門安全使用。
(二)數據倉庫用于科研數據的快速檢索、查詢
數據倉庫是為了實現數據的存儲、檢索以及表達,例如當數據倉庫中的數據需要從一種形式轉換成另一種形式時,ETL的數據轉換就需要進行考慮,同時ETL中的數據抽取、轉換、裝載等都需要變成轉換操作,所以對于數據倉庫而言數據轉換是其核心部分。數據倉庫實質上是一個獨立的數據環(huán)境,它需要從不同的系統(tǒng)中抽取所需要的數據,然后通過ETL技術將這些數據進行處理,處理過后的數據信息才可以安全的輸入到數據倉庫中。ETL技術主要涉及到互連、復制、轉換、監(jiān)控等方面的內容,在數據倉庫中的數據不需要和處理系統(tǒng)中、或者其他相關系統(tǒng)中的數據保持同步,盡量保證數據倉庫中信息的有效性。
為了將數據冗余等問題進行避免,在抽取的數據進入到數據倉庫之前,需要對其進行有效性檢查,這項工作在數據倉庫數據輸入中非常重要,如果沒有對這些即將輸入到數據倉庫的數據進行有效性檢查,就會對整個數據倉庫的完整性產生破壞,或者將其破壞的幾率大大的增加。對數據進行有效性檢查最好的方法就是源系統(tǒng)。在源系統(tǒng)中有專業(yè)的和非專業(yè)的技術知識人員,但是數據有效性檢查是一項費時又不可省略的一個環(huán)節(jié),所以可以進行自動化的檢查。
(三)通過數據倉庫實現科研數據的清除及轉換
由于數據倉庫中的數據來自不同的數據源,這些數據源可能出現不同的平臺上,有不同的操作系統(tǒng),所以這些數據會以不同的形式輸入到數據倉庫中。如何將這些數據加載,是數據倉庫建立中需要考慮的一個問題,在進行數據遷移的過程中,會將數據以一種適合數據倉庫的格式轉入數據倉庫中,這就是數據的格式化,對數據的處理是數據倉庫成功建立的關鍵,所以在數據提取的過程中,對數據進行格式化,從操作中實現數據資源的共享。ETL技術進行的數據有效性檢查是對數據進行標準給定的過程,如果數據的給定沒有在界定的范圍之內,那么它就是需要清除的對象。數據的清除包括了在給定界限范圍之外的數據,對這些數據采取一定的糾正措施。
通過數據倉庫,實現科研數據的轉換,是為了體現這些數據的價值,使其更加有意義,進一步推動科研工作的進程。在數據轉換的過程,使用最好的方法保證數據從原始儲存器到數據倉庫的過程是同步的,將數據轉換的重點放在語言的標準化、數據移動、通信等方面,數據的轉換除了自動化轉換以外,還具有一定的復雜性,所以在ETL數據轉換工具、技術不斷更新的同時,還需要將其復雜性進行解決。
(四)數據倉庫與科研數據動態(tài)更新
隨著科研進程的推進,數據倉庫也需要伴隨著科研數據的動態(tài)進行更新,這樣,才有助于實現數據的時效性。對檢查驗收之后的業(yè)務數據進行相應的更新,其他的數據都是在年底的時候才進行統(tǒng)一的更新。兩項或者兩項以上的、連續(xù)生產經營活動的變化和更新,都會被看作是多次變化,需要分別進行更新。數據倉庫更新方法主要是主鍵關聯法,主鍵關聯法就是要求被更新的數據庫和更新數據庫具有相同標識的小班唯一鍵值,然后才可以進行一對一的關聯,最后才可以進行數據倉庫數據的更新,主要更新的手段是字段更新。在對數據倉庫進行更新時,必須保證的是一對一的關聯,要不然會產生錯誤的邏輯關系。
(五)數據倉庫在科研檔案管理中的應用
通過數據倉庫來實現科研的檔案管理工作,對完善科研檔案管理具有重大的意義。對科研課題檔案資源進行研究和開發(fā)利用,檔案管理人員要注意聯合課題研究人員一起,及時的對各種課題檔案進行整理,通過數據倉庫,對檔案資源進行整合。然后積極的利用各種信息化技術,有效實現檔案資源的共享。并努力的深入研究開發(fā)各種檔案資源,更好的為經濟建設提供服務,最大程度的妥善利用各種檔案資源,保證科研究成果的最大化利用。從而有效的實現通過合理的利用促進科研工作的快速發(fā)展的目的,取得較大的經濟社會價值。
三、結語
針對現階段我國研究所科研項目管理工作中存在的問題,積極運用數據倉庫,來實現對科研數據資源的整合及管理。依靠數據倉庫實現科研檔案的規(guī)范化管理,以科研動態(tài)為基礎,及時更新數據倉庫,保持數據倉庫的時效性。數據倉庫在科研管理中的應用,進一步優(yōu)化了我國科研管理工作,提高了科研管理的質量和效率。努力提升我國科研管理能力,完善科研項目管理程序,使該管理體系逐步趨向規(guī)范化、成熟化。
參考文獻:
[1]焦振.基于Oracle的人事科研數據倉庫設計與實現[J].安陽師范學院學報,2013,(2):46-50.
[2]湯雪,趙衛(wèi)東,呂萬里等.高校教職工科研管理系統(tǒng)數據倉庫設計[J].福建電腦,2010,26(2):119-119,102.
[3]肖紅玉,黃靜,陳海等.數據庫技術在科研管理系統(tǒng)中的應用[J].制造業(yè)自動化,2010,32(10):68-70.
[4]巫莉莉,張波,李濤等.高校科研管理系統(tǒng)智能分析模塊的分析與實現[J].計算機工程與設計,2010,31(11):2641-2644.
[5]胡君.基于數據倉庫的科研管理系統(tǒng)設計與實現[D].中國地質大學(武漢),2011.
注:
本文為2009年廣東醫(yī)學院科研基金項目(Q2009021)。