薛雙
摘 要:信息技術(shù)的持續(xù)創(chuàng)新和廣泛應(yīng)用,推動(dòng)科學(xué)研究進(jìn)入大數(shù)據(jù)時(shí)代,既給高校科學(xué)研究管理帶來(lái)了新機(jī)遇,也提出了新挑戰(zhàn)。新技術(shù)理念的出現(xiàn)需要新的管理思維,通過(guò)分析科研數(shù)據(jù)管理出現(xiàn)了哪些新的特征,在充分了解大數(shù)據(jù)管理的基礎(chǔ)上探討在當(dāng)前環(huán)境下高校科研管理模式革新的新思路,對(duì)未來(lái)科研數(shù)據(jù)管理的研究方向做進(jìn)一步思考。
關(guān)鍵詞:大數(shù)據(jù); 互聯(lián)網(wǎng); 科研數(shù)據(jù)管理
引言
科研數(shù)據(jù)作為對(duì)自然,社會(huì)現(xiàn)象和科學(xué)實(shí)驗(yàn)等活動(dòng)的定量記錄,是科學(xué)技術(shù)發(fā)展的重要基礎(chǔ)。科學(xué)研究和商業(yè)在內(nèi)的各個(gè)領(lǐng)域已被推向前所未有的“大數(shù)據(jù)”時(shí)代,能夠可視化日益龐大和復(fù)雜的數(shù)據(jù),是科學(xué)研究必須適應(yīng)的一個(gè)新事實(shí)。高校作為科研前沿,積累了大量的科研數(shù)據(jù)。如何在如此大量的信息中有效管理科研數(shù)據(jù)是科研管理的重中之重。
1大數(shù)據(jù)時(shí)代科研數(shù)據(jù)管理新特征
1.1 形式多樣化
大數(shù)據(jù)時(shí)代,科研數(shù)據(jù)的來(lái)源不再是單一的文本數(shù)據(jù),而是變成了視頻等各種形式的多媒體數(shù)據(jù)。隨著信息化程度的不斷提高,各種非標(biāo)準(zhǔn)化數(shù)據(jù)的比例會(huì)越來(lái)越高,傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)對(duì)數(shù)據(jù)結(jié)構(gòu)的一致性要求越來(lái)越高,無(wú)法處理如此龐大的混合數(shù)據(jù)集。大數(shù)據(jù)技術(shù)將使用更先進(jìn)的信息技術(shù)對(duì)元數(shù)據(jù)進(jìn)行打包、分類(lèi)和過(guò)濾,以獲得過(guò)去未被注意到的細(xì)節(jié)和新發(fā)現(xiàn)。例如,新興的分析工具Spark是一個(gè)在大數(shù)據(jù)時(shí)代快速處理數(shù)據(jù)分析的框架。它易于操作,不需要用戶(hù)的任何編碼知識(shí)。一些大型軟件供應(yīng)商(如Microsoft和Salesforce)引入了新的分析工具:Microsoft R Server和Lightning CRM平臺(tái),非編碼器也可以創(chuàng)建應(yīng)用程序來(lái)查看數(shù)據(jù)。
1.2 重視關(guān)聯(lián)性
在傳統(tǒng)數(shù)據(jù)時(shí)代,我們獲得的數(shù)據(jù)少、結(jié)構(gòu)單一。使用傳統(tǒng)的數(shù)學(xué)方法,便可以計(jì)算出數(shù)據(jù)之間的因果關(guān)系。然而,在大數(shù)據(jù)時(shí)代,數(shù)據(jù)體量大,結(jié)構(gòu)復(fù)雜。研究人員可以從多個(gè)方面,視角和領(lǐng)域分析實(shí)驗(yàn)數(shù)據(jù),并探索研究對(duì)象之間的相關(guān)性,而不只是對(duì)設(shè)計(jì)實(shí)驗(yàn)的癡迷和驗(yàn)證假設(shè)。當(dāng)然,關(guān)注關(guān)聯(lián)性并不意味著放棄傳統(tǒng)的因果關(guān)系研究,大數(shù)據(jù)技術(shù)主要處理具有相關(guān)性的過(guò)程數(shù)據(jù)。
1.3 預(yù)見(jiàn)新趨勢(shì)
傳統(tǒng)的科研小數(shù)據(jù)因果關(guān)系的研究資料非常簡(jiǎn)單,實(shí)驗(yàn)結(jié)果因缺乏多元化的數(shù)據(jù)來(lái)補(bǔ)充的限制,因此實(shí)驗(yàn)結(jié)果缺乏擴(kuò)展性和可持續(xù)性。在大數(shù)據(jù)時(shí)代,未來(lái)形勢(shì)的預(yù)測(cè)是科研數(shù)據(jù)的最重要的研究。只有不斷補(bǔ)充數(shù)據(jù)和不斷豐富模型,才可以預(yù)測(cè)地更準(zhǔn)確,為高??茖W(xué)研究管理做決策判斷、出臺(tái)文件政策提供科學(xué)合理的依據(jù)。大學(xué)如何使用這些數(shù)據(jù)來(lái)產(chǎn)生有價(jià)值、有意義的科研成果;如何利用這些數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)科研發(fā)展方向是一個(gè)亟待解決的問(wèn)題。數(shù)據(jù)挖掘是近十年來(lái)信息科學(xué)領(lǐng)域備受重視的交叉學(xué)科,這門(mén)學(xué)科興起的因素之一就是能分析過(guò)去、指導(dǎo)現(xiàn)在、為未來(lái)作決策分析。
2大數(shù)據(jù)情境下科研管理模式革新
2.1完善高??蒲泄芾頂?shù)據(jù)庫(kù)
高校應(yīng)該主動(dòng)迎接大數(shù)據(jù)時(shí)代的到來(lái),準(zhǔn)確和真實(shí)的研究數(shù)據(jù)庫(kù)是一個(gè)重要的基礎(chǔ)和前提,為實(shí)現(xiàn)科研管理的變化。高校和科研院所可整合科研管理系統(tǒng),以方便內(nèi)部科研管理,但仍有待提高許多領(lǐng)域。在不同的高校采用不同制造商的系統(tǒng)將導(dǎo)致不同的科研情況和系統(tǒng)使用情況,以及不同的數(shù)據(jù)準(zhǔn)確性之間的數(shù)據(jù)兼容性。今后各科研系統(tǒng)要盡量實(shí)現(xiàn)數(shù)據(jù)的標(biāo)準(zhǔn)化,維護(hù)人員更新及時(shí)、保證數(shù)據(jù)準(zhǔn)確性才能推動(dòng)大數(shù)據(jù)時(shí)代建設(shè)科研管理的基礎(chǔ)變革。
2.2構(gòu)建科研數(shù)據(jù)交流與分析平臺(tái)
目前,高??蒲泄芾淼臄?shù)據(jù)庫(kù)作為科研數(shù)據(jù)的第一手資料,但考慮到數(shù)據(jù)安全與數(shù)據(jù)所有權(quán)益等原因,機(jī)構(gòu)內(nèi)的共享平臺(tái),基本未實(shí)現(xiàn)開(kāi)放共享,從而限制了科研數(shù)據(jù)獲取利用。
2.3 可視化應(yīng)用
可視化通過(guò)提供統(tǒng)計(jì)或交互式視覺(jué)表現(xiàn)的軟件系統(tǒng)來(lái)幫助人們探索和解釋復(fù)雜的數(shù)據(jù),它能有效簡(jiǎn)化提煉數(shù)據(jù)流,幫助使用者交互篩選有用數(shù)據(jù)。大數(shù)據(jù)時(shí)代的可視化不同于以往,現(xiàn)今主要是基于并行算法設(shè)計(jì)技術(shù),高效地處理和分析特定數(shù)據(jù)集的特性,直觀的可視環(huán)境也方便了科研管理人員可從紛雜無(wú)序的數(shù)據(jù)中解脫出來(lái),尋找新的研究切入點(diǎn)。多屏顯示可視化環(huán)境通過(guò)高速網(wǎng)絡(luò)連接的圖形服務(wù)器驅(qū)動(dòng)顯示器墻陣列,實(shí)現(xiàn)大運(yùn)算量的并行計(jì)算和超高分辨率的顯示的功能,它能從多方面增進(jìn)研究人員探索的工作效率,促進(jìn)更好地進(jìn)行空間思維、促進(jìn)科研人員之間的溝通。例如:高分辨率的地理航拍圖像是其中一個(gè)優(yōu)勢(shì)應(yīng)用,基于SAGE環(huán)境下的JuxtaView軟件以及其并行環(huán)境,可快速顯示由多塊高分辨率圖像組成的地理航拍數(shù)據(jù)顯示,目前得到了廣泛應(yīng)用。
2.4 個(gè)性化、專(zhuān)業(yè)化服務(wù)
數(shù)據(jù)不僅可以通過(guò)被收集,存儲(chǔ),組織和分析等手段讓研究人員找到研究學(xué)科發(fā)展的規(guī)律,捕捉自己的研究方向;也可通過(guò)個(gè)人終端的研究項(xiàng)目和研究團(tuán)隊(duì)的信息,了解各研究時(shí)間和項(xiàng)目的進(jìn)度;甚至每個(gè)研究者的思維態(tài)度,能力和方法都因此而有跡可循??蒲袛?shù)據(jù)管理者可由此及時(shí)、準(zhǔn)確地為研究者提供所需要的各種資源、指導(dǎo)和幫助,使高??蒲泄芾碚嬲龑?shí)現(xiàn)精準(zhǔn)服務(wù)。
3科研數(shù)據(jù)管理面臨的挑戰(zhàn)
3.1 數(shù)據(jù)計(jì)算方法需優(yōu)化
從系統(tǒng)角度看待科研數(shù)據(jù)處理,未來(lái)計(jì)算的研究方向主要包括以下幾個(gè)方面:批量計(jì)算主要考慮的是針對(duì)典型應(yīng)用進(jìn)行定制化的性能優(yōu)化,解決數(shù)據(jù)計(jì)算中的存儲(chǔ)瓶頸問(wèn)題;流式計(jì)算后續(xù)的研究要設(shè)計(jì)并優(yōu)化流式計(jì)算中的資源調(diào)度策略,同時(shí)實(shí)現(xiàn)數(shù)據(jù)流速高時(shí)處理速度快和數(shù)據(jù)流速低時(shí)能耗低兩個(gè)目標(biāo)。這些計(jì)算模式并不是相互獨(dú)立的,也可以相互配合,滿(mǎn)足同一應(yīng)用范式在不同階段對(duì)數(shù)據(jù)計(jì)算結(jié)果的要求。
3.2 專(zhuān)業(yè)人才缺乏
高??蒲泄芾聿块T(mén)利用好現(xiàn)在和未來(lái)的海量數(shù)據(jù)、海量技術(shù),需要專(zhuān)業(yè)性的數(shù)據(jù)人才,這些專(zhuān)業(yè)人才對(duì)科研數(shù)據(jù)資源的成功管理和利用起關(guān)鍵性作用。他們需要具備利用快速變化的網(wǎng)絡(luò)技術(shù)和數(shù)據(jù)技術(shù)的能力,參加相關(guān)的教育和培訓(xùn)活動(dòng),以便使用和管理這些科研數(shù)據(jù)。高??赏ㄟ^(guò)開(kāi)設(shè)數(shù)據(jù)科學(xué)相關(guān)的專(zhuān)業(yè)和課程對(duì)科研管理人員進(jìn)行專(zhuān)業(yè)培養(yǎng),促進(jìn)數(shù)據(jù)科學(xué)理論的發(fā)展,加快人才隊(duì)伍的建設(shè)。
3.3 數(shù)據(jù)的安全和隱私問(wèn)題
信息技術(shù)中,數(shù)據(jù)的安全和隱私一直是重中之重。隨著數(shù)據(jù)量的增大,數(shù)據(jù)面臨更嚴(yán)峻的安全風(fēng)險(xiǎn)和威脅,科研管理部門(mén)需要制定相應(yīng)的安全訪問(wèn)策略,確保數(shù)據(jù)訪問(wèn)的授權(quán)和安全。數(shù)據(jù)的隱私問(wèn)題包括兩個(gè)方面:一是個(gè)人隱私的保護(hù),隨著數(shù)據(jù)采集技術(shù)的發(fā)展,在用戶(hù)無(wú)法察覺(jué)的情況下,個(gè)人隱私信息可以被更容易地獲取;另一方面,即使得到用戶(hù)的許可,個(gè)人隱私數(shù)據(jù)在存放、傳輸和使用的過(guò)程中,也有被泄露的風(fēng)險(xiǎn)。因此,大數(shù)據(jù)時(shí)代的隱私保護(hù)或?qū)⒊蔀樾碌拿}。
結(jié)論
大數(shù)據(jù)時(shí)代的到來(lái),給高??蒲袛?shù)據(jù)管理工作帶來(lái)了挑戰(zhàn),為順應(yīng)時(shí)代發(fā)展,高校科研數(shù)據(jù)管理工作必須不斷進(jìn)行完善。高校需要優(yōu)化數(shù)據(jù)計(jì)算方法、加強(qiáng)科研人員隊(duì)伍的建設(shè)、提升高??蒲邪l(fā)展水平、對(duì)高??蒲袛?shù)據(jù)的安全和隱私問(wèn)題加強(qiáng)重視并提高相應(yīng)的監(jiān)控手段,更好地促進(jìn)高??蒲袛?shù)據(jù)管理工作的發(fā)展。
參考文獻(xiàn)
[1]維克托·邁爾-舍恩伯格,肯尼思·庫(kù)克耶.大數(shù)據(jù)時(shí)代:生活、工作與思維大變革[M].盛楊燕,周濤譯.杭州:浙江人民大學(xué)出版社,2013.
[2]CODATA中國(guó)全國(guó)委員會(huì).大數(shù)據(jù)時(shí)代的科研活動(dòng)[M].北京:科學(xué)出版社,2014.
[3]邢文明,吳方枝,司莉等.高校圖書(shū)館開(kāi)展科研數(shù)據(jù)管理與共享服務(wù)調(diào)查分析[J].圖書(shū)館論壇,2013(6):19-25,61.
[4]孟祥保,李?lèi)?ài)國(guó).國(guó)外高校圖書(shū)館科學(xué)數(shù)據(jù)素養(yǎng)教育研究[J].大學(xué)圖書(shū)館學(xué)報(bào),2014(3):11-16.
[5]楊鶴林.從數(shù)據(jù)監(jiān)護(hù)看美國(guó)高校圖書(shū)館的機(jī)構(gòu)庫(kù)建設(shè)新思路——來(lái)自 DataStaR 的啟示[J].大學(xué)圖書(shū)館學(xué)報(bào),2012(2):23-28.
[6]李曉輝.圖書(shū)館科研數(shù)據(jù)管理與服務(wù)模式探討[J].中國(guó)圖書(shū)館學(xué)報(bào),2011(5):46-52.
[7]唐燕花.高??蒲袛?shù)據(jù)管理服務(wù)實(shí)踐研究及建議[J].圖書(shū)情報(bào)工作,2016(24):130-138.
[8]胡紹君.面向科研數(shù)據(jù)管理的高校學(xué)科館員能力建設(shè)研究[J].圖書(shū)情報(bào)工作,2016(22):74-81.