馬瑾男,王志文
(山西省信息產(chǎn)業(yè)技術(shù)研究院有限公司,山西 太原 030012)
隨著信息技術(shù)的發(fā)展,我國的信息資源管理發(fā)展由最初的傳統(tǒng)管理時代進入了信息管理時代,伴隨著網(wǎng)絡(luò)信息的快速發(fā)展,“大數(shù)據(jù)”也逐漸引起人們的關(guān)注。大數(shù)據(jù)是指以多元形式,許多來源搜集而來的龐大數(shù)據(jù)組,它的特色在于對海量數(shù)據(jù)的挖掘、提純。簡言之,從各種各樣類型的數(shù)據(jù)中,快速獲得有效價值信息的能力,稱為大數(shù)據(jù)技術(shù)。
本文所提到的科技資源信息化管理主要是政府為有效整合和優(yōu)化全省的科技資源,實現(xiàn)科技資源的數(shù)據(jù)集成、數(shù)據(jù)展示、在線預(yù)約、服務(wù)評價和監(jiān)督等功能而建設(shè)的山西省科技資源開放共享網(wǎng)絡(luò)管理服務(wù)平臺(以下簡稱“科技資源管理服務(wù)平臺”)。
在科技資源管理服務(wù)平臺中,大數(shù)據(jù)技術(shù)成為了一項重要的工具和手段。目前大型科研設(shè)施與儀器、科技文獻、重點實驗室、創(chuàng)新團隊、創(chuàng)新平臺、工程技術(shù)研究中心等都通過大數(shù)據(jù)技術(shù)實現(xiàn)了數(shù)據(jù)的集成、挖掘、展示及管理。大數(shù)據(jù)技術(shù)的出現(xiàn),為科技資源的共享服務(wù)帶來了極大的便捷。
山西省科技資源開放共享網(wǎng)絡(luò)管理服務(wù)平臺是山西省科技廳根據(jù)國發(fā)[2014]70號文要求搭建的布局合理、功能完善、體系健全、共享高效的管理服務(wù)平臺。服務(wù)于儀器管理單位,主管部門、科技廳以及廣大科技資源用戶,實現(xiàn)全要素科技資源開放共享管理服務(wù),大型科研設(shè)施與儀器平臺(落實國務(wù)院70號文)、科技基礎(chǔ)條件平臺、生物(物種)資源與實驗材料、科技文獻、科學(xué)數(shù)據(jù)、重點科技創(chuàng)新平臺、重點實驗室、工程技術(shù)研究中心、創(chuàng)新團隊、科技創(chuàng)新券等向社會開放共享,提高科技資源的利用率。
在該系統(tǒng)中,我們通過大數(shù)據(jù)技術(shù)實現(xiàn)了大型科研設(shè)施與儀器資源庫的建立,重點實驗室、創(chuàng)新團隊、工程技術(shù)研究中心、重點科技創(chuàng)新平臺的信息收集與共享,搭建了近50家在線服務(wù)平臺,實現(xiàn)在線預(yù)約、在線搜索等功能;利用大數(shù)據(jù)技術(shù)還配套建設(shè)“山西省科技創(chuàng)新券管理系統(tǒng)”,促使形成具有個性化、專門化服務(wù)的信息資源。通過大數(shù)據(jù)的應(yīng)用將信息搜集和開發(fā)利用作為目標,有效解決了信息整合、數(shù)據(jù)挖掘、隱性知識的顯性化及信息資源的知識管理、信息共享等問題,促使科技資源的有效共享和管理。
將傳統(tǒng)工具與大數(shù)據(jù)工具有效結(jié)合,收錄入網(wǎng)儀器2000余臺,并對儀器進行整合分類;收錄重點科技創(chuàng)新平臺、創(chuàng)新團隊、工程技術(shù)研究中心等近400余家,建立后臺數(shù)據(jù)庫,前臺數(shù)據(jù)分類;搭建在線服務(wù)平臺群49家,實現(xiàn)數(shù)據(jù)的高級分類搜索,建立儀器庫,對儀器庫進行數(shù)據(jù)分析,實現(xiàn)數(shù)據(jù)預(yù)約排行榜;搭建山西科技創(chuàng)新券管理系統(tǒng),對中小微企業(yè)、平臺基地、管理機構(gòu)數(shù)據(jù)進行數(shù)據(jù)分類、數(shù)據(jù)處理及展示、數(shù)據(jù)分析統(tǒng)計、數(shù)據(jù)存儲等。
圖1 系統(tǒng)圖
針對科技資源系統(tǒng)并不是單純的對信息資源進行整合,我們在整合的基礎(chǔ)上積極了解用戶遇到的數(shù)據(jù)問題,如數(shù)據(jù)的查詢、使用等,對數(shù)據(jù)進行了加工、處理、分類、優(yōu)化、展示,從而給用戶提供更好的科技資源信息。
針對大量有效數(shù)據(jù),利用數(shù)據(jù)網(wǎng)絡(luò)技術(shù),搭建數(shù)據(jù)接口,強化數(shù)據(jù)關(guān)聯(lián),實現(xiàn)平臺與平臺之間,用戶與企業(yè)之間、部門與部門之間的有效連接,達成了數(shù)據(jù)共享、數(shù)據(jù)留痕、數(shù)據(jù)匯集、數(shù)據(jù)關(guān)聯(lián)、數(shù)據(jù)分析、數(shù)據(jù)智能的目標,促使科技資源信息的有效共享和利用。
通過標準化的流程和工具對科技資料中的數(shù)據(jù)分類進行處理,保證預(yù)先定義和設(shè)定好的高質(zhì)量數(shù)據(jù)分析結(jié)果。
無論是對大型科研設(shè)施中的儀器設(shè)施數(shù)據(jù)還是對創(chuàng)新券管理系統(tǒng)中的各類用戶,應(yīng)用數(shù)據(jù)可視化的直觀展示,通過數(shù)據(jù)說話,增強用戶體驗感。
利用集群、分割、孤立點分析等算法深入科技資料各類數(shù)據(jù)內(nèi)部,挖掘數(shù)據(jù)的價值,最終形成科技資源各類統(tǒng)計表,為用戶提供參考,為政府部門提供下一步?jīng)Q策預(yù)測的依據(jù)。
相似匹配是通過一定的方法,來計算兩個數(shù)據(jù)的相似程度,本系統(tǒng)中相似匹配方法用于科技資源管理服務(wù)平臺的各項網(wǎng)頁搜索,及創(chuàng)新券系統(tǒng)、大型科研設(shè)施與儀器管理平臺的評分功能。
本文通過對大數(shù)據(jù)技術(shù)的應(yīng)用,對山西省科技資源開放共享管理服務(wù)平臺的探討,得出大數(shù)據(jù)技術(shù)是解決科技資源管理信息化的重要手段,通過大數(shù)據(jù)技術(shù)提高了科技資源信息的有效性、實時性、便利性,為儀器管理單位、儀器使用者、主管部門、科技廳等廣大科技資源用戶提供了便利。
注:本論文依托于“山西科技成果轉(zhuǎn)化和知識產(chǎn)權(quán)交易服務(wù)平臺運營服務(wù)”項目。