郭亞平
[摘 要]數(shù)據(jù)作為基礎(chǔ)性戰(zhàn)略資源,已經(jīng)成為社會(huì)發(fā)展的必然趨勢(shì)和社會(huì)變革的驅(qū)動(dòng)力。本文介紹了大數(shù)據(jù)的產(chǎn)生背景、概念內(nèi)涵和主要特點(diǎn),提出了大數(shù)據(jù)背景下推進(jìn)信息資源開發(fā)與利用面臨的問題,探討我國科技信息資源開發(fā)與利用的發(fā)展思路和初步進(jìn)展,旨在為開展后續(xù)信息服務(wù)工作奠定基礎(chǔ)。
[關(guān)鍵詞]大數(shù)據(jù);信息資源;信息管理人員
doi:10.3969/j.issn.1673 - 0194.2019.12.083
[中圖分類號(hào)]G322[文獻(xiàn)標(biāo)識(shí)碼]A[文章編號(hào)]1673-0194(2019)12-0-02
0? ? ?引 言
隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)不僅推動(dòng)社會(huì)發(fā)展與變革,也提高了國家、軍隊(duì)各方面的競(jìng)爭(zhēng)力和保障水平,給信息資源開發(fā)與利用帶來機(jī)遇的同時(shí)也帶來了挑戰(zhàn)。
1? ? ?大數(shù)據(jù)概述
1.1? ?產(chǎn)生背景
大數(shù)據(jù)產(chǎn)生的背景包括以下幾方面。第一,信息科技進(jìn)步。信息科技的3個(gè)最核心基礎(chǔ)能力(信息處理、信息存儲(chǔ)和信息傳遞)飛速進(jìn)步。第二,互聯(lián)網(wǎng)把每臺(tái)計(jì)算機(jī)連接起來,成為人們獲取各類數(shù)據(jù)的首要渠道。第三,云計(jì)算將分布式、高性價(jià)比的大量計(jì)算、網(wǎng)絡(luò)和資源集成管理,并將應(yīng)用軟件簡(jiǎn)化為服務(wù)。云計(jì)算是大數(shù)據(jù)處理的重要支撐,大數(shù)據(jù)依托云計(jì)算挖掘海量數(shù)據(jù)。第四,物聯(lián)網(wǎng)是互聯(lián)網(wǎng)的延伸和擴(kuò)展,通過智能感知、識(shí)別等信息技術(shù),廣泛應(yīng)用于網(wǎng)絡(luò)中,在物與物間進(jìn)行信息交換和通信,產(chǎn)生大量數(shù)據(jù),其中,一些數(shù)據(jù)被持續(xù)收集起來成為大數(shù)據(jù)的重要來源之一。
1.2? ?概念內(nèi)涵
“大數(shù)據(jù)”術(shù)語最早出現(xiàn)在apache org的開源項(xiàng)目中。大數(shù)據(jù)的意義是提高對(duì)巨量數(shù)據(jù)的專業(yè)化處理能力,實(shí)現(xiàn)數(shù)據(jù)增值,而不是掌握這些數(shù)據(jù)信息。大數(shù)據(jù)的概念是一種規(guī)模大到在獲取、存儲(chǔ)、管理、分析方面遠(yuǎn)遠(yuǎn)超出傳統(tǒng)數(shù)據(jù)庫軟件工具范圍的數(shù)據(jù)集集合,是海量資源和技術(shù)構(gòu)架的統(tǒng)稱。大數(shù)據(jù)以海量數(shù)據(jù)為核心,泛指在以網(wǎng)絡(luò)為基礎(chǔ),智能分析為手段,輔助決策為目標(biāo)的資源、技術(shù)和應(yīng)用的統(tǒng)稱。
1.3? ?特征
大數(shù)據(jù)的特征就是眾所周知的“4V標(biāo)準(zhǔn)”。第一,數(shù)量(Volume),即數(shù)據(jù)規(guī)模巨大,從現(xiàn)在的TB/PB級(jí)體量,很快進(jìn)入ZB時(shí)代。第二,多樣性(Variety),即數(shù)據(jù)類型多樣,包括結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。第三,速度(Velocity),即數(shù)據(jù)處理快速,數(shù)據(jù)采集和處理時(shí)效性強(qiáng)。第四,真實(shí)性(Veracity),即追求高質(zhì)量的數(shù)據(jù)。
2? ? ?大數(shù)據(jù)背景下推進(jìn)信息資源開發(fā)利用存在的問題
2.1? ?數(shù)據(jù)管理與呈現(xiàn)數(shù)據(jù)面臨困難
信息管理人員面臨的首個(gè)難題是數(shù)據(jù)管理。各個(gè)單位的不同部門產(chǎn)生的數(shù)據(jù)形式多樣,結(jié)構(gòu)復(fù)雜,標(biāo)準(zhǔn)不同,往往包括異構(gòu)多源的各型數(shù)據(jù),增加了數(shù)據(jù)采集、編輯與整合的困難。此外,網(wǎng)絡(luò)數(shù)據(jù)信息量大、價(jià)值密度低,干擾和劣質(zhì)的信息影響了信息資源開發(fā)與利用的質(zhì)效。在管理過程中,管理人員不僅要收集數(shù)據(jù),還要通過集成和模型分析,呈現(xiàn)數(shù)據(jù)。
2.2? ?大數(shù)據(jù)技術(shù)要求高
數(shù)據(jù)管理依賴先進(jìn)的技術(shù)手段。目前,大多數(shù)數(shù)據(jù)挖掘算法的計(jì)算復(fù)雜度高,計(jì)算任務(wù)耗時(shí)長,非常迫切地需要相關(guān)企業(yè)掌握適應(yīng)大數(shù)據(jù)特征的新型加工處理技術(shù)。只有借助符合大數(shù)據(jù)特征的數(shù)據(jù)分析工具提供技術(shù)層面的支持,才能及時(shí)分析利用數(shù)據(jù),抓住數(shù)據(jù)最佳時(shí)效,不影響人們對(duì)事物的認(rèn)知與判斷,滿足數(shù)據(jù)的準(zhǔn)確性、完整性、全面性要求,才能批量挖掘大數(shù)據(jù)信息,獲得有價(jià)值的數(shù)據(jù),滿足動(dòng)態(tài)數(shù)據(jù)處理需求。
2.3? ?信息安全問題頻發(fā)
隨著信息技術(shù)的不斷發(fā)展,網(wǎng)絡(luò)系統(tǒng)防護(hù),專業(yè)數(shù)據(jù)備份、還原等信息要求越來越高,信息安全地位日顯突出。網(wǎng)絡(luò)信息泄露與竊密問題時(shí)有發(fā)生,網(wǎng)絡(luò)病毒層出不窮。信息技術(shù)的發(fā)展引起了信息內(nèi)容、載體和傳遞方式的變化,也引起了很多意想不到的問題和糾紛。
3? ? ?在大數(shù)據(jù)背景下進(jìn)行科技信息資源開發(fā)與利用的發(fā)展思路和內(nèi)容架構(gòu)
3.1? ?發(fā)展思路
在大數(shù)據(jù)背景下,緊緊圍繞科技信息工作的任務(wù),針對(duì)基于大數(shù)據(jù)的資源體系構(gòu)建、知識(shí)體系構(gòu)建、情報(bào)智能分析等開展研究,收集各種渠道的信息,利用多種途徑推動(dòng)應(yīng)用技術(shù)發(fā)展,提高應(yīng)用大數(shù)據(jù)作戰(zhàn)能力、情報(bào)感知能力,不斷完善自身建設(shè),爭(zhēng)取在前沿研究等方面取得突破,形成有效信息挖掘與情報(bào)分析支撐能力,推動(dòng)科技信息工作的發(fā)展與進(jìn)步。
3.2? ?內(nèi)容架構(gòu)
目前,筆者所在單位還處于信息資源開發(fā)與利用的初級(jí)階段。信息中心購置服務(wù)器,搭建了服務(wù)器集群,基礎(chǔ)條件支撐環(huán)境已經(jīng)實(shí)現(xiàn)高性能計(jì)算和高帶寬網(wǎng)絡(luò)通信,正在構(gòu)建科技信息獲取平臺(tái)和信息重構(gòu)與融合平臺(tái),逐步實(shí)現(xiàn)科技信息采集、處理、管理和轉(zhuǎn)播服務(wù),以及信息抽取、聚合服務(wù)。現(xiàn)急需建立一種有效的服務(wù)機(jī)制,在應(yīng)用層面提升信息服務(wù)質(zhì)量,實(shí)現(xiàn)信息資源互聯(lián)互通、資源共享和服務(wù)創(chuàng)新。應(yīng)用體系架構(gòu)如圖1所示。
4? ? ?信息資源開發(fā)與利用在大數(shù)據(jù)背景下的初步進(jìn)展
云計(jì)算等新型信息技術(shù)推動(dòng)了信息資源開發(fā)與利用的快速轉(zhuǎn)型,尤其是在大數(shù)據(jù)背景下,已經(jīng)實(shí)現(xiàn)了數(shù)據(jù)轉(zhuǎn)換、傳輸、存儲(chǔ)、遠(yuǎn)程獲取以及各類數(shù)據(jù)的分析與統(tǒng)計(jì)。此外,信息網(wǎng)絡(luò)和數(shù)據(jù)平臺(tái)已有一定規(guī)模,具備數(shù)據(jù)開發(fā)與利用基礎(chǔ)。目前,筆者所在單位在數(shù)據(jù)工程項(xiàng)目建設(shè)的基礎(chǔ)上持續(xù)開展數(shù)據(jù)采集與處理工作,為科研課題、裝備建設(shè)等工作提供信息支撐。
4.1? ?建立個(gè)性化服務(wù)系統(tǒng)
應(yīng)用大數(shù)據(jù)技術(shù)提高了數(shù)據(jù)開發(fā)與利用能力,也提高了科技信息服務(wù)水平。筆者所在單位的信息中心每年根據(jù)工作重點(diǎn)確定服務(wù)主題內(nèi)容,面對(duì)快速增長的數(shù)據(jù),提煉有價(jià)值的信息,提供準(zhǔn)確的信息資源。目前,筆者所在單位深度分析數(shù)據(jù),建立個(gè)性化的數(shù)據(jù)分析模型,提供個(gè)性化信息服務(wù)。個(gè)性化服務(wù)系統(tǒng)主要包括用戶分析系統(tǒng)、信息推送系統(tǒng)、定題跟蹤系統(tǒng)等。
4.2? ?課題跟蹤服務(wù)
課題跟蹤服務(wù)涵蓋了信息搜集、傳遞及分析等多個(gè)方面。作為一種新型信息服務(wù)形式,打破了被動(dòng)提供參考咨詢的傳統(tǒng)模式。目前,筆者所在單位指定信息服務(wù)人員為科研課題項(xiàng)目組搜集信息,專職人員跟蹤項(xiàng)目進(jìn)度,獲得項(xiàng)目實(shí)時(shí)需求,利用現(xiàn)有資源與平臺(tái)搜集提供前沿性的信息資源,有效參與到單位建設(shè)中。
4.3? ?云搜索服務(wù)
云搜索是專業(yè)站內(nèi)搜索和內(nèi)容推薦系統(tǒng),在分布式搜索引擎的基礎(chǔ)上,提供更穩(wěn)定、實(shí)時(shí)、可靠的個(gè)性化、智能化信息。筆者所在單位定制開放云搜索服務(wù),信息檢索人員可根據(jù)自己的需求尋找各種類型的相關(guān)數(shù)據(jù)信息,搜索方式靈活、搜索結(jié)果精準(zhǔn)、搜索速度更快。
5? ? ?結(jié) 語
大數(shù)據(jù)為科技信息資源的開發(fā)與利用提供了信息平臺(tái)、技術(shù)支撐和保障,有助于解決信息管理服務(wù)效率低、信息資源分散、深層次開發(fā)不足、共享不足等問題。因此,要不斷提高信息資源開發(fā)與利用的廣度和深度,加大對(duì)大數(shù)據(jù)技術(shù)的扶持與投資,推動(dòng)信息傳遞的共享化,充分發(fā)揮信息資源在推動(dòng)科研、裝備建設(shè)等方面發(fā)展中的作用,不斷提高科技信息資源的價(jià)值。
主要參考文獻(xiàn)
[1]姜虹.大數(shù)據(jù)背景下圖書館信息資源的管理及利用[J].黑河學(xué)院學(xué)報(bào),2016(7).
[2]李雪森,佟琳.淺談大數(shù)據(jù)時(shí)代信息技術(shù)的機(jī)遇與挑戰(zhàn)[J].信息安全與技術(shù),2013(11).
[3]鄔賀銓.大數(shù)據(jù)時(shí)代的機(jī)遇與挑戰(zhàn)[J].唯實(shí):現(xiàn)代管理,2013(5).
[4]曾方,黃紹斌,黃璐.大數(shù)據(jù)背景下政府信息資源開發(fā)利用供給機(jī)制探討[J].唯實(shí):現(xiàn)代管理,2016(7).
[5]高峰,王劍.大數(shù)據(jù)背景下科技信息資源創(chuàng)新支撐能力研究[J].情報(bào)雜志,2018(10).
[6]黃雙穎.大數(shù)據(jù)環(huán)境下網(wǎng)絡(luò)信息資源的管理與利用研究[J].科技情報(bào)開發(fā)與經(jīng)濟(jì),2014(21).
[7]袁偉,石蕾.大數(shù)據(jù)背景下科技資源信息挖掘與利用的思考[J].中國科技資源導(dǎo)刊,2017(49).
[8]王學(xué)琴,楊劍,康磊,等.大數(shù)據(jù)驅(qū)動(dòng)科技信息資源市場(chǎng)化開發(fā)利用[J].中國科技信息,2015(5).
[9]周萍.大數(shù)據(jù)背景下醫(yī)院檔案信息資源利用問題研究[J].檔案天地,2016(4).