于洪業(yè)
(營口市科學(xué)技術(shù)情報研究所,遼寧營口 115000)
大數(shù)據(jù)背景下情報服務(wù)發(fā)展方向的探索
于洪業(yè)
(營口市科學(xué)技術(shù)情報研究所,遼寧營口 115000)
本文通過對數(shù)據(jù)發(fā)展歷史由淺入深的描述,闡述了大數(shù)據(jù)的來源、定義和主要特征;并通過分析大數(shù)據(jù)對情報服務(wù)事業(yè)的影響,以及將礦產(chǎn)資源和大數(shù)據(jù)資源模擬對比,提出了在大數(shù)據(jù)時代情報服務(wù)事業(yè)的發(fā)展方向:應(yīng)將重點放在把挖掘到的有價值數(shù)據(jù)應(yīng)用到情報分析研究上,這是大數(shù)據(jù)環(huán)境下情報服務(wù)由信息服務(wù)轉(zhuǎn)向高端的知識服務(wù)的一個必然的過程,也是未來情報服務(wù)發(fā)展的主戰(zhàn)場。
大數(shù)據(jù) 情報 服務(wù)
人類社會出現(xiàn)以后,數(shù)據(jù)就一直伴隨著社會的發(fā)展而存在,并不斷變換著它的載體和數(shù)量。比如,從遠古人們用繩子打結(jié)記事,到古代在龜甲獸骨、泥板、竹簡上刻字紀(jì)錄,到后來在絹、紙上書寫記載,以及到現(xiàn)在通過電子手段存儲、處理信息數(shù)據(jù),數(shù)據(jù)隨著社會的進步而不斷增加它的種類和數(shù)量,與之相適應(yīng)的是產(chǎn)生新的存儲、處理載體,而新的載體又激發(fā)了數(shù)據(jù)量的劇增,它們以螺旋方式循環(huán)上升。而所謂大數(shù)據(jù)是個相對的稱呼,就是其數(shù)據(jù)量超出了當(dāng)時常規(guī)數(shù)據(jù)載體存儲、處理等操作的能力。目前,隨著互聯(lián)網(wǎng)的發(fā)展,原先分散的數(shù)據(jù)一下流通起來,并借助互聯(lián)網(wǎng)產(chǎn)生了巨量的新數(shù)據(jù),因此大數(shù)據(jù)就是互聯(lián)網(wǎng)發(fā)展到現(xiàn)今階段的一種表象或特征,在以云計算為代表的技術(shù)創(chuàng)新載體支撐下,這些原本很難收集和使用的數(shù)據(jù)開始容易被利用起來了。通過各行各業(yè)的不斷創(chuàng)新,大數(shù)據(jù)會逐步為人類創(chuàng)造更多的價值。
麥肯錫(McKinsey’s Global Institute,美國首屈一指的咨詢公司)是研究大數(shù)據(jù)的先驅(qū)。在其報告《Big data:The next frontier for innovation,competition,and productivity,大數(shù)據(jù):創(chuàng)新、競爭和生產(chǎn)力的下一個前沿領(lǐng)域》中它給出的大數(shù)據(jù)定義是:大數(shù)據(jù)指的是大小超出常規(guī)的數(shù)據(jù)庫工具獲取、存儲、管理和分析能力的數(shù)據(jù)集。但它同時強調(diào),并不是說一定要超過特定TB值的數(shù)據(jù)集才能算是大數(shù)據(jù)。國際數(shù)據(jù)公司(IDC)從大數(shù)據(jù)的四個特征來定義,即海量的數(shù)據(jù)規(guī)模(Volume)、快速的數(shù)據(jù)流轉(zhuǎn)和動態(tài)的數(shù)據(jù)體系(Velocity)、多樣的數(shù)據(jù)類型(Variety)、巨大的數(shù)據(jù)價值(Value)。
在20世紀(jì)50-60年代,西方國家對我國進行全面封鎖,那時的信息獲取渠道很少,因此當(dāng)時的科技情報工作顯得十分重要,情報收集整理、情報編譯報道、情報分析研究等即高深莫測又成效顯著,并為我國的科學(xué)技術(shù)發(fā)展做出了卓越的貢獻并取得了令人矚目的學(xué)術(shù)研究成果。
到了20世紀(jì)80年代,各級科技情報研究機構(gòu)(所)憑借著其收藏的科技報告、專利文獻、標(biāo)準(zhǔn)文獻和DIALOG之類的國際聯(lián)機檢索數(shù)據(jù)庫,特別是對科技查新的獨家壟斷,也曾在當(dāng)時風(fēng)光一時。
但是,進入20世紀(jì)90年代中期以后,隨著計算機和網(wǎng)絡(luò)的迅速普及、數(shù)據(jù)資源的易于獲得和科技工作者水平的普遍提高,使情報收集整理和情報編譯報道等信息服務(wù)已沒有了多少市場,能體現(xiàn)知識服務(wù)的高深的情報分析研究也失去了往日的光環(huán)。特別是在互聯(lián)網(wǎng)高速發(fā)展的今天,伴隨而生的大數(shù)據(jù)和云計算等在為各行各業(yè)提供機會同時也提出了挑戰(zhàn),而與信息、數(shù)據(jù)密切相關(guān)的科技情報工作更是如此,如何迎接挑戰(zhàn)、抓住機遇,情報服務(wù)事業(yè)如何發(fā)展?是我們情報工作者亟待解決的問題。
無論是在2014年3月在北京舉行的大數(shù)據(jù)產(chǎn)業(yè)推介會上,還是在2014年11月召開的世界互聯(lián)網(wǎng)大會上,被視為商界傳奇的中國電子商務(wù)創(chuàng)始人馬云在他的主題演講中均發(fā)表了他的最新觀點,即“人類正從IT時代走向DT(Data Technology)時代。”
表1 礦產(chǎn)資源與大數(shù)據(jù)各階段流程對比
從上文第3部分的分析中我們可以看到,在50-60年代,情報服務(wù)工作的開展得益于當(dāng)時社會對信息獲取的不易,而情報機構(gòu)具有獨特的獲取信息的優(yōu)勢,比如政府的扶持、中外資料的獲得、外語人才的擁有等等,也就是具有獲取信息、數(shù)據(jù)的渠道。在20世紀(jì)80年代,借助多年信息資料和渠道的積累,我們具有了某些大數(shù)據(jù)資源的前身,也正因為這些資源,使我們在當(dāng)時擁有了為企事業(yè)單位提供情報服務(wù)的優(yōu)勢和能力。而進入20世紀(jì)90年代中期以后,特別是到了目前的大數(shù)據(jù)時代,我們的優(yōu)勢在逐漸消失,在信息服務(wù)方面主要體現(xiàn)在是數(shù)據(jù)源優(yōu)勢的消失,而在知識服務(wù)方面主要體現(xiàn)在大數(shù)據(jù)環(huán)境下對數(shù)據(jù)分析的不適應(yīng)。
人們現(xiàn)在常把大數(shù)據(jù)比作寶礦,就像蘊含著巨大價值的礦產(chǎn)資源一樣。下面就通過模擬礦產(chǎn)資源,把大數(shù)據(jù)與礦產(chǎn)資源在開采、生產(chǎn)等不同階段時期所處的狀態(tài)進行對比,分析情報工作在不同階段中可能提供的服務(wù)。
在上表1的“資源階段”,情報服務(wù)業(yè)務(wù)要想占據(jù)一席之地,當(dāng)然最好是擁有自己的大數(shù)據(jù)資源,比如以前積累的文獻資料數(shù)據(jù)庫等,但這完全滿足不了情報服務(wù)于不同行業(yè)的需要。我們還需要尋找其他的大數(shù)據(jù)源來獲取所需的數(shù)據(jù),或者根據(jù)需要建造某種平臺收集新的數(shù)據(jù)并創(chuàng)建成新的大數(shù)據(jù)資源,但后者實行起來難度較大,需要國家的扶持和時間的積累。因此,在這一階段情報服務(wù)工作能做的主要是繼續(xù)利用原有數(shù)據(jù)資源并加大研發(fā)、使用數(shù)據(jù)挖掘工具,爭取在原有數(shù)據(jù)資源上獲取更多的有價值數(shù)據(jù);其次就是利用別人的大數(shù)據(jù)資源開展業(yè)務(wù),但在獲取可行性方面,還有很多不確定因素,比如是否可以獲取(包括技術(shù)上是否能實現(xiàn))、挖掘工具的使用、獲取成本、獲取程度等等。因此這一階段,我們原有情報服務(wù)業(yè)務(wù)目前優(yōu)勢不是太大。
在“生產(chǎn)階段”,對于礦產(chǎn)業(yè)來說是把礦石開采出來并提煉出產(chǎn)品,對應(yīng)于大數(shù)據(jù)就是使用數(shù)據(jù)挖掘軟件(工具)把有用的數(shù)據(jù)提取出來。由于目前大數(shù)據(jù)的產(chǎn)生主要是伴生于網(wǎng)絡(luò)及互聯(lián)網(wǎng),因此現(xiàn)在一談到數(shù)據(jù)挖掘技術(shù)及工具,基本都是IT人士的事,而情報業(yè)務(wù),特別是在情報分析方面的一個明顯短板是技術(shù)和工具的短缺,所以剛開始的時候,覺得大數(shù)據(jù)為情報分析提供了豐富的數(shù)據(jù)資源,可能是提升情報分析水平能力的大好機遇。但是換一個角度看,或許正因為大數(shù)據(jù)分析學(xué)技術(shù)非常先進,所以原本技術(shù)基礎(chǔ)較差的情報分析領(lǐng)域反而不容易獲益。技術(shù)轉(zhuǎn)移的歷史經(jīng)驗告訴我們,技術(shù)供應(yīng)方與接收方差距過大是轉(zhuǎn)移失敗的主要原因之一。許多“正統(tǒng)”的情報機構(gòu)由于缺乏技術(shù)人才和相應(yīng)的組織文化,可能與大數(shù)據(jù)帶來的機會失之交臂。Facebook對情報人員的應(yīng)聘要求包括具有計算機科學(xué)或其他相關(guān)技術(shù)領(lǐng)域的碩士以上學(xué)位,有豐富的數(shù)據(jù)分析工作經(jīng)驗,熟練掌握至少一種腳本語言,輕松自如的面對復(fù)雜大量的數(shù)據(jù),靈活的分析手段,準(zhǔn)確的表達等等。在這種要求下,傳統(tǒng)的情報人員已經(jīng)不能滿足大數(shù)據(jù)環(huán)境下情報服務(wù)的需要,必須通過角色轉(zhuǎn)型才能滿足企事業(yè)單位對情報服務(wù)的需求。因此,在這一階段,短期內(nèi)不是我們情報業(yè)務(wù)的長項,也是我們情報部門今后急需增強的部分。
在“應(yīng)用階段”,對于礦產(chǎn)資源方面來說,是把已提煉出的產(chǎn)品,如金屬、化工原料等通過加工,應(yīng)用到各個領(lǐng)域及行業(yè);而對于大數(shù)據(jù)方面來說,側(cè)是把提取到的有價值的數(shù)據(jù)通過處理、編輯、分析等加工后服務(wù)于相關(guān)行業(yè)、用戶。而專業(yè)的數(shù)據(jù)分析師對具體應(yīng)用到的行業(yè)就目前來看在了解上還存在著斷層,就像編程人員需要懂業(yè)務(wù)的人員配合才能編寫出某一行業(yè)的應(yīng)用軟件一樣,在大數(shù)據(jù)被挖掘后到具體應(yīng)用的這一過程中,也就是在專業(yè)數(shù)據(jù)分析師與各個領(lǐng)域具體應(yīng)用之間可能還需要存在一個銜接層或中間層。麥肯錫報告指出,能提出正確問題和利用分析結(jié)果的管理者和分析師需要量將是數(shù)據(jù)分析師的10倍。因為優(yōu)秀的情報人員具備對技術(shù)和產(chǎn)業(yè)領(lǐng)域的知識和洞察力、處理“零次情報(調(diào)研、考察、訪談等記錄下來成為數(shù)據(jù)前的信息)”的經(jīng)驗豐富等等,因而在為數(shù)據(jù)分析建立假設(shè),感知可能存在的關(guān)聯(lián),以及理解關(guān)聯(lián)背后的商業(yè)邏輯方面有可能表現(xiàn)出其他行業(yè)人員難以匹敵的能力,這就能夠與大數(shù)據(jù)分析師互為補充、共同發(fā)展,成為大數(shù)據(jù)分析、應(yīng)用過程中一個重要組成部分。此外,大數(shù)據(jù)分析也是信息分析的一種途徑和方法,大數(shù)據(jù)分析和情報分析二者在“外觀”上十分相似,而在情服務(wù)應(yīng)用的高端,包括產(chǎn)生最大附加價值的情報分析這樣的知識服務(wù)方面,一直是情報機構(gòu)的長項,并且大數(shù)據(jù)產(chǎn)生價值的實質(zhì)性環(huán)節(jié)就是信息分析,因此,在這一階段,不論是從人才優(yōu)勢、分析方法、還是從大數(shù)據(jù)價值實現(xiàn)環(huán)節(jié)上來看,這一階段應(yīng)是我們情報服務(wù)事業(yè)今后發(fā)展的重點。
在大數(shù)據(jù)背景下情報服務(wù)如何發(fā)展,以應(yīng)對大數(shù)據(jù)帶來的機遇和挑戰(zhàn),是擺在我們情報工作者面前一個亟待解決和回避不了的問題。通過上述分析,本文認為情報服務(wù)業(yè)務(wù)短期內(nèi)應(yīng)利用新的數(shù)據(jù)挖掘工具對原有的數(shù)據(jù)資源進行進一步的挖掘,發(fā)現(xiàn)并利用更多有價值的數(shù)據(jù);長期的任務(wù)是提高情報人員挖掘、利用大數(shù)據(jù)的能力,給情報人員提供學(xué)習(xí)、培訓(xùn)交流等環(huán)境,這也是關(guān)系到情報業(yè)務(wù)今后在新環(huán)境下是否被替代的問題;而今后情報服務(wù)的重點應(yīng)當(dāng)放到利用挖掘到的有價值數(shù)據(jù)來完成情報分析研究這樣的高端的知識服務(wù)上面。
[1]楊劍.大數(shù)據(jù)開啟情報服務(wù)機構(gòu)科技創(chuàng)新知識服務(wù)的新時代[J].科技資訊,2014(14).
[2]繆其浩.大數(shù)據(jù)將如何影響競爭情報[J].競爭情報,2013(1).
[3]James Manyika. Big data: The next frontier for innovation, c ompetition, and productivity[EB/OL].http://www.mckinsey.com/ins ights/business_technology/big_data_the_next_frontier_for_inn ovation,May, 2011.
[4]吳金紅.大數(shù)據(jù):企業(yè)競爭情報的機遇、挑戰(zhàn)及對策研究[J].情報雜志,2013(1).
[5]黃曉斌.大數(shù)據(jù)時代企業(yè)競爭情報研究的創(chuàng)新與發(fā)展[J].圖書與情報,2012(6).
[6]江俞蓉.大數(shù)據(jù)時代情報學(xué)面臨的挑戰(zhàn)和機遇[J].現(xiàn)代情報,2013 (8).
[7]王勇.大數(shù)據(jù)環(huán)境下競爭情報系統(tǒng)的研究與實現(xiàn)[J].廣東工業(yè)大學(xué)學(xué)報,2014(3).
This article explains the origin, definition and principal characteristics of big data based on the description of the history of data development,and puts forward the development direction of intelligence service business in the big data time through the analysis of big data influence on information services and the simulation bewteen mineral resources and big data resources: the intelligence service business should focus on the intelligence analysis researches with the use of the mined valuable data, that is not only an inevitable process from informtion service to knowledge service (high-end service) under big data, but also the main battlefield for the development of the future information service.
big data; information; Service
于洪業(yè)(1962—),男,遼寧營口人,本科,畢業(yè)于吉林工業(yè)大學(xué),副研究員,研究方向:科技情報。