官思發(fā)
大數(shù)據(jù)知識服務(wù)關(guān)鍵要素與實現(xiàn)模型研究*
官思發(fā)
知識服務(wù)是需求導(dǎo)向和創(chuàng)新驅(qū)動的、高度知識密集型的服務(wù)類型,大數(shù)據(jù)時代的來臨為知識服務(wù)既帶來了新的機遇也帶來了新的挑戰(zhàn)。文章對大數(shù)據(jù)知識服務(wù)的影響因素研究現(xiàn)狀進行梳理,總結(jié)出大數(shù)據(jù)知識服務(wù)的五方面關(guān)鍵要素并深入分析,在此基礎(chǔ)上對宏觀上構(gòu)建大數(shù)據(jù)知識服務(wù)實現(xiàn)模型的理論基礎(chǔ)和意義進行探討,并構(gòu)建了大數(shù)據(jù)知識服務(wù)實現(xiàn)的概念模型。
大數(shù)據(jù) 知識服務(wù) 關(guān)鍵要素 知識服務(wù)模型
隨著信息技術(shù)的推動和知識需求的進一步擴大,知識服務(wù)成為不可替代的服務(wù)類型。張曉林認為知識服務(wù)應(yīng)以信息知識的搜尋、組織、分析、重組的知識和能力為基礎(chǔ),根據(jù)用戶的問題和環(huán)境,融入用戶解決問題的過程之中,提供能夠有效支持知識應(yīng)用和知識創(chuàng)新的服務(wù)[1]。大數(shù)據(jù)時代的來臨為知識服務(wù)帶來了巨大的變革與重組。大數(shù)據(jù)知識服務(wù)是以大數(shù)據(jù)知識服務(wù)人才為核心,以大數(shù)據(jù)思維和理念為主線,利用大數(shù)據(jù)知識服務(wù)平臺和大數(shù)據(jù)資源為條件保障,對知識服務(wù)需求進行準確抓取,始終以大數(shù)據(jù)理念和技術(shù)為支撐最終實現(xiàn)知識服務(wù)的全過程的新型服務(wù)。
大數(shù)據(jù)為知識服務(wù)帶來了巨大的機遇,同時也為知識服務(wù)帶來了較大的挑戰(zhàn)。大數(shù)據(jù)作為新一代信息技術(shù)產(chǎn)業(yè)的重要內(nèi)容,將新興的云計算技術(shù)應(yīng)用于經(jīng)濟、金融、政治、醫(yī)療、生物和科學(xué)研究等領(lǐng)域的大數(shù)據(jù)分析中,在較短的時間以較低的成本實現(xiàn)數(shù)據(jù)分析目標。在情報分析和市場研究等領(lǐng)域,將數(shù)據(jù)分析成果形成知識產(chǎn)品提供服務(wù)已經(jīng)成為情報分析的熱點研究。但從宏觀上對大數(shù)據(jù)知識服務(wù)的關(guān)鍵要素的分析及要素之間的關(guān)聯(lián)關(guān)系方面的研究目前還比較匱乏。本文從知識服務(wù)的關(guān)鍵要素出發(fā),結(jié)合大數(shù)據(jù)對知識服務(wù)帶來的變革和影響,探討了大數(shù)據(jù)知識服務(wù)的關(guān)鍵要素構(gòu)成和實現(xiàn)模型。
隨著大數(shù)據(jù)的快速生成和累積,知識服務(wù)機構(gòu)在開展知識服務(wù)過程中必然選擇基于大數(shù)據(jù)資源的儲備和分析去完成知識服務(wù)任務(wù)。大數(shù)據(jù)為新的信息技術(shù)環(huán)境下的知識服務(wù)帶來機遇,同時帶來了諸多挑戰(zhàn)。如何應(yīng)對大數(shù)據(jù)環(huán)境下各種結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的多維處理就是其中的一大難題。本文對已有大數(shù)據(jù)知識服務(wù)的研究歸納為如下三個方面:
(1)大數(shù)據(jù)知識服務(wù)理念和體系研究。張興旺等人組織了大數(shù)據(jù)知識服務(wù)體系的專題研究[2]。其中,秦曉珠等對大數(shù)據(jù)知識服務(wù)的內(nèi)涵進行了闡述,詳細分析了大數(shù)據(jù)知識服務(wù)的典型特征,并結(jié)合大數(shù)據(jù)知識服務(wù)模式下對各種類型大數(shù)據(jù)管理和處理需求,構(gòu)建了大數(shù)據(jù)知識服務(wù)概念模型[3];李晨暉等對大數(shù)據(jù)知識服務(wù)運行機理、平臺構(gòu)建體系架構(gòu)及所涉及的關(guān)鍵技術(shù)進行了研究,并系統(tǒng)描述了大數(shù)據(jù)生態(tài)系統(tǒng)在圖書館中的應(yīng)用過程[4],對大數(shù)據(jù)知識服務(wù)的框架體系進行了初步的嘗試和探索。
(2)大數(shù)據(jù)知識服務(wù)方法研究。數(shù)據(jù)的快速增長對大規(guī)模數(shù)據(jù)挖掘和知識發(fā)現(xiàn)提出了新的挑戰(zhàn),粗糙集理論被成功引入數(shù)據(jù)挖掘的知識獲取中,Zhang Junbo、Wong Jian-Syuan和Li Tianrui等人提出基于并行大規(guī)模粗糙集的運用MapReduce的知識獲取方法,從大數(shù)據(jù)中挖掘有效知識,并在Hadoop、Phoenix和Twister三個MapReduce運行平臺上試驗,證明了所提并行方法的有效性[5]。蔣勛和劉喜文認為對大數(shù)據(jù)進行數(shù)據(jù)清洗是最終獲取知識的有效途徑,給出了數(shù)據(jù)清洗的基本框架模型及其局限,從而進一步提出非清潔數(shù)據(jù)的清潔度的機制[6],對大數(shù)據(jù)環(huán)境下面向知識服務(wù)的數(shù)據(jù)清洗進行了深入的研究。劉海鷗將用戶情景信息引入個性化推薦過程,結(jié)合云計算技術(shù)提出了一種大數(shù)據(jù)知識服務(wù)方法[7]。事實上,大數(shù)據(jù)知識服務(wù)是一項復(fù)雜的系統(tǒng)工程,涉及到眾多的復(fù)雜問題,尤其是非結(jié)構(gòu)化數(shù)據(jù)的處理技術(shù)仍然不夠成熟,大數(shù)據(jù)分析的深入探索與實踐仍需更多的付出與努力。
(3)大數(shù)據(jù)知識服務(wù)應(yīng)用研究。大數(shù)據(jù)知識服務(wù)本身是一項高智力、密集型、復(fù)雜度較高的服務(wù)領(lǐng)域,Greco Albert N和Aiss Chelsea G認為大數(shù)據(jù)與預(yù)測已經(jīng)形成了一個不小的產(chǎn)業(yè)市場,在出版行業(yè),在線零售商利用大數(shù)據(jù)系統(tǒng)捕獲了大量的消費者及其購買行為的數(shù)據(jù),然后運用預(yù)測分析和協(xié)同過濾系統(tǒng)為消費者提供購買建議,并建議加拿大和美國的大學(xué)出版社建立大數(shù)據(jù)系統(tǒng),不斷采集銷售和營銷數(shù)據(jù),利用大數(shù)據(jù)和預(yù)測分析獲取有效知識[8]。Cai Dongfeng、Bai yu和Zhang Guiping提出了基于大數(shù)據(jù)處理技術(shù)的知識服務(wù)平臺,指導(dǎo)了工業(yè)化和信息技術(shù)應(yīng)用融合項目在中國沈陽的實施[9]。國內(nèi)外已經(jīng)開展大數(shù)據(jù)情報分析和知識服務(wù)應(yīng)用方面的探索,而大數(shù)據(jù)知識服務(wù)的實踐價值將會催生更多的知識服務(wù)應(yīng)用領(lǐng)域和模式的創(chuàng)新。
總體看,目前的研究對大數(shù)據(jù)知識服務(wù)的概念內(nèi)涵和大數(shù)據(jù)知識服務(wù)平臺技術(shù)框架等進行了初步的探索,也有研究人員對大數(shù)據(jù)處理的具體技術(shù)或方法進行了一定的研究,但僅僅是單獨從技術(shù)框架、數(shù)據(jù)清洗、具體方法等角度研究大數(shù)據(jù)知識服務(wù)中的一個或某些具體問題,缺乏從宏觀上對大數(shù)據(jù)知識服務(wù)所涉及的主要因素進行統(tǒng)籌規(guī)劃的研究,不能從宏觀上指導(dǎo)知識服務(wù)機構(gòu)開展大數(shù)據(jù)知識服務(wù)的頂層規(guī)劃與內(nèi)容設(shè)計。
圖書館知識服務(wù)是國內(nèi)知識服務(wù)的重要研究方向,戚建林從社會發(fā)展環(huán)境、信息政策法規(guī)、知識服務(wù)理論、知識服務(wù)人才四個方面論述了圖書館知識服務(wù)的主要影響因素,并對未來知識服務(wù)進行了展望[10]。王曰芬、吳婷婷和張蓓蓓從要素結(jié)構(gòu)因素和關(guān)聯(lián)結(jié)構(gòu)因素兩個角度,對圖書情報機構(gòu)知識服務(wù)的影響因素進行了分析和調(diào)研。內(nèi)部要素結(jié)構(gòu)主要指實物資源、人力資源、財務(wù)資源和無形資產(chǎn);外在關(guān)聯(lián)因素主要指用戶、競爭者、社會的科技環(huán)境、人文環(huán)境、經(jīng)濟環(huán)境、政策法規(guī)等[11]。司莉認為實現(xiàn)知識服務(wù)的關(guān)鍵要素在于知識服務(wù)用戶的迫切需求、知識服務(wù)人員成為內(nèi)容主題專家、建設(shè)基于本體的知識庫與交互功能較強的知識服務(wù)平臺,還必須有行之有效的戰(zhàn)略學(xué)習(xí)機制[12]。從現(xiàn)有的文獻中,本文梳理出知識服務(wù)需求、知識服務(wù)制度政策、知識服務(wù)專業(yè)人員、知識服務(wù)資源和知識服務(wù)平臺五大要素作為知識服務(wù)的關(guān)鍵要素。
大數(shù)據(jù)知識服務(wù)是由于大數(shù)據(jù)技術(shù)的出現(xiàn)對知識服務(wù)帶來的新的變革與發(fā)展。大數(shù)據(jù)知識服務(wù)構(gòu)成要素仍然與傳統(tǒng)知識服務(wù)一樣,受知識服務(wù)需求、知識服務(wù)制度政策、知識服務(wù)人員素質(zhì)、知識服務(wù)資源建設(shè)和知識服務(wù)平臺等因素制約,它們的區(qū)別在于,大數(shù)據(jù)技術(shù)將對這五方面的因素進行全新的變革,進而為知識服務(wù)全流程和業(yè)務(wù)服務(wù)模式等帶來徹底的變革與重組。
在開展大數(shù)據(jù)知識服務(wù)過程中,知識服務(wù)需求、大數(shù)據(jù)資源、專業(yè)知識服務(wù)人員、知識服務(wù)技術(shù)平臺和知識服務(wù)制度規(guī)范構(gòu)成大數(shù)據(jù)知識服務(wù)的關(guān)鍵要素。
2.1 大數(shù)據(jù)知識服務(wù)需求
大數(shù)據(jù)知識服務(wù)需求可以從兩個層面去理解,一是傳統(tǒng)知識服務(wù)需求,二是由于大數(shù)據(jù)技術(shù)驅(qū)動產(chǎn)生的知識服務(wù)需求。傳統(tǒng)的知識服務(wù)需求用以往的知識服務(wù)經(jīng)驗或?qū)嵺`模式能夠較好地應(yīng)對,不屬于大數(shù)據(jù)知識服務(wù)的主要內(nèi)容。而大數(shù)據(jù)知識服務(wù)的重點和難點在于如何通過用戶的行為軌跡或活動規(guī)律,挖掘出用戶潛在的知識服務(wù)需求,這也體現(xiàn)了前文描述的大數(shù)據(jù)不光是對用戶需求的變革,而且是對用戶服務(wù)需求、過程以及效果等全過程的革新。既要從大數(shù)據(jù)記錄中挖掘用戶的需求,也要通過大數(shù)據(jù)實現(xiàn)用戶的需求。在市場經(jīng)濟環(huán)境下,服務(wù)科學(xué)尤其強調(diào)用戶的主動地位和核心主導(dǎo)作用,大數(shù)據(jù)知識服務(wù)作為知識密集型的服務(wù)之一,以大數(shù)據(jù)分析技術(shù)為手段,挖掘出用戶的真實需求,并最終滿足用戶需求,這將是知識服務(wù)最理想的狀態(tài)。
大數(shù)據(jù)對知識服務(wù)的所有環(huán)節(jié)進行了變革,使大數(shù)據(jù)知識服務(wù)需求具有數(shù)據(jù)密集性、隱蔽性和動態(tài)性等特征。大數(shù)據(jù)環(huán)境下,用戶知識服務(wù)需求首先具有數(shù)據(jù)密集性的特點,在大數(shù)據(jù)時代,要想通過傳統(tǒng)的小數(shù)據(jù)分析方式完成知識服務(wù)已經(jīng)成為歷史,用戶知識服務(wù)需求已經(jīng)必然地與大數(shù)據(jù)的搜集、組織和分析挖掘相聯(lián)系,數(shù)據(jù)密集型的知識服務(wù)已經(jīng)或正在改變知識服務(wù)模式與過程。在海量知識用戶構(gòu)成的服務(wù)對象中,單個用戶的知識服務(wù)需求有時候并未直接表達出來或很容易被發(fā)現(xiàn),而是隱藏在用戶的行動軌跡、用戶瀏覽歷史或其社交網(wǎng)絡(luò)環(huán)境中,需要對用戶的網(wǎng)絡(luò)行為進行跟蹤分析和挖掘才能找出用戶的知識服務(wù)需求。大數(shù)據(jù)知識服務(wù)需求的動態(tài)性體現(xiàn)在數(shù)據(jù)環(huán)境的快速變化,使得用戶知識需求隨之改變,以及用戶所處角色、所在社會媒體和所需完成的任務(wù)或研究課題等的快速改變,都要求對知識服務(wù)內(nèi)容進行動態(tài)更新。
知識需求是知識服務(wù)的前提,在產(chǎn)品開發(fā)需求方面,有研究提出“在全球化分布式產(chǎn)品成功開發(fā)過程中,知識工程起著最核心的作用,通過考察全球軟件開發(fā)不同利益主體的知識需求,能夠幫助確立全球軟件開發(fā)項目成功的經(jīng)驗,并提出了成功開展全球軟件開發(fā)項目的條件”[13],對知識需求的獲取將影響知識服務(wù)的整體效果。大數(shù)據(jù)知識服務(wù)需求的數(shù)據(jù)密集性、隱蔽性和動態(tài)性就決定了大數(shù)據(jù)知識服務(wù)需求獲取的復(fù)雜性。從實踐來看,可以從兩個方面獲取用戶的知識服務(wù)需求,一方面是直接獲取,例如可以向用戶詢問獲取知識需求;另一方面是間接獲取,如可以通過對用戶網(wǎng)絡(luò)行為的分析獲取用戶的知識需求。
2.2 大數(shù)據(jù)知識資源建設(shè)
從信息管理理論看,信息服務(wù)的前提是有足夠的信息資源保障。肖希明認為信息資源建設(shè)是人類對處于無序狀態(tài)的各種媒介信息進行選擇、采集、組織和開發(fā)等活動,使之形成可資利用的信息資源體系的全過程[14]。同樣,在大數(shù)據(jù)知識服務(wù)的背景下,大數(shù)據(jù)知識資源就是大數(shù)據(jù)環(huán)境下開展知識服務(wù)最基本的條件保障。只有在資源充足的條件下,才有可能在知識服務(wù)人員的知識加工和情報分析基礎(chǔ)上形成知識產(chǎn)品,滿足大數(shù)據(jù)環(huán)境下的知識需求。
大數(shù)據(jù)知識資源建設(shè)具有數(shù)據(jù)規(guī)模大、數(shù)據(jù)結(jié)構(gòu)復(fù)雜、數(shù)據(jù)價值密度低等特點。2013年中國產(chǎn)生的數(shù)據(jù)總量超過0.8ZB(相當于8億TB),2倍于2012年,相當于2009年全球的數(shù)據(jù)總量。預(yù)計到2020年中國產(chǎn)生的數(shù)據(jù)總量將是2013年的10倍,超過8.5ZB[15]。這些數(shù)據(jù)資源為大數(shù)據(jù)環(huán)境下的知識服務(wù)提供了重要的資源保障。知識資源結(jié)構(gòu)的復(fù)雜性是大數(shù)據(jù)資源建設(shè)最關(guān)鍵的問題之一。在資源建設(shè)過程中,可以從結(jié)構(gòu)化資源、非結(jié)構(gòu)化資源和半結(jié)構(gòu)化資源的分類入手進行資源建設(shè)。大數(shù)據(jù)知識資源第三個特征即數(shù)據(jù)價值密度低,大數(shù)據(jù)知識資源的價值隱藏在眾多數(shù)據(jù)之中,局部數(shù)據(jù)價值含量較低,甚至與總體數(shù)據(jù)包含的價值信息相悖。
大數(shù)據(jù)環(huán)境下,信息源的自動生成主要由各種傳感器和RFID等手段實現(xiàn)。吳斌等設(shè)計了一種采集傳感器節(jié)點數(shù)據(jù),對其處理形成知識并提供API接口供上層服務(wù)調(diào)用的方法[16]。通過傳感器自動捕獲數(shù)據(jù)、搜集社交網(wǎng)絡(luò)中用戶生成數(shù)據(jù)和信息系統(tǒng)主動采集數(shù)據(jù)是大數(shù)據(jù)的三種主要產(chǎn)生方式。大數(shù)據(jù)知識服務(wù)的資源建設(shè)是沒有盡頭的,只要社會向前發(fā)展,用戶的知識服務(wù)需求也會隨之動態(tài)更新和演變,知識服務(wù)機構(gòu)的資源建設(shè)和儲備就必須緊跟用戶需求和時代發(fā)展,尤其是在大數(shù)據(jù)理念和技術(shù)支持下。相對來說,知識服務(wù)機構(gòu)所累積的信息資源越多越好,因此,在實踐中,知識資源的建設(shè)需要各個知識服務(wù)機構(gòu)在考慮自身資源和能力的基礎(chǔ)上,持續(xù)不斷地投入人力、財力和物力,從而為大數(shù)據(jù)知識服務(wù)提供資源支持。
2.3 大數(shù)據(jù)知識服務(wù)專業(yè)人員
知識服務(wù)專業(yè)人員是知識服務(wù)的核心,知識服務(wù)質(zhì)量很大程度上取決于知識服務(wù)人員的專業(yè)化水平。尤其是在大數(shù)據(jù)環(huán)境下,對知識服務(wù)人員的專業(yè)化水平要求更高,不僅要求知識服務(wù)專業(yè)人員熟悉文獻資源和數(shù)字信息資源的組織和利用,而且在計算機能力和數(shù)據(jù)統(tǒng)計分析能力等方面都對知識服務(wù)人員提出了新的更高的要求,知識服務(wù)機構(gòu)需要多方面的高水平人才共同組建專業(yè)化的知識服務(wù)團隊。如英國國防科技研究院大力發(fā)展深度信息服務(wù)和現(xiàn)場專家服務(wù),營造適于員工學(xué)習(xí)交流的軟硬件環(huán)境和學(xué)習(xí)文化的氛圍,培養(yǎng)了一批由信息專家、信息科學(xué)家和知識代理組成的知識服務(wù)隊伍[17]。
知識服務(wù)專業(yè)人員在進行知識加工和情報分析的過程中,最關(guān)鍵的就是知識服務(wù)能力的培養(yǎng)和體現(xiàn)。知識構(gòu)建能力是知識服務(wù)能力的根本保障,從大量文獻或信息中所包含的知識元及相關(guān)信息間的鏈接,將產(chǎn)生極大的知識增值。在大數(shù)據(jù)環(huán)境下,專業(yè)人員通過對知識元提取和標引,基于關(guān)聯(lián)數(shù)據(jù)進行知識組織、基于本體的語義知識挖掘、知識推送與個性化推薦,實現(xiàn)大數(shù)據(jù)環(huán)境下全流程的知識服務(wù)。隨著云計算技術(shù)的日益成熟,探索基于MapReduce的分布式知識處理平臺技術(shù),并整合大數(shù)據(jù)分析的具體方法,進而將其完全融入滿足用戶知識需求的全過程,形成動態(tài)可控的知識服務(wù)所需的知識產(chǎn)品與服務(wù)生成機制,將極大地提升大數(shù)據(jù)知識服務(wù)人員的知識服務(wù)能力。
2.4 大數(shù)據(jù)知識服務(wù)平臺
大數(shù)據(jù)知識服務(wù)平臺是一個大數(shù)據(jù)獲取、存儲、組織、分析、決策服務(wù)資源和服務(wù)能力共享、交易和協(xié)作的智慧平臺[4]。大數(shù)據(jù)知識服務(wù)平臺保障大數(shù)據(jù)知識服務(wù)全生命周期過程服務(wù)的有效運作。從大數(shù)據(jù)知識服務(wù)的宏觀視角來看,本文認為大數(shù)據(jù)知識服務(wù)平臺是集用戶知識服務(wù)需求采集、大數(shù)據(jù)獲取與知識組織、大數(shù)據(jù)分析與挖掘、大數(shù)據(jù)服務(wù)提供與推薦、大數(shù)據(jù)知識服務(wù)評價與反饋、知識服務(wù)專業(yè)人員與用戶溝通互動等功能于一身的綜合知識服務(wù)系統(tǒng)。
從實踐來看,知識服務(wù)平臺積累了海量的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)資源,對這些資源的充分挖掘和深度分析,將極大地改善知識服務(wù)的水平。從知識服務(wù)研究和平臺建設(shè)實踐來看,集成多項知識服務(wù)技術(shù)和功能的平臺是大數(shù)據(jù)知識服務(wù)平臺的主要建設(shè)思想。在分析當前知識服務(wù)系統(tǒng)的基礎(chǔ)上,司莉從知識構(gòu)建角度提出知識服務(wù)的四項關(guān)鍵技術(shù):知識元標引與鏈接技術(shù)、主動推送的知識導(dǎo)航與服務(wù)技術(shù)、支持語義的知識檢索技術(shù)、知識重組與整合技術(shù)[12],這些技術(shù)同樣適用于大數(shù)據(jù)環(huán)境下的知識服務(wù)。從目前的技術(shù)發(fā)展來看,知識服務(wù)平臺具體應(yīng)該包括針對不同數(shù)據(jù)源的智能采集終端與技術(shù)、數(shù)據(jù)格式標準和數(shù)據(jù)存儲系統(tǒng)、數(shù)據(jù)清洗與處理技術(shù)、數(shù)據(jù)挖掘與知識發(fā)現(xiàn)技術(shù)、預(yù)測性分析與個性化服務(wù)等技術(shù)構(gòu)成的完整技術(shù)體系。在大數(shù)據(jù)環(huán)境下,由于數(shù)據(jù)類型的多樣性和復(fù)雜性,需要從大數(shù)據(jù)本身出發(fā),構(gòu)建能夠處理大數(shù)據(jù)的分析模型和知識發(fā)現(xiàn)技術(shù),并結(jié)合用戶個性化的需求對大數(shù)據(jù)進行深度挖掘,以更好地保證用戶需求的實現(xiàn)。尤其是在社交媒體的沖擊下,信息傳播的廣度和深度都得到巨大的提高,社會網(wǎng)絡(luò)大數(shù)據(jù)成為一種主要的大數(shù)據(jù)來源。從社會網(wǎng)絡(luò)的視角分析和滿足用戶的知識服務(wù)需求,并已經(jīng)取得了一些重要成果,這將是大數(shù)據(jù)知識服務(wù)平臺的發(fā)展趨勢。
2.5 大數(shù)據(jù)知識服務(wù)制度規(guī)范
大數(shù)據(jù)知識服務(wù)規(guī)范是從制度設(shè)計的角度對大數(shù)據(jù)知識服務(wù)全生命周期進行約束和保護的重要手段。對大數(shù)據(jù)知識服務(wù)從戰(zhàn)略規(guī)劃的制定入手,明確知識服務(wù)發(fā)展的短、中、長期目標,能夠更好地指導(dǎo)知識服務(wù)活動的開展。而其他一些針對大數(shù)據(jù)背景的技術(shù)標準的制定和過程管理規(guī)范等同樣是大數(shù)據(jù)知識服務(wù)順利進行的必要保證。
大數(shù)據(jù)屬于新興的技術(shù)領(lǐng)域,為知識服務(wù)過程中知識產(chǎn)權(quán)的管理和用戶隱私保護都帶來了巨大的挑戰(zhàn)。大數(shù)據(jù)環(huán)境下,知識資源通過社交媒體、移動互聯(lián)網(wǎng)等渠道快速地傳播,如果不對這些渠道下資源的傳播進行合理規(guī)范,將不利于知識服務(wù)和知識創(chuàng)新。本文認為,應(yīng)該從大數(shù)據(jù)知識服務(wù)戰(zhàn)略規(guī)劃的頂層設(shè)計出發(fā),制定大數(shù)據(jù)知識服務(wù)平臺建設(shè)的標準、大數(shù)據(jù)知識服務(wù)的過程管理制度和大數(shù)據(jù)知識服務(wù)的評價反饋機制,從而形成適應(yīng)大數(shù)據(jù)知識服務(wù)全過程的政策制度支撐體系,確保大數(shù)據(jù)知識服務(wù)穩(wěn)定運行。
3.1 構(gòu)建的理論基礎(chǔ)
“知識采集-知識處理-知識存儲-知識服務(wù)-知識轉(zhuǎn)換”共同構(gòu)成了知識服務(wù)供應(yīng)鏈結(jié)構(gòu),對整個知識服務(wù)具有宏觀上的統(tǒng)領(lǐng)作用和指導(dǎo)意義。此外,從情報研究的角度來看,大數(shù)據(jù)知識服務(wù)是情報研究產(chǎn)品或結(jié)果的應(yīng)用過程。在情報理論方面,經(jīng)典的競爭情報過程模型——Herring模型,由競爭情報規(guī)劃、情報源采集、情報加工、情報服務(wù)與情報反饋5大階段構(gòu)成,與前文的知識服務(wù)供應(yīng)鏈具有一定的對應(yīng)關(guān)系,因此,知識服務(wù)和情報研究內(nèi)在的具有較強的關(guān)聯(lián)關(guān)系,能夠用知識服務(wù)供應(yīng)鏈和競爭情報Herring模型等對大數(shù)據(jù)知識服務(wù)進行理論指導(dǎo),同時,應(yīng)用大數(shù)據(jù)思維對情報研究進行革新,結(jié)合知識服務(wù)供應(yīng)鏈對服務(wù)過程中所有環(huán)節(jié)與關(guān)鍵要素進行合理規(guī)劃,能夠提高大數(shù)據(jù)知識服務(wù)的效果。
3.2 構(gòu)建的意義
大數(shù)據(jù)知識服務(wù)模型是大數(shù)據(jù)知識服務(wù)的核心指南,模型對大數(shù)據(jù)知識服務(wù)過程中涉及的關(guān)鍵要素進行了梳理,并對關(guān)鍵要素之間的關(guān)聯(lián)關(guān)系進行一定的呈現(xiàn)和展示,能夠指導(dǎo)知識服務(wù)活動的順利開展。本文將在大數(shù)據(jù)知識服務(wù)關(guān)鍵要素梳理的基礎(chǔ)上,對大數(shù)據(jù)知識服務(wù)的概念模型進行初步勾畫,供知識服務(wù)機構(gòu)借鑒和參考。
大數(shù)據(jù)知識服務(wù)要素是大數(shù)據(jù)知識服務(wù)模型和開展大數(shù)據(jù)知識服務(wù)實踐的基礎(chǔ)。大數(shù)據(jù)環(huán)境下的知識服務(wù)是一項系統(tǒng)工程,需要在科學(xué)的大數(shù)據(jù)知識服務(wù)戰(zhàn)略規(guī)劃指導(dǎo)下,通過大數(shù)據(jù)知識服務(wù)要素之間的協(xié)同配合,共同創(chuàng)造開展大數(shù)據(jù)知識服務(wù)的需求采集機制、資源保障機制、人才支持機制、技術(shù)平臺支撐和制度規(guī)范機制,從這五大方面構(gòu)建基于大數(shù)據(jù)知識服務(wù)全生命周期的協(xié)同工作模式。其中,掌握大數(shù)據(jù)分析的專業(yè)知識服務(wù)團隊是大數(shù)據(jù)知識服務(wù)得以開展和順利實現(xiàn)的最根本保證。本文從大數(shù)據(jù)知識服務(wù)構(gòu)成要素的視角,對大數(shù)據(jù)知識服務(wù)模型進行構(gòu)建,其中,對知識服務(wù)要素之間的關(guān)聯(lián)關(guān)系進行了高度概括,以知識供應(yīng)鏈和競爭情報Herring模型為主線,通過大數(shù)據(jù)分析技術(shù)完成知識深度組織和挖掘。大數(shù)據(jù)知識服務(wù)的頂層理論設(shè)計和實踐指南,豐富了大數(shù)據(jù)知識服務(wù)的理論內(nèi)容。
3.3 構(gòu)建過程與實現(xiàn)
大數(shù)據(jù)知識服務(wù)是一項高度智力密集型和技術(shù)密集型的工作,需要知識服務(wù)機構(gòu)投入大量的人力、財力和物力進行相關(guān)資源的建設(shè)和條件保障。如圖1所示,知識服務(wù)需求、知識服務(wù)資源、知識服務(wù)平臺、知識服務(wù)制度和知識服務(wù)專業(yè)人員共同構(gòu)成了大數(shù)據(jù)知識服務(wù)五個維度方面的核心內(nèi)容,是大數(shù)據(jù)知識服務(wù)全生命周期過程中的主體框架。在傳感器終端的自動生成、用戶主動生成和業(yè)務(wù)處理系統(tǒng)被動生成這三種方式交替作用下,快速地累計了海量的數(shù)據(jù)資源。大數(shù)據(jù)平臺首先需要實現(xiàn)對這些海量數(shù)據(jù)的采集和存儲,這些資源構(gòu)成了大數(shù)據(jù)知識服務(wù)的前提。由于資源的類型和復(fù)雜度等差異,對海量數(shù)據(jù)資源進行分類和清洗處理是大數(shù)據(jù)知識服務(wù)平臺的基礎(chǔ)性工作,從中可得到不同的資源存儲供分析挖掘使用。通過知識元標引和鏈接分析、知識重組與整合技術(shù)對知識資源進行深度組織,并通過支持語義的知識檢索技術(shù)和關(guān)聯(lián)數(shù)據(jù)技術(shù)實現(xiàn)內(nèi)部資源與外部資源的融合,將進行深加工所得的知識資源作為組織的知識資產(chǎn)存儲在知識庫中,在組織內(nèi)部按不同的知識服務(wù)需求最大限度地進行授權(quán)和共享,運用社交媒體平臺進行知識服務(wù)導(dǎo)航與推送,如RSS訂制服務(wù)、Wiki、Blog。
圖1 大數(shù)據(jù)知識服務(wù)要素關(guān)系框架模型
在知識用戶的知識服務(wù)需求的牽引下,知識服務(wù)專業(yè)人員在知識服務(wù)的各項制度規(guī)范的約束和監(jiān)督下,利用內(nèi)部知識庫積累的知識資源和外部大數(shù)據(jù)作為信息源,在大數(shù)據(jù)知識服務(wù)平臺集成的多項知識服務(wù)技術(shù)的支持下,以知識用戶的需求為導(dǎo)向,對大數(shù)據(jù)資源進行有序加工和深度分析,實現(xiàn)知識服務(wù)全生命周期的管理和服務(wù)。
大數(shù)據(jù)知識服務(wù)是建立在對大數(shù)據(jù)的有效處理和預(yù)測分析的基礎(chǔ)上的服務(wù),云計算技術(shù)是進行大規(guī)模數(shù)據(jù)處理和復(fù)雜計算的強有力的技術(shù)手段,Ibrahim Abaker Targio Hashem,Ibrar Yaqoob,Nor BadrulAnuar等人對基于云計算的大數(shù)據(jù)定義、特征和分類進行了探討,并對大數(shù)據(jù)和云計算的關(guān)系進行了辨析,也討論了大數(shù)據(jù)存儲系統(tǒng)和Hadoop技術(shù)的關(guān)系,并提出包括可擴展性、數(shù)據(jù)有效性、數(shù)據(jù)整合、數(shù)據(jù)清洗、數(shù)據(jù)質(zhì)量、數(shù)據(jù)異構(gòu)性、隱私、法律和政策規(guī)范以及治理方面的問題[18]。大數(shù)據(jù)時代對知識服務(wù)而言既是機遇也是挑戰(zhàn),知識服務(wù)機構(gòu)應(yīng)該以知識用戶的大數(shù)據(jù)知識服務(wù)需求、專業(yè)的大數(shù)據(jù)知識服務(wù)人員、大數(shù)據(jù)知識服務(wù)資源建設(shè)、大數(shù)據(jù)知識服務(wù)技術(shù)平臺和大數(shù)據(jù)知識服務(wù)制度規(guī)范五位一體的大數(shù)據(jù)知識服務(wù)實現(xiàn)機制為核心,從這五個方面進行大數(shù)據(jù)知識服務(wù)核心要素的構(gòu)建和完善,從而保證大數(shù)據(jù)知識服務(wù)的有效運作與實現(xiàn)。要真正實現(xiàn)大數(shù)據(jù)知識服務(wù),必須對知識服務(wù)的每一個過程和環(huán)節(jié)進行深入的研究與實踐,筆者只是對大數(shù)據(jù)知識服務(wù)的宏觀框架和核心構(gòu)成要素進行了梳理,尚缺少對知識服務(wù)資源建設(shè)、人才培養(yǎng)、方法技術(shù)、政策制定等方面的具體而深入的研究,今后需要結(jié)合實踐對這些內(nèi)容進行補充和完善。
[1]張曉林.走向知識服務(wù):尋找新世紀圖書情報工作的生長點[J].中國圖書館學(xué)報,2000,26(5):32-37.
[2]張興旺.大數(shù)據(jù)知識服務(wù)體系研究[J].情報資料工作,2013(2):11.
[3]秦曉珠,李晨暉,麥范金.大數(shù)據(jù)知識服務(wù)的內(nèi)涵、典型特征及概念模型[J].情報資料工作,2013(2):18-22.
[4]李晨暉,崔建明,陳超泉.大數(shù)據(jù)知識服務(wù)平臺構(gòu)建關(guān)鍵技術(shù)研究[J].情報資料工作,2013(2):29-34.
[5]JunboZhang,JianSyuanW,TianruiLE.Acomparison ofparallel large-scale knowledge acquisition using rough set theory on different MapReduce runtime systems[J]. IntJApproxReason,2014,55(3):896-907.
[6]蔣勛,劉喜文.大數(shù)據(jù)環(huán)境下面向知識服務(wù)的數(shù)據(jù)清洗研究[J].圖書與情報,2013(5):16-21.
[7]劉海鷗.面向云計算的大數(shù)據(jù)知識服務(wù)情景化推薦[J].圖書館建設(shè),2014(7):31-35.
[8]GrecoAN,AissC G.UniversityPressesin theTwentyfirst Century:The Potential Impact of Big Data and Predictive Analytics on Scholarly Book Marketing[J]. JOURNALOFSCHOLARLYPUBLISHING,2015,46(2):105-140.
[9]Cai D,Bai Y,Zhang G.The Knowledge Service Project in the Era of Big Data[C]//IEEE International Congresson Big Data.Santa Clara,CA,2013:429-430.
[10]戚建林.圖書館知識服務(wù)的影響因素及其發(fā)展[J].圖書館工作與研究,2003(1):11-12.
[11]王曰芬,吳婷婷,張蓓蓓.圖書情報機構(gòu)知識服務(wù)的戰(zhàn)略管理與影響因素研究[J].情報理論與實踐,2009,32(12):1-6.
[12]司莉.基于知識構(gòu)建的知識服務(wù)的實現(xiàn)[J].圖書館論壇,2009,29(6):216-219.
[13]Parviainen P,Tihinen M.Knowledge-related challenges and solutions in GSD[J].EXPERT SYSTEMS,2014,31(3):253-266.
[14]肖希明.信息資源建設(shè):概念、內(nèi)容與體系[J].中國圖書館學(xué)報,2006,32(5):5-8.
[15]張廣彬,盤駿,曾智強.數(shù)據(jù)中心2013:硬件重構(gòu)與軟件定義[EB/OL].[2014-06-12].http://wenku.it168. com/d_001358914.shtm.
[16]吳斌,王俊峰,覃毅芳,等.一種面向自主服務(wù)的知識網(wǎng)絡(luò)構(gòu)建方法[J].四川大學(xué)學(xué)報:自然科學(xué)版,2013,50(5):973-978.
[17]趙悅,蔡超,叢姍.穩(wěn)固信息服務(wù)開拓知識服務(wù)——英國國防科技研究院知識服務(wù)部轉(zhuǎn)型啟示[J].情報理論與實踐,2011,34(10):28-31.
[18]IbrahimAbakerT H,IbrarY,NorBadrulAE.Therise of“big data”on cloud computing:Review and open researchissues[J].InformSyst,2015:98-115.
Research on the Key Factors and Implementation Model of Big Data Knowledge Service
GUAN Si-fa
Knowledge service is demand-driven and innovation-driven,highly knowledge-intensive service.The advent of big data era brings both new opportunities and new challenges for knowledge service.This paper summarizes the current development status of big data knowledge services affecting factors,analyzes the five key elements of big data knowledge services,and builds a conceptual model for big data knowledge service implementation.
big data;knowledge service;key factors;knowledge service model
格式 官思發(fā).大數(shù)據(jù)知識服務(wù)關(guān)鍵要素與實現(xiàn)模型研究[J].圖書館論壇,2015(6):87-93.
官思發(fā)(1987-),男,中國人民大學(xué)信息資源管理學(xué)院博士研究生。
2015-01-15
*本文系國家社科基金重大項目“云計算環(huán)境下的信息資源集成與服務(wù)研究”(項目編號:12&ZD220)、中國人民大學(xué)科研基金項目“信息分析技術(shù)創(chuàng)新研究”(項目編號:10XNJ035)和中國人民大學(xué)2014年度拔尖創(chuàng)新人才培育資助計劃研究成果之一