舒文剛
(重慶南川區(qū)圖書(shū)館,重慶 408400)
DIKW體系下數(shù)字圖書(shū)館的大數(shù)據(jù)服務(wù)模式
舒文剛
(重慶南川區(qū)圖書(shū)館,重慶 408400)
大數(shù)據(jù)的意義不在于掌握海量數(shù)據(jù),而在于對(duì)這些海量數(shù)據(jù)進(jìn)行專(zhuān)業(yè)化的整合利用。在DIKW體系下,數(shù)字圖書(shū)館關(guān)于大數(shù)據(jù)技術(shù)的信息資源服務(wù)包含:基于數(shù)據(jù)整合的平臺(tái)服務(wù)、基于數(shù)據(jù)分析的信息服務(wù)、基于數(shù)據(jù)應(yīng)用的知識(shí)服務(wù)、基于數(shù)據(jù)挖掘的智慧服務(wù)4個(gè)層次的服務(wù)模式。
數(shù)字圖書(shū)館 大數(shù)據(jù) 服務(wù)模式
隨著云計(jì)算時(shí)代的到來(lái),大數(shù)據(jù)(Big Data)受到社會(huì)各行各業(yè)越來(lái)越多的關(guān)注。一般而言,大數(shù)據(jù)具有4V特性,包含容量(Volume)、高速(Velocity)、多樣(Variety)、價(jià)值(Val?ue)4方面內(nèi)容。大數(shù)據(jù)的意義不在于掌握海量數(shù)據(jù),而在于對(duì)這些海量數(shù)據(jù)進(jìn)行專(zhuān)業(yè)化的整合利用。大數(shù)據(jù)海量數(shù)據(jù)的爆炸式增長(zhǎng),要求數(shù)字圖書(shū)館必須及時(shí)對(duì)數(shù)據(jù)進(jìn)行收集更新、加工處理及分析應(yīng)用,以將有效數(shù)據(jù)信息提供給用戶(hù),從而推動(dòng)數(shù)字圖書(shū)館服務(wù)模式的變化?,F(xiàn)代的數(shù)字圖書(shū)館服務(wù)模式正逐漸由以“館藏資源”為中心向以“用戶(hù)”為中心轉(zhuǎn)型,而將大數(shù)據(jù)技術(shù)應(yīng)用到數(shù)字圖書(shū)館服務(wù)中無(wú)疑更便于挖掘處理用戶(hù)的各項(xiàng)信息需求,更好地為用戶(hù)提供更高效的信息需求。
DIKW是關(guān)于數(shù)據(jù)、信息、知識(shí)發(fā)展演變的理論體系。美國(guó)管理學(xué)家羅素·艾可夫在《從數(shù)據(jù)到智慧》中,按照數(shù)據(jù)的加工處理程度,將DIKW體系劃分為數(shù)據(jù)、信息、知識(shí)、智慧4個(gè)層次[1],并對(duì)每一個(gè)層次賦予各自不同的特質(zhì)。DIKW體系下數(shù)據(jù)、信息、知識(shí)與智慧的關(guān)系如圖1所示。由此,在DIKW體系下,數(shù)字圖書(shū)館關(guān)于大數(shù)據(jù)技術(shù)的信息資源服務(wù)包含:基于數(shù)據(jù)整合的平臺(tái)服務(wù)、基于數(shù)據(jù)分析的信息服務(wù)、基于數(shù)據(jù)應(yīng)用的知識(shí)服務(wù)、基于數(shù)據(jù)挖掘的智慧服務(wù)4個(gè)層次的服務(wù)模式。
圖1 DIKW體系下數(shù)據(jù)、信息、知識(shí)與智慧的關(guān)系
在大數(shù)據(jù)技術(shù)環(huán)境下,數(shù)字化信息資源類(lèi)型多樣、數(shù)量龐大、數(shù)據(jù)結(jié)構(gòu)復(fù)雜、數(shù)據(jù)關(guān)聯(lián)性強(qiáng)、數(shù)據(jù)波動(dòng)性高,數(shù)字圖書(shū)館要想收集整合全部的信息資源是極其困難的,幾乎難以實(shí)現(xiàn)。目前,數(shù)字圖書(shū)館信息資源主要包括兩大類(lèi):一類(lèi)是實(shí)體館藏資源,主要指圖書(shū)館自身整理開(kāi)發(fā)的數(shù)字化信息資源,如館藏資源檢索數(shù)據(jù)庫(kù)、特色館藏?cái)?shù)據(jù)庫(kù)、館藏各類(lèi)專(zhuān)題數(shù)據(jù)庫(kù)以及由借助于互聯(lián)網(wǎng)技術(shù)采集并下載到本地服務(wù)器供用戶(hù)使用的信息資源等。二類(lèi)是虛擬館藏資源,主要指圖書(shū)館可利用的網(wǎng)絡(luò)在線(xiàn)的數(shù)字化信息資源,包括各種網(wǎng)絡(luò)數(shù)據(jù)資源庫(kù)、書(shū)報(bào)在線(xiàn)數(shù)據(jù)庫(kù)、網(wǎng)上動(dòng)態(tài)信息數(shù)據(jù)庫(kù)、社交門(mén)戶(hù)信息資源庫(kù)等。在DIKW體系下,數(shù)據(jù)(Data)就是數(shù)據(jù)本身,是為信息服務(wù)提供的原始資源。數(shù)字圖書(shū)館第一步要做的就是利用大數(shù)據(jù)技術(shù),將這些信息資源進(jìn)行整合,并根據(jù)數(shù)據(jù)資源的特性,建立一站式數(shù)據(jù)資源整合的平臺(tái)服務(wù)體系。
其一,數(shù)字圖書(shū)館平臺(tái)服務(wù)體系把云計(jì)算與關(guān)聯(lián)數(shù)據(jù)相結(jié)合,將數(shù)字館藏資源與分散在各種數(shù)據(jù)庫(kù)的數(shù)字、文字、圖像、符號(hào)等信息資源進(jìn)行組織和聚合,運(yùn)用“數(shù)據(jù)——用戶(hù)”關(guān)系模型,建立統(tǒng)一的數(shù)字圖書(shū)館數(shù)字資源門(mén)戶(hù),實(shí)現(xiàn)數(shù)據(jù)資源的統(tǒng)一聚合和集中揭示,以方便用戶(hù)的數(shù)據(jù)資源利用。其二,數(shù)字圖書(shū)館平臺(tái)服務(wù)體系通過(guò)大數(shù)據(jù)技術(shù)將不同數(shù)據(jù)庫(kù)的不同格式、不同類(lèi)型的數(shù)據(jù)資源進(jìn)行快速提取集成,完成不同結(jié)構(gòu)數(shù)據(jù)的無(wú)縫鏈接,實(shí)現(xiàn)一站式統(tǒng)一檢索?!耙徽臼綑z索”適應(yīng)了當(dāng)今大數(shù)據(jù)資源的分布性和異構(gòu)性的特點(diǎn),可以節(jié)省用戶(hù)的資料檢索和數(shù)據(jù)處理時(shí)間,提高用戶(hù)對(duì)數(shù)據(jù)資源利用的效率[2]。其三,數(shù)字圖書(shū)館平臺(tái)服務(wù)體系還應(yīng)具有多接口、多終端、多系統(tǒng)的支持能力,使用戶(hù)能夠借助于有線(xiàn)網(wǎng)絡(luò)、無(wú)線(xiàn)WiFi、APP應(yīng)用、PC電腦及手機(jī)平板等多種多樣的方式便捷地訪(fǎng)問(wèn)平臺(tái)服務(wù)系統(tǒng),使數(shù)字圖書(shū)館數(shù)據(jù)整合的平臺(tái)服務(wù)體系具有通用性、兼容性、易用性和拓展性??傊瑪?shù)字圖書(shū)館數(shù)據(jù)整合的平臺(tái)服務(wù)體系提供的是“一站式數(shù)據(jù)資源服務(wù)”,通過(guò)對(duì)數(shù)字信息資源進(jìn)行書(shū)目級(jí)的整合,使用戶(hù)能夠通過(guò)多種途徑在一個(gè)入口、一個(gè)界面檢索便可獲得全方位的、立體化信息數(shù)據(jù)資源。
在DIKW體系下,信息(Information)是對(duì)數(shù)據(jù)(Data)進(jìn)行加工處理后產(chǎn)生的數(shù)據(jù)流。信息來(lái)源于數(shù)據(jù)但高于數(shù)據(jù),“信息=數(shù)據(jù)+處理”。信息可以為用戶(hù)解答一些疑問(wèn),如關(guān)于誰(shuí)(Who)、什么(What)、為什么(Why)、怎么做(How)等。因此,數(shù)字圖書(shū)館在將信息資源進(jìn)行整合的基礎(chǔ)上,就要針對(duì)不同用戶(hù)的信息需求對(duì)相應(yīng)的數(shù)據(jù)進(jìn)行搜集、存儲(chǔ)、分析,為用戶(hù)提供專(zhuān)業(yè)的信息服務(wù)。而提高數(shù)字圖書(shū)館的信息服務(wù)能力的主要方式就是向用戶(hù)提供基于大數(shù)據(jù)分析的學(xué)科型、個(gè)體化的信息服務(wù)。
在大數(shù)據(jù)環(huán)境下,隨著信息資源由量到質(zhì)的變化,逐漸形成了分門(mén)別類(lèi)的學(xué)科化信息生態(tài)系統(tǒng),使得數(shù)字圖書(shū)館的信息服務(wù)模式也相應(yīng)地發(fā)生著變化。數(shù)字圖書(shū)館在通過(guò)大數(shù)據(jù)技術(shù)將這些數(shù)據(jù)信息資源進(jìn)行采集、分析的基礎(chǔ)上,抽取集合用戶(hù)需求的有價(jià)值的學(xué)科化信息,并為之提供信息服務(wù)。一方面,面向社會(huì)各個(gè)階層人員提供相關(guān)學(xué)科的信息服務(wù)。隨著信息社會(huì)的快速發(fā)展,人們更需要的是相關(guān)學(xué)科領(lǐng)域的專(zhuān)業(yè)信息資源。譬如教師、學(xué)生、醫(yī)生、工程師及其他科研人員等對(duì)自身學(xué)科專(zhuān)業(yè)的信息需求更多,作為為用戶(hù)提供信息資源權(quán)威平臺(tái)的數(shù)字圖書(shū)館,則可以通過(guò)學(xué)科館員及專(zhuān)業(yè)化的信息服務(wù)模式為這些用戶(hù)提供專(zhuān)業(yè)信息,為社會(huì)人才發(fā)展創(chuàng)新提供信息保障服務(wù)。另一方面,面向各個(gè)社會(huì)機(jī)構(gòu)提供相關(guān)學(xué)科的信息服務(wù)。隨著大數(shù)據(jù)技術(shù)的廣泛應(yīng)用,以各種類(lèi)型公司企業(yè)為代表的社會(huì)機(jī)構(gòu)對(duì)于信息服務(wù)的時(shí)效性要求變得更加強(qiáng)烈,關(guān)于企業(yè)自身的輿情監(jiān)測(cè)、品牌監(jiān)測(cè)、信息咨詢(xún)、市場(chǎng)分析及競(jìng)爭(zhēng)情報(bào)等信息服務(wù)成為包含數(shù)字圖書(shū)館在內(nèi)的各種信息服務(wù)機(jī)構(gòu)的重要內(nèi)容。為此,數(shù)字圖書(shū)館要基于大數(shù)據(jù)技術(shù)為企業(yè)用戶(hù)提供信息采集、監(jiān)測(cè)、分析、推送以及管理的信息服務(wù)??傊瑪?shù)字圖書(shū)館基于數(shù)據(jù)分析的信息服務(wù)是面向用戶(hù)的學(xué)科化的專(zhuān)業(yè)信息服務(wù)。在這種服務(wù)模式下,數(shù)字圖書(shū)館將用戶(hù)的信息需求與信息服務(wù)結(jié)合起來(lái),按照科學(xué)創(chuàng)新研究與對(duì)知識(shí)信息的需求規(guī)律,對(duì)數(shù)據(jù)進(jìn)行學(xué)科化的采集、整合,挖掘出數(shù)據(jù)的專(zhuān)業(yè)價(jià)值,動(dòng)態(tài)有機(jī)地滿(mǎn)足用戶(hù)的專(zhuān)業(yè)化信息需求[3]。
知識(shí)(Knowledge),是在對(duì)數(shù)據(jù)信息的理解(Understand?ing)過(guò)程中演繹而成的抽象的、邏輯的信息集合。在DIKW體系下,知識(shí)體現(xiàn)了信息的本質(zhì)。知識(shí)就是知道了什么(Know—what)、知道為什么(Know—why)、知道怎么做(Know—how)及知道誰(shuí)(Know—who)。知識(shí)位于信息之上,具有指導(dǎo)行動(dòng)的能力,并能夠理解和推理產(chǎn)生新的知識(shí)。構(gòu)建基于數(shù)據(jù)應(yīng)用的數(shù)字圖書(shū)館知識(shí)服務(wù)模式,是在對(duì)數(shù)據(jù)信息加工的基礎(chǔ)上,使提供的信息融合服務(wù)體現(xiàn)出知識(shí)價(jià)值。這不僅可以實(shí)現(xiàn)信息知識(shí)的有效共享,也有利于推動(dòng)信息與知識(shí)的轉(zhuǎn)化,促進(jìn)信息知識(shí)服務(wù)的智能化,繼而引領(lǐng)知識(shí)管理的革命。
圖2 數(shù)字圖書(shū)館大數(shù)據(jù)知識(shí)服務(wù)模型
邁爾·舍恩伯格指出:“數(shù)據(jù)就像一個(gè)神奇的鉆石礦,它的真實(shí)價(jià)值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,而絕大部分都隱藏在表面之下?!盵4]由此,作為信息資源集合平臺(tái)的數(shù)字圖書(shū)館,其知識(shí)服務(wù)模式就是要通過(guò)大數(shù)據(jù)技術(shù),對(duì)海量數(shù)據(jù)進(jìn)行采集、存儲(chǔ)、組織、分析及決策管理,通過(guò)數(shù)據(jù)挖掘和各種分析方法,為用戶(hù)構(gòu)建各種信息資源之間的知識(shí)服務(wù)網(wǎng)絡(luò),并按用戶(hù)需求為其提供信息融合的知識(shí)服務(wù)。數(shù)字圖書(shū)館知識(shí)服務(wù)模式反映了知識(shí)服務(wù)完成相應(yīng)行業(yè)、領(lǐng)域、任務(wù)及預(yù)期目標(biāo)的服務(wù)水平,包含了大數(shù)據(jù)知識(shí)服務(wù)過(guò)程中所涉及的數(shù)據(jù)、信息、資源、知識(shí)及過(guò)程等因素,其基本服務(wù)模型如圖2所示[5]。此外,基于數(shù)據(jù)應(yīng)用的數(shù)字圖書(shū)館知識(shí)服務(wù)模式還可以實(shí)現(xiàn)信息的可視化服務(wù)。國(guó)家圖書(shū)館副館長(zhǎng)魏大威指出:“數(shù)字圖書(shū)館可以利用時(shí)間軸、地域軸等知識(shí)圖譜可視化展示方式將資源呈現(xiàn)給用戶(hù),依托融合的物聯(lián)網(wǎng)、移動(dòng)通信網(wǎng)以及互聯(lián)網(wǎng)絡(luò)進(jìn)行傳播,最終實(shí)現(xiàn)為用戶(hù)提供電視、電腦、手機(jī)等多種終端的接收。”[6]通過(guò)可視化的技術(shù)手段,將海量數(shù)據(jù)信息及其知識(shí)語(yǔ)義表示出來(lái),深度發(fā)掘潛在的信息資源,減少異構(gòu)數(shù)據(jù)問(wèn)題,降低信息傳遞鴻溝,搭建學(xué)科知識(shí)地圖,為用戶(hù)獲得有效的信息知識(shí)提供便利??梢哉f(shuō),基于數(shù)據(jù)應(yīng)用的信息可視化服務(wù)也是今后數(shù)字圖書(shū)館知識(shí)服務(wù)的發(fā)展趨勢(shì)之一。
智慧(Wisdom)是DIKW體系的最高層次,是人們基于信息知識(shí)的理解(Understanding)作出決斷的能力。智慧通過(guò)理解過(guò)去的信息知識(shí),具有指向未來(lái)的特征。隨著人們獲取信息資源的條件日趨成熟,公眾對(duì)信息知識(shí)的期望也越來(lái)越高,社會(huì)對(duì)于人性化、智能化、智慧型的信息服務(wù)需求也越來(lái)越強(qiáng)烈。而伴隨著數(shù)字圖書(shū)館對(duì)信息資源整理開(kāi)發(fā)能力的提高,智慧服務(wù)將逐漸成為數(shù)字圖書(shū)館的發(fā)展潮流。
基于數(shù)據(jù)發(fā)掘的數(shù)字圖書(shū)館智慧服務(wù)具有以下幾方面的特點(diǎn):其一,能夠?yàn)橛脩?hù)提供人性化、個(gè)性化的信息知識(shí)服務(wù)。數(shù)字圖書(shū)館智慧服務(wù)更加注重用戶(hù)的個(gè)體需求,以人為本,為用戶(hù)提供的信息服務(wù)方式更加靈活多元,使用戶(hù)利用信息知識(shí)資源更加便捷高效。如可以隨時(shí)選擇通過(guò)人工、電話(huà)、網(wǎng)絡(luò)在線(xiàn)、RSS訂閱、郵件定制及24小時(shí)自助系統(tǒng)等各種途徑實(shí)現(xiàn)信息知識(shí)服務(wù)。其二,能夠?yàn)橛脩?hù)提供智能化、智慧型的信息知識(shí)服務(wù)。數(shù)字圖書(shū)館智慧服務(wù)利用大數(shù)據(jù)技術(shù)對(duì)用戶(hù)的個(gè)人信息、獲取信息知識(shí)的方式、獲取信息知識(shí)的主題、瀏覽下載門(mén)戶(hù)數(shù)據(jù)庫(kù)的日志等數(shù)據(jù)進(jìn)行分析處理,挖掘用戶(hù)的信息需求偏好及潛在的信息需求,構(gòu)建具有個(gè)體特征和需求特征的用戶(hù)模型,實(shí)現(xiàn)主動(dòng)地為用戶(hù)信息知識(shí)需求提供跟蹤與智能化服務(wù)。其三,能夠?yàn)橛脩?hù)搭建多維的交互系統(tǒng)。在數(shù)字圖書(shū)館智慧服務(wù)下,用戶(hù)不僅可以檢索利用數(shù)字圖書(shū)館服務(wù)系統(tǒng)提供的各種信息知識(shí),還可以促進(jìn)用戶(hù)之間、用戶(hù)與數(shù)字圖書(shū)館服務(wù)系統(tǒng)之間、用戶(hù)與圖書(shū)館及館員之間的交流更加廣泛深入。在數(shù)字圖書(shū)館智能感知用戶(hù)信息需求和信息知識(shí)分布的引導(dǎo)下,推動(dòng)用戶(hù)信息需求與提供的交互,實(shí)現(xiàn)各方間互相提供信息知識(shí)服務(wù)。其四,能夠?yàn)橛脩?hù)構(gòu)建信息知識(shí)的自組織和知識(shí)空間。在數(shù)字圖書(shū)館智慧服務(wù)下,可以通過(guò)網(wǎng)絡(luò)技術(shù)、語(yǔ)義技術(shù)對(duì)原始數(shù)據(jù)進(jìn)行語(yǔ)義抽取,構(gòu)建基于行業(yè)或?qū)W科的宏觀知識(shí)空間和基于用戶(hù)特定需要的微觀知識(shí)空間[7],使用戶(hù)自主利用和開(kāi)發(fā)知識(shí)信息??傊?,智慧服務(wù)既是數(shù)字圖書(shū)館對(duì)數(shù)據(jù)挖掘的升華,也是數(shù)字圖書(shū)館知識(shí)服務(wù)的創(chuàng)新;既是數(shù)字圖書(shū)館信息服務(wù)的核心,也是數(shù)字圖書(shū)館服務(wù)模式的發(fā)展方向。
[1]羅素·艾可夫.從資料到智慧[J].應(yīng)用系統(tǒng)分析期刊,1989(16).
[2]陳芬.面向用戶(hù)的一站式檢索[J].情報(bào)科學(xué),2010(12).
[3]高青.面向用戶(hù)的高校圖書(shū)館學(xué)科化信息服務(wù)體系構(gòu)建[J].現(xiàn)代情報(bào),2009(5).
[4]邁爾·舍恩伯格,庫(kù)克耶.大數(shù)據(jù)時(shí)代[M].杭州:浙江人民出版社,2013.
[5]秦曉珠,李晨暉.大數(shù)據(jù)知識(shí)服務(wù)的內(nèi)涵、典型特征及概念模型[J].情報(bào)資料工作,2013(2).
[6]李雪.數(shù)字圖書(shū)館迎大數(shù)據(jù)時(shí)代:將整合資源 提供深度服務(wù)[EB/OL].[2014-11-05].http://culture.people.com.cn/n/ 2014/1105/c172318-25981395.html.
[7]烏恩.智慧圖書(shū)館及其服務(wù)模式的構(gòu)建[J].情報(bào)資料工作,2012(5).
舒文剛男,1965年生。本科學(xué)歷,館員。研究方向:圖書(shū)館建設(shè)。
G250.74
2015-02-25;責(zé)編:楊新寬。)