田青
〔摘 要〕“大數(shù)據(jù)”是不可逆轉(zhuǎn)的,對(duì)圖書館的知識(shí)管理與知識(shí)服務(wù)產(chǎn)生巨大沖擊。文章從大數(shù)據(jù)的資源特點(diǎn)出發(fā),分析了大數(shù)據(jù)有效存儲(chǔ)與圖書館知識(shí)服務(wù)之間的關(guān)系,存在基礎(chǔ)性、質(zhì)量性、內(nèi)嵌性與可管理性。重點(diǎn)論述了圖書館的知識(shí)存儲(chǔ)規(guī)劃,指出須在用戶需求導(dǎo)向下,將大數(shù)據(jù)轉(zhuǎn)換為有價(jià)值的知識(shí),利用數(shù)據(jù)生命周期、價(jià)值性、更新頻率、使用頻率等指標(biāo)對(duì)知識(shí)進(jìn)行重要性評(píng)估,根據(jù)重要程度進(jìn)行知識(shí)分類與分級(jí)知識(shí)存儲(chǔ),同時(shí)注意數(shù)據(jù)備份與災(zāi)難預(yù)警,保障知識(shí)的動(dòng)態(tài)性與安全性,力圖為大數(shù)據(jù)利用、知識(shí)存儲(chǔ)與知識(shí)管理提供新的研究視角。
〔關(guān)鍵詞〕大數(shù)據(jù);知識(shí)存儲(chǔ);數(shù)據(jù)轉(zhuǎn)換;知識(shí)評(píng)估
DOI:10.3969/j.issn.1008-0821.2015.11.028
〔中圖分類號(hào)〕G250 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2015)11-0156-03
The Knowledge Storage Planning Studies of Library“Big Data”
Tian Qing
(Library,Changchun Normal University,Changchun 130032,China)
〔Abstract〕“Big data”is irreversible,have a tremendous impact on library knowledge management and knowledge service.The article from big data resource characteristics,analyzed the relationship between the effective storage and library knowledge services,there is basic,qualitative,embedded and manageability.And focuses on the library knowledge storage planning,pointing out that the user needs to be guided,the large data into valuable knowledge,the use of the data lifecycle,value,update frequency,use frequency and other indicators to assess the importance of knowledge,and then classify assorts knowledge and hierarchically storage based on the importance of knowledge,while paying attention to data backup,disaster warning,and dynamic security,trying to take advantage of big data,knowledge storage and knowledge management provide new perspective.
〔Key words〕big data;knowledge storage;data conversion;knowledge assessment
1 圖書館大數(shù)據(jù)時(shí)代的來臨
在互聯(lián)網(wǎng)快速發(fā)展的推動(dòng)下,數(shù)據(jù)量和數(shù)據(jù)類型也在不斷地激增,麥肯錫首次在咨詢報(bào)告中提及“大數(shù)據(jù)”,并指出“大數(shù)據(jù)是指無法在一定時(shí)間內(nèi)用傳統(tǒng)數(shù)據(jù)庫軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合。”[1]更有學(xué)者指出“大數(shù)據(jù)是組織內(nèi)外網(wǎng)頁數(shù)據(jù)的集合”??梢?,在互聯(lián)網(wǎng)的推動(dòng)下,數(shù)據(jù)在數(shù)量、類型、速度、格式、價(jià)值等方面都發(fā)生著巨大的變化,由大數(shù)據(jù)構(gòu)成的新產(chǎn)業(yè)環(huán)境正在加速發(fā)展,并不斷對(duì)各行各業(yè)甚至是國家與政府發(fā)揮著巨大的牽引力。由于整個(gè)信息生態(tài)環(huán)境的變化,直接對(duì)圖書館產(chǎn)生著影響,圖書館外部的數(shù)據(jù)源不斷增多,充實(shí)著圖書館的館藏資源,并因其動(dòng)態(tài)發(fā)展不斷增加與改變著圖書館的數(shù)據(jù)結(jié)構(gòu),這成為圖書館大數(shù)據(jù)的主要構(gòu)成部分;同時(shí),由于圖書館需要對(duì)這些數(shù)據(jù)進(jìn)行管理,由此會(huì)產(chǎn)生管理數(shù)據(jù)、流通數(shù)據(jù)、分析數(shù)據(jù)、關(guān)聯(lián)數(shù)據(jù)等,這對(duì)數(shù)據(jù)的應(yīng)用與開發(fā)、館藏結(jié)構(gòu)的建設(shè)與調(diào)整,以及分析用戶需求變化等及其重要,也是圖書館大數(shù)據(jù)的構(gòu)成部分;此外,圖書館內(nèi)部的用戶因自身工作、學(xué)習(xí)與生活受大數(shù)據(jù)的影響,用戶的信息需求行為與知識(shí)需求也在不斷地發(fā)生著變化,圖書館為了能在第一時(shí)間了解用戶的需求與變化趨勢(shì),重點(diǎn)深入地開展用戶行為分析,包括用戶的個(gè)人信息、借閱信息、知識(shí)服務(wù)過程、知識(shí)解決方案記錄、社會(huì)網(wǎng)絡(luò)信息、即時(shí)信息等,即用戶的動(dòng)態(tài)行為數(shù)據(jù)也成為圖書館大數(shù)據(jù)的構(gòu)成部分。而在每類數(shù)據(jù)構(gòu)成中又都存在著比以往任何時(shí)候都多的形式、類型與不同價(jià)值的數(shù)據(jù)內(nèi)容,因此,當(dāng)外部信息環(huán)境進(jìn)入到大數(shù)據(jù)時(shí)代時(shí),圖書館等信息機(jī)構(gòu)受其影響將最為明顯,圖書館應(yīng)積極應(yīng)對(duì)大數(shù)據(jù)時(shí)代對(duì)自身的沖擊,重新思考現(xiàn)行的數(shù)據(jù)存儲(chǔ)方法、數(shù)據(jù)管理模式與知識(shí)服務(wù)模式,充分利用大數(shù)據(jù)為圖書館提供的機(jī)遇,將大數(shù)據(jù)內(nèi)嵌于圖書館的知識(shí)服務(wù)中,更好地服務(wù)于用戶。
2 知識(shí)存儲(chǔ)與圖書館知識(shí)服務(wù)之間的關(guān)系
21 知識(shí)存儲(chǔ)是知識(shí)服務(wù)的基礎(chǔ)
一個(gè)完整的數(shù)據(jù)生命周期包括數(shù)據(jù)加工和知識(shí)抽取兩個(gè)層次,而數(shù)據(jù)加工又包括初次加工與高級(jí)加工,數(shù)據(jù)存儲(chǔ)隸屬于數(shù)據(jù)初次加工的范疇,而高級(jí)加工與知識(shí)抽取等都要基于數(shù)據(jù)存儲(chǔ)來進(jìn)行。與此同理,知識(shí)管理也是在知識(shí)庫的基礎(chǔ)上,實(shí)現(xiàn)組織內(nèi)員工的知識(shí)共享與交流,不斷提升知識(shí)創(chuàng)新能力,以增強(qiáng)組織的應(yīng)變能力與市場(chǎng)競(jìng)爭(zhēng)力。在知識(shí)管理的過程中,知識(shí)庫的建立正是知識(shí)存儲(chǔ)的集中體現(xiàn),借助于數(shù)據(jù)轉(zhuǎn)換為知識(shí)的過程,將有價(jià)值的知識(shí)有目的地存入機(jī)構(gòu)庫或數(shù)據(jù)倉庫中,以備知識(shí)共享、知識(shí)交流與知識(shí)創(chuàng)新所用。因此,知識(shí)存儲(chǔ)成為知識(shí)服務(wù)的前提,知識(shí)存儲(chǔ)的數(shù)量、種類、格式、知識(shí)元、標(biāo)引方法等直接影響知識(shí)服務(wù)的內(nèi)容、方法、模式、平臺(tái)等[2]。endprint
22 知識(shí)存儲(chǔ)的質(zhì)量決定知識(shí)服務(wù)的質(zhì)量水平
圖書館的知識(shí)服務(wù)觀是信息社會(huì)發(fā)展下的必然產(chǎn)物,圖書館因其對(duì)知識(shí)的專業(yè)性與技能性,能夠從用戶的需求出發(fā),分析用戶的知識(shí)需求,基于內(nèi)外知識(shí)的儲(chǔ)備與融合能夠向用戶提供問題的解決方案。雖然在知識(shí)服務(wù)的過程中,圖書館員的專業(yè)性占據(jù)了較大的比例,但是“巧婦難為無米之炊”,知識(shí)服務(wù)的基礎(chǔ)是每一個(gè)有意義的知識(shí)單元,館員正是從這些有價(jià)值的知識(shí)元出發(fā),發(fā)現(xiàn)蘊(yùn)含其中的聯(lián)系與機(jī)理,不斷地剖析推理,才能為用戶提供優(yōu)質(zhì)的知識(shí)服務(wù)。因此,知識(shí)存儲(chǔ)的數(shù)量與質(zhì)量決定著知識(shí)服務(wù)的范圍、深度與質(zhì)量水平,圖書館要想在知識(shí)服務(wù)的領(lǐng)域中爭(zhēng)得一席之地,必須扎扎實(shí)實(shí)地搞好知識(shí)存儲(chǔ)的工作。
23 知識(shí)存儲(chǔ)與知識(shí)服務(wù)內(nèi)嵌于知識(shí)管理過程中
知識(shí)管理就是要通過對(duì)確定有效的知識(shí)單元進(jìn)行處理(包括知識(shí)標(biāo)引、知識(shí)表達(dá)、知識(shí)存儲(chǔ)、知識(shí)檢索、知識(shí)計(jì)量、知識(shí)評(píng)價(jià)等)以達(dá)到知識(shí)服務(wù)、知識(shí)發(fā)現(xiàn)和知識(shí)創(chuàng)新的目的[3]。由此可見,知識(shí)存儲(chǔ)與知識(shí)服務(wù)共同隸屬于知識(shí)管理過程,經(jīng)過數(shù)據(jù)轉(zhuǎn)換為知識(shí)的處理后,知識(shí)元成為知識(shí)的基本單位,不僅可成為知識(shí)存儲(chǔ)的特征點(diǎn),同時(shí)也可成為知識(shí)服務(wù)時(shí)的檢索點(diǎn),提高知識(shí)服務(wù)的響應(yīng)速度和效率,而且知識(shí)服務(wù)的結(jié)果與過程也可成為新的知識(shí)點(diǎn)進(jìn)入知識(shí)存儲(chǔ)階段,不斷增加與更新知識(shí)的容量與質(zhì)量,二者互為依存、互為進(jìn)退,共同內(nèi)嵌于知識(shí)管理的情境中,既統(tǒng)一于知識(shí)管理的統(tǒng)一戰(zhàn)略,又具有各自的獨(dú)特性,共同服務(wù)于用戶實(shí)現(xiàn)知識(shí)創(chuàng)新的目標(biāo)。
3 圖書館大數(shù)據(jù)的知識(shí)存儲(chǔ)規(guī)劃
圖書館在大數(shù)據(jù)的背景下,面臨著數(shù)據(jù)來源繁多、形式多樣、格式多元等特點(diǎn),只有對(duì)大數(shù)據(jù)進(jìn)行有序的規(guī)劃與處理,才能為知識(shí)服務(wù)提供夯實(shí)的基礎(chǔ)。圖書館的知識(shí)存儲(chǔ)規(guī)劃分為數(shù)據(jù)轉(zhuǎn)換、知識(shí)評(píng)估、知識(shí)分類、知識(shí)存儲(chǔ)4個(gè)過程(見圖1),在用戶需求的導(dǎo)向下,將大數(shù)據(jù)轉(zhuǎn)換為有價(jià)值的知識(shí),利用數(shù)據(jù)生命周期、價(jià)值性、更新頻率、使用頻率等指標(biāo)對(duì)知識(shí)進(jìn)行重要性評(píng)估,對(duì)知識(shí)進(jìn)行重要性排序,基于此進(jìn)行知識(shí)分類,形成從高到低的知識(shí)層次,對(duì)應(yīng)不同重要級(jí)別的知識(shí)進(jìn)行分級(jí)分層存儲(chǔ),同時(shí)需要預(yù)防各種可能的數(shù)據(jù)存儲(chǔ)災(zāi)難,保證知識(shí)數(shù)據(jù)的實(shí)時(shí)、同步與可用性。
31 數(shù)據(jù)轉(zhuǎn)換為知識(shí)
大數(shù)據(jù)的“大”為圖書館的知識(shí)服務(wù)提供了豐富的數(shù)據(jù)源,從數(shù)據(jù)類型上看,有結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù);從數(shù)據(jù)類型來看,有音頻、文本、視頻、URL、圖像、即時(shí)通信、電子商務(wù)等;從數(shù)據(jù)來源看,有圖書館外部的信息機(jī)構(gòu)、網(wǎng)絡(luò)等數(shù)據(jù)和圖書館內(nèi)部的館藏目錄數(shù)據(jù)、圖書、論文、專利、標(biāo)準(zhǔn)、電子數(shù)據(jù)庫及動(dòng)態(tài)的RFID數(shù)據(jù)、用戶信息行為記等,但這些數(shù)據(jù)都是對(duì)客觀事物的屬性、特點(diǎn)、位置及相互關(guān)系的抽象表述,是客觀社會(huì)中的原始資料,適合人們進(jìn)行保存、傳播與加工處理。而知識(shí)是對(duì)數(shù)據(jù)處理后形成的信息再進(jìn)行定量與定性的歸納、演繹的邏輯推理后形成的、經(jīng)過實(shí)踐檢驗(yàn)的、有價(jià)值的、被人消化吸收的結(jié)果。因此,知識(shí)是對(duì)數(shù)據(jù)處理后的高級(jí)產(chǎn)物,而知識(shí)恰恰是圖書用戶利用的對(duì)象,不能與用戶需求聯(lián)系的任何數(shù)據(jù)都是沒有價(jià)值的。因此,在知識(shí)存儲(chǔ)的過程中,首先要對(duì)大數(shù)據(jù)進(jìn)行知識(shí)轉(zhuǎn)換與處理,基于用戶需求角度,對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)過濾、數(shù)據(jù)清洗、數(shù)據(jù)格式處理、知識(shí)元分解等處理過程,將數(shù)量龐大的大數(shù)據(jù)升級(jí)為用戶可用的、有價(jià)值的知識(shí)元對(duì)象。
32 知識(shí)評(píng)估
對(duì)知識(shí)進(jìn)行存儲(chǔ)的前提是將知識(shí)按照重要性將其進(jìn)行分類,以重要程度的不同來進(jìn)行分類存儲(chǔ)。因此,需要對(duì)知識(shí)進(jìn)行評(píng)價(jià),知識(shí)分類可選擇的指標(biāo)較多,如按照數(shù)據(jù)的生命周期、數(shù)據(jù)的價(jià)值性、數(shù)據(jù)存儲(chǔ)成本、數(shù)據(jù)在線與離線、知識(shí)的使用頻率、知識(shí)的可重復(fù)性等。如以用戶的使用頻率與知識(shí)的可重復(fù)性兩個(gè)屬性來對(duì)知識(shí)進(jìn)行分類,可形成UF-KR二維圖,如圖2所示。用戶的使用頻率可用知識(shí)服務(wù)引擎或者圖書館服務(wù)管理系統(tǒng)自動(dòng)進(jìn)行搜集與記錄,將用戶在不同時(shí)間、不同地點(diǎn)、不同知識(shí)需求及其知識(shí)查詢結(jié)果等知識(shí)行為記錄下來,根據(jù)不同知識(shí)使用頻率的排序,將知識(shí)分為3類,分別為高使用頻率知識(shí)、中使用頻率知識(shí)與低使用頻率知識(shí);知識(shí)的可重復(fù)性這一指標(biāo)的確定比較容易,如實(shí)時(shí)觀測(cè)的數(shù)據(jù)難以進(jìn)行重復(fù),這些數(shù)據(jù)就需要進(jìn)行長期保存。如美國航空航天局(NASA)建設(shè)的DAACs計(jì)劃,涉及數(shù)據(jù)篩選與清洗、定義與保存元數(shù)據(jù)、定義文件格式、確定需要保存的數(shù)據(jù)等各項(xiàng)長期保存計(jì)劃,目的就是保存實(shí)時(shí)的衛(wèi)星觀測(cè)數(shù)據(jù),做好存檔與再利用的準(zhǔn)備工作。同樣,將知識(shí)的可重復(fù)性也劃分為高、中、低3個(gè)層次,這樣,具體知識(shí)因其使用頻率域可重復(fù)性的不同特點(diǎn)落在相應(yīng)的象限中,據(jù)此我們將知識(shí)進(jìn)行分類。依據(jù)此原理,我們也可以增加分類的維度,形成更為綜合的知識(shí)矩陣,知識(shí)存儲(chǔ)系統(tǒng)可依據(jù)知識(shí)排序后的劃分與計(jì)算方法進(jìn)行知識(shí)歸類,然后自動(dòng)存儲(chǔ)在相應(yīng)的存儲(chǔ)空間中,并支持動(dòng)態(tài)的知識(shí)調(diào)整與維護(hù)。
33 知識(shí)分類
將知識(shí)進(jìn)行分類的方法很多,如邁克爾·波拉尼根據(jù)知識(shí)的編碼程度分為顯性知識(shí)與隱性知識(shí),日本學(xué)者野中郁次郎在此基礎(chǔ)上,認(rèn)識(shí)到顯性知識(shí)與隱性知識(shí)之間的相互轉(zhuǎn)換關(guān)系,提出二者之間的動(dòng)態(tài)轉(zhuǎn)換模型,以期為知識(shí)創(chuàng)新提供基礎(chǔ)。我們借鑒此思想,將知識(shí)與知識(shí)服務(wù)、知識(shí)創(chuàng)新的關(guān)系引進(jìn)來,知識(shí)的分類必須考慮最終用戶的使用情況與價(jià)值效果,結(jié)合用戶使用知識(shí)的實(shí)際情況,如知識(shí)訪問頻率、響應(yīng)速度要求、安全性能等,如前所述,根據(jù)知識(shí)評(píng)估的重要性排序,確定劃分標(biāo)準(zhǔn),可形成高、中、低3類,這是基本的類別,圖2應(yīng)用用戶使用頻率與知識(shí)可重復(fù)性兩個(gè)維度形成4種知識(shí)類型,對(duì)應(yīng)不同的象限選擇對(duì)應(yīng)的知識(shí)存儲(chǔ)類型。如果圖書館的存儲(chǔ)預(yù)算、成本、存儲(chǔ)設(shè)備與技術(shù)支持允許知識(shí)多層存儲(chǔ),可以再多設(shè)置知識(shí)類別,前提是二者之間必須協(xié)調(diào)統(tǒng)一,相互之間能夠支持與匹配,充分調(diào)動(dòng)圖書館內(nèi)部各種資源的最大潛力,實(shí)現(xiàn)資源的最優(yōu)化配置。
34 知識(shí)分層存儲(chǔ)
國外某些圖書館逐漸認(rèn)識(shí)到資源的不同級(jí)別重要程度,對(duì)資源進(jìn)行分級(jí)處理,如人文數(shù)據(jù)服務(wù)機(jī)構(gòu)(AHDS)將網(wǎng)絡(luò)資源分為檔案級(jí)、服務(wù)級(jí)、代理級(jí)、鏈接級(jí)與檢索工具5個(gè)級(jí)別分別采集;伯克利數(shù)字圖書館分為檔案級(jí)、服務(wù)級(jí)、鏡像級(jí)、鏈接級(jí)4個(gè)級(jí)別;加拿大國家圖書館則分為檔案級(jí)、服務(wù)級(jí)與鏈接級(jí)[4]3個(gè)級(jí)別……表明國外實(shí)體機(jī)構(gòu)與研究人員不僅認(rèn)識(shí)到網(wǎng)絡(luò)資源的重要性,同時(shí)對(duì)資源的價(jià)值性、獲取的級(jí)別性與維護(hù)成本進(jìn)行了多方位考慮,使其資源的獲取與存儲(chǔ)變得更為高效。同理,根據(jù)知識(shí)的3個(gè)分類級(jí)別,應(yīng)該設(shè)置相對(duì)應(yīng)的存儲(chǔ)層次,一是快速存儲(chǔ)區(qū),可使用低成本或是高端磁盤陣列,其特點(diǎn)是容錯(cuò)性高、在線訪問速度快、數(shù)據(jù)可靠性高(可保護(hù)由硬盤故障導(dǎo)致的數(shù)據(jù)丟失)等,主要適用于知識(shí)訪問頻率高、技術(shù)支持速度快、數(shù)量小、價(jià)格昂貴的知識(shí)類型,包括重要性知識(shí)、使用頻率高的知識(shí)等;二是備份級(jí)存儲(chǔ)區(qū),主要是離線存儲(chǔ)方式,使用光盤、磁帶、容災(zāi)備份磁盤陣列、跨地域數(shù)據(jù)復(fù)制等手段,其特點(diǎn)是成本低、容量大、訪問少,主要適用于對(duì)在線數(shù)據(jù)的存儲(chǔ)、需要長期保存不可重復(fù)的知識(shí)數(shù)據(jù)以及知識(shí)數(shù)據(jù)在不同階段及非常時(shí)期可能遇到的雪崩式災(zāi)難等。三是介于快速存儲(chǔ)與備份存儲(chǔ)之間的中級(jí)存儲(chǔ)區(qū),其知識(shí)價(jià)值性、使用頻率、存儲(chǔ)成本、安全要求等指標(biāo)處于中級(jí)水平,可使用Hadoop開源分布式計(jì)算平臺(tái),集成多個(gè)知識(shí)節(jié)點(diǎn)的存儲(chǔ)功能,實(shí)現(xiàn)知識(shí)數(shù)據(jù)有效結(jié)合與分布,而每個(gè)知識(shí)節(jié)點(diǎn)的數(shù)量可以是有限的;也可使用Cloudera、微軟、Amazon等提供的云形式的存儲(chǔ)方案[5]。四是存儲(chǔ)知識(shí)的動(dòng)態(tài)調(diào)整,知識(shí)存儲(chǔ)系統(tǒng)能夠自動(dòng)根據(jù)知識(shí)的分類級(jí)別設(shè)置相應(yīng)的存儲(chǔ)類別,實(shí)現(xiàn)知識(shí)與存儲(chǔ)空間的對(duì)等性,并隨著用戶知識(shí)需求的變化、知識(shí)老化周期的發(fā)展,知識(shí)存儲(chǔ)系統(tǒng)應(yīng)具備知識(shí)遷移功能,將訪問頻率下降到一定程度的知識(shí)調(diào)出本存儲(chǔ)區(qū),并動(dòng)態(tài)地從其他存儲(chǔ)區(qū)調(diào)入新出現(xiàn)的熱數(shù)據(jù),始終保持不同存儲(chǔ)層的知識(shí)對(duì)等,這樣才能兼顧知識(shí)的使用頻率、存儲(chǔ)成本、運(yùn)行速度、安全、預(yù)算等相關(guān)因素。
4 結(jié) 語
大數(shù)據(jù)對(duì)圖書館資源收集、組織、存儲(chǔ)、檢索與利用都存在著不同程度的作用效果。相關(guān)學(xué)者從云平臺(tái)、分布式、協(xié)同體系、知識(shí)推薦等角度對(duì)知識(shí)存儲(chǔ)進(jìn)行了相關(guān)研究。本研究深入數(shù)據(jù)與知識(shí)內(nèi)部,區(qū)別大數(shù)據(jù)與知識(shí)的不同,將大數(shù)據(jù)轉(zhuǎn)換為圖書館所用的知識(shí);并根據(jù)知識(shí)存儲(chǔ)的目標(biāo)設(shè)置用戶使用頻率與知識(shí)可重復(fù)性兩個(gè)指標(biāo),形成知識(shí)評(píng)估矩陣,分析不同知識(shí)的重要程度,這對(duì)于精準(zhǔn)存儲(chǔ)與加速存儲(chǔ)具有重要意義?,F(xiàn)階段,學(xué)者研究的重點(diǎn)在于如何有效把握用戶的知識(shí)需求,如何將用戶的情景資源有效地進(jìn)行挖掘和利用,劉海鷗等研究新型的過濾與評(píng)價(jià)機(jī)制[5];楊俊生、劉江玲、陳臣、張興旺、官思發(fā)等從云計(jì)算MapReduce方法、發(fā)現(xiàn)系統(tǒng)、分布式、關(guān)鍵要素、數(shù)據(jù)耕耘理論、社會(huì)化標(biāo)簽等理論與方法,探索更為精準(zhǔn)與加速的大數(shù)據(jù)挖掘與存儲(chǔ)[6-7],這表明精準(zhǔn)存儲(chǔ)式的知識(shí)服務(wù)將成為今后的研究方向,筆者將在數(shù)據(jù)轉(zhuǎn)換知識(shí)工具開發(fā)、知識(shí)評(píng)估模型、精準(zhǔn)推薦模型等領(lǐng)域進(jìn)一步展開研究。
參考文獻(xiàn)
[1]化柏林,李廣建.大數(shù)據(jù)環(huán)境下的多源融合型競(jìng)爭(zhēng)情報(bào)研究[J].情報(bào)理論與實(shí)踐,2015,(4):1-5.
[2]丁寧,馬浩琴.國外高校科學(xué)數(shù)據(jù)生命周期管理模型比較研究及借鑒[J].圖書情報(bào)工作,2013,(6):18-22.
[3]姜春林,張立偉,谷麗,等.知識(shí)單元視角下學(xué)術(shù)論文評(píng)價(jià)研究[J].情報(bào)雜志,2014,(4):29-34.
[4]謝劍敏.泛在知識(shí)環(huán)境下高校數(shù)字圖書館發(fā)展的困境與對(duì)策[J].情報(bào)理論與實(shí)踐,2015,(3):45-48.
[5]劉海鷗.面向云計(jì)算的大數(shù)據(jù)知識(shí)服務(wù)情景化推薦[J].圖書館建設(shè),2014,(7):31-35.
[6]陳臣.一種基于新型存儲(chǔ)的數(shù)字圖書館分布式大數(shù)據(jù)存儲(chǔ)架構(gòu)[J].現(xiàn)代情報(bào),2015,(1):100-103.
[7]官思發(fā).大數(shù)據(jù)知識(shí)服務(wù)關(guān)鍵要素與實(shí)現(xiàn)模型研究[J].圖書館論壇,2015,(6):87-93.
(本文責(zé)任編輯:孫國雷)endprint