袁慶莉
摘 要:根據(jù)大數(shù)據(jù)環(huán)境下圖書館現(xiàn)有學(xué)科服務(wù)的現(xiàn)狀,結(jié)合大數(shù)據(jù)和人工智能技術(shù),從數(shù)據(jù)的獲取、處理、存儲(chǔ)、分析和應(yīng)用5個(gè)層面入手,分析用戶行為信息并賦予數(shù)據(jù)標(biāo)簽,從而預(yù)測(cè)用戶的個(gè)性化學(xué)科需求?;趫D書館的文獻(xiàn)和業(yè)務(wù)等數(shù)據(jù),討論大數(shù)據(jù)處理的流程和實(shí)現(xiàn)途徑,快速為用戶提供所需學(xué)科知識(shí),提高圖書館資源利用率,構(gòu)建圖書館學(xué)科服務(wù)新模式。
關(guān)鍵詞:大數(shù)據(jù);人工智能;學(xué)科服務(wù)
中圖分類號(hào):G251 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1003-5168(2021)19-0152-04
Abstract: Aiming at the current status of library subject services under the big data environment, the article integrates big data and artificial intelligence technology, starting from five levels of data acquisition, processing, storage, analysis and application, analyzing user information behavior, and assigning tags. Predict their individual subject needs; discuss the process and realization of these big data based on the library's literature and business data; find the subject knowledge that can meet their needs for users, and maximize the utilization of library resources, Construct a new library subject service model.
Keywords: big data;artificial intelligence;subject service
圖書館是高校信息傳播和知識(shí)創(chuàng)新中心,圍繞學(xué)生的專業(yè)學(xué)習(xí)、教師的課堂教學(xué)和研究人員的科學(xué)研究開展服務(wù)。圖書館學(xué)科服務(wù)是助力本科院校對(duì)標(biāo)“雙一流”建設(shè)、高職院校對(duì)標(biāo)“雙高”建設(shè)的重要途徑。大數(shù)據(jù)時(shí)代,移動(dòng)智能設(shè)備和網(wǎng)絡(luò)環(huán)境的快速發(fā)展豐富了用戶的信息獲取渠道,而圖書館傳統(tǒng)的學(xué)科服務(wù)方式和內(nèi)容已無法滿足用戶日益凸顯的個(gè)性化需求,導(dǎo)致圖書館面臨用戶流失的尷尬局面,因此創(chuàng)新圖書館學(xué)科服務(wù)模式迫在眉睫。
1 現(xiàn)有學(xué)科服務(wù)模式的不足
自1998年清華大學(xué)圖書館率先建立學(xué)科館員制度以來[1],國內(nèi)多數(shù)高校也陸續(xù)開展了學(xué)科服務(wù),并取得了一定進(jìn)展。我國高?,F(xiàn)有學(xué)科服務(wù)模式大致分為學(xué)科館員對(duì)接學(xué)院模式和嵌入式學(xué)科服務(wù)模式兩種。學(xué)科館員對(duì)接學(xué)院即圖書館給二級(jí)院系配備固定的學(xué)科館員,院系有需求時(shí)直接聯(lián)系對(duì)應(yīng)的學(xué)科館員,學(xué)科館員主動(dòng)了解院系的學(xué)科資源需求[2],并圍繞需求搜集整合資源,然后反饋給院系用戶。嵌入式學(xué)科服務(wù)指學(xué)科館員跟蹤科研的思路萌芽、申請(qǐng)書撰寫、研究實(shí)施以及成果驗(yàn)收全過程,滿足科研各階段的學(xué)科信息需求[3-4],并參與教師教學(xué)全過程,搭建課程參考資源庫、開展融入課堂和專業(yè)的信息素養(yǎng)培訓(xùn)講座等[5-6]。
1.1 對(duì)學(xué)科館員的依賴程度較高
學(xué)科館員需要直接與用戶溝通,引導(dǎo)用戶表達(dá)自己的學(xué)科信息需求。若用戶對(duì)自己的信息需求表述不清或并不清楚自身的真實(shí)需求,學(xué)科館員將難以準(zhǔn)確掌握用戶的需求信息[7]。若學(xué)科館員專業(yè)素質(zhì)不夠,不能準(zhǔn)確理解用戶的表述,也會(huì)影響服務(wù)的開展。這種純?nèi)斯な降男枨笫占头答伨哂袕?qiáng)烈的主觀性,對(duì)學(xué)科館員的信息資源了解度、信息檢索能力以及組織能力有很高的要求。
1.2 高校圖書館學(xué)科服務(wù)內(nèi)容深度不足
目前,多數(shù)高校的圖書館學(xué)科服務(wù)內(nèi)容還停留在基礎(chǔ)的學(xué)科館員聯(lián)絡(luò)方式、學(xué)科資源推介、文獻(xiàn)資源推送以及參考咨詢等層面,學(xué)科前沿?zé)狳c(diǎn)追蹤、學(xué)術(shù)評(píng)價(jià)等服務(wù)的開展不夠廣泛[8-9]。大數(shù)據(jù)時(shí)代,用戶可以通過各種渠道輕松獲取基礎(chǔ)學(xué)科信息。然而,用戶急需又難以獲得經(jīng)過加工組織的學(xué)科信息,即基礎(chǔ)信息服務(wù)還沒有上升到傳遞知識(shí)服務(wù)。
1.3 用戶對(duì)現(xiàn)行模式下的學(xué)科服務(wù)黏度不強(qiáng)
圖書館學(xué)科服務(wù)對(duì)學(xué)科建設(shè)具有重要作用,但是由于學(xué)科服務(wù)層次淺、人工溝通耗時(shí)長以及無法有效滿足用戶需求,用戶對(duì)學(xué)科服務(wù)的信任度逐漸降低,造成用戶流失。
2 大數(shù)據(jù)和人工智能技術(shù)對(duì)學(xué)科服務(wù)的影響
大數(shù)據(jù)作為一個(gè)抽象概念,因具有數(shù)據(jù)規(guī)模大、數(shù)據(jù)種類多、處理速度快和價(jià)值密度低等特性得到了人們的廣泛認(rèn)同[10]。人工智能是指在理解自然智能(特別是人類智能)的基礎(chǔ)上創(chuàng)造具有一定智能水平的機(jī)器,能彌補(bǔ)人類在計(jì)算、精確度以及速度等方面的不足[11]。大數(shù)據(jù)和人工智能技術(shù)緊密聯(lián)系卻又有著本質(zhì)區(qū)別。在數(shù)據(jù)收集、處理和存儲(chǔ)過程中,大數(shù)據(jù)屬于輸入方,人工智能技術(shù)處理屬于輸出方。人工智能需要大量數(shù)據(jù)作為基礎(chǔ)來實(shí)現(xiàn)深度學(xué)習(xí)、思考、模仿或者預(yù)測(cè)等功能,而數(shù)據(jù)的價(jià)值需要人工智能來實(shí)現(xiàn)和凸顯。
大數(shù)據(jù)技術(shù)的發(fā)展增加了數(shù)據(jù)的描述維度,使得數(shù)據(jù)對(duì)事物的描述越來越接近實(shí)際,導(dǎo)致數(shù)據(jù)量呈爆炸式增長。學(xué)科服務(wù)的數(shù)據(jù)基礎(chǔ)不再局限于館藏文獻(xiàn)資源和所購買的數(shù)據(jù)庫,還有更多的政府機(jī)構(gòu)信息、行業(yè)協(xié)會(huì)信息以及科研交流信息等,使得可利用的數(shù)據(jù)量激增。
現(xiàn)階段,傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)已經(jīng)不能滿足人類對(duì)事物認(rèn)知的需求,圖像、音頻以及視頻等非結(jié)構(gòu)化數(shù)據(jù)和生活中的一些半結(jié)構(gòu)化數(shù)據(jù)已經(jīng)占據(jù)了數(shù)據(jù)總量的絕大部分。數(shù)據(jù)的異構(gòu)化和多維化對(duì)圖書館學(xué)科服務(wù)的數(shù)據(jù)整合與處理能力提出了更高要求,如果學(xué)科服務(wù)仍停留在結(jié)構(gòu)化數(shù)據(jù)時(shí)代,那么將難以滿足用戶的差異化信息需求。
數(shù)據(jù)量的激增要求提升數(shù)據(jù)處理速度。如果數(shù)據(jù)處理不及時(shí),數(shù)據(jù)的價(jià)值就會(huì)消失。大數(shù)據(jù)時(shí)代,用戶對(duì)服務(wù)的響應(yīng)速度要求越來越高,如學(xué)科服務(wù)的反應(yīng)速度直接影響用戶的體驗(yàn)。傳統(tǒng)的學(xué)科服務(wù)靠人工進(jìn)行需求的收集與分析、資源的選擇與整理,最后反饋給用戶。整個(gè)服務(wù)過程耗時(shí)較長且可能結(jié)果并不如意,容易造成用戶的不滿和資源的浪費(fèi)。
數(shù)據(jù)量的增加使得數(shù)據(jù)的相對(duì)價(jià)值密度變低。從用戶方面來講,由于信息接收渠道的多樣化,從大量數(shù)據(jù)中找出所需的信息變得困難,且無法判斷其有效性和權(quán)威性。人工智能技術(shù)對(duì)學(xué)科服務(wù)的影響主要體現(xiàn)在它通過對(duì)數(shù)據(jù)的深度學(xué)習(xí)和對(duì)用戶的全面分析,能比人工更準(zhǔn)確地把握用戶需求并快速進(jìn)行反饋,滿足用戶對(duì)服務(wù)的便捷性和自主化要求,彌補(bǔ)了人工效率低和時(shí)限短等缺陷。
3 融合大數(shù)據(jù)和人工智能技術(shù)的學(xué)科服務(wù)模式研究
3.1 服務(wù)需求分析
高校的學(xué)科服務(wù)用戶大致可分為學(xué)習(xí)型、教學(xué)型和科研型3種。每種類型的用戶都有其不同的學(xué)科服務(wù)需求[12]。
學(xué)習(xí)型用戶對(duì)圖書館的信息資源與服務(wù)接觸少,了解不全面,缺乏利用學(xué)科服務(wù)助力學(xué)業(yè)的意識(shí)。圖書館需要在提升這類用戶信息意識(shí)、提高他們的檢索應(yīng)用能力等方面加強(qiáng)服務(wù)。
教學(xué)型用戶需要大量學(xué)科資源作為備課資料和課堂交流的支撐,在教學(xué)過程中調(diào)動(dòng)學(xué)生的積極性和學(xué)習(xí)興趣,提升學(xué)生的自學(xué)能力。這類用戶需要大量的學(xué)科素材,如文字信息、圖片說明以及視頻材料等。多類型素材可以豐富用戶的課堂設(shè)計(jì),吸引學(xué)生注意力,為用戶提高工作效率。
科研型用戶在項(xiàng)目前期需要閱讀大量相關(guān)領(lǐng)域國內(nèi)外文獻(xiàn),研究中期不斷補(bǔ)充知識(shí)和調(diào)整研究策略,研究后期關(guān)注成果的刊載、轉(zhuǎn)化、驗(yàn)收等,及時(shí)掌握學(xué)科最新研究進(jìn)展和成果,了解研究領(lǐng)域的發(fā)展趨勢(shì)和研究熱點(diǎn)。這類用戶需要學(xué)科服務(wù)為其做好文獻(xiàn)資源的支撐工作,利用計(jì)量分析為其提供領(lǐng)域發(fā)展現(xiàn)狀和前沿的分析,并根據(jù)研究內(nèi)容提供投稿推薦期刊等。
此外,不同類型的用戶需求會(huì)隨著時(shí)間的推移、學(xué)習(xí)階段的推進(jìn)以及身份的轉(zhuǎn)變而改變,學(xué)科服務(wù)不能一成不變。隨著信息技術(shù)的發(fā)展,用戶更希望得到耗時(shí)短、流程簡便、節(jié)約精力的學(xué)科服務(wù)。傳統(tǒng)學(xué)科服務(wù)受用戶表達(dá)能力、學(xué)科館員能力以及時(shí)間因素的限制,難以滿足用戶需求。隨著大數(shù)據(jù)和人工智能等技術(shù)的發(fā)展,通過收集并分析用戶的搜索行為和閱讀軌跡等數(shù)據(jù),可以提高對(duì)用戶需求信息把握的精確度和客觀性,同時(shí)打破空間時(shí)間的限制,真正體現(xiàn)學(xué)科服務(wù)的價(jià)值,提高用戶黏度。
3.2 學(xué)科服務(wù)模式創(chuàng)新
從數(shù)據(jù)的獲取、處理、存儲(chǔ)、分析和應(yīng)用5個(gè)層面入手,融合大數(shù)據(jù)和人工智能技術(shù),如圖1所示。從圖書館和用戶兩個(gè)角度進(jìn)行數(shù)據(jù)處理,完成需求與資源的自動(dòng)匹配,創(chuàng)新學(xué)科服務(wù)模式,準(zhǔn)確把握用戶需求,解決學(xué)科服務(wù)差異性,提高資源利用率。
3.2.1 數(shù)據(jù)獲取層。大數(shù)據(jù)時(shí)代,學(xué)科服務(wù)不能僅僅依賴圖書館原有的文獻(xiàn)和數(shù)據(jù)庫資源,要面向網(wǎng)絡(luò)整合多方資源,通過資源聚合優(yōu)化館藏?cái)?shù)據(jù)結(jié)構(gòu)。在新模式下,用戶數(shù)據(jù)被作為需求分析的基礎(chǔ)進(jìn)行收集。在數(shù)據(jù)獲取層,圖書館和用戶方面需要獲取的數(shù)據(jù)如表1所示。圖書館方面,館藏?cái)?shù)據(jù)可以直接獲取;業(yè)務(wù)數(shù)據(jù)通過圖書館綜合管理系統(tǒng)獲取;服務(wù)數(shù)據(jù)通過查詢機(jī)、進(jìn)出管理系統(tǒng)(人臉識(shí)別技術(shù))、移動(dòng)圖書館、圖書館官網(wǎng)、視頻監(jiān)控器以及射頻識(shí)別技術(shù)(Radio Frequency Identification,RFID)等獲取;網(wǎng)絡(luò)資源利用網(wǎng)絡(luò)爬蟲技術(shù),從政府和行業(yè)網(wǎng)站、辦公自動(dòng)化科研交流平臺(tái)以及學(xué)術(shù)搜索引擎等系統(tǒng)獲取。用戶方面,基本個(gè)人信息通過圖書館后臺(tái)數(shù)據(jù)和教務(wù)部門獲取;社交平臺(tái)的行為數(shù)據(jù)要在經(jīng)過平臺(tái)許可后,利用流量抓包、網(wǎng)絡(luò)爬蟲等技術(shù)獲取;而館內(nèi)活動(dòng)軌跡可以利用感知技術(shù)(如語音命令、眼球追蹤、手勢(shì)命令等)收集。
3.2.2 數(shù)據(jù)處理層。圖書館數(shù)據(jù)資源涉及圖文和音視頻等多種數(shù)據(jù)類型,必須進(jìn)行處理使其規(guī)范化和條理化。圖書館大量的紙質(zhì)資源不利于傳播和服務(wù),需要進(jìn)行數(shù)字化處理。借助人工智能機(jī)器人進(jìn)行數(shù)字化工作能夠提高處理效率,節(jié)省人力資源。由于圖書館數(shù)據(jù)來自不同的業(yè)務(wù)系統(tǒng),數(shù)據(jù)標(biāo)準(zhǔn)和描述維度都會(huì)有所不同,需要進(jìn)行清洗和降維處理,增強(qiáng)數(shù)據(jù)的有效性和條理性。例如,可以使用ETL(Extract-Transform-Load)技術(shù)清洗數(shù)據(jù),借助缺失值比率、低方差濾波和高相關(guān)濾波等方法進(jìn)行數(shù)據(jù)降維。
用戶信息同樣要先進(jìn)行數(shù)據(jù)清洗,清除與學(xué)科服務(wù)無關(guān)的數(shù)據(jù),提高數(shù)據(jù)的價(jià)值密度。例如,刪除用戶在社交平臺(tái)中對(duì)娛樂明星的點(diǎn)贊記錄、圖片收藏等無關(guān)數(shù)據(jù)。在用戶大量的行為數(shù)據(jù)基礎(chǔ)上,使用機(jī)器學(xué)習(xí)技術(shù)對(duì)用戶的知識(shí)結(jié)構(gòu)、行為以及愛好等方面進(jìn)行分析,提取用戶特征,結(jié)合用戶的基本信息和所處情景為用戶賦予標(biāo)簽。標(biāo)簽會(huì)隨用戶行為、身份以及知識(shí)結(jié)構(gòu)的變化而發(fā)生改變,使得圖書館提供的學(xué)科服務(wù)隨之改變。
3.2.3 數(shù)據(jù)存儲(chǔ)層。圖書館傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)庫無法滿足大數(shù)據(jù)時(shí)代異構(gòu)數(shù)據(jù)的存儲(chǔ)需求和學(xué)科用戶不限地域時(shí)間的信息需求。為了學(xué)科服務(wù)的長遠(yuǎn)發(fā)展,需要建立大容量、高效率的新型數(shù)據(jù)庫。學(xué)科服務(wù)的數(shù)據(jù)存儲(chǔ)層要建立圖書館館藏資源庫,采用非關(guān)系型數(shù)據(jù)庫(NoSQL)進(jìn)行數(shù)據(jù)存儲(chǔ)。它能存儲(chǔ)文字、圖像以及音視頻等多源異構(gòu)數(shù)據(jù),解決圖書館館藏?cái)?shù)據(jù)和用戶數(shù)據(jù)的存儲(chǔ)問題。另外,如果圖書館囿于資金、技術(shù)和人才的限制,無法使用大型服務(wù)器來存儲(chǔ)過多數(shù)據(jù),也可以購買第三方儲(chǔ)存空間,利用云存儲(chǔ)這種分布式存儲(chǔ)方式進(jìn)行數(shù)據(jù)存儲(chǔ)。
3.2.4 數(shù)據(jù)分析層。經(jīng)過清洗、降維等處理后的數(shù)據(jù)統(tǒng)一存儲(chǔ)在館藏資源庫。由于數(shù)據(jù)的規(guī)模龐大、來源多樣以及結(jié)構(gòu)各異,若不經(jīng)過分析、關(guān)聯(lián),則無法充分挖掘數(shù)據(jù)的知識(shí)價(jià)值,不能為用戶提供知識(shí)結(jié)構(gòu)完整的學(xué)科服務(wù)。例如,文章A引用文章B中的內(nèi)容,那么文章B中所包含的知識(shí)其實(shí)是文章A部分內(nèi)容的來源。如果不將文章A和文章B結(jié)合分析進(jìn)行關(guān)聯(lián)推送,那么給用戶推送的知識(shí)就不完整。因此,在融合大數(shù)據(jù)和人工智能技術(shù)的學(xué)科服務(wù)新模式下,要利用文本挖掘技術(shù)分析數(shù)字文獻(xiàn),利用自然語言處理技術(shù)、圖像識(shí)別技術(shù)等分析音視頻和圖片,利用數(shù)據(jù)挖掘技術(shù)和語義網(wǎng)技術(shù)對(duì)圖書館存儲(chǔ)的數(shù)據(jù)進(jìn)行深度加工,將不同類型的數(shù)據(jù)所代表的知識(shí)關(guān)聯(lián)起來形成知識(shí)鏈或者知識(shí)圖譜,實(shí)現(xiàn)對(duì)資源的充分利用。
用戶信息方面,前期已經(jīng)根據(jù)用戶的基本信息、行為軌跡和所處情景進(jìn)行了標(biāo)簽化,在此基礎(chǔ)上利用神經(jīng)網(wǎng)絡(luò)算法預(yù)測(cè)用戶的學(xué)科服務(wù)需求。例如,用戶A是會(huì)計(jì)專業(yè)的大二學(xué)生,最近在網(wǎng)絡(luò)中檢索了英語四級(jí)報(bào)考日期的信息,并借閱了《大學(xué)英語四級(jí)詞匯表》。根據(jù)這些信息可以推測(cè)用戶A準(zhǔn)備報(bào)考英語四級(jí),可以為用戶推送相關(guān)資料。
3.2.5 數(shù)據(jù)應(yīng)用層。完成圖書館館藏?cái)?shù)據(jù)和用戶需求的分析后,將用戶需求和館藏資源進(jìn)行匹配,滿足用戶學(xué)科信息需求。根據(jù)用戶的檢索、借閱等行為數(shù)據(jù)預(yù)測(cè)得到的需求信息可以應(yīng)用于學(xué)科資源采購,優(yōu)化資源架構(gòu),以實(shí)現(xiàn)資源采購的高效化。對(duì)圖書館資源和用戶需求進(jìn)行雙向處理和分析后,能夠更好地滿足用戶的個(gè)性化學(xué)科服務(wù)需求,實(shí)現(xiàn)信息的精準(zhǔn)推送。
4 結(jié)語
大數(shù)據(jù)時(shí)代,用戶的學(xué)科信息需求千變?nèi)f化,對(duì)高校圖書館學(xué)科服務(wù)提出了更高的要求。同時(shí),大數(shù)據(jù)和人工智能技術(shù)的發(fā)展為學(xué)科服務(wù)模式的創(chuàng)新提供了技術(shù)支撐。從數(shù)據(jù)的獲取、處理、存儲(chǔ)、分析和應(yīng)用5個(gè)層面著手,融合大數(shù)據(jù)和人工智能技術(shù),分別從圖書館和用戶角度進(jìn)行數(shù)據(jù)處理與分析,創(chuàng)新學(xué)科服務(wù)模式,實(shí)現(xiàn)用戶個(gè)性化學(xué)科信息需求的精準(zhǔn)滿足,解決學(xué)科館員帶來的學(xué)科服務(wù)差異性問題,提高資源利用率。
參考文獻(xiàn):
[1]李大林.高校圖書館學(xué)科化服務(wù)探討[J].中華醫(yī)學(xué)圖書情報(bào)雜志,2009(1):45-46.
[2]魏佳.“雙一流”大學(xué)圖書館學(xué)科服務(wù)網(wǎng)絡(luò)調(diào)查研究[J].圖書館雜志,2021(4):69-76.
[3]黃敏,張霞,周喆,等.高校圖書館嵌入科研過程的學(xué)科服務(wù)模式研究[J].圖書館學(xué)研究,2018(8):88-91.
[4]孫波,劉萬國,謝亞南,等.“雙一流”背景下面向PI的高校圖書館嵌入式學(xué)科服務(wù)探索:以東北師范大學(xué)為例[J].圖書情報(bào)工作,2019(4):54-60.
[5]程惠蘭,段萌語,胡小華.高校圖書館嵌入院系的學(xué)科服務(wù)模式研究:以中國地質(zhì)大學(xué)(武漢)地球科學(xué)學(xué)院為例[J].圖書館學(xué)研究,2019(1):62-66.
[6]沈洋.我國高校圖書館嵌入式學(xué)科服務(wù)的調(diào)查與研究[J].圖書館建設(shè),2016(11):56-61.
[7]肖欣偉,王晨,張鳳榮.基于大數(shù)據(jù)的高校圖書館學(xué)科服務(wù)平臺(tái)的構(gòu)建研究[J].情報(bào)科學(xué),2017(6):34-38.
[8]婁冰.“雙一流”高校圖書館學(xué)科服務(wù)現(xiàn)狀分析及對(duì)策研究[J].圖書館工作與研究,2021(2):106-112.
[9]沈洋,李小平.新時(shí)代高校圖書館學(xué)科服務(wù)四位一體發(fā)展研究[J].圖書館工作與研究,2019(3):124-128.
[10]馬建光,姜巍.大數(shù)據(jù)的概念、特征及其應(yīng)用[J].國防科技,2013(2):10-17.
[11]鐘義信.人工智能:概念·方法·機(jī)遇[J].科學(xué)通報(bào),2017(22):2473-2479.
[12]于曦,高潔.基于用戶需求的高校圖書館嵌入式學(xué)科服務(wù)策略研究[J].情報(bào)理論與實(shí)踐,2014(5):73-76.
3366500338239