林 玲
(福建衛(wèi)生職業(yè)技術(shù)學(xué)院 圖書館,福建 福州 350101)
“十四五”規(guī)劃對我國未來5年的發(fā)展問題進行了精準(zhǔn)的描述,未來5年,我國將致力于建設(shè)世界科技強國,這必須要在現(xiàn)有的基礎(chǔ)之上培養(yǎng)出一大批科研型人才,創(chuàng)建新型企業(yè)。圖書館作為公共文化服務(wù)的重要機構(gòu),需要承擔(dān)起這種創(chuàng)新導(dǎo)向的社會責(zé)任,因此推進圖書館的現(xiàn)代化建設(shè),積極發(fā)展數(shù)據(jù)化的嵌入式服務(wù)已經(jīng)成為當(dāng)前科學(xué)圖書館建設(shè)的重要目標(biāo)之一。
機構(gòu)畫像驅(qū)動是一種基于大數(shù)據(jù)技術(shù)的畫像分析方法,能夠為圖書館的知識服務(wù)提供更加系統(tǒng)的數(shù)據(jù)基礎(chǔ)。機構(gòu)畫像與用戶畫像均是基于一系列真實數(shù)據(jù)的目標(biāo)作為研究對象的模型,用戶畫像的研究對象是用戶個體,建立用戶應(yīng)有體系的標(biāo)簽化數(shù)據(jù),構(gòu)建出目標(biāo)用戶的整體特征,而機構(gòu)畫像的研究對象則按照整體方式對數(shù)據(jù)進行排布,進而形成一個機構(gòu)的標(biāo)簽。這種機構(gòu)畫像方法相對于傳統(tǒng)畫像更加真實、更加全面,能夠構(gòu)建起一個動態(tài)的多層次系統(tǒng),反映出對象的靜態(tài)和動態(tài)特征[1]。
圖書館嵌入式服務(wù),尤其是基于嵌入式系統(tǒng)開展的學(xué)科服務(wù)是一種客戶導(dǎo)向的服務(wù)模型。相對于傳統(tǒng)的學(xué)科服務(wù),嵌入式服務(wù)立足于客戶的需求,目標(biāo)更加明確,服務(wù)方式更加靈活,能夠進行整體化的服務(wù)設(shè)計[2]。嵌入式服務(wù)目前已經(jīng)被廣泛應(yīng)用于新聞媒體、情報學(xué)等多個領(lǐng)域,積累了一定的經(jīng)驗。嵌入式學(xué)科服務(wù)的群體主要是科學(xué)研究人員、在校師生以及創(chuàng)新型企業(yè)的應(yīng)用者,其服務(wù)的核心在于創(chuàng)建良好的科學(xué)研究模式,突出清晰的內(nèi)部資源結(jié)構(gòu),其優(yōu)勢在于能夠提供精準(zhǔn)度更高、時效性更強的學(xué)科資源,方便使用者徜徉在學(xué)習(xí)的海洋當(dāng)中,從而提高學(xué)科服務(wù)的效能。
機構(gòu)畫像驅(qū)動的學(xué)科服務(wù)模式核心在于打造各類專業(yè)化標(biāo)簽,提高聯(lián)系的緊密性,使機構(gòu)數(shù)據(jù)結(jié)構(gòu)化、規(guī)范化和系統(tǒng)化,方便圖書館基于這些數(shù)據(jù)開展挖掘與分析[3]。這需要全面而準(zhǔn)確的數(shù)據(jù)支撐,圖書館網(wǎng)羅收集多方面的數(shù)據(jù),包括公開網(wǎng)頁信息機構(gòu)、統(tǒng)計年鑒、文獻數(shù)據(jù)庫,以及第三方機構(gòu)提供的評價報告等,機構(gòu)畫像驅(qū)動體系需要將這些數(shù)據(jù)按照年度類別標(biāo)簽進行整合合并、實時跟進、自動監(jiān)測、自動采集,并不斷地對已有的畫像數(shù)據(jù)進行更新,建立起全新的信息表達模型。繪制機構(gòu)畫像的數(shù)據(jù)大致可分為以下4個類型:第1類是商業(yè)數(shù)據(jù)庫,例如各個商業(yè)機構(gòu)所提供的專利、科學(xué)指標(biāo)、專業(yè)文獻數(shù)據(jù)等;第2類是自建數(shù)據(jù)庫,例如圖書館的學(xué)科項目、科技獎勵機構(gòu)、人才建設(shè)數(shù)據(jù)等;第3類是公開信息,通常是由各個商業(yè)機構(gòu)、政府部門和專門研究的事務(wù)所提供的機構(gòu)年鑒和第三方評價報告[4];第4類是一些科研管理部門、人事管理部門公開發(fā)布的內(nèi)部資料。
機構(gòu)數(shù)據(jù)采集是學(xué)科服務(wù)體系的基礎(chǔ),采集方式分為人工采集和自動采集兩種,其中后者占據(jù)了較高的比例,但是在現(xiàn)有的學(xué)科框架之下,為了提高服務(wù)的精準(zhǔn)度、學(xué)科資源價值和可持續(xù)性,還需要加大人工采集的力度,挖掘數(shù)據(jù)的各項特征。圖書館作為信息資源的中轉(zhuǎn)機構(gòu),具備人力優(yōu)勢和技術(shù)優(yōu)勢,能夠?qū)崿F(xiàn)機構(gòu)畫像的數(shù)據(jù)采集:一方面,圖書館自動采集的技術(shù)日趨成熟,可以對商業(yè)數(shù)據(jù)庫、公開信息按照時間、類別等不同項目進行排序排布;另一方面,圖書館的專業(yè)人才隊伍可以挖掘信息資源的隱藏關(guān)聯(lián),不僅能夠?qū)崿F(xiàn)交叉學(xué)科資源的網(wǎng)狀輻射排布,也能夠?qū)χR產(chǎn)權(quán)數(shù)據(jù)庫、專利數(shù)據(jù)庫、同行機構(gòu)信息數(shù)據(jù)庫等建立良好的評估機制,使機構(gòu)畫像的數(shù)據(jù)采集更加客觀,嵌入式學(xué)科服務(wù)的匹配度與效度也得到進一步提高。
基于機構(gòu)畫像的圖書館知識服務(wù)體系框架包括知識服務(wù)層、畫像展示層、數(shù)據(jù)加工層、底層數(shù)據(jù)層,組成了完善的服務(wù)鏈條。
底層數(shù)據(jù)層是知識服務(wù)體系建設(shè)的基礎(chǔ),圖書館會根據(jù)原始數(shù)據(jù)渠道的不同,甄選數(shù)據(jù)的類別,完成信息體系的架構(gòu)。需要注意的是,數(shù)據(jù)的選擇要考慮到該數(shù)據(jù)在行業(yè)內(nèi)的認可度、數(shù)據(jù)持續(xù)獲得的質(zhì)量,以及數(shù)據(jù)的連續(xù)性、保證性與全面性,既要選擇動態(tài)數(shù)據(jù),也要選擇靜態(tài)數(shù)據(jù)。
數(shù)據(jù)加工層包含數(shù)據(jù)采集、數(shù)據(jù)審核、數(shù)據(jù)清洗、標(biāo)簽分類、數(shù)據(jù)關(guān)聯(lián)幾個環(huán)節(jié),圖書館對信息靜態(tài)畫像數(shù)據(jù)庫與動態(tài)特征畫像數(shù)據(jù)庫的資源進行提取,經(jīng)過統(tǒng)計分析、挖掘、聚類之后,形成較為精準(zhǔn)和直觀的機構(gòu)畫像。這一部分是圖書館知識服務(wù)體系的核心,直接決定了機構(gòu)畫像的準(zhǔn)確度和學(xué)科知識服務(wù)的效度。
被圖書館分析聚類的數(shù)據(jù)最終要以可被讀取和展示的形成呈現(xiàn),畫像展示層指的是機構(gòu)畫像的形成,在這一層級,圖書館通過對數(shù)據(jù)進行可視化處理,為知識服務(wù)層的建設(shè)提供保障。
知識服務(wù)層包含科技信息統(tǒng)計分析、機構(gòu)各類評估評價資源、精準(zhǔn)推進人才和發(fā)展態(tài)勢分析等,這一層級直接面向使用者,便于用戶利用學(xué)科服務(wù)體系建設(shè)專屬于自己的資源庫,有利于其學(xué)術(shù)研究和科學(xué)決策。
高校、科研機構(gòu)以及重點實驗室的用戶需要頻繁使用數(shù)據(jù)庫中的各類信息開展統(tǒng)計分析、數(shù)據(jù)歸類等工作。機構(gòu)畫像驅(qū)動的圖書館嵌入式學(xué)科服務(wù)可以結(jié)合用戶的實際需求,突破傳統(tǒng)單次分析的瓶頸,對數(shù)據(jù)庫進行全面精準(zhǔn)的多線程篩選匹配,為用戶提供動態(tài)提取的一站式信息統(tǒng)計與分析服務(wù),能夠滿足各個機構(gòu)層面的實際應(yīng)用需求[5]。
機構(gòu)畫像驅(qū)動的圖書館嵌入式學(xué)科服務(wù)為用戶設(shè)計了各類評估評價功能。2020年,教育部對137所“雙一流”高校進行學(xué)科評估,實際上就是應(yīng)用了機構(gòu)畫像驅(qū)動的圖書館嵌入式服務(wù)技術(shù),通過評估結(jié)果,可以實現(xiàn)本機構(gòu)與同行機構(gòu)在不同指標(biāo)層面的量化對比,從而指導(dǎo)本機構(gòu)有的放矢地進行完善和改進[1]。在科研活動中,目標(biāo)機構(gòu)也可以應(yīng)用這一功能評估自身的排名,找到薄弱之處,彌補學(xué)科研究領(lǐng)域的短板。
科技資源精準(zhǔn)推送是機構(gòu)畫像在圖書館服務(wù)中的主要應(yīng)用內(nèi)容之一。通過機構(gòu)畫像,圖書館可以根據(jù)機構(gòu)用戶的數(shù)據(jù)庫檢索、下載日志,以及發(fā)表論文的引文分析、關(guān)鍵詞分析,精準(zhǔn)識別并呈現(xiàn)機構(gòu)用戶重點關(guān)注的數(shù)據(jù)庫、期刊和關(guān)鍵詞等,并以此為基點,實現(xiàn)向機構(gòu)用戶精準(zhǔn)推送最新學(xué)科文獻資源。此外,基于對同行機構(gòu)的畫像刻畫,圖書館也可以向本機構(gòu)推送同行機構(gòu)的最新學(xué)科成果進展信息。
創(chuàng)建世界一流高校和一流科研機構(gòu)的根本在于人才,因此,機構(gòu)人才發(fā)展的態(tài)勢分析也是學(xué)科服務(wù)的一項重要內(nèi)容。在機構(gòu)畫像構(gòu)建過程中,圖書館對機構(gòu)科技人才信息進行了長期采集、保存和分析,可以在較長的時間線上展示出高?;蚩蒲袡C構(gòu)的人才現(xiàn)狀與人才結(jié)構(gòu)變化趨勢,比如杰青、優(yōu)青等高端人才群體的變化特征,為機構(gòu)開展人才發(fā)展分析提供數(shù)據(jù)支撐[6]。
嵌入式學(xué)科服務(wù)的發(fā)展必須依托于機構(gòu)畫像的數(shù)據(jù)分析,這種知識的深層次服務(wù)展現(xiàn)出了復(fù)雜多樣的特點,外部的不確定性也在逐漸增強。因此面對當(dāng)前創(chuàng)新型科研型社會發(fā)展的時代背景,圖書館必須要對學(xué)科資源進行高效整合。同時,隨著讀者的需求日益增多,圖書館供給的資源雖然在數(shù)量上是無盡的,但是在類別劃分上與內(nèi)容個性化上不能夠達到讀者的要求,這種矛盾日益凸顯?;诖?,圖書館需要加強跨界合作,進一步推動資源共享,尤其是通過構(gòu)建機構(gòu)畫像,積極開展館際資源共享,推進學(xué)科資源的深度關(guān)聯(lián),建立多方合作共享的關(guān)系。
目前,高校嵌入式的學(xué)科服務(wù)尚不夠精準(zhǔn),處于較低的層次。機構(gòu)畫像驅(qū)動導(dǎo)向的融合強調(diào)學(xué)生和科研人員的全過程、全覆蓋參與,達成立體式的嵌入效果,在科研的每一個階段都始終以用戶需求為導(dǎo)向,還能夠隨時跟蹤進度,對階段性研究成果進行統(tǒng)計和回溯,有效提升了學(xué)科服務(wù)的效率和精度。隨著數(shù)據(jù)分析技術(shù)的不斷精進,機構(gòu)用戶畫像驅(qū)動的SNS已經(jīng)處于較為成熟的發(fā)展階段,能夠協(xié)助圖書館系統(tǒng)建設(shè)更加高效的雙向?qū)咏涣鳎奖憧蒲腥藛T對圖書館資源進行高效調(diào)取和使用。除此之外,相關(guān)的tag技術(shù)還有助于提升電子資源的整合效率,為不同畫像的機構(gòu)提供有效的標(biāo)簽服務(wù),幫助用戶快速搜索目標(biāo)文獻。
機構(gòu)畫像驅(qū)動的嵌入式圖書館學(xué)科服務(wù),需要處理海量的線上知識信息,這對于圖書館而言,無疑是一項巨大的挑戰(zhàn)。為了保障機構(gòu)用戶和學(xué)科資源的信息安全,圖書館必須要加強內(nèi)部建設(shè),利用現(xiàn)有的技術(shù)平臺補足漏洞,防范被不法分子盜取資源庫中的信息,只有保證網(wǎng)絡(luò)服務(wù)平臺的資源安全,才能夠真正保障系統(tǒng)的高效運行。因此,圖書館在建設(shè)機構(gòu)用戶畫像驅(qū)動的嵌入式學(xué)科服務(wù)體系時,可以在網(wǎng)絡(luò)內(nèi)外部之間購置一道防火墻,增加訪問的身份要求,設(shè)置雙重或多重權(quán)限,提高原服務(wù)臺的自身存儲安全性,堅決杜絕數(shù)據(jù)盜用情況的發(fā)生。
綜上所述,基于機構(gòu)用戶畫像驅(qū)動的圖書館嵌入式學(xué)科服務(wù),在信息數(shù)據(jù)的采集、分類整理、評價等方面具備明顯的創(chuàng)新優(yōu)勢,能夠為圖書館當(dāng)前的學(xué)科研究、信息更新、資源建設(shè)提供有效的數(shù)據(jù)支撐。機構(gòu)畫像是科研行為基本信息特征全貌建設(shè)的一種有效表達方法,為創(chuàng)新學(xué)科服務(wù)模式提供了新的思路。