馬宇馳(吉林財經(jīng)大學(xué)圖書館)
分析某一學(xué)科在特定時間段的熱點,能夠幫助專家學(xué)者迅速梳理領(lǐng)域知識結(jié)構(gòu)、明晰主流研究項目、把握該領(lǐng)域在當(dāng)前及未來一段時間的發(fā)展趨勢。
目前,國內(nèi)對于圖書情報學(xué)(Library and Information Science,LIS) 的行業(yè)熱點展望常見于領(lǐng)域內(nèi)某個主題的演進(jìn)回顧、分析及前瞻。如,奉國和等運(yùn)用CiteSpace,以CSSCI 為數(shù)據(jù)庫檢索源,對國內(nèi)機(jī)構(gòu)知識庫研究文獻(xiàn)進(jìn)行分析,識別了機(jī)構(gòu)知識庫領(lǐng)域核心期刊、研究團(tuán)隊、關(guān)鍵節(jié)點文獻(xiàn)等知識演進(jìn)要素[1];肖荻昱以CNKI 數(shù)據(jù)庫為檢索源,利用CiteSpace 繪制了圖書館智庫領(lǐng)域的文獻(xiàn)作者、機(jī)構(gòu)、關(guān)鍵詞及研究前沿圖譜[2];胡浪基于CNKI 的數(shù)據(jù),通過CiteSpace 呈現(xiàn)了國內(nèi)圖書情報學(xué)的研究現(xiàn)狀,指出了計量學(xué)在圖書情報領(lǐng)域中的增長態(tài)勢[3];蘇福等運(yùn)用CiteSpace,對2014—2015 年被Web of Science(WoS)收錄的圖書情報學(xué)期刊進(jìn)行分析,繪制出當(dāng)年的領(lǐng)域研究熱點[4];2014 年,孫杰等對SSCI 收錄圖書信息學(xué)Top5 的期刊進(jìn)行CiteSpace 關(guān)鍵詞聚類分析,并與國內(nèi)學(xué)者在國際期刊中的發(fā)文熱點進(jìn)行對比,總結(jié)學(xué)界發(fā)展過程中的異同[5]。前人的研究或基于國內(nèi)數(shù)據(jù)源、或未經(jīng)過相應(yīng)的數(shù)據(jù)清洗流程、或數(shù)據(jù)截取的時間跨度短、或因撰寫時間久遠(yuǎn)而削弱了對當(dāng)下借鑒的時效性。本研究嘗試運(yùn)用數(shù)據(jù)清洗方法、網(wǎng)絡(luò)密度分析結(jié)合時序分析法,剖析近五年圖書情報學(xué)在SCI 優(yōu)質(zhì)期刊中的研究主流及研究熱點,為該領(lǐng)域的相關(guān)研究提供一定的借鑒。
以WoS 和其期刊引文報告(Journal Citation Reports,JCR) 作為數(shù)據(jù)來源。WoS 按主題將其收錄的期刊大致分為250 個學(xué)科類別,每份期刊和書籍都至少屬于一個學(xué)科類別。在2018 年版的JCR 中,共236 個類目,包含圖書情報學(xué)(Information Science&Library Science,LIS)類目的數(shù)量為1,此類目下包含期刊出版物的數(shù)量為89 個。
作為權(quán)威的文獻(xiàn)計量大學(xué)排行,荷蘭萊頓大學(xué)科學(xué)技術(shù)研究中心(Centre for Science and Technology Studies,CWTS)及美國免費(fèi)期刊信息分析平臺Scimago 發(fā)布的排行報告在選取優(yōu)秀出版物的過程中,均將專業(yè)領(lǐng)域內(nèi)前10%這一比例作為選取依據(jù)[6]。因此,本研究同樣采用了“10%”作為抽取比例,即選取10 個期刊,按照J(rèn)CR 的期刊影響因子(Journal Impact Factor)數(shù)值降序排列(見表1)。
表1 2018 年圖書情報學(xué)影響因子TOP 10 期刊
在WoS 中的檢索策略為SO=(International Journal of Information Management) or SO= (Journal of Computer-Mediated Communication) or SO=(Journal of Knowledge Management) or SO= (MIS Quarterly) or SO= (Government Information Quarterly) orSO=(Journal of The American Medical Informatics Association) or SO=(Information&Management) orSO= (Journal ofStrategicInformation Systems) or SO= (Information Processing&Management) orSO=(Journal ofInformetrics)。檢索時間截止到2019 年12 月24 日,時間跨度為最近 5 年,索引為SCI-EXPANDED、SSCI,共檢索到文獻(xiàn)4,060 篇。在WoS 的數(shù)據(jù)導(dǎo)出界面中選擇“全記錄與引用的參考文獻(xiàn)”,文件格式選擇“純文本”,由此得到用于共現(xiàn)分析的數(shù)據(jù)文件。
CiteSpace 是知識可視化的表現(xiàn)手段,其工作原理是應(yīng)用論文中關(guān)鍵詞的詞頻統(tǒng)計及共現(xiàn)分析、文獻(xiàn)的共被引分析等理論,同時結(jié)合聚類分析、應(yīng)用數(shù)學(xué)分析方法、圖形學(xué)等信息可視化技術(shù),形成對知識內(nèi)在結(jié)構(gòu)的描繪和對知識間相互聯(lián)系的揭示。作為計量學(xué)在實踐領(lǐng)域的一項應(yīng)用,CiteSpace 常被用于兩個方面:① 某學(xué)科或多學(xué)科交叉下的研究主題發(fā)現(xiàn)、熱點定位及前沿趨勢探析;② 學(xué)科覆蓋下的杰出科研人員、優(yōu)勢科研機(jī)構(gòu)和國家的可視化標(biāo)識,以及科研人員之間、機(jī)構(gòu)國家之間的合作共現(xiàn)顯示。
應(yīng)用文獻(xiàn)目錄數(shù)據(jù)分析某一領(lǐng)域熱點的研究已廣泛開展,但由于數(shù)據(jù)質(zhì)量優(yōu)劣不一,基于該方法的結(jié)果的效度難以得到保障。潘瑋等構(gòu)建了數(shù)據(jù)清洗的“DEAN”流程,清洗4 類數(shù)據(jù)對象,即來自同一數(shù)據(jù)庫或多數(shù)據(jù)庫間的重復(fù)(Duplicates) 條目,不符合檢索需求的文獻(xiàn)類型或檢索策略錯誤(Errors) 記錄,具備相同語法或語義概念的同義不規(guī)范關(guān)鍵詞(Alias),含有子網(wǎng)或低頻次閾值的噪聲干擾關(guān)鍵詞(Noises),并證實該流程提升了對于研究主題識別的有效性和準(zhǔn)確性[7]。
按照“DEAN”數(shù)據(jù)清洗步驟,本次數(shù)據(jù)清洗的流程及結(jié)果見表2。
表2 “DEAN”流程各環(huán)節(jié)功能及結(jié)果
將清洗后的數(shù)據(jù)導(dǎo)入CiteSpaceV,在功能參數(shù)區(qū)中將時間切片中的時間范圍設(shè)置為“2015-2019”,時間切片為 1 年,節(jié)點類型(Node Types) 按照分析對象先后選取“Institution”“Author”“Keyword”等,每個時間切片選擇“Top 50”,連線強(qiáng)度選擇“Cosine”,然后進(jìn)行數(shù)據(jù)分析,在可視化的數(shù)據(jù)分析界面,文獻(xiàn)的關(guān)鍵詞以節(jié)點的形式出現(xiàn)在視圖中。節(jié)點為年輪狀彩色圓環(huán)圖,靠近外圈的環(huán)以暖色顯示,代表相對近期文獻(xiàn);內(nèi)圈的環(huán)用冷色顯示,代表相對早期的文獻(xiàn),圓環(huán)厚度及節(jié)點面積與關(guān)鍵詞頻次成正比。圖中連線表示其兩端連接的節(jié)點存在于同一篇文獻(xiàn)中,具有共現(xiàn)關(guān)系。
選取發(fā)文頻次機(jī)構(gòu)的數(shù)據(jù)形成發(fā)文機(jī)構(gòu)共現(xiàn)圖(見圖1),在發(fā)文頻次排名前10 的機(jī)構(gòu)中,9 所來自美國,1 所來自中國。WoS 收錄的文獻(xiàn)數(shù)量是評估機(jī)構(gòu)科研力量的因素之一[8],相比于企業(yè)、科研院所及社會研究組織,大學(xué)科研團(tuán)隊在LIS 領(lǐng)域中研究力量具有明顯優(yōu)勢。從國家角度來說,美國大學(xué)科研團(tuán)隊表現(xiàn)出明顯優(yōu)勢,這為我國培養(yǎng)LIS 領(lǐng)域研究人員所進(jìn)行的聯(lián)合辦學(xué)、學(xué)術(shù)交流提供了地區(qū)借鑒。排名前兩位的布列根和婦女醫(yī)院 (Brigham and Women’s Hospital)和哈佛大學(xué)醫(yī)學(xué)院(Harvard Medical School)均來自醫(yī)學(xué)領(lǐng)域,這表明LIS 領(lǐng)域與醫(yī)學(xué)學(xué)科深度交叉融合,醫(yī)學(xué)領(lǐng)域?qū)IS 人才需求量較其他學(xué)科更大,高校在構(gòu)建LIS 專業(yè)學(xué)生培養(yǎng)計劃時,可適當(dāng)加大對醫(yī)學(xué)信息管理等專業(yè)的學(xué)科投入力度。
根據(jù)作者數(shù)據(jù)繪制作者共現(xiàn)圖(見圖2),在發(fā)文數(shù)排名前10 的作者中,4 人來自美國的機(jī)構(gòu),5 人來自歐洲的機(jī)構(gòu),1 人來自中國的機(jī)構(gòu),且從事醫(yī)學(xué)信息學(xué)研究的作者占比較高,與發(fā)文機(jī)構(gòu)分析結(jié)果一致。
圖1 發(fā)文機(jī)構(gòu)共現(xiàn)圖
圖2 作者共現(xiàn)圖
高產(chǎn)作者中排名第一的是英國胡弗漢頓大學(xué)的Thelwall M(發(fā)文頻次27),其近五年主要致力于傳統(tǒng)文獻(xiàn)計量指標(biāo)與替代計量學(xué)(Altmetrics)的社交網(wǎng)絡(luò)影響力計量化指標(biāo)的對照分析研究,如全球最大的科研社交網(wǎng)絡(luò)服務(wù)網(wǎng)站“ResearchGate”是否能廣泛反映現(xiàn)有的學(xué)術(shù)層級以及各國學(xué)者在使用“ResearchGate”提供的服務(wù)過程中是否受益于該網(wǎng)站,他對ResearchGate 的用戶進(jìn)行人口統(tǒng)計學(xué)分析,他還基于Mendeley進(jìn)行替代計量學(xué)分析,憑借對“讀者數(shù)量”的跟蹤,證實了“讀者數(shù)量”在反應(yīng)科研成果利用率上同傳統(tǒng)文獻(xiàn)計量學(xué)“引文數(shù)”所發(fā)揮的作用高度相關(guān)[9]。排名第二的是美國哈佛大學(xué)醫(yī)學(xué)院醫(yī)學(xué)信息學(xué)專業(yè)的David A K,他的研究以中大型科研團(tuán)隊合著為特征,通過研發(fā)以患者為中心的網(wǎng)絡(luò)化工具包分析包含患者和護(hù)理人員共同參與的急性護(hù)理過程中的各項醫(yī)療信息。此外,他的研究還涉及到臨床診斷支持系統(tǒng)、電子處方系統(tǒng)的處方錯誤分析、藥物過敏預(yù)警的失敗案例等[10]。意大利國家研究委員會的Giovanni Abramo 論證了由CWTS 提出的New Crown Indicator(the Mean Normalized Citation Score, MNCS),及諸如國際合作率、高被引文獻(xiàn)數(shù)等一系列需計算比率即與自身體量無關(guān)的計量指標(biāo)在衡量科研績效過程中的不適用性;確定了基于SIMCA 的多元隨機(jī)模型作為衡量科研產(chǎn)出的計量體系[11-12]。
自動聚類視圖采用的方法是對數(shù)似然比算法。通過聚類算法生成知識聚類,從聚類的施引文獻(xiàn)中提取標(biāo)簽詞,以此來表征對應(yīng)一定知識基礎(chǔ)的研究主題[13]。關(guān)鍵詞共現(xiàn)聚類見圖3,其中代表網(wǎng)絡(luò)模塊化的指標(biāo)聚類模塊值(Modularity)為0.8328,當(dāng)其大于0.3 時就意味著網(wǎng)絡(luò)社團(tuán)結(jié)構(gòu)顯著;另一個評價指標(biāo)聚類平均輪廓值(Silhouette)為0.7951,在0.5 以上時可以認(rèn)為聚類結(jié)果是合理的。
由圖3 可知,2015-2019 年圖書情報領(lǐng)域的研究熱點包括社交媒體(SocialMedia)、知識分享(Knowledge Sharing)、文獻(xiàn)計量學(xué) (Bibliometrics)、開放創(chuàng)新(Open Innovation)、自然語言處理(NaturalLanguageProcessing)、信息技術(shù)(Information Technology)、電子健康記錄 (Electronic Health Records,EHRs)、知識管理(Knowledge Management)、社交商務(wù) (SocialCommerce)、情感分析(Sentiment Analysis)。下面是對LIS 研究態(tài)勢的演化過程分析。
3.4.1 以時間為視角的主題間演化態(tài)勢分析
圖3 2015-2019 年關(guān)鍵詞共現(xiàn)圖
(1)2015 年,聚類排名靠前的主題為知識管理和以各種模型、理論為基礎(chǔ)的實證分析與案例研究。數(shù)據(jù)技術(shù)是貫穿LIS 歷年的研究熱點,自然語言處理技術(shù)在當(dāng)年成為熱門,為之后的機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、情感分析及語義分析提供了基礎(chǔ),而后者又是社交商務(wù)、電子商務(wù)、智慧醫(yī)學(xué)信息系統(tǒng)實現(xiàn)的必要工具,技術(shù)進(jìn)步所累積的成果時至今日仍在為LIS 的學(xué)科發(fā)展提供支持。當(dāng)年的文獻(xiàn)計量學(xué)熱點聚焦在書目數(shù)據(jù)庫的構(gòu)建、引文影響因子、全計數(shù)法與分?jǐn)?shù)計數(shù)法等理論研究。
(2)2016 年,谷歌云、亞馬遜云平臺的崛起使分布式計算、大數(shù)據(jù)技術(shù)成為當(dāng)年的熱門工具。大數(shù)據(jù)與各個行業(yè)互相滲透融合的同時,也催生了許多有價值的應(yīng)用平臺與產(chǎn)品,而基于電子健康記錄利用大數(shù)據(jù)技術(shù)優(yōu)勢形成的一系列研究成果成為當(dāng)年的最大聚類。電子政務(wù)獲得了當(dāng)年極高的關(guān)注,開放政府?dāng)?shù)據(jù)和電子政務(wù)關(guān)系密切,對于開放政府?dāng)?shù)據(jù)的用戶接受和信息系統(tǒng)研究成為當(dāng)年的另一熱點,大量用戶數(shù)據(jù)具有潛在價值,通過數(shù)據(jù)技術(shù)情感分析發(fā)揮價值,為社交商務(wù)、電子商務(wù)的發(fā)展提供基礎(chǔ)。
(3)2017 年,電子商務(wù)成為當(dāng)年新出現(xiàn)的聚類,電子商務(wù)的概念及相關(guān)理論并非當(dāng)年首次出現(xiàn),也并非LIS 領(lǐng)域獨有。在LIS 領(lǐng)域中電子商務(wù)的集中聚類主要由于大數(shù)據(jù)等計算機(jī)技術(shù)使對用戶生成內(nèi)容的開發(fā)成為可能,為公司組織提供了商業(yè)模式上新的視角,在這個過程中發(fā)揮作用的大數(shù)據(jù)及信息系統(tǒng)技術(shù)是LIS 的核心研究點之一。創(chuàng)新成為當(dāng)年的熱門,公司和政府機(jī)構(gòu)都將數(shù)字化創(chuàng)新管理列為研究重點。計量學(xué)方面,被廣泛應(yīng)用的Bibliometrix 在這一年上線,實現(xiàn)文獻(xiàn)計量學(xué)分析中的主要分析和科學(xué)可視化,并成為科學(xué)知識圖譜分析的主流工具之一。
(4)2018 年,大數(shù)據(jù)從幕后到臺前,從云計算本身的歷史演進(jìn),到與各個行業(yè)應(yīng)用場景的融合, 涌現(xiàn)了大量對于大數(shù)據(jù)本身理論和技術(shù)的討論。在這一年,網(wǎng)站數(shù)據(jù)量大量積累,后臺計算能力急速增長、通訊網(wǎng)絡(luò)全面部署,研究人員開始關(guān)注大數(shù)據(jù)及人工智能對個人隱私、信息安全的沖擊。數(shù)據(jù)平臺如Facebook、Twitter 等面臨泄露用戶隱私的質(zhì)疑。同時,涌現(xiàn)了大量關(guān)于數(shù)據(jù)技術(shù)文本挖掘的研究成果。典型的例子是非結(jié)構(gòu)化文本處理技術(shù)逐步成熟,使商業(yè)智能開發(fā)和健康領(lǐng)域的深度學(xué)習(xí)布局成為可能。
(5)2019 年,伴隨各類線上線下活動、各種信息系統(tǒng)、信息服務(wù)游戲化程度加深,社交媒體及社交網(wǎng)站轉(zhuǎn)向聚焦相關(guān)游戲化研究。技術(shù)接受模型被更多的研究者所重視,結(jié)合整合型技術(shù)接受與使用理論(UTAUT),廣泛應(yīng)用于區(qū)塊鏈、移動銀行等新型商務(wù)模式的研究。IT 創(chuàng)新結(jié)合了創(chuàng)新績效的進(jìn)展,為公司的決策制定提供了科學(xué)的參考,探索更多應(yīng)用場景的融合。此外,科學(xué)技術(shù)的雙刃劍效應(yīng)引起了學(xué)者的關(guān)注,如在與數(shù)據(jù)技術(shù)緊密結(jié)合的醫(yī)療健康行業(yè),雖然大數(shù)據(jù)技術(shù)、移動醫(yī)療(M-Health)提升了醫(yī)院的診療效能,但是在一定程度上造成了醫(yī)生身心壓力大、職業(yè)倦怠等問題。
3.4.2 以內(nèi)容為視角的主題內(nèi)演化態(tài)勢分析
LIS 的主題包括研究對象和研究方法,二者并不是孤立存在的,而是彼此促進(jìn)、互相完善。對于單個主題內(nèi)部的研究分支演化態(tài)勢并非排他的,不存在某一熱點的出現(xiàn)替代消亡之前的研究對象。LIS 的主題依托圖書館作為知識平臺及信息樞紐,以數(shù)據(jù)技術(shù)為技術(shù)核心,以圖書館學(xué)、情報學(xué)、傳播學(xué)理論為輔助工具,向相關(guān)領(lǐng)域輻射。
社交媒體的歷史并不久遠(yuǎn),但短短十余年間,社交媒體對人類生活產(chǎn)生了顛覆性改變和巨大的影響,其引起的關(guān)注不只發(fā)生在行業(yè)內(nèi),同樣延伸到了學(xué)術(shù)界,包括醫(yī)療、商務(wù)、政務(wù)等方面。關(guān)于社交媒體的研究可以分為三個層次。① 將社交媒體本身視為研究對象,對社交網(wǎng)絡(luò)的度量、社區(qū)結(jié)構(gòu)、牢固和薄弱的聯(lián)系、社交網(wǎng)絡(luò)的演變、網(wǎng)絡(luò)結(jié)構(gòu)和關(guān)系、價值觀念和衡量策略、社會資本等核心因素進(jìn)行評述[14];將傳播學(xué)理論應(yīng)用于因果鏈框架結(jié)構(gòu)的構(gòu)建,更好地理解使用社交媒體的原因和利用社交媒體帶來的影響[15]、對于社交媒體的疲勞效應(yīng)和用戶心理健康的分析[16]、對于Gamification 特點和內(nèi)在需求滿足的研究[17]。② 將社交媒體上用戶行為特征與某一行業(yè)進(jìn)行聯(lián)合分析,進(jìn)行規(guī)律的總結(jié)和概括,從而指導(dǎo)組織的戰(zhàn)略規(guī)劃行為,如社交網(wǎng)絡(luò)的興起發(fā)展過程中對人們消費(fèi)及健康行為的改善[18]。③ 脫離用戶行為屬性,抽取用戶生成的數(shù)據(jù),應(yīng)用回歸分析、結(jié)構(gòu)方程模型等手段實現(xiàn)假設(shè)推理性的研究,如應(yīng)用數(shù)據(jù)分析技術(shù)的行業(yè)分析,開發(fā)數(shù)據(jù)的潛在商業(yè)價值[19]。
電子健康記錄 (Electronic Health Records,EHRs)正在對醫(yī)學(xué)相關(guān)領(lǐng)域進(jìn)行著一場變革,在健康診療護(hù)理中形成的海量數(shù)據(jù)已是學(xué)界公認(rèn)的重要資源。聚焦于EHRs 的研究首先著眼于計算機(jī)技術(shù),包括數(shù)據(jù)清洗、自然語言處理、文本挖掘、情感分析、可視化等。得益于數(shù)據(jù)技術(shù)發(fā)展,EHRs 成為顯著新興的研究熱點,其研究課題較為活躍,內(nèi)部態(tài)勢相對分散,呈現(xiàn)出“探索—總結(jié)—再探索”的規(guī)律。微觀上表現(xiàn)為結(jié)合醫(yī)學(xué)信息特點的數(shù)據(jù)技術(shù)研究,如基于特定規(guī)則算法或機(jī)器學(xué)習(xí),在結(jié)構(gòu)化及非結(jié)構(gòu)化的健康記錄輸入過程中能有效探測識別目標(biāo)患者人群[20]。這類研究以統(tǒng)計學(xué)為基礎(chǔ),以算法為工具實現(xiàn),主要表現(xiàn)為利用處理后的結(jié)構(gòu)化數(shù)據(jù)構(gòu)建功能性醫(yī)療平臺,提高健康機(jī)構(gòu)的診療護(hù)理質(zhì)量的實證研究。如,利用遞歸神經(jīng)網(wǎng)絡(luò)對心力衰竭進(jìn)行早期探查[21]、應(yīng)用云服務(wù)移動健康監(jiān)測平臺遠(yuǎn)程幫助患者預(yù)防腦卒中[22]。
有關(guān)電子政務(wù)的研究主要包含兩個方面。一方面是提高用戶參與電子政務(wù)積極性的研究,另一方面是提高政府開放數(shù)據(jù)透明度的研究。在電子政務(wù)方面,有學(xué)者論述了電子化政府的公共價值,并結(jié)合Facebook、Twitter 等社交網(wǎng)絡(luò)闡明了社交媒體內(nèi)容質(zhì)量與公民參與電子政務(wù)積極性的關(guān)系[23],以及社交媒體內(nèi)容質(zhì)量對公民信任度、政策實施效果的影響[24]。在開放政府?dāng)?shù)據(jù) (Open Government Data,OGD) 方面,從對OGD 主導(dǎo)模型的梳理[25]到歸納OGD 項目的主流生態(tài)環(huán)境[26],過渡到OGD 項目的核心不只在于平臺的構(gòu)建,更在于數(shù)據(jù)集本身的質(zhì)量[27]。
關(guān)于商務(wù)經(jīng)濟(jì)的研究主要包括兩類。一類是基于社交網(wǎng)絡(luò)平臺,對社交商務(wù)、移動商務(wù)、電子商務(wù)等商業(yè)模式的分析。這類熱點得以興起的原因在于:① 技術(shù)上,隨著近年來數(shù)據(jù)技術(shù)的飛速發(fā)展,云存儲、云計算能力日益完善,為獲得、處理、分析、利用商務(wù)信息數(shù)據(jù)提供了先進(jìn)的技術(shù)支持;② 在場景上,F(xiàn)acebook、Twitter、微博等社交平臺經(jīng)過多年的發(fā)展,積累了大量用戶行為記錄,為理解用戶行為、完善社交網(wǎng)絡(luò)傳播學(xué)原理提供了豐富的案例。在總體層面,如社交商務(wù)的定義、研究主題和發(fā)展趨勢的演進(jìn)[28];在個體層面,通過數(shù)據(jù)獲取,幫助用戶選擇最優(yōu)的機(jī)器學(xué)習(xí)模型,運(yùn)用自然語言處理技術(shù)進(jìn)行面向服務(wù)評論的情感分析,如對星巴克、希爾頓酒店等的分析。移動商務(wù)帶來非經(jīng)濟(jì)利益的同時,學(xué)界也在思考技術(shù)帶來的負(fù)面影響,基于UTAUT等模型,展開了對于用戶隱私保護(hù)不足的反思討論[29]。另一類是結(jié)合經(jīng)濟(jì)學(xué)、管理學(xué)模型,分析在社交媒體上的社交行為作為中介變量或調(diào)解變量在組織內(nèi)服務(wù)創(chuàng)新、知識創(chuàng)新、知識管理、知識分享、知識共創(chuàng)等活動中產(chǎn)生的作用或?qū)冃У挠绊憽?/p>
文獻(xiàn)計量學(xué)以科研績效評價為主,理論和實踐互為補(bǔ)充,相輔相成,旨在構(gòu)建完善的科學(xué)書目信息源,全面收集科研成果數(shù)據(jù),研發(fā)基于用戶的信息圖譜可視化工具,客觀科學(xué)地呈現(xiàn)科研績效。① 在理論方面,聚焦于標(biāo)準(zhǔn)化工作,包括對采樣時間范圍的標(biāo)準(zhǔn)化[30]以及基于算法分類法的跨學(xué)科標(biāo)準(zhǔn)化實踐[31],并討論在標(biāo)準(zhǔn)化程序下科學(xué)計量研究中的全計數(shù)法、分?jǐn)?shù)計數(shù)法以及MNCS 作為研究績效評審指標(biāo)的科學(xué)適用性[11,32]。② 在構(gòu)建文獻(xiàn)信息源方面,谷歌學(xué)術(shù)作為科學(xué)信息源和科研產(chǎn)出評估數(shù)據(jù)源的適用性討論;引文計數(shù)在Google Scholar、Web of Science、Scopus 三種信息源之間的異同對比分析;替代計量學(xué)領(lǐng)域?qū)τ谛屡d學(xué)術(shù)主題的社交網(wǎng)站 ResearchGate、Academia.edu 和 Mendeley 的研究。③ 在實踐方面,依托統(tǒng)計學(xué)和算法模型,文獻(xiàn)計量學(xué)領(lǐng)域的研究逐漸由回顧轉(zhuǎn)為結(jié)合現(xiàn)狀的前瞻預(yù)測,如結(jié)合神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法的引文技術(shù)預(yù)測模型、Altmetric.com 對于長期計數(shù)的預(yù)測模型、文獻(xiàn)老化預(yù)測模型等。
數(shù)據(jù)技術(shù)側(cè)重對數(shù)據(jù)操作及數(shù)據(jù)分析方法本身的關(guān)注,包括利用自然語言處理、文本挖掘、情感分析、神經(jīng)網(wǎng)絡(luò)、決策樹等技術(shù)實現(xiàn)商業(yè)需求。LIS 行業(yè)對于大數(shù)據(jù)的關(guān)注從最初的定義、分析方法、非結(jié)構(gòu)化數(shù)據(jù)相關(guān)分析的各種算法到分布式計算、云計算等前沿技術(shù)的評述,以及大數(shù)據(jù)在物聯(lián)網(wǎng)、智慧城市中的角色定位。其中,分布式賬本技術(shù)使系統(tǒng)的互操作性有了質(zhì)的飛躍,實現(xiàn)了醫(yī)療、物流供應(yīng)等多領(lǐng)域的應(yīng)用升級。當(dāng)前,大數(shù)據(jù)的發(fā)展正經(jīng)歷著“新興—實用—探索”反復(fù)循環(huán)交織的過程,人們在積極探索大數(shù)據(jù)在各行業(yè)應(yīng)用的同時,也在不斷完善發(fā)優(yōu)化自身對于數(shù)據(jù)的分析能力,包括認(rèn)知分析能力、對更高強(qiáng)度的非受控語言的處理能力、更加多元的決策支持模型的開發(fā)能力[33]。
通過對2015-2019 年LIS 領(lǐng)域頂級期刊的分析,得到以下結(jié)論。① 高校的研究機(jī)構(gòu)在LIS 領(lǐng)域中占核心地位;美國及歐洲占主導(dǎo)地位,中國在LIS 領(lǐng)域頂級刊物范圍內(nèi)也有高產(chǎn)作者。② LIS 領(lǐng)域的高產(chǎn)作者來自于醫(yī)學(xué)機(jī)構(gòu),或者與醫(yī)學(xué)機(jī)構(gòu)深度合作,醫(yī)學(xué)信息學(xué)存在較大發(fā)展?jié)摿?。③“社交媒體”“知識共享”“文獻(xiàn)計量”“電子健康記錄”“社會電子商務(wù)”等成為代表研究熱點的高頻關(guān)鍵詞語。④ 圖書情報領(lǐng)域的研究主題在傳統(tǒng)LIS 領(lǐng)域、計算機(jī)領(lǐng)域內(nèi)不斷深化完善,以數(shù)據(jù)技術(shù)為核心、LIS 相關(guān)理論為工具,與其他學(xué)科聯(lián)動擴(kuò)展,越來越多地與醫(yī)學(xué)、健康護(hù)理、商業(yè)經(jīng)濟(jì)、網(wǎng)絡(luò)傳播學(xué)進(jìn)行交叉融合。
本研究不免存在一定的局限性,由于CiteS-pace 所呈現(xiàn)的關(guān)鍵詞節(jié)點僅能定性呈現(xiàn)。在定量的角度上,節(jié)點所代表的值來自整個文獻(xiàn)數(shù)據(jù)集合里該關(guān)鍵詞出現(xiàn)的次數(shù),軟件若能對關(guān)鍵詞在具體文獻(xiàn)中出現(xiàn)次數(shù)加以權(quán)重劃分,該研究將有更強(qiáng)的說服性。