盧垚 王鸑飛 馬鑫
(中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所,北京 100081)
隨著科學(xué)研究的不斷深入,不同學(xué)科間的溝通、交互、融合日趨深化,科研人員跨學(xué)科合作也越來越頻繁,學(xué)科之間的關(guān)聯(lián)度越來越高,學(xué)科發(fā)展的邊界也日益模糊。當(dāng)某一領(lǐng)域跨學(xué)科研究積累足夠數(shù)量的知識點,并相互建立起成熟的關(guān)聯(lián)和邏輯時,就形成了交叉學(xué)科。因此,交叉學(xué)科就是指兩門及以上學(xué)科互相結(jié)合、彼此滲透交叉形成的新學(xué)科[1]。近年來,國內(nèi)外科學(xué)界一直倡導(dǎo)跨學(xué)科研究和促進新興交叉學(xué)科發(fā)展[2-4],而文獻資源保障是交叉學(xué)科建設(shè)發(fā)展的基礎(chǔ)條件,交叉學(xué)科的研究需要多學(xué)科領(lǐng)域的知識支撐,其文獻需求也有別于傳統(tǒng)學(xué)科,交叉學(xué)科信息資源建設(shè)對館藏資源建設(shè)的意義也越來越重要[5-7]。
很多圖書館和文獻服務(wù)機構(gòu)圍繞交叉學(xué)科信息資源建設(shè)開展了一系列的研究和實踐。如國家科技圖書文獻中心(National Science and Technology Library,NSTL)資源組通過定義交叉學(xué)科分類規(guī)則來組織相應(yīng)學(xué)科的科技文獻,其構(gòu)建的《NSTL文獻信息資源學(xué)科分類主題列表》根據(jù)交叉學(xué)科的研究對象及研究內(nèi)容的需要,在《中圖法》交替類目的基礎(chǔ)上調(diào)整了交叉學(xué)科的應(yīng)用規(guī)則,能夠?qū)徊鎸W(xué)科的科技文獻進行很好組織[8]。如對農(nóng)業(yè)經(jīng)濟學(xué)這類自然科學(xué)和社會科學(xué)融合產(chǎn)生的學(xué)科、農(nóng)業(yè)生物工程這種自然科學(xué)與技術(shù)科學(xué)交叉學(xué)科的相應(yīng)文獻都能按此分類表歸入適當(dāng)?shù)念惸肯隆?/p>
該領(lǐng)域多數(shù)研究主要集中在交叉學(xué)科文獻資源需求分析方面,利用不同的方法,分析交叉學(xué)科不同層面的文獻資源需求。如廈門大學(xué)圖書館對交叉學(xué)科研究者進行調(diào)研,分析其圖書借閱流通、館際互借數(shù)據(jù),尤其是中圖分類號的分布情況,了解相關(guān)研究者的文獻需求及文獻使用特點,從而優(yōu)化交叉學(xué)科的文獻資源建設(shè)[9]。沈丹等[10]利用引文分析從期刊引文數(shù)據(jù)入手,將期刊間的引用轉(zhuǎn)化為學(xué)科間的引用,分析學(xué)科間的交叉引用情況,從整體學(xué)科層面發(fā)現(xiàn)用戶對交叉學(xué)科的資源需求。同樣是基于引文分析,王婷等[11]提出了期刊關(guān)聯(lián)法,是對某一學(xué)科最具代表性期刊的參考文獻進行共引分析,將共引期刊間引證強度進行量化,判斷其相互聯(lián)系緊密度,從而找到相關(guān)的期刊。東華大學(xué)圖書館則從學(xué)科競爭力分析的角度借助科研評價工具,發(fā)現(xiàn)該校具有競爭優(yōu)勢的交叉學(xué)科領(lǐng)域范疇,為館藏資源建設(shè)提供宏觀導(dǎo)向和針對性的意見[7]。
這些研究從信息組織和需求分析方面,為交叉學(xué)科信息資源建設(shè)提供了實踐應(yīng)用指導(dǎo)。而在實際工作中,即便是掌握了學(xué)科需求,但由于期刊資源一般按照學(xué)科進行分類和組織,并且許多新出現(xiàn)的新興學(xué)科和交叉學(xué)科研究領(lǐng)域在現(xiàn)有的期刊分類學(xué)科體系中未能及時體現(xiàn),使得交叉學(xué)科期刊資源遴選仍面臨困難。
對于農(nóng)業(yè)科學(xué)而言,交叉學(xué)科的文獻資源建設(shè)一直都是保障的薄弱環(huán)節(jié)。農(nóng)業(yè)科學(xué)因其研究對象多樣,涉及的學(xué)科范圍廣泛、門類繁多,其中既有側(cè)重基礎(chǔ)理論的,也有側(cè)重應(yīng)用技術(shù)的,具有很強的學(xué)科交叉屬性。農(nóng)業(yè)學(xué)科科技文獻資源遠遠超出了作物學(xué)、園藝學(xué)、獸醫(yī)學(xué)等經(jīng)典農(nóng)業(yè)學(xué)科的范疇,涉及生物學(xué)、化學(xué)等基礎(chǔ)學(xué)科,工程學(xué)、計算機科學(xué)等應(yīng)用學(xué)科,經(jīng)濟學(xué)等人文社會學(xué)科。如果對這些所涉學(xué)科的資源按照學(xué)科為單元進行建設(shè),需要巨大的建設(shè)成本,并且針對性不強,資源利用也將不充分。此外,科研人員所需的信息資源不僅在學(xué)科層面越來越多元化,在面對海量的資源時,用戶需求也越來越個性化、精準化,即使是同一學(xué)科的資源,不同用戶的需求也存在很大的差異。因此,僅以學(xué)科為單元的文獻資源需求分析與遴選方法一定程度上已無法滿足交叉學(xué)科發(fā)展要求,打破學(xué)科的界限,進行更細粒度的文獻信息組織,探索新的資源遴選方法,為科研人員提供更精準的學(xué)科資源,成為交叉學(xué)科信息資源建設(shè)亟待解決的問題。
主題組織是將具有相同主題特征的文獻以表示其主題的受控詞匯作為標(biāo)識標(biāo)引、描述、存貯和檢索文獻的方法[12-14]。主題組織雖是圖書館信息資源管理常用的組織方式,但如何按照主題遴選期刊資源是新的議題。一方面,Scopus數(shù)據(jù)庫利用文獻間的直接引用關(guān)系識別相同研究主題的文獻進行聚類,并將每一類用主題詞表進行標(biāo)引,形成了9.6萬個主題組成的穩(wěn)定的組織結(jié)構(gòu),并且Scopus中95%的文獻都有對應(yīng)準確的唯一主題[15]。這就為利用發(fā)文引文進行文獻需求分析提供了一種比學(xué)科粒度更細的文獻組織方式和良好的大數(shù)據(jù)基礎(chǔ)。另一方面,愛思唯爾的指紋引擎技術(shù),采用先進的自然語言處理(NLP)算法從非結(jié)構(gòu)化文本中提取信息,配合領(lǐng)域相關(guān)的主題詞表的應(yīng)用,創(chuàng)建加權(quán)術(shù)語索引定義文本,即“指紋”,再通過聚合和比較指紋,能夠?qū)崿F(xiàn)語義層面的內(nèi)容匹配[16],這也為在主題層面進行需求和資源匹配提供了技術(shù)上的可能。
本文擬選擇中國農(nóng)科院蜜蜂學(xué)為對象,針對其開展科技文獻資源遴選方法研究。從中國農(nóng)科院蜜蜂學(xué)主要研究群體蜜蜂研究所(以下簡稱“蜜蜂所”)2017—2019年發(fā)文及引文著手,對文獻進行主題組織和分析,遴選出與該所科研人員研究內(nèi)容高度契合的高質(zhì)量期刊和核心論文。以典型的農(nóng)業(yè)交叉學(xué)科作為對象,研究科技文獻需求分析和資源遴選新方法,擬為科研人員提供精準的科技文獻資源,也為科研院所專業(yè)圖書館的信息資源建設(shè)和服務(wù)提供新的思路。
中國農(nóng)科院蜜蜂學(xué)科致力于蜂學(xué)的理論與應(yīng)用研究,其設(shè)置有7個主要研究方向,包括傳粉蜂生物學(xué)與授粉應(yīng)用、蜂產(chǎn)品加工與功能評價、蜂種質(zhì)資源與育種、蜂產(chǎn)品質(zhì)量與風(fēng)險評估、蜜蜂蛋白質(zhì)組學(xué)、蜜粉源植物產(chǎn)地環(huán)境識別與控制、蜜蜂病蟲害生物學(xué),具有專業(yè)性強且相對小眾的特點,涉及生物學(xué)、昆蟲學(xué)、生態(tài)學(xué)、蜜蜂病蟲害、蜂產(chǎn)品加工等多個學(xué)科,是典型的交叉學(xué)科專業(yè)。通過對蜜蜂所2019年發(fā)文進行分析發(fā)現(xiàn)所涉學(xué)科分布廣泛且極其分散(見圖1),按照Scopus數(shù)據(jù)庫學(xué)科分類體系,主要涉及農(nóng)業(yè)和生物科學(xué),生化、遺傳和分子生物學(xué),化學(xué)等一級學(xué)科;各一級學(xué)科內(nèi)又涉及多個二級學(xué)科,如農(nóng)業(yè)和生物科學(xué)涉及食品科學(xué),昆蟲學(xué),生態(tài)、進化、行為和系統(tǒng)學(xué),植物學(xué),農(nóng)學(xué)和作物科學(xué)等。而無論是一級學(xué)科還是二級學(xué)科都很難與蜜蜂學(xué)科主要研究方向進行映射,若以學(xué)科為單元對蜜蜂所及其主要研究團隊進行文獻需求分析,很難精確定位其所需的資源,因此需要將學(xué)科資源按照更細粒度進行組織遴選。
圖1 中國農(nóng)科院蜜蜂學(xué)發(fā)文學(xué)科分布
本文研究數(shù)據(jù)來源于Scopus引文索引數(shù)據(jù)庫和Scival數(shù)據(jù)庫,通過機構(gòu)檢索從Scopus數(shù)據(jù)庫中采集中國農(nóng)科院蜜蜂所2017—2019年發(fā)文272篇,引文11836篇,同時采集文獻所屬主題信息。各主題所涉全球論文數(shù)量、主題顯示度等數(shù)據(jù)則采集自Scival數(shù)據(jù)庫。
將上述蜜蜂學(xué)科發(fā)文引文按主題進行組織并遴選,從期刊和論文兩個層面開展資源內(nèi)容和質(zhì)量評估(見圖2),其中期刊的遴選又分為來源期刊分析和期刊內(nèi)容匹配兩條路徑,各關(guān)鍵環(huán)節(jié)具體方法如下。
圖2 基于主題分析的文獻資源遴選方法技術(shù)路線
(1)主題組織和遴選。本文利用Scopus數(shù)據(jù)庫對文獻按照引用關(guān)系進行聚類并用學(xué)科主題詞表標(biāo)引的主題組織方法[15,17],繼承數(shù)據(jù)庫對蜜蜂學(xué)科發(fā)文、引文的主題組織結(jié)果,并與該學(xué)科主要研究方向進行映射。隨后,分析蜜蜂學(xué)科發(fā)文及其引文在各主題的分布情況,綜合比較發(fā)文/引文在主題內(nèi)全球論文中的占比以及主題顯示度指標(biāo),遴選出蜜蜂學(xué)科發(fā)文/引文集中度、貢獻度相對較高并且在全球范圍內(nèi)被關(guān)注程度較高的、發(fā)展勢頭較好的主題。
(2)主題關(guān)鍵詞識別和分析。針對遴選出的主題,借助愛思唯爾指紋引擎技術(shù)識別提取主題內(nèi)文獻的關(guān)鍵詞[16]。指紋引擎技術(shù)采用先進的自然語言處理(NLP)技術(shù)從非結(jié)構(gòu)化文本中提取信息,并配合領(lǐng)域相關(guān)的主題詞表的應(yīng)用,對主題內(nèi)每篇出版物創(chuàng)建加權(quán)術(shù)語索引“指紋”,再基于逆向文件頻率(Inverse Document Frequency,IDF)[18]統(tǒng)計方法,判斷術(shù)語的重要性,提取與主題相關(guān)性高的關(guān)鍵詞。本研究借助Scival平臺愛思唯爾指紋引擎后端處理組件完成主題文獻關(guān)鍵詞的識別、相關(guān)性分析及其在主題中的走勢分析[19]。
(3)期刊遴選評估。本研究利用愛思唯爾期刊查找工具(Elsevier Journal Finder),查找與主題相匹配的期刊資源。期刊查找工具原本用于為作者找到適合發(fā)表其論文的期刊,需要作者提供論文標(biāo)題、關(guān)鍵詞和摘要[20],經(jīng)由愛思唯爾指紋引擎生成規(guī)范化、結(jié)構(gòu)化的加權(quán)術(shù)語索引,再將“指紋”與Scopus數(shù)據(jù)庫中論文進行匹配,再經(jīng)期刊排序算法計算,得到推薦期刊列表[21]。本研究利用該工具能夠語義搜索相關(guān)期刊的功能,以所遴選主題的名稱作為標(biāo)題和關(guān)鍵詞,將主題關(guān)鍵詞依據(jù)其與主題的相關(guān)性賦予相應(yīng)的權(quán)重,模擬生成摘要文本,輸入該工具,通過主題特征文本的匹配定位內(nèi)容相關(guān)度高的資源,并且為了兼顧交叉學(xué)科的期刊,并不預(yù)設(shè)期刊所屬學(xué)科。最后再結(jié)合期刊影響力指標(biāo),從中遴選出高水平的期刊。
(4)核心論文遴選評估。在單篇論文層面,本研究利用Scival平臺主題特征分析功能,分析獲得各主題的代表性論文。代表性論文的遴選依據(jù)核心論文分值[22],核心論文分值反映論文在主題中的核心程度,由文章在主題內(nèi)的鏈接數(shù)(包含被引和引用)、主題內(nèi)鏈接數(shù)占其所有鏈接數(shù)之比、被引次數(shù)出版年規(guī)范化值三者相乘而得。核心論文分值高的論文,通常有許多主題內(nèi)的引文關(guān)系,而且大部分引文關(guān)系都在主題內(nèi),被引用的次數(shù)也相對較高,能反映主題的中心研究問題,并且通過設(shè)置論文出版年份,還能夠反映主題內(nèi)較新的發(fā)展方向。
(1)主題顯示度。其反映主題的被關(guān)注度及發(fā)展勢頭,是對每一主題中文獻的被引次數(shù)、瀏覽次數(shù)和平均的期刊影響力加權(quán)求和的結(jié)果[17]。
(2)關(guān)鍵詞相關(guān)性。其反映關(guān)鍵詞與主題的相關(guān)程度,是關(guān)鍵詞IDF[18]統(tǒng)計結(jié)果的歸一化值,用0~1表示,主題內(nèi)相關(guān)度最高的關(guān)鍵詞相關(guān)性為1,其余關(guān)鍵詞的相關(guān)性則根據(jù)統(tǒng)計結(jié)果取相對值。
(3)期刊影響力指標(biāo)。CiteScore是以4年區(qū)間為基準計算的每本期刊平均被引用次數(shù);SNIP(Source Normalized Impact per Paper),即規(guī)范化影響力,是期刊中每篇論文平均被引次數(shù)與其所屬學(xué)科領(lǐng)域潛在引用值之比,可以直接比較不同學(xué)科領(lǐng)域期刊的引用影響[23-24];SJR(SCImago Journal Rank)是既考慮期刊被引數(shù)量,又考慮期刊被引質(zhì)量的指標(biāo),它采用Google的PageRank算法,賦予來源于高聲望期刊的引用以較高的權(quán)重,并以此規(guī)則迭代計算直到收斂[25]。
(4)FWCI值。學(xué)科規(guī)范化引文影響力(Field-Weighted Citation Impact,F(xiàn)WCI)[26]反映主題文獻合集或主題內(nèi)單篇論文的學(xué)術(shù)影響力,是論文被引頻次與同類型論文平均被引次數(shù)的比值,排除了出版年、學(xué)科領(lǐng)域與文獻類型的影響。
引用參考文獻、發(fā)表學(xué)術(shù)論文是科研用戶最主要的科技文獻利用方式,其發(fā)文和引文直接反映其文獻資源需求,尤其是引文分析法被廣泛應(yīng)用于文獻需求保障分析[27-29]。通過對中國農(nóng)科院蜜蜂學(xué)2017—2019年的272篇發(fā)文及其11836篇引文進行梳理分析,發(fā)現(xiàn)其發(fā)文分布于149個主題、引文分布于2253個主題。綜合比較該機構(gòu)發(fā)文、引文在各主題中的分布數(shù)量和占比,判斷其對各個主題文獻的需求,再結(jié)合主題全球表現(xiàn)情況和主題與該機構(gòu)蜜蜂學(xué)科研究方向的映射結(jié)果,遴選出16個主題(見表1)。
可以看出2017—2019年中國農(nóng)科院蜜蜂學(xué)科發(fā)文較集中的主題有“NosemaCeranae,Deformed Wing Virus,Sacbrood Virus”(21篇)、“Bombus,Pollinators,Neonicotinoids”(18篇)和“Honey,Stingless Bees,Hydroxymethylfurfural”(16篇)。從發(fā)文對主題同期論文貢獻程度而言,該機構(gòu)貢獻較大的主題有“Royal Jelly,10-Hydroxy-2-Decenoic Acid,Hypopharyngeal Glands”(6.71%)、“NosemaCeranae,Deformed Wing Virus,Sacbrood Virus”(4.42%)和“Honeybee,Lactobacillus Kunkeei,Bombus”(3.70%)。但由于主題的組織方式是基于引用關(guān)系,所以主題粒度大小不一,因此有的研究方向集中在一個主題內(nèi),如蜜蜂蛋白質(zhì)組學(xué);有的研究方向則涉及多個主題,如蜜蜂病蟲害生物學(xué)就涉及孢子蟲、瓦螨、殺蟲劑抗性、短膜蟲等主題。因此,在考慮發(fā)文占比的同時,也應(yīng)結(jié)合機構(gòu)研究方向的設(shè)置情況考慮主題粒度,選擇恰當(dāng)?shù)闹黝}進行文獻需求分析。
表1 中國農(nóng)科院蜜蜂學(xué)2017—2019年發(fā)文、引文主要主題分布
對引文的主題分布進行分析發(fā)現(xiàn),無論是引文篇次還是引文量的分布規(guī)律,都與發(fā)文主題分布有相同的特征。引文較集中的主題同樣是“NosemaCeranae,Deformed Wing Virus,Sacbrood Virus”(312篇)、“Bombus,Pollinators,Neonicotinoids”(306篇)和“Honey,Stingless Bees,Hydroxymethylfurfural”(248篇)。而引文占主題全部論文比排名前三的主題分別是“Royal Jelly,10-Hydroxy-2-Decenoic Acid,Hypopharyngeal Glands”(22.21%)、“Honeybee,Lactobacillus Kunkeei,Bombus”(19.96%)和“NosemaCeranae,Deformed Wing Virus,Sacbrood Virus”(17.21%),充分說明蜜蜂所利用的文獻集中在這些主題內(nèi)。
除發(fā)文、引文的主題分布情況,還通過主題顯示度指標(biāo)來判斷主題的受關(guān)注程度和發(fā)展勢頭。蜜蜂學(xué)涉及的主題“Bombus,Pollinators,Neonicotinoids”(99.804)、“Vomitoxin,Zearalenone,15-Acetyldeoxynivalenol”(99.441)和“Thin-Layer Drying,High Temperature Air,Solar Dryers”(99.372)顯示度較高,在全球范圍內(nèi)受關(guān)注程度高、發(fā)展勢頭較好,分析這類主題的文獻內(nèi)容構(gòu)成將有助于識別相關(guān)研究領(lǐng)域的科技前沿?zé)狳c信息資源和技術(shù)。此外,本文還將FWCI值作為遴選目標(biāo)主題的參考,但機構(gòu)用戶的文獻需求分析主要考量其與主題文獻的相關(guān)程度,并不評價主題內(nèi)論文的引文影響力高低,因此FWCI值在此僅作參考不作為遴選指標(biāo)。綜上所述,綜合比較主題的發(fā)文量、對主題的發(fā)文貢獻、引文量、引文占比以及主題顯示度等因素,最終將16個主題遴選為分析中國農(nóng)科院蜜蜂學(xué)文獻需求的主要研究對象。
以主題“NosemaCeranae,Deformed Wing Virus,Sacbrood Virus”為例,說明本研究對主題關(guān)鍵詞的識別過程和分析結(jié)果。通過分析蜜蜂所引用該主題內(nèi)312篇文獻發(fā)現(xiàn),引文的出版年主要集中在2010年以后,因此對該主題2010年至今的1384篇文獻進行關(guān)鍵詞識別,提取出相關(guān)性排名前50的關(guān)鍵詞,構(gòu)建特征文本,代表該主題的主要內(nèi)容。在提取出的關(guān)鍵詞中(見表2,此處僅列出相關(guān)性排名前20的關(guān)鍵詞)除Honeybee、Bee、ApisMellifera(意大利蜜蜂)、ApisCerana(東方蜜蜂)等蜜蜂的不同常用名、種名之外,絕大多數(shù)是蜜蜂病蟲害生物學(xué)的專業(yè)名詞,包括NosemaCeranae(微孢子蟲)、Deformed Wing Virus(畸翅病毒)、Sacbrood Virus(囊幼病病毒)等描述病害和蟲害的關(guān)鍵詞。關(guān)鍵詞的相關(guān)性通過IDF統(tǒng)計方法算得,相關(guān)性越高越能代表該主題,將由此設(shè)置在特征文本中的權(quán)重。此外,關(guān)鍵詞走勢反映主題內(nèi)關(guān)鍵詞所涉文獻過去10年的數(shù)量變化趨勢,可作為判斷主題主要內(nèi)容變化的參考,如關(guān)鍵詞Deformed Wing Virus,其相關(guān)文章的數(shù)量過去10年在此主題內(nèi)增長率超過200%,說明相關(guān)的研究越來越受到重視。
表2 主題“NosemaCeranae, Deformed Wing Virus, Sacbrood Virus”主要關(guān)鍵詞
本研究從資源內(nèi)容和資源質(zhì)量兩個方面對主題相關(guān)的期刊進行了評估。仍然以主題“NosemaCeranae,Deformed Wing Virus,Sacbrood Virus”為例,通過分析主題文獻來源期刊分布得到刊載該主題文章數(shù)量較多的主要期刊(見表3),可以看出這些期刊不僅涉及昆蟲學(xué),還涉及傳染病學(xué)、病毒學(xué),以及生態(tài)學(xué)、進化學(xué)、行為學(xué)和系統(tǒng)分類學(xué)等學(xué)科,由此說明利用主題來組織期刊資源能夠突破學(xué)科的界限。除此之外,還用文本匹配的方法嘗試尋找內(nèi)容相關(guān)期刊,利用上文中識別提取出的主題關(guān)鍵詞,將其按與主題的相關(guān)性賦予權(quán)重,構(gòu)建特征文本,再利用愛思唯爾期刊查找工具,從語義上匹配內(nèi)容相關(guān)的期刊。對主題“NosemaCeranae,Deformed Wing Virus,Sacbrood Virus”而言,期刊查找工具匹配出49種期刊(見圖3),文本匹配分數(shù)(5分為滿分)較高的期刊有Journal of Apicultural Research(2.32分)、Saudi Journal of Biological Science(1.81分)和Current Biology(1.08分)。這3種刊如果按照傳統(tǒng)的蜂學(xué)期刊資源遴選方法,從昆蟲學(xué)期刊中尋找都不會被發(fā)現(xiàn),因此也證明本研究采用的方法能夠在其他學(xué)科精準地定位到與蜜蜂研究密切相關(guān)的期刊。此外,在期刊質(zhì)量評估方面,本文則選取了CiteScore、SNIP、SJR期刊影響力指標(biāo),作為評估期刊資源質(zhì)量的重要參考依據(jù)。
對于主題核心論文的遴選,本研究利用Scival主題特征分析,獲得主題“NosemaCeranae,Deformed Wing Virus,Sacbrood Virus”中2017—2020年核心程度高的論文(見表4),這些論文反映主題的中心研究問題,與主題內(nèi)的其他文章有較多的引文關(guān)系,并且對其自身而言大部分引文關(guān)系都發(fā)生在主題內(nèi),相對于其出版年份被引的次數(shù)也較高。在論文質(zhì)量評估方面,本文采用各論文的被引次數(shù)和FWCI值作為判斷論文學(xué)術(shù)影響力的依據(jù),但并不作為核心論文遴選指標(biāo)。因為被引次數(shù)受出版年份的影響,但本研究并不是遴選主題內(nèi)積累引用最多的論文,而是在內(nèi)容上是中心的,且反映較新發(fā)展方向的論文,作為較新的核心資源推薦給用戶。而FWCI值雖然消除了出版年份的偏差,但由于其是以同學(xué)科論文為基準進行計算,粒度比主題粗,也不適用。因此,該兩項指標(biāo)僅用于評估論文質(zhì)量。
表3 主題“NosemaCeranae, Deformed Wing Virus, Sacbrood Virus”主要來源期刊
圖3 愛思唯爾期刊查找工具查找相關(guān)期刊結(jié)果
表4 主題“NosemaCeranae, Deformed Wing Virus, Sacbrood Virus”核心論文
為了進一步驗證該方法和遴選結(jié)果,筆者針對遴選出的期刊開展了用戶需求分析,通過分析電子期刊使用統(tǒng)計數(shù)據(jù)和引文數(shù)據(jù)反映用戶對資源的需求程度,進而佐證遴選結(jié)果。以中國農(nóng)科院蜜蜂學(xué)的主要研究群體蜜蜂研究所為目標(biāo)用戶,分別統(tǒng)計其2019年各刊全文下載量,及其2017—2019年發(fā)文對各刊的引文量(見表5),可以看出,蜜蜂所對這些期刊都有一定程度的需求,尤其是對其中非OA刊的需求強烈。但下載量和引文量一定程度上僅反映用戶對能獲取資源的需求,因此僅是佐證用戶的現(xiàn)實需求,而遴選結(jié)果中還出現(xiàn)了該用戶未訂閱的資源,則是挖掘出了潛在的需求。因此,筆者還通過走訪蜜蜂所蜜蜂病蟲害生物學(xué)創(chuàng)新團隊,針對遴選出的期刊進行調(diào)研,征詢相關(guān)研究人員的意見,也獲得了正向的反饋。
表5 期刊遴選結(jié)果需求分析
本文以蜜蜂學(xué)為例,研究了基于主題組織和分析的科技文獻資源遴選方法,并且證明該方法能夠突破學(xué)科的限制精準地定位內(nèi)容相關(guān)期刊資源。在本文采用的研究方法中,主題組織、關(guān)鍵詞識別、資源匹配等環(huán)節(jié)都運用到了愛思唯爾指紋引擎技術(shù),該技術(shù)采用先進的自然語言處理技術(shù)并結(jié)合多領(lǐng)域的主題詞表應(yīng)用,使分析超越元數(shù)據(jù),能夠從語義層面挖掘出版物內(nèi)容間有價值的聯(lián)系,本文將其應(yīng)用于資源遴選,相對于傳統(tǒng)按學(xué)科組織資源的方法,按主題組織資源顆粒度更細,將在跨學(xué)科、交叉學(xué)科資源遴選的過程中發(fā)揮優(yōu)勢。
本文對于期刊查找工具的利用實現(xiàn)了通過語義匹配遴選期刊資源的目的。雖然可以將主題的特征內(nèi)容生成“指紋”與Scopus數(shù)據(jù)庫中大量的文摘進行匹配,但期刊推薦工具反饋的結(jié)果僅局限于愛思唯爾出版的期刊。本研究過程中也嘗試使用了其他出版社類似工具,如SpringerNature期刊推薦工具(Springer Nature Journal Suggester)和Wiley期刊推薦工具(Wiley Journal Finder)等,但這類期刊查找工具原是為作者尋找發(fā)表論文的期刊而設(shè)計,各工具算法不一、不同的工具匹配出不同出版社的期刊,無法對匹配結(jié)果進行統(tǒng)一比較。因此,可以考慮利用指紋引擎技術(shù)和文摘大數(shù)據(jù)開發(fā)獨立的期刊遴選應(yīng)用組件,對更大范圍更多來源的期刊資源進行匹配遴選。此外,通過這種方法遴選得到的期刊,也有待后續(xù)從資源利用效率和用戶反饋等方面進行進一步驗證,確保為該交叉學(xué)科需求的資源,針對資源遴選方法及其結(jié)果的評估開展更深入的研究,完善此方法的科學(xué)性。