■任艷青 王雪峰 翁彥琴
1)中國科學(xué)院文獻(xiàn)情報中心,北京市海淀區(qū)北四環(huán)西路33號 1001902)中國科學(xué)院物理研究所《物理學(xué)報》編輯部,北京市海淀區(qū)中關(guān)村南三街8號 1001903)中國科學(xué)院大學(xué)圖書情報與檔案管理系,北京市海淀區(qū)北四環(huán)西路33號 100190
科技期刊的數(shù)字出版促進(jìn)了科技期刊的內(nèi)容生產(chǎn)、管理過程和產(chǎn)品形態(tài)的數(shù)字化[1]。數(shù)字化的信息隱含了豐富的情報,期刊的出版者可以借助數(shù)據(jù)的分析優(yōu)化期刊的辦刊方向,反饋于辦刊的決策過程中,使期刊出版和管理成為閉環(huán),促進(jìn)期刊質(zhì)量和影響力的提高。
科技期刊采編、生產(chǎn)、出版、引用等環(huán)節(jié)的數(shù)字化過程中產(chǎn)生了大量數(shù)據(jù)信息,不僅包括顯現(xiàn)形式存在的論文標(biāo)題、作者、作者單位、摘要、關(guān)鍵詞等題錄信息,還包括期刊的評審周期、發(fā)表周期、引用數(shù)據(jù)等隱含信息??萍计诳F(xiàn)有的大數(shù)據(jù)研究主要集中于如何在“互聯(lián)網(wǎng)+”時代利用出版和引用的數(shù)據(jù)進(jìn)行選題策劃和組約稿件[2-5],例如國家海洋信息中心的李雪等[5]采用文獻(xiàn)計量學(xué)的分析方法,對學(xué)科期刊數(shù)據(jù)資源進(jìn)行挖掘、整合和分析,從學(xué)科科研熱點、前沿趨勢、地區(qū)優(yōu)勢、機構(gòu)合作、作者遴選、專題策劃等方面獲取學(xué)科出版的潛在信息,而期刊出版者可從中獲得學(xué)科情報信息,為辦刊提供參考。中國科學(xué)技術(shù)信息研究所的車堯等[6]利用Visual Basic宏語言(Visual Basic for Applications,VBA) 程序并借助Excel 進(jìn)行可視化操作,對《情報學(xué)報》刊載文獻(xiàn)的題目、作者、關(guān)鍵詞、作者單位等題錄信息進(jìn)行自動抽取和分析,獲取核心主題集群、核心作者、核心機構(gòu)等相關(guān)信息。中國知網(wǎng)借助自身平臺融合了8000多種學(xué)術(shù)期刊和中國博士學(xué)位論文全文數(shù)據(jù)庫、中國優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫、中國重要會議論文全文數(shù)據(jù)庫的引文數(shù)據(jù),運用文獻(xiàn)計量學(xué)方法,從發(fā)文情況、被引頻次、下載量等維度對作者、讀者、機構(gòu)等辦刊要素進(jìn)行統(tǒng)計,定量分析期刊的各項指標(biāo),形成基于大數(shù)據(jù)的期刊深度分析報告。高申等[7]介紹了中國知網(wǎng)的相關(guān)數(shù)據(jù)在科技期刊選題策劃中的應(yīng)用。以上文獻(xiàn)分析的數(shù)據(jù)主要是期刊的引證數(shù)據(jù)或者發(fā)表數(shù)據(jù),而采編和策劃過程中產(chǎn)生了豐富的組稿數(shù)據(jù)、評審數(shù)據(jù)等,若能實現(xiàn)與發(fā)文和引證數(shù)據(jù)的互聯(lián)互通,將會有更多隱含信息被挖掘出來。龍靜等[8]通過對期刊的投稿量、錄用率、審稿周期、編輯加工周期、稿件存量等進(jìn)行挖掘分析,探討了縮短科技期刊論文發(fā)表周期的方法,其中借助了部分期刊采編數(shù)據(jù),但僅討論了縮短期刊發(fā)表周期的問題。本研究提出將采編、生產(chǎn)、發(fā)表、引證等方面的數(shù)據(jù)關(guān)聯(lián)起來,進(jìn)行深度挖掘,從而為優(yōu)化期刊的收稿方向、合理設(shè)置期刊的發(fā)表周期、有計劃地組織和策劃???專題、挖掘核心作者和核心機構(gòu)進(jìn)行宣傳推廣等提供數(shù)據(jù)支撐,讓這些源于期刊的數(shù)據(jù)為期刊決策和加強期刊管理服務(wù)。
對于期刊生產(chǎn)、發(fā)表和引證數(shù)據(jù)的獲取和分析在已有研究中陳述較多,本研究重點介紹采編系統(tǒng)數(shù)據(jù)的獲取和分析方法。目前國內(nèi)外成熟的采編系統(tǒng)較多,文獻(xiàn)[9-10]對現(xiàn)有的期刊稿件采編系統(tǒng)進(jìn)行了詳細(xì)的介紹和比較,不同采編系統(tǒng)的數(shù)據(jù)相差不多,主要是數(shù)據(jù)標(biāo)簽的表達(dá)形式不同。
采編系統(tǒng)實現(xiàn)了在線投稿和審稿,實時記錄了稿件從投稿到錄用或退稿的全過程,基本實現(xiàn)了采編環(huán)節(jié)的數(shù)字化和結(jié)構(gòu)化,對于發(fā)布平臺和采編平臺融合度較高的期刊來說,期刊生產(chǎn)環(huán)節(jié)的很多因素也可以記錄在采編系統(tǒng)中,為分析期刊的收發(fā)稿件和評審情況提供詳實的數(shù)據(jù)支撐。
具體來講,分析的數(shù)據(jù)主要包括期刊稿件的收取、發(fā)表和評審情況三個方面。
(1) 稿件收取情況:統(tǒng)計周期內(nèi)收稿量、收稿的學(xué)科方向、文章類型、作者的職稱與研究機構(gòu)等相關(guān)信息。
(2) 稿件發(fā)表情況:發(fā)表稿件數(shù)量、發(fā)表周期(從錄用到發(fā)表的周期)、發(fā)表稿件的學(xué)科方向、文章類型、收發(fā)稿件作者的職稱與研究機構(gòu)等相關(guān)信息。
(3) 稿件評審情況:每年/月的收稿量、稿件的送審率、稿件審理專家人數(shù)、錄用稿件量、錄用率、錄用稿件/退稿稿件以及全部稿件的評審周期,評審周期又可分為第一輪意見的評審周期和最終意見的評審周期。可對比研究各學(xué)科方向的評審周期,也可對每位責(zé)任編委或責(zé)任編輯負(fù)責(zé)稿件的評審周期及錄用率進(jìn)行橫向比較。
因筆者曾經(jīng)工作的期刊采用ScholarOne Manuscript評審系統(tǒng),故本研究以ScholarOne Manuscript評審系統(tǒng)為例,匯總評審系統(tǒng)中可以獲得的數(shù)據(jù)標(biāo)簽以及其反映的數(shù)據(jù)含義,如表1所示。
ScholarOne Manuscript主要是投稿和審稿管理,結(jié)合期刊發(fā)表相關(guān)的數(shù)據(jù),可對期刊的發(fā)稿情況進(jìn)行統(tǒng)計,最常用的關(guān)于發(fā)表的相關(guān)數(shù)據(jù)如表2所示。
表1 ScholarOne Manuscript采編系統(tǒng)中獲得的數(shù)據(jù)標(biāo)簽及其含義
表2 期刊發(fā)表的相關(guān)數(shù)據(jù)統(tǒng)計方法
期刊稿件的收取、發(fā)表和評審等相關(guān)數(shù)據(jù)可以從采編系統(tǒng)中制定的報表獲得,保存為Excel格式,進(jìn)行深入分析和加工,在處理過程中,使用較多的功能和函數(shù)為數(shù)據(jù)透視表、Vlookup函數(shù)和Dateif函數(shù)。
(1) 數(shù)據(jù)透視表可以對基礎(chǔ)數(shù)據(jù)進(jìn)行分組和歸類,若需要統(tǒng)計每月的投稿量和統(tǒng)計數(shù)據(jù)時稿件的評審狀態(tài),可將“(zh)投稿月份(數(shù)字形式)”設(shè)置為行標(biāo)簽,將“(zh)稿件 ID”和“(zh)稿件狀態(tài)”設(shè)置為列標(biāo)簽,對其中的數(shù)據(jù)進(jìn)行計數(shù)求和。
(2) 當(dāng)不同的數(shù)據(jù)保存在多個統(tǒng)計表格中時,使用Vlookup函數(shù)進(jìn)行匹配查找,可實現(xiàn)期望數(shù)據(jù)的調(diào)用,若在發(fā)表數(shù)據(jù)的統(tǒng)計表格中,希望調(diào)用相應(yīng)稿件的評審數(shù)據(jù),可通過“(zh)稿件 ID”利用Vlookup函數(shù)進(jìn)行查找匹配。
(3) 在期刊相關(guān)的數(shù)據(jù)統(tǒng)計中涉及到很多周期的計算與統(tǒng)計,例如得到首輪評審意見的周期、得到最終評審意見的周期、從投稿到發(fā)表的周期、從錄用到發(fā)表的周期等,需要計算從某一日期到另一日期之間的天數(shù),除了評審系統(tǒng)提供相關(guān)數(shù)據(jù)標(biāo)簽外,還可以使用Dateif函數(shù)實現(xiàn),例如從投稿到發(fā)表的周期即可通過Dateif函數(shù)(發(fā)表日期,投稿日期,"D")計算得到。
以上Excel操作方法和函數(shù)簡單易學(xué),適合非計算機專業(yè)或者文獻(xiàn)情報分析專業(yè)的編輯對數(shù)據(jù)進(jìn)行分析。
期刊數(shù)據(jù)分析的學(xué)術(shù)價值在于通過數(shù)據(jù)分析為優(yōu)化期刊的收稿方向、合理安排期刊的發(fā)表節(jié)奏、提高同行評議的效率、有針對性地宣傳期刊等提供數(shù)據(jù)支撐。
在收發(fā)稿件數(shù)據(jù)中,通過設(shè)置投稿標(biāo)簽或者在同行評議過程中設(shè)置專業(yè)副主編(Subject Editor)來確定稿件的研究方向?!蹲詣踊瘜W(xué)報》首先通過自動化的五個二級學(xué)科(控制理論與控制工程、模式識別與智能系統(tǒng)、檢測技術(shù)與自動化裝置、系統(tǒng)工程和導(dǎo)航制導(dǎo)與控制)匹配相應(yīng)責(zé)任主編,粗略地對研究方向進(jìn)行分類,再進(jìn)一步通過處理的編委確認(rèn)該研究的小學(xué)科方向(例如,對于模式識別來講,其包含的子學(xué)科有語音識別、自然語言處理、圖像處理等),獲得了這些研究方向分類之后,與期刊的收稿范圍進(jìn)行比對,判斷目前收發(fā)稿件的趨勢與學(xué)科的大發(fā)展趨勢是否吻合,采取一定措施,對稿件的研究方向進(jìn)行優(yōu)化調(diào)整。若某一新興或者熱點學(xué)科的投稿量較少,可以組織相應(yīng)方向的??蛯n}來吸引這一研究方向的投稿量,促進(jìn)該方向的學(xué)科發(fā)展;若某一學(xué)科相對比較成熟,發(fā)表稿件區(qū)別度不大,可以適當(dāng)收緊該方向的評審力度,減少該方向稿件的發(fā)表,讓有限的出版資源發(fā)揮最大效用。
在期刊流程管理中,尤其是錄用后稿件的管理中,編輯部應(yīng)盡量壓縮發(fā)表周期。另外,??寮慕M織與發(fā)表一般會延長自由投稿的發(fā)表周期,導(dǎo)致積壓的稿件數(shù)量增加。為了緩解相應(yīng)壓力,需要合理安排發(fā)表節(jié)奏,文獻(xiàn)[8]通過分析期刊每月的收稿量和發(fā)稿量,結(jié)合當(dāng)前錄退比的變化趨勢,對錄退比進(jìn)行合理調(diào)控。筆者根據(jù)多年期刊管理經(jīng)驗,給出??M織頻次的計算公式,以合理地統(tǒng)籌稿件發(fā)表力度:若單月錄用稿件量>單月收稿量×平均錄退比+(當(dāng)年策劃組織??跀?shù)×平均每月發(fā)表文章篇數(shù))/期刊年發(fā)表期數(shù),則加大發(fā)表力度來消化積壓稿件,或者降低錄退比來減少錄用稿件;若單月錄用稿件量<單月收稿量×平均錄退比+(當(dāng)年策劃組織??跀?shù)×平均每月發(fā)表文章篇數(shù))/期刊年發(fā)表期數(shù),此時待發(fā)表稿件量較少,則需要更多地策劃專刊和專題,提高稿件的錄退比,達(dá)到一種平衡,以促使期刊整體穩(wěn)定健康運行。
評審專家是科技期刊學(xué)術(shù)質(zhì)量的維護(hù)者和論文命運的主要主宰者,專家數(shù)據(jù)庫是科技期刊的重要資源之一。專家?guī)斓膭討B(tài)管理尤為重要,基于期刊采編系統(tǒng)的評審數(shù)據(jù),可以對期刊的專家數(shù)據(jù)庫及同行評議的過程進(jìn)行全面的分析和把握,例如所有稿件的評審周期、第一輪稿件的評審天數(shù)、每篇稿件送審專家人數(shù)、每年參加評審的專家人數(shù)、專家數(shù)據(jù)庫的結(jié)構(gòu)等,這些數(shù)據(jù)還可以對人員的績效考評、編委會的組織規(guī)模、哪些方向需要增選編委等辦刊中的具體問題提供思路。
(1) 分析專家數(shù)據(jù)庫的組成。詳細(xì)分析近幾年為期刊評審稿件的專家信息,包括職稱、機構(gòu)、學(xué)科甚至地域等,對于某些熱點或者新興學(xué)科專家人數(shù)較少或者機構(gòu)過于集中的情況,有針對性、有目的地補充專家信息。尤其對于送審比較困難的交叉學(xué)科,其專家數(shù)據(jù)庫的組建可以作為著重強化和努力的方向。
(2) 縱向比較稿件的評審周期,觀察其逐年變化趨勢,同時橫向比較不同學(xué)科方向的評審周期,對于評審周期持續(xù)較長的學(xué)科,可以著重補充該方向的專家,鼓勵該方向編委推薦評審專家,緩解專家的評審壓力,提高評審效率。
同時,編輯部需要不斷提升對評審專家和編委們的服務(wù),以提高專家對于期刊的歸屬感和認(rèn)可度,提高他們參與論文評審的熱情,尤其對于編委負(fù)責(zé)制的科技期刊來講,做好對編委的服務(wù)是重中之重[11]?!蹲詣踊瘜W(xué)報》實行編委負(fù)責(zé)制,在主辦單位和主編的指導(dǎo)下,建立了基于數(shù)據(jù)的績效考評和編委會動態(tài)調(diào)整的工作機制。辦刊過程中,除了定性的規(guī)章制度,如編委會工作條例等明確編委的權(quán)責(zé)之外,還采取一定的獎勵措施認(rèn)可編委的付出與努力,以提高編委的工作積極性,例如設(shè)立“優(yōu)秀編委獎”,對審稿時間短、質(zhì)量高且對期刊關(guān)注度高的編委進(jìn)行激勵。同時,編委會實行動態(tài)化調(diào)整,每兩年進(jìn)行編委會換屆。這些調(diào)整也要依據(jù)大量的數(shù)據(jù)分析,分析的主要指標(biāo)有:編委參與送審的稿件數(shù)量、編委初審的周期、篇均送審的專家數(shù)量、稿件的錄退比、第一輪的評審周期、從投稿到給出最終處理意見的周期等稿件評審的具體情況,同時鼓勵編委組織策劃???專題、自己撰寫或者約請優(yōu)秀綜述稿件、在參加國內(nèi)外會議時對期刊進(jìn)行宣傳等,這些都可以作為編委年度績效考核指標(biāo),為評選工作和換屆工作提供數(shù)據(jù)支撐。
投稿作者是期刊讀者群的重要組成部分之一,投稿作者相對比較集中的機構(gòu),通常對該期刊的認(rèn)可度比較高,通過采編系統(tǒng)的投稿數(shù)據(jù),挖掘核心機構(gòu)和作者,對于期刊的宣傳推廣工作有一定的積極意義。文獻(xiàn)[12]提到了核心讀者的概念,其文獻(xiàn)計量學(xué)公式為[13]
M=0.749Nmax
(1)
式中:M為發(fā)表的論文篇數(shù);Nmax為所統(tǒng)計年限內(nèi)發(fā)表文章最多的作者的論文數(shù)。只有那些發(fā)表論文數(shù)在M篇以上的作者,方能稱為核心作者。
筆者認(rèn)為投稿量較大、發(fā)文量較多的機構(gòu)均屬于期刊的核心機構(gòu)。明確了期刊的核心機構(gòu)和核心作者群,有針對性、有目的地進(jìn)行宣傳推廣,有利于逐步擴大期刊的學(xué)術(shù)影響力。
通過對采編系統(tǒng)的數(shù)據(jù)進(jìn)行深入分析,深度挖掘數(shù)據(jù)映射出的實際問題,為優(yōu)化期刊的收稿方向、合理地統(tǒng)籌安排刊期與??M織頻次、提高期刊同行評議的效率等提供數(shù)據(jù)支撐,并且有利于挖掘核心作者與機構(gòu),有目標(biāo)、有針對性地做好期刊的宣傳推廣工作,做好精準(zhǔn)推送。
期刊的數(shù)據(jù)分布在期刊的整個生態(tài)鏈中,從策劃采編到同行評議、從出版到傳播再到引用、促進(jìn)相關(guān)內(nèi)容的再研究等均涉及到數(shù)據(jù),而且是關(guān)于作者、讀者、審者、機構(gòu)等維度的數(shù)據(jù)。將相關(guān)數(shù)據(jù)打通,實現(xiàn)互聯(lián)互通,有助于為期刊政策的制定提供數(shù)據(jù)支撐,將憑經(jīng)驗辦刊逐步轉(zhuǎn)向借助數(shù)據(jù)分析的引導(dǎo)性辦刊,有利于進(jìn)一步提升期刊的學(xué)術(shù)質(zhì)量和影響力。