任娟
從2012年開始,“大數(shù)據(jù)”這一概念逐漸在國內(nèi)學(xué)術(shù)界被廣泛地討論和引用。2012年7月,信息管理學(xué)者、阿里巴巴集團(tuán)副總裁徐子沛的著作《大數(shù)據(jù):正在到來的數(shù)據(jù)革命》引領(lǐng)了中國社會對大數(shù)據(jù)領(lǐng)域的關(guān)注,展開了業(yè)界對大數(shù)據(jù)戰(zhàn)略、數(shù)據(jù)治國和開放數(shù)據(jù)的討論[1]。近年來,大數(shù)據(jù)對各行各業(yè)正產(chǎn)生著巨大的影響,出版業(yè)也不例外,出版業(yè)的編輯、銷售、市場、組織設(shè)計(jì)等諸多環(huán)節(jié)和流程正受到大數(shù)據(jù)產(chǎn)生的直接或間接影響[2]。而從學(xué)科角度來看,大數(shù)據(jù)時代的出版學(xué)科研究也同樣面臨著更多的挑戰(zhàn)與機(jī)遇。在數(shù)據(jù)密集型科學(xué)研究范式這一新范式的產(chǎn)生背景下,出版學(xué)科的研究對象、研究內(nèi)容、研究方法由于本身學(xué)科的發(fā)展和外部環(huán)境變化的共同推動也處在不斷演化的過程中。我國出版學(xué)近五十年的發(fā)展歷史,形成了自己獨(dú)特的學(xué)科結(jié)構(gòu)。近幾年來,大數(shù)據(jù)的產(chǎn)生為出版學(xué)科的研究提供了創(chuàng)新的可能,有學(xué)者開始從理論上不同層面地對以數(shù)據(jù)驅(qū)動為典型特征的時代背景下出版領(lǐng)域的學(xué)科結(jié)構(gòu)、研究體系與新技術(shù)、新方法相結(jié)合進(jìn)行研究[3,4],但使用文獻(xiàn)計(jì)量學(xué)、知識圖譜等方法對出版領(lǐng)域的研究熱點(diǎn)、主題分布及其歷史演進(jìn)方面的研究還比較缺乏。
因此,建構(gòu)國內(nèi)出版領(lǐng)域的研究知識圖譜,探討其主要研究問題,幫助我國出版領(lǐng)域的研究者從宏觀層面對整體研究態(tài)勢進(jìn)行明晰的把握,具有一定的理論價(jià)值與現(xiàn)實(shí)意義。本文擬借助文獻(xiàn)計(jì)量學(xué)的工具和方法對近十年的出版領(lǐng)域和大數(shù)據(jù)領(lǐng)域的研究狀況進(jìn)行分析,并在此基礎(chǔ)上將出版領(lǐng)域與大數(shù)據(jù)主題進(jìn)行結(jié)合分析,探析大數(shù)據(jù)時代出版領(lǐng)域的研究趨向。
本文以中國知網(wǎng)(CNKI)的CSSCI來源(含擴(kuò)展版)期刊為數(shù)據(jù)源,選擇的時間范圍為2008年1 月1 日至2017年12 月31日。按照分類檢索策略,選擇“信息科技”類下的“出版”進(jìn)行檢索以獲取該類下的文獻(xiàn);按照主題檢索策略,以“大數(shù)據(jù)”為關(guān)鍵詞獲取大數(shù)據(jù)研究領(lǐng)域近十年的文獻(xiàn);按照分類與主題組合檢索策略,在“出版”類中以“大數(shù)據(jù)”為關(guān)鍵詞以獲取該方向近十年的文獻(xiàn)。
圖1—圖5分別顯示了2008年至2017年中國知網(wǎng)中“出版”類別、“出版”類別中的三個分支“編、印、發(fā)工作”(即“編輯工作”“印刷工作”“發(fā)行工作”)、“大數(shù)據(jù)”主題、“出版”類別下的“大數(shù)據(jù)”主題(后文簡稱為“出版中的大數(shù)據(jù)”)以及“編、印、發(fā)工作”類別下的“大數(shù)據(jù)”主題研究論文發(fā)表的時間趨勢分布。
圖1 “出版”類論文發(fā)表年度趨勢
圖2 “編、印、發(fā)工作”論文發(fā)表年度趨勢
圖3 “大數(shù)據(jù)”主題的論文發(fā)表年度趨勢
圖4 “出版中的大數(shù)據(jù)”論文發(fā)表年度趨勢
圖5 “編、印、發(fā)工作”類下的“大數(shù)據(jù)”主題論文發(fā)表年度趨勢
在“出版”類別下,2008—2017年這十年間總共發(fā)表論文33 234篇,年均學(xué)術(shù)論文發(fā)表數(shù)量為3 323.4篇,呈現(xiàn)出一種年發(fā)文量相對穩(wěn)定的態(tài)勢。 “編、印、發(fā)工作”三個分支,在過去十年間共發(fā)文12 568篇,占到“出版”類論文發(fā)表量的37.8%左右?!按髷?shù)據(jù)”是從2012年在學(xué)術(shù)領(lǐng)域迅速發(fā)展起來的一個研究熱點(diǎn),通過在中國知網(wǎng)中CSSCI來源(含擴(kuò)展版)期刊中對“大數(shù)據(jù)”進(jìn)行主題檢索發(fā)現(xiàn),過去十年共發(fā)表6 584篇論文。第一篇論文發(fā)表在2010年《現(xiàn)代圖書情報(bào)技術(shù)》期刊上,題為《搭建基于云計(jì)算的開源海量數(shù)據(jù)挖掘平臺》。2013年至今,大數(shù)據(jù)研究的論文數(shù)量呈急劇增長態(tài)勢,2017年的發(fā)文量已經(jīng)接近2 000篇?!俺霭嬷械拇髷?shù)據(jù)”研究始于2013 年。2013年共發(fā)表了21 篇相關(guān)論文。2013—2017年這五年中,相關(guān)研究成果增長快速,截至2017年12月31日,共發(fā)表403篇論文。“編、印、發(fā)工作”類別下的“大數(shù)據(jù)”主題研究也始于2013 年。2013年共發(fā)表5 篇相關(guān)論文。這5篇論文均出現(xiàn)“大數(shù)據(jù)時代”關(guān)鍵詞,分別發(fā)表在《出版發(fā)行研究》和《編輯學(xué)刊》期刊上,體現(xiàn)了編輯出版學(xué)科領(lǐng)域的研究者開始對大數(shù)據(jù)研究的關(guān)注。2013—2017年這五年中,該類別下對“大數(shù)據(jù)”主題的研究逐步發(fā)展,截止到2017年12月31日共發(fā)表103篇論文。
科學(xué)基金資助的水平和強(qiáng)度,在某種程度上反映了現(xiàn)有研究水平和未來研究發(fā)展的方向。國家社會科學(xué)基金、國家自然科學(xué)基金和國家科技支撐計(jì)劃資助均屬于國家級別且有著不同的研究目標(biāo)。其中,國家社會科學(xué)基金和國家自然科學(xué)基金主要是以某一領(lǐng)域科學(xué)發(fā)展的基礎(chǔ)問題,探索客觀世界的普遍規(guī)律為研究目標(biāo);而國家科技支撐計(jì)劃是以解決某一重大的技術(shù)問題,并能夠產(chǎn)生較大的社會經(jīng)濟(jì)效益為目標(biāo)??紤]到中國知網(wǎng)中論文的基金資助級別和來源的影響力,本文在“出版”“編、印、發(fā)工作”“大數(shù)據(jù)”“出版中的大數(shù)據(jù)”這四類研究中分別篩選出受國家社會科學(xué)基金、國家自然科學(xué)基金和國家科技支撐計(jì)劃資助的發(fā)文量進(jìn)行分析(見表1)。分析結(jié)果顯示:國家社會科學(xué)基金是資助這四類研究成果發(fā)表的主要機(jī)構(gòu),對應(yīng)類別的發(fā)文量占比分別為3.44%、2.20%、16.19%和6.95%;國家自然科學(xué)基金和國家科技支撐計(jì)劃對“出版”“編、印、發(fā)工作”和“出版中的大數(shù)據(jù)”這三類研究的資助比例均低于1%;“大數(shù)據(jù)”研究成果受上述三類國家級基金資助的比例最高。
表1 “出版”“編、印、發(fā)工作”“大數(shù)據(jù)”“出版中的大數(shù)據(jù)”四類研究的基金資助分布
為進(jìn)一步對有代表性的文獻(xiàn)進(jìn)行分析,本文在“出版”類別下2008—2017年間發(fā)表的33 234篇論文基礎(chǔ)上,選取“2017—2018年度CSSCI來源期刊目錄”中“新聞與傳播”類15種期刊(即《編輯學(xué)報(bào)》《編輯之友》《出版發(fā)行研究》《出版科學(xué)》《當(dāng)代傳播》《國際新聞界》《科技與出版》《現(xiàn)代傳播(中國傳媒大學(xué)學(xué)報(bào))》《現(xiàn)代出版》《新聞大學(xué)》《新聞記者》《新聞界》《新聞與傳播研究》《中國出版》《中國科技期刊研究》,以下簡稱“15種核心期刊”)為被引文獻(xiàn)來源進(jìn)行高被引文獻(xiàn)的檢索。15種核心期刊2008—2017年總發(fā)文量為21 660篇(見表2)。
表2 “出版”類別下15種核心期刊2008—2017年發(fā)文量分布情況
首先,根據(jù)普賴斯定律確定高被引文獻(xiàn)的方法[5],被引頻次以上的文獻(xiàn)為高被引文獻(xiàn),其中,ηmax為最高被引頻次。根據(jù)所分析的文獻(xiàn)計(jì)算得出N=11.31,即被引頻次≥12次的文獻(xiàn)為高被引文獻(xiàn)。然后根據(jù)檢索策略,結(jié)果得出中國知網(wǎng)中15種核心期刊中高被引文獻(xiàn)共有1 748篇,占“出版”類總發(fā)文量的5.26%。表3分別列出了“出版”“編、印、發(fā)工作”“大數(shù)據(jù)”“出版中的大數(shù)據(jù)”四類研究的高被引論文中發(fā)文量排名top20的來源期刊。其中,“出版”“編、印、發(fā)工作”和“出版中的大數(shù)據(jù)”三類研究的高被引論文的來源分布比較一致,主要集中在《編輯學(xué)報(bào)》《中國科技期刊研究》《出版發(fā)行研究》《科技與出版》《中國出版》《編輯之友》《出版科學(xué)》《中國編輯》《現(xiàn)代出版》等出版類期刊上。而“大數(shù)據(jù)”研究的高被引論文的來源分布相對分散,主要分布在圖書情報(bào)類、新聞與傳播類、經(jīng)濟(jì)管理類等期刊上。
表3 “出版”“編、印、發(fā)工作”“大數(shù)據(jù)”“出版中的大數(shù)據(jù)”高被引論文中發(fā)文量top20的來源期刊
本文利用CiteSpace軟件對“出版”研究的關(guān)鍵詞進(jìn)行詞頻統(tǒng)計(jì)、共現(xiàn)分析和聚類分析,初步歸納出近十年來“出版”科學(xué)研究中的熱點(diǎn)和研究現(xiàn)狀。其中,“出版”研究的關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò)如圖6所示,被引次數(shù)top200論文與被下載次數(shù)top200論文的關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò)如圖7、圖8所示?!俺霭妗毖芯康母哳l關(guān)鍵詞如表4所示。通過分析發(fā)現(xiàn),目前我國出版領(lǐng)域的研究方向主要集中在數(shù)字出版、科技期刊和學(xué)術(shù)期刊、出版業(yè)、著作權(quán)與版權(quán)、編輯工作、選題策劃等。
圖6 “出版”研究的關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò)圖
圖7 “出版”研究的被引次數(shù)top200論文關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò)圖
圖8 “出版”研究的被下載次數(shù)top200論文關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò)圖
其中,針對科技期刊和學(xué)術(shù)期刊以及數(shù)字出版的研究在“出版”類研究中所占比重較高,研究內(nèi)容主要包括科技期刊和學(xué)術(shù)期刊從傳統(tǒng)出版向數(shù)字出版轉(zhuǎn)型發(fā)展的對策、影響力提升路徑及評價(jià)體系等,以及不同類型的期刊在移動互聯(lián)網(wǎng)時代如何利用新媒體平臺創(chuàng)新編輯加工流程、出版?zhèn)鞑シ绞郊斑\(yùn)營和服務(wù)模式等。表4所列的高頻關(guān)鍵詞中,排在前三位的“科技期刊”“數(shù)字出版”“學(xué)術(shù)期刊”的詞頻分別為1 780、1 044、959,占“出版”類研究的5.36%、3.14%、2.89%;接下來只有“編輯”和“出版”的詞頻占比超過1%。關(guān)鍵詞詞頻占比較高,表明這些領(lǐng)域或方向是“出版”類研究的重點(diǎn),研究成果較多。由于“出版”類研究的理論性、思辨性特色明顯,規(guī)范研究多于實(shí)證研究,目前,結(jié)合大數(shù)據(jù)等方法層面的應(yīng)用研究相對較少。
表4 “出版”研究的高頻關(guān)鍵詞
從整體而言,“出版”類研究的主題呈多元化趨勢。數(shù)字出版、電子書、內(nèi)容資源管理、自媒體出版、媒介融合、著作權(quán)及版權(quán)保護(hù)等都與大數(shù)據(jù)有著緊密的聯(lián)系,伴隨著大數(shù)據(jù)技術(shù)和應(yīng)用的快速發(fā)展,大數(shù)據(jù)對出版業(yè)產(chǎn)生的影響將日益凸顯,會逐漸形成一些研究熱點(diǎn)方向。
“編、印、發(fā)工作”研究的關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò)如圖9所示,被引次數(shù)top200論文與被下載次數(shù)top200論文的關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò)如圖10、圖11所示?!熬帯⒂?、發(fā)工作”研究的高頻關(guān)鍵詞如表5所示。通過分析發(fā)現(xiàn),目前我國“編、印、發(fā)工作”類研究的主要方向與“出版”類研究基本一致,仍然集中在科技期刊和學(xué)術(shù)期刊及數(shù)字出版,此類研究側(cè)重編輯方面的研究。表5的高頻關(guān)鍵詞中,排在前三位的“科技期刊”“學(xué)術(shù)期刊”“編輯”的詞頻分別為1 286、688、430。 從“編輯工作”“印刷工作”“發(fā)行工作”三個分支來看,“編、印、發(fā)工作”研究的核心“編輯工作”,特別是與編輯工作緊密相關(guān)的選題策劃及創(chuàng)新等是研究熱點(diǎn)問題,針對“發(fā)行工作”也有所研究,“印刷工作”則幾乎沒有涉及。此外,高校學(xué)報(bào)是此類研究中相對獨(dú)立的熱點(diǎn)研究方向之一。
圖9 “編、印、發(fā)工作”研究的關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò)
圖10 “編、印、發(fā)工作”研究的被引次數(shù)top200論文關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò)
圖11 “編、印、發(fā)工作”研究的被下載次數(shù)top200論文關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò)
表5 “編、印、發(fā)工作”研究的高頻關(guān)鍵詞
“大數(shù)據(jù)”研究的關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò)如圖12所示,被引次數(shù)top200論文與被下載次數(shù)top200論文的關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò)如圖13、圖14所示?!按髷?shù)據(jù)”研究的高頻關(guān)鍵詞如表6所示。通過分析發(fā)現(xiàn), 目前我國研究“大數(shù)據(jù)”的幾個主要方面是:與大數(shù)據(jù)相關(guān)的互聯(lián)網(wǎng)經(jīng)濟(jì)、智慧城市、電子政務(wù)、圖書館知識服務(wù)研究;數(shù)據(jù)挖掘、云計(jì)算、學(xué)習(xí)分析、可視化等大數(shù)據(jù)技術(shù)研究;大數(shù)據(jù)信任研究;大數(shù)據(jù)崗位研究;等等。新聞傳播領(lǐng)域的學(xué)者將大數(shù)據(jù)與新聞生產(chǎn)有機(jī)結(jié)合進(jìn)行研究,使得社交網(wǎng)絡(luò)、數(shù)據(jù)新聞等新的傳播學(xué)領(lǐng)域研究方向迅速發(fā)展。在高被引top200論文中,側(cè)重對數(shù)據(jù)挖掘、數(shù)據(jù)技術(shù)等方法的研究,以及結(jié)合用戶需求的互聯(lián)網(wǎng)經(jīng)濟(jì)下的服務(wù)模式創(chuàng)新等研究;在高下載top200論文中,研究熱點(diǎn)在關(guān)注大數(shù)據(jù)技術(shù)的同時,也突出了大數(shù)據(jù)與傳播學(xué)領(lǐng)域的交叉研究,如大數(shù)據(jù)背景下的新聞生產(chǎn)、社交網(wǎng)絡(luò)等。表6的高頻關(guān)鍵詞中,排在前三位的“大數(shù)據(jù)”“大數(shù)據(jù)審計(jì)”“大數(shù)據(jù)崗位”的詞頻分別為2 502、279、160。其他高頻詞體現(xiàn)了大數(shù)據(jù)與政務(wù)、圖書館、傳播、教育等不同領(lǐng)域和機(jī)構(gòu)的融合研究特色,反映了大數(shù)據(jù)對各行各業(yè)正在產(chǎn)生著巨大的影響。
圖12 “大數(shù)據(jù)”研究的關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò)
圖13 “大數(shù)據(jù)”研究的被引次數(shù)top200論文關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò)
圖14 “大數(shù)據(jù)”研究的下載次數(shù)top200論文關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò)
表6 “大數(shù)據(jù)”研究的高頻關(guān)鍵詞
“出版中的大數(shù)據(jù)”研究的關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò)如圖15所示,被引次數(shù)top200論文與被下載次數(shù)top200論文的關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò)如圖16、圖17所示?!俺霭嬷械拇髷?shù)據(jù)”研究的高頻關(guān)鍵詞如表7所示。通過分析發(fā)現(xiàn),目前我國研究“出版中的大數(shù)據(jù)”的幾個主要方面是:與大數(shù)據(jù)相關(guān)的出版業(yè)融合發(fā)展、知識服務(wù)、選題策劃、轉(zhuǎn)型升級研究;出版社結(jié)合大數(shù)據(jù)進(jìn)行的按需出版研究;與大數(shù)據(jù)相關(guān)的數(shù)字出版、編輯活動研究;互聯(lián)網(wǎng)與大數(shù)據(jù)的融合研究;大數(shù)據(jù)素養(yǎng)研究;等等。在高被引和高下載論文中,側(cè)重研究大數(shù)據(jù)時代下的傳統(tǒng)出版業(yè)如何利用大數(shù)據(jù)、新媒體、物聯(lián)網(wǎng)等新興技術(shù)進(jìn)行精準(zhǔn)營銷、出版發(fā)行,以及大數(shù)據(jù)時代下的出版模式、出版內(nèi)容、版權(quán)保護(hù)等熱點(diǎn)問題。表7“出版中的大數(shù)據(jù)”研究的高頻關(guān)鍵詞中,排在前三位的“大數(shù)據(jù)”“數(shù)字出版”“大數(shù)據(jù)素養(yǎng)”的詞頻分別為149、35、24。整體上而言,“出版中的大數(shù)據(jù)”研究形成了多個分支和熱點(diǎn),如與大數(shù)據(jù)關(guān)系緊密的知識服務(wù)、按需出版、精準(zhǔn)營銷、人工智能等都是近幾年和未來研究的重點(diǎn)。
圖15 “出版中的大數(shù)據(jù)”研究的關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò)
圖16 “出版中的大數(shù)據(jù)”研究的被引次數(shù)top200論文關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò)
圖17 “出版中的大數(shù)據(jù)”研究的下載次數(shù)top200論文關(guān)鍵詞共現(xiàn)聚類網(wǎng)絡(luò)
表7 “出版中的大數(shù)據(jù)”研究的高頻關(guān)鍵詞
通過對2008—2017年這十年來“出版”“編、印、發(fā)工作”“大數(shù)據(jù)”以及“出版中的大數(shù)據(jù)”等四類研究的總體研究狀況和研究熱點(diǎn)進(jìn)行分析,發(fā)現(xiàn)隨著大數(shù)據(jù)的發(fā)展,出版領(lǐng)域的研究與大數(shù)據(jù)的結(jié)合日益緊密,運(yùn)用大數(shù)據(jù)技術(shù)解決出版領(lǐng)域的應(yīng)用問題,將是未來該領(lǐng)域研究的創(chuàng)新發(fā)展方向。
[1]徐子沛.大數(shù)據(jù):正在到來的數(shù)據(jù)革命[M].桂林:廣西師范大學(xué)出版社,2012.
[2]馬克· J.H.弗雷茨,柏雯,曹子郁,等.大數(shù)據(jù)出版[J].出版科學(xué),2017(1):1-5.
[3]王鵬濤.讀者學(xué)研究重啟的必要與可能[J].現(xiàn)代出版,2013(1):11-15.
[4]楊曉新.數(shù)據(jù)科學(xué)視域下的出版學(xué)研究方法[J].出版科學(xué),2017(6):46-50.
[5]馬費(fèi)成,胡翠華,陳亮.信息管理學(xué)基礎(chǔ)[M].武漢:武漢大學(xué)出版社,2002:83-90.