陳麗煙
(福建對外經(jīng)濟貿(mào)易職業(yè)技術(shù)學(xué)院 信息技術(shù)系,福建 福州 350016)
?
國內(nèi)競爭情報研究進展的統(tǒng)計分析及關(guān)鍵詞可視化
陳麗煙
(福建對外經(jīng)濟貿(mào)易職業(yè)技術(shù)學(xué)院信息技術(shù)系,福建福州350016)
以CNKI收錄類別為CSSCI來源期刊為范圍,收集2005—2014十年內(nèi)競爭情報研究文獻的題錄信息,從統(tǒng)計學(xué)和可視化兩個視角進行了系統(tǒng)綜合分析。首先運用傳統(tǒng)的統(tǒng)計分析方法,從作者發(fā)文量、被引頻次和作者合作度等三個方面客觀分析了近十年來我國競爭情報研究的現(xiàn)狀;其次采用了可視化分析的思想,運用社會網(wǎng)絡(luò)分析方法和Ucinet工具,對高頻次關(guān)鍵詞進行了可視化分析,從中心性和凝聚子群角度直觀準確揭示出近十年來我國競爭情報的研究重點、研究熱點和研究態(tài)勢。
競爭情報;CSSCI;統(tǒng)計;社會網(wǎng)絡(luò)分析;中心性
競爭情報作為情報學(xué)領(lǐng)域的一個重要概念,還沒有形成統(tǒng)一化的明確定義。大多數(shù)學(xué)者認為,競爭情報既是一個產(chǎn)品,也是一個過程[1]。在20世紀50年代,美國率先開展了現(xiàn)代意義上的競爭情報活動[2],80年代以后,競爭情報逐步發(fā)展為一項獨立職能,并向技術(shù)、方法及應(yīng)用領(lǐng)域不斷擴展。我國對競爭情報的有組織的理論與實踐研究起始于20世紀90年代,眾多學(xué)者開始競爭情報領(lǐng)域的相關(guān)研究,出現(xiàn)了大量的競爭情報文獻。為了梳理競爭情報研究脈絡(luò),有部分學(xué)者應(yīng)用文獻計量學(xué),從不同側(cè)面對不同時期我國競爭情報研究進展進行了分析[3~7]。統(tǒng)計分析方法可以準確地揭示一個學(xué)科或知識域在一定時期的發(fā)展,具有較好的優(yōu)越性,但是無法較為形象、準確地把握學(xué)科的研究熱點和發(fā)展態(tài)勢。因此為了科學(xué)揭示競爭情報研究的態(tài)勢,通過從統(tǒng)計學(xué)和可視化分析兩個角度進行系統(tǒng)全面分析,分析2005—2014年十年期間競爭情報研究的新進展和新情況,為后續(xù)深入研究提供參考。
以中國學(xué)術(shù)期刊全文數(shù)據(jù)庫來源期刊(CNKI)為數(shù)據(jù)源,檢索條件是篇名當中包括“競爭情報”,時間范圍是2005—2014年(檢索時間截止到2014年12月31日),來源期刊選擇CSSCI。選擇CSSCI來源期刊的原因是CSSCI來源期刊的遴選遵循文獻計量學(xué)規(guī)律,篩選出的期刊在學(xué)術(shù)界具有較強的代表性和權(quán)威性,被CSSCI來源文獻引用說明該文獻具有一定的理論與實踐價值[8]。利用上述檢索途徑,初次檢索到943篇文獻,文獻統(tǒng)計分析和可視化分析的研究均基于2005—2014年這十年的統(tǒng)計數(shù)據(jù)。
在研究方法上主要采用統(tǒng)計分析方法和可視化分析方法。其主要步驟是首先對檢索到的論文信息進行“導(dǎo)出參考文獻”等規(guī)范化處理,然后把數(shù)據(jù)轉(zhuǎn)換成編碼為ANSI的TXT格式,以便書目共現(xiàn)分析系統(tǒng)提取。數(shù)據(jù)處理完畢,啟動書目共現(xiàn)分析系統(tǒng),新建項目,提取文檔,選擇相關(guān)的分析數(shù)據(jù),提取每篇文章需要分析的信息作為分析對象,用SPSS等軟件進行后續(xù)數(shù)據(jù)處理及定量分析??梢暬治龇椒ň褪菍⑽墨I信息經(jīng)過計算機處理過后的中間數(shù)據(jù)或者結(jié)果數(shù)據(jù),以圖形或者圖像的形式比較直觀的呈現(xiàn)出來。對競爭情報的高頻次關(guān)鍵詞的分析就是應(yīng)用這種方法來分析,從而揭示出其規(guī)律。社會網(wǎng)絡(luò)分析主要利用Ucinet6軟件工具,此工具它以直觀的可視化形式展示社會網(wǎng)絡(luò)中各點之間的復(fù)雜關(guān)系,可以繪制出我國競爭情報研究的關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖,并進行分析。
1.作者發(fā)文量分析
在科學(xué)研究當中,發(fā)文量的多少可以衡量一位學(xué)者在該領(lǐng)域的影響力。因此,作者發(fā)文量的分析是一個主要方向。在統(tǒng)計的946篇文章中,其中涉及作者1 829人,將發(fā)文量達6篇及以上的作者統(tǒng)計。由統(tǒng)計分析得知,處于金字塔頂端的核心作者如王知津,彭靖,張玉峰等均為情報學(xué)研究領(lǐng)域造詣較深的學(xué)者。而其中王知津教授是我國競爭情報研究領(lǐng)域的知名專家,同時也是情報方法論建設(shè)和應(yīng)用的主要發(fā)起人。
2.被引頻次分析
論文的被引用情況通??梢苑从吵鲈撜撐呐c現(xiàn)階段研究熱點的相關(guān)性,同時還能體現(xiàn)研究的嚴謹性,是一種尊敬前人著作權(quán)的行為。論文被引頻次的多少,反映了其在同行中的影響力大小。通過統(tǒng)計分析得出競爭情報中被引次數(shù)排名前10名的文獻如表1,其中被引次數(shù)最多的是包昌火等學(xué)者的《發(fā)展中的競爭情報系統(tǒng)》,被引頻次高達62次,由此可以看出近年來研究基礎(chǔ)主要為情報系統(tǒng)技術(shù)的開發(fā)。其次被引用較多的是彭靖里等人的《競爭情報中人際網(wǎng)絡(luò)構(gòu)建的理論研究》,被引頻次為56次,這是一個新的情報研究分支,或許會成為將來的研究熱點。表1中的篇名可反映出近十年來情報的相關(guān)研究多為理論性研究,而且發(fā)文年代久遠,因此可以作為本領(lǐng)域的基礎(chǔ)。
表1 近10年中競爭情報論文被引頻次前10的統(tǒng)計
表2 2005-2014年中競爭情報中作者合作統(tǒng)計
表3 近10年競爭情報論文中關(guān)鍵詞頻次在20次以上統(tǒng)計
圖1 共詞網(wǎng)絡(luò)圖
3.作者合作度分析
隨著研究的深入,作者就作者合作度和合作率兩個角度進行了分析。其中,合作度=作者總數(shù)/論文總數(shù),合作率=合作論文數(shù)/論文數(shù)*100%(這里均指一定時期內(nèi)相關(guān)文獻的作者數(shù)和論文數(shù))。分析近十年來競爭情報研究領(lǐng)域作者的合作度及合作率(表2),合作度數(shù)值區(qū)間為1.73—2.12。平均值為1.93,并呈逐年上升趨勢。合作率區(qū)間為53.03%—75.27%,平均值為63.26%,也穩(wěn)步上升。這表明我國競爭情報研究領(lǐng)域已經(jīng)形成了較為專業(yè)的研究隊伍,學(xué)者之間能夠良好合作。
關(guān)鍵詞是著者為了表達文獻主題而添加的自然語言詞匯。關(guān)鍵詞能夠科學(xué)反映出文獻的研究特征。關(guān)于同一主題領(lǐng)域的論文,作者會采用相同的關(guān)鍵詞,而這些關(guān)鍵詞同時出現(xiàn)在一些文獻中稱為關(guān)鍵詞共現(xiàn),于是眾多關(guān)鍵詞共現(xiàn)形成了關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)[9]。從社會網(wǎng)絡(luò)方法的角度來看,關(guān)鍵詞屬于社會網(wǎng)絡(luò)中的節(jié)點,關(guān)鍵詞共現(xiàn)表現(xiàn)為節(jié)點與節(jié)點間的聯(lián)系。關(guān)鍵詞共現(xiàn)頻次以及是否共現(xiàn)代表了關(guān)鍵詞在共詞社會網(wǎng)絡(luò)中的地位和角色。因此我們可以采用社會網(wǎng)絡(luò)分析方法(SNA)的原理和方法進行共詞分析從而通過關(guān)鍵詞間的聯(lián)系,可揭示出某一領(lǐng)域主題研究的內(nèi)涵和規(guī)律[10]。我們采用Ucinet6.0軟件的繪圖功能,將0—1二值矩陣轉(zhuǎn)化為關(guān)鍵詞共詞網(wǎng)絡(luò)圖(如圖1),在這個圖中,每個節(jié)點代表一個關(guān)鍵詞,他們之間的連線表示存在關(guān)系。
1.競爭情報研究領(lǐng)域的高頻關(guān)鍵詞
高頻次關(guān)鍵詞代表著關(guān)鍵詞的重要程度越高,在其領(lǐng)域研究中受到的關(guān)注度也高。表3列出了近十年競爭情報領(lǐng)域研究中頻次在20次以上的關(guān)鍵詞。
從表3可以看出,除了“競爭情報”以外,企業(yè)競爭情報、情報研究、競爭情報系統(tǒng)、信息、知識頻次較高,說明這些領(lǐng)域是競爭情報研究的重要方面。我們可以將這些關(guān)鍵詞粗略分成如下幾大類:競爭情報理論層面主要有知識、信息、專利、人際網(wǎng)絡(luò)等,實踐層面有競爭對手、反競爭情報、國家競爭情報等,競爭情報技術(shù)研究領(lǐng)域有競爭情報系統(tǒng)、數(shù)據(jù)挖掘、技術(shù)競爭、動態(tài)競爭等。高頻次關(guān)鍵詞也顯示出了一些新的研究領(lǐng)域,如反競爭情報、產(chǎn)業(yè)競爭情報、圖書競爭情報等。同時這些高頻次關(guān)鍵詞也說明了競爭情報的研究由理論層面逐漸向?qū)嵺`層面發(fā)展。
2.中心性分析
中心性分析是社會網(wǎng)絡(luò)分析的重要方法,主要用來分析個人或組織在網(wǎng)絡(luò)中所處的地位,它主要包括中心度和中心勢兩個指標。個體中心度是指個體處于網(wǎng)絡(luò)中心的程度,是對個體行動者權(quán)力的量化分析,中心度又分為點度中心度、中間中心度和接近中心度;而中心勢指數(shù)描述的是點間的差異度,是對群體權(quán)力的量化分析,中心勢也分為點度中心勢、中間中心勢和接近中心勢。我們利用Ucinet的分析功能得出競爭情報關(guān)鍵詞網(wǎng)絡(luò)的中心性數(shù)據(jù)(表4)。在該表中關(guān)鍵詞的序號是根據(jù)關(guān)鍵詞的頻次來排列的。
表4 競爭情報論文高頻關(guān)鍵詞中心度和中心勢
(1)點度中心度分析
社會網(wǎng)絡(luò)中節(jié)點的點度中心度是指與其直接相連的其他點的個數(shù),其值越大,代表該節(jié)點越接近處于“中心”地位。在高頻關(guān)鍵詞分析中,點度中心度反映的是其與其他詞共現(xiàn)的次數(shù),數(shù)值越大說明這個關(guān)鍵詞與其他關(guān)鍵詞的直接聯(lián)系越緊密,越重要。通過分析發(fā)現(xiàn),圖書館競爭情報的點度中心度最大,說明它在競爭情報研究領(lǐng)域中最活躍。結(jié)合我們的統(tǒng)計分析,近十年我國競爭情報領(lǐng)域研究,越來越多的學(xué)者開始關(guān)注圖書館在競爭情報中的作用。另外網(wǎng)絡(luò)、可視化分析、專利、系統(tǒng)建設(shè)、競爭對手的點度中心度也比較高,這表示在近十年來它們相關(guān)的研究是競爭情報領(lǐng)域的重點內(nèi)容,同時競爭情報系統(tǒng)、信息、知識等關(guān)鍵詞的點度中心度較低,這表示雖然它們出現(xiàn)的頻率較高,但是與其他關(guān)鍵詞聯(lián)系較弱,無法形成一個整體研究框架。
(2)中心勢分析
中心勢分點度中心勢和中間中心勢。其中點度中心勢主要用來描述網(wǎng)絡(luò)圖的整體中心性,中間中心勢表示的是在中間中心度最高節(jié)點與其他節(jié)點中心度的差距,它的數(shù)值越大,表示網(wǎng)絡(luò)的中心勢越高,也就是說這個網(wǎng)絡(luò)可以被劃分為多個小團體。如表4所示, 這些關(guān)鍵詞的中間中心勢都偏低,說明競爭情報關(guān)鍵詞不容易形成小團體,這也進一步說明近十年來競爭情報研究的內(nèi)容不集中,較為分散。
(3)凝聚子群分析
凝聚子群是指網(wǎng)絡(luò)中某些關(guān)系特別緊密的行動者結(jié)合成的次級團體。凝聚子群分析主要研究的是在關(guān)鍵詞網(wǎng)絡(luò)中有幾個子群以及它們之間有什么樣的關(guān)系。根據(jù)節(jié)點間的這些連線,我們可以看到該網(wǎng)絡(luò)內(nèi)關(guān)鍵詞之間的緊密度以及該網(wǎng)絡(luò)的核心關(guān)鍵詞及邊緣關(guān)鍵詞。凝聚子群分析利用Ucinet的n-clique工具,形成競爭情報關(guān)鍵詞的n-clique聚類圖(圖2)。
圖2 n-clique聚類圖
n-clique是小團體內(nèi)某兩點之間有不大于n的距離(小于n)。利用Ucinet6軟件處理圖2相應(yīng)的數(shù)據(jù)得n=2的5個小團。從結(jié)果看,小團體的規(guī)模相差不大。由于每兩個關(guān)鍵詞距離不同產(chǎn)生的結(jié)果也不盡相同,有些關(guān)鍵詞同時出現(xiàn)在四個小團體中,如產(chǎn)業(yè)競爭情報、反競爭情報、國家競爭情報和人際競爭情報等;而案例則只出現(xiàn)在某些團體當中。圖2可以較為客觀地反映競爭情報領(lǐng)域研究內(nèi)容之間的內(nèi)在關(guān)系,如位于圖2下邊的系統(tǒng)建設(shè)、數(shù)據(jù)挖掘等,這些內(nèi)容是當前競爭情報研究中最為基礎(chǔ)的內(nèi)容;而位于圖2最上邊的企業(yè)競爭情報、情報研究、競爭情報系統(tǒng)等,這些相對而言是本領(lǐng)域相對更深入的研究內(nèi)容,而一些新型的分支可能成為將來研究的熱點如人際競爭情報、人際網(wǎng)絡(luò)競爭情報等。從下面的聚類圖分析看,這些研究內(nèi)容具有一定的代表性且它們之間有一定的關(guān)系。
凝聚子群密度是測量小團體現(xiàn)象是否嚴重的指標,它的取值范圍為[-1,+1],越靠近1,表示小團體密度越大;越接近-1,意味著小團體密度越小;接近0,表明關(guān)系越趨向于隨機分布。圖2凝聚子群的密度值 -0.283,可見趨向于隨機分布狀態(tài)也就是說明它們之間的關(guān)系比較松散,這反映了競爭情報領(lǐng)域的研究內(nèi)容方向性不是很強,有必要改變其分散狀態(tài)使其研究更緊密。
我們分別從統(tǒng)計學(xué)和可視化分析兩個視角系統(tǒng)全面分析了我國競爭情報領(lǐng)域十年來研究的態(tài)勢。首先采用統(tǒng)計學(xué)的分析方法,從三個方面對競爭情報研究特征進行了描述統(tǒng)計分析;其次采用了可視化分析的思想,借助社會網(wǎng)絡(luò)分析方法和工具,從高頻次關(guān)鍵詞的角度進行了可視化分析。這兩個視角較為科學(xué)全面反映出了近十年來我國競爭情報研究的進展:文獻數(shù)量趨向穩(wěn)定,研究逐步走向成熟;發(fā)文期刊主要集中在圖書情報類;競爭情報研究學(xué)者較多,研究學(xué)者之間有著較強的合作度,并且出現(xiàn)一批領(lǐng)軍人物,這些學(xué)者的研究主題前沿新穎,推動競爭情報領(lǐng)域向縱深領(lǐng)域發(fā)展。同時,企業(yè)競爭情報、競爭情報系統(tǒng)、產(chǎn)業(yè)競爭情報仍然是競爭情報領(lǐng)域研究的主要對象。近十年來,出現(xiàn)了一些新的研究主題,理論層面主要有知識、信息、專利、人際網(wǎng)絡(luò)等,實踐層面有競爭對手、反競爭情報、國家競爭情報等。但是這些研究主題影響力較小,與其他主題共現(xiàn)較少,研究比較孤立,沒有形成成熟的研究團體群。因此,競爭情報領(lǐng)域的研究需要改變其分散狀態(tài)使其研究更緊密,加強這些層面的研究。
[1]王克平,等.競爭情報與企業(yè)危機預(yù)警[J].情報科學(xué),2012,(3):336~340.
[2]陳遠,望俊成.近年來國內(nèi)競爭情報研究述評[J].圖書情報知識,2005,(6):70~73.
[3]劉東曉,等.基于文獻計量的國外技術(shù)競爭情報研究進展分析[J].情報雜志,2013,(5):49~55.
[4]郝屹.近五年競爭情報研究的文獻計量分析[J].情報科學(xué),2012,(12):1 907~1 910.
[5]胡笑梅,李文玉.2009—2010年國內(nèi)競爭情報研究熱點分析[J].情報探索,2012,(4):54~57.
[6]麥淑平,等. 2006-2010年我國競爭情報論文的計量分析[J].圖書館工作與研究,2012,(2):24~29.
[7]陳淑平.我國競爭情報研究進展的定量分析[J].大學(xué)圖書情報學(xué)刊,2009,(5):89~93.
[8]李超,柯健.基于CSSCI的信息生態(tài)被引文獻統(tǒng)計分析與評價[J].情報科學(xué),2010,(4):554~558.
[9]魏瑞斌.社會網(wǎng)絡(luò)分析在關(guān)鍵詞網(wǎng)絡(luò)分析中的實證研究[J].情報雜志,2009,(9):46~49.
[10]斯坦利·沃瑟曼.社會網(wǎng)絡(luò)分析:方法與應(yīng)用[M].北京:中國人民大學(xué)出版社,2012.10~15.
2095-4654(2016)08-0129-05
2016-05-03
福建省中青年教師教育科研項目科技A類項目(JA14402)
G350
A