趙清俊皮進(jìn)修彭建文陳桂蘭
作者簡(jiǎn)介:趙清?。?977-),男,四川宜賓人,博士,副教授,碩士生導(dǎo)師,研究方向:科學(xué)計(jì)量學(xué),技術(shù)創(chuàng)新與管理。
摘要:本文從在中觀層面上對(duì)大數(shù)據(jù)領(lǐng)域的科研產(chǎn)出進(jìn)行科學(xué)計(jì)量分析。對(duì)大數(shù)據(jù)科學(xué)研究的宏觀層面產(chǎn)出與分布進(jìn)行分析,為更進(jìn)一步了解大數(shù)據(jù)科學(xué)研究的重要機(jī)構(gòu),方便科研人員或者企事業(yè)單位快速定位全球范圍內(nèi)或者某國(guó)家范圍內(nèi)具有重要研究能力的研究機(jī)構(gòu)并開展合作、技術(shù)引進(jìn)和投資等活動(dòng)。
關(guān)鍵詞:大數(shù)據(jù);合著;科研產(chǎn)出
1.引言
科學(xué)知識(shí)的產(chǎn)出和分布是了解全球關(guān)于這一科學(xué)領(lǐng)域的研究實(shí)力的重要指標(biāo),其已經(jīng)成為對(duì)某一學(xué)科領(lǐng)域主題進(jìn)行科學(xué)計(jì)量分析的重要組成部分。不少學(xué)者通過科學(xué)知識(shí)的產(chǎn)出與分布進(jìn)行研究,取得了眾多顯著的成果。比如:著名的布拉福德定律的提出者Bradford通過對(duì)期刊的產(chǎn)出情況進(jìn)行分析,發(fā)現(xiàn)了文獻(xiàn)的分布規(guī)律;在國(guó)內(nèi),李杰等通過分析31種SCI收錄的聲學(xué)期刊,統(tǒng)計(jì)分析了國(guó)際聲學(xué)研究的產(chǎn)出與分布提點(diǎn)。因此筆者在參考學(xué)者分析方法的基礎(chǔ)上,針對(duì)大數(shù)據(jù)科學(xué)知識(shí)的產(chǎn)出與分布進(jìn)行探索,從論文與會(huì)議報(bào)告的角度嘗試挖掘出大數(shù)據(jù)科學(xué)知識(shí)的時(shí)間、空間分布的特點(diǎn)。
2.論文產(chǎn)出與分布
在2012年以前ARTICLE(論文)和PROCEEDINGS PAPER(報(bào)告)的文獻(xiàn)資料都相對(duì)很少,而且2003-2011年的文獻(xiàn)基本上處于個(gè)位數(shù),沒有明顯的增長(zhǎng)規(guī)律。到了2012年以后呈現(xiàn)出爆發(fā)式的增長(zhǎng),尤其是ARTICLE(論文)2012年,2013年,2014年的文獻(xiàn)量幾乎是前一年的3倍。雖然PROCEEDINGS PAPER(報(bào)告)在2012年開始同樣具有出令人驚訝的增長(zhǎng)量,但在2013年,2014年其文獻(xiàn)量大致相當(dāng),并且到2015年度可檢索的只有328篇,遠(yuǎn)遠(yuǎn)小于同期ARTICLE(論文)的數(shù)量,這間接說(shuō)明就大數(shù)據(jù)科學(xué)的發(fā)展所舉辦的學(xué)術(shù)交流活動(dòng)的次數(shù)呈現(xiàn)出穩(wěn)定的變化趨勢(shì)。為了更加具體的展現(xiàn)這兩種文獻(xiàn)資料的增長(zhǎng)情況,筆者借助指數(shù)模型對(duì)他們的論文數(shù)量進(jìn)行擬合,探究他們的增長(zhǎng)趨勢(shì)。
從圖1中我們可以看出ARTICLE(論文)呈現(xiàn)出指數(shù)形式的增長(zhǎng)趨勢(shì)(y=0.318e1.055x,R2=0.975),這在一定程度上說(shuō)明對(duì)于大數(shù)據(jù)科學(xué)的研究處于持續(xù)高漲階段。普萊斯的理論對(duì)此解釋道:“學(xué)科系統(tǒng)的‘指數(shù)輸入(比如資金、人力資源投入等)是科學(xué)成果‘指數(shù)輸出的原因”,不少學(xué)者也對(duì)此類現(xiàn)象做出了解釋,他們認(rèn)為學(xué)科處于誕生和發(fā)展階段,科學(xué)成果常常會(huì)呈現(xiàn)出指數(shù)形式的增長(zhǎng)方式,但隨著科學(xué)研究的不斷進(jìn)展,學(xué)科逐漸具有成熟的理論,此時(shí)學(xué)科的成果數(shù)量將增長(zhǎng)緩慢,或者出現(xiàn)負(fù)增長(zhǎng)。通過比較相同顏色的曲線,我們大致可以發(fā)現(xiàn)ARTICLE-TGCS=3*ARTICLE-Recs,ARTICLE-TGCS=5*ARTICLE-TLCS;PAPER-TGCS=3*PAPER-TLCS。
3.國(guó)家/地區(qū)的產(chǎn)出與分布
對(duì)大數(shù)據(jù)科學(xué)文獻(xiàn)資料的作者國(guó)籍進(jìn)行統(tǒng)計(jì)分析,ARTICLE與PROCEEDINGS PAPER總共4140篇,涉及到的國(guó)家總共有84個(gè),并分三個(gè)層次(總體情況,ARTICLE和PROCEEDINGS PAPER)六個(gè)指標(biāo)(文獻(xiàn)數(shù)量、文獻(xiàn)數(shù)量百分比、TLCS、TGCS、H指數(shù)-LCS與H指數(shù)-GCS)進(jìn)行統(tǒng)計(jì)分析,獲取了發(fā)文量總數(shù)排名前二十的國(guó)家,并通過Histcite軟件計(jì)算出這前二十個(gè)國(guó)家在三個(gè)層次上H指數(shù)①。從對(duì)大數(shù)據(jù)研究所涉及的國(guó)家以及文獻(xiàn)產(chǎn)出統(tǒng)計(jì)來(lái)看,大數(shù)據(jù)科學(xué)已經(jīng)受到了廣泛的關(guān)注。無(wú)疑前排名前十的國(guó)家是大數(shù)據(jù)科學(xué)研究最活躍取得成果最顯著的地區(qū),他們是美國(guó)(USA)、中國(guó)(Peoples R China)、英國(guó)(UK)、德國(guó)(Germany)、澳大利亞(Australia)、加拿大(Canada)、日本(Japan)、印度(India)、韓國(guó)(South Korea)、意大利(Italy)。參考以往學(xué)者的研究,我們不難發(fā)現(xiàn)美國(guó)和歐洲地區(qū)是目前大數(shù)據(jù)科學(xué)研究的核心地帶。
現(xiàn)在我們進(jìn)一步分析,在進(jìn)行分析前筆者發(fā)現(xiàn)文獻(xiàn)中存在少部分的科研成果涉及兩個(gè)或者兩個(gè)以上的國(guó)家,如果單純地將文獻(xiàn)的著作地歸屬于某一個(gè)國(guó)家,這顯然對(duì)其他國(guó)家不公平,而且從另一個(gè)角度講合著的各方均參與了研究,我們假設(shè)他們的研究信息對(duì)合著者是完全彼此公開的,這就不難得出文獻(xiàn)所蘊(yùn)含的知識(shí)與技術(shù)在合著者國(guó)家間的掌握程度是彼此相當(dāng)?shù)?,因此我們認(rèn)為這樣的情況使得各個(gè)合著國(guó)的文獻(xiàn)量均為一篇,但這也會(huì)帶來(lái)一個(gè)負(fù)面效果即會(huì)使得總的文獻(xiàn)量虛增,但相比于更加真實(shí)的反應(yīng)各個(gè)國(guó)家間的差距,筆者認(rèn)為這樣的影響是可以忽略的。美國(guó)以發(fā)文量1417(占比28.8%),H-GCS為21位居榜首,另外在前五名中其他四個(gè)國(guó)家,中國(guó)(891,18.1%,10)、英國(guó)(265,5.4%,10)、德國(guó)(210,4.3%,10)和澳大利亞(182,3.7%,9)。我們不難發(fā)現(xiàn)中國(guó)無(wú)論是發(fā)文總量還是H指數(shù)均遠(yuǎn)低于美國(guó),但僅從發(fā)文數(shù)量上來(lái)看中國(guó)卻比其他國(guó)家更站優(yōu)勢(shì),不過我們同樣也發(fā)現(xiàn)中國(guó)文獻(xiàn)的H指數(shù)與其他四個(gè)國(guó)家基本無(wú)差異,這也進(jìn)一步證實(shí)了我國(guó)的論文數(shù)量充足但質(zhì)量上還有待進(jìn)一步提高。
4.結(jié)語(yǔ)
對(duì)大數(shù)據(jù)科學(xué)研究論文數(shù)量排名前30的國(guó)家進(jìn)行發(fā)文數(shù)量統(tǒng)計(jì)分析,這些國(guó)家前10位的發(fā)文數(shù)量就占據(jù)了全部發(fā)文數(shù)量的72.371%,到前20位時(shí)達(dá)到88.626%,到前30位時(shí)達(dá)到93.874%(如圖2所示),這反應(yīng)大數(shù)據(jù)科學(xué)在世界各國(guó)間的研究產(chǎn)出存在很大的不平衡性,存在明顯的馬太效應(yīng),也就是說(shuō)大數(shù)據(jù)科學(xué)的研究成果和技術(shù)掌握在少數(shù)國(guó)家間。(作者單位:1.重慶師范大學(xué)經(jīng)濟(jì)與管理學(xué)院;2.重慶師范大學(xué)數(shù)學(xué)學(xué)院;3.重慶師范大學(xué)教務(wù)處)
基金項(xiàng)目:重慶市社會(huì)科學(xué)規(guī)劃博士項(xiàng)目(No:2014BS097);大數(shù)據(jù)領(lǐng)域的創(chuàng)新績(jī)效的測(cè)度與知識(shí)演化研究;重慶師范大學(xué)基金項(xiàng)目(No:14XWB016):基于社會(huì)網(wǎng)絡(luò)分析的大數(shù)據(jù)領(lǐng)域成長(zhǎng)路徑辨識(shí)與產(chǎn)業(yè)發(fā)展對(duì)策研究;中國(guó)博士后科學(xué)基金一等資助項(xiàng)目(No:2015M57016):大數(shù)據(jù)領(lǐng)域的復(fù)雜創(chuàng)新網(wǎng)絡(luò)研究;重慶市教委科學(xué)技術(shù)研究項(xiàng)目(No.KJ1500334):復(fù)雜創(chuàng)新網(wǎng)絡(luò)視角下的大數(shù)據(jù)領(lǐng)域成長(zhǎng)戰(zhàn)略、創(chuàng)新機(jī)制、發(fā)展動(dòng)力研究;重慶市社會(huì)科學(xué)規(guī)劃項(xiàng)目(No:2015YBGL113)“一帶一路”背景下重慶市的創(chuàng)新驅(qū)動(dòng)路徑分析與對(duì)策研究—以大數(shù)據(jù)領(lǐng)域?yàn)槔椭貞c文理學(xué)院科研項(xiàng)目(No:Z2013SC09)資助。
注解:
①H指數(shù)最早由美國(guó)加利福尼亞大學(xué)教授J.E.Hirsch教授提出用于進(jìn)行科學(xué)成果評(píng)價(jià)指標(biāo),具體含義是在一定時(shí)間內(nèi)發(fā)表的論文至少有H篇被引用的次數(shù)不低于H次的科研評(píng)估指標(biāo),在本處筆者將分兩個(gè)環(huán)境來(lái)計(jì)量,其一就是本地下載的文獻(xiàn),其二是WoS數(shù)據(jù)庫(kù)文獻(xiàn)分別獲得H指數(shù)-LCS與H指數(shù)-GCS.
參考文獻(xiàn):
[1]李杰.安全科學(xué)知識(shí)圖譜導(dǎo)論[M].北京:化學(xué)工業(yè)出版社,2015.7:54.