• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      學(xué)術(shù)論文接受時間與被引用次數(shù)的統(tǒng)計分析

      2015-06-23 16:27:56姜興隆
      關(guān)鍵詞:冪律指數(shù)分布線性

      姜興隆

      (溫州大學(xué)物理與電子信息工程學(xué)院,浙江溫州 325035)

      學(xué)術(shù)論文接受時間與被引用次數(shù)的統(tǒng)計分析

      姜興隆

      (溫州大學(xué)物理與電子信息工程學(xué)院,浙江溫州 325035)

      論文發(fā)表是一種很重要的人類行為,一直被廣泛關(guān)注.對Nature期刊Report欄目所發(fā)表論文的收錄時間和發(fā)表后三年內(nèi)文章的被引情況進(jìn)行了統(tǒng)計分析,結(jié)果顯示它們都服從指數(shù)衰減分布.該結(jié)果揭示了論文發(fā)表行為的一個內(nèi)在規(guī)律,為引文機(jī)制的進(jìn)一步挖掘提供了實證依據(jù).

      論文接受時間;被引次數(shù);指數(shù)分布

      早些時候,由于缺乏統(tǒng)計工具和方法,大量的數(shù)據(jù)被簡化,人們近似地認(rèn)為人類行為的發(fā)生時間是統(tǒng)一的.近幾年,由于網(wǎng)絡(luò)和計算機(jī)技術(shù)的飛速發(fā)展,人們能夠探測引文網(wǎng)絡(luò),能夠獲得和處理大量的統(tǒng)計數(shù)據(jù)[1-5],因此,定量理解人類行為已成為現(xiàn)代科學(xué)的中心議題之一.

      重尾統(tǒng)計分布普遍存在于自然和社會現(xiàn)象中,科學(xué)論文被引所服從的統(tǒng)計分布最著名的就是重尾分布,在這種情況下,有一個相當(dāng)大的爭論是,引文分布遵循的是對數(shù)正態(tài)分布還是冪律分布.文獻(xiàn)[6]通過測量一個非常大且均勻的引文分布數(shù)據(jù),認(rèn)為偏離很大的數(shù)據(jù)遵循對數(shù)正態(tài)分布,且尾布呈偏離向上的分布規(guī)律.關(guān)于論文發(fā)表模式的定量研究可以追溯到1926年洛特卡關(guān)于科學(xué)生產(chǎn)力規(guī)律的開創(chuàng)性研究,他指出科學(xué)家發(fā)表論文服從冪律分布,即發(fā)表過k篇論文的科學(xué)家人數(shù)按照k-γ的規(guī)律減少[7].在洛特卡之后,又有許多科學(xué)家對論文的引用模式進(jìn)行了探討.因為有的引文數(shù)據(jù)庫是可用的,所以普萊斯[8]討論了引文網(wǎng),首次證實了引文網(wǎng)的入度和出度都服從冪律分布.此后,出現(xiàn)了很多有關(guān)引文網(wǎng)的研究,例如,瑞德納[9]研究了由科學(xué)信息研究所按期刊編目分類的783 339篇論文和在20年間發(fā)表在PRD上的24 296篇論文的引文分布,發(fā)現(xiàn)了一篇論文被引用k次的概率,即相應(yīng)的引文網(wǎng)的入度服從冪律分布.最近,彼得森等[10]開發(fā)了一個科學(xué)引文的分布模型,發(fā)現(xiàn)冪律指數(shù)分布并不普遍.王大舜等[11]給出了一個單篇論文的引文動力學(xué)機(jī)理模型,用一個機(jī)理模型的個人論文被引用情況,得到了不同期刊的論文被引用的歷史,發(fā)現(xiàn)其分布規(guī)律為單一的曲線,指出所有論文傾向于遵循相同的時間模式.觀察這些模式能夠幫助我們揭開科學(xué)影響的基本機(jī)制,發(fā)現(xiàn)可能有的潛在的政策含義.

      論文發(fā)表是近代人類知識增長的一個不可或缺的重要組成部分.隨著科技的發(fā)展,人類知識的迅速增加,論文的發(fā)表時間與被引用已經(jīng)成為大多科研工作者所關(guān)注的對象.本文將從論文的發(fā)表時間與被引用這兩方面入手,來探討其中存在的某種機(jī)制.

      1 數(shù)據(jù)分析

      本文的數(shù)據(jù)來源于Nature期刊Report欄目上發(fā)表的文章.從1997年到2008年12年間收錄的文章中,其中有8 762篇標(biāo)記了收到時間和同意發(fā)表時間,本文將兩者的時間間隔定義為接受時間τ,并且以天為單位.考慮到科學(xué)論文的編輯發(fā)表也屬人類活動,在這種服務(wù)系統(tǒng)輸入流中包括遞交論文的排隊過程,在這其中又包括裁判評審、信息修正等一系列過程,最后由編輯委員會驗收.本文對接受時間使用了累積分布:

      其中M(τ)為接受時間為τ的論文數(shù)量.

      2 實證結(jié)果

      由于論文發(fā)表時的等待時間取決于編輯委員會,所以,本文將注意力集中放在接受時間的統(tǒng)計上.

      2.1論文接受時間分布

      首先對Nature期刊Report欄目上的論文的接受時間分布進(jìn)行分析,接受時間見圖1.從圖1中可以看出,接受時間分布在單對數(shù)坐標(biāo)下呈指數(shù)衰減分布:

      圖1中,τ表示接受時間,以天為單位,M(τ)表示接受時間為τ的論文數(shù)量.圖中下垂頭部和尾部,即在很短或很長的時間間隔內(nèi)發(fā)表的論文數(shù)很少,只占總數(shù)的32%,所以只取了中間部分.對67≤τ≤400范圍內(nèi)的數(shù)據(jù)進(jìn)行線性擬合得直線,負(fù)相關(guān)系數(shù)R=-0.950 5,直線的斜率為-0.015.

      在圖1的插圖中給出了相應(yīng)的累積分布情況.累積分布進(jìn)行線性擬合與原始數(shù)據(jù)進(jìn)行線性擬合的結(jié)構(gòu)相似,都呈指數(shù)衰減分布.可以這樣解釋,接受時間很短和很長的論文數(shù)量很少,大多數(shù)論文都是按照相對穩(wěn)定的模式被接受的.該結(jié)果與當(dāng)前論文接受時間發(fā)表模式中表現(xiàn)出來的規(guī)律并不相同,例如引文分布的科學(xué)出版物是基于兩個相對較大的數(shù)據(jù)集,瑞德納在PRD與ISI數(shù)據(jù)集中,發(fā)現(xiàn)出版物的引用呈冪律分布[9].可見,現(xiàn)代文章的發(fā)表模式在不斷改變文章的接受時間.

      圖1 論文接受時間的分布

      2.2論文被引次數(shù)分布

      引文網(wǎng)的最大優(yōu)勢在于通過它可以獲得豐富且準(zhǔn)確的數(shù)據(jù).本文對Nature期刊Report欄目上發(fā)表的具有確切接受時間的論文在發(fā)表后3年內(nèi)被引的次數(shù)進(jìn)行分析,結(jié)果見圖2.

      圖2中,橫坐標(biāo)k表示論文的被引次數(shù),縱坐標(biāo)N( k)表示k所對應(yīng)的論文數(shù),對15k219≤≤范圍的數(shù)據(jù)進(jìn)行線性擬合得圖中直線.由圖2可以看出,被引次數(shù)在37的論文數(shù)最大,在這個最大點以后的論文量逐漸減少,由于論文N( k)=1,2,3的被引次數(shù)和被引次數(shù)在219以后的論文數(shù)都很少(被引大于219的論文數(shù)只有421篇,大約只占總量的5%),所以可以除去數(shù)據(jù)中下垂的頭部和尾部,只對中間部分的數(shù)據(jù)進(jìn)行線性擬合,結(jié)果發(fā)現(xiàn),在單對數(shù)坐標(biāo)下呈指數(shù)衰減分布:

      3 總結(jié)與討論

      本文對Nature期刊Report欄目所發(fā)表論文的接受時間和發(fā)表后三年內(nèi)文章的被引情況進(jìn)行了統(tǒng)計分析,結(jié)果顯示,論文接受時間服從λ=-0.015的指數(shù)分布,論文在發(fā)表后三年內(nèi)被引次數(shù)服從α=-0.017的指數(shù)分布.從這兩個結(jié)果可以看出,它們呈現(xiàn)出基本相同的分布特征,即都服從指數(shù)衰減分布.因此,有理由推測出這些特性可能是論文發(fā)表模式中的共同特性,從這些特性中可以進(jìn)一步反映出人類在論文發(fā)表的行為中可能暗含某種機(jī)制.信息網(wǎng)絡(luò)技術(shù)還在快速發(fā)展,在信息量足夠多的情況下,可能還會有更豐富的標(biāo)度特性,這有待于更多的有興趣的學(xué)者去進(jìn)一步挖掘.

      圖2 論文3年被引次數(shù)分布

      致謝:本文得到導(dǎo)師林振權(quán)教授的悉心指導(dǎo),同時也得到了林振權(quán)教授的科研補助金的贊助,在此表示致謝.

      [1] Johansen A. Probing human response times [J]. Physica A: Statistical Mechanics and its Applications, 2004, 338(1): 286-291.

      [2] Barabasi A L. The origin of bursts and heavy tails in human dynamics [J]. Nature, 2005, 435: 207-211.

      [3] Oliveira J G, Barabási A L. Human dynamics: Darwin and Einstein correspondence patterns [J]. Nature, 2005, 437: 1251-1251.

      [4] Stouffer D B, Malmgren R D, Amaral L A N. Log-normal statistics in e-mail communication patterns [J]. [EB/OL]. [2014-01-08]. http://www.researchgate.net/publication/2175792_Log-normal_statistics_in_e-mail_communication_patterns.

      [5] Vázquez A, Oliveira J G, Dezs? Z, et al. Modeling bursts and heavy tails in human dynamics [J]. Physical Review E: statistical, nonlinear, and soft matter physics, 2006, 73(3): 036127.

      [6] Golosovsky M, Solomon S. Runaway events dominate the heavy tail of citation distributions [J]. The European Physical Journal Special Topics, 2012, 205(1): 303-311.

      [7] Newman M E J. The structure and function of complex networks [J]. Society for Industrial and Applied review, 2003, 45(2): 167-256.

      [8] Yu P, Van de Sompel H. Networks of scientific papers [J]. Science, 1965, 169: 510-515.

      [9] Redner S. How popular is your paper? An empirical study of the citation distribution [J]. The European Physical Journal B-Condensed Matter and Complex Systems, 1998, 4(2): 131-134.

      [10] Peterson G J, Pressé S, Dill K A. Nonuniversal power law scaling in the probability distribution of scientific Citations [J]. Proceedings of the National Academy of Sciences, 2010, 107(37): 16023-16027.

      [11] Wang D, Song C, Barabási A L. Quantifying long-term scientific impact [J]. Science, 2013, 342(6154): 127-132.

      Statistical Analysis on Accepted Time for Papers and Citation Frequency

      JIANG Xinglong
      (College of Physics and Electronic Information Engineering, Wenzhou University, Wenzhou, China 325035)

      Paper publication has always been widely concerned, which is one of important human behaviors. This paper indicates that the distribution tends to obey the law of exponential decay after statistical analysis on the time of receipt for the papers published in Report Colum from the Journal Nature and the situation of their citations after they were published within three years. This result demonstrates an inherent law for paper publications and thus provides an empirical evidence for the future excavation of the citation mechanism.

      Accepted Time For Papers; Citation Frequency; Exponential Distribution

      N94

      A

      1674-3563(2015)01-0059-04

      10.3875/j.issn.1674-3563.2015.01.010 本文的PDF文件可以從xuebao.wzu.edu.cn獲得

      (編輯:王一芳)

      2014-02-28

      國家自然科學(xué)基金(10875086);國家自然科學(xué)基金(11175131)

      姜興隆(1987- ),男,吉林扶余人,碩士研究生,研究方向:人類動力學(xué)

      猜你喜歡
      冪律指數(shù)分布線性
      漸近線性Klein-Gordon-Maxwell系統(tǒng)正解的存在性
      線性回歸方程的求解與應(yīng)用
      二階線性微分方程的解法
      指數(shù)分布抽樣基本定理及在指數(shù)分布參數(shù)統(tǒng)計推斷中的應(yīng)用
      四川地區(qū)降水冪律指數(shù)研究
      冪律流底泥的質(zhì)量輸移和流場
      二元Weinman型指數(shù)分布隨機(jī)變量之和、差、積、商及比率的分布
      對抗冪律
      基于Fibonacci法求冪律模式流變參數(shù)最優(yōu)值
      斷塊油氣田(2012年6期)2012-03-25 09:53:59
      指數(shù)分布與其它分布的關(guān)系
      出国| 本溪市| 靖江市| 酒泉市| 青浦区| 七台河市| 江孜县| 韶关市| 阜城县| 丹寨县| 太湖县| 拉萨市| 呼玛县| 义乌市| 明光市| 南靖县| 屯留县| 古丈县| 丽水市| 桦南县| 班玛县| 洪洞县| 东安县| 志丹县| 乡城县| 林甸县| 咸阳市| 贺州市| 大姚县| 江源县| 平泉县| 丰镇市| 铁力市| 漳州市| 泰顺县| 仁化县| 社会| 新闻| 呼伦贝尔市| 长阳| 齐齐哈尔市|