高丹 李秀霞 周娜
(曲阜師范大學(xué)傳媒學(xué)院,日照 276826)
被引頻次指學(xué)術(shù)文獻(xiàn)發(fā)表后的被引用次數(shù),是評(píng)價(jià)與學(xué)術(shù)文獻(xiàn)有關(guān)的期刊、學(xué)科(專業(yè))、國(guó)家(地區(qū))、單位(個(gè)人)的一種方法,是反映學(xué)術(shù)文獻(xiàn)的科學(xué)水平和學(xué)術(shù)影響力的重要指標(biāo)[1]。目前,提高被引頻次的重要性已在學(xué)術(shù)界達(dá)成廣泛共識(shí)。
國(guó)內(nèi)外學(xué)者從多個(gè)角度對(duì)被引頻次的影響因素進(jìn)行深入探討。國(guó)外學(xué)者如Virgo[2]驗(yàn)證了被引頻次與學(xué)術(shù)文獻(xiàn)重要性的正相關(guān)假設(shè);Webster等[3]指出參考文獻(xiàn)的數(shù)量與被引頻次存在正相關(guān)關(guān)系;Stanek[4]驗(yàn)證了學(xué)術(shù)文獻(xiàn)的篇幅長(zhǎng)短與被引頻次存在相關(guān)關(guān)系,篇幅較長(zhǎng)的學(xué)術(shù)文獻(xiàn)被引頻次也相應(yīng)較多;Maliniak等[5]研究男性和女性在學(xué)術(shù)文獻(xiàn)被引頻次和出版量的差異,發(fā)現(xiàn)女性作者的被引頻次整體低于男性作者;Kulkarni等[6]驗(yàn)證醫(yī)學(xué)領(lǐng)域熱點(diǎn)話題對(duì)被引頻次的影響,發(fā)現(xiàn)對(duì)行業(yè)有利的觀點(diǎn),腫瘤學(xué)和心臟病學(xué)等主題與被引頻次有關(guān);Suryani等[7]通過(guò)CARS模型對(duì)比分析計(jì)算機(jī)科學(xué)領(lǐng)域中的高被引文獻(xiàn)和低被引文獻(xiàn),發(fā)現(xiàn)作者需要在引言中闡明研究成果和研究?jī)r(jià)值,才能使學(xué)術(shù)文獻(xiàn)得到更高的引用頻次。國(guó)內(nèi)學(xué)者如姜磊等[8]探討中文學(xué)術(shù)文獻(xiàn)的參考文獻(xiàn)數(shù)量與被引頻次的關(guān)系,表明參考文獻(xiàn)數(shù)量與被引頻次的相關(guān)性不明顯,參考文獻(xiàn)可以作為一個(gè)獨(dú)立于被引頻次的論文評(píng)價(jià)指標(biāo);牛昱昕等[9]驗(yàn)證了單篇論文的下載頻次與被引頻次的相關(guān)性不顯著;蘇芳荔[10]采用符號(hào)檢驗(yàn)與相關(guān)分析的方法,發(fā)現(xiàn)合作發(fā)表論文的影響力明顯高于無(wú)合作發(fā)表的論文;簡(jiǎn)琳等[11]發(fā)現(xiàn)關(guān)鍵詞個(gè)數(shù)對(duì)文獻(xiàn)被引頻次存在顯著影響;楊利軍等[12]從引用文獻(xiàn)的時(shí)間、類型、數(shù)量3個(gè)特征進(jìn)行分析,得出作者的引用習(xí)慣是影響被引頻次的重要因素之一。
分析已有研究,發(fā)現(xiàn)被引頻次影響因素的研究主要涉及參考文獻(xiàn)數(shù)量、篇幅長(zhǎng)短、下載頻次、合作模式、關(guān)鍵詞個(gè)數(shù)及作者引用習(xí)慣等,通過(guò)計(jì)量的方法分析各影響因素與被引頻次的關(guān)系。已有研究大多以外部因素為研究對(duì)象,鮮有基于學(xué)術(shù)文獻(xiàn)內(nèi)容結(jié)構(gòu)的研究。
引言是學(xué)術(shù)文獻(xiàn)的重要組成部分,作者需要通過(guò)引言引起讀者的閱讀興趣,判定與其研究主題相關(guān)后,才會(huì)激發(fā)深度閱讀行為。引言作為學(xué)術(shù)文獻(xiàn)中不可缺少的組成部分,是決定學(xué)術(shù)文獻(xiàn)質(zhì)量的重要因素之一;而被引頻次能揭示學(xué)術(shù)文獻(xiàn)的應(yīng)用價(jià)值、參考價(jià)值或?qū)W術(shù)影響力,是進(jìn)行學(xué)術(shù)文獻(xiàn)評(píng)價(jià)的重要指標(biāo)之一。學(xué)術(shù)文獻(xiàn)的引言與被引頻次密切相關(guān),兩者間的關(guān)系值得深度探索。本文擬將引言的內(nèi)容結(jié)構(gòu)與被引頻次結(jié)合起來(lái),探討引言與被引頻次的關(guān)系,為規(guī)范學(xué)術(shù)文獻(xiàn)的引言寫作、提高其學(xué)術(shù)影響力提供幫助。
美國(guó)體裁分析學(xué)家Swalesian學(xué)派的代表人Swales在研究各學(xué)科的學(xué)術(shù)文獻(xiàn)引言部分時(shí),發(fā)現(xiàn)不同學(xué)者在寫作學(xué)術(shù)文獻(xiàn)這一特殊體裁時(shí),內(nèi)容結(jié)構(gòu)等方面普遍一致。Swales[13]認(rèn)為,語(yǔ)篇具有特定的共同交流目的,這影響并制約文章內(nèi)容和文體風(fēng)格。因此,得出“學(xué)術(shù)文獻(xiàn)的寫作只有符合其特定的體裁模式,才能實(shí)現(xiàn)其交流目的。而這種公認(rèn)體裁模式是不同研究領(lǐng)域進(jìn)行學(xué)術(shù)交際的最好方法”。
Swales在1990年提出引言結(jié)構(gòu)分析模型,即CARS(Create a Research Space)模型[13],包括確定研究領(lǐng)域、確定研究定位、把握研究契機(jī)3個(gè)語(yǔ)步(move),以及相應(yīng)語(yǔ)步的步驟(step)。語(yǔ)步是作者寫作目的的總體概況,步驟是為實(shí)現(xiàn)語(yǔ)步目的的詳細(xì)描述。第一語(yǔ)步,確定研究領(lǐng)域,即通過(guò)回顧前人研究成果來(lái)闡明研究意義與重要性,包括宣稱中心活躍度、主題概括、綜述以往文獻(xiàn);第二語(yǔ)步,確定研究定位,通過(guò)指出前人研究缺陷再次強(qiáng)調(diào)研究的必要性,包括反駁已有觀點(diǎn)、指出研究不足、提出研究問(wèn)題和繼承前人研究成果4個(gè)循環(huán)步驟;第三語(yǔ)步,把握研究契機(jī),包括概述研究目的、描述研究特征、預(yù)示研究成果、介紹論文結(jié)構(gòu)4個(gè)步驟。
Swales的CARS模型為引言提供了普遍意義上的寫作思路和框架,使學(xué)術(shù)文獻(xiàn)做到“言之有序”,學(xué)術(shù)文獻(xiàn)遵循的“序”即引言的框架結(jié)構(gòu)。然而,CARS模型中對(duì)語(yǔ)步、步驟的概念定義不夠細(xì)致規(guī)范,僅依據(jù)于小部分代表性的句法特征,且應(yīng)用價(jià)值較弱,對(duì)語(yǔ)類驗(yàn)證只能采取事后分析的方式,對(duì)語(yǔ)步的判定僅依賴使用者的直覺(jué),這樣很難獲得分析的一致性。而且,根據(jù)實(shí)際寫作的需要,CARS模型中一些語(yǔ)步和步驟功能相近,略顯冗余,需要進(jìn)一步整合。
為改善CARS模型的不足,豐富引言結(jié)構(gòu),本文嘗試提出一種新的引言結(jié)構(gòu)詞表,為學(xué)者對(duì)引言的規(guī)范寫作提供借鑒和參考。
引言結(jié)構(gòu)詞表數(shù)據(jù)來(lái)自Web of Science的科學(xué)引文(SCI-EXPANDED)數(shù)據(jù)庫(kù),隨機(jī)選取圖書情報(bào)領(lǐng)域的500篇學(xué)術(shù)文獻(xiàn)。通過(guò)分析學(xué)術(shù)文獻(xiàn)的引言部分,發(fā)現(xiàn)CARS模型可以簡(jiǎn)化為“闡述重要性”“文獻(xiàn)綜述”“研究不足”“研究目的”“預(yù)示重要結(jié)果”“論文結(jié)構(gòu)”6個(gè)語(yǔ)步,且語(yǔ)步可自由組合。將文獻(xiàn)引言以此分類,在結(jié)合Swales等體裁分析學(xué)家的語(yǔ)料庫(kù)積累上,通過(guò)自編程得到引言詞表(見(jiàn)表1)。
引言詞表具有以下優(yōu)勢(shì):①匯總引言部分的高頻單詞,專注引言體裁的檢索需求,為引言的規(guī)范寫作提供參考與借鑒;②實(shí)用性強(qiáng),可利用重合率來(lái)進(jìn)行語(yǔ)類驗(yàn)證、語(yǔ)步判定,最大程度地滿足讀者的實(shí)際需要;③收詞范圍較廣,取材范圍覆蓋學(xué)術(shù)文獻(xiàn)引言所使用的正式和非正式語(yǔ)體,收詞以高頻核心詞為基礎(chǔ),同時(shí)適當(dāng)收錄了各體裁分析學(xué)家認(rèn)為讀者在寫作引言時(shí)所必須的部分詞語(yǔ);④詞性收錄全面,對(duì)動(dòng)詞、名詞、副詞、第三人稱單數(shù)等做了詳細(xì)歸納。
引言是學(xué)術(shù)文獻(xiàn)不可或缺的組成部分,起著開(kāi)篇點(diǎn)題的作用,是決定學(xué)術(shù)文獻(xiàn)質(zhì)量的重要因素之一;被引頻次是反映學(xué)術(shù)文獻(xiàn)的科研水平和學(xué)術(shù)影響力的重要指標(biāo)之一。針對(duì)兩者是否存在相關(guān)關(guān)系這一問(wèn)題,本文提出用語(yǔ)步重合率,即各語(yǔ)步與引言詞表相重合的數(shù)量占各語(yǔ)步總詞數(shù)的比,與論文被引頻次進(jìn)行相關(guān)性分析,探討CARS模型對(duì)論文被引頻次的影響。
為分析引言的內(nèi)容結(jié)構(gòu)與被引頻次的關(guān)系,基于CARS模型構(gòu)建引言詞表,引言詞表的數(shù)據(jù)來(lái)源于圖書情報(bào)領(lǐng)域的500篇隨機(jī)學(xué)術(shù)文獻(xiàn)。為保證樣本檢驗(yàn)數(shù)據(jù)能正確反映引言詞表對(duì)學(xué)術(shù)文獻(xiàn)被引頻次的影響,樣本檢驗(yàn)數(shù)據(jù)源區(qū)別于引言詞表數(shù)據(jù)源。樣本檢驗(yàn)數(shù)據(jù)來(lái)源于Web of Science的科學(xué)引文(SCI-EXPANDED)數(shù)據(jù)庫(kù),檢索方式采用高級(jí)檢索,以“InformationScience & Library Science”為學(xué)科類別,以“knowledge management”為檢索詞,文獻(xiàn)類型為“Article”,限定語(yǔ)言為“English”,發(fā)表時(shí)間為2014年,檢索時(shí)間為2018年5月24日,共檢索到789篇文獻(xiàn)。隨機(jī)抽取25篇文獻(xiàn)作為樣本數(shù)據(jù)。
表1 引言詞表(部分)
將25篇文獻(xiàn)按照被引頻次(排除自引)排序得到表2,每篇學(xué)術(shù)文獻(xiàn)的引言內(nèi)容按照“闡述重要性”“文獻(xiàn)綜述”“研究不足”“研究目的”“預(yù)示重要結(jié)果”“論文結(jié)構(gòu)”6個(gè)語(yǔ)步歸類,分別統(tǒng)計(jì)每篇引言在各語(yǔ)步中出現(xiàn)的總詞數(shù)m。通過(guò)Python編程,以引言詞表分別過(guò)濾引言各語(yǔ)步,得到引言中與詞表重合的詞數(shù)n,n/m為各語(yǔ)步與引言詞表相重合的數(shù)量占各語(yǔ)步總詞數(shù)的比,即重合率。
2.2.1 被引頻次與引言各語(yǔ)步重合率的對(duì)比分析
為驗(yàn)證學(xué)術(shù)文獻(xiàn)引言結(jié)構(gòu)對(duì)被引頻次的影響,將引言各語(yǔ)步的詞表重合率與被引頻次比較。各語(yǔ)步的詞表重合率與引言寫作的規(guī)范程度有關(guān),重合率越高,表示引言與“引言詞表”更相符,相應(yīng)的引言寫作用詞越規(guī)范。若某篇文獻(xiàn)沒(méi)有個(gè)別語(yǔ)步,統(tǒng)計(jì)時(shí)以錯(cuò)誤值“#N/”代替,橫軸表示25篇引言,縱軸表示各語(yǔ)步與詞表的重合率(見(jiàn)圖1、圖2)。
由圖1發(fā)現(xiàn),“研究不足”“預(yù)示重要結(jié)果”語(yǔ)步的詞表重合率與被引頻次曲線走勢(shì)基本一致,被引頻次隨著詞表重合率的降低而降低,但也存在例外(如序號(hào)20的學(xué)術(shù)文獻(xiàn)引言“預(yù)示重要結(jié)果”語(yǔ)步的詞表重合率驟然升高)。由圖2可見(jiàn),“闡述重要性”“文獻(xiàn)綜述”“研究目的”語(yǔ)步的詞表重合率總體一致,皆與被引頻次的曲線走勢(shì)有較大的不同,說(shuō)明這3個(gè)語(yǔ)步詞表重合率對(duì)被引頻次的影響較弱?!把芯磕康摹闭Z(yǔ)步的平均詞表重合率最高為0.11,其次是“闡述重要性”語(yǔ)步,說(shuō)明這兩個(gè)語(yǔ)步在引言寫作時(shí)常用術(shù)語(yǔ)具有更高的穩(wěn)定性?!罢撐慕Y(jié)構(gòu)”語(yǔ)步的樣本太少,數(shù)據(jù)不納入分析。
表2 引言各語(yǔ)步的詞表重合率與被引頻次的比較
圖1 “研究不足”“預(yù)示重要結(jié)果”語(yǔ)步與被引頻次的比較
圖2 “闡述重要性”“文獻(xiàn)綜述”“研究目的”“研究不足”“論文結(jié)構(gòu)”語(yǔ)步與被引頻次的比較
2.2.2 被引頻次與引言各語(yǔ)步重合率的相關(guān)性分析
為更準(zhǔn)確地呈現(xiàn)被引頻次與引言各語(yǔ)步間的關(guān)聯(lián)性,本文在SPSS環(huán)境下,利用表3的數(shù)據(jù)計(jì)算各指標(biāo)間的Spearman相關(guān)系數(shù)。
被引頻次與除“論文結(jié)構(gòu)”外的其他所有語(yǔ)步均呈正相關(guān),其中與“研究不足”語(yǔ)步呈強(qiáng)相關(guān)性,相關(guān)系數(shù)為0.552。被引頻次與“闡述重要性”“預(yù)示重要結(jié)果”語(yǔ)步均呈較強(qiáng)相關(guān),相關(guān)系數(shù)分別為0.451和0.421。由表3還發(fā)現(xiàn),“論文結(jié)構(gòu)”語(yǔ)步與被引頻次呈負(fù)相關(guān),相關(guān)系數(shù)為-0.391。“論文結(jié)構(gòu)”語(yǔ)步僅簡(jiǎn)要概括文獻(xiàn)的各章節(jié),并不包含實(shí)質(zhì)學(xué)術(shù)價(jià)值和信息,與被引頻次相關(guān)性較低。
表3 被引頻次與引言各語(yǔ)步間的相關(guān)性
(1)“研究不足”語(yǔ)步對(duì)被引頻次的影響?!把芯坎蛔恪闭Z(yǔ)步可以指出前人研究的問(wèn)題與不足,填補(bǔ)科學(xué)研究的缺陷和空白。在前人提出的研究課題中,雖然已有初步的研究成果,但隨著科學(xué)技術(shù)的不斷發(fā)展,還有待補(bǔ)充、豐富。這種補(bǔ)充性或糾正性的研究課題,強(qiáng)調(diào)當(dāng)前研究的必要性,對(duì)社會(huì)發(fā)展有著深遠(yuǎn)的科學(xué)價(jià)值和現(xiàn)實(shí)指導(dǎo)意義。“研究不足”語(yǔ)步是引言內(nèi)容的重要組成部分,與被引頻次聯(lián)系緊密。
(2)“闡述重要性”語(yǔ)步對(duì)被引頻次的影響。“闡述重要性”語(yǔ)步的主要作用是聲明研究課題的重要意義,闡述研究主題“重大而主要”的學(xué)術(shù)價(jià)值和社會(huì)影響,以達(dá)到吸引潛在讀者的目的。在開(kāi)篇引言部分,讀者就可獲知文獻(xiàn)的學(xué)術(shù)價(jià)值,從而激發(fā)深度閱讀行為,被引頻次相應(yīng)提高。
(3)“預(yù)示重要結(jié)果”語(yǔ)步對(duì)被引頻次的影響?!邦A(yù)示重要結(jié)果”語(yǔ)步說(shuō)明作者在當(dāng)前研究中的獨(dú)創(chuàng)性貢獻(xiàn),推進(jìn)或解決某一領(lǐng)域的發(fā)展?!瓣U述重要性”語(yǔ)步與“預(yù)示重要結(jié)果”語(yǔ)步互為關(guān)聯(lián),但兩者側(cè)重點(diǎn)不同。前者強(qiáng)調(diào)研究課題進(jìn)行的必要性與目的,后者著重研究課題取得的成效和貢獻(xiàn)。學(xué)術(shù)貢獻(xiàn)是一篇學(xué)術(shù)文獻(xiàn)的核心價(jià)值,“預(yù)示重要結(jié)果”語(yǔ)步是影響被引頻次的因素之一。
被引頻次是反映學(xué)術(shù)文獻(xiàn)影響力的重要指標(biāo),被引頻次有眾多的影響因素,本文的實(shí)驗(yàn)數(shù)據(jù)驗(yàn)證了引言語(yǔ)步與被引頻次存在關(guān)系。上述研究發(fā)現(xiàn),改進(jìn)后的CARS模型中“研究不足”“闡述重要性”“預(yù)示重要結(jié)果”3個(gè)引言語(yǔ)步的詞表重合率與被引頻次呈現(xiàn)較強(qiáng)相關(guān)性,引言語(yǔ)步的詞表重合率越高,代表引言寫作越規(guī)范,相應(yīng)的學(xué)術(shù)文獻(xiàn)被引頻次和影響力就高。這表明,引言寫作規(guī)范度與被引頻次呈正相關(guān)關(guān)系,寫作規(guī)范度對(duì)文獻(xiàn)的被引頻次影響較大,可作為影響被引頻次的指標(biāo)。因此,為提高學(xué)術(shù)文獻(xiàn)的被引頻次和影響力,學(xué)者應(yīng)選擇合適的引言結(jié)構(gòu)和語(yǔ)步,規(guī)范學(xué)術(shù)文獻(xiàn)的引言寫作。
本文對(duì)CARS模型提出改進(jìn),并對(duì)引言分別建立了“闡述重要性”“文獻(xiàn)綜述”“研究不足”“研究目的”“預(yù)示重要結(jié)果”“論文結(jié)構(gòu)”6個(gè)語(yǔ)步的詞表。本研究豐富了引言結(jié)構(gòu)內(nèi)容并提高了其應(yīng)用價(jià)值,通過(guò)對(duì)引言各語(yǔ)步與被引頻次的相關(guān)分析,發(fā)現(xiàn)“研究不足”“預(yù)示重要結(jié)果”“闡述重要性”語(yǔ)步的詞表重合率與被引頻次呈現(xiàn)較強(qiáng)相關(guān)性,表明這3個(gè)語(yǔ)步的寫作規(guī)范度可以作為影響被引頻次的指標(biāo),同時(shí)表明科學(xué)的引言結(jié)構(gòu)對(duì)學(xué)術(shù)文獻(xiàn)的被引頻次有重要影響。
因此,學(xué)者可規(guī)范學(xué)術(shù)文獻(xiàn)的引言寫作,使用CARS模型構(gòu)建合適的引言結(jié)構(gòu),在引言部分重點(diǎn)闡述“原有研究的缺陷”“本課題的重要性”“本課題的學(xué)術(shù)貢獻(xiàn)”,進(jìn)而提高我國(guó)期刊論文的被引頻次,提高其學(xué)術(shù)影響力。
模型構(gòu)建過(guò)程中存在以下不足:①本文選取的數(shù)據(jù)樣本范圍單一,只分析了圖書情報(bào)領(lǐng)域?qū)W術(shù)文獻(xiàn)的引言,使結(jié)論分析較片面;②構(gòu)建引言詞表模型時(shí),對(duì)語(yǔ)料庫(kù)的構(gòu)建具有一定的主觀性,使實(shí)驗(yàn)數(shù)據(jù)存在一定誤差。后續(xù)研究中將對(duì)引言詞表模型做相應(yīng)的更新,創(chuàng)建學(xué)術(shù)文獻(xiàn)引言結(jié)構(gòu)語(yǔ)料庫(kù),為引言的規(guī)范寫作提供參考與借鑒,從而提高學(xué)術(shù)文獻(xiàn)的應(yīng)用價(jià)值和學(xué)術(shù)影響力。