■張紅霞 冀倫文 賈麗紅 王晶冰
太原理工大學期刊中心,山西省太原市迎澤西大街79號 030024
關(guān)鍵詞是為了便于文獻檢索而選取的、能夠反映論文主題的詞語或術(shù)語。一般每篇論文標注3~8個關(guān)鍵詞,并盡量采用《漢語主題詞表》等提供的規(guī)范詞,未被各類詞表收錄的新學科、新技術(shù)中的重要術(shù)語和地區(qū)、人物、文獻、產(chǎn)品及重要數(shù)據(jù)名稱,也可作為關(guān)鍵詞[1]。
隨著科技的飛速發(fā)展,文獻量急劇增長,依靠各種學術(shù)文獻數(shù)據(jù)庫檢索文獻已成為人們獲取學術(shù)信息的主要方式。如果說出版是信息傳播的第一步,那么數(shù)據(jù)庫檢索中的“被發(fā)現(xiàn)”就是信息傳播的第二步,也是傳播鏈上最關(guān)鍵的一環(huán);若此環(huán)松動、掉鏈,文獻“被撈出”的概率將很小,甚至石沉大海。論文“被發(fā)現(xiàn)”的途徑主要包括主題檢索、關(guān)鍵詞檢索、摘要檢索、標題檢索、作者檢索等,其中關(guān)鍵詞檢索是用戶最常用的文獻檢索方式之一,只有用戶檢索的關(guān)鍵詞與某篇論文的關(guān)鍵詞一致時,這篇論文才會被檢出。因此,關(guān)鍵詞作為論文信息傳播的源頭,在論文的檢索過程中擔負著文獻“被正確、恰當、充分地檢出”的重任。學術(shù)期刊編輯作為學術(shù)信息的傳播者[2-3],承擔著信息選擇、加工、傳播的使命,要特別重視論文關(guān)鍵詞的標引工作。關(guān)鍵詞標引質(zhì)量的高低直接關(guān)系著學術(shù)文獻的有效傳播和充分利用,從而影響著期刊的學術(shù)影響力。
自20世紀 80 年代起,學者們就持續(xù)不斷地進行著學術(shù)論文關(guān)鍵詞標引的研究,發(fā)現(xiàn)學術(shù)期刊論文普遍存在著關(guān)鍵詞標引不當?shù)膯栴},主要表現(xiàn)為:所選關(guān)鍵詞不能準確、全面地反映論文主要內(nèi)容,存在主題信息遺漏、不明晰、不準確的問題[4];采用無檢索價值的泛義詞作為關(guān)鍵詞;把標題隨意拆分成幾個詞作為關(guān)鍵詞[5];為了表達某一確切含義,把關(guān)鍵詞寫成多個內(nèi)容全面的短語[6];關(guān)鍵詞(包括英文關(guān)鍵詞)表述不規(guī)范[7-8];縮略詞使用不當[9]等。關(guān)于關(guān)鍵詞的標引,學者們也給出了一些方法和建議,例如:應從研究目的、研究對象、研究方法、研究結(jié)果等方面入手,所選出的關(guān)鍵詞才能準確體現(xiàn)論文的中心內(nèi)容[10-11];關(guān)鍵詞的邏輯組合應能鮮明直觀地體現(xiàn)論文主題內(nèi)容[12];關(guān)鍵詞的標引步驟包括先對論文進行主題分析,然后確定若干主題概念,再把主題概念轉(zhuǎn)換為關(guān)鍵詞[4,13-14];依照有關(guān)國家標準,關(guān)鍵詞標引要遵循專指性原則、組配原則和上位詞標引原則[10,14];要多琢磨用戶檢索文獻時的思路和可能采用的詞匯,提高論文的被檢率和利用率[5,12]。這些研究成果為關(guān)鍵詞的正確標引提供了很好的指導與幫助,但鮮有學者對所提出的標引方法和選詞原則進行深入探討,僅以幾個簡單例子對所給出的方法予以說明,可操作性不強。因此,有必要進一步探討關(guān)鍵詞的標引方法。
通過對國家標準GB/T 3860—2009《文獻主題標引規(guī)則》的研讀、分析[15],筆者發(fā)現(xiàn)該國家標準遵循對文獻進行主題標引的一般規(guī)律,主要是針對有主題詞表可查的受控標引,可為關(guān)鍵詞標引提供參考。因此,本研究參考國標GB/T 3860—2009,結(jié)合中國知網(wǎng)的中國學術(shù)期刊全文數(shù)據(jù)庫,從信息傳播角度探討如何科學、合理地標引關(guān)鍵詞,提出比較系統(tǒng)的關(guān)鍵詞標引方法,并以一篇出版方面的論文關(guān)鍵詞修改實例來說明所提方法的有效性與實用性。
本研究以論文被正確、恰當、充分檢出為目標導向、圍繞信息傳播效果提出關(guān)鍵詞標引方法。此法與文獻[4,13-14]的提法有些類似,也分為三大步驟(表1):(1)通過分析論文主題確定若干個主題概念;(2)將主題概念轉(zhuǎn)換成關(guān)鍵詞;(3)借助文獻數(shù)據(jù)庫對所選關(guān)鍵詞進行輔助性審核與修改。標引過程合理有序,每一步不僅有明確的目標,還有相應的操作方法,如確定主題概念的“四要素法”、主題概念轉(zhuǎn)換為關(guān)鍵詞的三種方式、利用數(shù)據(jù)庫輔助性審核標引結(jié)果的方法等。
表1 關(guān)鍵詞標引步驟說明
學術(shù)論文主題是論文所論述與研究的問題,即論文的核心信息和最主要的內(nèi)容。論文題名往往只能在一定程度上反映論文主題,如研究對象、研究方法等,全面、準確的主題信息還需進一步研究分析;而這對于具有相關(guān)專業(yè)背景、可獲得作者幫助以及對論文已進行數(shù)遍加工與校對的編輯而言,找出論文主題并不難。主題概念是指描述論文主題基本要素的概念。筆者認為,既然論文摘要集中反映論文的主要內(nèi)容或者主題信息,在確定論文主題概念時可借鑒摘要的四要素法(目的、方法、結(jié)果、結(jié)論);同時又考慮到主題概念的詞性(名詞性詞語或相當于名詞的術(shù)語)以及用戶檢索的習慣與需求,最終確定表達主題概念的四要素為研究對象、研究方法、結(jié)果結(jié)論和其他重要信息。這與文獻[11]提出的主題四要素(研究目的、研究類別、研究方法、研究結(jié)果)不同。表2就本研究提出的主題四要素的內(nèi)涵分別予以解釋,并給予實例說明。
在確定主題概念時要遵循三個原則:
(1) 客觀性??陀^分析論文實際具有的主題,這就要求編輯能把握住論文的核心信息。
(2) 一致性。主題概念所反映主題的全面性與專指性應與論文實際具有的主題全面性與專指性基本一致。
(3) 實用性。充分考慮檢索系統(tǒng)目標與用戶的需求,選定論文中有檢索意義的主題概念。
表2 主題概念的四要素內(nèi)涵及實例說明
1.2.1 主題概念轉(zhuǎn)換成關(guān)鍵詞的必要性及轉(zhuǎn)換方式
主題概念轉(zhuǎn)換為關(guān)鍵詞有3種方式,如表3所示。其中主題概念詞即代表主題概念的詞語,可以是一個規(guī)范的、形式較固定的詞語或術(shù)語,也可以是復合程度較高、形式不固定的詞組。
許多作者和編輯不理解關(guān)鍵詞組配表達主題概念等方式,往往將關(guān)鍵詞寫成“內(nèi)容全面”的短語;此時關(guān)鍵詞的限定詞增多、復合程度升高、專指性增強,所檢出的文獻數(shù)量減少,從而嚴重影響了文獻的被檢率和利用率。對數(shù)據(jù)庫用戶而言,其檢索目標是就某一主題獲取盡可能全面的相關(guān)文獻,關(guān)心的是查全率,而不是某一篇或幾篇文獻。因此,在主題概念形式不固定、復合程度較高的情況下,有必要采用組配方式將主題概念轉(zhuǎn)換成2個及以上的關(guān)鍵詞。用戶可通過使用關(guān)鍵詞的組合或者采用高級檢索方式進行檢索,以縮小檢索范圍,提高檢準率。總之,不管采用哪種方式,均是為了便于論文能得到充分、合理、有效的檢索。
表3 主題概念轉(zhuǎn)換關(guān)鍵詞的3種方式
注:“→”表示轉(zhuǎn)換,“→”前為主題概念詞,“→”后為關(guān)鍵詞。
1.2.2 主題概念轉(zhuǎn)換成關(guān)鍵詞的注意事項
(1) 可以通過查詞表來確定專業(yè)術(shù)語表達的規(guī)范性。此類詞表可以是《漢語主題詞表》、某學科的專業(yè)術(shù)語詞典、全國科學技術(shù)名詞審定委員會頒布的科學技術(shù)名詞或醫(yī)學MeSH詞典[16]。
(2) 實際上許多學科沒有專業(yè)術(shù)語詞典,并且專業(yè)詞典的更新速度遠遠趕不上新術(shù)語的涌現(xiàn)速度。這種情形下有2種處理方式:①若該詞是同行認可的、形式較固定的、規(guī)范的或使用頻率高的術(shù)語,則直接作為關(guān)鍵詞;②若該詞的復合程度較高、表達形式不固定且可拆分,則采用關(guān)鍵詞組配的方式。
(3) 主題概念轉(zhuǎn)換成關(guān)鍵詞時,要注意選用有檢索意義的詞,這類關(guān)鍵詞可分為具有獨立檢索意義的詞和具有輔助檢索意義的詞2種,如國際證券市場、盾構(gòu)隧道、金屬有機骨架材料,及數(shù)值模擬、綜述、算法、調(diào)研等。而研究、探討、思考、分析等沒有檢索意義的詞應避免用作關(guān)鍵詞。
關(guān)鍵詞的規(guī)范性、使用頻率對查全率的影響及其組配方式、表達方式的合理性都需要進一步審核分析,而數(shù)據(jù)庫便是最佳的輔助媒介。
數(shù)據(jù)庫輔助審核、修改關(guān)鍵詞步驟如下:(1)選擇關(guān)鍵詞作為檢索條件,將選好的關(guān)鍵詞輸入檢索框;(2)通過檢出文獻數(shù)判斷關(guān)鍵詞的使用頻率、規(guī)范性及適用性;(3)依據(jù)判斷結(jié)果對所選關(guān)鍵詞進行修改。雖然根據(jù)檢出結(jié)果不一定能準確判斷該詞的適用性,但如表1所述,可以解決所選關(guān)鍵詞可能存在的突出問題,進一步保障論文的查全率與檢準率。
為了說明所提方法的有效性,本研究以某些論文中的關(guān)鍵詞作為檢索詞,利用關(guān)鍵詞檢索方式進行檢索,得出檢出結(jié)果及關(guān)鍵詞修改意見(表4)。
(1) 可利用中國學術(shù)期刊全文數(shù)據(jù)庫檢驗關(guān)鍵詞表達的規(guī)范性。編輯加工學術(shù)論文時,經(jīng)常會遇到專業(yè)術(shù)語前后表述不一致的情形,此時可以通過專業(yè)詞典、數(shù)據(jù)庫等判斷專業(yè)術(shù)語的規(guī)范性、通用性及適用性。例如表4中的“MOF”與“MOFs”、“蒸氣滲透”與“蒸汽滲透”、“金屬有機框架材料”與“金屬有機骨架材料”,通過數(shù)據(jù)庫審核發(fā)現(xiàn)每組均是不規(guī)范表達與規(guī)范表達的問題,只有后者才符合原論文的本意。
(2) 編輯在對專業(yè)術(shù)語不熟悉的情況下,可以通過檢出文獻數(shù)得出該詞的使用頻率,進而決定是直接把主題概念詞作為關(guān)鍵詞,還是采用組配的方式來表達。例如表4中“燃氣輪機冷卻系統(tǒng)”和“深埋硬巖隧道”使用頻率極低,因此不適合直接用作關(guān)鍵詞,必須采用關(guān)鍵詞組配的方式。
(3) 如果某一關(guān)鍵詞的檢出文獻數(shù)特別少,應視具體情況進行處理,可采用將上位詞作為關(guān)鍵詞、原詞與上位詞同時作為關(guān)鍵詞這2種處理方式。如用“單齒配體”代替“非手性單齒配體”、用“封面設計”“字體設計”代替“刊名字體設計”。需要注意的是,部分關(guān)鍵詞所代表的研究方向為學科前沿,雖然檢出文獻數(shù)較少,但仍應用作關(guān)鍵詞,如“鋰硒電池”一詞,檢出的文獻只有7條,但仍應用作關(guān)鍵詞,并增加其上位詞“鋰離子電池”作為關(guān)鍵詞。
(4) 代表研究對象、研究方法的關(guān)鍵詞可以稱之為核心關(guān)鍵詞,對這些詞的審核要格外慎重。如果這些詞作為檢索詞且檢出文獻數(shù)特別少時,要考慮換詞,如采用其上位詞或采用兩個使用頻率高的關(guān)鍵詞組配的方式來提升論文的被檢索率。
表4 以某些關(guān)鍵詞作為檢索詞在數(shù)據(jù)庫中檢索的結(jié)果及關(guān)鍵詞修改意見
注:所用的數(shù)據(jù)庫為中國知網(wǎng)的中國學術(shù)期刊全文數(shù)據(jù)庫,檢索方式為關(guān)鍵詞字段檢索;檢索日期為2018-11-09。
特別需要說明的是,表4中的例子不是個例,在審核關(guān)鍵詞時會經(jīng)常遇到這些情形,此時只有經(jīng)過關(guān)鍵詞審核和修改,才能對所選關(guān)鍵詞的合理性有一定把握,故十分有必要利用數(shù)據(jù)庫對關(guān)鍵詞進行輔助性審核與修改。
在實際工作中,編輯所面對的是作者已標出的論文關(guān)鍵詞。因此在運用本方法修改關(guān)鍵詞時,需要在把握論文的核心內(nèi)容并與作者充分溝通的前提下,以已標出的關(guān)鍵詞為參考來重新標引關(guān)鍵詞。
為了便于編輯同仁對該方法的理解,筆者專門選取一篇出版類論文作為實例,運用本研究的關(guān)鍵詞標引方法對論文原有關(guān)鍵詞進行修改(表5)。該文題名為《上海市英文科技期刊出版現(xiàn)狀分析與思考》,主要內(nèi)容是從期刊的基本情況、期刊采編系統(tǒng)、期刊網(wǎng)站建設、期刊國際合作出版、期刊出版模式等方面對上海市英文科技期刊的出版現(xiàn)狀進行調(diào)研,得出亟需提升英文科技期刊數(shù)量和質(zhì)量、期刊專業(yè)化程度、期刊網(wǎng)站建設質(zhì)量與期刊國際影響力的結(jié)論。
表5 運用本研究方法修改論文關(guān)鍵詞的實例
注:括號內(nèi)的數(shù)字為在關(guān)鍵詞檢索方式下,以該關(guān)鍵詞作為檢索詞的檢索結(jié)果(檢出文獻數(shù));檢索日期為2018-11-09。
通過對實例關(guān)鍵詞的標引,可以得出以下結(jié)論。
(1) 該方法具有實際操作性。作者和編輯有章可依、心中有譜,就不會“任性”地選擇關(guān)鍵詞,不易產(chǎn)生信息遺漏、標引不準確的問題。
(2) 修后關(guān)鍵詞個數(shù)較原文關(guān)鍵詞多了4個,更全面地反映論文主題內(nèi)容,便于數(shù)據(jù)庫用戶從多個角度檢索到該論文,從而充分發(fā)揮論文的學術(shù)價值。Uddin等[17]研究論文被引頻次與關(guān)鍵詞個數(shù)之間的關(guān)系,發(fā)現(xiàn)在不考慮論文學術(shù)質(zhì)量的前提下,論文被引頻次與關(guān)鍵詞個數(shù)呈正相關(guān),即論文關(guān)鍵詞個數(shù)越多,被引頻次越高。因此,為使文獻得到充分的利用,關(guān)鍵詞個數(shù)偏多為好(≤8)。
(3) 由主題概念轉(zhuǎn)換成關(guān)鍵詞時,要充分考慮詞語的規(guī)范性和使用頻率。如國際合作出版(6)→國際合作(出版類33)、期刊出版模式(1)→出版模式(538)、上海市(79642)→上海(139590)、出版現(xiàn)狀分析(1)→出版現(xiàn)狀(220)(括號內(nèi)數(shù)字為以該詞作為檢索詞的檢出文獻數(shù),檢索日期為2018-11-09)。建議有關(guān)部門盡快建設我國的主題詞電子詞庫[18-19],便于編輯及用戶檢索查詢,提高關(guān)鍵詞的標引精度和數(shù)據(jù)庫的檢索效率。
(4) 對轉(zhuǎn)換后的關(guān)鍵詞進行優(yōu)化與精選。最終確定的關(guān)鍵詞比轉(zhuǎn)換后的關(guān)鍵詞少了“調(diào)研”和“出版模式”。刪除原因在于“調(diào)研”是該文的研究方法,意義較泛;“出版模式”在原文中探討較少。
(5) 有針對性地審核關(guān)鍵詞,不是每一個詞都需要審核。不需要審核熟知的規(guī)范詞和專業(yè)術(shù)語,重點審核那些無法判斷其規(guī)范性和使用頻率的關(guān)鍵詞。
本研究提出一個比較系統(tǒng)的關(guān)鍵詞標引方法:從研究對象、研究方法、結(jié)果結(jié)論、其他重要信息4個方面去確定論文的主題概念,以準確、全面地反映論文的主題信息;采用組配、上位詞等方式把主題概念轉(zhuǎn)換為關(guān)鍵詞或者直接把主題概念詞作為關(guān)鍵詞;并借助文獻數(shù)據(jù)庫對所選關(guān)鍵詞進行輔助性審核和修改。
通過上述研究,筆者對編輯關(guān)鍵詞標引工作及我國文獻數(shù)據(jù)庫的發(fā)展提出以下2點建議:(1)關(guān)鍵詞標引質(zhì)量的高低直接影響學術(shù)文獻的有效傳播和充分利用,因此要高度重視關(guān)鍵詞的標引工作,建議把關(guān)鍵詞標引質(zhì)量控制作為科技期刊編輯規(guī)范化的一項內(nèi)容,并加強關(guān)鍵詞標引方面的培訓。(2)為大幅提升文獻的傳播效果和利用價值,我國學術(shù)期刊文獻數(shù)據(jù)庫需要加快主題詞庫建設步伐,向優(yōu)秀數(shù)據(jù)庫學習。如國外的Web of Science數(shù)據(jù)庫中每篇文獻的關(guān)鍵詞除文獻原有的關(guān)鍵詞外,還添加了計算機自動抽取的關(guān)鍵詞;EI數(shù)據(jù)庫有自己的主題詞(受控詞)庫,每篇文獻的關(guān)鍵詞除文獻原有的關(guān)鍵詞外,還標出一定數(shù)量的受控關(guān)鍵詞,進一步提升了文獻被發(fā)現(xiàn)、被利用的概率。
作為關(guān)鍵詞標引方面的探討,本研究希望能給予從事、研究關(guān)鍵詞標引工作的人員提供一些有益的幫助和思路,同時也歡迎各位對研究的不足之處批評指正。