周桂蓮,許育彬,席美麗,華千勇
(西北農(nóng)林科技大學(xué)《麥類作物學(xué)報》編輯部 陜西楊凌712100)
大多數(shù)生物學(xué)、農(nóng)學(xué)和醫(yī)學(xué)期刊都會刊登分子生物學(xué)論文。這類論文中常常涉及到基因、基因在染色體上的位點以及引物、分子標記等內(nèi)容。盡管這些內(nèi)容早已不是什么新鮮事物,但在許多期刊發(fā)表的這類論文中,基因、位點、引物、分子標記、引物序列等符號的編排格式至今仍然五花八門;而且因為無據(jù)可依,致使許多編輯人員無所適從。雖然已經(jīng)有人撰文探討過基因、蛋白質(zhì)、內(nèi)切酶、病毒和質(zhì)粒的正斜體編排問題[1-5],但論述都比較簡短,且都未涉及基因位點、引物、分子標記等符號以及基因芯片型號、引物的核苷酸序列、基因符號中阿拉伯數(shù)字的規(guī)范編排問題,有些文章還給出了一些含糊甚至錯誤的信息,比如有文章稱:“按照《TIG 遺傳命名指南》[6],人類基因的符號由斜體大寫的拉丁字母與正體的阿拉伯數(shù)字組成?!边@其中“正體的阿拉伯數(shù)字”就是個錯誤信息,《TIG遺傳命名指南》中并沒有這樣的信息。因此,本文統(tǒng)計分析了國內(nèi)外 130種生物學(xué)期刊關(guān)于這些符號的編排格式,提出了這些符號的規(guī)范使用建議。
在中國知網(wǎng)《期刊全文數(shù)據(jù)庫》中選取80種近幾年刊登分子生物學(xué)論文較多的學(xué)術(shù)性中文科技期刊,其中,生物學(xué)期刊20種,農(nóng)學(xué)期刊30種,醫(yī)學(xué)期刊30種;在美國《科學(xué)引文數(shù)據(jù)庫》中選取50種近幾年刊登分子生物學(xué)論文較多的英文科技期刊,其中,生物學(xué)期刊10種,農(nóng)學(xué)期刊20種,醫(yī)學(xué)期刊20種。于2017年6月下旬,分別用“分子標記”“基因”“位點”“引物序列”“基因芯片”(或其相應(yīng)的英文)為關(guān)鍵詞逐刊檢索其2016年以來發(fā)表的論文,每刊取不同期號發(fā)表的2~4篇文章,統(tǒng)計其中基因、基因位點、引物、分子標記符號以及SNP基因芯片型號的編排格式,同時統(tǒng)計了引物序列轉(zhuǎn)行時是否加有連字符的情況。
簡單地說,基因是含特定遺傳信息的核苷酸序列,是遺傳信息的最小功能單位[7]。具體一點說,基因是基因組序列中與調(diào)控、轉(zhuǎn)錄和/或其他功能序列相關(guān)聯(lián)的有確定位置的區(qū)段,對應(yīng)于一個遺傳單位[8]。基因的命名在不同物種間還沒有統(tǒng)一的規(guī)則,但各物種內(nèi)的基因命名已趨于遵循統(tǒng)一的規(guī)則,具體可參見有關(guān)文獻[6-12]。比如細菌的基因符號由3個小寫斜體字母組成,具有相同表型的不同基因座(locus,如今一般被翻譯為基因位點)突變用斜體大寫字母后綴相區(qū)別,等位基因用緊隨基因座名稱后的一系列特定的數(shù)字來表示[6],如araA2表示ara基因座A的2位突變。因為每一個物種都有一個國際性的基因命名委員會,已經(jīng)注冊的基因都已被命名,并且經(jīng)過了有關(guān)委員會的審批[6-10],作者在撰寫論文時,一般都會自覺采用已有的名稱;在命名新發(fā)現(xiàn)的基因時,一般也都會遵循本物種的基因命名規(guī)則。因此,絕大多數(shù)學(xué)術(shù)期刊中出現(xiàn)的問題都不是基因名稱是否正確,而是基因符號的編排格式不規(guī)范。最普遍的問題是基因符號的正斜體格式不規(guī)范。在《TIG遺傳命名指南》[6]中,所有基因符號中的字母都被要求為斜體,包括表示復(fù)等位基因的上角標字母(如豌豆crtys)在內(nèi);數(shù)字的正斜體雖然沒有明確要求,但所有舉例中,無論是阿拉伯數(shù)字還是羅馬數(shù)字,也不管它們在基因符號的末尾、中間,還是上標位置,一律都是斜體(例如細菌基因lacA1,lac-23;枯草芽孢桿菌突變體基因spo0A,spoⅡB;斑馬魚基因cyctf219),未見一處例外。而從表1可知,在筆者調(diào)查的80種國內(nèi)學(xué)術(shù)期刊中,基因符號有多種編排格式,其中,所有字母和數(shù)字均為斜體的期刊只占36.25%,字母為斜體、數(shù)字為正體的期刊占31.25%,還有少量期刊是部分字母為斜體、部分字母(比如代表基因座的大寫字母)和數(shù)字為正體(比如將大腸桿菌aroG 基因?qū)懗蒩roG);最不應(yīng)該發(fā)生的情況是,在不同文章,尤其是不同期號的不同文章中,格式不統(tǒng)一,在這一篇文章中是字母和數(shù)字均為斜體,在另一篇文章中是字母斜體、數(shù)字正體,這樣的期刊還不少,占到了總數(shù)的13.75%。這正是沒有統(tǒng)一標準造成的不良后果。
國外 SCI收錄期刊的格式統(tǒng)一度要高得多。在所調(diào)查的 50種期刊中,基因名稱和基因符號的字母和數(shù)字均為斜體的期刊占 90.00%;字母為斜體、數(shù)字為正體的期刊占 10.00%,多為亞非拉國家主辦的期刊;沒有字母和數(shù)字均為正體的期刊。
基因在染色體上占有的特定位置叫基因位點,又稱為遺傳基因座[13]。一個基因位點上往往存在兩個或兩個以上的基因,這些基因被稱為等位基因或復(fù)等位基因[14]?;蛭稽c符號一般也都由字母和阿拉伯數(shù)字組成,有時也會有連字符。在《TIG遺傳命名指南》[6]中,基因位點(locus)被翻譯為基因座,一般是在基因符號后加上適當?shù)暮缶Y來表示;基因位點符號中的字母和數(shù)字也都為斜體,如 1B染色體上控制小麥株高的位點符號為 Rht-B1。國內(nèi)學(xué)術(shù)期刊在基因位點符號的編排格式上更為混亂(見表 1),在筆者調(diào)查的 80種期刊中,字母和數(shù)字均為正體的期刊比例最大(32.50%);字母和數(shù)字均為斜體的期刊次之(27.50%);字母為斜體、數(shù)字為正體的期刊也占有不小的比例(21.25%);在不同文章中格式不統(tǒng)一的期刊占 18.75%,其中個別期刊在同一篇文章中前后的格式都不一致,有的是字母和數(shù)字均為正體,有的是字母斜體、數(shù)字正體。
國外 SCI收錄期刊的格式也不夠統(tǒng)一,但與基因符號的情況相似,仍然以字母和數(shù)字均為斜體者占絕大多數(shù)(82.00%);字母為斜體、數(shù)字為正體的期刊只占 10.00%;不同文章中格式不統(tǒng)一的期刊占8.00%。后兩類多為亞非拉國家主辦的期刊。
引物(primer)是人工合成的、作為 DNA 復(fù)制起始點的兩段寡核苷酸序列[15]。分子標記(molecular markers)有廣義和狹義之分。廣義的分子標記是指可遺傳并可檢測的 DNA序列或蛋白質(zhì),狹義的分子標記是指 DNA標記,也就是能反映生物個體或種群間基因組中某種差異的特異性DNA片段[16]。
引物和分子標記的符號一般也都由字母和數(shù)字組成,應(yīng)該用正體還是斜體,也沒有統(tǒng)一規(guī)定,國內(nèi)學(xué)術(shù)期刊在其編排格式上也不夠統(tǒng)一(見表 1)。在筆者調(diào)查的 80種中文期刊中,引物符號中的字母和數(shù)字均為正體的期刊占 70.00%,字母和數(shù)字均為斜體的期刊占 8.75%,在不同文章中正斜體格式不統(tǒng)一的期刊占 21.25%;分子標記符號中的字母和數(shù)字均為正體的期刊占48.75%,字母和數(shù)字均為斜體的期刊占16.25%,字母為斜體、數(shù)字為正體的期刊占 7.50%,在不同文章中或者同一篇文章的正文與圖表中正斜體格式不統(tǒng)一的期刊占27.50%。
SCI收錄的國外期刊中,引物符號的格式比較統(tǒng)一,字母和數(shù)字均為正體的期刊占86.00%,均為斜體的期刊占12.00%;不同文章中格式不統(tǒng)一的期刊只占2.00%;分子標記符號的格式也比較統(tǒng)一,字母和數(shù)字均為正體的期刊占 82.00%,均為斜體的期刊占12.00%;不同文章中格式不統(tǒng)一的期刊占6.00%。
表1 國內(nèi)外科技期刊所發(fā)表的分子生物學(xué)論文中幾種常見名詞符號的編排格式Tab.1 Formatting of normal nouns and symbols for molecular biology papers published in domestic or overseas sci-tech journals
需要特別說明的是,有一類 SSR(Simple sequence repeats)標記,比如檢測小麥抗病基因的 SSR標記 Xcfd81、Xwmc154、Xgwm429等等,其符號開頭的 X代表基因位點,所以這類標記符號一般都被排為斜體,這是應(yīng)該的。同一種期刊的不同論文或同一篇論文中,這類標記被排為斜體,其他標記(如SCAR標記 SCAR203)被排為正體,筆者在調(diào)查統(tǒng)計時,未將其視為“格式不統(tǒng)一”。
引物序列(Primer sequences)即引物的核苷酸序列,也就是 DNA或 RNA中堿基的排列順序,如 5'-GTGATGAAGTCGGAGTGGCA-3',其中的 A、T、G、C代表4種堿基。有些引物比較長,含有四五十個堿基,排版時往往需要轉(zhuǎn)行,轉(zhuǎn)行時,不宜在堿基之間加連字符,因為一個連字符代表一個省略的堿基,轉(zhuǎn)行時所加的連字符容易被誤認為省略了一個堿基。
國內(nèi)中文期刊中,引物序列符號轉(zhuǎn)行時不加連字符的期刊占 57.50%,轉(zhuǎn)行時加連字符的期刊占42.50%。SCI收錄的國外期刊中,引物序列符號轉(zhuǎn)行時不加連字符的占 92.00%,轉(zhuǎn)行時加連字符的占8.00%,后者基本為亞洲和非洲期刊。
基因芯片又稱DNA 芯片(DNA chip)、DNA 微陣列(DNA microarray)、DNA 微陣列芯片(DNA microarray chip),是以預(yù)先設(shè)計的方式將大量的生物訊息密碼(寡核苷酸、cDNA、基因組DNA 等)固定在玻片、硅片、聚丙烯膜、尼龍膜等固相載體上組成的密集分子陣列[17]。其中的SNP(Single Nucleotide Polymorphisms,單核苷酸多態(tài)性)基因芯片有90K、60K等不同型號。SCI收錄的國外期刊中,這種K為大寫者占96.00%,為小寫者僅占4.00%,并且與數(shù)字之間均無空格。但國內(nèi)中文期刊中,這種K有大寫、小寫、與數(shù)字之間留空格和不留空格4種格式,如90K、90,K、90k、90,k,有時同一篇論文中出現(xiàn)4種或3種格式:K為大寫、與數(shù)字之間無空格的期刊占38.75%;K為小寫、與數(shù)字之間有空格或無空格的期刊占17.50%;在不同文章或同一篇文章中格式不統(tǒng)一的期刊占31.25%。
沒有統(tǒng)一的國家標準,可能是造成我國眾多科技期刊分子生物學(xué)名詞符號編排不規(guī)范的主要原因。因此,中國科技期刊編輯學(xué)會應(yīng)該盡快牽頭制定與上述分子生物學(xué)符號編排格式有關(guān)的國家標準,讓相關(guān)期刊有據(jù)可依。在標準制定中,應(yīng)以《TIG遺傳命名指南》為基準,以方便期刊排版操作為原則,以多數(shù)國際性期刊的習慣格式為標樣。筆者在此提出幾點建議,供標準制定者和有關(guān)期刊參考:①根據(jù)《TIG遺傳命名指南》及90%國外期刊的慣例,建議基因和位點符號中的字母和數(shù)字都用斜體。②根據(jù) 80%以上國外期刊的慣例,建議引物和標記符號中的字母和數(shù)字都用正體。③將引物序列盡量排在同一行,必須轉(zhuǎn)行時,一定不要加連字符。④根據(jù) 95%以上國外期刊的慣例,建議SNP基因芯片型號中的字母大寫,字母與數(shù)字之間不留空格?!?/p>
[1]張翠英. 基因及蛋白質(zhì)符號的規(guī)范編排[J]. 編輯學(xué)報,2004,16(4):262-263.
[2]郭建順,沈曉峰,張學(xué)東. 分子生物學(xué)書刊中限制性內(nèi)切酶的規(guī)范表達[J]. 編輯學(xué)報,2005,17(3):195-196.
[3]張冰. 科技期刊中基因及蛋白質(zhì)的規(guī)范表達[J]. 學(xué)報編輯論叢,2007:81-83.
[4]夏元玲,高玨,周麗萍,等. 分子生物學(xué)類論文中幾類常見名詞的正斜體編排[J]. 編輯學(xué)報,2009,21(2):127-128.
[5]王連芬,張立方,孫勇. Taq 酶正斜體編排問題的探討[J]. 中國科技期刊研究,2011,22(2):291-292.
[6]分子生物學(xué)進展編輯部. TIG遺傳命名指南[M]. 王金發(fā),陳中健,楊琳,等譯. 北京:科學(xué)出版社,2002.
[7]Helen P. What is a Gene?[J]. Nature,2006(441):398-401.
[8]張輝,丁蘭,梁前進,等. 基因組學(xué)中幾個分子生物學(xué)問題的探討[J]. 生物學(xué)通報,2009,44(3):17-19.
[9]Wain H M,Bruford E A,Lovering R C,et al. Guidelines for human gene nomenclature[J]. Genomics,2002,79(4):464-470.
[10]Wright M W,Bruford E A. Human and orthologous gene nomenclature[J]. Gene,2006(369):1-6.
[11]方福德,向若蘭,楊燕麗,等. 如何命名和書寫基因:最新國際人類基因命名和書寫規(guī)則[J]. 中國醫(yī)學(xué)科學(xué)院學(xué)報,2005,27(129):128-134.
[12]Price C A,Reardon E M. Mendel,a database of nomenclature for sequenced plant genes[J]. Nucleic Acids Reserch,2001,29(1):118-119.
[13]Robert H. 世界最新英漢雙解細胞與分子生物學(xué)詞典[M]. 3版. 西安:世界圖書出版公司,2008:319.
[14]趙壽元,喬守怡. 現(xiàn)代分子生物學(xué)[M]. 2版. 北京:高等教育出版社,2008:35.
[15]劉春宇,張春玲,夏家輝. 隨機引物在分子生物學(xué)研究中的應(yīng)用[J]. 生物化學(xué)與生物物理進展,1996,23(6):517-520.
[16]黎裕,賈繼增,王天宇. 分子標記的種類及其發(fā)展[J]. 生物技術(shù)通報,1999(4):19-22.
[17]孫兵,閆彩霞,張廷婷,等. 基因芯片技術(shù)在植物基因克隆中的應(yīng)用研究進展[J]. 基因組學(xué)與應(yīng)用生物學(xué),2009,28(1):153-158.