郜星晨 姜 偉 劉紹平
長江中游常見魚類DNA條形碼研究及其電子芯片分析*
郜星晨1姜 偉1①劉紹平2
(1. 中國長江三峽集團有限公司中華鱘研究所 三峽工程魚類資源保護湖北省重點實驗室 宜昌 443100; 2. 農(nóng)業(yè)農(nóng)村部長江中上游漁業(yè)資源環(huán)境科學(xué)觀測實驗站 中國水產(chǎn)科學(xué)研究院長江水產(chǎn)研究所 武漢 430223)
為建立長江中游常見魚類的快速鑒別方法,文獻調(diào)研了7目11科50屬64種魚類名錄,GenBank共獲取168條線粒體細胞色素c氧化酶I (Ⅰ)序列,分析了序列特征、不同階元Kimura-2- paramater (K2P)遺傳距離及系統(tǒng)進化關(guān)系。結(jié)果顯示,64種魚類的種間遺傳距離(平均值為0.084)明顯大于種內(nèi)(平均值為0.0079),NJ樹上不同物種均能以較高支持度聚類成獨立分支,以線粒體Ⅰ序列作為DNA條形碼可準(zhǔn)確鑒定所研究魚類;綜合利用分子生物學(xué)軟件篩選物種特異性探針,最終43種魚類可篩選出112條物種特異性探針,物種識別率為67.2%。本研究驗證了DNA條形碼芯片技術(shù)在長江中游魚類物種鑒定的可行性,可為該地區(qū)魚類物種多樣性保護提供技術(shù)支持。
長江中游;DNA條形碼;電子芯片
長江是世界第三、中國第一大河流,宜昌至湖口縣為中游段(29°30¢~30°36¢N, 113224¢~115258¢E)。中游江寬流曲,河網(wǎng)發(fā)達,水質(zhì)肥沃,餌料生物豐富(Yi, 2011),與通江湖泊形成了獨特而完整的江湖復(fù)合生態(tài)系統(tǒng)。水流湍急和江河緩流中的魚類相互銜接和交替,形成了具有較廣種類的江河平原區(qū)系復(fù)合體魚類區(qū)系(胡軍華等, 2008)。中游水域孕育著豐富的魚類資源,其中不乏珍稀、名貴以及重要的經(jīng)濟魚類,是我國寶貴的淡水魚類種質(zhì)資源庫。近半個世紀(jì)以來,環(huán)境污染、水工建設(shè)、圍湖造田以及過渡捕撈等造成了魚類生境片段化、棲息地逐漸喪失,嚴(yán)重影響了其生存和繁殖(Yi, 2011)?!堕L江魚類志》記錄中游魚類119種(湖北省水生生物研究所魚類研究室等, 1976),根據(jù)新的研究,刪除同種異名、偶見種,整理得到長江中游魚類97種,隸屬14目22科68屬。2003~2008年,在長江中游及洞庭湖、鄱陽湖共監(jiān)測到魚類14目22科86種(胡軍華等, 2008);2009~2010年的調(diào)查結(jié)果為6目10科55種(劉春池等, 2012)??梢姡L江中游漁業(yè)資源嚴(yán)重衰退,魚類種群結(jié)構(gòu)在不斷簡化,生態(tài)系統(tǒng)功能逐步退化。有效利用自然資源、保護中游地區(qū)魚類多樣性成為緊迫而艱巨任務(wù)。然而,魚類種類繁多,傳統(tǒng)的魚類分類主要依據(jù)外部形態(tài)特征,不同生長階段其形態(tài)特征的差異給鑒定及分類帶來了許多困難(柳淑芳等, 2016)。Hebert等(2003)提出的DNA條形碼概念,即通過一段標(biāo)準(zhǔn)的DNA序列對物種進行鑒定,為魚類的快速鑒定提供了新的思路。在加拿大、古巴、北美、阿根廷等國家不同種類的魚中得到了成功應(yīng)用(Hubert, 2008; Lara, 2010; April, 2011; Mabragana, 2011)。中國也開展了DNA條形碼的魚類鑒別研究和應(yīng)用。彭居俐等(2009)成功鑒定了鲌屬()的4種魚,Zhang等(2012)鑒別了中國南海的242種1336條魚類。作者曾經(jīng)以DNA條形碼技術(shù)實現(xiàn)了鲀形目(Tetraodontiformes)魚類的準(zhǔn)確鑒定,證實Ⅰ基因可以用于硬骨魚類物種鑒定(郜星晨, 2005)。隨著分子條形碼技術(shù)的不斷發(fā)展,結(jié)合電子芯片自身快速、靈敏及高通量等優(yōu)點,DNA條形碼芯片技術(shù)已成為一種識別鑒定物種及確定階元歸屬的理想工具。但國內(nèi)外相關(guān)的研究工作相對較少,Kochzius等(2008)將芯片技術(shù)用于魚類鑒定,證明了16S rRNA基因用于設(shè)計微陣列探針區(qū)分歐洲海洋至少11種魚類的實用性。柳淑芳等(2016)篩選了山東沿海常見的77種常見魚類DNA條形碼物種特異性探針,最終有64種魚類可用于制作DNA條形碼芯片。關(guān)于我國淡水魚類的DNA芯片適用性研究尚未開展,因此,本研究擬根據(jù)長江中游魚類種類分布情況,探討DNA條形碼技術(shù)的適用性,并篩選物種特異性探針,從而為長江中游常見魚類的DNA條形碼芯片研發(fā)工作提供基礎(chǔ)資料和技術(shù)支撐。
根據(jù)中國知網(wǎng)數(shù)據(jù)庫(CNKI)查到的100余篇主題為“長江中游魚類”、“魚類多樣性”、“魚類物種組成”和“漁業(yè)資源調(diào)查”的調(diào)查文獻和相關(guān)科學(xué)考察集,并參考往年監(jiān)測記錄作補充(胡軍華等, 2008; Yi, 2011; 劉春池等, 2012),確定長江中游常見魚類物種名錄,即7目11科50屬64種魚類。物種的分類和名稱通過Fishbase數(shù)據(jù)庫(www.fishbase.org)、《中國動物志》(樂佩琦, 2000)及分類文獻確認。從GenBank下載對應(yīng)物種收錄的168條Ⅰ序列 (表1),盡量選取研究區(qū)域內(nèi)不同的地理種群,每條序列需經(jīng)BOLD數(shù)據(jù)庫驗證。
表1 本研究中64種魚類Ⅰ基本信息
Tab.1 Information of COⅠ genes of 64 species
續(xù)表1
1.2.1 條形碼分析 Bioedit比對切齊序列,MEGA 6.0計算序列的序列變異、堿基組成及基于Kimura-2-paramater(K2P)模型不同分類階元的遺傳距離(Tamura, 2013)。進一步構(gòu)建鄰接(Neighbour- Joining, NJ)系統(tǒng)進化樹,將Bootstrap值參數(shù)設(shè)為1000。Microsoft Excel 2007作遺傳距離頻率分布直方圖。
1.2.2 DNA條形碼芯片探針設(shè)計和分析 建立本地Blast數(shù)據(jù)庫,序列文件barcode.fasta格式化,形成文件barcode.fasta.nsq。由于序列數(shù)目較多,為了提高篩選效率,鯉形目48種魚類130條序列劃分為一個數(shù)據(jù)集,其余16種魚類38條序列為另一數(shù)據(jù)集。各數(shù)據(jù)集分別利用OligoArray 2.1篩選探針,探針長度為23~27 bp,T值為70℃~82℃,GC含量為40%~ 55%,Na+和DNA濃度分別為1 mol/L和1 μmol/L,形成二級結(jié)構(gòu)的最大T值和交叉雜交最小T值為65℃,兩探針間距離為25 bp,最大探針數(shù)為10,連續(xù)出現(xiàn)的單一堿基數(shù)不超過4個。
選取該物種序列所共有且與其他物種序列無同源性的探針作為該物種的探針,在線軟件OligoCalc (http://www.simgene.com/OligoCalc)優(yōu)化,排除易形成發(fā)夾、莖環(huán)及自身二聚體結(jié)構(gòu)的不合格探針。整理各數(shù)據(jù)集篩選合格的探針與切齊序列于在線軟件OHM(http://bioinfo.unice.fr/softwares/ohm/)中進行虛擬雜交,查看雜交結(jié)果。
2.1.1 DNA條形碼序列特征 經(jīng)同源比對得到長度為624 bp的有效片段,其中,T=28.7%,C=28.2%,A=25.3%,G=17.8%(表2)。A+T含量為54.0%,第1、2和3密碼子的G+C含量分別為57.5%、42.7%和37.6%,表現(xiàn)出明顯的反G偏倚,與其他硬骨魚類線粒體的特點一致。在堿基變異中,不變位點為516個,占總位點數(shù)的82.7%。轉(zhuǎn)換位點為66個,顛換位點為41個,86.4%的堿基轉(zhuǎn)換和97.6%的堿基顛換發(fā)生在第3密碼子位點。轉(zhuǎn)換與顛換比()為3.58,表明此片段沒有飽和,適合進行系統(tǒng)發(fā)育分析。
表2 64種魚類Ⅰ基因序列組成統(tǒng)計
Tab.2 The content of COⅠ gene sequences of 64 species
注: L: 長度; ii:不變位點;S: 轉(zhuǎn)換位點;S: 顛換位點
注: L: Length; ii: Invariant site;S: Conversion site;S: Transversion site
2.1.3 64種魚類系統(tǒng)進化樹 本研究中的64種魚類不同個體均能聚類形成種的單系支,且支持率較高,50個屬不同物種也能聚類成屬的單系支。但是,科內(nèi)屬間、目內(nèi)科間及目間聚類效果不明顯,不能形成平行的獨立分支,與傳統(tǒng)分類存在一些分歧(圖2)。
表3 數(shù)據(jù)集1探針編號及序列
Tab.3 Probe IDs and sequences of dataset 1
續(xù)表3
續(xù)表3
注: 加粗為無效探針
Note: The probes in bold are not available
圖1 不同分類階元水平的遺傳差異分布
表4 數(shù)據(jù)集2探針編號及序列
Tab.4 Probe ids and sequences of dataset 2
注: 加粗為無效探針
Note: The probes in bold are not available
圖2 基于線粒體CO I基因構(gòu)建的NJ樹
總之,本研究下載的64個物種的168條Ⅰ序列,利用OligoArray 2.1軟件初步篩選出62個物種的210條特異性探針,OligoCalc優(yōu)化后選出58個種的164條探針,OHM中虛擬雜交后43個物種的112條探針可作為物種的鑒別探針,可鑒定的物種數(shù)占總物種數(shù)的67.2%(表5)。
表5 篩選探針及雜交情況
Tab.5 Probe selection and hybridization conditions
DNA條形碼是一項利用標(biāo)準(zhǔn)序列快速和準(zhǔn)確鑒定的診斷技術(shù),為分類學(xué)發(fā)展的新方向(Dayrat, 2005)。Hebert等(2003)對大量動物的線粒體Ⅰ序列分析發(fā)現(xiàn),2%是物種劃分的參考值,且種間距離至少是種內(nèi)距離的10倍。本研究中,59種魚類(占總類數(shù)的92.1%)種內(nèi)差異小于2%,種內(nèi)平均遺傳距離為0.0079,屬內(nèi)種間平均遺傳距離為0.084,種間距離為種內(nèi)距離的11倍,基本符合“10倍種內(nèi)遺傳距離”。構(gòu)建的系統(tǒng)進化樹中,64種魚類均能形成種的單系支,且支持率較高。這些都充分證明了線粒體Ⅰ序列的分子條形碼對于長江中游常見魚類有很好的分類效果,可進一步篩選DNA條形碼芯片(Blanchet, 2012; Kim, 2011)。其中,49種(占總類數(shù)的76.6%)魚類的種內(nèi)遺傳距離小于種間最小遺傳距離(0.003),可形成明顯的條形碼間隙。其余種類種內(nèi)與種間遺傳差異存在重疊,未形成DNA條形碼間隙,造成這種現(xiàn)象的原因可能是物種快速形成、漸滲雜交或不完全世系分選等(Zhang, 2012)。此外,本研究中,種內(nèi)、屬內(nèi)種間、科內(nèi)屬間、目內(nèi)科間及目間的遺傳差異分別為0.0079、0.084、0.184、0.232和0.253,分類單元越高,遺傳距離越大,為傳統(tǒng)分類學(xué)的有效性提供了依據(jù)。但除了種間與種內(nèi)距離差異明顯外,物種以上階元的增加明顯變緩慢,且不同高階分類單元遺傳差異出現(xiàn)重疊,未形成明顯的DNA條形碼間隙。表明基于線粒體Ⅰ序列的DNA條形碼序列解析能力有限,可用于物種的分類鑒定,但不適合于高階元分類單元的系統(tǒng)進化分析(Dayrat, 2005)。
April J, Mayden RL, Hanner R,. Genetic calibration of species diversity among North America's freshwater fishes. Proceedings of the National Academy of Sciences of the USA, 2011, 108(26): 10602–10607
Blanchet S. The use of molecular tools in invasion biology: An emphasis on freshwater ecosystems. Fisheries Management and Ecology, 2012, 19(2): 120–132
Dayrat B. Towards integrative taxonomy. Biological Journal of the Linnean Society, 2005, 85(3): 407–415
Fish Research Laboratory of Institute of Hydrobiology. Fish of the Yangtze River. Beijing: Science Press, 1976 [湖北省水生生物研究所魚類研究室. 長江魚類. 北京: 科學(xué)出版社, 1976]
Gao XC. DNA barcoding of Tetraodontiformes in coastal waters of China. Master′s Thesis of Jinan University, 2015 [郜星晨. 基于線粒體Ⅰ序列的中國沿海鲀形目魚類DNA條形碼研究. 暨南大學(xué)碩士研究生學(xué)位論文, 2015]
Hajibabaei M, Singer GA, Clare EL,. Design and applicability of DNA arrays and DNA barcodes in biodiversity monitoring. BMC Biology, 2007, 5(1): 24–24
Hebert N, Cywinska A, Ball SL,. Biological identifications through DNA barcodes. Proceedings of the Royal Society B: Biological Sciences, 2003, 270(1512): 313–321
Hu JH, Zhang CL, Hu HJ. Structure and variation of fish diversity of lake in the central Yangtze River. Journal of Hydroecologe, 2008, 1(1): 47–51 [胡軍華, 張春蘭, 胡慧建. 長江中游湖泊魚類物種多樣性結(jié)構(gòu)及動態(tài). 水生態(tài)學(xué)雜志, 2008, 1(1): 47–51]
Hubert N, Hanner R, Holm E,. Identifying Canadian freshwater fishes through DNA barcodes. PLoS One, 2008, 3(6): e2490
Kim S, Koo H, Kim J,. DNA chip for species identification of Korean freshwater fish: A case study. Biochip Journal, 2011, 5(1): 72–77
Kochzius M, Nolte M, Weber H,. DNA microarrays for identifying fishes. Marine Biotechnology, 2008, 10(2): 207–217
Kochzius M, Seidel C, Antoniou A,. Identifying fishes through DNA barcodes and microarrays. PLoS One, 2010, 5(9): e12620
Lara A, De Leon JLP, Rodriguez R,. DNA barcoding of Cuban freshwater fishes: Evidence for cryptic species and taxonomic conflicts. Molecular Ecology Resources, 2010, 10(3): 421–430
Le PQ. China animal Scientific Osteichthyes. Beijing: Science Press, 2000 [樂佩琦. 中國動物志, 硬骨魚綱. 北京: 科學(xué)出版社, 2000]
Liu CC, Gao X, Lin PC,. Fish community structure in Gezhouba reservior. Resources and Environment in the Yangtze Basin, 2012, 21(7): 843–849 [劉春池, 高欣, 林鵬程, 等. 葛洲壩水庫魚類群落結(jié)構(gòu)特征研究. 長江流域資源與環(huán)境, 2012, 21(7): 843–849]
Liu SF, Li XR, Du TF,. DNA barcoding and electronic microarray for common fish species in Shandong coastal water. Journal of Fishery Sciences of China, 2016, 23(4): 777–790 [柳淑芳, 李獻儒, 杜騰飛, 等. 山東近海習(xí)見魚類DNA條形碼及其電子芯片分析. 中國水產(chǎn)科學(xué), 2016, 23(4): 777–790]
Mabragana E, De Astarloa JMD, Hanner R,. DNA barcoding identifies Argentine fishes from marine and brackish waters. PLoS One, 2011, 6(12): e28655
Ouyang XY, Mo BH, Yu HL,. DNA barcoding identification comparion on accuracy of DNA barcodes in mosquito identification. Chinese Journal of Frontier Health and Quarantine, 2007, 30(6): 349-352 [歐陽小艷, 莫幫輝, 余華麗, 等. DNA條形碼識別-DNA條形碼與DNA芯片識別蚊媒準(zhǔn)確性的比較. 中國國境衛(wèi)生檢疫雜志, 2007, 30(6): 349–352]
Peng JL, Wang XZ, Wang D,. Application of DNA barcoding based on the mitochondrialⅠ gene sequences in classification of culter (Pisces: Cyprinidae), Acta Hydrobiologica Sinica, 2009, 33(2): 271–276 [彭居俐, 王緒禎, 王丁, 等. 基于線粒體Ⅰ基因序列的DNA條形碼在鯉科鲌屬魚類物種鑒定中的應(yīng)用. 水生生物學(xué)報, 2009, 33(2): 271–276]
Tamura K, Stecher G, Peterson D,. MEGA6: Molecular evolutionary genetics analysis Version 6.0. Molecular Biology and Evolution, 2013, 30(12): 2725–2729
Yi Y, Yang Z, Zhang S. Ecological risk assessment of heavy metals in sediment and human health risk assessment of heavy metals in fishes in the middle reaches of the Yangtze River basin. Environmental Pollution, 2011, 159(10): 2575–2585
Zhang JB, Hanner R. Molecular approach to the identification of fish in the South China Sea. PLoS One, 2012, 7(2): e30621
DNA Barcoding and Electronic Microarrays for Common Fish Species in the Middle Reaches of the Yangtze River
GAO Xingchen1, JIANG Wei1①, LIU Shaoping2
(1. Chinese Sturgeon Research Institute, China Three Gorges Corporation, Hubei Key Laboratory of Three Gorges Project for Conservation of Fishes, Yichang 443100; 2. Scientific Observing and Experimental Station of Fishery Resources and Environment in the Upper and Middle Reaches of Yangtze River, Ministry of Agriculture and Rural Affairs; Yangtze River Fishery Resources Institute, Chinese Academy of Fishery Sciences, Wuhan 430223)
To develop a method for the rapid identification and classification of fishes in the middle reaches of the Yangtze River, 168 DNA sequences of the cytochrome oxidase subunit Ⅰ (Ⅰ) gene collected from GenBank. 64 commonfreshwater fish species in 7 orders, 11 families, and 50 genera were analyzed to test the efficacy of species identification using a DNA barcode microarray. The results showed that the intraspecific genetic distances ranged from 0 to 0.0776 (average, 0.0079). The interspecific distances ranged from 0.003 to 0.0190 (average, 0.084). The interspecific genetic distance was larger than the intraspecific distance, and all 168 sequences formed species units in a neighbor-joining phylogenetic tree, indicating that the DNA barcodes could be used to identify these 64 species. Based on the DNA microarray technology, 112 probes were selected from 43 species with high specificity, accounting for 67.2% of the total species. Thus, the DNA barcode microarray provided technical support and a new way to identify fish species in the middle reaches of Yangtze River basin.
Middle reaches of Yangtze River; DNA barcode; Electronic microarray
JIANG Wei, E-mail: 106635291@qq.com
* 國家重點研發(fā)計劃“典型脆弱生態(tài)修復(fù)與保護研究”重點專項(2016YFC0502210)和農(nóng)業(yè)農(nóng)村部長江中上游漁業(yè)資源環(huán)境科學(xué)觀測站共同資助 [This work was supported by National Key R&D Program of China “Ecological Restoration and Conservation Research of Typical Fragile Ecosystems” (2016YFC0502210), and Scientific Observing and Experimental Station of Fishery Resources and Environment in the Upper and Middle Reaches of Yangtze River, Ministry of Agriculture and Rural Affairs]. 郜星晨,E-mail: 13039829682@126.com
姜 偉,E-mail: 106635291@qq.com
2018-06-24,
2018-07-28
S931.1
A
2095-9869(2019)05-0089-12
10.19663/j.issn2095-9869.20180624001
http://www.yykxjz.cn/
郜星晨, 姜偉, 劉紹平. 長江中游常見魚類DNA條形碼研究及其電子芯片分析, 2019, 40(5): 89–100
Gao XC, Jiang W, Liu SP. DNA Barcoding and electronic microarrays for common fish species in the middle reaches of the Yangtze River. Progress in Fishery Sciences, 2019, 40(5): 89–100
(編輯 馮小花)