張衛(wèi)平 , 邱冰瀅 , 張東升
1.上海海洋大學(xué)水產(chǎn)與生命學(xué)院,水產(chǎn)科學(xué)國(guó)家級(jí)實(shí)驗(yàn)教學(xué)示范中心,上海 201306;2.上海海洋大學(xué)水產(chǎn)與生命學(xué)院,環(huán)境DNA技術(shù)與水生態(tài)健康評(píng)估工程中心,上海 201306
世界上有10000多種鳥類[1],它們生活于不同的環(huán)境中,并演化出相應(yīng)的解剖學(xué)和行為學(xué)特征,其中鳥類的食性是備受關(guān)注的特征之一。大量研究表明,鳥類通過(guò)適應(yīng)不同的食物資源來(lái)推動(dòng)其形態(tài)、生理和行為特征的進(jìn)化[2-3]。例如,加拉帕戈斯群島達(dá)爾文雀是攝食適應(yīng)的典型代表,食物的選擇影響喙大小和形狀的進(jìn)化[4-5]。鳥類食性多樣,幾乎包括所有類型的食物,如無(wú)脊椎動(dòng)物、魚蝦、內(nèi)臟腐肉、水果、花蜜、果實(shí)、植物草莖、雜草、苔蘚等,許多鳥類吃一種或幾種特定類型的食物,而有些鳥類食譜較廣[6-7]。食物基質(zhì)的不同導(dǎo)致這些物質(zhì)被攝取后所需的酶、機(jī)制以及消化吸收的時(shí)間存在差異[8]。不少研究表明,鳥類和哺乳動(dòng)物的基本代謝速率與自身的食性有關(guān)[9-12]。此外,鳥種的食物構(gòu)成對(duì)物種的形成和滅絕產(chǎn)生深刻影響[6],鳥類是研究飲食對(duì)物種形成和滅絕作用的一個(gè)很好的模型系統(tǒng)[13-14]。
動(dòng)物通過(guò)降解食物中的營(yíng)養(yǎng)物質(zhì)來(lái)獲取能量,而線粒體是細(xì)胞產(chǎn)生能量的主要細(xì)胞器,為真核細(xì)胞提供95%的能量[15-17]。同時(shí),線粒體自身的基因組編碼13個(gè)氧化磷酸化途徑中的重要亞基,因此線粒體及其基因組在動(dòng)物的能量代謝中發(fā)揮重要作用[18-19]。線粒體基因組編碼基因參與能量代謝,并在動(dòng)物的長(zhǎng)期演化過(guò)程中受到適應(yīng)性進(jìn)化壓力[20-22]。研究發(fā)現(xiàn),基礎(chǔ)代謝率較高的哺乳動(dòng)物比基礎(chǔ)代謝率較低的哺乳動(dòng)物對(duì)線粒體DNA的凈化選擇更強(qiáng)[23]。此外,喪失飛行能力的鳥類比飛行能力強(qiáng)的鳥類在mtDNA中積累了更多的非同義取代,這可能是因?yàn)閺?qiáng)運(yùn)動(dòng)物種維持高效的能量代謝,mtDNA經(jīng)歷了強(qiáng)純化選擇[24]。
雁形目鳥類是備受關(guān)注的水鳥種群之一,全世界共有3科178種[1]。雁形目鳥類食譜較廣,包括雜食性、草食性和肉食性物種。草食性雁形目主要以植物草莖、雜草、苔蘚、真菌、豆類為食,肉食性雁形目主食魚和無(wú)脊椎動(dòng)物,專食化程度較高[7]。雜食性雁形目則以植物草莖、雜草、苔蘚、真菌、豆類以及無(wú)脊椎動(dòng)物為食[7]。本研究以20種雁形目鳥類為研究對(duì)象,通過(guò)分析不同食性組雁形目鳥類的線粒體編碼蛋白基因,以探討雁形目鳥類食性的差異與這些基因進(jìn)化表現(xiàn)之間的關(guān)系。
本研究選取了20種雁形目鳥類(Anseriformes birds)作為研究對(duì)象。將食性組成中食肉比例達(dá)80%及以上的鳥類劃分為食肉組;食草比例達(dá)80%及以上的鳥類劃分為食草組;兩者皆食且食草或食肉比例均不超過(guò)80%的鳥類視為雜食組。依據(jù)食性差異,這些鳥類被劃分為食肉組、食草組和雜食組3組。其中,食草組有9種:Anser albifrons(NC_004539.1),Anser anser(NC_011196.1),Anser cygnoides(NC_023832.1),Anser fabalis(HQ890328.1),Anser indicus(NC_025654.1),Branta canadensis(NC_007011.1),Cygnuscolumbianus(NC_007691.1),Cygnus cygnus(NC_027095.1),Cygnus olor(NC_027096.1);食肉組有7種:Bucephala clangula(MW849283.1),Clangula hyemalis(MW849278.1),Histrionicus histrionicus(MW849288.1),Mergus merganser(NC_040986.1),Mergus squamatus(NC_016723.1),Poltastelleri(MW849289.1),Mergus serrator(MZ365040.1);雜食組有4種:Aythya baeri(NC_057048.1),Aythya ferina(NC_024602.1),Aythya fuligula(NC_024595.1),Aythya nyroca(NC_059801.1)。這些物種的序列信息均來(lái)源于NCBI數(shù)據(jù)庫(kù),分類信息來(lái)源于Eltron-Traits 1.0數(shù)據(jù)庫(kù)[7]。
本研究以雞形目雉雞(Phasianus colchicus)作為外群,雉雞與雁形目同屬雞雁小綱。將13個(gè)線粒體蛋白編碼基因刪除終止子,再拼接成全長(zhǎng)編碼序列,即拼接序列(spliced data),使用Mega11[25]程序的Muscle[26]比對(duì)方法,對(duì)拼接序列進(jìn)行比對(duì),生成.fas比對(duì)文件,并以比對(duì)好的拼接序列為基礎(chǔ),通過(guò)最大似然法構(gòu)建系統(tǒng)發(fā)育樹(shù)。同時(shí),按照相同方法生成不含外群的.fas比對(duì)文件和.tree樹(shù)文件,用于Paml和Relax的輸入文件。
借助Relax[27]在線服務(wù)器(https://www.datamonkey.org/RELAX)對(duì)各基因進(jìn)行放松性選擇分析,選擇肉食性、雜食性和草食性的鳥類中其中1組作為前景支,以另外2組鳥類作為背景支,來(lái)檢測(cè)這些分支經(jīng)歷的選擇壓力。當(dāng)K值大于1,則表示該前景支受到了強(qiáng)化性選擇;當(dāng)K值小于1,則表示該前景支受到了放松性選擇。
本研究使用了Paml 4.8[28]中的Codeml程序評(píng)估3組鳥線粒體13個(gè)編碼基因受到的選擇壓力,且以自由比率模型(free-ratio model)對(duì)拼接序列以及每一個(gè)編碼基因進(jìn)行適應(yīng)性進(jìn)化分析。當(dāng)dN/dS<1時(shí)(dN表示非同義替換率;dS表示同義替換率),表示該基因可能受到負(fù)選擇或純化選擇;當(dāng)dN/dS=1,表示該基因可能受到中性選擇,中性突變是自然界最常見(jiàn)的;當(dāng)dN/dS>1時(shí),預(yù)示著該基因很可能受到了正選擇作用,正選擇也是物種適應(yīng)性進(jìn)化的重要基礎(chǔ)。
Codeml程序中的支-位點(diǎn)模型(branch-site model)存在模型A和null假設(shè),根據(jù)2種模型之間的似然比檢驗(yàn)推測(cè)某些位點(diǎn)是否經(jīng)歷了正選擇作用,當(dāng)P<0.05時(shí)表示有充足證據(jù)可以判斷前景支中存在正選擇位點(diǎn)。用位點(diǎn)模型(site model)探索每個(gè)位點(diǎn)間選擇壓力的差異,位點(diǎn)模型假定同一分支上不同位點(diǎn)的ω值(ω表示進(jìn)化速率)都不同,但在進(jìn)化樹(shù)不同分支上卻無(wú)差異。
通過(guò)Python編程獲取氨基酸多態(tài)性位點(diǎn)信息,并使用Provean程序[29]評(píng)估這些多態(tài)性位點(diǎn)的有害性。Score(預(yù)測(cè)的分值)=-2.5是判斷有害位點(diǎn)或中性突變位點(diǎn)的臨界值,當(dāng)預(yù)測(cè)分值小于-2.5,可視為有害突變位點(diǎn),反之視為中性突變??紤]到3組鳥類的物種數(shù)不一致(食肉組7;食草組9;雜食組4),本研究利用氨基酸多態(tài)性比例[多態(tài)性位點(diǎn)數(shù)/(該基因氨基酸數(shù)×該組物種數(shù))]和有害性比例[有害突變位點(diǎn)數(shù)/(該基因氨基酸數(shù)×該組物種數(shù))]表示3組鳥類間的差異。
利用Swiss-Model[30]對(duì)本研究涉及的所有線粒體蛋白質(zhì)進(jìn)行三維結(jié)構(gòu)構(gòu)建,并且使用PyMOL進(jìn)行修飾,觀察3組食性鳥類中這些位點(diǎn)的分布情況。
從NCBI數(shù)據(jù)庫(kù)中下載已選定的20種雁形目鳥類的線粒體蛋白編碼序列,并根據(jù)食性分為食肉組、雜食組和食草組。利用Mega11[25]程序的Muscle[26]對(duì)編碼線粒體蛋白質(zhì)的13個(gè)基因拼接后的序列進(jìn)行比對(duì),構(gòu)建的系統(tǒng)發(fā)育樹(shù)(圖1)顯示實(shí)驗(yàn)選取的雁鴨類鳥類中,相同食性的鳥種在進(jìn)化樹(shù)中聚類為一個(gè)單系群。
圖1 基于拼接序列構(gòu)建的雁形目鳥類系統(tǒng)發(fā)育樹(shù)Fig. 1 Phylogenetic tree based on the spliced data of Anseriformes birds
通過(guò)Relax在線分析線粒體蛋白編碼基因在不同食性組中受到的放松性選擇情況,結(jié)果發(fā)現(xiàn)(表1),食肉組有COX2、COX3、CYTB、ND1、ND3、ND4共6個(gè)基因受到了放松性選擇,且沒(méi)有任何基因受到強(qiáng)化選擇;食草組有ND2和ND6共2個(gè)基因受到了放松性選擇,有ATP6、COX2、COX3、ND3共4個(gè)基因受到了強(qiáng)化性選擇;而雜食組有COX1、COX2、CYTB、ND2、ND3共5個(gè)基因受到了強(qiáng)化性選擇,且沒(méi)有任何基因受到放松性選擇。
表1 結(jié)果中有顯著放松性選擇或顯著強(qiáng)化性選擇的基因Table 1 The significant results of the relaxation and intensification
為了估算譜系特異性ω值,通過(guò)Codeml程序的自由比率模型(free-ratio model)來(lái)評(píng)估不同分支的進(jìn)化速率,得到的編碼數(shù)據(jù)包括每個(gè)譜系基因的N、S、dN、dS和ω值。對(duì)3組數(shù)據(jù)(dN,dS,ω)中的3類鳥(拼接序列)做兩兩之間的t檢驗(yàn),結(jié)果顯示(圖2),食肉組的dS值顯著高于食草組和雜食組(P<0.01),雖然食草組的ω值較高,但是跟其他兩組比較并沒(méi)有達(dá)到顯著水平(P>0.05)。
圖2 食肉組、食草組、雜食組的dN、dS和ω比較Fig. 2 Comparisons of dN, dS and ω values among the groups of carnivore birds, herbivorous birds and omnivorous birds
對(duì)13個(gè)基因分別進(jìn)行檢測(cè)并作t檢驗(yàn),食肉組與雜食組進(jìn)行t檢驗(yàn)結(jié)果表明,食肉組有10個(gè)基因的dS(ATP8、COX1、COX2、COX3、CYTB、ND1、ND2、ND4、ND5、ND6)、7個(gè)基因的dN(ATP8、COX2、COX3、CYTB、ND4、ND5、ND6)顯著高于雜食組;而食肉組與食草組進(jìn)行比較表明,食肉組在dS(ATP8、COX1、COX2、COX3、CYTB、ND1、ND2、ND4、ND5、ND6)、dN(ATP8、COX3、CYTB、ND4、ND5)顯著高于食草組;但當(dāng)食草組與雜食組相比較時(shí),dS、dN均未表現(xiàn)出顯著性,僅CYTB基因在雜食組中的ω值顯著高于食草組。
此外,本研究采用Codeml程序的支-位點(diǎn)(branch-site)模型和site模型探究哪些基因受到了正選擇,結(jié)果均未發(fā)現(xiàn)正選擇位點(diǎn)。
基于氨基酸序列的比對(duì)結(jié)果,通過(guò)Python編程得到氨基酸多態(tài)性位點(diǎn)信息,并使用Provean程序[29]評(píng)估這些多態(tài)性位點(diǎn)的有害性[31]。結(jié)果發(fā)現(xiàn),在食肉組的這些蛋白質(zhì)序列中,多態(tài)性位點(diǎn)和有害性位點(diǎn)出現(xiàn)的頻率均高于另外兩組鳥。對(duì)13個(gè)線粒體蛋白分別檢測(cè)的結(jié)果(圖3)表明,在食肉組的13個(gè)基因中,其中有11個(gè)基因的氨基酸多態(tài)性頻率高于另外兩組(圖3B),有7個(gè)基因的有害突變頻率高于另外兩組(圖3C)。
圖3 食肉組、食草組、雜食組的氨基酸多態(tài)性和有害性的頻率Fig. 3 Proportion of amino acid polymorphism sites and amino acid harmful sites in carnivore, herbivorous and omnivorous birds
本研究使用Swiss-Model在線網(wǎng)址預(yù)測(cè)了13種蛋白質(zhì)的三級(jí)結(jié)構(gòu),利用Pymol對(duì)中性突變位點(diǎn)和有害位點(diǎn)進(jìn)行標(biāo)記:黃色標(biāo)記中性突變,紅色標(biāo)記有害突變。結(jié)果(圖4)顯示,3組食性鳥類的所有編碼基因的蛋白質(zhì)三維結(jié)構(gòu)位點(diǎn)均呈現(xiàn)多態(tài)性,有害位點(diǎn)并未集中分布且主要存在于食肉組中。
圖4 食肉組、食草組、雜食組中ND2的3D結(jié)構(gòu)預(yù)測(cè)和氨基酸多態(tài)性、有害性位點(diǎn)的比例Fig. 4 3D structure prediction and proportion of polymorphism sites and harmful sites of ND2 in carnivore, herbivorous and omnivorous birds
由于食物資源的時(shí)空分布不一,鳥類演化出了不同的飲食偏好和取食方式及形態(tài)特征,因此,普遍認(rèn)為鳥類的食性選擇會(huì)影響物種的進(jìn)化。以往的研究主要集中在食性與生理結(jié)構(gòu)[8,32]、行為特征[2-3]及特定基因[33-34]之間的關(guān)系等,而極少在基因組層面研究?jī)烧叩年P(guān)系。為了在基因組層面探討兩者的關(guān)系,本研究選取20種雁形目鳥類,利用Mega、Paml、Relax、Python、Swiss-Model、Pymol等生物信息學(xué)軟件或方法對(duì)線粒體基因組進(jìn)行進(jìn)化速率分析、選擇性分析、氨基酸多態(tài)性和有害性分析、蛋白質(zhì)3D結(jié)構(gòu)分析等。已有對(duì)鳥類等動(dòng)物的研究中通常認(rèn)為線粒體編碼的基因在能量代謝相關(guān)的特征進(jìn)化過(guò)程中受到強(qiáng)烈的選擇壓力[18-19,35],純化選擇的放松可能與進(jìn)化速度的加快有關(guān)[36-38]。本研究對(duì)鳥類食性與線粒體基因組的這些編碼基因做了進(jìn)化分析,結(jié)果也證實(shí)了這種現(xiàn)象。與雜食組和食草組鳥類相比,食肉組的雁形目鳥類大部分編碼蛋白的線粒體基因處于放松性選擇,而雜食組鳥類的強(qiáng)化性選擇信號(hào)顯著。利用Paml-Codeml對(duì)3種食性鳥類進(jìn)行兩兩間的進(jìn)化分析比較,雖然ω值沒(méi)有表現(xiàn)出顯著性,但是食肉組鳥類的dS和dN值顯著高于另外兩組鳥類,雜食組鳥類的dS和dN值顯著偏低。此外,不同食性組鳥類線粒體基因組在氨基酸多態(tài)性及氨基酸有害性方面也表現(xiàn)出明顯的差異,食肉組中有11個(gè)基因表現(xiàn)出較高的氨基酸多態(tài)性頻率,有7個(gè)基因表現(xiàn)出較高的氨基酸有害性頻率。研究結(jié)果表明,攝取肉食比例較高的雁形目鳥類,其線粒體基因組受到放松性選擇作用。
專門的蜜食動(dòng)物和果食動(dòng)物多在“四季常青”的地方生存,食蟲動(dòng)物則在全年都有昆蟲的熱帶環(huán)境中生存[39],因此資源的可獲得性相對(duì)穩(wěn)定。雜食動(dòng)物在不穩(wěn)定的資源和環(huán)境中更有優(yōu)勢(shì)[40]。但是,在生態(tài)競(jìng)爭(zhēng)的競(jìng)技場(chǎng)中,雜食動(dòng)物作為可食多種食物資源的“多面手”,在利用特定食物資源方面表現(xiàn)不佳[41],因此在物種宏觀進(jìn)化方面,表現(xiàn)出低物種形成率或高滅絕率。Burin等[7]通過(guò)分析比較現(xiàn)存的近萬(wàn)中鳥類的進(jìn)化關(guān)系和食性,發(fā)現(xiàn)雜食性鳥類是鳥類食性的“進(jìn)化陷阱”,同其他食性的鳥類相比,雜食性鳥類的滅絕率較高,多樣化率較低。但是,該研究并未涉及這些現(xiàn)象的分子機(jī)制。本研究從基因組層面揭示雜食性的雁形目鳥類線粒體基因組受到強(qiáng)化性的選擇壓力,氨基酸多態(tài)性下降,有害突變位點(diǎn)被淘汰,為雜食性鳥類物種的低多樣化率提供了一定的分子依據(jù)。