李梓鋒,殷利奪,劉德武*
牛和山羊基因組共同加速進(jìn)化區(qū)域與角形成的潛在關(guān)系
李梓鋒1,殷利奪2,劉德武1*
(1.華南農(nóng)業(yè)大學(xué)動(dòng)物科學(xué)學(xué)院,廣東 廣州 510642;2.中國科學(xué)院昆明動(dòng)物研究所,云南 昆明 650223)
對(duì)14個(gè)物種的全基因組序列進(jìn)行比對(duì),識(shí)別其基因組中的同源區(qū)域,進(jìn)而鑒定牛和山羊基因組的共同加速進(jìn)化區(qū)域(以下簡稱加速區(qū)域),并對(duì)加速區(qū)域進(jìn)行注釋及組蛋白修飾位點(diǎn)的富集分析;運(yùn)用生物信息學(xué)方法,篩選編碼區(qū)出現(xiàn)加速進(jìn)化的基因,并對(duì)其進(jìn)行GO和KEGG通路分析。結(jié)果表明:在牛和山羊基因組中共檢測到44 794個(gè)加速區(qū)域;加速區(qū)域在基因區(qū)與非基因區(qū)均有分布,分別占總數(shù)的54.80%與45.20%;加速區(qū)域顯著富集了25個(gè)不同的組蛋白標(biāo)記;鑒定出2703個(gè)候選基因的編碼區(qū)出現(xiàn)了加速區(qū)域;GO條目分析發(fā)現(xiàn),候選基因主要富集的生物過程包括軸突形成、腺體發(fā)育、肌肉組織發(fā)育等,細(xì)胞組成包括突觸膜、軸突部分、突觸后致密等;KEGG通路分析發(fā)現(xiàn),這些候選基因參與了cAMP信號(hào)通路、軸突導(dǎo)向、鈣離子信號(hào)通路、Rap1信號(hào)通路、神經(jīng)活性配體–受體互作等信號(hào)通路。這揭示在牛角形成過程中,突觸和軸突的產(chǎn)生可能發(fā)生了獨(dú)特的變化,影響信號(hào)傳遞與神經(jīng)結(jié)構(gòu)組成并導(dǎo)致轉(zhuǎn)錄調(diào)控和基因表達(dá)發(fā)生變化,從而導(dǎo)致牛科動(dòng)物出現(xiàn)形態(tài)特異的洞角。
牛;山羊;同源區(qū)域;共同加速進(jìn)化區(qū)域;角;突觸;軸突
反芻動(dòng)物是陸生草食動(dòng)物中一個(gè)重要的群體,包含長頸鹿科、叉角羚科、鼷鹿科、麝科、鹿科、??芠1],包括至少200個(gè)現(xiàn)存物種。其中,牛科中現(xiàn)存物種最多,至少有143種,包括重要的家養(yǎng)動(dòng)物(牛和山羊)。反芻動(dòng)物具有特異的解剖學(xué)特征,如多腔胃、高冠齒及角(顱附外骨)[2–4]。這些特征被認(rèn)為是反芻動(dòng)物在物種多樣性、地域豐富度和地理分布范圍方面進(jìn)化成功的原因。盡管反芻動(dòng)物具有生物學(xué)上的突出地位及對(duì)人類文明的重要價(jià)值,但關(guān)于反芻亞目動(dòng)物,尤其是??苿?dòng)物的了解仍然很有限。羊亞科中,家山羊與其他物種在全基因組水平的分歧度相當(dāng)?shù)?,?.21%(野山羊與家山羊)到2.18%(綿羊與家山羊)[5]。筆者選取牛科中牛亞科牛屬的普通牛()、羊亞科山羊?qū)俚募疑窖?) 2個(gè)物種作為牛科動(dòng)物中的代表物種進(jìn)行研究。
確定特定的基因組區(qū)域與特殊表型的形成是否存在聯(lián)系,是一項(xiàng)具有挑戰(zhàn)性的工作,其研究方法缺乏普適性。其中較為優(yōu)越的策略之一是通過比較基因組學(xué)的方法來識(shí)別功能序列[6–8]。由于不同物種基因組序列間存在進(jìn)化上同源保守的區(qū)域,這部分保守同源區(qū)域與動(dòng)物體的生長發(fā)育相關(guān)[9–11]。在這些保守同源序列中出現(xiàn)相對(duì)較高的序列替換率,會(huì)造成物種特異的形態(tài)變化,如在人類基因組的研究中發(fā)現(xiàn)加速進(jìn)化區(qū)域都是高度保守的[9,12],至少30%的人類基因組加速區(qū)域位于負(fù)責(zé)生長發(fā)育的基因與調(diào)控元件上,其中在1個(gè)RNA基因上鑒定出加速區(qū)域,該基因在人類新皮層發(fā)育的7~19個(gè)妊娠周中的Cajal–Retzius神經(jīng)元中特異表達(dá)(皮質(zhì)神經(jīng)元遷移的關(guān)鍵時(shí)期),此階段的發(fā)育特征被認(rèn)為是造成人類與黑猩猩形態(tài)特征差異的原因之一[13]:因此,基于進(jìn)化上保守同源的區(qū)域,錨定其中進(jìn)化速率較快的區(qū)域,既可用于識(shí)別在編碼蛋白基因區(qū)域的信號(hào),也可識(shí)別非編碼區(qū)域中的信號(hào)[14–15],從而對(duì)物種的表型變異進(jìn)行分子層面上的解析。
本研究中,通過比較基因組分析,在全基因組范圍內(nèi)檢測反芻亞目??苿?dòng)物牛、山羊共同的加速進(jìn)化信號(hào),探索共同加速進(jìn)化區(qū)域(以下簡稱加速區(qū)域)在全基因中的分布,找到出現(xiàn)加速進(jìn)化信號(hào)的功能區(qū)域,揭示角的形成機(jī)制,旨在為探究反芻目亞??频奶禺惐硇托纬蓹C(jī)理提供依據(jù)。
14種具有代表性的哺乳動(dòng)物:人(,GRCh37/hg19),恒河猴(,MGSC Merged 1.0/rheMac3),樹鼩(,Broad Institute tupBel1(NCBI project 13971,AAPY010000 00)),小鼠(,NCBI37/ mm10),豚鼠(,Broad/cavPor3),兔(,Broad/oryCun2),牛(,Bos_ taurus_UMD_3.1/bosTau7),家山羊(),馬(,Broad/equCab2),狗(,Broad/canFam3),鼩鼱(,Broad/sorAra2),象(,Broad/ loxAfr3),馬島猬(,Broad/echTel2),負(fù)鼠(,Broad/monDom5)。從NCBI網(wǎng)站下載山羊()基因組序列,從UCSC基因組瀏覽器網(wǎng)站下載其他物種基因組序列和以人類基因組為參考序列的序列比對(duì)結(jié)果。
運(yùn)用UCSC Kent公用程序(http://hgdownload.soe. ucsc.edu/admin/exe/linux.x86_64/)對(duì)山羊基因組數(shù)據(jù)進(jìn)行預(yù)處理,計(jì)算基因組大小并進(jìn)行格式轉(zhuǎn)換;以人類基因組的各常染色體為目標(biāo)序列,運(yùn)用lastz (v1.04.03)[16]將山羊基因組序列分別與人類基因組各常染色體序列進(jìn)行跨物種的兩兩比對(duì);運(yùn)用axtChain(v302.0.0)、chainNet(v302.0.0)和axtToMaf (v302.0.0)等進(jìn)行g(shù)ap過濾和格式轉(zhuǎn)換,得到maf格式的兩兩比對(duì)結(jié)果文件;使用Multiz(v11.2)[17]獲得以人類常染色體為參考的多物種基因組序列比對(duì)結(jié)果。
基于UCSC的hg19基因組注釋,以1.2的比對(duì)結(jié)果作為輸入文件,采用msa_view(PHAST v1.4)與phyloFit(PHAST v1.4)[18]獲取4倍簡并位點(diǎn),并估計(jì)中性進(jìn)化模型;運(yùn)用PHAST軟件包[18]并根據(jù)多序列比對(duì)結(jié)果及中性進(jìn)化速率模型,識(shí)別保守同源元件,進(jìn)一步檢測牛和山羊的基因組中的加速區(qū)域。
人類基因組的功能研究較為豐富,其基因組注釋(包括功能元件的注釋)均較為齊全[19],是其他非模式生物難以企及的;因此,將加速區(qū)域映射到人類基因組同源區(qū)域進(jìn)行后面的注釋和分析。采用R包ChIPseeker[20]對(duì)加速區(qū)域進(jìn)行注釋,將加速區(qū)域落在基因組中的位置,如啟動(dòng)子、內(nèi)含子、外顯子等區(qū)域注釋;根據(jù)VISTA增強(qiáng)子瀏覽器中已經(jīng)通過實(shí)驗(yàn)驗(yàn)證的增強(qiáng)子注釋,查看加速區(qū)域在增強(qiáng)子區(qū)域的分布[21]。
運(yùn)用ChIP–Atlas數(shù)據(jù)庫,識(shí)別組織特異的調(diào)控元件[19]。檢測加速區(qū)域是否位于人類基因組的候選功能元件,并描述這些元件的生物化學(xué)活性;使用ChIP–Atlas中公開可用的ChIP–Seq數(shù)據(jù)集[19];運(yùn)用silico ChIP并規(guī)定100為默認(rèn)顯著性閾值,將加速區(qū)域的bed格式文件在人類不同組織細(xì)胞中進(jìn)行組蛋白位點(diǎn)富集分析。
運(yùn)用GREAT[22]基于hg19注釋將加速區(qū)域分配到附近的基因,使用基礎(chǔ)設(shè)置加上1000 kb的擴(kuò)展默認(rèn)設(shè)置,基于R包ClusterProfiler[23]內(nèi)置數(shù)據(jù)庫,將編碼區(qū)出現(xiàn)加速進(jìn)化的基因分別進(jìn)行GO條目富集分析與KEGG通路富集分析,采用超幾何分布計(jì)算出基因顯著富集的GO條目和KEGG通路。
統(tǒng)計(jì)基因鄰近的加速區(qū)域數(shù),展示富集加速區(qū)域最多的前10個(gè)基因、加速區(qū)域數(shù)及前10個(gè)基因涉及的GO分析結(jié)果。
根據(jù)14個(gè)物種的系統(tǒng)發(fā)育關(guān)系(圖1),以有袋類哺乳動(dòng)物的負(fù)鼠作為外群,并將羊膜哺乳動(dòng)物的靈長目、嚙齒目、樹鼩目、偶蹄目、奇蹄目、食蟲目、長鼻目和猬形目中具代表性的物種進(jìn)行全基因組序列比對(duì),得到以人類(hg19)為目標(biāo)序列的共14個(gè)物種的基因組比對(duì)結(jié)果。
圖1 基于4倍簡并位點(diǎn)構(gòu)建的系統(tǒng)發(fā)育樹
對(duì)多物種基因組序列比對(duì)結(jié)果進(jìn)行保守同源性分析,發(fā)現(xiàn)12 105 596個(gè)哺乳動(dòng)物保守同源的區(qū)域分布于常染色體上(表1)?;谒迫槐葯z驗(yàn)的算法[18],對(duì)獲得的同源區(qū)域進(jìn)行加速進(jìn)化檢測,通過與中性模型比較,識(shí)別在牛和山羊序列中具有核苷酸替代率共同增加(FDR<1%)的區(qū)域,各常染色體均有加速區(qū)域分布,共檢測到44 794個(gè)加速區(qū)域。
表1 保守區(qū)域與加速區(qū)域在染色體上的分布
對(duì)加速區(qū)域的注釋發(fā)現(xiàn),加速區(qū)域在基因區(qū)(包括非翻譯區(qū)、外顯子區(qū)與內(nèi)含子區(qū))與非基因區(qū)(包括啟動(dòng)子區(qū)、遠(yuǎn)端基因間區(qū)和下游區(qū)域)均有分布,分別占總數(shù)的54.80%與45.20%(表2)。1957個(gè)加速區(qū)域分布在外顯子區(qū)域(占總加速區(qū)域的4.37%)中,有636個(gè)加速區(qū)域分布在第一個(gè)外顯子區(qū)域(占1.42%);有21 890個(gè)加速區(qū)域分布在內(nèi)含子區(qū)域(占48.87%),其中,有5684個(gè)加速區(qū)域分布在第一個(gè)內(nèi)含子區(qū)域(占12.69%);有439個(gè)加速區(qū)域分布在遠(yuǎn)端基因間區(qū)(占0.98%);有89個(gè)加速區(qū)域分布在5′端非翻譯區(qū)(占0.20%);有612個(gè)加速區(qū)域分布在3′端非翻譯區(qū)域(占1.36%);有1356個(gè)加速區(qū)域分布在啟動(dòng)子區(qū)域(占3.03%)。另外,通過VISTA增強(qiáng)子實(shí)驗(yàn)驗(yàn)證數(shù)據(jù)集對(duì)加速區(qū)域的注釋發(fā)現(xiàn),有108個(gè)加速區(qū)域分布在增強(qiáng)子區(qū)域。
表2 牛和山羊基因組加速進(jìn)化區(qū)域的注釋結(jié)果
將加速區(qū)域映射到人類基因組中,通過組蛋白標(biāo)記區(qū)域富集分析發(fā)現(xiàn),加速區(qū)域顯著富集了25個(gè)不同的組蛋白標(biāo)記,圖2展示的是其中8個(gè)組蛋白標(biāo)記的結(jié)果(相對(duì)于隨機(jī)抽樣的加速區(qū)域FDR<5%),如組蛋白變體(H2A.Z)、增強(qiáng)子活性位點(diǎn)(H3K27ac和H3K4me1)、啟動(dòng)子活性位點(diǎn)(H3K4me3和H3K4me2)等。從圖2可知,加速區(qū)域在腎臟細(xì)胞、血液細(xì)胞、消化道細(xì)胞、骨細(xì)胞中的H2A.Z標(biāo)記的富集倍數(shù)高達(dá)3~4倍;加速區(qū)域在神經(jīng)細(xì)胞、上皮細(xì)胞、骨細(xì)胞中的H3K27ac與H3K4me1標(biāo)記的富集倍數(shù)達(dá)2~3倍。
圖2 加速區(qū)域在不同組織細(xì)胞中的組蛋白標(biāo)記顯著富集情況(FDR<5%)
運(yùn)用Great基于hg19注釋到了2703個(gè)編碼區(qū)加速進(jìn)化的基因。運(yùn)用GO數(shù)據(jù)庫,對(duì)2703個(gè)候選基因進(jìn)行功能富集分析,結(jié)果如圖3所示。共有24個(gè)GO條目顯著(<0.05)富集,其中生物過程包括軸突形成、腺體發(fā)育、肌肉組織發(fā)育和上皮細(xì)胞管形態(tài)發(fā)生等;細(xì)胞組成包括突觸膜、軸突部分、突觸后致密和非對(duì)稱性突觸等;分子功能包括金屬離子跨膜轉(zhuǎn)運(yùn)體活性、磷酸酯水解酶活性、鈣調(diào)蛋白結(jié)合等。
1~10為生物過程(1 軸突形成,2 腺體發(fā)育,3 肌肉組織發(fā)育,4 胚胎器官發(fā)育,5 橫紋肌發(fā)育,6 上皮細(xì)胞管形態(tài)發(fā)生,7 胚胎器官形態(tài)發(fā)生,8 感覺器官形態(tài)發(fā)生,9 心臟形態(tài)發(fā)生,10 細(xì)胞命運(yùn)決定);11~20為細(xì)胞組成(11 突觸膜,12 軸突部分,13 突觸后致密,14 非對(duì)稱性突觸,15 收縮纖維,16 肌原纖維,17 收縮纖維部分,18 肌原纖維節(jié),19 I帶,20 Z線);21~24為分子功能(21 金屬離子跨膜轉(zhuǎn)運(yùn)體活性,22 磷酸酯水解酶活性,23 鈣調(diào)蛋白結(jié)合,24 γ–氨基丁酸跨膜轉(zhuǎn)運(yùn)活性)。
基于KEGG數(shù)據(jù)庫,KEGG富集分析結(jié)果中前15個(gè)KEGG富集通路如圖4所示,包括cAMP信號(hào)通路、軸突導(dǎo)向、鈣離子信號(hào)通路、Rap1信號(hào)通路、神經(jīng)活性配體–受體互作等信號(hào)通路顯著(<0.05)富集。
1 cAMP信號(hào)通路;2 軸突導(dǎo)向;3 鈣離子信號(hào)通路;4 Rap1信號(hào)通路;5 神經(jīng)活性配體–受體互作;6 黏著斑;7 胃癌;8 Hippo信號(hào)通路;9 致心律失常性右室心肌??;10 信號(hào)通路調(diào)控干細(xì)胞多能性;11 其他類型的O–聚糖生物合成;12 Wnt信號(hào)通路;13 細(xì)胞粘連分子;14 人乳頭狀瘤病毒感染;15 黏蛋白O–聚糖生物合成。
經(jīng)統(tǒng)計(jì)發(fā)現(xiàn),部分基因附近檢測出較多的加速區(qū)域。表3展示了加速區(qū)域總數(shù)排名前10的基因。其中,、、基因在神經(jīng)元投射導(dǎo)向、神經(jīng)元遷移、軸突形成、神經(jīng)元識(shí)別的生物過程等GO條目中顯著富集(表4)。另外,在基因附近區(qū)域檢測到了143個(gè)加速區(qū)域(圖5),該基因編碼IgLON家族中含有免疫球蛋白(Ig)結(jié)構(gòu)域的糖基磷脂酰肌醇(GPI)錨定的細(xì)胞黏附分子。
表3 基因加速區(qū)域總數(shù)排名前10的結(jié)果
表4 加速區(qū)域總數(shù)排名前10的基因涉及的GO條目
圖5 NTM基因周圍的加速區(qū)域分布情況與其中1個(gè)加速區(qū)域
以往的研究[24]表明,與下游的其他內(nèi)含子相比,人類基因組大部分轉(zhuǎn)錄本的第一個(gè)內(nèi)含子富集于受進(jìn)化選擇的主動(dòng)轉(zhuǎn)錄調(diào)控信號(hào),如H3K4me1,H3K4me3增強(qiáng)子活性標(biāo)記,這些信號(hào)對(duì)調(diào)控復(fù)雜的基因表達(dá)模式尤為重要。本研究中,對(duì)反芻亞目牛科的牛、山羊2個(gè)物種全基因組深入研究發(fā)現(xiàn),有5684個(gè)加速區(qū)域位于基因組中的第一個(gè)內(nèi)含子,可能使得該區(qū)域增強(qiáng)子結(jié)合活性改變,從而在轉(zhuǎn)錄調(diào)控水平發(fā)生改變,影響相關(guān)表型的形成,并且在非翻譯區(qū)等其他調(diào)控元件區(qū)域也發(fā)現(xiàn)加速進(jìn)化的信號(hào),需要后續(xù)進(jìn)一步的研究驗(yàn)證其功能有何具體影響。
組蛋白變體H2A.Z的核小體比常規(guī)核小體展開程度更高[25]。加速區(qū)域在染色體活性區(qū)域有顯著高的富集倍數(shù),包括在增強(qiáng)子活性區(qū)域,啟動(dòng)子活性區(qū)域及組蛋白變體H2A.Z,表明絕大多數(shù)加速區(qū)域具有生物學(xué)功能,參與多種調(diào)控活動(dòng),但具體的調(diào)控活性功能有待進(jìn)一步的驗(yàn)證。
在反芻亞目動(dòng)物關(guān)于角起源的研究[5]中,對(duì)??贫唇呛吐菇枪餐弑磉_(dá)基因的研究結(jié)果表明,這2種顱附外骨的發(fā)育都依賴于相似的基因表達(dá)譜,主要來自神經(jīng)、骨骼和皮膚組織;GO功能富集分析表明,這些共同高表達(dá)基因在神經(jīng)嵴細(xì)胞遷移、發(fā)育的生物過程顯著富集;KEGG通路分析發(fā)現(xiàn),共同高表達(dá)基因在神經(jīng)嵴分化通路、軸突導(dǎo)向等信號(hào)通路顯著富集,認(rèn)為反芻亞目動(dòng)物的角可能在神經(jīng)嵴干細(xì)胞中具有相同起源。本研究中,對(duì)2703個(gè)編碼區(qū)加速進(jìn)化的候選基因進(jìn)行生物學(xué)功能富集,GO結(jié)果表明,候選基因在軸突形成、上皮細(xì)胞管形態(tài)發(fā)生等生物過程顯著富集,在突觸膜、軸突部分、突觸后致密、非對(duì)稱性突觸等神經(jīng)元的組成結(jié)構(gòu)顯著富集;KEGG通路分析發(fā)現(xiàn),候選基因在軸突導(dǎo)向通路顯著富集。表明可能從神經(jīng)嵴干細(xì)胞分化產(chǎn)生顱面軟骨和顱面骨時(shí),伴隨著神經(jīng)元的分化,在突觸結(jié)構(gòu)和軸突形成過程出現(xiàn)特異變化,在神經(jīng)調(diào)控通路發(fā)生??苿?dòng)物特異的信號(hào)傳導(dǎo)等變化,從而導(dǎo)致??苿?dòng)物洞角的形成[26]。
有研究[7–8,27]表明,加速區(qū)域不等比例的分布在基因組的各個(gè)區(qū)域,這就存在部分加速區(qū)域會(huì)在某些調(diào)控區(qū)域范圍集中形成一個(gè)熱點(diǎn)。本研究中,通過對(duì)加速區(qū)域分布的統(tǒng)計(jì)發(fā)現(xiàn),加速區(qū)域分布最多的基因,如、、基因在神經(jīng)結(jié)構(gòu)的發(fā)育和組成相關(guān)的GO條目中顯著富集,其中,基因周圍存在143個(gè)加速區(qū)域。相關(guān)研究[5,28]表明,基因在山羊的角形成過程中特異高表達(dá),且該基因可促進(jìn)神經(jīng)突的生長和黏附,提示可能在牛和山羊基因組中這些基因出現(xiàn)了加速進(jìn)化,改變了周圍調(diào)控區(qū)域,從而促使該基因在角形成過程中表達(dá)量升高,導(dǎo)致??苿?dòng)物的顱附外骨進(jìn)化發(fā)育成洞角。
[1] KER D F E,YANG Y P.Ruminants:Evolutionary past and future impact[J].Science,2019,364:1130–1131.
[2] JANIS C.The evolutionary strategy of the Equidae and the origins of rumen and cecal digestion[J].Evolution,1976,30(4):757–774.
[3] CHEN L,QIU Q,JIANG Y,et al.Large-scale ruminant genome sequencing provides insights into their evolution and distinct traits[J].Science,2019,364(6446):eaav6202.
[4] KIM T H,SHIVDASANI R A.Stomach development,stem cells and disease[J].Development,2016,143(4):554–565.
[5] LI R,F(xiàn)U W,SU R,et al.Towards the complete goat pan-genome by recovering missing genomic from the reference genome[J].Frontiers in Genetics,2019,10:1169.
[6] BOYD J L,SKOVE S L,ROUANET J P,et al. Human-chimpanzee differences in a FZD8 enhancer alter cell-cycle dynamics in the developing neocortex[J]. Current Biology,2015,25(6):772–779.
[7] FRANCHINI L F,POLLARD K S.Human evolution:the non-coding revolution[J].BMC Biology,2017,15(1):89.
[8] HOLLOWAY A K,BRUNEAU B G,SUKONNIK T,et al.Accelerated evolution of enhancer hotspots in the mammal ancestor[J].Molecular Biology and Evolution, 2016,33(4):1008–1018.
[9] HUBISZ M J,POLLARD K S.Exploring the genesis and functions of Human Accelerated Regions sheds light on their role in human evolution[J].Current Opinion in Genetics & Development,2014,29:15–21.
[10] LOOTS G G,LOCKSLEY R M,BLANKESPOOR C M,et al.Identification of a coordinate regulator of interleukins 4,13,and 5 by cross-species sequence comparisons[J].Science,2000,288(5463):136–140.
[11] BOFFELLI D,MCAULIFFE J,OVCHARENKO D,et al.Phylogenetic shadowing of primate sequences to find functional regions of the human genome[J].Science,2003,299(5611):1391–1394.
[12] PRABHAKAR S,NOONAN J P,P??BO S,et al. Accelerated evolution of conserved noncoding sequences in humans[J].Science,2006,314(5800):786.
[13] CAPRA J A,ERWIN G D,MCKINSEY G,et al.Many human accelerated regions are developmental enhancers[J]. Philosophical Transactions of the Royal Society of London Series B,Biological Sciences,2013,368(1632):20130025.
[14] 馮俊,李光,王義權(quán).后生動(dòng)物非編碼保守元件[J].遺傳,2013,35(1):35–44.
[15] POLLARD K S,SALAMA S R,LAMBERT N,et al.An RNA gene expressed during cortical development evolved rapidly in humans[J].Nature,2006,443(7108):167–172.
[16] HARRIS R S.Improved pairwise Alignmnet of genomic DNA[D].Philadelphia:The Pennsylvania State University,2007.
[17] BLANCHETTE M,KENT W J,RIEMER C,et al. Aligning multiple genomic sequences with the threaded blockset aligner[J].Genome Research,2004,14(4):708–715.
[18] HUBISZ M J,POLLARD K S,SIEPEL A.PHAST and RPHAST:phylogenetic analysis with space/time models[J].Briefings in Bioinformatics,2011,12(1):41–51.
[19] OKI S,OHTA T,SHIOI G,et al.ChIP-Atlas:a data-mining suite powered by full integration of public ChIP-seq data[J].EMBO Reports,2018,19(12):e46255.
[20] YU G C,WANG L G,HE Q Y.ChIPseeker:an R/Bioconductor package for ChIP peak annotation,comparison and visualization[J].Bioinformatics,2015,31(14):2382–2383.
[21] VISEL A,MINOVITSKY S,DUBCHAK I,et al. VISTA Enhancer Browser:a database of tissue-specific human enhancers.Nucleic Acids Research,2007,35(suppl_1):D88–D92.
[22] MCLEAN C Y,BRISTOR D,HILLER M,et al. GREAT improves functional interpretation of-regulatory regions[J].Nature Biotechnology,2010,28(5):495–501.
[23] YU G C,WANG L G,HAN Y,et al.clusterProfiler:an R package for comparing biological themes among gene clusters[J].OMICS:A Journal of Integrative Biology,2012,16(5):284–287.
[24] PARK S G,HANNENHALLI S,CHOI S S. Conservation in first introns is positively associated with the number of exons within genes and the presence of regulatory epigenetic signals[J].BMC Genomics,2014,15(1):526.
[25] GIAIMO B D,F(xiàn)ERRANTE F,HERCHENR?THER A,et al.The histone variant H2A.Z in gene regulation[J]. Epigenetics & Chromatin,2019,12(1):37.
[26] WANG Y,ZHANG C Z,WANG N N,et al.Genetic basis of ruminant headgear and rapid antler regeneration[J].Science,2019,364:eaav6335.
[27] LEE K S,BANG H,CHOI J K,et al.Accelerated evolution of the regulatory sequences of brain development in the human genome[J].Molecules and Cells,2020,43(4):331–339.
[28] LI W Q,HUANG L H,LIN W Y,et al.Engraftable neural crest stem cells derived from cynomolgus monkey embryonic stem cells[J].Biomaterials,2015,39:75–84.
The potential relationship between co-accelerated evolution regions in the genomes ofandand horn formation
LI Zifeng1,YIN Liduo2,LIU Dewu1*
(1.College of Animal Science, South China Agricultural University, Guangzhou, Guangdong 510642, China; 2.Kunming Institute of Zoology, Chinese Academy of Sciences, Kunming, Yunnan 650223, China)
To identify co-accelerated evolution regions(accelerated regions for short) ofandat whole genome-wide, and reveal the potential molecular mechanism under the evolution of the unique phenotype of bovids, we performed homologous genomic regions of 14 species the whole genome sequencing and bioinformatics analysis of genes with accelerated evolution events in coding regions, the enriched GO term, KEGG pathways and histone modification regions. The results showed that a total of 44 794 accelerated regions were detected in genome ofand. These acceleration regions were distributed in both the gene region and the non-gene region, accounting for 54.80 % and 45.20 % of the total, respectively. In addition, accelerated regions were significantly enriched in 25 active sites of histone. A total of 2703 candidate genes occurred accelerated evolution events in coding regions. Gene Ontology analysis indicated that these candidate genes were mainly involved in biological processes like axon genesis, gland development, muscle tissue development, cellular components like synaptic membrane, axon membrane, axon part, post-synaptic density. KEGG pathways showed that these candidate genes were mainly involved in cAMP signaling pathways, axon guidance signaling pathways,calcium signaling pathway andNeuroactive Ligand-Receptor Interaction.It indicated that during the formation of the horn in bovids, unique changes occur in the production of synapses and axons, which affects signal transmission and leads to the changes in transcription regulation and gene expression, resulting to the appearance of morphologically specific horns in bovids.
;; homologous region; co-accelerated evolution region;horn; synapses; axons
李梓鋒,殷利奪,劉德武.牛和山羊基因組共同加速進(jìn)化區(qū)域與角形成的潛在關(guān)系[J].湖南農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2022,48(5):578–584.
LI Z F,YIN L D,LIU D W.The potential relationship between co-accelerated evolution regions in the genomes ofandand horn formation[J].Journal of Hunan Agricultural University(Natural Sciences),2022,48(5):578–584.
http://xb.hunau.edu.cn
S823.2;S827.2
A
1007-1032(2022)05-0578-07
10.13331/j.cnki.jhau.2022.05.011
2021–03–27
2022–09–30
第二次青藏高原綜合科學(xué)考察研究任務(wù)五動(dòng)物專題(2019QZKK0501)
李梓鋒(1995—),男,廣東廣州人,碩士研究生,主要從事動(dòng)物遺傳育種與繁殖研究,837934075@qq.com;*通信作者,劉德武,博士,教授,主要從事分子遺傳與動(dòng)物育種、動(dòng)物健康養(yǎng)殖與安全生產(chǎn)研究,dwliu@scau.edu.cn
責(zé)任編輯:鄒慧玲
英文編輯:柳正