吳思雯,馮 彤,Rehman Saifur,劉慶友
(中國科學院亞熱帶農(nóng)業(yè)生物資源保護與利用國家重點實驗室,廣西大學動物科學技術(shù)學院,廣西南寧 530005)
水牛()約在6 000 年前被人類馴化,為約20 億人提供了乳、肉等重要初產(chǎn)品,以及黃油、酸奶、奶酪等優(yōu)質(zhì)加工品,帶動了至少67 個國家的經(jīng)濟發(fā)展,被聯(lián)合國糧農(nóng)組織(FAO)譽為養(yǎng)活世界人口最多的大家畜。作為世界重要的經(jīng)濟型家畜,水牛的產(chǎn)奶性狀、生長性狀、繁殖性狀和毛色等性狀越來越被重視并納入育種規(guī)劃的重要指標。1999—2019 年全球水牛數(shù)量增長約25.9%,水牛奶產(chǎn)量增長約106%,水牛肉產(chǎn)量增長約45%,水牛生產(chǎn)快速發(fā)展。
雖然水牛整體數(shù)量和產(chǎn)業(yè)發(fā)展較快,但水牛在選擇培育中依然面臨著生殖效率低、生產(chǎn)潛力差和產(chǎn)奶量低等諸多問題,亦有少數(shù)水牛品系瀕臨滅絕。因此,為了更明確地鑒定現(xiàn)存水牛品種以保護遺傳完整性,選擇培育優(yōu)良水牛品種,通過對水牛進行參考基因組分析,研究其基因型和核型,挖掘出一批與其重要經(jīng)濟性狀高度關(guān)聯(lián)的基因,對水?;蚪M育種具有重要的指導(dǎo)意義。全基因組單核苷酸多態(tài)性(Single Nucleotide Polymorphisms,SNPs)選育方式使用全基因組SNP育種芯片作為遺傳標記,可同時分析大量SNP 位點的遺傳效應(yīng),減少世代間隔,加快遺傳進展,奶牛全基因組育種技術(shù)使其遺傳改良育種的速度提高兩倍,目前基因組分析在畜禽育種生產(chǎn)中已經(jīng)得到了廣泛應(yīng)用。本文將對水?;蚪M和功能基因解析研究進展進行綜述,并對優(yōu)化建立水牛全基因組選擇育種和基因組設(shè)計育種進行展望。
近年來,水?;蚪M及重要經(jīng)濟性狀關(guān)聯(lián)基因的研究受到越來越多的關(guān)注,這是因為水牛營養(yǎng)豐富,且可以在高溫高濕的環(huán)境下靠粗飼較好生存。水牛是第二大乳用動物,產(chǎn)奶量約占全球牛奶產(chǎn)量的15%。水牛奶含有100 多種營養(yǎng)成分(表1),與奶牛奶相比,水牛奶含有更高的總干物質(zhì),更多的蛋白質(zhì)(酪蛋白含量極高)和脂肪酸。水牛奶富含鈣(191 mg/100 g)和磷(185 mg/100 g),兩者比率幾乎為1:1,其維生素B含量(0.33 mg/100 g)也比奶牛奶的高出近1 個數(shù)量級,同時含有維生素C、維生素A 和維生素H 等。水牛奶還是豐富的必需氨基酸來源,其賴氨酸含量是奶牛奶的兩倍。此外水牛奶可以加工成豐富多樣口感極佳的奶制品。除了供奶,水牛肉的膽固醇和脂肪含量較低,是優(yōu)質(zhì)動物蛋白。Giordano 等研究發(fā)現(xiàn)食用水牛肉可以帶來明顯的心血管益處,適用于有患心血管和腦血管疾病風險的人。水牛肉還含有豐富的鋅和復(fù)合維生素B,可滿足Ordovas 等推薦給女性的營養(yǎng)需求,從而實現(xiàn)個性化營養(yǎng)的目標。本草綱目記載:“水牛肉:安中益氣,養(yǎng)脾辦,健強筋骨,消水腫,除濕氣”。此外,水牛是最重要的稻田勞動力,與水稻產(chǎn)生了獨特的稻作文化和水田中天然的循環(huán)農(nóng)業(yè)。水牛皮是各種皮革產(chǎn)品的重要來源,水牛糞是天然有機肥料。水牛對維持生態(tài)系統(tǒng)也起至關(guān)重要的作用,例如Chilika 水牛瀕臨滅絕,導(dǎo)致其放牧和糞便量減少,一定程度破壞了印度東部奇利卡湖作為野生動物棲息地和漁場的生態(tài)系統(tǒng)。水牛除了上述優(yōu)勢特性外,比其他牛更能有效地將劣質(zhì)粗飼料轉(zhuǎn)化為高營養(yǎng)產(chǎn)品(奶和肉)。
表1 每100g 水牛奶和奶牛奶的營養(yǎng)成分比較
水牛在分類學上屬于哺乳綱(),偶蹄目(),??疲ǎ伲ǎ?。野生水牛主要有亞洲水牛亞屬()和非洲水牛亞屬()2 種類型。亞洲水牛屬為目前主要的研究對象,可以分為河流型水牛(Bubalus bubalis)(2n=50)和沼澤型水牛(Bubalus carabanesis)(2n=48)2 個亞種,并在馴化和分化歷程中,逐漸表現(xiàn)為河流型水牛種群的系統(tǒng)地理結(jié)構(gòu)較弱,表型多樣性較高且品種較多;沼澤型水牛種群缺乏基因流,具有較強的系統(tǒng)地理結(jié)構(gòu),表型一致性較高。
基因組學主要研究基因組的結(jié)構(gòu)、功能和進化及其對生物體的影響。在進化過程中,基因組會發(fā)生許多大大小小的變化,因此研究水?;蚪M,首先要探討水?;蚪M結(jié)構(gòu),同時要解析水牛進化歷程以及馴化有關(guān)的重要基因座。
2.1 水牛的染色體共線性分析 河流型水牛染色體有25對,而沼澤型水牛有24 對,河流型水牛的4 號染色體和9 號染色體融合為沼澤型水牛的1 號染色體(圖1),這2 個亞種除了前5 對是中間著絲粒染色體外,其他所有的染色體(包括性染色體在內(nèi)的)都是端著絲粒(圖1-A)。黃牛有29 對近端著絲粒染色體和1 對性染色體(ΧY),而水牛有19 對近端著絲粒染色體、5 對雙臂染色體和1 對性染色體(ΧY)組成(圖 1-B)。
圖1 水牛(河流型和沼澤型)和黃牛的細胞遺傳學
2.2 水牛的分化與馴化 目前全世界共記錄水牛品種有136 個,約2.04 億頭(2019 年),其中約2 億頭(97%)分布在亞洲,其余散布在其他四大洲,這種地理分布是水牛分化與馴化的結(jié)果。分子數(shù)據(jù)表明沼澤型水牛和河流型水牛的分化發(fā)生在它們被馴化之前,這種分化可能是由于種群大小、樣本、mtDNA 序列、突變率和基因差異造成的。最近的全基因組研究使用Ks 分布和MCMC 樹方法評估了沼澤型水牛和河流型水牛之間的分化時間,估計沼澤型水牛和河流型水牛分化在350 萬年~110 萬年前,并由此推測這兩類水牛發(fā)生了獨立的人工馴化選擇。然而Mishra 等認為分化時間在170 萬年~1 萬年前,而Wang 等通過線粒體基因組分析估算沼澤型水牛分化時間為90 萬年~86 萬年前。分化時間點仍存爭議,這可能需要更多的水?;蚪M數(shù)據(jù)進一步解析。沼澤型水牛在3 000~7 000 年前馴化于印度支那邊界地區(qū),河流型水牛約6 300 年前馴化于印度次大陸西部。通常連續(xù)的水牛遷移事件發(fā)生在不同時間和不同地理尺度上,依據(jù)SNPs、mtDNA 和考古證據(jù),可提出2 個獨立的遷移事件:河流型水牛早期馴化中心最有可能在印度-巴基斯坦地區(qū),然后向西遷移遠至埃及、巴爾干半島和意大利南部,而沼澤型水牛早期馴化中心在靠近中國/印度支那的邊界,從印度支那北部通過東-南-東的路線遷移,在中國、中南半島、菲律賓和印度尼西亞等推廣。更新世冰川事件影響了沼澤型水牛祖先的種群數(shù)量,導(dǎo)致種群規(guī)模下降,形成偏遠的聚集地。在全新世后冰期(1.1 萬年~0.6萬年前),由于氣候改善,沼澤型水牛馴化后得到快速的種群擴張和廣泛的地理分布。
2.3 水牛全基因組測序進展 水牛全基因組測序在過去5年里取得了較大進展。截至2020 年12 月31 日,已有36個水?;蚪M注釋集,29 個在NCBI(https://www.ncbi.nlm.nih.gov),5 個在EBI(https://www.ebi.ac.uk),2 個在中國科學院北京基因組研究所數(shù)據(jù)中心(https://bigd.big.ac.cn)。水?;蚪M總大小、注釋到的基因數(shù)、測序樣本量等都達到新的高度,極大地豐富了水?;蚪M數(shù)據(jù)信息集。例如,Mintoo 等對孟加拉的河流型水?;蚪M進行測序組裝,拼接基因組大小為2.77 Gb,Contig N50 為25 kb,注釋到24 613 個功能基因,確定了159 個基因家族,并發(fā)現(xiàn)與其他哺乳動物相比,這些基因家族擴張在水牛中大大加強。與非洲野生水牛基因組(37.21%)相比,家養(yǎng)化水?;蚪M中重復(fù)DNA占51.19%(1 418 Mbp),高出約13%,且家養(yǎng)水牛49.06% 的基因組為轉(zhuǎn)座元件,其中41.50% 為長散在重復(fù)序列。Dutta 等對印度6 個不同水牛品種(Bhadawari、Banni、Murrah、Jaffarabadi、Surti 和Pandharpuri)進行重測序分析,不僅發(fā)現(xiàn)了26 247 559個雙等位SNVs,其中25 513 085 個位于常染色體,而且其結(jié)果與其他馴化物種的特定品種對比突出了河流型水牛的遺傳多樣性,并提供了跨物種趨同馴化的證據(jù)。Luo 等在國際上首次組裝獲得中國沼澤型水牛和印度河流型摩拉水牛的高質(zhì)量染色體級別參考基因組(2.631 Gb 和2.646 Gb),Scaffolds N50 分別達到117.3 Mb 和116.1 Mb,分別注釋到19 279 個和20 202個基因,其BUSCO 評估率分別為 96.8% 和 96.0%。此外,Luo 等對中國、印度和巴基斯坦等15 個國家共30 個地方品種水牛230 頭個體進行了全基因組重測序分析(其中沼澤型水牛共132 頭,河流型水牛98 頭),共獲得了沼澤型水牛1 873 萬個、河流型水牛2 372 萬個和水牛整體群體3 352 萬個SNPs 位點,構(gòu)建成迄今最完善的水?;蚪M遺傳多樣性數(shù)據(jù)集。
表2 基因組序列統(tǒng)計、注釋和種群參數(shù)[13]
3.1 水牛耐熱性狀的相關(guān)基因 水牛主要棲息在熱帶和亞熱帶地區(qū),能在炎熱的夏天在水稻田耕作,抗熱應(yīng)激能力極強,這與熱休克蛋白(Heat Shock Proteins,HSPs)基因調(diào)控十分相關(guān)。HSPs 是包括水牛在內(nèi)的多種生物中廣泛存在的一類蛋白質(zhì),最關(guān)鍵的功能是通過抵抗細胞蛋白質(zhì)的變性來保護細胞免受熱應(yīng)激侵襲,被認為是量化不同牲畜物種中抗熱應(yīng)激強度的潛在生物標記。目前水?;蚪M中共發(fā)現(xiàn)64 個基因,其中39 個屬于基因家族,4 個屬于基因家族,8 個屬于HSPB 家族,10 個屬于基因家族,家族、家族和家族各1 個。研究發(fā)現(xiàn)水牛HSP 家族基因的SNPs、外轉(zhuǎn)錄子和啟動子區(qū)域與水牛的產(chǎn)奶量、耐熱性、應(yīng)激恢復(fù)力和疾病易感性呈顯著關(guān)聯(lián)。Luo 等研究發(fā)現(xiàn)水?;蚪M中HSPs 基因家族顯著擴張,HSPs 的拷貝數(shù)顯著多于其他物種,是脅迫誘導(dǎo)的分子伴侶,與水牛的環(huán)境脅迫適應(yīng)相關(guān)。其中家族的研究較為成熟。與家族的其他基因相比,基因的非同義SNPs 與同義SNPs 的比例較高(0.59),這表明基因由于與細胞耐熱性密切相關(guān)而處于選擇狀態(tài),這在Murrah 和Tarai 水牛中有所體現(xiàn),即在夏季的表達更高。另外基因與繁殖性能有關(guān),其SNPs 多態(tài)性影響公水牛精液質(zhì)量,且mRNA 在水牛卵母細胞熱環(huán)境和冷環(huán)境處理中具有顯著差異,該基因表達上調(diào)后具有促進細胞凋亡的效果,在??苿游锱咛ブ谐S闷浔磉_量作為熱應(yīng)激程度的標識指標。
3.2 水牛繁殖性狀的相關(guān)基因 水牛繁殖效率低,篩選繁殖性狀關(guān)聯(lián)基因以提高水牛的生產(chǎn)效益?zhèn)涫荜P(guān)注。Lei 等報道,可能通過調(diào)節(jié)顆粒細胞的增殖和凋亡來促進水牛卵泡的選擇和優(yōu)勢化,添加重組蛋白會引起顆粒細胞關(guān)鍵細胞周期調(diào)節(jié)因子(如cyclin D1 和cyclin D2)的表達上調(diào),而且還上調(diào)了在生長濾泡的選擇和控制中起重要作用的系統(tǒng)和等的表達。黃體生成素多肽基因和促性腺激素釋放激素受體基因的SNPs 與中國水牛精子質(zhì)量性狀之間存在顯著關(guān)聯(lián)。某些特定基因型與精子性狀有關(guān)。Cheng 等通過連鎖不平衡分析鑒定出4 個單倍型(H1:ACG,H2:CCG,H3:CTA 和H4:CCA),其中基因型為H2H2 的水牛射精量較多,單體型為H1H4 的水牛精子密度較高。Wang 等通過同種分析方法鑒定出3 個單倍型(H1:TAI,H2:CT-和H3:TT-),合并基因型H1H2 和H1H3 的水牛射精量較多,且中18 953 bp 處的GGCAAAGTAA 缺失與較多射精量顯著相關(guān)?;蚓庉嫷募毎豍450 芳香酶調(diào)節(jié)雌激素的生物合成,并且基因表達降低可能會提高卵巢氧化性損害的發(fā)生率,影響雌水牛的繁殖效率。
3.3 水牛產(chǎn)奶性狀的相關(guān)基因 產(chǎn)奶性狀的遺傳標記選擇是提高水牛產(chǎn)奶量的重要途徑,在不同的水牛品種中,目前已報道了19 個與產(chǎn)奶性狀有關(guān)的候選基因,包含47 個突變,分別發(fā)生在啟動子區(qū)(4 個)、內(nèi)含子區(qū)(24 個)和編碼區(qū)(19 個),而這19 個編碼區(qū)中有13 個突變是非同義的,會導(dǎo)致氨基酸發(fā)生替代。如表3 所示將這19 個與產(chǎn)奶性狀相關(guān)的基因分為4 大類。Iamartino 等研究發(fā)現(xiàn)了與牛奶生產(chǎn)相關(guān)的9 種重要SNPs,其中重要的SNPs 位于基因的下游~51 kb 處,其內(nèi)含子區(qū)域的SNP 與牛的乳脂產(chǎn)量相關(guān)。生長激素受體(Growth Hormone Receptor,)基因多態(tài)性與埃及水牛產(chǎn)奶量、牛奶質(zhì)量以及分子變化有關(guān),在GHR 突變型AA 單倍型水牛的體細胞中GH 和IGF1 表達顯著增加,表明c.380G>A(該SNP 位于GHR 胞外結(jié)構(gòu)域中)和c.836T>A(該SNP位于GHR 跨膜結(jié)構(gòu)域中)SNPs 可能直接或間接(通過與其他致病性SNP 連接)改變GH 表達,進而誘導(dǎo)IGF1 表達,造成這些基因型水牛的產(chǎn)奶量更高。Fan 等在河流型和沼澤型水牛的基因編碼序列中發(fā)現(xiàn)13 個SNPs,其中8 個SNPs 是非同義的,其中c.580T>C 和c.642C>G 引起的氨基酸變化可能影響水牛S2-酪蛋白(S2-casein,S2-CN)合成,最終影響產(chǎn)奶量。
表3 具有不同產(chǎn)奶性狀的候選基因[35]
3.4 水牛役用性狀的相關(guān)基因 中國水牛幾乎都是沼澤型水牛,是稻作文明的主要勞動力,溫順耐勞。研究在沼澤型水?;蚪M中發(fā)現(xiàn)了與運動相關(guān)的一些受選擇的基因(和),這些基因參與信號通路和黏著連接通路,與水牛的稻田耕作耐力強和肌肉低氧代謝息息相關(guān)。沼澤型水牛的催產(chǎn)素受體基因呈現(xiàn)多態(tài)性明顯降低的信號,基因多態(tài)性與人類多種社會行為(包括親情、社會認知、共情和利他行為等)相關(guān),由此推測是水牛溫順聽話性格形成的關(guān)鍵調(diào)控基因。此外,信號通路中的關(guān)鍵基因在沼澤型水?;蚪M中表現(xiàn)出強烈的選擇信號(π 值低,F(xiàn)st 值高,Tajima's D 值為負值),改變基因的表達可實現(xiàn)骨骼肌纖維由快肌纖維向慢肌纖維的定向分化,充分表明水?;蚴艿竭x擇與稻作役用性能息息相關(guān)。
3.5 水牛的抗病相關(guān)基因 水牛與其他同類動物相比,具有較強的抵抗感染的先天免疫力,對肺結(jié)核、乳腺炎、蜱蟲病或巴貝斯蟲病的抵抗力更好。Sun 等報道,在水牛自身免疫性疾病中起重要作用,在淋巴細胞與脾基質(zhì)成分的正確結(jié)合中起著重要作用,與子宮炎有關(guān),和與結(jié)核病有關(guān),這些基因表達增強了水牛環(huán)境適應(yīng)能力和抗病性。此外,(干擾素-)基因中的g.4467G>A 多態(tài)性影響miR-125b 的靶序列并賦予其對水牛中牛結(jié)核病的敏感性。在埃及水牛群體中追蹤到補體C3 基因第27 外顯子C>A 的替換與乳腺炎的潛在征兆顯著相關(guān)。
3.6 水牛毛色調(diào)控基因 毛色是水牛重要的體貌特征,為顯性遺傳性狀,盡管目前已有一些報道其分子調(diào)控機制,但尚未被系統(tǒng)解析。沼澤型水牛通常是深灰色,但純白色的是一個常見變種,發(fā)生頻率高達10%。白色斑點水牛在印度尼西亞被高度重視,其基因中含有兩種導(dǎo)致功能喪失的獨立突變,包括供體剪接位點的突變和過早終止密碼子突變,這可能是造成白斑皮膚的重要原因。張毅等研究發(fā)現(xiàn)基因的高表達阻礙了黑色素細胞發(fā)育,導(dǎo)致白水牛皮膚基底層缺乏成熟黑色素細胞及色素顆粒,首次系統(tǒng)地揭示了水牛白毛色性狀形成的分子機制。因在白水牛Agouti 信號蛋白()基因上游存在一個LINE-1 轉(zhuǎn)座子的插入,長2 809 個核苷酸,只含有完整LINE-1 轉(zhuǎn)座子的5'-UTR區(qū)域,但仍行使基因新的強啟動子功能,使白水牛皮膚基因的表達量提高了近10 倍,且LINE-1轉(zhuǎn)錄序列與基因編碼外顯子形成白水牛特有的融合轉(zhuǎn)錄本。
近年來隨著眾多與畜禽重要經(jīng)濟性狀相關(guān)位點的挖掘及其功能基因的定位,由此產(chǎn)生的標記輔助選擇育種技術(shù)逐步完善,因此有效推動了包括水牛在內(nèi)的多種動物遺傳改良進展。水?;蚪M研究與重要經(jīng)濟性狀功能基因的挖掘得到加速,基因組選擇育種技術(shù)受到全球關(guān)注。目前已有一些關(guān)于水牛基因組的研究被報道,但水?;蚪M數(shù)據(jù)仍然缺乏,特別是我國經(jīng)過近50 余年雜交改良,存養(yǎng)了一批優(yōu)秀的雜交水牛群體,亟需建立現(xiàn)代基因組選擇育種技術(shù)加快遺傳進展和水牛新品種選育。水?;蚪M和功能基因解析相對滯后成為制約我國水牛產(chǎn)業(yè)發(fā)展的瓶頸問題,亟待加速解決。水牛基因組、基因組變異和重要經(jīng)濟性狀關(guān)聯(lián)基因的進一步解析將加速建立水牛基因組水牛血統(tǒng)溯源、基因組選配和優(yōu)化的基因組育種芯片技術(shù),以及針對重要功能基因的基因編輯技術(shù),最終為人類培育出產(chǎn)奶量高、個體大、性格溫順、抗熱應(yīng)激且耐粗飼的理想水牛品種。