劉 帥,蔣 麗
(1.上海海洋大學(xué)水產(chǎn)科學(xué)國(guó)家級(jí)實(shí)驗(yàn)教學(xué)示范中心,上海 201306;2.中國(guó)水產(chǎn)科學(xué)研究院農(nóng)業(yè)農(nóng)村部水生動(dòng)物基因組學(xué)重點(diǎn)實(shí)驗(yàn)室,北京 100141)
日本沼蝦(Macrobrachiumnipponense)俗稱青蝦、河蝦,屬于節(jié)肢動(dòng)物門(Arthropoda)甲殼綱(Crustacea)十足目(Decapoda)長(zhǎng)臂蝦科(Palaemonidae)沼蝦屬(Macrobrachium),廣泛分布于我國(guó)及東南亞大部分地區(qū),由于其肉質(zhì)鮮美,營(yíng)養(yǎng)豐富,是我國(guó)重要的淡水養(yǎng)殖蝦種之一。雌雄差異及群體均勻度低是制約集約化養(yǎng)殖產(chǎn)量的主要因素,因而,從基因組水平對(duì)其體重相關(guān)的基因進(jìn)行解析,進(jìn)而培育具有較高均勻度且增重快的新品種對(duì)其養(yǎng)殖業(yè)發(fā)展具有戰(zhàn)略意義。
全基因組關(guān)聯(lián)分析(genome-wide association study,GWAS)是現(xiàn)代分子育種的重要輔助手段,通過(guò)單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)與目標(biāo)性狀之間的關(guān)聯(lián)檢驗(yàn),實(shí)現(xiàn)相關(guān)基因的定位,在水產(chǎn)動(dòng)物育種中發(fā)揮著重要作用。經(jīng)典的GWAS只針對(duì)單一性狀進(jìn)行分析,但當(dāng)不同性狀間存在遺傳相關(guān)時(shí),考慮性狀間協(xié)方差的多性狀分析相較于單性狀分析具有更高的檢驗(yàn)功效[1]和參數(shù)估計(jì)的精度[2]。已有研究證明,多性狀聯(lián)合 GWAS分析對(duì)顯著遺傳變異的檢測(cè)能力更強(qiáng)[3],且更具生物學(xué)意義[4]?;诖?,筆者對(duì)日本沼蝦體重和出肉率性狀進(jìn)行聯(lián)合分析,實(shí)現(xiàn)對(duì)相關(guān)基因的定位和篩選,以期為日本沼蝦生長(zhǎng)增重的基因表達(dá)解析提供理論支撐,進(jìn)而促進(jìn)其養(yǎng)殖業(yè)發(fā)展。
1.1 試驗(yàn)群體及表型測(cè)量試驗(yàn)用蝦養(yǎng)殖于中國(guó)水產(chǎn)科學(xué)研究院淡水漁業(yè)研究中心宜興大浦基地,收集日齡52 d的成熟蝦,隨機(jī)挑選200尾健康蝦(雌雄各100尾)編號(hào),記錄體重,收集蝦尾部的肌肉并稱重,尾部肌肉與體重的比值為出肉率。此外,收集的肌肉需轉(zhuǎn)入凍存管中于-80 ℃保存,以便進(jìn)行DNA提取。
1.2 DNA提取、測(cè)序及基因型數(shù)據(jù)的獲取以收集的肌肉組織為材料,根據(jù)酚-氯仿法[5]提取DNA,使用1%瓊脂糖凝膠評(píng)估提取DNA質(zhì)量,并將其濃度調(diào)整至2.5 μg/μL,最終在北京華大基因完成序列測(cè)定。原始測(cè)序數(shù)據(jù)經(jīng)工具包NGS QC Toolkit[6]質(zhì)控過(guò)濾后,通過(guò)軟件BWA[7]與日本沼蝦參考基因組(GCA_015104395.1)進(jìn)行對(duì)比分析,通過(guò)軟件Picard(https://github.com/broadinstitute/picard)去除對(duì)比結(jié)果中的重復(fù)序列,最終由軟件GATK(https://github.com/broadinstitute/gatk)實(shí)現(xiàn)SNP位點(diǎn)的篩選,從而完成基因分型。獲得的分型數(shù)據(jù)需要通過(guò)PLINK[8]軟件進(jìn)一步質(zhì)控和過(guò)濾,去除樣本分型成功率≤90%,最小等位基因頻率≤5%的位點(diǎn)并生成二進(jìn)制基因型數(shù)據(jù)。
1.3 全基因組關(guān)聯(lián)分析分別對(duì)體重、出肉率性狀進(jìn)行單性狀的全基因組關(guān)聯(lián)分析,并對(duì)2個(gè)性狀進(jìn)行多性狀聯(lián)合分析,其中單性狀分析使用GEMMA[9]軟件中的單性狀混合模型分析,多性狀聯(lián)合分析采用GEMMA軟件中的多性狀線性混合模型。以Bonferroni校正閾值[10]為界限篩選與性狀顯著相關(guān)的SNP位點(diǎn),并通過(guò)R語(yǔ)言繪制曼哈頓和Q-Q圖。
1.4 基因注釋根據(jù)檢驗(yàn)顯著SNP位點(diǎn)于參考基因組上的物理位置,提取其上下游區(qū)域250 kb范圍內(nèi)的序列,通過(guò)軟件KOBAS(http://kobas.cbi.pku.edu.cn/kobas3)調(diào)整參數(shù)“-e 1e-5”實(shí)現(xiàn)對(duì)提取序列的注釋,根據(jù)NCBI數(shù)據(jù)庫(kù)及文獻(xiàn)檢索實(shí)現(xiàn)注釋的功能注釋。
2.1 表型及基因型描述統(tǒng)計(jì)剔除體重、出肉率表型數(shù)據(jù)中的缺失項(xiàng)后共獲得181尾蝦的表型數(shù)據(jù)(表1),性狀間的相關(guān)關(guān)系及分布見(jiàn)圖1~3?;?81尾蝦分型獲得的基因型數(shù)據(jù)中剔除分型成功率≤90%及最小等位基因頻率≤5%的位點(diǎn)后,共獲得7 793個(gè)高質(zhì)量SNP位點(diǎn)。
表1 表型描述性統(tǒng)計(jì)Table 1 Descriptive statistics of phenotype
圖1 日本沼蝦體重性狀分布Fig.1 Distribution in traits of body weight for Macrobrachium nipponense
2.2 全基因組關(guān)聯(lián)分析對(duì)體重、出肉率進(jìn)行單一性狀的全基因組關(guān)聯(lián)分析及兩性狀的聯(lián)合分析,結(jié)果如圖4所示。觀察圖4 d~圖4f,根據(jù)統(tǒng)計(jì)檢驗(yàn)概率P值擬合的實(shí)際曲線均與理論曲線有較高的一致性,且基因組控制值(λ)位于1.00附近[11],說(shuō)明關(guān)聯(lián)檢驗(yàn)的統(tǒng)計(jì)準(zhǔn)確性較高,進(jìn)而可說(shuō)明曼哈頓圖中檢測(cè)到的SNP具有較高的可信度(圖4a~c),水平線表示Bonferroni校正閾值(0.05/7793,6.42e-06)分布于水平線上方的位點(diǎn)具有與性狀的顯著相關(guān)性。由圖4a可知,在體重單性狀關(guān)聯(lián)分析中,僅檢測(cè)到1個(gè)SNP位點(diǎn)與之相關(guān);在出肉率的單性狀關(guān)聯(lián)分析中(圖4b),并未檢查測(cè)到顯著SNP位點(diǎn);在兩性狀的聯(lián)合分析中(圖4c),共檢測(cè)到6個(gè)SNP位點(diǎn),且體重單性狀分析檢測(cè)到的SNP位點(diǎn)也被包含在內(nèi),這證明多性狀聯(lián)合分析對(duì)SNP檢測(cè)的效率具有顯著提升作用。
圖2 日本沼蝦出肉率性狀分布Fig.2 Distribution in traits of meat rate for Macrobrachium nipponense
圖3 日本沼蝦體重和出肉率性狀相關(guān)關(guān)系Fig.3 The correlation between trait of body weight and meat rate in Macrobrachium nipponense
圖4 日本沼蝦體重、出肉率單一分析及聯(lián)合分析的曼哈頓和Q-Q圖Fig.4 The manhattan and Q-Q plot of single and combine analysis for body weight,meat rate in Macrobrachium nipponense
2.3 候選基因根據(jù)日本沼蝦體重和出肉率聯(lián)合分析獲得的顯著SNP 位點(diǎn)為探針,提取其所在日本沼蝦全基因組位置上下游250 bp區(qū)域內(nèi)的序列,通過(guò)數(shù)據(jù)庫(kù)kobas完成候選基因的在線注釋與鑒定,共鑒定出5個(gè)候選基因(表 2),分別為Jrkl(JRK like)、Tep2(Thioester-containing protein 2)、ZNF84(zinc finger protein 84)、CG12299和swm(second mitotic wave missing)。通過(guò)KEGG通路注釋分析,這些候選基因主要參與基因表達(dá)調(diào)控、轉(zhuǎn)錄調(diào)控、細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)、蛋白酶解、內(nèi)肽酶分析及先天性免疫系統(tǒng)發(fā)育等生物學(xué)過(guò)程,在機(jī)體分化發(fā)育方面發(fā)揮著重要作用。
表2 日本沼蝦體重和出肉率兩性狀聯(lián)合分析的顯著位點(diǎn)與基因Table 2 Significant loci and genes of joint analysis for body weight and meat yield in Macrobrachium nipponense
隨著測(cè)序成本的下降及多種水產(chǎn)動(dòng)物基因組全測(cè)序的完成,GWAS技術(shù)逐漸應(yīng)用于水產(chǎn)動(dòng)物的基因定位及育種領(lǐng)域。吳碧銀等[12]通過(guò)GWAS分析技術(shù)發(fā)現(xiàn)了影響低氧環(huán)境下鯉耐受性的23個(gè)候選基因。陳小明等[13]利用GWAS檢測(cè)到26個(gè)與大黃魚耐高溫相關(guān)的基因。徐鴻飛等[14]對(duì)紅羅非魚低溫體色變異現(xiàn)象進(jìn)行GWAS分析,發(fā)現(xiàn)了19個(gè)與之相關(guān)的功能基因。
盡管GWAS在水產(chǎn)動(dòng)物已有諸多應(yīng)用,但大多數(shù)都是針對(duì)單一表型的關(guān)聯(lián)分析,而水產(chǎn)動(dòng)物的表型如體重、體長(zhǎng)、性別之間存在顯著相關(guān)性,因而對(duì)表型進(jìn)行單一性狀關(guān)聯(lián)分析時(shí),通常會(huì)忽略某個(gè)SNP位點(diǎn)對(duì)多個(gè)性狀的共同影響,致使檢驗(yàn)SNP位點(diǎn)的個(gè)數(shù)變少,篩選到的候選基因精度降低。相較于單一性狀關(guān)聯(lián)分析,多個(gè)性狀聯(lián)合分析方法在顯著SNP的定位上表現(xiàn)出更高的檢測(cè)能力和精確度。通過(guò)對(duì)比日本沼蝦體重和出肉率兩性狀 GWAS 與兩性狀分別進(jìn)行單一性狀 GWAS 的結(jié)果發(fā)現(xiàn),在相同的顯著水準(zhǔn)下,前者檢測(cè)到 6個(gè)顯著SNP 遠(yuǎn)多于后兩者共檢測(cè)到的1個(gè)與體重相關(guān)的SNP。基于聯(lián)合分析檢測(cè)到的6個(gè)顯著SNP位點(diǎn)篩選到的5個(gè)功能基因中,Jrkl為功能未知的新基因;Tep2編碼含硫蛋白2,參與代謝、細(xì)胞程序性死亡及免疫應(yīng)激等有關(guān)生物學(xué)活動(dòng)的調(diào)控[15];ZNF84和CG12299[16]分別編碼鋅指蛋白84和鋅指蛋白135,作為鋅指蛋白家族的成員,可通過(guò)其鋅指結(jié)構(gòu)域與轉(zhuǎn)錄因子結(jié)合進(jìn)而調(diào)控基因表達(dá)[17],參與細(xì)胞增殖、分化和凋亡等多種生理過(guò)程,維持組織穩(wěn)態(tài);swm編碼的蛋白是Hh信號(hào)的負(fù)調(diào)節(jié)因子[18],對(duì)細(xì)胞極性至關(guān)重要。該研究定位到的候選基因都與機(jī)體發(fā)育相關(guān),可能在日本沼蝦體重和出肉率性狀的表現(xiàn)上有重要影響,因而可對(duì)日本沼蝦體重和出肉率的解析提供理論支撐。