• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    參考群篩選方法及規(guī)模對基因型填充準確性的影響

    2021-12-31 01:08:46陽文攀葉紹潘葉浩強張志剛張細權陳贊謀
    畜牧獸醫(yī)學報 2021年12期
    關鍵詞:系譜等位基因準確性

    陽文攀,葉紹潘,葉浩強,林 清,魏 趁,張志剛,張細權,陳贊謀,張 哲*

    (1.華南農業(yè)大學動物科學學院 國家生豬種業(yè)工程技術研究中心,廣州 510642;2.福建傲農生物科技集團股份有限公司,漳州 363000;3.廈門銀祥集團有限公司 肉食品安全生產技術國家重點實驗室,廈門 361100;4.汕頭大學理學院,廣東省海洋生物技術重點實驗室,汕頭 515063)

    在畜禽選育中,育種值估計準確性是影響畜禽遺傳進展的重要因素之一?;蚪M選擇(genomic selection,GS)能有效提高育種值估計準確性,已在奶牛育種中取得了較大效益[1],并逐漸推廣到豬[2]、雞[3]、魚[4]等畜禽及水產品種選育中。在實施基因組選擇時,參考群規(guī)模和標記密度是影響基因組選擇準確性的重要因素[5-6]。由于基因分型成本較高,常通過構建具有高密度SNP芯片數(shù)據(jù)或全基因組序列數(shù)據(jù)的參考群體,根據(jù)不同方法對低密度SNP芯片進行基因型填充,以獲得高質量的基因型數(shù)據(jù)[7-9]。目前,該技術已廣泛應用于奶牛[10]、豬[11]、雞[12]等畜禽育種中。

    通過基因型填充獲取高質量高密度的基因型數(shù)據(jù)是提高基因組選擇準確性的有效方式之一[13]。然而,基因型填充的準確性受諸多因素影響,如基因型填充軟件[14]、參考群規(guī)模[15]、參考群體和目標群體之間的關系[16]等。其中,參考群篩選和構建方式尤為重要,參考群規(guī)模越大,基因型填充準確性越高,然而基因分型成本也隨之增加[17]。研究表明,當參考群體與目標群體間的親緣關系較近時,兩者之間的單倍型長度和數(shù)量都會增加,使填充更準確[18-19]。因此,如何篩選關鍵個體構建參考群至關重要,能夠保證基因型填充準確性從而降低成本。

    本研究擬使用矮小黃羽肉雞資源群體作為研究對象,采用不同方法篩選關鍵個體構建參考群,將低密度標記的驗證群填充至高密度標記,通過比較不同參考群篩選方法的基因型填充準確性及其在基因組預測中的應用效果,探究構建參考群最佳的策略,為基因型填充技術在遺傳育種中的應用提供參考。

    1 材料與方法

    1.1 試驗群體

    本研究所用群體來自廣東溫氏南方家禽育種有限公司提供的矮小型黃羽肉雞N301系第25世代03批次,共1 600羽個體,公母各半,全部由30只公雞和360只母雞產生。結合系譜信息和性狀記錄的完整性,選取15羽親本公雞及435羽子代公雞送往上海伯豪生物技術有限公司(Shanghai Biotechnology Corporation)進行基因分型,基因分型采用雞600K SNP芯片(Affymetrix Axion HD genotyping array),最終共檢測到559 898個SNPs位點。同時測定435羽子代公雞45、56、70、84、91日齡體重。

    1.2 低密度芯片數(shù)據(jù)模擬

    為保證SNP芯片的質量及基因型填充,本研究使用Plink v1.90[20]去除未定位到參考基因組染色體上的SNP位點后剩余552 335個SNPs,使用Beagle4.0(r1399)[21]對缺失位點進行填充;使用Plink對填充后的數(shù)據(jù)進行質量控制,剔除小等位基因頻率小于0.005的SNP位點,剩余464 119個SNPs。60K芯片數(shù)據(jù)生成采用隨機提取和相等排序間隔提取兩種方式,共進行5次重復。隨機提取方式是使用R v4.0.1[22]軟件設立3組隨機數(shù)種子,從464 119個SNPs中隨機選取46 412個SNPs生成,共3次重復。相等排序間隔提取方式是從根據(jù)染色體與物理位置排序后的600K芯片中每隔10個SNPs取1個SNP,從第2、7個SNP開始,共2次重復。

    1.3 關鍵群體篩選方法

    為探究不同參考群篩選方法對基因型填充準確性的影響,本研究主要涉及表1中的5種參考群篩選方法。

    表1 不同參考群篩選方法Table 1 The different methods for choosing reference population

    1.4 基因型填充準確性影響因素比較

    為探究不同版本Beagle軟件及系譜使用對基因型填充準確性的影響,本研究根據(jù)MCA、RELA、KIN、RAN方法篩選前50個關鍵群體作為參考群,分別使用Beagle4.0+系譜信息、Beagle4.0、Beagle5.1(18May20.d20)[21,23]將60K SNP芯片數(shù)據(jù)填充至600K SNP芯片數(shù)據(jù),比較不同版本Beagle軟件及系譜使用基因型填充等位基因一致性比率。

    為探究不同參考群篩選方法對基因型填充準確性的影響,本研究分別根據(jù)RELA、MCA、KIN、RAN方法篩選的前15個關鍵個體和15個共同祖先作為參考群,使用Beagle4.0與系譜信息對目標群體進行填充,軟件使用默認參數(shù),將60K SNP芯片數(shù)據(jù)填充至600K SNP芯片數(shù)據(jù),比較不同篩選關鍵群體方法進行基因型填充等位基因一致性比率。

    為探究參考群規(guī)模對基因型填充準確性的影響,本研究分別根據(jù)MCA、KIN、RAN方法篩選的前15、25、50個關鍵個體作為參考群,使用Beagle4.0與系譜信息將60K SNP芯片數(shù)據(jù)填充至600K SNP芯片數(shù)據(jù),比較使用不同規(guī)模參考群進行基因型填充等位基因一致性比率。

    為探究填充芯片對基因組預測準確性的影響,本研究分別根據(jù)MCA、RAN方法篩選的前15、25、50個關鍵個體作為參考群,使用Beagle4.0與系譜信息將60K SNP芯片數(shù)據(jù)填充至600K SNP芯片數(shù)據(jù),比較填充芯片數(shù)據(jù)與真實芯片數(shù)據(jù)基因組預測準確性與基因組預測無偏性。

    1.5 基因型填充準確性的評估

    本研究使用兩種驗證標準來衡量基因型填充準確性。一種是等位基因一致性比率,另一種是基因組預測準確性和無偏性。

    1.5.1 等位基因一致性比率 等位基因一致性比率為正確填充基因型所占百分比,其具體操作為:將60K SNP芯片填充至600K SNP芯片數(shù)據(jù)后,使用R軟件比較每個個體填充基因型與真實基因型間的正確率,并將其平均值作為基因型填充準確性的評判依據(jù)。

    1.5.2 基因組預測準確性和無偏性 為比較填充芯片數(shù)據(jù)與真實芯片數(shù)據(jù)在基因組預測中的應用效果,本研究采用基因組最佳線性無偏預測(genomic best linear unbiased prediction,GBLUP)進行預測,具體公式如下:

    yi=u+ai+ei,

    基因組預測準確性與無偏性為基因組估計育種值(GEBV)和校正表型間的相關系數(shù)與回歸系數(shù)。其具體操作為:使用R軟件中的lm函數(shù)對子代435羽個體45、56、70、84、91日齡體重等原始表型值進行年-季節(jié)固定效應校正,將殘差作為校正后的表型值用于交叉驗證。使用R軟件中的 rrBLUP包[24]計算群體基因組估計育種值,通過5*10的交叉驗證計算填充芯片數(shù)據(jù)與真實芯片數(shù)據(jù)基因組預測準確性與無偏性。

    2 結 果

    2.1 Beagle版本與系譜信息對基因型填充準確性的影響

    根據(jù)MCA、RELA、KIN、RAN方法篩選前50個關鍵個體作為參考群,使用不同版本Beagle與系譜信息進行基因型填充準確性估計,如圖1所示。從圖1可知,使用Beagle5.1進行基因型填充的等位基因一致性比率最低,為0.594~0.595。使用Beagle4.0進行基因型填充,未使用系譜信息時,MCA、RELA、KIN等方法進行基因型填充的等位基因一致性比率為0.961、0.963、0.947;使用系譜信息時,MCA、RELA、KIN等方法進行基因型填充的等位基因一致性比率為0.970、0.971、0.953。提供系譜信息可以提高MCA、RELA、KIN等方法的等位基因一致性比率,但會導致RAN方法等位基因一致性比率降低,使其從0.956降低至0.939。

    圖1 不同Beagle版本和系譜信息使用與否的基因型填充準確性Fig.1 Genotype imputation accuracy by different Beagle versions and pedigree information

    2.2 不同篩選關鍵群體策略對基因型填充準確性的影響

    表2展示了不同參考群篩選方法篩選的關鍵個體交叉數(shù)量??梢钥闯?,使用CA、MCA、RELA、KIN等方法篩選的參考群至少有10個共同個體,而RAN方法篩選出的15個關鍵個體與其它方法篩選出的關鍵個體無共同個體。

    表2 不同參考群篩選方法所篩選關鍵個體交叉表Table 2 Individual crosstab selected by different reference population selection methods

    根據(jù)RELA、MCA、KIN、RAN方法篩選的前15關鍵個體和15個共同祖先作為參考群,使用Beagle4.0與系譜信息對目標群體進行基因型填充,不同參考群篩選方法基因型填充準確性如圖2所示。由圖2可知,MCA方法篩選參考群進行基因型填充的等位基因一致性比率最高為0.757,其次是CA、RELA方法為0.755、0.751。此外,MCA、RELA、CA 3種方法的等位基因一致性比率差別較小,RAN方法等位基因一致性比率最低為0.595。

    圖2 不同參考群篩選方法的基因型填充準確性Fig.2 Genotype imputation accuracy of different reference population choosing methods

    2.3 參考群規(guī)模對基因型填充準確性的影響

    根據(jù)MCA、RELA、KIN、RAN方法篩選的前15、25、50個關鍵個體作為參考群,使用Beagle4.0與系譜信息對目標群體進行填充,不同參考群規(guī)模對基因型填充準確性的影響如圖3所示。由圖3可以看出,MCA、RELA、KIN、RAN方法篩選的前15、25、50個關鍵個體作為參考群,基因型填充的等位基因一致性比率為0.595~0.757、0.773~0.897、0.939~0.971。隨著參考群規(guī)模增加,等位基因一致性比率也隨之增加。但隨著參考群規(guī)模增大(從15增加至25再增加至50),等位基因一致性比率的提升幅度下降,從0.150降低至0.100。當參考群規(guī)模較小時,MCA與RELA方法篩選參考群的等位基因一致性比率保持明顯優(yōu)勢,但是隨著參考群規(guī)模的增加,MCA與RELA方法篩選參考群的等位基因一致性比率優(yōu)勢降低。

    圖3 不同參考群規(guī)模的基因型填充準確性Fig.3 Genotype imputation accuracy of different reference population sizes

    2.4 填充芯片對基因組預測準確性的影響

    根據(jù)MCA、RAN方法篩選的前15、25、50個關鍵個體作為參考群,使用Beagle4.0與系譜信息進行基因填充,不同填充芯片與真實芯片數(shù)據(jù)基因組預測準確性如表3、表4所示??梢钥闯?,真實芯片預測無偏性一般表現(xiàn)為最佳。隨著參考群規(guī)模增加,填充基因組預測準確性與無偏性同真實芯片基因組預測準確性與無偏性相比差別越小。相對于RAN方法,使用MCA方法篩選關鍵個體進行基因型填充的基因組預測準確性與真實芯片數(shù)據(jù)的預測結果更為接近。

    表3 基因型填充的基因組預測準確性Table 3 Genome prediction accuracy of genotype imputation

    表4 基因型填充的基因組預測無偏性Table 4 Genome prediction unbiased of genotype imputation

    3 討 論

    本研究使用Beagle4.0、Beagle4.0+系譜信息、Beagle5.1等軟件進行基因型填充,其中Beagle4.0+系譜信息填充效果最佳,其次為Beagle4.0,而Beagle5.1填充效果最差。Pook等[25]對比了Beagle4.0、Beagle5.1未使用系譜信息時雙單倍型玉米基因型填充效果,結果發(fā)現(xiàn)Beagle5.1填充錯誤率最低,這與本研究結果存在較大差異,可能是由于其試驗群體基因型都為純合位點且群體較大,而本研究選取的群體是由15羽親本公雞與435羽子代群體構成,雜合位點較高且群體較小。Whalen和Hickey[26]使用Beagle4.1、Beagle5.1在18 349個個體的模擬豬家系中使用350、10 000、33 000、46 000個標記進行填充,Beagle4.1填充準確性為0.995、0.944、0.969、0.327,Beagle5.1填充準確性為0.626、0.909、0.939、0.219,當標記數(shù)目為46 000時,與本研究結果類似。這可能與Beagle5.1采用綜合單倍型有關,在輸入目標單倍型時,僅使用參考單倍型的子集[27-28]。本研究僅使用Beagle軟件進行測試,根據(jù)不同使用需求可以選擇不同軟件進行基因型填充[29],如FImpute[17]、Impute5[14]等。

    本研究結果表明,參考群規(guī)模一定時,不同參考群篩選方法基因型填充準確性不同。使用CA、MCA、RELA法篩選參考群進行基因型填充的準確性較好,使用RAN法篩選參考群進行基因型填充的準確性較差。Druet等[19]發(fā)現(xiàn),RELA方法填充效果優(yōu)于RAN法,特別是在MAF較低的位點,這與本研究結果類似。Yu等[18]發(fā)現(xiàn),MCA方法填充效果優(yōu)于RELA、KIN、RAN方法。當使用Beagle4.0+系譜信息進行基因型填充時,對篩選構建的參考群填充效果更佳。這是因為通過參考群篩選方法篩選關鍵個體可最大限度的代表群體的遺傳變異,同時使參考群體與低密度基因型目標群體有更強的親緣關系[15,18,30]。所以使用共同祖先與親本信息進行基因型填充,也可獲取高質量的填充基因型數(shù)據(jù)[31]。本研究僅采用系譜親緣關系矩陣進行參考群篩選,在擁有稀疏基因型信息的情況下,可以考慮使用基因型親緣關系矩陣進行關鍵個體篩選[32]。同時,當僅存在部分個體有低密度基因型的情況下,可以使用一步法建立H矩陣[33-34],進行關鍵個體篩選。

    隨著參考群規(guī)模增大,基因型填充準確性增高。但隨著關鍵個體參考群的增大(從15增加至25再增加至50),基因型填充準確性的提升幅度下降。Wang等[35]使用3K、50K芯片對2 246頭安格斯牛進行基因型填充,參考群體比例分別為總群體的1%、10%、20%、50%,填充準確性分別為64%、71%、75%、75%。Ghoreishifar等[36]使用水牛群體在保持目標群體數(shù)目不變的情況下增加參考群規(guī)模,填充準確性在參考群從小到中等規(guī)模變化時提升較快,從中等到大規(guī)模時提升較慢。這與本研究結果相似,隨著參考群規(guī)模增加,單倍型推斷及匹配更加準確,基因型填充準確性也隨之增加,這可能是因為較多的參考群個體能夠提供更多的單倍型。但是隨著參考群規(guī)模的進一步擴大提升幅度會逐漸降低[30,37],因此,在保證基因型填充準確性足夠分析的情況下,可以適當控制參考群規(guī)模,以降低檢測成本。

    不同填充芯片與真實芯片數(shù)據(jù)基因組預測準確性相比,基因型填充一致性比率越大越接近真實芯片預測結果,真實芯片預測無偏性一般表現(xiàn)最佳。然而當參考群規(guī)模較小時,其基因型填充一致性比率較低,而預測準確性卻表現(xiàn)較佳。這可能是因為使用了系譜信息進行填充,導致填充后的結果與系譜預期更符合,從而導致預測準確性更高。

    小等位基因頻率[38]、目標群體與參考群體芯片密度[38]、填充軟件、參考群組成、參考群體大小等因素都會影響基因型填充準確性,然而在實際生產中對于小等位基因頻率難以進行控制,目標群體與參考群體也基本使用定制芯片。本研究通過探究參考群篩選方法及規(guī)模對基因型填充準確性的影響,發(fā)現(xiàn)使用Beagle4.0+系譜信息有更好的填充效果。使用MCA法篩選參考群進行基因型填充準確性最高,但當系譜關系清晰時使用共同祖先與親本信息進行基因型填充也可以獲取高質量的高密度芯片。參考群規(guī)模增加,基因型填充準確性也隨之增加,但過多的增加參考群所帶來的的收益較低。將公共動植物基因型填充數(shù)據(jù)庫中的個體添加到參考群體中,以此增加參考群數(shù)目也可以有效增加基因型填充準確性[39-40]。

    4 結 論

    綜上所述,可以通過參考群篩選方法構建參考群以及控制參考群規(guī)模,以保證基因型填充和基因組預測準確性并節(jié)省成本,本研究可為基因型填充在畜禽遺傳育種中的應用提供技術參考。

    猜你喜歡
    系譜等位基因準確性
    親子鑒定中男性個體Amelogenin基因座異常1例
    智慧健康(2021年17期)2021-07-30 14:38:32
    《論風格》文本系譜與論爭
    淺談如何提高建筑安裝工程預算的準確性
    中國荷斯坦公牛系譜完整性研究
    中國奶牛(2017年2期)2017-03-22 02:04:46
    教你如何治好“遺傳病”
    WHOHLA命名委員會命名的新等位基因HLA-A*24∶327序列分析及確認
    美劇翻譯中的“神翻譯”:準確性和趣味性的平衡
    論股票價格準確性的社會效益
    DXS101基因座稀有等位基因的確認1例
    超聲引導在腎組織活檢中的準確性和安全性分析
    建宁县| 黄梅县| 呼伦贝尔市| 靖西县| 华阴市| 四会市| 年辖:市辖区| 金沙县| 安龙县| 西林县| 望都县| 政和县| 泸水县| 广南县| 永靖县| 揭西县| 志丹县| 芷江| 蒙自县| 卓尼县| 汉川市| 嵩明县| 三台县| 宁阳县| 毕节市| 准格尔旗| 隆林| 岳普湖县| 崇左市| 美姑县| 景德镇市| 迁西县| 巴楚县| 西畴县| 娄烦县| 犍为县| 肥西县| 云林县| 南乐县| 诸暨市| 通海县|