劉艷萍 包阿東 梅步俊
摘要 本研究通過模擬和基因組數(shù)據(jù),使用群體遺傳模型來預(yù)測(cè)稀有變異選擇的預(yù)期特征,并比較不同SNP年齡估計(jì)方法的結(jié)果之間的異同。Wright-Fisher模型框架下,隨著初始基因頻率的增加,基因被固定的概率上升;與有效群體縮減Wright-Fisher模型相比,一般Wright-Fisher模型和有效群體擴(kuò)增Wright-Fisher模型的基因被固定概率更高,但初始基因頻率較高時(shí),3種模型無明顯差異。稀有變異基因的遺傳方式為共顯性、完全顯性時(shí),稀有變異基因可以在群體中達(dá)到很高的頻率或固定,其中完全顯性時(shí)基因頻率在群體中達(dá)到0.5以上的概率更高;稀有變異基因的遺傳方式為共顯性時(shí),不同有效群體含量隨選擇系數(shù)變化的規(guī)律與理論預(yù)測(cè)基本相同。SNP年齡估計(jì)依據(jù)不同假設(shè)條件,往往有不同估計(jì)結(jié)果。
關(guān)鍵詞 復(fù)雜性狀;稀有變異;家畜;Wright-Fisher模型;SNP年齡
中圖分類號(hào) S813? ?文獻(xiàn)標(biāo)識(shí)號(hào) A
文章編號(hào) 1007-7731(2023)08-0111-08
Study on Inheritance of Rare Variants of Complex Traits in Livestock
LIU Yanping2,3? ?BAO Adong1,2? ?MEI Bujun1,2*
(1Engineering Technology Research Center of Inner Mongolia sheep Genetic Evaluation Method and Application,
Bayannur Inner MongoLia 015000;
2Medical college, Hetao college, Bayannur Inner MongoLia 015000;
3Agriculture department, Hetao college, Bayannur Inner MongoLia 015000)
Abstract This study uses population genetic models to predict the expected characteristics of rare variant selection through simulation and genomic data, and compares the similarities and differences between the results of different SNP age estimation methods. Under the framework of the Wright-Fisher model, with the increase of the initial gene frequency, the probability of the gene being fixed increases; compared with the effective population size contraction Wright-Fisher model, the fixed probability of gene frequency in the general Wright-Fisher model and the effective population expansion Wright-Fisher model is higher, but when the initial gene frequency is higher, there is no significant difference between the those models. When the genetic mode of the rare variant gene is codominance and completely dominant, the rare variant gene can reach a high frequency or fixation in the population. And when the genetic mode is completely dominant, the probability of gene frequency reaching 0.5 or more in the population is higher. When the genetic mode of rare variant genes is codominant, the law of the different effective populations size with the different selection coefficient is basically the same as the theoretical prediction. SNP age estimation methods based on different assumptions often have different estimation results.
Keywords complex traits; rare variants; livestock; Wright-Fisher model; SNP age
全基因組關(guān)聯(lián)研究(Genome-wide association study,GWAS)方法通過基因芯片技術(shù)系統(tǒng)評(píng)估常見遺傳變異(通常是SNP,在群體中的最小等位基因頻率MAF>5%)對(duì)性狀(疾?。┑挠绊?。到目前為止,已經(jīng)發(fā)現(xiàn)有2 000多個(gè)SNP與疾病相關(guān),只能解釋小部分的遺傳因素[1]??傮w來說,GWAS發(fā)現(xiàn)的這些SNP位點(diǎn)對(duì)復(fù)雜疾病只有中等程度的影響,位點(diǎn)與性狀只有關(guān)聯(lián)性,沒有因果關(guān)系,要想通過關(guān)聯(lián)關(guān)系推導(dǎo)至因果關(guān)系仍很困難,要想將這些通過GWAS發(fā)現(xiàn)的位點(diǎn)轉(zhuǎn)化為疾病功能解釋或臨床應(yīng)用還有很長(zhǎng)的路要走。分析低頻位點(diǎn)(0.5% 罕見基因位點(diǎn)一般在基因的編碼區(qū)或啟動(dòng)子區(qū),具有一定的生物學(xué)意義,如錯(cuò)義突變、無義突變、stop loss突變、插入或缺失引起的移碼突變及啟動(dòng)子區(qū)調(diào)節(jié)轉(zhuǎn)錄的變異。RVAS是基于功能單元(目前主要是基因,以后有可能是小的信號(hào)通路)分析一組位點(diǎn)與疾病的關(guān)聯(lián),而GWAS是基于單個(gè)位點(diǎn)評(píng)估關(guān)聯(lián)性[3-4]。 突變可能由于遺傳漂變、自然選擇和人工選擇在群體中消失,增加頻率或固定。如果等位基因受到選擇的影響,大的基因組區(qū)域也會(huì)因遺傳連鎖而受到影響。在強(qiáng)陽(yáng)性選擇的情況下,基因組區(qū)域遺傳變異可能消失,出現(xiàn)“選擇性清除(selective sweep)”[5]。在純化選擇的情況下,當(dāng)有害等位基因反復(fù)從基因座中被清除時(shí),也可以減少連鎖基因組鄰域中的中性突變。這種現(xiàn)象被稱為“背景選擇”。隨著畜禽基因組測(cè)序數(shù)據(jù)的增加,積累了稀有變異數(shù)據(jù),這些數(shù)據(jù)表明畜禽進(jìn)化過程較預(yù)想的復(fù)雜,而群體遺傳學(xué)研究有助于闡明數(shù)量性狀的遺傳機(jī)理[6]。本研究通過模擬和基因組數(shù)據(jù),使用群體遺傳模型來預(yù)測(cè)稀有變異選擇的預(yù)期特征。 1 材料與方法 1.1 Wright-Fisher模型 本研究分別考慮有效群體含量初始為100和1 000這2種情況,模擬200世代,等位基因初始頻率分別為0.004、0.04、0.2、0.4;分別使用一般Wright-Fisher模型、有效群體縮減Wright-Fisher模型和有效群體擴(kuò)增Wright-Fisher模型,對(duì)于后兩種模型有效群體含量初始為100時(shí),有效群體變動(dòng)范圍為50;有效群體含量初始為1 000時(shí),有效群體變動(dòng)范圍為500。 假設(shè)一個(gè)群體由N個(gè)個(gè)體組成,[Xt]和[Xt+1]表示[t]和[t]+1世代攜帶等位基因A的染色體數(shù)目,分別等于i和j,基因在代際間傳遞可用二項(xiàng)式(Binomial)分布表示: 式中,P為等位基因A的頻率,1-p或q為等位基因a的頻率。 1.2 不同遺傳方式影響 通常根據(jù)顯性系數(shù)(h)和選擇系數(shù)(s)對(duì)遺傳模型進(jìn)行參數(shù)化,野生型適應(yīng)度設(shè)置為1,其中基因型AA的適合性為1,基因型Aa的適合性為1+hs,基因型aa的適合性為1+s。h=1為完全顯性,h=0為完全隱性,h=0.5為共顯性。如果種群規(guī)模是固定的,要考慮相對(duì)適應(yīng)度,即個(gè)體基因型相對(duì)于群體的適合度,平均群體適合度[?]為: 1.3 SNP年齡估計(jì)方法 20世紀(jì)70年代,群體遺傳學(xué)家Motoo Kimura和Tomoko Ohta使用等位基因頻率估計(jì)等位基因年齡[7]。在隨機(jī)交配的大群體中,中性等位基因的年齡估計(jì)值為: 式中,p代表等位基因頻率,t1為期望的等位基因年齡,以2N世代為單位。1990年,Jean-Louis Serre等通過分析等位基因內(nèi)部變異來估計(jì)等位基因年齡[8],公式為: 式中,t為世代數(shù),c為重組率,[xt]為t世代時(shí)與突變等位基因連鎖的標(biāo)記頻率,y為與突變等位基因不連鎖的標(biāo)記頻率。 一般方法是在Serre方法基礎(chǔ)上,計(jì)算基因所在區(qū)域的LD,計(jì)算擴(kuò)展單倍型雜合性(EHHS, Extended Haplotype Heterozygosity),并在此基礎(chǔ)上設(shè)定閾值,計(jì)算基因左右翼用于計(jì)算年齡的標(biāo)記長(zhǎng)度[9]。本研究使用R軟件SimPhe包內(nèi)置數(shù)據(jù)集,比較3種不同SNP年齡估計(jì)方法估計(jì)結(jié)果的異同。 2 結(jié)果與分析 2.1 Wright-Fisher模型 Wright-Fisher模型描述了在離散的非重疊世代中有限隨機(jī)交配群體的進(jìn)化。該模型描述了基因座上等位基因頻率隨時(shí)間的變化過程?;蝾l率受一系列因素的影響,如隨機(jī)漂移、突變、遷移、選擇和種群規(guī)模的變化。突變、遷移和選擇以確定性方式影響等位基因頻率,被統(tǒng)稱為進(jìn)化壓力。對(duì)有限群體進(jìn)行隨機(jī)抽樣,頻率從一代到下一代變化(遺傳漂移)。突變和遷移會(huì)導(dǎo)致抽樣頻率的線性變化,而選擇是一種非線性變化。一般認(rèn)為,隨著世代推移,等位基因頻率逐漸遠(yuǎn)離初始頻率。本研究中(圖1、圖2),當(dāng)初始基因頻率極低時(shí)(0.004),無論種群規(guī)模是否發(fā)生變化,隨著世代數(shù)增加,基因頻率偶爾有微小波動(dòng),但在大多數(shù)情況下基因始終保持極低頻率或最終從群體中消失;隨著初始基因頻率的增加,基因被固定的概率上升;與有效群體縮減Wright-Fisher模型相比,一般Wright-Fisher模型和有效群體擴(kuò)增Wright-Fisher模型的基因固定概率更高,但初始基因頻率較高時(shí),3種模型無明顯差異;當(dāng)有效群體含量由100增加為1 000時(shí),基因更加不容易被固定,且200個(gè)世代中,基因頻率最終結(jié)果更難預(yù)測(cè)。 2.2 不同遺傳方式影響 本研究考慮稀有變異3種不同遺傳方式(共顯性、完全顯性和完全隱形),在選擇系數(shù)s為0.1時(shí),100個(gè)世代基因頻率的變化,共模擬100次(見圖3)。結(jié)果顯示,稀有變異基因的遺傳方式為共顯性、完全顯性時(shí),稀有變異基因可以在群體中達(dá)到很高的頻率或固定,其中完全顯性時(shí)基因頻率在群體中達(dá)到0.5以上的概率更高;而遺傳方式為完全隱形時(shí),基因頻率在100個(gè)世代內(nèi)一般不會(huì)超過0.4。 本研究用模擬方法比較不同群體含量和選擇系數(shù)對(duì)稀有變異基因頻率的影響,結(jié)果表明,稀有變異基因的遺傳方式為共顯性時(shí),不同有效群體含量隨選擇系數(shù)變化的規(guī)律與理論預(yù)測(cè)基本相同;完全顯性時(shí),不同有效群體含量隨選擇系數(shù)變化的規(guī)律均比理論預(yù)測(cè)高,而且隨著選擇系數(shù)增加,偏差逐漸增大;而完全隱形時(shí),趨勢(shì)與完全顯性時(shí)相反,且隨著有效群體含量增加,基因頻率隨選擇系數(shù)變化規(guī)律與理論預(yù)測(cè)結(jié)果的偏差逐漸增大(見圖4)。 2.3 SNP年齡估計(jì)方法 等位基因或SNP的年齡可以通過不同拷貝之間的遺傳變異(等位基因內(nèi)變異)及其頻率來估計(jì)。遺傳學(xué)界已有估計(jì)等位基因年齡的近似方法。只用等位基因頻率也可以估計(jì)基因的年齡。基于頻率和等位基因內(nèi)變異性的估計(jì)可以組合以提供更準(zhǔn)確的估計(jì),也可以揭示自然選擇的影響是否存在,等位基因年齡的估計(jì)取決于對(duì)群體歷史和自然選擇的假設(shè)。SNP年齡估計(jì)依據(jù)不同假設(shè)條件,往往有不同估計(jì)結(jié)果,圖5顯示了3種不同估計(jì)方法對(duì)同一數(shù)據(jù)估計(jì)結(jié)果的差異。 3 討論 全基因組關(guān)聯(lián)研究(GWAS)改變了我們對(duì)復(fù)雜性狀(例如,體重指數(shù)BMI,血壓和血脂)遺傳基礎(chǔ)的理解,以及對(duì)常見1型和2型糖尿病、冠狀動(dòng)脈疾病等疾病的認(rèn)識(shí)。盡管GWAS成功地鑒定了與這些復(fù)雜性狀相關(guān)的基因組區(qū)域,但是僅能解釋遺傳力的一小部分。GWAS的一個(gè)重要局限性在于,通常以常見變異關(guān)聯(lián)信號(hào)為理論基礎(chǔ),每個(gè)信號(hào)僅對(duì)性狀產(chǎn)生一定的效應(yīng)。因此,人們?cè)絹碓絻A向“缺失遺傳力”由罕見的遺傳變異或低頻變異(通常定義為MAF<1%)引起[10]。 全基因組測(cè)序技術(shù)是研究稀有遺傳變異的金標(biāo)準(zhǔn)。傳統(tǒng)GWAS方法分析群體中頻率低于1%變異的功效有限。但下一代測(cè)序技術(shù)和新型分析技術(shù)的發(fā)展,稀有遺傳變異在許多復(fù)雜性狀中都發(fā)揮了作用,包括克羅恩病中的NOD2、1型糖尿病的IFIH1,病態(tài)竇房結(jié)綜合征中的MYH6和調(diào)節(jié)空腹血糖水平的G6PC2。正在進(jìn)行的基于人類群體的全基因組測(cè)序計(jì)劃,例如千人基因組和UK10K項(xiàng)目,正在為跨群體研究稀有遺傳變異的分布和特征提供了基礎(chǔ),通過改進(jìn)的填補(bǔ)技術(shù),可以對(duì)數(shù)以千萬計(jì)具有復(fù)雜性狀的變異進(jìn)行關(guān)聯(lián)研究。但DNA芯片技術(shù)通常對(duì)于常見SNP變異最有效,能夠達(dá)到99.5%以上的準(zhǔn)確度,而對(duì)于低頻和稀有變異(次要等位基因頻率<5%)則準(zhǔn)確性不高[11]。隨著針對(duì)稀有變異(例如Exome Chip和MetaboChip)芯片的廣泛使用,已經(jīng)發(fā)布了精確識(shí)別稀有變異的新方法。 Affymetrix和Illumina兩家公司有專門針對(duì)低頻變異(次等位基因頻率<5%)的基因芯片,可以用于遺傳學(xué)關(guān)聯(lián)研究?,F(xiàn)有用于常見SNP的芯片基因型分型算法(如MPAM、DM、RLMM、GEL、BRLMM、CRLMM、CHIAMO等)不適用于稀有變體,因?yàn)檫@些方法在對(duì)數(shù)據(jù)進(jìn)行聚類時(shí)會(huì)假定存在3個(gè)基因型類,而稀有變異則不適用這種假設(shè)。例如,對(duì)于處于哈代溫伯格平衡的次等位基因頻率<1%的變異,則需要對(duì)100 000個(gè)樣本進(jìn)行基因分型,以期望每個(gè)基因型類別至少有10個(gè)信號(hào)[12]。另外,很難對(duì)稀有變異的算法進(jìn)行基準(zhǔn)校對(duì),因?yàn)榇蠖鄶?shù)樣品(包括HapMap樣品)的稀有變體的檢測(cè)率都與常見變異不在同一數(shù)量級(jí)。使用家系數(shù)據(jù)也不一定能解決這個(gè)問題。如果未檢測(cè)到稀有基因型,并且家系中的每個(gè)個(gè)體都被稱為常見等位基因純合子,且不會(huì)發(fā)生孟德爾錯(cuò)誤。類似地,因?yàn)闊o法判斷稀有變異等位基因基因型的正確識(shí)別率,比較算法結(jié)果與已知基因型的總體一致性幾乎沒用。例如,對(duì)于MAF=0.1%的SNP,計(jì)算所有位點(diǎn)常見等位基因純合子的算法有99.8%的正確率[13]。因此,對(duì)于稀有變異,找到合適的比較數(shù)據(jù)集和評(píng)估算法的準(zhǔn)確性比常見變異更具挑戰(zhàn)性。 SNP是最常見的遺傳突變,也可能是研究最多的遺傳變異。SNP檢測(cè)的原理較簡(jiǎn)單,在讀段正確比對(duì)到參考序列以后,與參考序列比對(duì)不上的堿基就是SNP。但有許多因素會(huì)導(dǎo)致出現(xiàn)“假SNP”。常見導(dǎo)致“假SNP”的5種原因:①測(cè)序錯(cuò)誤,測(cè)序儀本身導(dǎo)致“假SNP”的出現(xiàn),讀段中存在不正確的堿基,有時(shí)錯(cuò)誤的堿基會(huì)以低質(zhì)量序列打分?jǐn)?shù)被反映出來;②PCR錯(cuò)誤,PCR擴(kuò)增過程中發(fā)生復(fù)制錯(cuò)誤,導(dǎo)致出現(xiàn)堿基錯(cuò)誤的讀段,多次對(duì)同一PCR片段重復(fù)測(cè)序可能會(huì)加劇這種情況的出現(xiàn);③污染,生物樣品包含來自另一個(gè)樣品或物種(例如細(xì)菌或病毒)的少量DNA;④比對(duì)錯(cuò)誤,如將讀段比對(duì)到錯(cuò)誤的基因組位置,則可能導(dǎo)致明顯的堿基不匹配;⑤存在未知的插入或缺失,如果變異附近存在未知的變異(例如大片段的插入或缺失),則位于該變異側(cè)翼的讀段可能比對(duì)不正確,從而產(chǎn)生SNP,這種錯(cuò)誤較難發(fā)現(xiàn)和矯正[14]??梢酝ㄟ^以下3種方式判斷SNP檢測(cè)率是否有錯(cuò)誤:①如在人類中,計(jì)算SNP的發(fā)生率是否約為每1 000個(gè)堿基1個(gè);②轉(zhuǎn)換/顛換比(Ts/Tv),已知自然發(fā)生轉(zhuǎn)換形成的SNP(C→T,T→C,A→G,G→A)的速率顯著高于顛換形成SNP的速率,正常情況下該比例應(yīng)高于2;③等位基因頻率:實(shí)際SNP數(shù)據(jù)應(yīng)當(dāng)在0.5和1.0等位基因頻率處存在2個(gè)峰值,如果在0.5和1.0處沒有明顯的峰值,則SNP檢測(cè)有問題[15]。 稀有變異的質(zhì)控主要是去除錯(cuò)誤率較高的變異和個(gè)體,以免產(chǎn)生虛假的關(guān)聯(lián)信號(hào)。通常樣本水平的質(zhì)控優(yōu)先于變異水平的質(zhì)控,以確保質(zhì)量不合格的樣本不影響后續(xù)分析。樣品混合是造成測(cè)序錯(cuò)誤的主要原因,可能發(fā)生在整個(gè)采樣及測(cè)序過程中。通常可以使用“DNA指紋”技術(shù)檢測(cè)樣品登記性別和測(cè)序標(biāo)記估計(jì)“性別”一致性,或?qū)y(cè)序結(jié)果與以前個(gè)體測(cè)序基因型相比較來判斷樣品是否有混合??梢允褂肧equenom測(cè)序平臺(tái)測(cè)得的幾十個(gè)常見多態(tài)性位點(diǎn)作為“DNA指紋”[16, 17]?;蛐湾e(cuò)誤可以利用同源一致性原理進(jìn)行校正。 等位基因年齡(或突變年齡)指等位基因首次突變出現(xiàn)以來經(jīng)過的時(shí)間。估計(jì)某個(gè)等位基因出現(xiàn)的時(shí)間可以推斷物種遷徙,性狀和自然選擇的模式。估計(jì)等位基因年齡主要依據(jù)2種方式:①群體中等位基因的頻率;②等位基因不同拷貝內(nèi)發(fā)生的遺傳變異,也稱為等位基因內(nèi)變異[18]。將2種方式聯(lián)合使用可以提高等位基因年齡估計(jì)的準(zhǔn)確性,有時(shí)也可以提供選擇信號(hào)是否存在的信息?;陬l率估計(jì)等位基因年齡的基本假設(shè):在沒有選擇的情況下,高頻等位基因比低頻等位基因更古老。在有正向選擇的情況下,由于自然選擇、基因流、遺傳漂移和突變等因素可能使等位基因頻率增長(zhǎng)較快。基于等位基因內(nèi)部變異來估計(jì)等位基因年齡的基本假設(shè),即每一世代重組均會(huì)破壞連鎖不平衡,也會(huì)產(chǎn)生連鎖的新變異?;诘任换騼?nèi)變異估計(jì)等位基因年齡可以使用溯祖理論(coalescent theory),分析年代久遠(yuǎn)的歷史突變時(shí)可以通過重建基因樹并確定樹根的方式來推斷等位基因的年齡,而對(duì)于新近突變,群體遺傳學(xué)使用突變,重組率和統(tǒng)計(jì)學(xué)模型來估計(jì)等位基因年齡[19]。 等位基因年齡估計(jì)的例子:囊性纖維化(Cystic fibrosis)、艾滋病抗性等位基因(AIDS-resistance allele,CCR5)、乳糖酶持久性(Lactase persistence)。最近,Albers和McVean[20]提出了一種非參數(shù)方法,使用基于聚結(jié)的突變和重組模型來估計(jì)等位基因的年齡。具體而言,該方法將時(shí)間推斷為成百上千的染色體序列(單倍型)對(duì)之間的最新共同祖先(TMRCA),然后使用復(fù)合似然方法將該信息組合起來,以獲得單個(gè)基因座突變時(shí)間的估計(jì)值。使用來自1 000個(gè)基因組計(jì)劃和西蒙斯基因組多樣性計(jì)劃的數(shù)據(jù),該方法應(yīng)用于人類基因組中的1 600萬個(gè)變體,以生成變體年齡圖集[21]。 4 作者貢獻(xiàn) 梅步俊負(fù)責(zé)文章的設(shè)計(jì)、撰寫及程序編寫,是試驗(yàn)設(shè)計(jì)和試驗(yàn)研究的執(zhí)行人;包阿東和劉艷萍負(fù)責(zé)編寫部分程序和資料整理,參與部分試驗(yàn)設(shè)計(jì)、試驗(yàn)結(jié)果分析。全體作者都閱讀并同意最終的文本。 5 致謝 感謝華中農(nóng)業(yè)大學(xué)姜?jiǎng)灼浇淌谡n題組在研究過程中提供的幫助。本研究受國(guó)家自然科學(xué)基金項(xiàng)目(31760660);內(nèi)蒙古自治區(qū)自然科學(xué)基金項(xiàng)目(2019MS03092);內(nèi)蒙古自治區(qū)肉羊遺傳評(píng)估方法與應(yīng)用工程技術(shù)研究中心;巴彥淖爾市科技創(chuàng)新基金項(xiàng)目;巴彥淖爾市科技計(jì)劃項(xiàng)目(BKZ2016);內(nèi)蒙古自治區(qū)科技計(jì)劃項(xiàng)目(2020GG0201)等項(xiàng)目的資助。 6 參考文獻(xiàn) [1] BURKETT K M,MCNENEY B,GRAHAM J,et al. Using gene geneal-ogies to detect rare variants associated with complex traits[J]. Hum Hered.,2014,78(3-4):117-130. [2] CHEN G,YUAN A,ZHOU Y,et al. Simultaneous analysis of common and rare variants in complex traits:Application to SNPs (SCARVAsnp)[J]. Bioinform Biol Insights,2012(6):177-185. [3] FENG T,ELSTON R C,ZHU X. Detecting rare and common variants for complex traits:sibpair and odds ratio weighted sum statistics (SPWSS,ORWSS)[J]. Genet Epidemiol.,2011,35(5):398-409. [4] OSCAR G R,DAETWYLER H D,MACLEOD I M,et al. Rare variants in transcript and potential regulatory reg-ions explain a small percentage of the missing heritability of complex traits in cattle[J]. PLoS One,2015,10(12):e0143945. [5] JOUAN L,GAUTHIER J,DION P A,et al. Rare variants in complex traits:novel identification strategies and the role of de novo mutations[J]. Hum Hered.,2012,74(3-4):215-25. [6] KARUNARATHNA C B,GRAHAM J. Using gene genealogies to localize rare variants associated with complex traits in diploid populations[J]. Hum Hered.,2018,83(1):30-39. [7] SLATKIN M,RANNALA B. Estimating allele age[J]. Annu Rev Genomics Hum Genet.,2000(1):225-49. [8] Malaspinas,Anna-Sapfo. Estimating allele age and selection coefficient from time-serial data[J]. Genetics,2012,192(2):599-607. [9] GANDOLFO,LUKE,C,et al. Dating rare mutations from small samples with dense marker data[J]. Genetics,2014,197(4):1315-1327. [10] KIM S,LEE K,SUN H. Statistical selection strategy for risk and protective rare variants associated with complex traits[J]. J Comput Biol.,2015,22(11):1034-1043. [11] LETTRE,G. Rare and low-frequency variants in human common diseases and other com-plex traits[J]. J Med Genet.,2014,51(11):705-714. [12] LI B,LIU D J,LEAL S M. Identifying rare variants associated with complex traits via sequencing[J]. Curr Protoc Hum Genet.,2013(1):1-26. [13] LU T H,AUSTIN E,BONNER A,et al. Applications of machine learning and data mining methods to detect associations of rare and common variants with complex traits[J]. Genet Epidemiol.,2014,38(1):81-85. [14] MR MUNAF?,F(xiàn)LINT J. Common or rare variants for complex traits?[J]. Biol Psychiatry,2014,75(10):752-753. [15] KALLIOPE P,IOANNA T,ELEFTHERIA Z. In search of low-frequency and rare variants affecting complex traits[J]. Hum Mol Genet.,2013,22(R1):16-21. [16] RITCHIE G R S,F(xiàn)LICEK P. Functional annotation of rare genetic variants,in assessing rare variation in complex traits:design and analysis of genetic studies[M]. E. Zeggini and A. Morris,Editors. New York(NY):2015 57-70. [17] RUDRA P,BROADAWAY K A,WARE E B,et al. Testing cross-phenotype effects of rare variants in longitudinal stud-ies of complex traits[J]. Genet Epidemiol.,2018,42(4):320-332. [18] DUBON M,PEDROSA V,F(xiàn)EITOSA F,et al. Identification of novel candidate genes for age at first calving in Nellore cows using a SNP chip specifically developed for Bos taurus indicus cattle[J]. Theriogenology,2021,173:156-162. [19] SCHMIDT N,K SCH?CKER,KRAUSE I,et al. Genome-wide SNP typ-ing of ancient DNA:Determination of hair and eye color of Bronze Age humans from their skeletal remains[J]. Am J Phys Anthropol.,2020,172(1):99-109. [20] HAMANN L,SZWED M,MOSSAKOWSKA M,et al. First evidence for STING SNP R293Q being protective regarding obesity-associated cardiovascular disease in age-advanced subjects-a cohort study[J]. Immun Ageing,2020,17:7. [21] SINGH A,BABYAK M A,SIMS M,et al. Evaluating the precision of EBF1 SNP x stress interaction association:sex,race,and age differences in a big harmonized data set of 28,026 participants[J]. Transl Psychiatry,2020,10(1):351. (責(zé)編:何 艷) 基金項(xiàng)目 國(guó)家自然科學(xué)基金項(xiàng)目(31760660);內(nèi)蒙古自治區(qū)自然科學(xué)基金項(xiàng)目(2019MS03092);巴彥淖爾市科技計(jì)劃項(xiàng)目(BKZ2016);內(nèi)蒙古自治區(qū)科技計(jì)劃項(xiàng)目(2020GG0201)。 作者簡(jiǎn)介 劉燕萍(1969—),女,副教授。研究方向:動(dòng)物胚胎移植及家畜的保種和育種。 收稿日期 2021-12-06