摘 要: 遺傳力是衡量由遺傳因素解釋的表型方差的比例,在實際遺傳力估計中多只考慮加性遺傳效應(yīng)。由于畜禽傳統(tǒng)遺傳力估計需要的系譜信息完整性和準(zhǔn)確性較難以實現(xiàn),隨著基因組學(xué)的發(fā)展,以全基因組單核苷酸多態(tài)性(SNP)進(jìn)行遺傳力估計的方法得到廣泛應(yīng)用。而對SNP遺傳力的準(zhǔn)確估計有利于了解遺傳變異對表型的作用程度,目前已有不少SNP遺傳力估計模型被開發(fā)利用。本文主要綜述了SNP遺傳力的概念、常用估計方法及其影響因素,并與傳統(tǒng)遺傳力估計進(jìn)行比較,探究了SNP遺傳力在畜禽育種中的應(yīng)用潛力。
關(guān)鍵詞: SNP遺傳力;遺傳力缺失;影響因素;估計模型;畜禽育種
中圖分類號:S813
文獻(xiàn)標(biāo)志碼:A""" 文章編號:0366-6964(2024)05-1854-12
收稿日期:2023-10-27
基金項目:國家重點研發(fā)計劃項目(2022YFD1300200);重慶市現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系(草食牲畜:CQMAITS202313);重慶市科企聯(lián)合體種質(zhì)資源收集利用與品種試驗項目資助(草食牲畜)資助
作者簡介:段益欣(2001-),女,江西于都人,碩士生,主要從事動物遺傳育種與繁殖研究,E-mail:duanyx315@163.com
*通信作者:趙永聚,主要從事山羊遺傳育種研究,E-mail:zyongju@163.com
The Evaluated Methods and Influencing Factors of SNP Heritability and Its Application
in Farmer Animal Breeding
DUAN" Yixin, ZHANG" Linyun, ZHAO" Yongju*
(Chongqing Engineering Research Center for Herbivores Resource Protection and Utilization,
Chongqing Key Laboratory of Herbivore Science, College of Animal Science and Technology,
Southwest University, Chongqing 400715," China)
Abstract:" Heritability is a measure of the proportion of phenotypic variance explained by genetic factors. In actual heritability evaluation, only additive genetic effects are considered. With the development of genomics, genome-wide single nucleotide polymorphisms (SNPs) have been widely used to evaluate heritability because of the difficulty in achieving the integrity and accuracy of genealogy information that traditional heritability estimation relies on. However, accurate evaluation of SNP heritability is helpful in understanding the extent of genetic variation’s effect on phenotype. Currently, many SNP heritability evaluation models have been developed and utilized. In this paper, the concept, common evaluation methods and influencing factors of SNP heritability are reviewed, and a comparison was made between SNP heritability and the traditional heritability estimation, in order to explore the potential application of SNP heritability in livestock breeding.
Key words: SNP heritability; loss of heritability; influencing factors; estimation model; farmer animal breeding
*Corresponding author:" ZHAO Yongju, E-mail: zyongju@163.com
表型性狀通常受到遺傳效應(yīng)和環(huán)境效應(yīng)的共同作用,遺傳力是評估遺傳與環(huán)境效應(yīng)的關(guān)鍵值,是衡量由遺傳因素解釋的表型方差的比例[1]。遺傳力分為廣義遺傳力和狹義遺傳力,遺傳效應(yīng)包括上位效應(yīng)、顯性效應(yīng)和加性效應(yīng)。其中,廣義遺傳力通常指上位效應(yīng)、顯性效應(yīng)和加性效應(yīng)的遺傳方差占表型方差的比例,狹義遺傳力通常指加性遺傳效應(yīng)解釋的表型方差的比例[1-3]。傳統(tǒng)遺傳力的估計通常針對狹義遺傳力進(jìn)行,主要基于家庭或系譜數(shù)據(jù),利用混合線性模型(MLM)進(jìn)行方差組分的估計,從而進(jìn)行加性遺傳效應(yīng)的評估。作為遺傳效應(yīng)影響表型的重要參數(shù)之一,遺傳力常被用作遺傳連鎖和遺傳關(guān)聯(lián)研究的基礎(chǔ)[4],其應(yīng)用主要包括了解遺傳能力、確定疾病遺傳風(fēng)險、比較遺傳起源及遺傳相關(guān),甚至可以輔助育種值準(zhǔn)確估計從而促進(jìn)基因組選擇等[1,3,5]。較高遺傳力表明遺傳因素在影響性狀表型或疾病上發(fā)揮較高作用[6],因此,在畜禽育種中遺傳力的準(zhǔn)確估計具有重要意義,性狀的遺傳力高低將影響其選種、選育的方式方法,而遺傳力的準(zhǔn)確估計也是性狀遺傳評估的基礎(chǔ)[7]。
由于傳統(tǒng)的遺傳力估計是基于系譜信息來構(gòu)建親緣關(guān)系矩陣(A陣),并結(jié)合MLM進(jìn)行的,這對系譜信息的準(zhǔn)確性以及完整性都有較高的要求[8]。而目前,大多數(shù)養(yǎng)殖場存在系譜信息記錄不完善和錯誤等情況,致使傳統(tǒng)的遺傳力估計方法存在一定的局限性。隨著測序技術(shù)的快速發(fā)展,數(shù)以百萬計的SNPs得以有效挖掘,利用SNP進(jìn)行遺傳力估計成為了一種流行趨勢。Yang等[9]開發(fā)了一種基于全基因組SNP進(jìn)行的估計加性遺傳變異比例方法,該方法利用全基因組SNP分子標(biāo)記構(gòu)建相關(guān)性矩陣(GRM),從而進(jìn)行遺傳力的估計。本文主要對SNP遺傳力估計的概念、估計方法及其影響因素進(jìn)行綜述,并與傳統(tǒng)遺傳力估計進(jìn)行比較以了解SNP遺傳力估計的重要意義,探究SNP遺傳力在畜禽育種中的應(yīng)用潛力。
1 SNP遺傳力概述
1.1 SNP遺傳力概念
利用SNP分子標(biāo)記進(jìn)行加性遺傳方差的估計以解釋表型變異的比例即為SNP遺傳力(h2SNP)。SNP遺傳力通常利用REML法擬合方差分量模型進(jìn)行估計[10]。一般SNP遺傳力估計分為兩類:基于全基因組關(guān)聯(lián)分析(GWAS)結(jié)果和基于全基因組SNP[5]。前者是利用GWAS研究中顯著性SNP進(jìn)行遺傳力估計,后者是利用了全基因組所有的SNP。全基因組方法表明了大部分遺傳變異是加性遺傳變異,且其中的約1/3可由SNP捕獲[11],常見的SNP可以解釋大部分性狀的遺傳性[12]。
隨著全基因組測序技術(shù)和GWAS的發(fā)展,目前已經(jīng)能夠準(zhǔn)確測定數(shù)以百萬計的SNP的基因型以及挖掘復(fù)雜性狀相關(guān)的分子標(biāo)記及基因。但是研究發(fā)現(xiàn),基于GWAS結(jié)果只能解釋一小部分的遺傳力,而有很大一部分的遺傳力無法解釋,這一部分的遺傳力稱之為“消失遺傳力”或“遺傳力缺失”[13]。消失遺傳力的劃分主要為隱藏的遺傳力和依舊消失的遺傳力[14],隱藏的遺傳力通常指全基因組SNP遺傳力與GWAS遺傳力之間的差異,主要因小效應(yīng)的標(biāo)記無法檢測所致,可通過增加樣本量的方式來降低;依舊消失的遺傳力通常指利用GWAS也無法捕獲的變異,例如一些罕見的變異,可以通過增加變異來源、估計多種遺傳方差來降低。
對于“消失遺傳力”的解釋主要包括:變異與SNPs不完全連鎖不平衡(LD)導(dǎo)致遺傳力估計偏低;具有較大效應(yīng)的罕見變異解釋了表型方差;影響較小的常見變異(MAFgt;1%)無法在全基因組顯著性水平上檢測到;環(huán)境影響使得基于系譜研究的遺傳力估計值偏高;遺傳相互作用使總遺傳力估計偏高[9,11,13,15-16]。大多數(shù)基因水平的遺傳力由常見變異主導(dǎo),但有研究從罕見或低頻變異(0.5%lt;MAFlt;1%)中確定了影響某些性狀的基因,其遺傳力不為零[17]。Zhou等[18]在番茄圖形泛基因組的構(gòu)建研究中估計了不同變異對遺傳力的貢獻(xiàn),發(fā)現(xiàn)SNP對遺傳力的貢獻(xiàn)值并非最高,而由于DNA片段發(fā)生插入、缺失、重復(fù)等遺傳變異所引起的基因組結(jié)構(gòu)變異(SV)對于遺傳力也有較大的貢獻(xiàn),其作用不可忽視,這可能也是影響缺失遺傳力的一大因素,即表明結(jié)構(gòu)變異可以捕獲一部分缺失的遺傳力。另有研究指出,盡管大多數(shù)變異具有累加效應(yīng),但非加性遺傳效應(yīng)對遺傳力估計的影響仍不可忽視[19]。Alipanah等[20]對蘇格蘭綿羊進(jìn)行體重性狀的遺傳參數(shù)估計研究發(fā)現(xiàn),加性和非加性效應(yīng)的聯(lián)合模型對遺傳參數(shù)的估計研究更為準(zhǔn)確。此外,Chen等[21]對人雙胞胎個體的研究也指出了顯性效應(yīng)在遺傳估計中的作用可能被大大低估。盡管有研究發(fā)現(xiàn)泛基因組開放閱讀框可以為缺失遺傳力的研究進(jìn)行潛在補充[22],但目前遺傳力缺失的具體機制與原因仍未得到完全的解釋,而由于“缺失遺傳力”存在著多樣性,大部分研究者著重于對基因組和遺傳因素控制復(fù)雜表型的機制進(jìn)行研究。
基于系譜信息的遺傳力估計受到基因-環(huán)境互作效應(yīng)的影響,其估計值可能偏高[15],而GWAS研究中發(fā)現(xiàn)的與性狀相關(guān)的SNPs只能解釋一小部分遺傳力,其遺傳力估計值偏低。因此,利用全基因組SNP進(jìn)行遺傳力的準(zhǔn)確估計對于遺傳評估、遺傳改良、缺失遺傳力的研究以及GWAS研究[23]皆至關(guān)重要。
1.2 傳統(tǒng)遺傳力估計與SNP遺傳力估計的比較
相較于傳統(tǒng)遺傳力估計方法,系譜信息難以保證其準(zhǔn)確性和完整性,而基于全基因組標(biāo)記的SNP遺傳力估計恰恰可以避免這一問題。為進(jìn)一步提高遺傳力估計的準(zhǔn)確性和完整性,基于SNP標(biāo)記進(jìn)行的遺傳力估計研究日益增多,不少研究者對傳統(tǒng)遺傳力估計法與SNP遺傳力估計法進(jìn)行了比較研究[13,24-27]。有研究指出,與系譜信息相比,由基因組信息估計的人類復(fù)雜性狀的遺傳力估計值偏低[13],即所謂的“遺傳力缺失”。Khanzadeh等[28]基于系譜信息和基因組信息對奶牛產(chǎn)奶性狀進(jìn)行遺傳力估計的研究指出,基于譜系的遺傳力估計值要高于基因組遺傳力估計值。然而仍有不少研究結(jié)果與其存在差異。
有研究指出,相較于基于系譜數(shù)據(jù)的遺傳力估計值,基于單核苷酸多態(tài)性的遺傳力估計能夠捕獲更大的加性遺傳方差比例[29],且具有較高的準(zhǔn)確性和穩(wěn)定性[30]。常瑤等[24]基于系譜信息以及基因組信息對不同于月齡的荷斯坦牛后備牛的體重性狀進(jìn)行了遺傳參數(shù)估計,研究指出,利用系譜-基因組信息估計的遺傳參數(shù)更準(zhǔn)確、穩(wěn)定。Perrier等[30]基于系譜信息、全基因組信息、基因組矯正的系譜信息,對小樣本的藍(lán)山雀進(jìn)行4個性狀的遺傳參數(shù)估計研究,結(jié)果發(fā)現(xiàn)與基于社會系譜信息(PED)估計的遺傳力相比,使用遺傳關(guān)系矩陣(GRM)估計的遺傳力估計值略高,利用基因組信息進(jìn)行的校正系譜信息(PED校正)估計的遺傳力處于中間值,表明由于不正確的系譜信息以及系譜信息含量低于遺傳關(guān)系矩陣(GRM),致使PED遺傳力略有被低估,而遺傳關(guān)系矩陣(GRM)具有更高的精確度和更高的信息量。另有研究指出,雖然基因組遺傳力估計具有相對較大的標(biāo)準(zhǔn)誤差,但系譜信息和基于SNP標(biāo)記估計的遺傳力差異不大[25]。Guo等[26]對扇貝的四個生長性狀進(jìn)行遺傳力估計,比較了GCTA法(基于基因組SNP)和傳統(tǒng)選擇性育種法(選擇反應(yīng)與選擇差的比值)估計遺傳力的差異,結(jié)果發(fā)現(xiàn)兩者的估計值差異不大。Ogawa等[31]對日本黑牛胴體性狀進(jìn)行研究發(fā)現(xiàn),基于基因組信息的遺傳力估計值與傳統(tǒng)系譜法估計值相似,即表明大部分加性遺傳變異可以由SNP解釋。Aase等[32]研究也指出,基于基因組信息進(jìn)行的定量遺傳參數(shù)估計與系譜估計值相似。Bérénos等[27]通過比較系譜和全基因組兩種方法估計的遺傳力也發(fā)現(xiàn)其遺傳力估計值相似,但基因組法所估計的遺傳力其標(biāo)準(zhǔn)差較低,且包含了更多的信息。
對于基于系譜數(shù)據(jù)和基于SNP標(biāo)記進(jìn)行的遺傳力估計比較研究似乎并沒有統(tǒng)一確定的結(jié)果,這可能與系譜準(zhǔn)確性[30]、SNP密度[26,33]、估計算法(模型)[34]的差異有關(guān)。但毫無疑問的是,相較于系譜信息的較難收集及其完整性、準(zhǔn)確性不明,基于基因組SNP標(biāo)記進(jìn)行的遺傳力估計研究的準(zhǔn)確性、精確性及穩(wěn)定性更佳。而由于考慮的遺傳變異有限以及標(biāo)記間的連鎖不平衡,SNP遺傳力估計結(jié)果與實際遺傳力間仍存在一定的差異。
另外,遺傳參數(shù)的估計需要大的樣本量和有關(guān)個體間完整、準(zhǔn)確的系譜信息。對于那些只能在較小樣本中表型化或具有成本效益的數(shù)量性狀,如罕見病、行為性狀等,可能較難獲得足夠大的樣本量以滿足估計遺傳參數(shù)的要求,使用SNP進(jìn)行遺傳力估計比系譜法的遺傳力估計效果更佳[29]。
2 SNP遺傳力估計方法
通常利用線性回歸模型假設(shè)表型向量(y)與基因型矩陣(X)間的關(guān)系:
y=Xβ+ε
(1)
上式(1)中,y表示表型向量,X表示n×p的基因型矩陣(n為樣本數(shù)量,p為SNP數(shù)量),β表示遺傳效應(yīng)大小,ε表示殘差向量。基因型利用0、1、2進(jìn)行編碼,表示參考等位基因的數(shù)量。當(dāng)ngt;p時,遺傳力由Var(Xβ)/Var(y)估計,其中Var表示樣本方差;當(dāng)nlt;p時,上式(1)成為了一個不確定的系統(tǒng),因此需要對SNP效應(yīng)大小進(jìn)行模型假設(shè)[1-2]。
目前已有不少可用于SNP遺傳力估計的關(guān)于效應(yīng)大小的模型假設(shè),常用的一些模型假設(shè)如下:
基因組相關(guān)性矩陣限制最大似然法(GREML)?;旌暇€性模型(MLM)最初由Yang等[9]應(yīng)用于SNP遺傳力估計。其假設(shè)所有SNP具有非零效應(yīng),且效應(yīng)(β)大小遵循正態(tài)分布:
βj~N(0,σ2β)(2)
y=Xf+Zα+e
(3)
上式(3)中,y表示性狀的表型,f表示固定效應(yīng)(非遺傳),α表示隨機加性效應(yīng),e表示殘差效應(yīng),X、Z分別為對應(yīng)的結(jié)構(gòu)矩陣?;诨旌暇€性模型進(jìn)行的SNP遺傳力估計方法可以分為兩類[35]:一類是將SNP效應(yīng)作為固定效應(yīng)加入到線性模型中[36],另一類是將SNP效應(yīng)作為隨機效應(yīng)[9]。固定效應(yīng)模型假設(shè)每個SNP在種群內(nèi)的不同樣本中的影響是一致的,而在隨機效應(yīng)模型中,SNP的影響可能在不同樣本中發(fā)生變化[36]。
SNP遺傳力估計值為:h2SNP=σ2gσ2g+σ2e,其中加性遺傳方差定義為:σ2g=p×σ2β?;谌蚪M數(shù)據(jù),應(yīng)用MLM模型可能會導(dǎo)致低估了具有常見的潛在因果變異的性狀的SNP遺傳力[1]。因此,總加性遺傳效應(yīng)的方差分量和殘差效應(yīng)的方差分量可以利用GCTA軟件[37]基于約束最大似然法(REML)進(jìn)行估算,即GREML法。GREML方法在估計時考慮了LD,并且其應(yīng)用于不相關(guān)的個體樣本,因此SNP遺傳力不太可能被常見的環(huán)境影響所混淆[38]。
貝葉斯變量選擇回歸法(BVSR)。BVSR法假設(shè)在所有遺傳變異中影響表型的變異相對較少[39]。假設(shè)每個SNP效應(yīng)大小服從點-正態(tài)分布:
βj~πN(0,σ2β)+(1-π)δ0
(4)
上式(4)中,σ2β表示正態(tài)分布中的方差分量,π表示非零SNP效應(yīng)比例,而當(dāng)比例為1-π時,SNP效應(yīng)為零,δ0為零點的質(zhì)點。SNP遺傳力估計為:h2SNP=πσ2βπσ2β+σ2e,利用馬爾可夫鏈蒙特卡羅(MCMC)算法獲得參數(shù)樣本。不少研究利用REML進(jìn)行遺傳力估計,利用貝葉斯模型進(jìn)行SNP遺傳力估計相對較少,但有研究對比了REML和貝葉斯法(Bayes)來估計SNP遺傳力,指出利用貝葉斯模型進(jìn)行高遺傳力性狀的SNP遺傳力估計也同樣具有較高的準(zhǔn)確性,但對于較低遺傳力的性狀,所有模型都難以估計真實的遺傳力[40]。
當(dāng)小部分SNP對性狀具有非零效應(yīng)時,BVSR在估計SNP遺傳力方面更準(zhǔn)確;相反,當(dāng)大部分SNP對性狀具有效應(yīng)時,利用MLM估計SNP遺傳力更為準(zhǔn)確。
貝葉斯系數(shù)線性混合模型(BSLMM)。通常由于表型性狀的遺傳結(jié)構(gòu)是未知的,所以對于模型的選擇也無法確定。因此,Zhou等[41]將LMM和BVSR兩種模型進(jìn)行綜合,提出了貝葉斯稀疏線性混合模型(BSLMM),假設(shè)效應(yīng)服從兩個正態(tài)分布的混合:
βj~πN(0,σ2a+σ2b)+(1-π)N(0,σ2b)
(5)
假設(shè)所有SNP至少有一個小的影響其方差為σ2b,當(dāng)比例為π 時,方差分量為σ2a,當(dāng)σ2b為0時,相當(dāng)于BVSR模型;當(dāng)π為0時,相當(dāng)于LMM模型。SNP遺傳力估計近似于pπσ2a+σ2bpπσ2a+σ2b+σ2e,依靠大都會-黑斯廷斯(MH)算法執(zhí)行后驗。
連鎖不平衡調(diào)整親屬關(guān)系(LDAK)。由于LD的存在,BVSR,GREML和BSLMM法可能會對高LD的變異的遺傳力估計值高估,而低估了低LD區(qū)域的遺傳力估計。Speed等[42]提出了一種新方法LDAK,它考慮了LD,假設(shè)由罕見變異解釋的方差比由常見變異解釋的方差要大。假設(shè)效應(yīng)大小遵循以下等式:
βj~N(0,σ2j),σ2j∝(fj(1-fj))1+α×ωj×rj
(6)
上式(6)中,fj是指SNPj的次等位基因頻率;ωj是SNP權(quán)重,是SNPj的連鎖不平衡分?jǐn)?shù)倒數(shù)的函數(shù)。LDAK法利用LD調(diào)整GRM,即通過LD加權(quán)模型,減少了潛在偏差,提高了遺傳力估計的精確性[43]。但LDAK中的LD加權(quán)增加了稀有變異的比重,從而導(dǎo)致對罕見變異遺傳力的高估[6]。
連鎖不平衡分?jǐn)?shù)回歸(LDSC)。根據(jù)GWAS結(jié)果匯總統(tǒng)計顯著性SNP數(shù)據(jù)估計SNP遺傳力的常用方法是LDSC[44]。
E(X2|li)=nlih2SNPp+na+1
(7)
上式(7)中,n是樣本數(shù)量,p是 SNP 的數(shù)量,a是衡量混雜偏差的貢獻(xiàn),給定SNP的X2關(guān)聯(lián)統(tǒng)計值反映LD中所有SNP與該SNP的關(guān)聯(lián),li是SNPi的LD得分,即LDSC通過回歸 GWAS 測試統(tǒng)計數(shù)據(jù)X2每個 SNP LD 分?jǐn)?shù)li估計h2SNP。
除了以上被列舉出來的方法以外,還有不少其它的估計模型,例如應(yīng)用于數(shù)量性狀的廣義隨機效應(yīng)模型(GRE)[45]、相關(guān)性不平衡回歸(RDR)[46]、動態(tài)貝葉斯高斯過程模型(dynBGP)[47],應(yīng)用于病例對照研究和計數(shù)表型的責(zé)任閾值模型-REML[48]、PCGC回歸[49]、PQLseq[50]以及應(yīng)用于匯總統(tǒng)計的MQS法[51]、GWAS遺傳力估計器(GWASH)[36]等。目前,基于SNP的遺傳力研究中,GCTA法(也稱GREML法)被較為廣泛的應(yīng)用于數(shù)量性狀研究中,而連鎖不平衡回歸分析法(LDSC)被最為廣泛的應(yīng)用于匯總統(tǒng)計數(shù)據(jù)當(dāng)中[52]。BVSR和BSLMM法除了可以估計SNP遺傳力外,也可用于基因組預(yù)測研究中。表1為 h2SNP估計方法總括表。
3 SNP遺傳力估計的影響因素
遺傳力不是表型性狀的固有屬性,其取決于測定表型的樣本群體[17,52],它會隨著群體差異(包括年齡、性別、季節(jié)等)、環(huán)境差異而變化。遺傳參數(shù)的估計對于樣本量的要求也較高,通常通過增加樣本量的方式減少抽樣方差[54]。而基于不同平臺檢測的SNP位點數(shù)量不同[30],因果變異的連鎖不平衡、次等位基因頻率[9,55-56],群體分層[57]以及估計的模型不同[34],會導(dǎo)致SNP遺傳力估計值間可能存在差異。
SNP遺傳力估計研究依賴于基因組信息,SNP標(biāo)記密度的增加可以提高遺傳力估計的精確度。Bérénos等[33]對野生綿羊種群5個成年體型性狀進(jìn)行遺傳結(jié)構(gòu)分析發(fā)現(xiàn),其基因組遺傳力范圍從前腿0.26到下頜0.53,且不同體型性狀具有不同遺傳結(jié)構(gòu),而密集的SNP有助于了解野生種群基因座數(shù)量特征的選擇。Guo等[26]的研究也發(fā)現(xiàn)SNP密度會影響遺傳力估計值,當(dāng)標(biāo)記密度足夠高時,利用GCTA法可進(jìn)行準(zhǔn)確的遺傳力估計。但也有研究發(fā)現(xiàn)SNP密度的增加對遺傳力估計的影響效果并不顯著[40,58],James等[59]利用兩種不同SNP密度對3個年齡階段(初生、羔羊、成年)的野生綿羊的5個性狀(體重、前腿長、后腿長、掌骨長度、下頜長度)進(jìn)行SNP遺傳力估計,并進(jìn)行GWAS分析,發(fā)現(xiàn)不同SNP密度并不會影響遺傳力的估計,但在高密度SNP數(shù)據(jù)發(fā)現(xiàn)了一些新的SNP-性狀關(guān)聯(lián)。另外,倪萍等[8]對仿刺參的疣足數(shù)量進(jìn)行SNP遺傳力估計時發(fā)現(xiàn)50K SNP密度下的遺傳力估計已達(dá)穩(wěn)定。這表明不同物種不同性狀的SNP遺傳力估計對SNP密度的要求不一致,不同的SNP密度對遺傳力估計存在著一定影響,而當(dāng)標(biāo)記密度達(dá)到一定水平時,這種影響將達(dá)到穩(wěn)定,而大多數(shù)遺傳方差都可以通過高密度的SNP捕獲[55]。
SNP間的LD會致使SNP遺傳力估計偏倚,因此進(jìn)行SNP遺傳力估計時一般建議考慮LD,目前有不少研究將LD加權(quán)進(jìn)入模型中以保證SNP遺傳力估計的準(zhǔn)確性[29,42,60]。Ren等[61]利用LD調(diào)整親緣關(guān)系(LDAK)和LD分層多組分(LDS)模型控制區(qū)域間LD異質(zhì)性,并與沒有LD控制的經(jīng)典模型進(jìn)行比較,發(fā)現(xiàn)GCTA-LDS模型和LDAK-LDS模型都能有效消除區(qū)域間LD異質(zhì)性的不利影響,從而提高遺傳力估計的無偏性和基因組預(yù)測的準(zhǔn)確性;另外,研究發(fā)現(xiàn)對于高密度SNP數(shù)據(jù),區(qū)域間LD異質(zhì)性的不利影響更為明顯。次等位基因頻率(MAF)與LD相互依賴,高M(jìn)AF的數(shù)量性狀位點(QTL)間的LD程度高于低MAF的QTLs間,通常因果變異的LD會致使遺傳力估計偏差,而MAF可作為其不完全指標(biāo)[42]。另外,當(dāng)根據(jù)MAF進(jìn)行SNP標(biāo)記篩選質(zhì)控時,考慮的SNP標(biāo)記位點會有所不同,從而會引起遺傳力估計的差異性。
SNP遺傳力估計會受到許多因素的影響,在應(yīng)用過程中往往需要根據(jù)實際情況考慮不同的方法進(jìn)行相關(guān)的研究估計。盡管目前的模型方法估計SNP遺傳力存在一定的偏差,但整體而言,大多數(shù)方法模型都是可靠穩(wěn)健的[45]。
4 SNP遺傳力估計在畜禽育種中的應(yīng)用
遺傳力是反映性狀遺傳能力大小的重要遺傳參數(shù),遺傳力估計的準(zhǔn)確度對畜禽育種工作具有重要的意義,通常可以根據(jù)遺傳力的大小選擇適合的育種方法,為畜禽育種增效。傳統(tǒng)遺傳力估計依賴于親緣關(guān)系較近的個體間系譜信息的完整性及準(zhǔn)確性,并且由于受到環(huán)境因素的作用,其估計值往往偏高。隨著SNP標(biāo)記估計遺傳力方法的改善,可以對許多復(fù)雜性狀進(jìn)行較為準(zhǔn)確的SNP遺傳力估計,復(fù)雜性狀的遺傳學(xué)研究也得到了顯著進(jìn)展。
在畜禽育種方案設(shè)計中,改良性狀的遺傳力和加性遺傳效應(yīng)對獲得較佳的育種選擇至關(guān)重要[62],因此,基于基因組信息進(jìn)行準(zhǔn)確的遺傳參數(shù)估計十分重要。阮棟林等[63]對杜洛克種豬生長和體尺性狀進(jìn)行遺傳參數(shù)估計研究時,利用了SNP芯片數(shù)據(jù)進(jìn)行估計研究,并加入了環(huán)境因素和群體間混雜因素的影響,結(jié)果指出該群體的生長性狀屬于中高等遺傳力性狀,在選育過程中較易、較快獲得遺傳進(jìn)展,而大部分體尺性狀屬于低遺傳力性狀,較易受到環(huán)境因素的影響,說明在選育過程中需結(jié)合考慮不同的選擇方法,進(jìn)而加快遺傳改良進(jìn)展,也為杜洛克豬的選育提供了一定的理論基礎(chǔ)。羊毛性狀作為綿羊重要經(jīng)濟性狀之一,是綿羊選育過程中考慮的一個重要指標(biāo)。Arzik等[64]基于基因組信息對阿卡拉曼羊的5個羊毛性狀進(jìn)行遺傳參數(shù)估計,發(fā)現(xiàn)6個羊毛性狀的遺傳力范圍包括中等到高等,結(jié)合GWAS研究挖掘出與羊毛性狀顯著相關(guān)的1個基因和6個SNPs,為提高該品種羊毛質(zhì)量和產(chǎn)量的育種計劃提供幫助。另外,通過考慮SNP密度和性狀遺傳力來設(shè)計基因組選擇策略,在育種過程中實現(xiàn)可持續(xù)的遺傳增益和控制近交水平十分重要[65]。Zhang等[66]通過研究肉脂型與瘦肉型兩種群體的北京鴨肉質(zhì)性狀發(fā)現(xiàn),肉脂型與瘦肉型北京鴨在整體基因組水平具有遺傳可區(qū)分性,其肉質(zhì)性狀的遺傳力也存在差異性,即兩個種群間不同選擇方向?qū)е铝烁咚降倪z傳分化,結(jié)合基因組選擇,可為鴨育種改良提供幫助。Rostamzadeh等[67]對日本黑牛胴體性狀進(jìn)行基因組遺傳力及相關(guān)性分析指出,其胴體性狀的遺傳力為中等至高等范圍,胴體性狀之間存在相當(dāng)大的遺傳變異和較好的基因組相關(guān)性,即通過基因組選擇可以同時獲得性狀的遺傳改良,研究還發(fā)現(xiàn)樣本量以及個體之間的相關(guān)性不同,可能會導(dǎo)致基因組遺傳力和胴體性狀之間相關(guān)性估計值的不同。
通常SNP遺傳力并不會單獨進(jìn)行研究估計,往往會結(jié)合GWAS分析、基因組育種值估計并對基因組進(jìn)行選擇,共同為動物的育種工作提供一定的理論依據(jù)。表2匯總了目前不同畜禽重要性狀的SNP遺傳力估計的研究情況。
5 總 結(jié)
SNP遺傳力估計能克服傳統(tǒng)遺傳力估計受系譜信息完整性的限制難題,為遺傳參數(shù)準(zhǔn)確估計提供了可能,并結(jié)合當(dāng)前如火如荼的基因組研究,為畜禽育種工作提供更有效的幫助。值得注意的是,目前基于SNP標(biāo)記進(jìn)行的遺傳力估計結(jié)果與實際遺傳力間仍存在一定差異,其準(zhǔn)確性也有待更進(jìn)一步的提高。現(xiàn)有的SNP遺傳力估計模型所考慮的因素并不充分,其估計值仍存在一定的偏差,且仍需有足夠大的樣本,因此SNP遺傳力估計的實際應(yīng)用受到一定的限制。其次,大部分的復(fù)雜性狀存在著隱藏遺傳力,而基于SNP分子標(biāo)記的遺傳力估計尚存在一定的局限性,并不能完全考慮所有的變異,因此在遺傳力估計中應(yīng)更多的考慮各種變異的存在。再者,目前的SNP遺傳力估計模型大多只考慮了加性遺傳效應(yīng),而忽略了顯性效應(yīng)和互作效應(yīng)。因此,隨著測序技術(shù)、方法以及SNP遺傳力估計模型的不斷發(fā)展與成熟,有望建立更為準(zhǔn)確的估計模型,使基于全基因組信息進(jìn)行SNP遺傳力無偏估計得到更廣泛應(yīng)用,并盡可能充分考慮各種遺傳、環(huán)境等因素的影響,為畜禽育種提供有效幫助。
參考文獻(xiàn)(References):
[1] ZHU H H,ZHOU X.Statistical methods for SNP heritability estimation and partition:a review[J].Comput Struct Biotechnol J,2020,18:1557-1568.
[2] TANG M S,WANG T,ZHANG X F.A review of SNP heritability estimation methods[J].Brief Bioinform,2022,23(3):bbac067.
[3] VISSCHER P M,HILL W G,WRAY N R.Heritability in the genomics era-concepts and misconceptions[J].Nat Rev Genet,2008,9(4):255-266.
[4] FRIEDMAN N P,BANICH M T,KELLER M C.Twin studies to GWAS:there and back again[J].Trends Cogn Sci,2021,25(10): 855-869.
[5] MAYHEW A J,MEYRE D.Assessing the heritability of complex traits in humans:methodological challenges and opportunities[J]. Curr Genomics,2017,18(4):332-340.
[6] SRIVASTAVA A K,WILLIAMS S M,ZHANG G.Heritability estimation approaches utilizing genome-wide data[J].Curr Protoc,2023,3(4):e734.
[7] PIZARRO INOSTROZA M G,LANDI V,NAVAS GONZLEZ F J,et al.Does the acknowledgement of αS1-casein genotype affect the estimation of genetic parameters and prediction of breeding values for milk yield and composition quality-related traits in Murciano-Granadina?[J].Animals (Basel),2019,9(9):679.
[8] 倪 萍,任 強,王 靜,等.仿刺參疣足數(shù)量SNP遺傳力評估[J].漁業(yè)科學(xué)進(jìn)展,2021,42(3):68-76.
NI P,REN Q,WANG J,et al.Estimating SNP heritability for papillae number in sea cucumber[J].Progress in Fishery Sciences,2021,42(3):68-76.(in Chinese)
[9] YANG J,BENYAMIN B,MCEVOY B P,et al.Common SNPs explain a large proportion of the heritability for human height[J]. Nat Genet, 2010,42(7):565-569.
[10] LIN Z T,SEAL S,BASU S.Estimating SNP heritability in presence of population substructure in biobank-scale datasets[J]. Genetics,2022,220(4):iyac015.
[11] UZZAMAN M R,PARK J E,LEE K T,et al.Whole-genome association and genome partitioning revealed variants and explained heritability for total number of teats in a Yorkshire pig population[J].Asian-Australas J Anim Sci,2018,31(4):473-479.
[12] SHIN D,PARK K D,KA S,et al.Heritability estimated using 50K SNPs indicates missing heritability problem in Holstein breeding[J].Genomics Inform,2015,13(4):146-151.
[13] MANOLIO T A,COLLINS F S,COX N J,et al.Finding the missing heritability of complex diseases[J].Nature,2009, 461(7265):747-753.
[14] WITTE J S,VISSCHER P M,WRAY N R.The contribution of genetic variants to disease depends on the ruler[J].Nat Rev Genet,2014,15(11):765-776.
[15] YANG J,BAKSHI A,ZHU Z H,et al.Genetic variance estimation with imputed variants finds negligible missing heritability for human height and body mass index[J].Nat Genet,2015,47(10):1114-1120.
[16] TENESA A,HALEY C S.The heritability of human disease:estimation,uses and abuses[J].Nat Rev Genet,2013,14(2):139-149.
[17] BURCH K S,HOU K C,DING Y,et al.Partitioning gene-level contributions to complex-trait heritability by allele frequency identifies disease-relevant genes[J].Am J Hum Genet,2022,109(4):692-709.
[18] ZHOU Y,ZHANG Z Y,BAO Z G,et al.Graph pangenome captures missing heritability and empowers tomato breeding[J].Nature,2022,606(7914):527-534.
[19] LPEZ-CORTEGANO E,CABALLERO A.Inferring the nature of missing heritability in human traits using data from the GWAS catalog[J].Genetics,2019,212(3):891-904.
[20] ALIPANAH M,ROUDBARI Z,MOMEN M,et al.Impact of inclusion non-additive effects on genome-wide association and variance’s components in Scottish black sheep[J].Anim Biotechnol,2023,34(8):3765-3773.
[21] CHEN X,KUJA-HALKOLA R,RAHMAN I,et al.Dominant genetic variation and missing heritability for human complex traits:insights from twin versus genome-wide common SNP models[J].Am J Hum Genet,2015,97(5):708-714.
[22] LI Z C,SIMIANER H.Pan-genomic open reading frames:a potential supplement of single nucleotide polymorphisms in estimation of heritability and genomic prediction[J].PLoS Genet,2020,16(8):e1008995.
[23] SPEED D,O’BRIEN T J,PALOTIE A,et al.Describing the genetic architecture of epilepsy through heritability analysis[J].Brain,2014,137(10):2680-2689.
[24] 常 瑤,蘇國生,李艷華,等.基于系譜和基因組信息估計荷斯坦青年母牛體重性狀遺傳參數(shù)[J].畜牧獸醫(yī)學(xué)報,2022,53(11):3759-3768.
CHANG Y,SU G S,LI Y H,et al.Estimating genetic parameters for body weights using pedigree and genotype-pedigree based approaches in Holstein heifers[J].Acta Veterinaria et Zootechnica Sinica,2022,53(11):3759-3768.(in Chinese)
[25] JOERGENSEN D,MADSEN P,ROPSTAD E O,et al.Heritability estimates of distichiasis in Staffordshire bull terriers using pedigrees and genome-wide SNP data[J].Acta Vet Scand,2022,64(1):30.
[26] GUO H B,ZENG Q F,LI Y P,et al.Estimating realized heritability for growth in Zhikong scallop (Chlamys farreri) using genome-wide complex trait analysis[J].Aquaculture,2018,497:103-108.
[27] BRNOS C,ELLIS P A,PILKINGTON J G,et al.Estimating quantitative genetic parameters in wild populations:a comparison of pedigree and genomic approaches[J].Mol Ecol,2014,23(14):3434-3451.
[28] KHANZADEH H,GHAVI HOSSEIN-ZADEH N,GHOVVATI S.A meta-analysis of the gap between pedigree-based and genomic heritability estimates for production traits in dairy cows[J].Livest Sci,2022,263:105000.
[29] ZIMMERMANN E,DISTL O.SNP-based heritability of osteochondrosis dissecans in hanoverian warmblood horses[J].Animals (Basel),2023,13(9):1462.
[30] PERRIER C,DELAHAIE B,CHARMANTIER A.Heritability estimates from genomewide relatedness matrices in wild populations:application to a passerine,using a small sample size[J].Mol Ecol Resour,2018,18(4):838-853.
[31] OGAWA S,MATSUDA H,TANIGUCHI Y,et al.Estimation of the autosomal contribution to total additive genetic variability of carcass traits in Japanese Black cattle[J].Anim Sci J,2022,93(1):e13710.
[32] AASE K,JENSEN H,MUFF S.Genomic estimation of quantitative genetic parameters in wild admixed populations[J].Methods Ecol Evol,2022,13(5):1014-1026.
[33] BRNOS C,ELLIS P A,PILKINGTON J G,et al.Heterogeneity of genetic architecture of body size traits in a free-living population[J].Mol Ecol,2015,24(8):1810-1830.
[34] SPEED D,KAPHLE A,BALDING D J.SNP-based heritability and selection analyses:improved models and new results[J]. Bioessays,2022,44(5):2100170.
[35] MIN A L,THOMPSON E,BASU S.Comparing heritability estimators under alternative structures of linkage disequilibrium[J]. G3 (Bethesda),2022,12(8):jkac134.
[36] SCHWARTZMAN A,SCHORK A J,ZABLOCKI R,et al.A simple,consistent estimator of SNP heritability from genome-wide association studies[J].Ann Appl Stat,2019,13(4):2509-2538.
[37] YANG J,LEE S H,GODDARD M E,et al.GCTA:a tool for genome-wide complex trait analysis[J].Am J Hum Genet,2011,88(1): 76-82.
[38] YANG J,ZENG J,GODDARD M E,et al.Concepts,estimation and interpretation of SNP-based heritability[J].Nat Genet,2017,49(9):1304-1310.
[39] GUAN Y T,STEPHENS M.Bayesian variable selection regression for genome-wide association studies and other large-scale problems[J].Ann Appl Stat,2011,5(3):1780-1815.
[40] KRAG K,JANSS L L,SHARIATI M M,et al.SNP-based heritability estimation using a Bayesian approach[J]. Animal,2013,7(4):531-539.
[41] ZHOU X,CARBONETTO P,STEPHENS M.Polygenic modeling with Bayesian sparse linear mixed models[J].PLoS Genet, 2013, 9(2):e1003264.
[42] SPEED D,HEMANI G,JOHNSON M R,et al.Improved heritability estimation from genome-wide SNPs[J].Am J Hum Genet, 2012, 91(6):1011-1021.
[43] SPEED D,CAI N,The UCLEB Consortium,et al.Reevaluation of SNP heritability in complex human traits[J].Nat Genet,2017, 49(7):986-992.
[44] BULIK-SULLIVAN B K,LOH P R,F(xiàn)INUCANE H K,et al.LD Score regression distinguishes confounding from polygenicity in genome-wide association studies[J].Nat Genet,2015,47(3):291-295.
[45] HOU K C,BURCH K S,MAJUMDAR A,et al.Accurate estimation of SNP-heritability from biobank-scale data irrespective of genetic architecture[J].Nat Genet,2019,51(8):1244-1251.
[46] YOUNG A I,F(xiàn)RIGGE M L,GUDBJARTSSON D F,et al.Relatedness disequilibrium regression estimates heritability without environmental bias[J].Nat Genet,2018,50(9):1304-1310.
[47] ARJAS A,HAUPTMANN H,SILLANPM J.Estimation of dynamic SNP-heritability with Bayesian Gaussian process models[J].Bioinformatics,2020,36(12):3795-3802.
[48] LEE S H,WRAY N R,GODDARD M E,et al.Estimating missing heritability for disease from genome-wide association studies[J].Am J Hum Genet,2011,88(3):294-305.
[49] GOLAN D,LANDER E S,ROSSET S.Measuring missing heritability:inferring the contribution of common variants[J].Proc Natl Acad Sci U S A,2014,111(49):E5272-E5281.
[50] SUN S Q,ZHU J Q,MOZAFFARI S,et al.Heritability estimation and differential analysis of count data with generalized linear mixed models in genomic sequencing studies[J].Bioinformatics,2019,35(3):487-496.
[51] ZHOU X.A unified framework for variance component estimation with summary statistics in genome-wide association studies[J].Ann Appl Stat,2017,11(4):2027-2051.
[52] GE T,CHEN C Y,NEALE B M,et al.Phenome-wide heritability analysis of the UK Biobank[J].PLoS Genet,2017,13(4): e1006711.
[53] PALLA L,DUDBRIDGE F.A fast method that uses polygenic scores to estimate the variance explained by genome-wide marker panels and the proportion of variants affecting a trait[J].Am J Hum Genet,2015,97(2):250-259.
[54] VISSCHER P M,GODDARD M E.A general unified framework to assess the sampling variance of heritability estimates using pedigree or marker-based relationships[J].Genetics,2015,199(1):223-232.
[55] UEMOTO Y,SASAKI S,KOJIMA T,et al.Impact of QTL minor allele frequency on genomic evaluation using real genotype data and simulated phenotypes in Japanese Black cattle[J].BMC Genet,2015,16:134.
[56] EVANS L M,TAHMASBI R,VRIEZE S I,et al.Comparison of methods that use whole genome data to estimate the heritability and genetic architecture of complex traits[J].Nat Genet,2018,50(5):737-745.
[57] DANDINE-ROULLAND C,BELLENGUEZ C,DEBETTE S,et al.Accuracy of heritability estimations in presence of hidden population stratification[J].Sci Rep,2016,6:26471.
[58] GODDARD M E,HAYES B J.Mapping genes for complex traits in domestic animals and their use in breeding programmes[J].Nat Rev Genet,2009,10(6):381-391.
[59] JAMES C,PEMBERTON J M,NAVARRO P,et al.The impact of SNP density on quantitative genetic analyses of body size traits in a wild population of Soay sheep[J].Ecol Evol,2022,12(12):e9639.
[60] MATHEW B,LON J,SILLANP M J.A novel linkage-disequilibrium corrected genomic relationship matrix for SNP-heritability estimation and genomic prediction[J].Heredity (Edinb),2018,120(4):356-368.
[61] REN D Y,CAI X D,LIN Q,et al.Impact of linkage disequilibrium heterogeneity along the genome on genomic prediction and heritability estimation[J].Genet Sel Evol,2022,54(1):47.
[62] GUL S,ARZIK Y,KIZILASLAN M,et al.Heritability and environmental influence on pre-weaning traits in Kilis goats[J].Trop Anim Health Prod,2023,55(2):85.
[63] 阮棟林,陳 悅,莊站偉,等.基于SNP芯片的杜洛克種豬生長和體尺性狀遺傳參數(shù)估計及相關(guān)分析[J].家畜生態(tài)學(xué)報,2023,44(2):19-24.
RUAN D L,CHEN Y,ZHUANG Z W,et al.Genetic parameter estimation and correlation analysis of growth traits and body traits in Duroc pigs based on SNP chip[J].Journal of Domestic Animal Ecology,2023,44(2):19-24.(in Chinese)
[64] ARZIK Y,KIZILASLAN M,BEHREM S,et al.Genome-wide scan of wool production traits in akkaraman sheep[J].Genes (Basel),2023,14(3):713.
[65] ZHENG X,ZHANG T L,WANG T Z,et al.Long-term impact of genomic selection on genetic gain using different SNP density[J].Agriculture,2022,12(9):1463.
[66] ZHANG F,ZHU F,YANG F X,et al.Genomic selection for meat quality traits in Pekin duck[J].Anim Genet,2022,53(1):94-100.
[67] ROSTAMZADEH MAHDABI E,TIAN R G,LI Y,et al.Genomic heritability and correlation between carcass traits in Japanese Black cattle evaluated under different ceilings of relatedness among individuals[J].Front Genet,2023,14:1053291.
[68] TUSELL L,GILBERT H,VITEZICA Z G,et al.Dissecting total genetic variance into additive and dominance components of purebred and crossbred pig traits[J].Animal,2019,13(11):2429-2439.
[69] WU Z Y,DOU T F,BAI L Y,et al.Genomic prediction and genome-wide association studies for additive and dominance effects for body composition traits using 50 K and imputed high-density SNP genotypes in Yunong-black pigs[J].J Anim Breed Genet,2023,doi:10.1111/jbg.12830.
[70] HAYES B J,COPLEY J,DODD E,et al.Multi-breed genomic evaluation for tropical beef cattle when no pedigree information is available[J].Genet Sel Evol,2023,55(1):71.
[71] SUTERA A M,TOLONE M,MASTRANGELO S,et al.Detection of genomic regions underlying milk production traits in Valle del Belice dairy sheep using regional heritability mapping[J].J Anim Breed Genet,2021,138(5):552-561.
[72] MOGHADDAR N,BROWN D J,SWAN A A,et al.Genomic prediction in a numerically small breed population using prioritized genetic markers from whole-genome sequence data[J].J Anim Breed Genet,2021,139(1):71-83.
(編輯 郭云雁)