代力強(qiáng),吳 律,董青松,閆 鴿,曲 靜,王丕武
(吉林農(nóng)業(yè)大學(xué) 農(nóng)學(xué)院,吉林 長(zhǎng)春130118)
粒長(zhǎng)是玉米產(chǎn)量性狀遺傳改良的主要目標(biāo)之一。選擇相對(duì)較長(zhǎng)的玉米籽粒,對(duì)提高玉米的單產(chǎn)水平具有重要意義。已有的研究表明,籽粒長(zhǎng)度是高度遺傳的數(shù)量性狀,受環(huán)境的影響較小[1-3]。2005年樊慶琦等[4]采用多世代聯(lián)合分析方法對(duì)普通玉米籽粒長(zhǎng)度進(jìn)行遺傳分析,認(rèn)為玉米粒長(zhǎng)表現(xiàn)為主基因+多基因的混合遺傳,只是在不同遺傳背景的材料中控制籽粒長(zhǎng)度的主基因數(shù)目表現(xiàn)出一定的差異。2011年P(guān)eng等[5]對(duì)2個(gè)F2:3玉米家系群體的研究結(jié)果顯示,不同基因型玉米的粒長(zhǎng)間存在著極顯著差異,廣義遺傳力最高可達(dá)到0.89,表明該性狀主要受到遺傳因素的控制。2012年Macke[6]對(duì)12個(gè)美國(guó)玉米自交系及其雜交后代進(jìn)行研究,認(rèn)為玉米粒長(zhǎng)性狀的基因效應(yīng)以加性為主并具有較高的遺傳力,后代選擇有效。所以在組配籽粒較深且產(chǎn)量高的玉米雜交種時(shí),可選擇粒長(zhǎng)較長(zhǎng)的玉米自交系。然而,控制玉米籽粒生長(zhǎng)發(fā)育的因素較多且復(fù)雜,粒長(zhǎng)發(fā)育形成的遺傳機(jī)制尚不明確,還需進(jìn)一步對(duì)其分子機(jī)理進(jìn)行研究并找到相關(guān)的主效基因。
目前,科學(xué)家主要應(yīng)用SSR和SNP等分子標(biāo)記技術(shù)對(duì)玉米粒長(zhǎng)性狀進(jìn)行QTL定位。2012年曹曉良等[7]以“農(nóng)系531”和“SIL8”雜交所衍生的200個(gè)F2:3家系為作圖群體,利用238對(duì)SSR標(biāo)記共定位得到3個(gè)玉米粒長(zhǎng)的QTL位點(diǎn),最高可解釋17.34%的表型貢獻(xiàn)率。2014年Zhang等[8]利用SSR標(biāo)記技術(shù)對(duì)243個(gè)永久F2代自交系進(jìn)行遺傳作圖,經(jīng)過(guò)兩年兩點(diǎn)的試驗(yàn)共檢測(cè)出4個(gè)控制玉米粒長(zhǎng)發(fā)育的QTL,這些位點(diǎn)分布在第3、第5和第10號(hào)染色體上。2016年Chen等[9]采用GBS簡(jiǎn)易基因組測(cè)序技術(shù)對(duì)173個(gè)重組自交系進(jìn)行基因分型,在6個(gè)環(huán)境下共定位得到4個(gè)玉米粒長(zhǎng)的QTL,解釋的表型變異率在6.2%~8.0%。2016年Qin等[10]以Mo17和黃早四雜交所衍生的3個(gè)回交群體作為研究對(duì)象,利用SSR標(biāo)記對(duì)之前得到的粒長(zhǎng)QTL進(jìn)行精細(xì)定位,結(jié)果顯示,主效qKL1.07位點(diǎn)的遺傳距離已縮小至1.6 Mb,為進(jìn)一步挖掘相關(guān)的功能基因提供了依據(jù)。
盡管上述研究獲得了大量控制玉米粒長(zhǎng)性狀的數(shù)量性狀位點(diǎn)。但由于受到標(biāo)記密度的影響,所檢測(cè)到的QTL置信區(qū)間仍然較大,給后續(xù)功能基因的發(fā)掘帶來(lái)了很大困難。所以,本研究采用第2代測(cè)序技術(shù)對(duì)80個(gè)核心玉米自交系進(jìn)行基因組重測(cè)序,利用得到的高密度SNP標(biāo)記對(duì)玉米籽粒長(zhǎng)度的全基因組進(jìn)行關(guān)聯(lián)分析,篩選與粒長(zhǎng)顯著關(guān)聯(lián)的SNP,深度挖掘玉米種質(zhì)中控制粒長(zhǎng)發(fā)育的優(yōu)異等位基因,為分子標(biāo)記輔助選擇籽粒長(zhǎng)、產(chǎn)量高的玉米材料及克隆相關(guān)的功能基因奠定基礎(chǔ)。
本研究收集并篩選了80個(gè)核心玉米自交系作為關(guān)聯(lián)群體,主要包含了在吉林省玉米育種中應(yīng)用較多的自交系和近5年來(lái)在東北推廣面積較大的玉米雜交種親本。這些自交系的名稱及系譜來(lái)源見(jiàn)表1。在2014年和2015年分別將其種植在吉林省長(zhǎng)春市和梅河口市。采用完全隨機(jī)區(qū)組設(shè)計(jì),3行區(qū),行長(zhǎng)3 m,行距0.65 m,株距20 cm,設(shè)3次重復(fù),兩年的田間管理相同。
表1 80個(gè)核心玉米自交系的名稱及系譜來(lái)源Table 1 Names and pedigree sources of 80 elite inbred lines
表1(續(xù)) Contiued table 1
當(dāng)玉米達(dá)到完熟期后每小區(qū)隨機(jī)摘取10個(gè)果穗,風(fēng)干后考種。按照以下公式計(jì)算玉米籽粒長(zhǎng)度:粒長(zhǎng)(cm)=(穗粗-軸粗)/2。其中穗粗和軸粗均為果穗中部的測(cè)量結(jié)果,每個(gè)果穗重復(fù)測(cè)量3次。各小區(qū)的粒長(zhǎng)平均值用于后續(xù)的統(tǒng)計(jì)分析。
使用SPSS 19.0(IBM Corp.,Armonk,NY,USA)軟件分別對(duì)粒長(zhǎng)數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)分析、方差分析和相關(guān)分析。按照Knapp等[11]提出的公式計(jì)算廣義遺傳力。
采用康為世紀(jì)植物基因組DNA提取試劑盒提取80個(gè)玉米自交系葉片基因組DNA。用1%瓊脂糖凝膠電泳、NanoDrop1000檢測(cè)DNA質(zhì)量,合格的DNA樣品用于構(gòu)建基因組文庫(kù),并利用Illumina Hiseq PE150進(jìn)行測(cè)序。將獲得的高質(zhì)量測(cè)序數(shù)據(jù)通過(guò)BWA軟件[12]比對(duì)到玉米自交系B73的參考基因組RefGen_v3(ftp://ftp.ensemblgenomes.org/pub/plants/release-29/fasta/zea_mays/dna/)上,比對(duì)結(jié)果經(jīng)SAMTOOLS軟件[13]去除重復(fù),并利用貝葉斯模型進(jìn)行群體SNP的檢測(cè)。采用最小等位基因頻率≥0.05、SNP檢測(cè)缺失率<0.1等過(guò)濾條件進(jìn)行篩選,最終獲得1 490 007個(gè)高質(zhì)量的SNP,用于后續(xù)的全基因組關(guān)聯(lián)分析。
應(yīng)用軟件PLINK[14],通過(guò)LD測(cè)量參數(shù)r2(r2≥0.1)計(jì)算關(guān)聯(lián)群體全基因組的平均LD衰減距離。運(yùn)用FarmCPU方法[15]對(duì)高質(zhì)量的SNP標(biāo)記與籽粒長(zhǎng)度數(shù)據(jù)間進(jìn)行全基因組關(guān)聯(lián)分析,其中關(guān)聯(lián)群體的親緣關(guān)系與5個(gè)代表群體結(jié)構(gòu)的最大主成分,分別隨機(jī)選取10% 的SNP標(biāo)記,運(yùn)用GAPIT軟件[16]進(jìn)行計(jì)算。采用Bonferroni法[17]對(duì)多重假設(shè)檢驗(yàn)得到的P值進(jìn)行校正,用以降低假陽(yáng)性關(guān)聯(lián)結(jié)果,最終確定當(dāng)-lgP≥6時(shí),判定SNP標(biāo)記與玉米粒長(zhǎng)性狀關(guān)聯(lián)顯著。在顯著性SNP位點(diǎn)的LD范圍內(nèi)(本試驗(yàn)所用關(guān)聯(lián)群體平均LD衰減距離為5.2 kb)對(duì)控制粒長(zhǎng)發(fā)育的候選基因進(jìn)行掃描。候選基因的注釋功能及相關(guān)信息參照玉米遺傳學(xué)及基因組學(xué)數(shù)據(jù)庫(kù)(http://www.maizegdb.org/)和美國(guó)國(guó)立生物技術(shù)信息中心網(wǎng)站(http://www.ncbi.nlm.nih.gov/)。
如表2所示,在2014年和2015年不同地點(diǎn)種植玉米自交系的籽粒長(zhǎng)度變異范圍在0.56~1.14 cm,標(biāo)準(zhǔn)差分別為0.11,0.15,0.12和0.14,說(shuō)明玉米籽粒長(zhǎng)度的遺傳變異較大。通過(guò)方差分析得到的F值顯示,不同玉米自交系的粒長(zhǎng)間達(dá)到極顯著差異水平(P<0.01);基因型與環(huán)境互作方差為0.023(P<0.01)。利用Knapp等[11]提出的公式計(jì)算玉米籽粒長(zhǎng)度的廣義遺傳力為83.67%,與前人的研究結(jié)果[2,5,18]相近,說(shuō)明該性狀可以有效地通過(guò)表型進(jìn)行選擇。Pearson相關(guān)分析表明,不同環(huán)境下的玉米籽粒長(zhǎng)度間達(dá)到極顯著正相關(guān)(P<0.01)。
表2 80份玉米自交系籽粒長(zhǎng)度的統(tǒng)計(jì)分析Table 2 Statistics of kernel lengths of 80 elite maize inbred lines in two years
注:**表示在P=0.01水平顯著。
Note: **indicates significance atP=0.01.
利用重測(cè)序得到的1 490 007個(gè)高質(zhì)量的SNP標(biāo)記對(duì)玉米粒長(zhǎng)關(guān)聯(lián)群體全基因組的LD進(jìn)行估計(jì)。如圖1所示,當(dāng)r2=0.1時(shí),關(guān)聯(lián)群體全基因組的平均LD衰減距離約為5.2 kb,該結(jié)果小于已有研究得到的LD長(zhǎng)度[19-20],說(shuō)明本研究所用的關(guān)聯(lián)群體具有較快的LD衰減速率。
圖1 玉米粒長(zhǎng)關(guān)聯(lián)群體全基因組范圍內(nèi)的連鎖不平衡衰減Fig.1 Linkage disequilibrium decay across whole genome of maize kernel length association panels
本研究采用FarmCPU方法對(duì)80個(gè)玉米自交系的籽粒長(zhǎng)度進(jìn)行全基因組關(guān)聯(lián)分析,結(jié)果顯示除了2014年在長(zhǎng)春未檢測(cè)到與目標(biāo)性狀顯著關(guān)聯(lián)的標(biāo)記外,其余3個(gè)環(huán)境下共檢測(cè)到16個(gè)與玉米粒長(zhǎng)顯著關(guān)聯(lián)(P<10-6)的SNP(圖2)。這些標(biāo)記分布在第1、第2、第3、第7和第10號(hào)染色體上,解釋的表型變異率在1.68%~27.61% (表3),其中位于染色體框10.03的SNP解釋的表型變異率最低,而位于染色體框3.04物理位置為74171556的SNP解釋的表型變異率最高,達(dá)到27.61%。同樣位于染色體框3.04,物理位置為110936416的SNP標(biāo)記在2015年的2個(gè)地點(diǎn)均被檢測(cè)到,且該標(biāo)記在長(zhǎng)春環(huán)境下具有最小的P值,說(shuō)明其與籽粒長(zhǎng)度關(guān)聯(lián)最顯著。
表3 與玉米籽粒長(zhǎng)度顯著關(guān)聯(lián)的SNP位點(diǎn)(P<10-6)Table 3 SNPs identified to be associated with maize kernel length (P<10-6)
注:已有研究中定位的粒長(zhǎng)QTL與本研究檢測(cè)到的顯著性SNP具有一致性。
Note: There exists consistency between significant SNPs and QTL interval reported in previous studies.
在5.2 kb的連鎖不平衡范圍內(nèi),對(duì)16個(gè)與玉米粒長(zhǎng)顯著關(guān)聯(lián)(P<10-6)的SNP位點(diǎn)進(jìn)行掃描分析,共得到3個(gè)候選基因(表3),其中GRMZM2G018607和GRMZM2G034882的基因座內(nèi)各包含1個(gè)顯著性SNP,它們均位于基因的外顯子區(qū)域且為同義突變?;騁RMZM2G018607的編碼產(chǎn)物是一個(gè)ABCF4轉(zhuǎn)運(yùn)蛋白(ABC transporter F family member 4),該蛋白質(zhì)包含ABCF_EF-3和ABC_tran_Xtn 2種結(jié)構(gòu)域,可能參與調(diào)節(jié)應(yīng)激相關(guān)蛋白的翻譯合成過(guò)程[23]?;騁RMZM2G034882預(yù)測(cè)編碼1種WIP2互作蛋白(WPP domain-interacting protein 2),這種產(chǎn)物作為植物特有的外層核膜蛋白,在將RanGAP錨定在核膜上及維護(hù)細(xì)胞核形態(tài)的過(guò)程中發(fā)揮作用[24-25]?;騁RMZM2G322641編碼1個(gè)含DUF2346結(jié)構(gòu)域的蛋白質(zhì),目前該蛋白家族成員的生物學(xué)功能還未知。
關(guān)聯(lián)群體的連鎖不平衡水平不僅決定了全基因組關(guān)聯(lián)分析的定位精度,而且對(duì)所選用的標(biāo)記數(shù)量、密度以及所采取的試驗(yàn)方案等都會(huì)產(chǎn)生較大影響。2013年劉化龍等[26]研究認(rèn)為,種質(zhì)資源的連鎖不平衡與其地理起源密切相關(guān),群體遺傳進(jìn)化上的差異最終導(dǎo)致了LD的差異。2013年Romay等[19]利用681 257個(gè)SNP標(biāo)記對(duì)2 815份來(lái)自美國(guó)玉米種質(zhì)資源庫(kù)的自交系進(jìn)行了連鎖不平衡分析,結(jié)果顯示當(dāng)r2=0.1時(shí),整個(gè)群體的LD衰減距離在10 kb左右,其中熱帶玉米種質(zhì)的LD接近于整個(gè)群體的連鎖不平衡水平,而其他SS、NSS和ExPVP群體的LD衰減距離則達(dá)到50 kb以上。2012年Wang等[20]以144份我國(guó)玉米雜交種親本作為研究群體,采用45 868個(gè)SNP對(duì)其全基因組的連鎖不平衡進(jìn)行分析,認(rèn)為關(guān)聯(lián)群體的平均LD衰減距離在200 kb左右,其中衰減最慢的染色體甚至達(dá)到了750 kb。該結(jié)果遠(yuǎn)大于本研究得到的5.2 kb的衰減距離,這可能是由于前者所選擇的親本自交系群體中基因或染色體片段受到的選擇強(qiáng)度較大所致;另外,本試驗(yàn)采用的核心玉米自交系數(shù)量小于上述研究,供試種質(zhì)的遺傳構(gòu)成較復(fù)雜,這也可能是導(dǎo)致群體LD衰減較快的另一個(gè)主要原因。
自2011年Tian等[27]將全基因組關(guān)聯(lián)分析用于玉米莖葉夾角的定位研究以來(lái),該技術(shù)在玉米主要病害、開花期和抗逆性等其他復(fù)雜性狀的遺傳解析中也得到了廣泛應(yīng)用[28-30]。本研究采用FarmCPU方法對(duì)由80個(gè)核心玉米自交系組成的關(guān)聯(lián)群體進(jìn)行了全基因組關(guān)聯(lián)分析,在4個(gè)環(huán)境下共檢測(cè)到16個(gè)與玉米粒長(zhǎng)顯著關(guān)聯(lián)(P<10-6)的SNP標(biāo)記。這些位點(diǎn)中有7個(gè)位于前人已定位的粒長(zhǎng)QTL置信區(qū)間內(nèi)[7,21-22]。其中位于染色體框7.02(物理位置為96607424和111201213)、10.04(物理位置為124464498)及3.04(物理位置為74171556)的4個(gè)顯著性SNP與Chen等[21]定位的籽粒長(zhǎng)度QTL具有一致性;位于染色體框7.02,10.03(物理位置為37333210)和10.04的4個(gè)顯著性SNP,與陳哲等[22]利用176個(gè)F2:3家系為作圖群體定位的結(jié)果相吻合。2012年曹曉良等[7]利用1個(gè)F2:3分離群體在umc1917-umc1603處定位到粒長(zhǎng)的QTL,本研究檢測(cè)到的位于染色體框1.05的2個(gè)顯著性SNP也在該區(qū)間的物理位置內(nèi)。另外,2009年李永祥等[31]對(duì)玉米籽粒構(gòu)型性狀與產(chǎn)量性狀進(jìn)行相關(guān)性分析得出,玉米粒長(zhǎng)與單穗產(chǎn)量的相關(guān)系數(shù)最高,達(dá)到了0.64,說(shuō)明籽粒長(zhǎng)度對(duì)玉米產(chǎn)量具有較大的貢獻(xiàn)。所以,本研究對(duì)這16個(gè)顯著性SNP與前人定位的產(chǎn)量性狀QTL[32-36]進(jìn)行比對(duì),發(fā)現(xiàn)除了位于染色體框3.08及10.03的3個(gè)SNP外,其余的標(biāo)記位點(diǎn)均位于已有產(chǎn)量性狀的QTL置信區(qū)間內(nèi),說(shuō)明控制這2個(gè)性狀的基因可能存在連鎖關(guān)系,或者在這些染色體熱點(diǎn)區(qū)域有控制玉米產(chǎn)量及籽粒長(zhǎng)度的多效基因存在。
近年來(lái),盡管研究者利用不同的分子標(biāo)記技術(shù)定位了較多的控制玉米籽粒構(gòu)型性狀的數(shù)量性狀位點(diǎn)[7-10],但從這些位點(diǎn)中挖掘控制玉米粒長(zhǎng)的功能基因還未見(jiàn)報(bào)道。本研究對(duì)16個(gè)與玉米籽粒長(zhǎng)度顯著關(guān)聯(lián)(P<10-6)的SNP位點(diǎn)進(jìn)行掃描分析,共得到3個(gè)候選基因?;騁RMZM2G018607編碼一個(gè)ABCF4轉(zhuǎn)運(yùn)蛋白,該產(chǎn)物與ABC轉(zhuǎn)運(yùn)蛋白家族的其他成員有所不同,僅位于細(xì)胞質(zhì)中,蛋白質(zhì)無(wú)跨膜區(qū)域,因而不具有轉(zhuǎn)運(yùn)功能[37]。2011年Zeng等[23]對(duì)scord5和ila-3 2種擬南芥突變體進(jìn)行研究得出,ABCF家族蛋白AtABCF3是細(xì)菌觸發(fā)氣孔關(guān)閉反應(yīng)的重要組成部分,它可能在氣孔關(guān)閉的早期反應(yīng)通路中通過(guò)調(diào)節(jié)應(yīng)激相關(guān)蛋白的翻譯合成而發(fā)揮作用?;騁RMZM2G034882預(yù)測(cè)編碼一種含有SMC_prok_A結(jié)構(gòu)域的WIP2互作蛋白,它通過(guò)與特定的內(nèi)層核膜蛋白進(jìn)行互作,從而將其本身及RanGAP固定在核膜上,之后RanGAP催化RanGTPase對(duì)結(jié)合的GTP進(jìn)行快速水解,精確調(diào)控核質(zhì)間RanGTP和RanGDP的濃度梯度,有效促進(jìn)細(xì)胞內(nèi)的核質(zhì)運(yùn)輸、紡錘體組裝、核膜重建和異染色質(zhì)的組裝等[38-39]。2012年Zhou等[25]對(duì)3種wip擬南芥突變體的葉片表皮細(xì)胞進(jìn)行DAPI熒光成像觀察得出,與野生型植株相比,突變體葉片表皮細(xì)胞的細(xì)胞核長(zhǎng)度顯著降低,說(shuō)明WIP2互作蛋白在維持細(xì)胞核特定形態(tài)的過(guò)程中也扮演著重要角色。基因GRMZM2G322641編碼一個(gè)含有DUF2346結(jié)構(gòu)域的未知功能蛋白。通過(guò)對(duì)其cDNA序列進(jìn)行BLAST分析,結(jié)果顯示在水稻、高粱和谷子等主要農(nóng)作物的基因組中均發(fā)現(xiàn)GRMZM2G322641的直系同源基因,說(shuō)明該基因的存在比較普遍,其生物學(xué)功能及參與的代謝途徑還需要進(jìn)一步驗(yàn)證研究。
候選基因的鑒定與所用的關(guān)聯(lián)群體和多態(tài)性標(biāo)記密度有直接關(guān)系。在不同的關(guān)聯(lián)群體中等位基因頻率有所差異,這種差異可能導(dǎo)致在特定基因組區(qū)域中多態(tài)性位點(diǎn)的不一致,從而使關(guān)聯(lián)分析的結(jié)果不同[40]。另外,隨著高通量測(cè)序技術(shù)的快速發(fā)展,應(yīng)用不同測(cè)序技術(shù)獲得的多態(tài)性信息含量差異較大,較高的標(biāo)記密度在解析玉米復(fù)雜性狀的遺傳結(jié)構(gòu)時(shí)具有更好的分辨率。所以,本研究采用第二代測(cè)序技術(shù)對(duì)由80個(gè)核心玉米自交系組成的關(guān)聯(lián)群體進(jìn)行重測(cè)序,經(jīng)過(guò)全基因組關(guān)聯(lián)分析共得到3個(gè)候選基因,其可能與玉米籽粒長(zhǎng)度緊密相關(guān),為進(jìn)一步研究玉米粒長(zhǎng)的遺傳機(jī)理奠定了前期基礎(chǔ)。
西北農(nóng)林科技大學(xué)學(xué)報(bào)(自然科學(xué)版)2018年6期