劉其寶,李黎貝,張馳,宿俊吉,魏恒玲,王寒濤,喻樹迅
(中國農(nóng)業(yè)科學(xué)院棉花研究所/棉花生物學(xué)國家重點(diǎn)實(shí)驗(yàn)室,河南安陽 455000)
作物遺傳育種·種質(zhì)資源·分子遺傳學(xué)
陸地棉葉片葉綠素含量與SSR標(biāo)記的關(guān)聯(lián)分析及優(yōu)異等位變異的挖掘
劉其寶,李黎貝,張馳,宿俊吉,魏恒玲,王寒濤,喻樹迅
(中國農(nóng)業(yè)科學(xué)院棉花研究所/棉花生物學(xué)國家重點(diǎn)實(shí)驗(yàn)室,河南安陽 455000)
【目的】篩選與陸地棉葉片葉綠素含量性狀相關(guān)聯(lián)的分子標(biāo)記,挖掘其優(yōu)異等位變異及典型材料,為陸地棉分子標(biāo)記輔助育種提供技術(shù)支持?!痉椒ā吭?年6個(gè)環(huán)境中,對185份陸地棉品種(系)組成的自然群體進(jìn)行倒4葉葉綠素相對含量(soil and plant analyzer development,SPAD)的測定,每年分3個(gè)時(shí)期(打頂后0、10和 20 d)。采用 PowerMarker 3.25軟件計(jì)算各位點(diǎn)的多態(tài)性信息含量,以分析群體的遺傳多樣性。利用STRUCTURE 2.3.4軟件計(jì)算群體結(jié)構(gòu)矩陣(Q),利用TASSEL 3.0軟件計(jì)算親屬關(guān)系矩陣(K),通過GLM(general linear model,Q)和MLM(mixed linear model,Q+K)2種方法,同時(shí)對SPAD與SSR標(biāo)記進(jìn)行關(guān)聯(lián)分析。依據(jù)計(jì)算的等位位點(diǎn)表型效應(yīng)值,挖掘優(yōu)異的等位變異及典型材料。【結(jié)果】137對SSR多態(tài)性引物共擴(kuò)增出355個(gè)等位變異,平均每對引物擴(kuò)增到2.6個(gè)多態(tài)性位點(diǎn),PIC平均值為0.67,變化范圍為0.01—0.95,高度多態(tài)性引物(PIC>0.5)占85%,其中PIC最高的標(biāo)記為HAU2146(PIC=0.95)和NAU2083(PIC=0.93)。當(dāng)ΔK取得最大值時(shí),K=2,因此,將185份陸地棉材料劃分為2個(gè)亞群。通過GLM方法共檢測到22個(gè)顯著性位點(diǎn)(P<0.001),表型變異解釋率為5.28%—10.85%,平均為7.24%,貢獻(xiàn)率最高的等位變異位點(diǎn)是SWU0529a(R2=10.85%)和NAU998c(R2=10.48%);通過MLM方法共檢測到17個(gè)顯著性位點(diǎn)(P<0.01),表型變異解釋率為3.72%—8.58%,平均為4.72%,貢獻(xiàn)率最高的等位變異位點(diǎn)是SWU0923b(R2=8.06%)和SWU0662d(R2=6.74%);2種方法共同檢測到的顯著性位點(diǎn)有12個(gè),等位變異NAU998c在3個(gè)時(shí)期2種方法能同時(shí)被檢測到。通過等位變異的表型效應(yīng)分析,找到2個(gè)增效效應(yīng)最大的等位變異(HAU3318b和SWU0987b),利用找到的等位變異對材料進(jìn)行篩選,獲得攜帶2個(gè)增效效應(yīng)等位變異的材料53份,2個(gè)增效效應(yīng)位點(diǎn)都未檢測到的材料有46份,統(tǒng)計(jì)結(jié)果顯示,在打頂后10和20 d 2個(gè)時(shí)期,53份材料的SPAD均值顯著高于46份材料的SAPD均值?!窘Y(jié)論】檢測到12個(gè)與SPAD值相關(guān)的顯著性位點(diǎn),并挖掘到2個(gè)增效效應(yīng)優(yōu)異等位變異,獲得攜帶優(yōu)異等位變異的載體材料53份,獲得攜帶2個(gè)優(yōu)異等位變異的典型材料1份。
陸地棉;葉綠素;SSR;關(guān)聯(lián)分析;優(yōu)異等位變異
Abstract:【Objective】The objective of this study is to detect the SSR markers associated with leaf chlorophyll content and explore the alleles and their typical materials in upland cotton. The results will be helpful for molecular marker-assisted breeding.【Method】The natural population including 185 upland cotton accessions were planted at two different places in 3 years and the dataof leaf chlorophyll content were recorded at 3 stages (0, 10 and 20 days after topping) every year. In analysis the polymorphism information of population structure, Power Marker 3.25 software was used to estimate the polymorphism information content (PIC).The structure of the natural population was analyzed using STRUCTURE 2.3.4 software and the kinship was estimated using TASSEL 3.0 software. Then the data were associated with 137 SSR markers by GLM (general linear model, Q) and MLM (mixed linear model, Q+K). The superior alleles were exploited and the phenotypic effects of total alleles were found.【Result】 Totally 355 polymorphic alleles were found with 137 SSR markers and 2.6 alleles were revealed with each marker in average ranged from 0.01-0.95. The 85% of total alleles were highly polymorphic primers (PIC>0.5). HAU2146 (PIC=0.95) and NAU2083 (PIC=0.93)kept the maximum PIC. According to the results of STRUCTURE software, K value was 2 when ΔK was the max so the cultivars were divided into 2 populations. A total of 22 alleles found by GLM method significantly at the level of P<0.001 which explained 5.28%-10.85% of the phenotypic variance and the mean value was 7.24%. SWU0529a (R2=10.85%) and NAU998c (R2=10.48%)kept the max value. Meanwhile, 17 alleles were found by MLM method significantly at the level of P<0.01 which explained 3.72%-8.58% of the phenotypic variance and the mean value was 4.72%. SWU0923b (R2=8.06%) and SWU0662d (R2=6.74%)kept the max value. A total of 12 alleles were revealed by GLM method and MLM method in common, and NAU998c was significantly at 3 stages by GLM and MLM methods. Two positive alleles (HAU3318b and SWU0987b) were revealed over the estimated phenotypic effects. The 53 carrier materials of two positive alleles kept higher SPAD value in average than the 46 materials carried none of two positive alleles in 10 and 20 days after topping.【Conclusion】A total of 12 alleles associated significantly with leaf chlorophyll of upland cotton were found, and then two positive superior alleles, 53 carrier materials and one typical materials were revealed.
Key words:upland cotton; chlorophyll; SSR; association analysis; superior allele
【研究意義】棉花是中國重要的經(jīng)濟(jì)作物之一,改善棉花光合作用和延緩棉花衰老是提高棉花產(chǎn)量的有效途徑。而葉片的葉綠素含量既能直接影響棉花的光合效率,也是衡量棉花衰老程度的重要指標(biāo)[1]。有研究表明,植株衰老階段的葉綠素降解特征,是影響作物高產(chǎn)的重要指標(biāo)之一[2-3]。因此,對棉花葉片葉綠素含量相關(guān)的QTL位點(diǎn)進(jìn)行基因定位,挖掘其優(yōu)異等位變異,對發(fā)展棉花高產(chǎn)育種具有重要意義。【前人研究進(jìn)展】目前,連鎖分析已經(jīng)應(yīng)用于棉花葉綠素含量相關(guān)的QTL定位研究。SONG等[4]、SARANGA等[5]分別通過海陸雜交組合BC群體和F2群體各檢測到2個(gè)和7個(gè)葉綠素含量相關(guān)的QTL;宋美珍[6]用葉綠素含量等生化指標(biāo)研究短季棉早熟不早衰的遺傳機(jī)制,發(fā)現(xiàn)早熟不早衰類型的親本的葉綠素含量高于早衰類型,并檢測到4個(gè)葉綠素含量相關(guān)的QTL;秦鴻德等[7]用四交分離作圖群體的 F2:3家系對棉花葉綠素含量進(jìn)行分析,檢測到 3個(gè)與葉綠素含量相關(guān)的QTL,認(rèn)為其遺傳效應(yīng)以加性效應(yīng)為主;張建等[8]在陸地棉重組近交家系F2:7群體中,檢測到4個(gè)與葉綠素質(zhì)量分?jǐn)?shù)相關(guān)的QTL;鄭巨云等[9]、戎福喜等[10]分別用陸地棉F2:3家系和海陸滲透系構(gòu)建的群體各檢測到1個(gè)與葉綠素含量相關(guān)的QTL。【本研究切入點(diǎn)】近年來,關(guān)聯(lián)分析(association analysis)的方法被廣泛用于植物數(shù)量性狀QTL研究中,如擬南芥[11]、水稻[12]、玉米[13-14]等。與傳統(tǒng)的連鎖分析相比,關(guān)聯(lián)分析以自然群體為材料,構(gòu)建周期短,可以檢測到同一座位的多個(gè)等位基因,定位精確[15-16]。NIE等[17]、SU等[18-20]通過全基因組關(guān)聯(lián)分析(genome-wide association study,GWAS)的方法對棉花相關(guān)農(nóng)藝性狀進(jìn)行了基因定位,表明在棉花中運(yùn)用關(guān)聯(lián)分析對數(shù)量性狀進(jìn)行基因定位是一種非常有效的方法。但是利用關(guān)聯(lián)分析對棉花葉綠素含量進(jìn)行基因定位的研究仍鮮見報(bào)道。【擬解決的關(guān)鍵問題】以185份陸地棉品種(系)構(gòu)成的自然群體為材料,選用137對多態(tài)性引物,對3年6個(gè)環(huán)境中的棉花倒4葉葉綠素相對含量進(jìn)行關(guān)聯(lián)分析,并挖掘與葉片葉綠素含量相關(guān)的優(yōu)異等位變異,以期為棉花分子標(biāo)記輔助育種提供技術(shù)支持。
試驗(yàn)選取185份陸地棉材料組成自然群體[20](表1),于2013年和2014年在中國農(nóng)業(yè)科學(xué)院棉花研究所安陽試驗(yàn)站種植,各設(shè)置2個(gè)播期(春播和夏播),播種日期分別為2013年4月26日、2013年5月23日、2014年5月1日和2014年5月25日;2016年設(shè)置安陽和黃岡2個(gè)種植點(diǎn),播種日期分別為2016年4月25日和2016年4月17日。試驗(yàn)采用常規(guī)田間管理,完全隨機(jī)區(qū)組試驗(yàn)設(shè)計(jì),設(shè)置3個(gè)重復(fù)。
表1 185份陸地棉材料來源Table 1 The origin regions of 185 upland cotton accessions
從棉花打頂后第一天開始,使用葉綠素計(jì)(SPAD-502Plus,Konica Minoita,Japan)測定 185份陸地棉材料倒 4葉的葉綠素相對含量(SAPD),每個(gè)重復(fù)材料每10 d測量一次,共測量3次(打頂后0、10和20 d)。具體測量方法為每個(gè)材料隨機(jī)選取5株,每株測量3次,取測量的平均值作為該材料的葉綠素相對含量。
采用改良的CTAB法[21]提取棉花幼嫩葉片的基因組 DNA。從 CMD(Cottonmarker database)數(shù)據(jù)庫(http://www.cottonmarker.org)選取 137對均勻覆蓋陸地棉26條染色體的SSR引物[22]進(jìn)行群體擴(kuò)增,所有引物由生工生物工程(上海)股份有限公司合成。PCR反應(yīng)體系為模板DNA 30 ng、10×PCR buffer 1.0 μL、10 mmol·L-1dNTP 0.2 μL、10 mmol·L-1SSR 引物 2 μL、5 U·μL-1Taq DNA 聚合酶,加 ddH2O 補(bǔ)足 10 μL。Taq聚合酶和dNTP均購自北京全式金生物技術(shù)有限公司。PCR反應(yīng)程序?yàn)?5℃ 5 min;94℃ 30 s,58℃ 45 s,45 s,29個(gè)循環(huán);72℃ 10 min;10℃保存。擴(kuò)增產(chǎn)物用濃度 8%的聚丙烯酰胺凝膠電泳分離,并參考張軍等[23]方法進(jìn)行銀染。
1.4.1 SSR標(biāo)記分析 根據(jù) SSR擴(kuò)增產(chǎn)物的電泳結(jié)果,用0,1讀帶法進(jìn)行帶型統(tǒng)計(jì),遷移率相同的帶記為1,無帶記為0;不同基因型,用小寫字母a、b、c等區(qū)分。
1.4.2 多態(tài)性信息含量(polymorphism information content,PIC)分析 根據(jù)SSR擴(kuò)增產(chǎn)物的帶型統(tǒng)計(jì)結(jié)果,采用Power Maker V3.25軟件[24]計(jì)算各位點(diǎn)的多態(tài)性信息含量(PIC),并用Excel表格進(jìn)行統(tǒng)計(jì)分析。
1.4.3 群體結(jié)構(gòu)分析 采用STRUCTURE 2.3.4軟件[25]進(jìn)行群體結(jié)構(gòu)分析,同時(shí)計(jì)算每個(gè)材料的Q值(即第i個(gè)材料基因變異源于第K個(gè)亞群的概率),以備后續(xù)關(guān)聯(lián)分析。參數(shù)設(shè)置為:K值范圍為 1—10,重復(fù)10次;MCMC(Markov Chain Monte Carlo)的2個(gè)參數(shù)分別設(shè)為50 000次和100 000次。由于STRUCTURE軟件得的原始數(shù)據(jù)不能很直觀地確定 K值,因此,需要計(jì)算K值的對數(shù)變化率ΔK來更為準(zhǔn)確地判斷K值[26]。通過 StructureHarves(http://taylor0.biology.ucla.edu/structureHarvester/)在線工具[27]收集 STRUCTURE軟件產(chǎn)生的結(jié)果,并作ΔK的變化規(guī)律圖,以此確定合適的群體數(shù)目,同時(shí)得到該K值下的Q矩陣。
1.4.4 表型數(shù)據(jù)分析 采用R語言的ANOVA方法對表型數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)分析,運(yùn)用 R語言的‘lme4’包[28]計(jì)算SPAD在3個(gè)不同時(shí)期的遺傳力。
1.4.5 關(guān)聯(lián)分析 運(yùn)用TASSEL 3.0軟件[29]提供的一般線性模型(general linear model,GLM)和混合線性模型(mixed liner model,MLM)2種方法分別對 3個(gè)時(shí)期的SAPD均值和SSR標(biāo)記進(jìn)行關(guān)聯(lián)分析。GLM分析需要的Q矩陣來自STRUCTURE軟件的結(jié)果,MLM分析中需要的Kinship矩陣由TASSEL軟件計(jì)算得到。
參考 BRESEGHELLO等[30]的方法,通過等位位點(diǎn)與無效等位變異(null allele)相比較,判斷該等位位點(diǎn)的表型效應(yīng)。SSR位點(diǎn)等位變異表型效應(yīng)的計(jì)算公式為:
其中,ai代表第 i個(gè)等位變異的表型效應(yīng)值,xij為攜帶第i個(gè)等位變異的第j材料性狀表型測定值,ni為具有第i等位變異的材料數(shù)目,Nk為攜帶無效等位變異的第k個(gè)材料的表型測定值,nk為具有無效等位變異的材料數(shù)目。若ai值為正,則認(rèn)為該等位變異為增效等位變異,反之為減效等位變異[31]。
對185份陸地棉材料在3個(gè)時(shí)期(打頂后0、10和20 d)及各自6個(gè)環(huán)境中的SPAD進(jìn)行方差分析(表2)。在3個(gè)不同的測定時(shí)期,SPAD的平均值分布范圍分別為46.50—55.01、46.02—55.80和42.90—52.86,標(biāo)準(zhǔn)差分別為2.45—3.63、2.51—4.94和3.10—6.91,極差分別為 13.07—19.50、13.17—21.67和 15.37—30.90。在各個(gè)測定時(shí)期內(nèi),6個(gè)環(huán)境的葉綠素相對含量均呈極顯著正相關(guān)(P<0.01),說明葉綠素含量在多個(gè)環(huán)境下重復(fù)性較好。雖然3個(gè)時(shí)期SPAD平均值變化不大,但是標(biāo)準(zhǔn)差和極差都隨測著測定時(shí)期的推移依次增大,說明越到后期,棉花品種間葉綠素含量的差異越明顯。3個(gè)時(shí)期的偏度和峰度都比較小,符合近正態(tài)分布,可以用作后續(xù)關(guān)聯(lián)分析。3個(gè)測定時(shí)期性狀的廣義遺傳力分別為 62.76%、57.77%和62.66%,說明葉綠素含量的遺傳力穩(wěn)定且比較高,受環(huán)境影響較小。
表2 3個(gè)時(shí)期不同環(huán)境下SPAD值統(tǒng)計(jì)表Table 2 The statistics of SPAD value in different environments of 3 stages
利用篩選出的137對多態(tài)性引物進(jìn)行群體擴(kuò)增,共檢測到355個(gè)等位變異,平均每個(gè)標(biāo)記檢測到2.59個(gè)等位變異。其中HAU2146標(biāo)記和NAU2083標(biāo)記檢測到的等位變異最多,分別為12個(gè)和8個(gè)。多態(tài)性信息含量(PIC)可以用來衡量基因變異程度的高低,BOTSTEIN等[32]認(rèn)為,當(dāng)PIC<0.25時(shí),為低度多態(tài)性信息引物,0.25<PIC<0.50時(shí),為中度多態(tài)性信息引物,PIC>0.50 時(shí)為高度多態(tài)性信息引物。對 137對引物進(jìn)行PIC分析,其平均值為0.67,變化范圍為0.01—0.95,PIC>0.50的高度多態(tài)性引物有115個(gè),占總量的83.94%。其中,PIC最高的標(biāo)記為HAU2146(0.95)和NAU2083(0.93)。分析結(jié)果表明,所選研究群體的遺傳多樣性較高、SSR標(biāo)記多態(tài)性較好。
用STRUCTURE2.3.4軟件對185份陸地棉材料進(jìn)行群體結(jié)構(gòu)分析,并計(jì)算相應(yīng)材料的Q值。由于LnP(D)值隨K值的增大而逐漸增大(圖1-A),且沒有明顯的拐點(diǎn),無法準(zhǔn)確判斷K的取值,所以參照EVANNO等[26]的方法進(jìn)行亞群數(shù)量的判定。在K=2時(shí),ΔK有最大值(圖1-B),所以將材料分為2個(gè)亞群(圖1-C)。其中一個(gè)亞群包含95份材料(占總材料的 51%);另一個(gè)亞群包含 90份材料(占總材料的 49%)。獲得的Q矩陣將作為關(guān)聯(lián)分析的協(xié)變量,以消除群體結(jié)構(gòu)對關(guān)聯(lián)分析結(jié)果的影響。
圖1 185份陸地棉材料的群體結(jié)構(gòu)Fig. 1 The population structure of 185 upland cotton accessions
用TASSEL軟件的GLM方法和MLM方法,在打頂后0、10和20 d 3個(gè)時(shí)期,分別對185份材料的SPAD值和355個(gè)多態(tài)性位點(diǎn)進(jìn)行關(guān)聯(lián)分析。
通過GLM方法(表3、圖2)分析關(guān)聯(lián)到22個(gè)與SPAD值顯著相關(guān)的位點(diǎn)(P<0.001),-lg(P)的取值范圍為 3.04—5.69,表型變異解釋率為 5.28%—10.85%,平均值為 7.24%。貢獻(xiàn)率最高的位點(diǎn)是SWU0529a和 NAU998c,貢獻(xiàn)率分別為 10.85%和10.48%。其中變異位點(diǎn)NAU2083e在打頂后10和20 d都被檢測到,平均貢獻(xiàn)率為7.84%;變異位點(diǎn)NAU998c在0、10和20 d都被檢測到,平均貢獻(xiàn)率為8.86%。
通過MLM方法(表3、圖2)分析共關(guān)聯(lián)到17個(gè)與SPAD值顯著相關(guān)的位點(diǎn)(P<0.01),-lg(P)的取值范圍為 2.09—3.73,表型變異解釋率為 3.72%—8.58%,平均為 4.72%。貢獻(xiàn)率最高的位點(diǎn)是SWU0923b和 SWU0662d,貢獻(xiàn)率分別為 8.06%和6.74%。其中變異位點(diǎn)NAU2083e和NAU998c可以在0、10和20 d被檢測到,平均貢獻(xiàn)率分別為4.31%和5.14%;變異位點(diǎn)CGR5258c可以在打頂后10和20 d被檢測到,平均貢獻(xiàn)率為3.96%;變異位點(diǎn)NAU2806a可以在打頂后 10和 20 d被檢測到,平均貢獻(xiàn)率為4.54%。
比較GLM方法和MLM方法的關(guān)聯(lián)結(jié)果,GLM方法關(guān)聯(lián)到22個(gè)顯著性位點(diǎn),MLM關(guān)聯(lián)到17個(gè)顯著性位點(diǎn),兩者同時(shí)關(guān)聯(lián)到的位點(diǎn)有12個(gè)(表4),僅在GLM方法下關(guān)聯(lián)到的位點(diǎn)有10個(gè),僅在MLM方法下關(guān)聯(lián)到的位點(diǎn)有5個(gè)。其中變異位點(diǎn)NAU998 c在2種方法3個(gè)時(shí)期都被檢測到。
對GLM方法和MLM方法共同關(guān)聯(lián)到的12個(gè)顯著性等位變異,分別計(jì)算其表型效應(yīng)值,發(fā)掘與葉綠素含量相關(guān)的優(yōu)異等位變異(表4)。在打頂后0、10和20 d 3個(gè)時(shí)期,12個(gè)變異位點(diǎn)表型效應(yīng)的范圍不同,分別是-0.71—0.79、-2.54—2.55和-3.52—5.94。在打頂后0 d,有4個(gè)位點(diǎn)表現(xiàn)為增效效應(yīng),8個(gè)位點(diǎn)表現(xiàn)為減效效應(yīng),且增效效應(yīng)和減效效應(yīng)的效應(yīng)值絕對值差別不大;但是,在打頂后10 d,增效效應(yīng)和減效效應(yīng)的位點(diǎn)各有 6個(gè),其中增效效應(yīng)最大的位點(diǎn)是HAU3318b(2.55)和SWU0987b(2.05),減效效應(yīng)最大的位點(diǎn)是 NAU998c(-2.54)和 MGHES-73a(-1.74);在打頂后20 d,增效效應(yīng)和減效效應(yīng)的位點(diǎn)也各有 6個(gè),其中增效效應(yīng)最大的位點(diǎn)是HAU3318b(5.94)和 SWU0987b(4.65),減效效應(yīng)最大的位點(diǎn)是NAU998c(-3.52)和NAU2083e(-3.48)。
用 2個(gè)增效效應(yīng)最大的位點(diǎn)(HAU3318b和SWU0987b)對材料進(jìn)行篩選,并比較其在打頂后0、10和20 d 3個(gè)時(shí)期SPAD值的差異。檢測到HAU3318b和SWU0987b 2個(gè)增效效應(yīng)位點(diǎn)的材料(ZX2)有53份,2個(gè)增效效應(yīng)位點(diǎn)都未檢測到的材料(ZX0)有46份。ZX2和ZX0在打頂后0 d的SPAD均值差異不大(圖3-A),而在打頂后 10和20 d,ZX2的SPAD均值都顯著比ZX0的SPAD均值高(圖3-B、圖3-C);根據(jù)材料的表型數(shù)據(jù),在ZX2中篩選了一份典型材料——新棉33B,其SPAD值在3個(gè)時(shí)期分別為52.68(0 d)、55.15(10 d)和55.67(20 d)。說明陸地棉倒4葉在打頂后10 d已經(jīng)出現(xiàn)衰老表型的差異,此時(shí)的SPAD值可以作為棉花品種衰老性狀的指標(biāo)。同時(shí),檢測到HAU3318b和SWU0987b是2個(gè)提高葉片葉綠素含量的優(yōu)異等位變異,獲得攜帶2個(gè)優(yōu)異等位變異的載體材料53份,獲得攜帶2個(gè)優(yōu)異等位變異的典型材料一份。
表3 GLM和MLM方法關(guān)聯(lián)分析結(jié)果Table 3 Association analysis results by the GLM and MLM
圖2 GLM和MLM兩種模型下的Q-Q plot圖Fig. 2 Quantile-quantile plots of the GLM and MLM
表4 GLM方法和MLM方法共同關(guān)聯(lián)到的12個(gè)顯著性位點(diǎn)在3個(gè)時(shí)期的表型效應(yīng)Table 4 Phenotypic effect of the 12 significant loci at 3 stages by the GLM and MLM
結(jié)合前人葉綠素含量相關(guān)QTL定位的研究結(jié)果[4-10,33],利用e-PCR程序[34]將統(tǒng)計(jì)得到的25對SSR標(biāo)記和本研究得到的10對(2對SSR標(biāo)記未能成功匹配)顯著性標(biāo)記匹配到參考基因組[35]上(圖 4)。35對 SRR標(biāo)記被匹配到 19條染色體上(A01、A02、A03、A06、A07、A08、A09、A10、A13、D01、D03、D05、D06、D07、D08、D09、D10、D11、D13)。與前人研究結(jié)果相比,本研究在5條新的染色體上發(fā)現(xiàn)了標(biāo)記位點(diǎn),即 A01(SSR標(biāo)記為 NAU2083、NAU2092)、A02(SSR 標(biāo)記為 NAU3318)、A03(SSR標(biāo)記為NAU998)、A08(SSR標(biāo)記為SWU0932)、A09(SSR標(biāo)記為MGHES-73)。
葉綠素是植物進(jìn)行光合作用的主要物質(zhì)基礎(chǔ),是作物高產(chǎn)的重要指標(biāo)。目前,關(guān)于棉花葉片葉綠素含量的基因定位研究的較少,為了從全基因組水平上定位與葉綠素含量相關(guān)的基因,本研究采用關(guān)聯(lián)分析的方法,用覆蓋棉花26條染色體的137對多態(tài)性SSR引物對棉花葉片葉綠素含量進(jìn)行了基因定位,并挖掘其優(yōu)異的等位變異及典型材料。
圖3 攜帶兩個(gè)增效等位變異的材料在打頂后0、10和20 d 3個(gè)時(shí)期的SPAD值Fig. 3 The SPAD of cotton materials carrying two positive alleles in 0, 10 and 20 days after topping
圖4 綜合前人研究與本研究的35對SSR標(biāo)記的環(huán)形物理圖譜Fig. 4 Circus physical map of 35 SSR markers from this study and previous studies
本研究用篩選到的137對多態(tài)性引物,187份陸地棉材料中共檢測到 355個(gè)等位變異,根據(jù)BOTSTEIN等[32]的分類方法,137對引物中有83.94%的引物為高度多態(tài)性引物(PIC>0.50),說明本研究的SSR引物含有豐富的遺傳信息并且所選群體的遺傳多樣性很好,有利于后續(xù)的關(guān)聯(lián)分析和發(fā)掘優(yōu)異等位變異。由于環(huán)境對數(shù)量性狀的影響很大,高遺傳力有利于關(guān)聯(lián)分析結(jié)果的準(zhǔn)確性[36]。本研究在3年6個(gè)環(huán)境下,分 3個(gè)時(shí)期對棉花倒 4葉葉綠素相對含量(SPAD)進(jìn)行了測量,統(tǒng)計(jì)結(jié)果顯示,SPAD的廣義遺傳力在3個(gè)時(shí)期約為60%,遺傳力穩(wěn)定并且比較高,這為提高關(guān)聯(lián)分析結(jié)果的準(zhǔn)確性提供了有利條件。
為降低群體結(jié)構(gòu)和親屬關(guān)系造成的假陽性結(jié)果[37],本研究計(jì)算了Q矩陣和K矩陣,并同時(shí)用GLM方法和MLM方法進(jìn)行關(guān)聯(lián)分析。分析結(jié)果顯示(表3、圖2),MLM方法關(guān)聯(lián)到的位點(diǎn)(17個(gè))比GLM方法關(guān)聯(lián)到的位點(diǎn)(22個(gè))要少,說明GLM方法的假陽性率高于MLM方法。但是,MLM方法和GLM方法共同關(guān)聯(lián)到的位點(diǎn)僅有12個(gè),所以通過2種方法相互比較印證,也可以有效的減少假陽性結(jié)果。值得注意的是,不同變異位點(diǎn)在同時(shí)期的表型效應(yīng)有差異,而且有的變異位點(diǎn)在不同時(shí)期的表型效應(yīng)值差異很大,甚至是效果相反。如位點(diǎn)NAU998c在3個(gè)時(shí)期都表現(xiàn)減效效應(yīng),且絕對值不斷增大,而位點(diǎn)HAU3318b在打頂后0 d表現(xiàn)為減效效應(yīng),在打頂后10和20 d都表現(xiàn)為增效效應(yīng),絕對值也不斷增大。這種現(xiàn)象可能是由于葉綠素含量相關(guān)的基因在棉花葉片不同生育時(shí)期是特異性表達(dá)造成的,具體原因還需要進(jìn)一步的科學(xué)研究。
本研究首次利用了關(guān)聯(lián)分析的方法對棉花葉綠素含量進(jìn)行基因定位,將關(guān)聯(lián)分析結(jié)果與前人QTL定位結(jié)果進(jìn)行比較發(fā)現(xiàn),D05是標(biāo)記較為集中的染色體,王鵬等[33]、鄭巨云等[9]分別在D05染色體定位到一個(gè)葉綠素b含量相關(guān)的QTL(qCb-D05-3,附近SSR標(biāo)記為 NAU3252)和一個(gè) SPAD值相關(guān)的 QTL(qSPAD1,附近SSR標(biāo)記為NAU1221),本研究在這2個(gè)QTL間關(guān)聯(lián)到一個(gè)顯著性SSR標(biāo)記NAU1185,而且與qSPAD1(NAU1221)相距僅大約2 Mb,說明這一區(qū)段附近很可能存在與葉綠素含量相關(guān)的基因位點(diǎn),可以進(jìn)行深入的分析驗(yàn)證。
通過計(jì)算與SPAD顯著關(guān)聯(lián)位點(diǎn)的表型效應(yīng),本研究發(fā)掘了SPAD相關(guān)的優(yōu)異等位變異HAU3318b和SWU0987b。在棉花育種改良工作中,可以直接選取含有優(yōu)異等位變異的材料作為親本,有利于提高選擇效率。
共獲得355個(gè)多態(tài)性位點(diǎn),檢測到12個(gè)與陸地棉葉片葉綠素含量(SPAD)相關(guān)的顯著性位點(diǎn)。發(fā)掘2個(gè)可以提高棉花葉片葉綠素含量的優(yōu)異等位變異HAU3318b和SWU0987b,獲得 53份攜帶2個(gè)優(yōu)異等位變異的析料,獲得一份攜帶2個(gè)優(yōu)異等位變異的典型材料,可用于陸地棉分子標(biāo)記輔助育種。
[1]李鵬程, 董合林, 劉愛忠, 王潤珍, 劉愛珍, 李如義. 棉花上部葉片葉綠素 SPAD值動態(tài)變化研究. 中國農(nóng)學(xué)通報(bào), 2012, 28(3):121-126.LI P C, DONG H L, LIU A Z, WANG R Z, LIU A Z, LI R Y. A study on dynamic change of chlorophyll SPAD values of upper leaves in main stem of cotton. Chinese Agricultural Science Bulletin, 2012,28(3): 121-126. (in Chinese)
[2]THOMAS H, HOWARTH C J. Five ways to stay green. Journal of Experimental Botany, 2000, 51(Suppl. 1): 329-337.
[3]THOMAS H, OUGHAM H. The stay-green trait. Journal of Experimental Botany, 2014, 65(14): 3889-3900.
[4]SONG X L, GUO W Z, HAN Z G, ZHANG T Z. Quantitative trait loci mapping of leaf morphological traits and chlorophyll content in cultivated tetraploid cotton. Journal of Integrative Plant Biology,2005, 47(11): 1382-1390.
[5]SARANGA Y, MENZ M, JIANG C X, WRIGHT R J, YAKIR D,PATERSON A H. Genomic dissection of genotype×environment interactions conferring adaptation of cotton to arid conditions.Genome Research, 2001, 1(12): 1988-1995.
[6]宋美珍. 短季棉早熟不早衰生化遺傳機(jī)制及 QTL定位[D]. 北京:中國農(nóng)業(yè)科學(xué)院, 2006.SONG M Z. Biochemical genetic mechanism and QTLs of early maturing without decrepitude in shorted-reason upland cotton (G.hirsutum L.)[D]. Beijing: Chinese Academy of Agricultural Sciences,2006. (in Chinese)
[7]秦鴻德, 張?zhí)煺? 棉花葉綠素含量和光合速率的 QTL定位. 棉花學(xué)報(bào), 2008, 20(5): 394-398.QIN H D, ZHANG T Z. QTL mapping of leaf chlorophyll content and photosynthetic rates in cotton. Cotton Science, 2008, 20(5): 394-398.(in Chinese)
[8]張建, 劉大軍, 林剛, 張正圣. 陸地棉葉綠素質(zhì)量分?jǐn)?shù) QTL定位.西南大學(xué)學(xué)報(bào), 2011, 33(4): 1-4.ZHANG J, LIU D J, LIN G, ZHANG Z S. QTL mapping for chlorophyll content in upland cotton (Gossypium hirsutum L.).Journal of Southwest University (Natural Science Edition), 2011,33(4): 1-4. (in Chinese)
[9]鄭巨云, 龔照龍, 王俊鐸, 李雪源, 艾先濤, 梁亞軍, 吐爾遜江, 多力坤, 莫明. 新疆陸地棉遺傳連鎖圖譜構(gòu)建及葉綠素含量和光合速率的QTL定位. 新疆農(nóng)業(yè)科學(xué), 2014, 51(9): 1577-1582.ZHENG J Y, GONG Z L, WANG J D, LI X Y, AI X T, LIANG Y J,TU E X J, DUO L K, MO M. Construction of linkage genetic map and QTL mapping for the chlorophyll content and photosynthetic rates in upland cotton. Xinjiang Agricultural Sciences, 2014, 51(9): 1577-1582.(in Chinese)
[10]戎福喜, 湯麗魁, 唐媛媛, 李志博, 趙瑞海, 雷軍, 魏亦農(nóng). 海陸漸滲系棉花吐絮期葉綠素含量、熒光參數(shù)及相關(guān)性狀的QTL定位分析. 棉花學(xué)報(bào), 2015, 27(5): 417-426.RONG F X, TANG L K, TANG Y Y, LI Z B, ZHAO R H, LEI J, WEI Y N. QTL mapping for leaf chlorophyll content, fast chlorophyll fluorescence parameters and related traits in cotton introgression lines during the boll opening stage. Cotton Science, 2015, 27(5): 417-426.(in Chinese)
[11]1001 Genomes Consortium. 1135 genomes reveal the global pattern of polymorphism in Arabidopsis thaliana. Cell, 2016, 166(2): 481-491.
[12]CHEN W, GAO Y Q, XIE W B, GONG L, LU K, WANG W S, LI Y,LIU X Q, ZHANG H Y, DONG H X, ZHANG W, ZHANG L J, YU S B, WANG G W, LIAN X M, LUO J. Genome-wide association analyses provide genetic and biochemical insights into natural variation in rice metabolism. Nature Genetics, 2014, 46(7): 714-721.
[13]KUMP K L, BRADBURY P J, WISSER R J, BUCKLER E S,BELCHER A R, OROPEZA-ROSAS M A, ZWONITZER J C,KRESOVICH S, MCMULLEN M D, WARE D, BALINT-KURTI P J,HOLLAND J B. Genome-wide association study of quantitative resistance to southern leaf blight in the maize nested association mapping population. Nature Genetics, 2011, 43(2): 163-168.
[14]XIAO Y J, TONG H, YANG X H, XU S Z, PAN Q C, QIAO F,RAIHAN M S, LUO Y, LIU H J, ZHANG X H, YANG N, WANG X Q, DENG M, JIN M L, ZHAO L J, LUO X, ZHOU Y, LI X, LIU J,ZHAN W, LIU N N, WANG H, CHEN G S, CAI Y, XU G, WANG W D, ZHENG D B, YAN J B. Genome-wide dissection of the maize ear genetic architecture using multiple populations. New Phytologist,2015, 210: 1095-1106.
[15]DOERGE R W. Mapping and analysis of quantitative trait loci in experimental populations. Nature Reviews Genetics, 2002, 3(1):43-52.
[16]HOLLAND J B. Genetic architecture of complex traits in plants.Current Opinion in Plant Biology, 2007, 10(2): 156-161.
[17]NIE X H, HUANG C, YOU C Y, LI W, ZHAO W X, SHEN C,ZHANG B B, WANG H T, YAN Z H, DAI B S, WANG M J, ZHANG X L, LIN Z X. Genome-wide SSR-based association mapping for fiber quality in nation-wide upland cotton inbreed cultivars in China.BMC Genomics, 2016, 17(1): 352.
[18]SU J J, FAN S L, LI L B, WEI H L, WANG C X, WANG H T, SONG M Z, ZHANG C, GU L J, ZHAO S Q, MAO G Z, WANG C S, PANG C Y, YU S X. Detection of favorable QTL alleles and candidate genes for lint percentage by GWAS in Chinese upland cotton. Frontiers in Plant Science, 2016, 7(10): 1-11.
[19]SU J J, LI L B, PANG C Y, WEI H L, WANG C X, SONG M Z,WANG H T, ZHAO S Q, ZHANG C, MAO G Z, HUANG L, WANG C S, FAN S L, YU S X. Two genomic regions associated with fiber quality traits in Chinese upland cotton under apparent breeding selection. Scientific Reports, 2016, 6: 38496.
[20]SU J J, PANG C Y, WEI H L, LI L B, LIANG B, WANG C X, SONG M Z, WANG H T, ZHAO S Q, JIA X Y, MAO G Z, DUANG L,GNEG D D, WANG C S. Identification of favorable SNP alleles and candidate genes for traits related to early maturity via GWAS in upland cotton. BMC Genomics, 2016, 17(1): 687.
[21]宋國立, 崔榮霞, 王坤波, 郭立平, 黎紹惠, 王春英, 張香娣. 改良CTAB法快速提取棉花DNA. 棉花學(xué)報(bào), 1998, 10(5): 273-275.SONG G L, CUI R X, WANG K B, GUO L P, LI S H, WANG C Y,ZHANG X D. A rapid improved CTAB method for extraction of cotton genomic DNA. Cotton Science, 1998, 10(5): 273-275. (in Chinese)
[22]趙樹琪, 梁冰, 李黎貝, 龐朝友, 宿俊吉, 宋美珍, 魏恒玲, 王寒濤,范術(shù)麗, 喻樹迅. 基于 SSR標(biāo)記的陸地棉早熟相關(guān)種質(zhì)遺傳多樣性分析. 植物遺傳資源學(xué)報(bào), 2016, 17(4): 599-606.ZHAO S Q, LIANG B, LI L B, PANG C Y, SU J J, SONG M Z, WEI H L, WANG H T, FAN S L, YU S X. Genetic diversity analysis of early-maturity related germplasm in upland cotton (Gossypium hirsutum L.) based on SSR marker. Journal of Plant Genetic Resources, 2016, 17(4): 599-606. (in Chinese)
[23]張軍, 武耀廷, 郭旺珍, 張?zhí)煺? 棉花微衛(wèi)星標(biāo)記的 PAGE/銀染快速檢測. 棉花學(xué)報(bào), 2000, 12(5): 267-269.ZHANG J, WU Y T, GUO W Z, ZHANG T Z. Fast screening of microsatellite markers in cotton with PAGE/silver staining. Cotton Science, 2000, 12(5): 267-269. (in Chinese)
[24]LIU K, MUSE S V. PowerMaker: An integrated analysis environment for genetic maker analysis. Bioinformatics, 2005, 21(9): 2128-2129.
[25]PRITCHARD J K, STEPHENS M, DONNELLY P. Inference of population structure using multilocus genotype data. Genetics, 2000,155(2): 945-959.
[26]EVANNO G, REGNAUT S, GOUDET J. Detecting the number of clusters of individuals using the software structure: A simulation study.Molecular Ecology, 2005, 14(8): 2611-2620.
[27]EARL D A. STRUCTURE HARVESTER: a website and program for visualizing STRUCTURE output and implementing the Evanno method. Conservation Genetics Resources, 2012, 4(2): 359-361.
[28]BATES D, MAECHLER M, BOLKER B, WALKER S. Fitting linear mixed-effects models using lme4. Journal of Statistical Software,2015, 67(1): 1-48.
[29]BRADBURY P J, ZHANG Z, KROON D E, CASSTEVENS T M,RAMDOSS Y, BUCKLER E S. TASSEL: Software for association mapping of complex traits in diverse samples. Bioinformatics, 2007,23(19): 2633-2635.
[30]BRESEGHELLO F, MARK S. Association mapping of kernel size and milling quality in wheat (Triticum aestivum L.) cultivars. Genetics,2006, 172: 1165-1177.
[31]文自翔, 趙團(tuán)結(jié), 鄭永戰(zhàn), 劉順湖, 王春娥, 王芳, 蓋鈞鎰. 中國栽培和野生大豆農(nóng)藝及品質(zhì)性狀與SSR標(biāo)記的關(guān)聯(lián)分析: II. 優(yōu)異等位變異的發(fā)掘. 作物學(xué)報(bào), 2008, 34(8): 1339-1349.WEN Z X, ZHAO T J, ZHENG Y Z, LIU S H, WANG C E, WANG F,GAI J Y. Association analysis of agronomic and quality traits with SSR markers in Glycine max and Glycine soja in China: II.Exploration of elite alleles. Acta Agronomica Sinica, 2008, 34(8):1339-1349. (in Chinese)
[32]BOTSTEIN D, WHITE R L, SKOLNICK M, DAVIS R W.Construction of a genetic linkage map in man using restriction fragment length polymorphism. American Journal of Human Genetics,1980, 32(3): 314-331.
[33]王鵬, 張?zhí)煺? 利用棉花海陸種間染色體片段導(dǎo)入系剖析光合色素含量的遺傳基礎(chǔ). 作物學(xué)報(bào), 2012, 38(6): 947-953.WANG P, ZHANG T Z. Genetic dissection of photosynthetic pigment content in cotton interspecific chromosome segment introgression lines. Acta Agronomica Sinica, 2012, 38(6): 947-953. (in Chinese)
[34]ROTMISTROVSKY K, JANG W, SCHULER G D. A web server for performing electronic PCR. Nucleic Acids Research, 2004, 32(Suppl.2): W108-W112.
[35]ZHANG T Z, HU Y, JIANG W K, FANG L, GUAN X Y, CHEN J D,ZHANG J B,SASKI C A, SCHEFFLER B E, STELLY D M,HULSE-KEMP A M, WAN Q, LIU B L, LIU C X, WANG S, PAN M Q, WANG Y K, WANG D W, YE W X, CHANG L J, ZHANG W P,SONG Q X, KIRKBRIDE R C, CHEN X Y, DENNIS E,LLEWELLYN D J, PETERSON D G, THAXTON P, JONES D C,WANG Q, XU X Y, ZHANG H, WU H T, ZHOU L, MEI G F, CHEN S Q, TIAN Y, XIANG D, LI X H, DING J, ZUO Q Y, TAO L N, LIU Y C, LI J, LIN Y, HUI Y Y, CAO Z H, CAI C P, ZHU X F, JIANG Z,ZHOU B L, GUO W Z, LI R Q, CHEN Z J. Sequencing of allotetraploid cotton (Gossypium hirsutum L. acc. TM-1) provides a resource for fiber improvement. Nature Biotechnology, 2015, 33(5):531-537.
[36]MACKAY T F C, STONE E A, AYROLES J F. The genetics of quantitative traits: Challenges and prospects. Nature Reviews Genetics,2009, 10(8): 565-577.
[37]ZHANG Z W, ERSOZ E, LAI C Q, TODHUNTER R J, TIEARI H K,GORE M A, BRADBURY P J, YU J M, ARNETT D K, ORDOVAS J M, BUCKLER E S. Mixed linear model approach adapted for genome-wide association studies. Nature Genetics, 2010, 42(4):355-360.
(責(zé)任編輯 李莉,岳梅)
Association Analysis of Leaf Chlorophyll Content with SSR Markers and Exploration of Superior Alleles in Upland Cotton
LIU QiBao, LI LiBei, ZHANG Chi, SU JunJi, WEI HengLing, WANG HanTao, YU ShuXun
(Institute of Cotton Research, Chinese Academy of Agricultural Sciences/State Key Laboratory of Cotton Biology,Anyang 455000, Henan)
2017-03-20;接受日期:2017-05-25
國家自然科學(xué)基金(31660409)、國家棉花產(chǎn)業(yè)體系(CARS-18)
聯(lián)系方式:劉其寶,Tel:17051007243;E-mail:liuqibao566@163.com。通信作者喻樹迅,Tel:0372-2562201;E-mail:yu@cricaas.com.cn