宿洋楊靜郭勇杜維俊邱麗娟
(1山西農(nóng)業(yè)大學(xué)農(nóng)學(xué)院,030801,山西晉中;2中國農(nóng)業(yè)科學(xué)院作物科學(xué)研究所/農(nóng)作物基因資源與遺傳改良國家重大科學(xué)工程/農(nóng)業(yè)農(nóng)村部北京大豆生物學(xué)重點(diǎn)實(shí)驗(yàn)室,100081,北京)
大豆是富含蛋白質(zhì)和油脂的重要糧食和經(jīng)濟(jì)作物[1],提高大豆產(chǎn)量一直是我國大豆育種最重要的目標(biāo)之一。百粒重是大豆重要的產(chǎn)量性狀,發(fā)掘調(diào)控籽粒大小/粒重相關(guān)的基因,對大豆籽粒大小/粒重的分子調(diào)控機(jī)制開展研究,可為提高大豆產(chǎn)量提供理論基礎(chǔ)。同時,大豆百粒重還是重要的馴化性狀,野生大豆和栽培大豆的百粒重差異很大,野生大豆百粒重在0~3g之間,而栽培大豆在5~55g之間,因此大豆種質(zhì)資源中基因的變異為百粒重基因的發(fā)掘提供了重要線索。
植物的種子是由受精卵發(fā)育成熟而形成的,主要由胚、胚乳和種皮3部分組成。種子發(fā)育成熟后最終的大小也主要取決于胚、胚乳和種皮的發(fā)育程度。目前在模式植物擬南芥中已明確了多個調(diào)控種子大小的基因,其中與胚發(fā)育相關(guān)的基因有ANGUSTIFOLIA3(AN3)、MINISEED3(MINI3)、YODA(YDA)和 ETHYLENE-INSENSITIVE3(EIN3)等。突變體分析表明,an3突變體種子中胚細(xì)胞的體積增大,而mini3突變體種子中胚細(xì)胞的數(shù)量減少。mini3和an3雙突材料的種子大小與mini3單突材料種子大小一致。因此,MINI3與AN3相比具有上位性,在種子大小調(diào)控路徑中AN3位于MINI3的上游[2];YODA(YDA)編碼MAPKK激酶,研究發(fā)現(xiàn)功能缺失突變體yda的種子變小,而ein3突變體的種子變大。遺傳分析表明,YDA和EIN3是糖介導(dǎo)的代謝級聯(lián)系統(tǒng)的組成部分,通過母系控制胚的大小來調(diào)節(jié)種子大小[3]。與胚乳發(fā)育有關(guān)的基因有ENDOSPERM DEFECTIVE1(EDE1)和DET2等。對突變體的研究發(fā)現(xiàn),ede突變體胚乳存在核分裂缺陷,與野生型胚乳相比缺少有序的微管陣列,最終導(dǎo)致種子敗育[4];det2突變體中,種子胚乳的細(xì)胞化過程與野生型相比延遲1~2d,造成種子腔和胚乳體積減小,因此導(dǎo)致種子變小[5]。與種皮發(fā)育有關(guān)的基因有EOD3/CYP78A6和APETALA2(AP2),對突變體的研究發(fā)現(xiàn),eod3影響珠被細(xì)胞體積的擴(kuò)大,導(dǎo)致eod3外珠被細(xì)胞顯著小于野生型外珠被細(xì)胞,因此eod3的種子變小[6];ap2突變體與野生型相比具有更長的珠被細(xì)胞,產(chǎn)生了比野生型更大的種子,因此AP2負(fù)調(diào)控種子大小[7]。種子的粒形性狀包括粒長、粒寬和粒厚,這些性狀與種子的質(zhì)量密切相關(guān)。在水稻中已對GW2、GW5和GL4等多個與粒形和粒重相關(guān)的基因開展深入研究。GW2編碼具有E3泛素連接酶活性的環(huán)形蛋白,它的功能缺失突變體與野生型相比增加了穎殼中的細(xì)胞數(shù)量,導(dǎo)致水稻籽粒變寬,粒重增加[8]。GW5編碼鈣調(diào)結(jié)合蛋白,是BR信號通路中的正向調(diào)控因子,它的表達(dá)水平的提高能夠增加谷粒寬度,從而使粒重增加[9]。GL4調(diào)控內(nèi)外穎殼中縱向細(xì)胞的伸長,在發(fā)生移碼突變后,谷粒的長度變短,粒重變小[10]。
在大豆中,與粒重相關(guān)的研究大多仍處在QTL定位階段,已報道的關(guān)于大豆百粒重的QTL有304個(http://www.soybase.org,2021年3月數(shù)據(jù)),分布于20條染色體上。陳強(qiáng)等[11]利用冀豆12×黑豆(ZDD03651)構(gòu)建的重組自交系(RIL)群體,共檢測到5個百粒重QTL,遺傳貢獻(xiàn)率(R2)為7.68%~12.83%。郭潔等[12]利用東農(nóng)46和L-100衍生的RIL群體,檢測到5個與百粒重相關(guān)的QTL,分別位于9號、12號、14號和18號染色體上,可解釋的表型貢獻(xiàn)率為2.30%~7.59%。Dhungana等[13]利用Williams 82×PI 366121構(gòu)建的RIL群體,定位到9個百粒重QTL。Liu等[14]利用Jackson×JWS156-1構(gòu)建的染色體片段代換系群體定位到9個百粒重QTL,其中12號染色體上的qSW12.1位點(diǎn)連續(xù)3年被檢測到,是一個穩(wěn)定的主效QTL。Li等[15]對來自3個生態(tài)區(qū)的146個大豆品種進(jìn)行全基因組關(guān)聯(lián)分析,定位到21個與粒重相關(guān)聯(lián)的位點(diǎn),其中9號染色體上的SW9-1位點(diǎn)是一個新發(fā)現(xiàn)的與籽粒大小顯著相關(guān)的QTL。從這些研究中可以看出,大豆百粒重是受多個位點(diǎn)調(diào)控的復(fù)雜數(shù)量性狀,在不同群體中或不同環(huán)境下所檢測到的QTL都有所差異,且定位到的目標(biāo)區(qū)間較大。在候選基因的研究方面,Wang等[16]通過關(guān)聯(lián)分析發(fā)現(xiàn)了1個與大豆籽粒大小/粒重相關(guān)的基因GmCYP78A10,該基因在大豆馴化和育種過程中經(jīng)歷了人工選擇,等位基因GmCYP78A10a主要分布在野生大豆中,而GmCYP78A10b主要分布于栽培大豆中。該研究發(fā)現(xiàn)攜帶GmCYP78A10b等位基因的大豆品種在粒重、粒寬和粒厚方面均明顯大于攜帶GmCYP78A10a等位基因的品種,但該基因的作用機(jī)理尚不清楚。Lu等[17]利用ZYD7×HN44構(gòu)建的RIL群體定位到野生大豆ZYD7中的phosphatase 2C(PP2C)基因,該基因參與調(diào)控種子重量/大小,通過與轉(zhuǎn)錄因子GmBZR1結(jié)合,促進(jìn)去磷酸化的GmBZR1蛋白積累,導(dǎo)致籽粒大小/粒重的增加。
從相關(guān)文獻(xiàn)中收集在擬南芥和水稻中已明確生物學(xué)功能的和調(diào)控籽粒大小/粒重的基因,基因信息均來自已發(fā)表文章。
在Ensembl數(shù)據(jù)庫(http://plants.ensembl.org/index.html)中,根據(jù)擬南芥和水稻中基因的ID編號查找對應(yīng)大豆基因組中的直系同源基因。
在包括栽培大豆和野生大豆的56份大豆種質(zhì)資源的重測序數(shù)據(jù)中[18]查找并篩選SNP位點(diǎn),計算每個SNP在野生大豆和栽培大豆兩大類群之間的Fst值,依據(jù)Fst>0.45篩選在兩大類群中差異顯著的SNP,根據(jù)基因注釋信息篩選導(dǎo)致非同義變異的SNP。
從Phytozome數(shù)據(jù)庫(https://phytozome.jgi.doe.gov/pz/portal.html)中獲得基因在不同組織中的表達(dá)量數(shù)據(jù),包括的組織有大豆的根、根毛、根瘤、莖、葉、分生組織、花、莢和種子等。利用軟件TBtools對基因在不同組織的表達(dá)數(shù)據(jù)繪制表達(dá)譜并進(jìn)行聚類分析,將表達(dá)量超過所有組織平均值2倍的組織認(rèn)為是特異性表達(dá)的組織。
利用上述56份大豆資源中的26份驗(yàn)證位于編碼區(qū)的非同義突變SNP,包括8份野生大豆和18份栽培大豆。利用CTAB法提取基因組DNA,根據(jù)SNP位點(diǎn)兩側(cè)的基因組序列設(shè)計特異性引物,擴(kuò)增SNP位點(diǎn)所在片段,用瓊脂糖凝膠電泳檢測目標(biāo)條帶后進(jìn)行測序。根據(jù)測序結(jié)果中SNP變異類型在野生大豆和栽培大豆中的分布情況,分析得到與大豆百粒重相關(guān)的SNP位點(diǎn)。
利用2368份資源的重測序數(shù)據(jù)[19]以及其中1695份資源的百粒重表型數(shù)據(jù),分析驗(yàn)證得到的SNP位點(diǎn)在野生型和突變型材料中的百粒重表型分布情況。按照 0.1~6.0g、6.1~12.0g、12.1~18.0g和>18.0g的分布劃分出百粒重表型范圍,統(tǒng)計每個范圍內(nèi)的材料數(shù)量,比較不同SNP變異類型在野生大豆和栽培大豆及不同百粒重材料中的分布。
2.1.1 擬南芥和水稻中粒重相關(guān)基因的收集 通過文獻(xiàn)檢索共得到59個調(diào)控籽粒大小/粒重的基因(表1),其中擬南芥基因37個,水稻基因22個,這些基因都有明確的生物學(xué)功能,根據(jù)其功能進(jìn)行分類,其中參與激素信號轉(zhuǎn)導(dǎo)的基因有24個,參與泛素代謝途徑的基因有6個,參與其他代謝途徑的基因有29個。
表1 調(diào)控植物籽粒大小/粒重的功能基因Table 1 Functional genes related to seed size/weight in plants
續(xù)表1 Table 1(continued)
2.1.2 大豆百粒重相關(guān)基因的全基因組檢索 基于序列相似和結(jié)構(gòu)域相同的原則,查找水稻和擬南芥中與粒重相關(guān)的59個基因在大豆中的同源基因,共獲得了175個基因(表2),由表2可知,其中174個基因分布于大豆20條染色體上,1個基因位于基因組的Scaffold上,這些基因在10號染色體上分布最多(22個),12號染色體上最少(2個),其他染色體上基因數(shù)目在3~13之間。從代謝途徑來看,泛素代謝途徑相關(guān)基因主要分布在1號、2號和10~17號染色體上;激素信號轉(zhuǎn)導(dǎo)途徑相關(guān)基因在除10號、12號、18號和20號染色體的其他染色體上均有分布。由表1可知,在59個調(diào)控植物籽粒大小/粒重的基因中,SHB1、GS2、BG1、GL3和GLW7基因在大豆中沒有找到同源基因;IKU2、D11和GSK2基因在大豆中為單拷貝,其他基因均為多拷貝。
表2 大豆百粒重相關(guān)基因在染色體上的定位Table 2 Chromosome location of genes related to 100-seed weight in soybean
2.1.3 大豆百粒重相關(guān)基因表達(dá)譜分析 175個大豆同源基因中,有171個基因在Phytozome網(wǎng)站上有表達(dá)量數(shù)據(jù),對這171個基因的表達(dá)豐度進(jìn)行聚類分析,可以將這些基因分成6個亞群(圖1),A亞群基因主要在花中表達(dá),B亞群基因主要在根中表達(dá),C亞群基因主要在根毛、根、根瘤和頂端分生組織中表達(dá),D亞群基因主要在莢中表達(dá),E亞群基因主要在種子和頂端分生組織中表達(dá),F(xiàn)亞群基因主要在葉片、頂端分生組織和莖中表達(dá)。
圖1 大豆百粒重相關(guān)基因的電子表達(dá)譜Fig.1 Expression profiling of genes related to 100-seed weight in soybean
組織特異表達(dá)分析結(jié)果(表3)表明,不同的基因在不同組織中存在特異性表達(dá),其中在花中特異表達(dá)的基因最多(35個),在葉片中最少(7個)。在種子中特異性表達(dá)的基因有21個,在莢中特異性表達(dá)的基因有11個。在花中,參與激素信號轉(zhuǎn)導(dǎo)的特異性表達(dá)的基因有14個,參與泛素代謝途徑特異性表達(dá)的基因有5個;在種子中,參與激素信號轉(zhuǎn)導(dǎo)特異性表達(dá)的基因有6個,參與泛素代謝途徑特異性表達(dá)的基因有3個;在莢中,參與激素信號轉(zhuǎn)導(dǎo)特異性表達(dá)的基因有4個。從代謝途徑來看,參與激素信號轉(zhuǎn)導(dǎo)途徑的62個基因在各個組織中均有表達(dá),其中有14個基因在花中特異性表達(dá),有6個基因在種子中特異性表達(dá);參與泛素代謝途徑的14個基因,在除了莢、根毛和頂端分生組織以外的各組織中均有表達(dá),其中5個基因在花中特異性表達(dá),有3個基因在種子中特異性表達(dá),且都屬于DA家族基因。
表3 大豆不同組織中特異性表達(dá)的基因Table 3 Specifically expressed genes in different tissues of soybean
2.2.1 SNP位點(diǎn)的查找 利用56份大豆資源(31份栽培大豆和25份野生大豆)的重測序數(shù)據(jù),以Williams 82為參考基因組,在175個大豆同源基因中共獲得2769個SNP位點(diǎn),其中121個SNP位點(diǎn)在野生和栽培大豆2個類群間的Fst值大于0.45。在這121個SNP位點(diǎn)中,由表4可知,有16個SNP為非同義變異,分布于2號、5號、7號、13號和17號染色體上,位于11個基因中。
表4 非同義變異SNP位點(diǎn)分布情況Table 4 Distribution of non-synonymous variation SNP loci
2.2.2 SNP位點(diǎn)的驗(yàn)證 利用Williams 82參考基因組的序列,對這16個位于編碼區(qū)的SNP設(shè)計特異性擴(kuò)增引物。從56份大豆資源中選擇26份資源(18份栽培大豆和8份野生大豆)進(jìn)行PCR擴(kuò)增測序,鑒定每份材料中16個SNP的堿基類型。通過分析16個SNP位點(diǎn)在26份資源中的堿基類型分布(圖2),發(fā)現(xiàn)有5個SNP在26份資源中的不同變異類型在野生大豆和栽培大豆間存在顯著性差異,在野生大豆中主要為一種變異,而在栽培大豆中為另一種變異。這5個SNP位點(diǎn)分別位于Glyma.05G019800、Glyma.07G022800、Glyma.07 G052300、Glyma.13G259700和Glyma.13G261700這5個基因中。
圖2 16個SNP在26份大豆資源中的分布Fig.2 Distribution of 16 SNPs in 26 soybean accessions
2.3.1 SNP位點(diǎn)在重測序數(shù)據(jù)中的表型分布 在2368份大豆資源的重測序數(shù)據(jù)中查找上述5個SNP,獲得了其中的4個SNP數(shù)據(jù),分別位于Glyma.05G019800、Glyma.07G022800、Glyma.13 G259700和Glyma.13G261700這4個基因中。對這4個SNP位點(diǎn)的不同變異類型在野生和栽培大豆中的分布情況進(jìn)行分析發(fā)現(xiàn),基因Glyma.13G259700上SNP野生型變異在野生大豆中分布頻率為1%,
在栽培大豆中頻率為99%;突變型變異在野生大豆中分布頻率為28%,在栽培大豆中頻率為72%?;騁lyma.07G022800上SNP野生型變異在野生大豆中分布頻率為1%,在栽培大豆中頻率為99%;突變型變異在野生大豆中分布頻率為27%,在栽培大豆中頻率為73%?;騁lyma.05G019800上SNP野生型變異在野生大豆中分布頻率為1%,在栽培大豆中頻率為99%;突變型變異在野生大豆中分布頻率為32%,在栽培大豆中頻率為68%?;騁lyma.13G261700上SNP野生型變異在野生大豆中分布頻率為1%,在栽培大豆中頻率為99%;突變型變異在野生大豆中分布頻率為30%,在栽培大豆中頻率為70%。更進(jìn)一步說明這4個SNP在野生和栽培大豆中存在明顯分化。
此外,在2368份重測序材料中,有1695份材料有百粒重表型數(shù)據(jù)。對上述獲得數(shù)據(jù)的4個SNP在野生型和突變型材料中的百粒重表型分別進(jìn)行顯著性分析(圖3),發(fā)現(xiàn)每個SNP在野生型和突變型變異材料對應(yīng)的百粒重表型間存在極顯著差異。
圖3 不同SNP類型材料對應(yīng)的百粒重表型分析Fig.3 Phenotypic analysis of 100-seed weight corresponding to different types of SNP
進(jìn)一步按照 0.1~6.0g、6.1~12.0g、12.1~18.0g及>18.0g的分布范圍來劃分百粒重數(shù)據(jù),統(tǒng)計4個SNP不同變異類型的材料中,不同百粒重范圍的資源數(shù)量占總資源數(shù)量的比例。結(jié)果(圖4)表明,在每個SNP中攜帶野生型變異的大豆資源百粒重≥12.0g的材料占總材料比例超過60%,而在每個SNP中攜帶突變型變異的大豆資源百粒重<12.0g的材料占總材料的比例也超過了60%。因此,這4個SNP所在的候選基因Glyma.05G019800、Glyma.07G022800、Glyma.13G259700和Glyma.13 G261700可能都與籽粒大小/粒重的調(diào)控有關(guān)。
圖4 不同百粒重范圍內(nèi)大豆資源數(shù)量分布Fig.4 Distribution of soybean accessions in different 100-seed weight phenotypic ranges
2.3.2 候選基因功能注釋 為進(jìn)一步了解這4個候選基因的功能,在NCBI數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov)中查找候選基因的功能注釋,由表5可知,基因Glyma.05G019800為水稻GW7基因的同源基因,編碼未知功能蛋白,參與單細(xì)胞的生長調(diào)節(jié)過程?;騁lyma.07G022800為水稻GW6a基因的同源基因,編碼乙?;D(zhuǎn)移酶,參與氨基酸的運(yùn)輸和代謝等生理活動?;騁lyma.13G259700為擬南芥UBP15/SOD2基因的同源基因,編碼泛素水解酶,參與無機(jī)離子的轉(zhuǎn)運(yùn)與代謝等生理活動?;騁lyma.13G261700為擬南芥SOB7基因的同源基因,編碼氧化還原酶,包含細(xì)胞色素P450蛋白結(jié)構(gòu)域,參與次生代謝物的生物合成、運(yùn)輸和分解代謝等生理活動。
表5 候選基因功能注釋Table 5 Functional annotation of candidate genes
大豆在進(jìn)化過程中,經(jīng)過了染色體的多倍體化和基因組復(fù)制,且基因組較大,利用正向遺傳學(xué)方法定位控制大豆農(nóng)藝性狀基因耗時較長。隨著大豆全基因組測序的完成,利用反向遺傳學(xué)方法進(jìn)行大豆基因定位和功能研究已取得了諸多進(jìn)展。Zhong等[32]利用擬南芥開花途徑中在結(jié)構(gòu)和功能上都高度保守的1個MADS-box基因AGL20/SOC1,同源克隆到大豆中與之序列高度同源的基因GmGAL1,將該基因轉(zhuǎn)入擬南芥中發(fā)現(xiàn),轉(zhuǎn)基因植株與野生型相比較早進(jìn)入了開花期,并提出該基因在大豆的發(fā)育過程中可能是1個多功能基因。Deshmukh等[33]利用水稻和擬南芥等植物中的主嵌入蛋白(MIP)家族基因,通過序列比對同源克隆到大豆中的結(jié)瘤嵌入蛋白基因GmNIP2,該基因表達(dá)的蛋白能夠轉(zhuǎn)運(yùn)硅元素,是豆科植物中首次報道的硅轉(zhuǎn)運(yùn)蛋白的基因。薛晨晨等[34]利用擬南芥中已公布的表達(dá)L-半乳糖酸-1,4-內(nèi)酯脫氫酶(GLDH)的基因AtGLDH序列,在大豆中同源克隆到1個與之功能一致的基因GmGLDH(Glyma.02G166300),并對其進(jìn)行生物信息學(xué)分析及非生物脅迫下的表達(dá)分析,為進(jìn)一步研究該基因的功能提供幫助。大豆百粒重基因受到多個位點(diǎn)和環(huán)境條件的共同作用[35],利用圖位克隆進(jìn)行相關(guān)基因定位工作量大且耗時較長,本研究利用水稻和擬南芥中的已知功能基因鑒定出大豆中調(diào)控籽粒大小/粒重相關(guān)基因,通過生物信息學(xué)分析來挖掘相關(guān)基因,可為候選基因的篩選提供參考。
通過篩選共鑒定出至少有4個基因可能與大豆的百粒重相關(guān),這4個基因中Glyma.13G259700在種子中的表達(dá)量最高,Glyma.13G261700和Glyma.07G022800在花中的表達(dá)量最高,Glyma.05G019800在頂端分生組織中表達(dá)量最高。查找基因功能注釋發(fā)現(xiàn),Glyma.07G022800編碼乙?;D(zhuǎn)移酶,在水稻中已報道了基因GW6a編碼組蛋白H4乙酰基轉(zhuǎn)移酶,表達(dá)該基因能增加粒重[23];Glyma.13G259700編碼的蛋白質(zhì)中包含泛素特異性蛋白酶結(jié)構(gòu)域,在擬南芥中已報道了泛素特異性蛋白酶UBP15/SOD2參與了種子大小的調(diào)控[24];Glyma.13G261700編碼細(xì)胞色素P450蛋白,在擬南芥中已報道了SHK1和KLU等基因編碼細(xì)胞色素P450蛋白,它們都與種子大小的調(diào)控有關(guān)[20]。水稻和擬南芥的相關(guān)研究報道,加速了大豆百粒重候選基因的篩選鑒定。
大豆是古四倍體,基因組曾發(fā)生過多次復(fù)制,導(dǎo)致約75%的基因以多拷貝形式存在,因此對大豆功能基因的研究較為困難。隨著2010年大豆全基因組測序工作的完成,以及高通量測序技術(shù)帶來的高效便捷,通過對來自不同地區(qū)和不同類型的大豆品種進(jìn)行重測序,利用檢測到的變異位點(diǎn)進(jìn)行基因分型,并結(jié)合材料表型可進(jìn)行基因定位等大豆功能基因組研究。Zhou等[36]通過對62個野生大豆、130個地方大豆和110個改良大豆品種進(jìn)行重測序,結(jié)合全基因組關(guān)聯(lián)分析(GWAS)揭示了10個被選擇區(qū)域和9個馴化或改良性狀相關(guān)聯(lián),并鑒定出包括含油量、株高和茸毛形態(tài)等13個農(nóng)藝性狀相關(guān)位點(diǎn)。該研究為提高對大豆馴化遺傳學(xué)認(rèn)知提供了資源,并為今后遺傳資源庫中相關(guān)性狀的等位變異研究提供了參考,從而為大豆作物改良提供了依據(jù)。Kulkarni等[37]利用全基因組重測序數(shù)據(jù)進(jìn)行比較基因組分析,鑒定出6個與蛋白含量和脂肪酸組分相關(guān)的SNP的基因,其中Glyma.10G275800中的單個SNP與蛋白質(zhì)含量升高以及棕櫚酸、油酸和亞油酸含量有關(guān),其他5個基因?yàn)榘c該研究分析的各個性狀相關(guān)的SNP的新基因。本研究利用56份大豆資源(包括野生大豆和栽培大豆)的重測序數(shù)據(jù)對大豆中與籽粒大小/粒重相關(guān)基因進(jìn)行基因分型,2種類型材料的百粒重表型差異較大,結(jié)合基因型分析獲得與性狀相關(guān)的SNP位點(diǎn);在對篩選到的SNP驗(yàn)證分析中用到了2368份資源重測序數(shù)據(jù)及部分材料已有的表型數(shù)據(jù),進(jìn)一步驗(yàn)證相關(guān)的SNP位點(diǎn)與大豆百粒重的相關(guān)性。通過對大量重測序數(shù)據(jù)及百粒重表型數(shù)據(jù)的分析,能夠較為精準(zhǔn)高效地獲得與百粒重相關(guān)的候選基因,為相關(guān)基因的功能研究奠定基礎(chǔ)。
利用文獻(xiàn)檢索得到的59個在擬南芥和水稻中已明確生物學(xué)功能的與籽粒大小/粒重相關(guān)的基因,經(jīng)過同源分析,在大豆基因組中鑒定到175個同源基因。對基因的表達(dá)譜進(jìn)行分析,發(fā)現(xiàn)有22個基因在大豆的種子中特異性表達(dá)。利用56份大豆種質(zhì)資源的重測序數(shù)據(jù)鑒定出121個SNP位點(diǎn)在野生大豆和栽培大豆間存在分化,其中16個SNP為非同義變異位點(diǎn),分布于11個基因中。通過擴(kuò)增測序驗(yàn)證這些非同義變異位點(diǎn),結(jié)合1695份有百粒重表型的資源的重測序數(shù)據(jù)分析,發(fā)現(xiàn)有4個SNP在野生型和突變型所對應(yīng)的百粒重表型間存在極顯著差異,并且野生型變異材料的百粒重≥12g,而突變型變異材料的百粒重<12g。這4個SNP分別位于Glyma.05G019800、Glyma.07G022800、Glyma.13G259700和Glyma.13G261700這4個大豆基因中,可作為大豆百粒重候選基因,為后續(xù)相關(guān)的基因功能研究奠定基礎(chǔ)。