鮮小華 王 嘉 徐新福 曲存民 盧 坤 李加納 劉列釗,*
?
整合GWAS和WGCNA分析挖掘甘藍型油菜黃籽微效作用位點
鮮小華1,**王 嘉1,2,**徐新福1曲存民1盧 坤1李加納1劉列釗1,*
1西南大學(xué)農(nóng)學(xué)與生物科技學(xué)院 / 西南大學(xué)農(nóng)業(yè)科學(xué)研究院, 重慶 400715;2南充市農(nóng)業(yè)科學(xué)院, 四川南充 637000
甘藍型油菜是世界上最重要的油料作物之一, 黃籽是提高品質(zhì)的重要育種目標(biāo)。本研究以520份具有代表性的甘藍型油菜品種(系)為材料, 結(jié)合種子發(fā)育過程中8個時期的轉(zhuǎn)錄組數(shù)據(jù), 采取整合全基因組關(guān)聯(lián)分析(GWAS)和權(quán)重基因共表達網(wǎng)絡(luò)分析(WGCNA)的策略, 挖掘油菜黃籽性狀微效作用位點, 2年共檢測到199個SNP位點, 在SNP位點附近共挖掘出1826個名義候選基因。利用R語言中的WGCNA軟件包構(gòu)建了8個共表達模塊, 基因功能富集分析顯示, turquoise模塊和blue模塊與黃籽表型相關(guān)。苯丙烷代謝途徑、類黃酮途徑的關(guān)鍵基因、以及為turquoise模塊的樞紐基因(hub gene)。通過已知的黃籽相關(guān)基因, 挖掘出了一部分黃籽微效作用基因, 這些基因多參與苯丙烷、類黃酮以及原花青素代謝途徑。本研究挖掘的這些位點和候選基因可作為影響油菜黃籽形成的重要候選區(qū)域和基因, 有助于探究甘藍型油菜黃籽基因資源信息、揭示油菜黃籽性狀的遺傳基礎(chǔ)和分子機制、豐富分子育種理論以及提高油菜品質(zhì)。
甘藍型油菜; 黃籽; 全基因組關(guān)聯(lián)分析; 權(quán)重基因共表達網(wǎng)絡(luò)分析
甘藍型油菜(L.)是全世界廣泛種植的主要油料作物之一, 同時也是我國重要的油料、飼料和能源作物。黃籽是甘藍型油菜的一個重要性狀, 在相同的遺傳背景下, 甘藍型黃籽油菜比黑籽油菜具有更高的含油量和蛋白質(zhì)含量[1]。同時, 黃籽油菜種皮薄, 籽粒纖維含量低, 對飼料品質(zhì)更為有利; 其油質(zhì)清澈, 原油中色素含量少, 便于脫色加工[2]。因而對黃籽油菜的遺傳解析一直是油菜品質(zhì)育種的重要工作之一。甘藍型油菜種皮色澤不僅表現(xiàn)有純黑色和純黃色, 還表現(xiàn)出中間不同類型的顏色, 如紅色、紅褐色、黑褐色等, 表明種皮色澤不僅受主效位點控制, 同時也受微效多基因影響。
基于連鎖不平衡的全基因組關(guān)聯(lián)分析(genome- wide association study, GWAS), 又稱作關(guān)聯(lián)作圖或連鎖不平衡作圖, 其原理是利用自然群體中存在的豐富變異, 使用特定的統(tǒng)計方法尋找出與目標(biāo)性狀變異顯著相關(guān)的位點或基因組區(qū)段[3]。隨著生物信息學(xué)的迅猛發(fā)展以及測序成本的下降, GWAS被廣泛應(yīng)用于解析動植物復(fù)雜數(shù)量性狀的研究中。自Hasan等[4]首次將關(guān)聯(lián)分析應(yīng)用于甘藍型油菜種子硫苷含量的研究中以來, GWAS分析越來越頻繁地出現(xiàn)在甘藍型油菜重要數(shù)量性狀的遺傳研究中。在前期研究中, 我們對520份材料進行GWAS分析, 2年共檢測到22個SNP位點與黃籽表型顯著關(guān)聯(lián), 挖掘出14個與黃籽形成相關(guān)的基因[5]。與傳統(tǒng)的連鎖作圖相比較, GWAS具有耗時少、廣度大、精確度高等優(yōu)勢[6], 但也存在一定的局限性, 其面臨的最大的問題之一是其對微效多基因控制的數(shù)量性狀檢測能力不足, 難以準(zhǔn)確挖掘出微效作用位點, 產(chǎn)生遺傳性缺失現(xiàn)象(missing heritability)。
同樣是基于基因與性狀之間的關(guān)聯(lián)分析技術(shù), 權(quán)重基因共表達網(wǎng)絡(luò)分析(weighted gene co-expression network analysis, WGCNA)更加注重挖掘和呈現(xiàn)基因在不同樣本中的表達形式, 基于表達模式類似的分子可能參與特定生物學(xué)功能的理論[7], 利用基因表達數(shù)據(jù)構(gòu)建生物體內(nèi)基因間的潛在作用網(wǎng)絡(luò)體系, 以探索基因網(wǎng)絡(luò)與性狀之間的關(guān)聯(lián)關(guān)系。自該技術(shù)問世以來, 因其強大的分析效能, 在生物醫(yī)學(xué)研究中得到廣泛應(yīng)用[8], 隨后迅速擴大到多個研究領(lǐng)域并被廣泛運用?;赪GCNA能夠?qū)?fù)雜的數(shù)據(jù)降維并簡化為若干模塊, Weiss等[9]提出基因模塊相關(guān)性研究(gene module association study, GMAS)作為GWAS分析結(jié)果的補充。Farber[10]整合GWAS和WGCNA分析, 并成功發(fā)掘出在常規(guī)GWAS分析中沒有被發(fā)現(xiàn)的與骨密度相關(guān)的基因, 同時驗證了基因在骨代謝中的核心地位。該方法顯著提高了對微效基因的挖掘效率, 為GWAS解決自身的局限性找到了捷徑。本研究首次采用整合GWAS和WGCNA分析的策略, 對甘藍型油菜黃籽表型進行遺傳分析, 挖掘控制黃籽表型的相關(guān)作用位點, 旨在為甘藍型黃籽油菜育種研究提供有價值的信息和依據(jù)。
用于GWAS分析的群體由不同育成年代、不同生態(tài)區(qū)域的國內(nèi)外520份材料組成。在前期的研究中, 我們利用該群體已完成對黃籽R-value的GWAS分析, 本研究所使用的數(shù)據(jù)來源于前期發(fā)表的GWAS分析結(jié)果, 使用的甘藍型油菜種子發(fā)育和成熟過程中的基因表達譜數(shù)據(jù)來自NCBI數(shù)據(jù)庫中的GEO數(shù)據(jù)庫, 其注冊碼為GSE43918[11]。該數(shù)據(jù)包含8個取樣時間點(分別為開花后第10、第15、第20、第25、第30、第35、第40以及第45天), 每個時間點6個重復(fù)共計48個樣本。
采用相對寬松的5% FDR對GWAS分析結(jié)果進行多重校正, 獲得2014年和2015年名義上與黃籽性狀相關(guān)聯(lián)的基因集。利用BLAST, 將表達譜數(shù)據(jù)中的探針序列與候選基因比對, 篩選無錯配、無缺失的高質(zhì)量比對結(jié)果, 獲得該基因集的表達譜數(shù)據(jù), 對于多個探針比對到同一個基因的情況, 取平均值作為該基因的表達數(shù)據(jù)。
利用R軟件的WGCNA包完成共表達網(wǎng)絡(luò)構(gòu)建, 參考WGCNA官網(wǎng)(https://labs.genetics.ucla.edu/ horvath/CoexpressionNetwork/Rpackages/WGCNA/)上的tutorial完成[12]。首先, 對樣品聚類分析, 去除離群樣本; 為了盡量滿足無尺度網(wǎng)絡(luò)分布前提條件, 利用WGCNA提供的pickSoftThreshold函數(shù)計算軟閾值, 選取擬合曲線第一次接近0.9時的閾值參數(shù)β; 根據(jù)β值, 計算所有基因間的相關(guān)性創(chuàng)建鄰接矩陣, 將鄰接矩陣轉(zhuǎn)換為拓?fù)渚仃? 利用相異度進行拓?fù)渲丿B, 采取逐步法構(gòu)建基因聯(lián)系網(wǎng)絡(luò)。利用動態(tài)剪枝法識別共表達模塊, 設(shè)定每個模塊最低基因數(shù)為30個。計算每個模塊的特征向量基因ME (Module Eigengene)對模塊聚類作降維處理, 選擇相似性在75%以上模塊進行融合(MEDissThres=0.25)。
利用OS-tools的GO分析軟件分別對各模塊內(nèi)的基因進行富集分析, 選擇甘藍型油菜基因組作為背景, 以校正后FDR < 0.05作為顯著性閾值。利用相關(guān)系數(shù)法計算每個模塊特征值與性狀的相關(guān)性, 基于KEGG生物學(xué)通路數(shù)據(jù)庫(http://www.kegg.jp/), 對黃籽表型特異相關(guān)的模塊內(nèi)的基因進行通路富集分析。利用OS-tools網(wǎng)絡(luò)圖工具完成基因間的作用關(guān)系可視化展示。
如圖1所示, 在前期的研究中, 我們采用基于FWER標(biāo)準(zhǔn)的Bonferroni校正法對GWAS分析結(jié)果進行多重校正, 2年共檢測到22個顯著關(guān)聯(lián)位點[5]。為獲得更多微效關(guān)聯(lián)位點, 本研究采用相對寬松的FDR校正法進行多重校正, 經(jīng)校正, 2年共獲得199個顯著位點。根據(jù)該關(guān)聯(lián)群體的LD衰減距離, 在顯著位點上下游各50 kb內(nèi)的區(qū)域共挖掘出1826個候選基因。利用從NCBI數(shù)據(jù)庫中獲得的轉(zhuǎn)錄組數(shù)據(jù)探針序列, 與候選基因比對, 去除低質(zhì)量的比對結(jié)果, 共得到1461個低顯著性關(guān)聯(lián)基因的表達譜數(shù)據(jù)用于WGCNA分析。
利用R中的WGCNA軟件包對低顯著性關(guān)聯(lián)基因集進行加權(quán)基因共表達分析, 采取逐步法構(gòu)建共表達網(wǎng)絡(luò), 利用動態(tài)剪枝法識別共表達模塊, 共獲得8個模塊(表1和圖2-A), grey模塊代表未能分配到任何一個模塊的基因, 各模塊所包含基因數(shù)目差異較大, 最少的pink模塊僅包含49個基因, 最多的turquoise模塊則含有473個基因。對8個模塊分別進行GO (gene ontology)功能富集分析, 其中有4個模塊沒有富集到任何GO術(shù)語(GO term), 剩余4個模塊共富集到189個GO term, 最顯著的term是turquoise模塊中的苯丙烷生物合成過程(GO: 0009699, FDR=1.47E–04)。4個模塊中, turquoise模塊共富集到156個GO term, 其中多個GO term與原花青素、木質(zhì)素以及類黃酮生物合成相關(guān); blue模塊富集到6個GO term, 其中4個與木質(zhì)素的生物合成相關(guān)(GO:0045551、GO:0052747、GO: 0009698和GO:0009699)。同時, 樣本標(biāo)量矩陣與模塊特征向量相關(guān)性分析結(jié)果顯示, turquoise模塊有最高的相關(guān)性(= 0.63,= 2E–05), 其次為blue模塊(圖2-B)。
圖1 甘藍型油菜黃籽表型全基因組關(guān)聯(lián)分析結(jié)果的曼哈頓圖
灰色的虛線為Bonferroni校正閾值線, 紅色為FDR校正閾值線。
The gray horizontal dashed line indicates the Bonferroni threshold; the red horizontal dashed line indicates the FDR threshold.
表1 各模塊GO富集情況(部分)
對turquoise模塊進行KEGG富集分析, 最顯著的代謝通路為類黃酮生物合成途徑(ko00941,= 1.50E–07)和苯丙烷生物合成途徑(ko00940,= 1.88E–04)。在這個模塊中, 有7個基因?qū)儆陬慄S酮生物合成途徑, 其中6個在模塊中連通性排名前5%; 7個基因?qū)儆诒奖樯锖铣赏緩? 其中1個基因在這個模塊中連通性排名前五。有4個基因在這個模塊中連通性排名前10% (圖3)。利用OS-tools網(wǎng)絡(luò)圖工具, 選擇軟閾值作為連通性計算方法, 對turquoise模塊中weight ≥ 0.4的基因共表達網(wǎng)絡(luò)圖進行可視化,()、、()、()、()、()等基因處于該網(wǎng)絡(luò)的中心, 具有較高的連通性。其中是苯丙烷代謝途徑的關(guān)鍵基因,是已知的花色苷生物合成途徑末端的一個關(guān)鍵酶基因, 而是類黃酮代謝途徑的關(guān)鍵酶基因之一(圖4)。作為原花青素途徑上游代謝途徑的關(guān)鍵基因, 它們之間分享大量相同的共表達基因, 表明在模塊中, 基因功能之間存在顯著的協(xié)同性。
圖2 基因共表達網(wǎng)絡(luò)構(gòu)建結(jié)果
A: 基因的聚類與模塊構(gòu)建; B: 特征與模塊相關(guān)性分析。
A: the cluster of genes and construction of modules; B: correlation analysis between characteristics and modules.
圖3 turquoise模塊的KEGG富集分析
基因是turquoise模塊的一個核心基因, 其連通性在整個網(wǎng)絡(luò)中排第九, 模塊中排名第八, 在擬南芥中是花色苷生物合成途徑末端的一個關(guān)鍵酶基因。此外,()和()基因雖然在模塊內(nèi)連通性排名僅為22和269, 但它們的擬南芥同源基因是原花青素途徑的關(guān)鍵基因(編碼花青素還原酶ANR是類黃酮途徑中決定底物是否轉(zhuǎn)向原花青素途徑的關(guān)鍵基因[13];編碼的LAC15參與原花青素的進一步多聚化和氧化, 賦予種皮棕色[14])。本研究分別以、和為中心, 篩選連通性排名前20的基因構(gòu)建局部調(diào)控網(wǎng)絡(luò)(圖5-A)。整個局部網(wǎng)絡(luò)共54個基因, 其中, 多個基因已知在苯丙烷合成代謝、類黃酮合成代謝中發(fā)揮著作用(表2)。
圖4 turquoise模塊內(nèi)的基因共表達網(wǎng)絡(luò)
()基因是blue模塊的一個核心基因, 其連通性在模塊中排名第3, 在擬南芥中對種皮色素的形成有重要作用。本研究以基因為核心, 篩選weight ≥ 0.3的調(diào)控關(guān)系以及相關(guān)基因構(gòu)建局部調(diào)控網(wǎng)絡(luò)(圖5-B)。整個局部網(wǎng)絡(luò)包含95個基因, 通過GO富集分析發(fā)現(xiàn)這個亞模塊有8個term顯著富集, 包括苯丙烷代謝過程(GO:0009698,= 1.41E–06)、次生代謝過程(GO:0019748,= 6.20E–06)、次生代謝產(chǎn)物生物合成過程(GO:0044550,= 1.52E–06)等。其中, 多個基因直接或間接參與苯丙烷-類黃酮-原花青素途徑(表2)。這些信息在常規(guī)的GWAS分析中并沒有被檢測到, 只有通過WGCNA分析才被挖掘出來。
GWAS在動植物復(fù)雜性狀研究上的應(yīng)用, 很大程度上增強了研究者對這些復(fù)雜性狀遺傳機制的理解。但是, GWAS應(yīng)用的難點在于有效過濾假陽性的同時挖掘微效作用位點。作為主要依賴統(tǒng)計分析的研究方法, GWAS在檢測的過程中會引入大量的假陽性結(jié)果, 為了控制多重檢驗帶來的虛報, 一般采用多重校正的方法[15]。然而, 無論采用何種校正方法, 都不能從根本上解決假陽性關(guān)聯(lián)問題, 過于保守的校正還會導(dǎo)致假陰性結(jié)果的出現(xiàn)。此外, 微效作用位點對性狀的貢獻率都非常小, 經(jīng)過多重校正后往往達不到顯著水平, 其顯著性淹沒在背景噪音中, 難以被準(zhǔn)確挖掘出來。為了解決這一難題, 多位學(xué)者提出了不同的策略, 如基于單體型的關(guān)聯(lián)分析(Haplotype-based GWAS)[16]、基于基因的關(guān)聯(lián)分析(Gene-based GWAS)[17]、利用CNV變異的GWAS[18]以及類似于Haplotype-based GWAS的RTM-GWAS方法[19]等。Farber[10]首次以WGCNA分析作為對GWAS分析的補充, 挖掘影響骨密度的微效作用位點, 其結(jié)果表明, 使用WGCNA策略對GWAS分析得到的大量的“名義”顯著基因進行篩選, 能夠提高二階段關(guān)聯(lián)分析驗證的驗證率。本研究整合GWAS和WGCNA, 挖掘影響黃籽表型相關(guān)的微效作用位點, 發(fā)現(xiàn)了大量與種皮色素形成相關(guān)的基因, 例如等原花青素途徑的關(guān)鍵基因, 這些基因在我們前期的GWAS分析中因沒有達到校正閾值而未被發(fā)現(xiàn), 說明整合GWAS和WGCNA分析能夠提高對黃籽表型微效作用位點的挖掘效率。
圖5 樞紐基因相關(guān)的局部調(diào)控網(wǎng)絡(luò)
紅圈強調(diào)的基因參與類黃酮-原花青素途徑。A: turquoise模塊; B: blue模塊。
The highlighted genes involved in flavonoid-proanthocyanidin pathways. A: turquoise module; B: blue module.
甘藍型油菜種子發(fā)育過程中種皮色澤的變化主要受原花色素、多酚和木質(zhì)素及其衍生物等重要次生代謝物質(zhì)的影響[20], 控制類黃酮合成途徑相關(guān)基因在種皮色澤形成中扮演著重要角色[21-25]。原花青素途徑是類黃酮代謝途徑中的重要分支之一, 同時在擬南芥中該途徑的產(chǎn)物能夠特異地在種皮中積累,是種皮顏色變化的主要原因[13]。在本研究中, 與黃籽表型相關(guān)性最高的turquoise模塊顯著地富集到了類黃酮合成代謝過程、原花青素的生物合成過程等GO term, 同時基于共表達網(wǎng)絡(luò)hub gene挖掘出的基因大部分參與了苯丙烷-類黃酮途徑, 而這些基因大部分未被傳統(tǒng)的GWAS分析發(fā)現(xiàn)。此外, turquoise模塊和blue模塊均富集到了苯丙烷和木質(zhì)素途徑, 作為類黃酮途徑的上游途徑和相鄰?fù)緩? 相關(guān)基因被劃分到同一模塊內(nèi), 表明其在轉(zhuǎn)錄水平上的相關(guān)性和功能上的協(xié)調(diào)性。上述結(jié)果進一步表明, 整合GWAS和WGCNA分析不僅可以提高對微效作用位點的挖掘效率, 而且也大大提升了GWAS的發(fā)展空間, 使其能夠進一步為人類了解動植物復(fù)雜性狀的遺傳基礎(chǔ)及分子機制提供更多的線索。
本研究使用相對寬松的FDR進行多重校正, 篩選出超過1800個名義上的關(guān)聯(lián)基因, 但5%的FDR閾值線依然高達3.62 (= 2.41E–4, –lg () ≈ 3.62), 導(dǎo)致忽略掉了一部分更微效的位點。因此, 在以后的研究中, 整合GWAS和WGCNA分析必須協(xié)調(diào)好最大限度挖掘微效位點和盡可能過濾掉假陽性結(jié)果以避免消耗大量計算資源。此外, 在表型特異模塊內(nèi)基因的梳理過程中, 本研究發(fā)現(xiàn)原本顯著關(guān)聯(lián)的部分基因(和)并沒有被劃分入turquoise模塊或者blue模塊, 推測WGCNA共表達模塊的劃分是基于基因間表達量的相關(guān)性, 而基因的表達量受多種因素影響, 導(dǎo)致一部分真實關(guān)聯(lián)基因被劃分到其他模塊。盡管如此, 整合GWAS和WGCNA分析得到的這些信息, 仍然可以為其他的實驗提供一些參考, 同時也可為探究甘藍型油菜黃籽基因資源信息、豐富分子育種理論奠定基礎(chǔ)。
采用整合全基因組關(guān)聯(lián)分析(GWAS)和權(quán)重基因共表達網(wǎng)絡(luò)分析(WGCNA)的策略, 挖掘油菜黃籽性狀微效作用位點, 2年共檢測到199個SNP位點, 在SNP位點附近共挖掘出1826個名義候選基因?;诤蜻x基因表達譜數(shù)據(jù)構(gòu)建了8個共表達模塊, 其中turquoise模塊和blue模塊與黃籽表型相關(guān)性最高。、、等苯丙烷代謝途徑、類黃酮途徑的關(guān)鍵酶基因為turquoise模塊的樞紐基因(hub gene)。通過已知的黃籽相關(guān)基因, 挖掘出了一部分黃籽微效作用基因, 這些基因多參與苯丙烷、類黃酮以及原花青素代謝途徑。
[1] Wittkop B, Snowdon R J, Friedt W. Status and perspectives of breeding for enhanced yield and quality of oilseed crops for Europe., 2009, 170: 131
[2] 張永泰, 李愛民, 蔣金金, 王娟, 王幼平. 新型黃籽甘藍型油菜的獲得及其遺傳規(guī)律分析. 中國油料作物學(xué)報, 2011, 33: 302–306 Zhang Y T, Li A M, Jiang J J, Wang J, Wang Y P. Discovery and genetics of new type of yellow seed., 2011, 33: 302–306 (in Chinese with English abstract)
[3] Remington D L, Thornsberry J M, Matsuoka Y, Wilson L M, Whitt S R, Doebley J, Kresovich S, Goodman M M, and Buckler E S. Structure of linkage disequilibrium and phenotypic associations in the maize genome., 2001, 98: 11479–11484
[4] Hasan M, Friedt W, Pons-Kuehnemann J, Freitag N M, Link K, Snowdon R J. Association of gene-linked SSR markers to seed glucosinolate content in oilseed rape (ssp).2008, 116: 1035–1049
[5] Wang J, Xian X H, Xu X F, Qu C M, Lu K, Li J N, Liu L Z. Genome wide association mapping of seed coat color in., 2017, 65: 5229–5237
[6] 楊小紅, 嚴(yán)建兵, 鄭艷萍, 余建明, 李建生. 植物數(shù)量性狀關(guān)聯(lián)分析研究進展, 作物學(xué)報, 2007, 33: 523–530 Yang X H, Yan J B, Zheng Y P, Yu J M, Li J S. Reviews of association analysis for quantitative traits in plants., 2007, 33: 523–530 (in Chinese with English abstract)
[7] Zhang B, Horvath S. A general framework for weighted gene co-expression network analysis., 2005, 4: 17
[8] 劉偉, 李立, 葉樺, 屠偉. 權(quán)重基因共表達網(wǎng)絡(luò)分析在生物醫(yī)學(xué)中的應(yīng)用. 生物工程學(xué)報, 2017, 33: 1791–1801 Liu W, Li L, Ye H, Tu W. Weighted gene co-expression network analysis in biomedicine research., 2017, 33: 1791–1801 (in Chinese with English abstract)
[9] Weiss J N, Karma A, MacLellan W R, Deng M, Rau C D, Rees C N, Wang J, Wisniewski N, Eskin E, Horvath S, Qu Z L, Wang Y B, Lusis A J. “Good enough solutions” and the genetics of complex diseases., 2012, 111: 493–504
[10] Farber C R. Systems-level analysis of genome-wide association data., 2013, 3: 119–129
[11] Huang D, Koh C, Feurtado J A, Tsang E W, Cutler A J. MicroRNAs and their putative targets inseed maturation., 2013, 14:140
[12] Langfelder P, Horvath S. WGCNA: an R package for weighted correlation network analysis., 2008, 9: 559
[13] 甘蓓, 楊紅玉. 擬南芥中類黃酮代謝途徑及其調(diào)控. 安徽農(nóng)業(yè)科學(xué), 2008, 36: 5290–5292 Gan B, Yang H Y. Metabolic approach of flavonoids and its regulation in., 2008, 36: 5290–5292 (in Chinese with English abstract)
[14] Pourcel L, Routaboul J M, Kerhoas L, Caboche M, Lepiniec L, Debeaujon I.encodes a laccase-like enzyme involved in oxidative polymerization of flavonoids inseed coat., 2005, 17: 2966–2980
[15] 黃楊岳, 孔祥禎, 甄宗雷, 劉嘉. 全基因組關(guān)聯(lián)研究中的多重校正方法比較. 心理科學(xué)進展, 2013, 21: 1874–1882 Huang Y Y, Kong X Z, Zhen Z L, Liu J. The comparison of multiple testing corrections methods in genome-wide association studies., 2013, 21: 1874–1882
[16] Sato S, Uemoto Y, Kikuchi T, Egawa S, Kohira K, Saito S, Sakuma H, Miyashita S, Arata S, Kojima T, Suzuki K. SNP- and haplotype-based genome-wide association studies for growth, carcass, and meat quality traits in a Duroc multigenerational population., 2016, 17: 60
[17] Zhang W, Li J, Guo Y, Zhang L, Xu L, Gao X, Zhu B, Gao H, Ni H, Chen YMulti-strategy genome-wide association studies identify the DCAF16-NCAPG region as a susceptibility locus for average daily gain in cattle., 2016, 6: 38073
[18] Marshall C R, Howrigan D P, Merico D, Thiruvahindrapuram B, Wu W, Greer D S, Antaki D, Shetty A, Holmans P A, Pinto D, Gujral M, Brandler W M, Malhotra D, Wang Z, Fajarado K V F, Maile M S, Ripke S, Agartz I, Albus M, Alexander M, Amin F, Atkins J, Bacanu S A, Belliveau R A, Bergen S E, Bertalan M, Bevilacqua E, Bigdeli T B, Black D W, Bruggeman R, Buccola N G, Buckner R L, Bulik-Sullivan B, Byerley W, Cahn W, Cai G, Cairns M J, Campion D, Cantor R M, Carr V J, Carrera N, Catts S V, Chambert K D, Cheng W, Cloninger C R, Cohen D, Cormican P, Craddock N, Crespo-Facorro B, Crowley J J, Curtis D, Davidson M, Davis K L, Degenhardt F, Del Favero J, DeLisi L E, Dikeos D, Dinan T, Djurovic S, Donohoe G, Drapeau E, Duan J, Dudbridge F, Eichhammer P, Eriksson J, Escott-Price V, Essioux L, Fanous A H, Farh K H, Farrell M S, Frank J, Franke L, Freedman R, Freimer N B, Friedman J I, Forstner A J, Fromer M, Genovese G, Georgieva L, Gershon E S, Giegling I, Giusti-Rodríguez P, Godard S, Goldstein J I, Gratten J, de Haan L, Hamshere M L, Hansen M, Hansen T, Haroutunian V, Hartmann A M, Henskens F A, Herms S, Hirschhorn J N, Hoffmann P, Hofman A, Huang H, Ikeda M, Joa I, K?hler A K, Kahn R S, Kalaydjieva L, Karjalainen J, Kavanagh D, Keller M C, Kelly B J, Kennedy J L, Kim Y, Knowles J A, Konte B, Laurent C, Lee P, Lee S H, Legge S E, Lerer B, Levy D L, Liang K Y, Lieberman J, L?nnqvist J, Loughland C M, Magnusson P K E, Maher B S, Maier W, Mallet J, Mattheisen M, Mattingsdal M, McCarley R W, McDonald C, McIntosh A M, Meier S, Meijer C J, Melle I, Mesholam-Gately R I, Metspalu A, Michie P T, Milani L, Milanova V, Mokrab Y, Morris D W, Müller-Myhsok B, Murphy K C, Murray R M, Myin-Germeys I, Nenadic I, Nertney D A, Nestadt G, Nicodemus KK, Nisenbaum L, Nordin A, O’Callaghan E, O’Dushlaine C, Oh S Y, Olincy A, Olsen L, O'Neill F A, Van Os J, Pantelis C, Papadimitriou G N, Parkhomenko E, Pato M T, Paunio T, Perkins D O, Pers T H, Pietil?inen O, Pimm J, Pocklington A J, Powell J, Price A, Pulver A E, Purcell S M, Quested D, Rasmussen H B, Reichenberg A, Reimers M A, Richards A L, Roffman J L, Roussos P, Ruderfer D M, Salomaa V, Sanders A R, Savitz A, Schall U, Schulze T G, Schwab S G, Scolnick E M, Scott R J, Seidman L J, Shi J, Silverman J M, Smoller J W, S?derman E, Spencer C C A, Stahl E A, Strengman E, Strohmaier J, Stroup T S, Suvisaari J, Svrakic D M, Szatkiewicz J P, Thirumalai S, Tooney P A, Veijola J, Visscher P M, Waddington J, Walsh D, Webb B T, Weiser M, Wildenauer D B, Williams N M, Williams S, Witt S H, Wolen A R, Wormley B K, Wray N R, Wu J Q, Zai C C, Adolfsson R, Andreassen O A, Blackwood D H R, Bramon E, Buxbaum J D, Cichon S, Collier D A, Corvin A, Daly M J, Darvasi A, Domenici E, Esko T, Gejman P V, Gill M, Gurling H, Hultman C M, Iwata N, Jablensky A V, J?nsson E G, Kendler K S, Kirov G, Knight J, Levinson D F, Li Q S, McCarroll S A, McQuillin A, Moran J L, Mowry B J, N?then M M, Ophoff R A, Owen M J, Palotie A, Pato C N, Petryshen T L, Posthuma D, Rietschel M, Riley B P, Rujescu D, Sklar P, St Clair D, Walters J T R, Werge T, Sullivan P F, O’Donovan M C, Scherer S W, Neale B M, Sebat J. Contribution of copy number variants to schizophrenia from a genome-wide study of 41,321 subjects., 2017, 49: 27–35
[19] He J, Meng S, Zhao T, Xing G, Yang S, Li Y, Guan R, Lu J, Wang Y, Xia Q, Yang B, Gai J. An innovative procedure of genome–wide association analysis fits studies on germplasm population and plant breeding., 2017, 130: 2327–2343
[20] 葉小利, 李加納, 唐章林, 梁穎, 諶利. 甘藍型油菜種皮色澤及相關(guān)性狀的研究. 作物學(xué)報, 2001, 27: 550–556 Ye X L, Li J N, Tang Z L, Liang Y, Chen L. Study on seed coat color and related characters of., 2001, 27: 550–556 (in Chinese with English abstract)
[21] Fu F Y, Liu L Z, Chai Y R, Chen L, Yang T, Jin M Y, Ma A F, Yan X Y, Zhang Z S, Li J N. Localization of QTLs for seed color using recombinant inbred lines ofin different environments., 2007, 50: 840–854
[22] Chai Y R, Lei B, Huang H L, Li J N, Yin J M, Tang Z L, Wang R, Chen L.genes fromand parental species: cloning, evolution, and differential involvement in yellow seed trait., 2009, 281: 109–123
[23] Zhang J, Lu Y, Yuan Y, Zhang X, Geng J, Chen Y, Cloutier S, McVetty P B, Li G. Map-based cloning and characterization of a gene controlling hairiness and seed coat color traits in., 2009, 69: 553–563
[24] Stein A, Wittkop B, Liu L, Obermeier C, Friedt W, Snowdon R J. Dissection of a major QTL for seed colour and fibre content inreveals colocalization with candidate genes for phenylpropanoid biosynthesis and flavonoid deposition., 2013, 132: 382–389
[25] Padmaja L K, Agarwal P, Gupta V, Mukhopadhyay A, Sodhi Y S, Pental D, Pradhan A K. Natural mutations in two homoeologousgenes control yellow seed coat trait in allotetraploid(AABB)., 2014, 127: 339–347
Mining Yellow-seeded Micro Effect Loci inby Integrated GWAS and WGCNA Analysis
XIAN Xiao-Hua1,**, WANG Jia1,2,**, XU Xin-Fu1, QU Cun-Min1, LU Kun1, LI Jia-Na1, and LIU Lie-Zhao1,*
1College of Agronomy and Biotechnology / Academy of Agricultural Sciences, Southwest University, Chongqing 400715, China;2Nanchong Academy of Agricultural Sciences, Nanchong 637000, Sichuan, China
is one of the most important oil crops in the world, and developing yellow-seededwith improved qualities is a major breeding goal. The yellow-seeded minor genes were mined by genome-wide association study (GWAS) and weighted gene co-expression network analysis (WGCNA) with 520 representative varieties (or lines) and the transcriptional data at eight time points during the seed development. The 199 SNPs and 1826 nominally significant GWAS candidate genes were detected. Weighted gene co-expression network analysis was performed using the WGCNA R package to construct the resulting network composing eight distinct gene modules. Among them, the turquoise module and the blue module were related to the seed coat color based on gene function enrichment analysis.,, and, the key enzymes genes of phenylpropane metabolic pathway and flavonoid metabolic pathway were found in turquoise module. Through the characterization of module content and topology, we mined a number of micro effect genes based on known yellow-seed related genes mainly involved in the phenylpropanoid metabolic process, flavonoid metabolic process and proanthocyanidin biosynthetic process. This information of minor loci and candidate genes should be useful in the breeding for yellow-seeded.
; yellow-seeded; GWAS; WGCNA
2018-06-09;
2018-06-11.
10.3724/SP.J.1006.2018.01105
劉列釗, E-mail: liezhao2003@126.com, Tel: 023-68251383
**同等貢獻(Contributed equally to this work)
鮮小華, E-mail: xxm920423@126.com, 王嘉, E-mail: wangjia0724@126.com
2018-01-29;
本研究由國家自然科學(xué)基金項目(31771830), 重慶市科委項目(cstc2016shmszx80083)和中央高?;究蒲袠I(yè)務(wù)費專項(XDJK2017A009)項目資助。
This study was supported by the National Natural Science Foundation of China (31771830), the Science and Technology Committee of Chongqing (cstc2016shmszx80083), and the Fundamental Research Funds for the Central Universities (XDJK2017A009).
URL:http://kns.cnki.net/kcms/detail/11.1809.S.20180611.0904.008.html