• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      小麥高質(zhì)量SNP對產(chǎn)量及根系表型的潛在影響分析與在線數(shù)據(jù)庫的構(gòu)建

      2023-10-31 02:58:00胡尊鎧朱志偉劉子輝王曉明許盛寶
      西北農(nóng)業(yè)學(xué)報 2023年11期
      關(guān)鍵詞:表型基因組根系

      胡尊鎧,朱志偉,劉子輝,趙 鵬,王曉明,許盛寶

      (西北農(nóng)林科技大學(xué) 農(nóng)學(xué)院,陜西楊凌 712100)

      小麥(TriticumaestivumL.)是全球種植范圍最廣泛的作物之一,為人類提供了20%的食物來源,其產(chǎn)量與人類的生存息息相關(guān),而根系作為小麥扎根地下的器官,對小麥吸收土壤中的水分和營養(yǎng)物質(zhì)起到至關(guān)重要的作用[1-2]。隨著下一代測序技術(shù)(Next-generation sequencing,NGS)的快速發(fā)展,分子標(biāo)記輔助育種已經(jīng)成為較為前沿的手段。分子標(biāo)記種類有很多,例如簡單重復(fù)序列(SSR)、限制性片段長度多態(tài)性(RFLP)、隨機擴增多態(tài)性DNA(RAPD)、任意引物PCR(AP-PCR)以及單核苷酸多態(tài)性(SNP)等[3-6]。相比于其他分子標(biāo)記,SNP標(biāo)記有著遺傳穩(wěn)定性較高、位點豐富、分布較為廣泛以及代表性強等特點,已經(jīng)被廣泛用于各種生物學(xué)研究[7-9]。但是將原始測序數(shù)據(jù)轉(zhuǎn)化為儲存變異信息的SNP數(shù)據(jù)需要使用大量的命令行工具以及編程語言腳本,這對于幾乎沒有生物信息學(xué)經(jīng)驗的生物學(xué)家以及育種家來說,是一項及其耗時耗力的工作。隨著計算機科學(xué)以及生物信息學(xué)的不斷發(fā)展,由專門的生物信息學(xué)研究人員將原始測序數(shù)據(jù)轉(zhuǎn)化為儲存變異信息的結(jié)果文件,利用在線數(shù)據(jù)庫將這些信息通過網(wǎng)頁展示并提供查詢、分析以及下載,使研究人員不需要專門學(xué)習(xí)生物信息學(xué)技能便可以對需要的信息進(jìn)行檢索和利用。

      其他植物在線數(shù)據(jù)庫的應(yīng)用度要高于小麥,比如擬南芥的PHOSPHAT磷酸化位點數(shù)據(jù)庫、GENEVESTIGATOR微陣列數(shù)據(jù)庫、SUBA亞細(xì)胞數(shù)據(jù)庫、ARACYC生化途徑數(shù)據(jù)庫以及DATF轉(zhuǎn)錄因子數(shù)據(jù)庫等[10-14];水稻的RAP-DB基因組數(shù)據(jù)庫、ORYZABASE基因組數(shù)據(jù)庫、RICEVARMAP基因組數(shù)據(jù)庫以及RMD突變體數(shù)據(jù)庫等[15-18]。小麥由于其基因組較為龐大和復(fù)雜,導(dǎo)致參考基因組測序完成的時間較晚,因此小麥可供查詢和使用的SNP數(shù)據(jù)庫屈指可數(shù),這嚴(yán)重制約了小麥研究的推進(jìn)。因此利用小麥苗期根系轉(zhuǎn)錄組數(shù)據(jù)開發(fā)的原始SNP過濾得到高質(zhì)量SNP,研究其對小麥產(chǎn)量及根系等相關(guān)性狀存在的潛在影響,并以此為基礎(chǔ)構(gòu)建數(shù)據(jù)庫,為分子標(biāo)記輔助育種提供參考。

      本研究利用413份小麥自然材料苗期根系轉(zhuǎn)錄組測序數(shù)據(jù)開發(fā)高質(zhì)量SNP標(biāo)記,根據(jù)該群體產(chǎn)量、根系等相關(guān)性狀的表型觀測數(shù)據(jù),鑒定這些SNP標(biāo)記對產(chǎn)量以及根部表型存在的潛在影響,并將過濾得到的高質(zhì)量SNP標(biāo)記構(gòu)建在線數(shù)據(jù)庫,為后續(xù)的分子標(biāo)記輔助育種提供參考。

      1 材料與方法

      1.1 試驗材料

      413份收集自世界各地的小麥材料構(gòu)成的自然群體。所有材料的詳細(xì)信息見數(shù)據(jù)庫首頁的Variety information部分(https://iwheat.net/links/)。

      1.2 試驗設(shè)計

      1.2.1 田間試驗 2018-2019、2019-2020和2020-2021年,在陜西省咸陽市楊陵區(qū)曹新莊試驗農(nóng)場進(jìn)行兩個播期的播種,分別為當(dāng)年10月初的正常播種和次年1月中旬的晚播;2018-2019年和2020-2021年,在四川省崇州市四川農(nóng)業(yè)大學(xué)現(xiàn)代農(nóng)業(yè)研究基地當(dāng)年10月末進(jìn)行正常播種。采取隨機區(qū)組設(shè)計進(jìn)行試驗,每個地點均設(shè)計3個重復(fù),品種間均以行長1 m、行距20 cm種植,每行點播10粒種子,并根據(jù)當(dāng)?shù)氐臍夂蚝偷刭|(zhì)狀況進(jìn)行田間管理。

      1.2.2 根系培養(yǎng)試驗 對每份供試小麥材料分別選取籽粒飽滿且大小均勻一致的種子16 粒。將種子分別裝入15 mL離心管,注入無菌蒸餾水常溫浸泡6 h。用消毒液對種子表面消毒10 min,使用蒸餾水沖洗干凈,注入1 mL無菌蒸餾水于4 ℃冰箱低溫處理2 d。在發(fā)芽盒中鋪入濾紙,并將種子移入,注入5 mL無菌蒸餾水后用保鮮膜封口,并戳6~9 個小孔通氣。將發(fā)芽盒放入培養(yǎng)箱培養(yǎng)14 d(溫度:光照條件下24 ℃,黑暗條件下20 ℃;濕度:50%;光照度:2 000 lx;光照 16 h;黑暗8 h),期間定期補充無菌蒸餾水,保證濾紙?zhí)幱跐駶櫊顟B(tài)。

      1.3 表型測定

      1.3.1 產(chǎn)量表型測定 對產(chǎn)量性狀使用下述標(biāo)準(zhǔn)進(jìn)行調(diào)查:有效分蘗數(shù)(Productive tiller number,PTN):人工統(tǒng)計小麥能夠抽穗并結(jié)實的分蘗;穗粒數(shù)(Kernel number per spike,KNS):人工統(tǒng)計每個小穗的籽粒數(shù);千粒質(zhì)量(Thousand kernel mass,TKM):使用SC-G谷粒外觀質(zhì)量快速圖像分析系統(tǒng)分析1 000粒籽粒的質(zhì)量。

      1.3.2 根系表型測定 將培養(yǎng)箱中生長14 d的小麥初生根于貼近種子處剪下,擦干表面水分并稱重,獲得根鮮質(zhì)量(Root fresh mass,RFM),利用萬深LA-S植物根系掃描儀進(jìn)行根系表型掃描。通過萬深LA-S根系分析系統(tǒng)(V.2.6.4.4)分析每個小麥材料根表面積(Root surface area,RS)和根體積(Root volume,RV)數(shù)據(jù)。

      1.4 表型數(shù)據(jù)處理

      使用Excel 2019(Microsoft Office Home and Student 2019)和Python(3.7.4)程序語言處理產(chǎn)量以及根部表型的觀測數(shù)值,利用R語言(3.6.4)的R包Lme4計算產(chǎn)量相關(guān)的多年多點表型觀測值的最佳線性無偏估計值(Best linear unbiased estimate,BLUE)。

      1.5 高質(zhì)量SNP標(biāo)記過濾

      對西北農(nóng)林科技大學(xué)小麥非生物脅迫耐受機理實驗室前期開發(fā)的原始SNP文件,使用以下標(biāo)準(zhǔn)進(jìn)行過濾:只保留純合基因型,并且每個樣本的支持reads必須大于等于30。根據(jù)上述參數(shù),未通過的SNP被認(rèn)定為缺失,通過的SNP認(rèn)定為高質(zhì)量SNP。

      1.6 顯著性檢驗

      按照SNP的基因型將小麥群體分為兩個基因型亞群,對兩個亞群的表型進(jìn)行顯著性檢驗,結(jié)合隨機抽樣的置換檢驗。使用Python語言的Scipy模塊中的stats功能進(jìn)行顯著性檢驗,首先檢驗兩組試驗數(shù)據(jù)的方差齊性,若方差齊性通過檢驗,參數(shù)equal_var設(shè)置為True,否則該參數(shù)設(shè)置為Fasle。為去除偶然性帶來的影響,使用Python的random函數(shù),對需要顯著性檢驗的數(shù)據(jù)進(jìn)行隨機抽樣,每次抽取80%的數(shù)據(jù),抽樣1 000次,取超過800次顯著的結(jié)果為通過置換檢驗的結(jié)果。顯著性檢驗閾值參考Bonferroni矯正,取0.05/SNP總數(shù)=1×10-7。

      1.7 在線數(shù)據(jù)庫搭建

      利用R語言Shiny框架對數(shù)據(jù)庫進(jìn)行構(gòu)建。整體的數(shù)據(jù)庫構(gòu)建流程如圖 1所示,使用R語言shiny包搭建web框架,分別編寫UI模塊以及Server模塊,UI模塊用于設(shè)計web網(wǎng)頁的頁面前端布局以及頁面,本數(shù)據(jù)庫對UI模塊使用R包shinydashboard對前端頁面進(jìn)行設(shè)計,Server模塊的代碼負(fù)責(zé)后端程序的功能實現(xiàn)并且控制輸出,將上述結(jié)果整合到CSV文件后,借助R包DT將數(shù)據(jù)在網(wǎng)頁數(shù)據(jù)庫的前端界面中輸出,并且在Server模塊中結(jié)合CSS語言代碼塊對數(shù)據(jù)庫表格進(jìn)行外觀屬性配置。

      圖1 在線數(shù)據(jù)庫搭建流程Fig.1 Processfor constructionof online database

      2 結(jié)果與分析

      2.1 表型分析

      通過對413份供試材料的產(chǎn)量(有效分蘗數(shù)、千粒質(zhì)量和穗粒數(shù))和根系(根體積、根表面積和根鮮質(zhì)量)相關(guān)性狀的表型觀測值進(jìn)行統(tǒng)計分析,結(jié)果表明,產(chǎn)量與根系相關(guān)性狀的表型變異系數(shù)為10%~22%,品種之間存在廣泛的表型變異;表型的偏度系數(shù)的絕對值都<1,除穗粒數(shù)表型之外,其他表型的峰度系數(shù)的絕對值也都<1,這表明本研究所使用群體表型數(shù)據(jù)均呈現(xiàn)正態(tài)分布,符合數(shù)量性狀的特征,說明本研究的目標(biāo)性狀為多基因控制的數(shù)量性狀(表 1)。相關(guān)性分析表明根系表型之間呈現(xiàn)極顯著的強烈正相關(guān),而產(chǎn)量性狀之間呈現(xiàn)顯著的負(fù)相關(guān)關(guān)系;千粒質(zhì)量與根部表型之間呈現(xiàn)顯著正相關(guān)關(guān)系,有效分蘗數(shù)與根部表型呈現(xiàn)顯著的負(fù)相關(guān)關(guān)系,穗粒數(shù)與根部表型之間不存在相關(guān)關(guān)系(表 2)。

      表1 產(chǎn)量及根部相關(guān)性狀的統(tǒng)計分析Table 1 Statistical analysis of yield and root-related traits

      表2 產(chǎn)量及根部相關(guān)性狀的相關(guān)性分析Table 2 Correlation analysis of yield and root-related traits

      2.2 SNP分布特征

      通過對小麥苗期根系轉(zhuǎn)錄組數(shù)據(jù)的過濾以及質(zhì)量控制,在其中篩選出高質(zhì)量SNP標(biāo)記 45 898個,在小麥A、B和D亞基因組上鑒定到的SNP數(shù)目分別為19 381、22 444和4 073,其中B亞基因組含有的SNP最多,而D亞基因組上鑒定到的SNP數(shù)目遠(yuǎn)小于A亞基因組和B亞基因組。從染色體的分布上看,2B染色體上存在的SNP最多(3 973個),4D染色體上存在的SNP最少(173個)(表 3)。

      表3 小麥自然群體SNP標(biāo)記基本統(tǒng)計分析Table 3 Basic statistical analysis of SNP markers in natural populations of wheat

      2.3 SNP對表型的影響

      為檢驗本試驗群體過濾得到的高質(zhì)量SNP標(biāo)記對小麥產(chǎn)量性狀的影響,選取所有高質(zhì)量SNP,根據(jù)其基因型對群體進(jìn)行分組,并采用顯著性檢驗分析不同基因型對產(chǎn)量性狀的影響。結(jié)果表明,在產(chǎn)量相關(guān)性狀上,有123個SNP的2種基因型間千粒質(zhì)量存在顯著差異,其中87%的SNP突變后會增加千粒質(zhì)量;有299個SNP的2種基因型間穗粒數(shù)存在顯著差異,其中92%的SNP突變后會減少穗粒數(shù);有1 660個SNP的2種基因型間有效分蘗數(shù)存在顯著差異,其中41%的SNP突變后會增加有效分蘗數(shù)。在根系相關(guān)性狀上,有51個SNP的2種基因型間根表面積存在顯著差異,這些SNP突變后全部增加根表面積;有121個SNP的2種基因型間根體積存在顯著差異,其中97%的SNP突變后增加根體積;有97個SNP的2種基因型間根鮮質(zhì)量存在顯著差異,其中98%的SNP突變后增加根鮮質(zhì)量 (表 4)。

      表4 SNP對表型的潛在影響Table 4 Potential effect of SNPs on phenotype

      2.4 數(shù)據(jù)庫使用

      本數(shù)據(jù)庫包含3個部分,分別為小麥群體材料信息部分(Variety Information)、高質(zhì)量SNP查詢部分(Population SNP Database)以及小麥群體標(biāo)記數(shù)據(jù)下載部分(SNP Data Download)。

      小麥群體材料信息包含413份小麥材料的編號、名稱、類型(農(nóng)家種或現(xiàn)代栽培種)以及種植地區(qū)。該模塊內(nèi)容見圖 2。

      高質(zhì)量SNP標(biāo)記信息包含SNP物理位置、堿基突變類型、對產(chǎn)量和根部表型的影響情況以及在每個材料的變異情況,Chr列與Pos列可以得到SNP標(biāo)記的物理位置信息,REF列與ALT列得到SNP標(biāo)記的堿基類型,Down列與Up列得到SNP標(biāo)記對產(chǎn)量和根系表型的影響信息(Down為降低表型數(shù)值,Up為增加表型數(shù)值);群體標(biāo)記信息欄可以隨下方滑塊拖動,該信息欄可以得到413份小麥材料的SNP信息(“0/0”代表該位置堿基類型與中國春參考基因組一致, “1/1”代表該位置堿基類型與中國春參考基因組不一致,“./.”代表該位置沒有測得高質(zhì)量的SNP)。該模塊的內(nèi)容如圖 3所示,研究人員可以通過對感興趣的表型進(jìn)行搜索,得到與該表型相關(guān)的SNP標(biāo)記信息以及這些標(biāo)記在群體材料中的分布情況信息。

      小麥群體標(biāo)記數(shù)據(jù)下載部分包含供試群體所有高質(zhì)量SNP標(biāo)記數(shù)據(jù)以及每條染色體的SNP標(biāo)記數(shù)據(jù)。該模塊的內(nèi)容見圖 4。

      圖2 小麥群體材料信息部分Fig.2 Information material of wheat population

      圖3 高質(zhì)量SNP查詢部分Fig.3 High-quality SNP query

      圖4 小麥群體標(biāo)記數(shù)據(jù)下載部分Fig.4 Download links of wheat population marker data

      綜上,研究人員通過本數(shù)據(jù)庫獲得的信息,可以為后續(xù)的育種工作提供參考。例如,查詢?nèi)后w中對千粒質(zhì)量存在影響的SNP標(biāo)記,并且根據(jù)SNP變異后對千粒質(zhì)量表型的效應(yīng)(增加或減少),在育種工作中對相應(yīng)的SNP進(jìn)行有目標(biāo)的選擇使用。

      3 討 論

      小麥?zhǔn)鞘澜缛笞魑镏?其種植面積占糧食總種植面積的五分之一,小麥產(chǎn)量的變化將會對糧食安全產(chǎn)生重大影響[19]。SNP標(biāo)記具有位點多、分布廣、穩(wěn)定性高和代表性強的優(yōu)點,已廣泛用于小麥育種研究[7]。前人研究表明,在亞基因組層面,小麥SNP標(biāo)記在B亞基因組最多,D亞基因組最少[20]。本研究也得到了相同結(jié)果,B亞基因組存在的SNP最多(48.9%),其次是A亞基因組(42.2%),在D亞基因組上存在的SNP最少(8.9%),可能是D亞基因組在小麥進(jìn)化過程中較為保守所致[21]。

      產(chǎn)量以及根系相關(guān)性狀的相關(guān)性分析表明,千粒質(zhì)量與根系相關(guān)性狀呈顯著正相關(guān),劉佳熠等[22]發(fā)現(xiàn)苗期根系性狀與千粒質(zhì)量性狀呈現(xiàn)顯著正相關(guān),與穗粒數(shù)性狀相關(guān)性不顯著。本研究結(jié)果與其相同,可能是根系發(fā)育較好的小麥,能夠更好地吸收利用土壤中的水分和養(yǎng)料,促進(jìn)籽粒灌漿,增加千粒質(zhì)量[23]。此外,本研究還發(fā)現(xiàn)有效分蘗數(shù)與根系相關(guān)性狀之間呈顯著負(fù)相關(guān),此現(xiàn)象鮮有報道,以后可繼續(xù)進(jìn)行研究。

      目前已經(jīng)有一些小麥SNP數(shù)據(jù)庫公布,用來輔助育種工作者,以便于他們使用分子標(biāo)記進(jìn)行育種工作,如WGVD數(shù)據(jù)庫、Triticeae-GeneTribe數(shù)據(jù)庫以及Snphub數(shù)據(jù)庫[24-26]。本研究基于小麥苗期根系轉(zhuǎn)錄組測序數(shù)據(jù)過濾得到的高質(zhì)量SNP標(biāo)記構(gòu)建在線數(shù)據(jù)庫,與其他小麥數(shù)據(jù)庫相同的是,本數(shù)據(jù)庫可以對標(biāo)記信息進(jìn)行查詢和下載,不同的是,本研究的高質(zhì)量SNP大多數(shù)位于編碼區(qū)。此外,本數(shù)據(jù)庫還提供了原始標(biāo)記數(shù)據(jù)的下載方式,研究人員可以下載原始標(biāo)記數(shù)據(jù)進(jìn)行分析。相較于其他數(shù)據(jù)庫,本數(shù)據(jù)庫也存在一些不足,比如未提供數(shù)據(jù)可視化接口,后續(xù)會針對此不足對數(shù)據(jù)庫進(jìn)行維護(hù)和更新。

      猜你喜歡
      表型基因組根系
      牛參考基因組中發(fā)現(xiàn)被忽視基因
      雅安市:織密根治欠薪“根系網(wǎng)”
      根系分泌物解鋁毒作用研究進(jìn)展
      建蘭、寒蘭花表型分析
      烤煙漂浮育苗根系致腐細(xì)菌的分離與鑒定
      長期膜下滴灌棉田根系層鹽分累積效應(yīng)模擬
      GABABR2基因遺傳變異與肥胖及代謝相關(guān)表型的關(guān)系
      慢性乙型肝炎患者HBV基因表型與血清學(xué)測定的臨床意義
      72例老年急性白血病免疫表型分析
      基因組DNA甲基化及組蛋白甲基化
      遺傳(2014年3期)2014-02-28 20:58:49
      德庆县| 南漳县| 靖宇县| 南昌县| 萝北县| 蒙山县| 桐梓县| 马山县| 陇西县| 凤冈县| 安丘市| 贺州市| 彭水| 伊吾县| 礼泉县| 城固县| 那曲县| 敦煌市| 双城市| 承德市| 温宿县| 新龙县| 城口县| 南雄市| 嘉义县| 英德市| 台中市| 锦屏县| 黔东| 台东县| 金平| 荣成市| 巴彦县| 台湾省| 新野县| 崇义县| 丰县| 荥阳市| 周口市| 安阳市| 临沂市|