• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于全基因組重測(cè)序技術(shù)分析甜菜InDel標(biāo)記

      2020-07-16 04:36:42黃平仙高永明劉乃新付暢吳玉梅
      中國(guó)糖料 2020年3期
      關(guān)鍵詞:甜菜基因組位點(diǎn)

      黃平仙,高永明,劉乃新,付暢,吳玉梅

      (1.黑龍江大學(xué)現(xiàn)代農(nóng)業(yè)與生態(tài)環(huán)境學(xué)院,哈爾濱 150080;2.哈爾濱師范大學(xué)生命科學(xué)與技術(shù)學(xué)院,哈爾濱 150025)

      0 引言

      甜菜屬于石竹目、藜科、甜菜屬,甜菜最初生長(zhǎng)于歐洲西南部地區(qū),是甘蔗以外的第二大糖料來源。甜菜產(chǎn)業(yè)在我國(guó)北方占有重要地位,甜菜糖業(yè)在西北、東北穩(wěn)定發(fā)展,在華北呈不斷提升發(fā)展態(tài)勢(shì)[1]。分子標(biāo)記、基因工程、組學(xué)技術(shù)等為甜菜的深入研究提供了重要技術(shù)手段[2]。在遺傳育種研究中能夠快速、高效且準(zhǔn)確地識(shí)別甜菜品種十分重要。目前應(yīng)用于物種鑒定試驗(yàn)中的分子標(biāo)記技術(shù)主要有SCoT[3]、SSR[4]和SRAP[5]等,主要用于甜菜物種鑒定的技術(shù)有SSR[6]、SRAP[7]和ISSR[8],每種方法各有長(zhǎng)處。

      全基因組重測(cè)序技術(shù)是針對(duì)人類已經(jīng)掌握全部基因組序列的個(gè)體進(jìn)行基因組測(cè)序,并將所取得的結(jié)果與個(gè)體、群體的基因組進(jìn)行差異性分析,將測(cè)序后得到的結(jié)果與已經(jīng)掌握的基因組進(jìn)行比對(duì),可以檢測(cè)出全基因組內(nèi)的插入、缺失突變和核苷酸序列改變等多種變異信息,全基因組重測(cè)序后得到的數(shù)據(jù)是鑒定經(jīng)濟(jì)動(dòng)、植物遺傳性狀的重要依據(jù),可根據(jù)基因組變化的結(jié)果針對(duì)多種突變進(jìn)行開發(fā)利用,為各種經(jīng)濟(jì)作物的品種篩選提供便利[9]。InDel 標(biāo)記是根據(jù)不同個(gè)體基因組同源序列發(fā)生的核苷酸片段插入或缺失而開發(fā)的,InDel位點(diǎn)在基因組內(nèi)分布廣、密度高、變異率高,InDel標(biāo)記技術(shù)的可重復(fù)性好并且成本不高昂[10-11]。因此利用全基因組重測(cè)序技術(shù)開發(fā)InDel 標(biāo)記,并利用這種方法進(jìn)行品種鑒定已經(jīng)被廣泛應(yīng)用于水稻[12]、朝天椒[13]和番茄[14]等農(nóng)作物中,諸多研究已經(jīng)證明了InDel標(biāo)記技術(shù)的可靠性,因此將其應(yīng)用于甜菜品種的篩選是可行的方案。

      2016年,Ries等利用不同表型育種系品種通過深度測(cè)序和InDel標(biāo)記法對(duì)甜菜不同基因型樣本進(jìn)行了快速檢測(cè)[15]。但是,目前已知的甜菜InDel標(biāo)記較少,研究相對(duì)落后,將InDel標(biāo)記應(yīng)用于甜菜品種的篩選可以從多種角度、更加全面地篩選不同品種的甜菜。本研究利用全基因組重測(cè)序技術(shù)對(duì)5 個(gè)甜菜品種的基因組進(jìn)行了測(cè)序,第二代測(cè)序技術(shù)能夠高效、快速和準(zhǔn)確地獲得5 種甜菜全基因組序列,進(jìn)而可將其基因組上的插入與缺失位點(diǎn)開發(fā)出一套全新的InDel引物,為甜菜種質(zhì)資源的篩選提供更加多樣化、細(xì)致化的選擇基礎(chǔ),對(duì)甜菜品種的保護(hù)起到重要的作用。

      1 材料和方法

      1.1 試驗(yàn)材料

      以‘MA3001’、‘KWS1231’、‘ZT000589’、‘ZT000549’、‘ZT000286’五個(gè)甜菜種質(zhì)資源為試驗(yàn)材料,從每個(gè)甜菜品種中取出15 粒種子,種植在大小適宜的花盆內(nèi),待植株的莖長(zhǎng)到5~6 cm后將莖剪下來,快速地封裝在做好標(biāo)記的容器中,而后轉(zhuǎn)移到超低溫冰箱中留用。

      1.2 試驗(yàn)方法

      1.2.1 甜菜基因組DNA的提取

      采用CTAB法提取甜菜基因組的DNA,并用1%瓊脂糖凝膠電泳對(duì)DNA樣品進(jìn)行質(zhì)量檢測(cè)[16]。

      1.2.2 文庫構(gòu)建與測(cè)序

      使用Covaris破碎機(jī)將檢驗(yàn)后無污染且純度好的DNA 樣品隨機(jī)切斷成長(zhǎng)度約為350 bp 的DNA 片段,而后使用Klenow exo 對(duì)DNA 片段進(jìn)行前端修復(fù)、加尾和連接測(cè)序接頭,最后使用TruSeq Library Construction Kit回收DNA片段,得到甜菜的基因組測(cè)序文庫。

      構(gòu)建測(cè)序文庫后,用核酸蛋白定量?jī)xQubit2.0 進(jìn)行初階定量,將基因組濃度減少到1 ng/μL,然后使用Agilent 2100 針對(duì)文庫的插入尺寸進(jìn)行檢測(cè),符合預(yù)期后對(duì)文庫的有效DNA 濃度進(jìn)行定量(文庫濃度應(yīng)>2 mol/L)。在保證文庫質(zhì)量的基礎(chǔ)上進(jìn)行illumina HiSeq測(cè)序。

      1.2.3 測(cè)序質(zhì)量檢查

      按表1中的標(biāo)準(zhǔn)進(jìn)行測(cè)序錯(cuò)誤率檢測(cè),測(cè)序錯(cuò)誤率用e表示,堿基質(zhì)量值Qphred=-10 log10(e)。

      表1 測(cè)序正確率與Phred 分值的對(duì)應(yīng)關(guān)系Table 1 The correlation between sequencing accuracy and Phred score

      1.2.4 測(cè)序數(shù)據(jù)過濾

      測(cè)序后得到的序列是原始數(shù)據(jù),中間摻雜有接頭的低品質(zhì)的數(shù)據(jù)。為確保測(cè)定數(shù)據(jù)的品質(zhì),需要對(duì)原始數(shù)據(jù)進(jìn)行過濾,將有接頭的數(shù)據(jù)去掉,將單頭測(cè)序中含有N 比例超過10%的數(shù)據(jù)去掉,將單頭測(cè)序中低質(zhì)量堿基大于50%的數(shù)據(jù)去掉,得到有效數(shù)據(jù),后續(xù)分析都根據(jù)有效數(shù)據(jù)展開。

      1.2.5 重測(cè)序序列與參考基因組的比對(duì)及InDel位點(diǎn)的檢測(cè)

      對(duì)重測(cè)序數(shù)據(jù)進(jìn)行過濾后,使用BWA 軟件[17]將有效數(shù)據(jù)與參考基因組的序列進(jìn)行比對(duì),尋找一致的基因組數(shù)據(jù),然后使用SAMTOOLs軟件[18]檢測(cè)一致基因組數(shù)據(jù)中的插入及缺失位點(diǎn)。

      1.2.6 InDel位點(diǎn)的分布分析

      使用ANNOVAR軟件[19]分析5個(gè)甜菜種質(zhì)資源基因組中InDel位點(diǎn)的分布位置,以及不同長(zhǎng)度的InDel位點(diǎn)在基因組上的分布情況。根據(jù)分析得出的結(jié)果確定可以開發(fā)InDel引物的合適位點(diǎn)。

      2 結(jié)果與分析

      2.1 甜菜品種的全基因組重測(cè)序分析

      對(duì)5個(gè)甜菜種質(zhì)資源進(jìn)行全基因組重測(cè)序,測(cè)序后對(duì)測(cè)序質(zhì)量進(jìn)行分析,檢查全基因組重測(cè)序結(jié)果是否符合規(guī)范,是否可以進(jìn)行后續(xù)InDel位點(diǎn)檢測(cè)與引物開發(fā)。分析結(jié)果表明測(cè)序錯(cuò)誤率比較低(表2)。測(cè)序的錯(cuò)誤率受到堿基質(zhì)量、測(cè)量?jī)x器、材料和原料等諸多因素的影響,產(chǎn)生誤差的原因主要有以下幾點(diǎn):⑴測(cè)序儀器初期不穩(wěn)定;⑵藥劑的逐漸減少導(dǎo)致文庫的測(cè)量質(zhì)量降低;⑶DNA 被照射次數(shù)增多導(dǎo)致?lián)p傷增多。一般序列的前端和末端的錯(cuò)誤率會(huì)偏高。

      表2 測(cè)序數(shù)據(jù)的質(zhì)量分析Table 2 Quality analysis of sequencing data

      通過對(duì)5 個(gè)甜菜種質(zhì)資源的全基因組重測(cè)序,共獲得42.908 GB 的原始數(shù)據(jù),經(jīng)過過濾處理后得到42.849 GB 的有效數(shù)據(jù)。每個(gè)甜菜品種的原始數(shù)據(jù)在7 351.715~9 487.149 Mbp 的范圍之內(nèi),Q20≥95.36%、Q30≥88.80%(表2)(高質(zhì)量測(cè)序保證Q30>85%),G 和C 含量在36.79%~37.95%之間(表2)。結(jié)果表明,基因組測(cè)序數(shù)據(jù)量足夠,C和G的分布在正常范圍之內(nèi),測(cè)序質(zhì)量良好,能夠支持后續(xù)分析。

      2.2 甜菜品種的基因組序列與參考基因組的比對(duì)分析

      利用BWA軟件(參數(shù):mem-t 4-k 32-M)將5個(gè)甜菜品種的有效基因組數(shù)據(jù)與參考基因組比對(duì),再利用SAMTOOLS 軟件去除多余的重復(fù)序列。參考基因組的大小為566.550 Mbp(表3),由表4 可知,5 個(gè)甜菜品種的基因組平均測(cè)序深度最大為16.41%,最小為12.87%;單堿基覆蓋度占比最大為95.79%,最小為94.62%;四堿基覆蓋度占比最大為88.83%,最小為85.15%。比對(duì)后5 個(gè)甜菜品種與參考基因組一致的有效序列(去除重復(fù)序列)數(shù)據(jù)量為42.84 GB,有效序列的數(shù)量為2.71×109條,占參考基因組序列的99.84%。平均每個(gè)甜菜品種的有效數(shù)據(jù)量為8.57 GB,有效序列的數(shù)量為5.42×108條。結(jié)果表明,5個(gè)甜菜品種的基因組序列可用于后續(xù)的變異檢測(cè)及相關(guān)分析。

      表3 參考基因組基本情況分析Table3 Analysisofreferencegenome

      表4 測(cè)序深度及覆蓋度分析Table 4 Analysis of sequencing depth and coverage

      2.3 InDel序列長(zhǎng)度及分布分析

      利用SAMTOOLs(mpileup-m 2-F 0.002-d 1000)從5 個(gè)甜菜品種與參考基因組比對(duì)一致的序列中檢測(cè)InDel序列(長(zhǎng)度小于50 bp的插入與缺失片段),然后用ANNOVAR 軟件對(duì)InDel序列的分布位置進(jìn)行注釋及分析(表5)。

      通過InDel位點(diǎn)的注釋分析,從5 個(gè)甜菜品種中分別發(fā)現(xiàn)了343 138、317 057、281 435、312 444和316 595個(gè)InDel位點(diǎn)(平均314 134.8),其數(shù)量和分布與參考基因組相似。在這5個(gè)甜菜品種中,InDel位點(diǎn)主要分布在基因間區(qū),約占全部位點(diǎn)的55%,其次是基因區(qū)。在基因區(qū)內(nèi),大部分的InDel位點(diǎn)分布在內(nèi)含子中,蛋白質(zhì)編碼區(qū)(Coding sequence,CDS)區(qū)中分布的InDel位點(diǎn)最少。

      表5 InDel 位點(diǎn)的檢測(cè)及注釋Table 5 Detection and annotation of InDel locus

      在這5 個(gè)甜菜品種全基因組中,InDel 位點(diǎn)的長(zhǎng)度分布趨勢(shì)也基本一致(圖1)。InDel 位點(diǎn)的數(shù)量隨著InDel 片段長(zhǎng)度的增加而減少(基因區(qū)除外)。根據(jù)片段長(zhǎng)度,可將InDel位點(diǎn)分為4 種類型,分別是長(zhǎng)度為1 bp 的位點(diǎn)、長(zhǎng)度為2~4 bp 的位點(diǎn)、長(zhǎng)度為5~8 bp 的位點(diǎn)和長(zhǎng)度超過9 bp 的位點(diǎn)。其中長(zhǎng)度為1 bp 的InDel位點(diǎn)數(shù)量超過110 000 個(gè)(約占所有InDel的40%);長(zhǎng)度為2~4 bp的InDel位點(diǎn)數(shù)量為20 000~80 000個(gè);長(zhǎng)度為5~8 bp的InDel位點(diǎn)數(shù)量約為10 000個(gè);長(zhǎng)度超過9 bp的InDel位點(diǎn)數(shù)量不足7 000個(gè)(圖2)。

      圖1 基因編碼區(qū)InDel長(zhǎng)度分布Fig.1 InDel length distribution of gene coding region

      圖2 全基因組InDel長(zhǎng)度分布Fig.2 InDel length distribution in the whole genome

      5個(gè)甜菜品種的InDel位點(diǎn)在CDS區(qū)的分布趨勢(shì)和數(shù)量也與參考基因組相似,分別有4 828、4 810、4 473、4 975 和4 824 個(gè)InDel 位點(diǎn),這些InDel 位點(diǎn)幾乎都會(huì)引起編碼蛋白質(zhì)的顯著變化。其中約有1 500 個(gè)InDel位點(diǎn)導(dǎo)致了插入或刪除,這將插入或刪除編碼蛋白質(zhì)的一個(gè)或幾個(gè)氨基酸。大約有600~800 個(gè)InDel 位點(diǎn)導(dǎo)致了堿基移位,低于100個(gè)InDel位點(diǎn)導(dǎo)致了終止密碼子的產(chǎn)生和缺失。導(dǎo)致移碼突變或終止密碼子的產(chǎn)生和缺失的InDel位點(diǎn)將大大改變編碼蛋白質(zhì)的序列。

      用InDel位點(diǎn)的長(zhǎng)度對(duì)不同長(zhǎng)度InDel位點(diǎn)占位點(diǎn)總數(shù)的百分比作圖,得到InDel位點(diǎn)在全基因組中的長(zhǎng)度分布(圖2),隨著InDel 位點(diǎn)長(zhǎng)度的增加,InDel 位點(diǎn)的數(shù)量將會(huì)減少。在基因編碼區(qū)內(nèi),當(dāng)InDel片段的長(zhǎng)度為3 bp時(shí),數(shù)量將遠(yuǎn)遠(yuǎn)超過其他長(zhǎng)度的InDel位點(diǎn)(圖1)。

      3 討論

      3.1 甜菜品種基因組中InDel位點(diǎn)的分布

      本研究使用Illumina測(cè)序平臺(tái)對(duì)5個(gè)甜菜品種進(jìn)行了全基因組重測(cè)序,并將全基因組序列分別與甜菜的參考基因組進(jìn)行了比對(duì),約有55%的InDel位點(diǎn)分布在基因間區(qū),與其他物種的InDel位點(diǎn)分布基本一致。在基因區(qū)內(nèi),超過60%的InDel位點(diǎn)分布在內(nèi)含子中,這些變異幾乎不會(huì)影響基因表達(dá)和基因功能。如果InDel位點(diǎn)分布在CDS 區(qū)中,其編碼蛋白質(zhì)的氨基酸序列會(huì)發(fā)生改變,基因功能可能會(huì)發(fā)生改變甚至遭到破壞。如果InDel位點(diǎn)分布在啟動(dòng)子區(qū)域,基因的表達(dá)會(huì)增加或減少,這最終會(huì)改變植物的表型或適應(yīng)性。分布在基因間區(qū)的InDel位點(diǎn)不會(huì)使基因表達(dá)發(fā)生如此大的變化,所以該區(qū)域中長(zhǎng)度大于3 bp 的InDel位點(diǎn)最適合進(jìn)行InDel 引物開發(fā),其次是內(nèi)含子區(qū)域中長(zhǎng)度大于3 bp 的InDel位點(diǎn),CDS 區(qū)域和啟動(dòng)子區(qū)域的InDel位點(diǎn)不適合進(jìn)行引物開發(fā)。

      3.2 甜菜品種基因組中InDel序列長(zhǎng)度分布

      InDel序列的長(zhǎng)度各有不同,通常插入與缺失位點(diǎn)的數(shù)量會(huì)隨著InDel長(zhǎng)度的增加而減少(基因區(qū)除外),5 個(gè)甜菜品種的InDel 序列無論是在全基因組上的分布還是在CDS 區(qū)域的分布都符合這一情況。這一現(xiàn)象可能是因?yàn)橹仓昊蜷g區(qū)較短,過長(zhǎng)的插入或缺失會(huì)破壞與植物生存相關(guān)的基因,最終降低植物的存活率。當(dāng)插入與缺失片段短時(shí),對(duì)基因組的損傷較小,植株的存活率較高,因此這種變化保留的概率更高。在基因區(qū)內(nèi)長(zhǎng)度為3 bp 或其整數(shù)倍的InDel 位點(diǎn)的數(shù)量最多。最適宜開發(fā)InDel引物的是等于或大于3 bp 的InDel序列。將這5 個(gè)甜菜品種的基因組序列與參考基因組比對(duì)后發(fā)現(xiàn),這5 個(gè)甜菜品種的基因組中分別有135 639、137 011、123 776、145 478 和135 040個(gè)InDel位點(diǎn)的長(zhǎng)度超過3 bp,平均每MB數(shù)據(jù)中有238.78個(gè)長(zhǎng)度超過3 bp的InDel位點(diǎn)。這些位點(diǎn)有適合用于開發(fā)高效的InDel引物。

      4 結(jié)論

      進(jìn)行了5 個(gè)甜菜品種的全基因組重測(cè)序分析,Q20≥95.36%、Q30≥88.80%,基因組重測(cè)序數(shù)據(jù)量足夠,C和G的分布在正常范圍之內(nèi),測(cè)序質(zhì)量良好,能夠支持后續(xù)分析。

      將5 個(gè)甜菜品種的基因組序列分別與參考基因組比對(duì),經(jīng)處理后得到42.84 GB 的無重復(fù)有效數(shù)據(jù)。通過InDel位點(diǎn)的注釋分析可知,從5個(gè)甜菜品種中分別發(fā)現(xiàn)了343 138、317 057、281 435、312 444和316 595個(gè)InDel 位點(diǎn)。主要分布在基因間區(qū),約占全部位點(diǎn)的55%,其次是基因區(qū)。在基因區(qū)內(nèi),大部分的InDel位點(diǎn)分布在內(nèi)含子中,蛋白質(zhì)編碼區(qū)(Coding sequence,CDS)中分布的InDel位點(diǎn)最少。

      InDel位點(diǎn)的數(shù)量隨著InDel長(zhǎng)度的增加而減少(基因間區(qū)除外),在基因區(qū)內(nèi)大部分InDel位點(diǎn)的長(zhǎng)度為3 bp或其整數(shù)倍,在基因間區(qū)內(nèi)大部分InDel位點(diǎn)長(zhǎng)度為1 bp。

      5個(gè)甜菜品種的InDel位點(diǎn)在CDS區(qū)的分布趨勢(shì)和數(shù)量也與參考基因組相似,分別有4 828、4 810、4 473、4 975和4 824個(gè)InDel位點(diǎn),這些InDel位點(diǎn)幾乎都會(huì)引起編碼蛋白質(zhì)的顯著變化。

      大于3 bp 的InDel位點(diǎn)適合進(jìn)行InDel 引物開發(fā)。這些InDel位點(diǎn)的開發(fā)為進(jìn)行遺傳效應(yīng)分析并鑒定甜菜種質(zhì)資源提供了重要基礎(chǔ)。

      猜你喜歡
      甜菜基因組位點(diǎn)
      鎳基單晶高溫合金多組元置換的第一性原理研究
      上海金屬(2021年6期)2021-12-02 10:47:20
      甜菜應(yīng)答鹽脅迫的RING型E3連接酶基因的鑒定與分析
      牛參考基因組中發(fā)現(xiàn)被忽視基因
      CLOCK基因rs4580704多態(tài)性位點(diǎn)與2型糖尿病和睡眠質(zhì)量的相關(guān)性
      辣椒甜菜,各有所愛
      二項(xiàng)式通項(xiàng)公式在遺傳學(xué)計(jì)算中的運(yùn)用*
      新疆產(chǎn)區(qū)有機(jī)甜菜栽培技術(shù)探討
      基因組DNA甲基化及組蛋白甲基化
      遺傳(2014年3期)2014-02-28 20:58:49
      二二三團(tuán)甜菜主要病蟲害發(fā)生特點(diǎn)及防治
      有趣的植物基因組
      思茅市| 德兴市| 宜州市| 新余市| 卓资县| 满洲里市| 合江县| 东辽县| 华蓥市| 乌拉特前旗| 山丹县| 威宁| 马鞍山市| 梓潼县| 永年县| 章丘市| 曲松县| 太仆寺旗| 安远县| 岗巴县| 大同县| 平江县| 喀喇沁旗| 九江县| 县级市| 康乐县| 集贤县| 安达市| 仙游县| 开封县| 黄石市| 安陆市| 海丰县| 南宁市| 盐源县| 德阳市| 通渭县| 皋兰县| 沙坪坝区| 安多县| 桂东县|