• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      芋全長轉錄組測序分析及淀粉生物合成相關基因挖掘

      2022-08-06 09:05:24何芳練劉莉莉蔣慧萍韋紹龍邱祖楊董偉清
      西南農(nóng)業(yè)學報 2022年6期
      關鍵詞:核苷酸基因組淀粉

      何芳練,劉莉莉,蔣慧萍,韋紹龍,邱祖楊,董偉清

      (1.廣西農(nóng)業(yè)科學院生物技術研究所,南寧 530007;2.荔浦市農(nóng)業(yè)農(nóng)村局,廣西 荔浦 546600;3.廣西亞熱帶作物研究所,南寧 530001)

      【研究意義】芋[Colocasiaesculenta(L.) Schott]俗稱芋頭,為天南星科單子葉植物,其利用歷史可追溯到28000年前的所羅門島[1]。芋的主要食用部位為富含淀粉和蛋白及其他營養(yǎng)物質(zhì)的地下球莖,是亞太、非洲和美洲地區(qū)5億多人的主食和蔬菜[2-3]。我國有2000多年的芋栽培歷史,是世界上第二大芋生產(chǎn)國和最大出口國[2]。目前,雖然芋的基因組已被成功測序[4-5],但其在轉錄水平的調(diào)控是一個復雜過程,包括可變剪接(AS)和可變多聚腺苷酸化(APA)等。AS和APA在植物生長發(fā)育和脅迫應答方面發(fā)揮重要作用[6-7],但二代測序讀長較短,無法準確預測完整的全長序列,對轉錄本的結構分析存在較大困難,而基于單分子長讀數(shù)測序技術(SMRT)的三代全長轉錄組測序具有讀長超長優(yōu)勢,可直接獲得完整的全長轉錄本,能準確識別轉錄本的同源異構體,在分析轉錄本AS、APA、融合基因和等位基因等方面具有非常大的優(yōu)勢[8]。因此,開展芋三代全長轉錄組測序,獲取芋全長轉錄本信息并進行功能注釋,分析轉錄本的AS、APA、長鏈非編碼RNA(lncRNA)、轉錄因子(TF)及簡單重復序列(SSR)等結構信息,同時挖掘淀粉生物合成相關的基因及轉錄本信息,對豐富芋基因序列及結構信息,為后續(xù)闡明淀粉生物合成的分子機制及深入挖掘芋基因資源具有重要意義?!厩叭搜芯窟M展】測序技術已廣泛應用于開展芋種質(zhì)資源、基因組、球莖發(fā)育機理、顏色形成及分子標記等方面的研究。在基因組研究方面,Bellinger等[4]完成了夏威夷地方芋品種Moi的基因組測序,組裝的基因組大小為2450 Mb,隨后Yin等[5]組裝高質(zhì)量染色體級別的芋基因組(龍香芋),基因組大小為2405 Mb,高質(zhì)量基因組的公布為深入研究芋遺傳進化及重要農(nóng)藝性狀形成的分子機制打下了基礎。在球莖發(fā)育和顏色形成方面,Dong等[3]對芋球莖發(fā)育過程進行全轉錄組測序,富集到與淀粉和蔗糖代謝途徑相關的mRNA、CircRNA和miRNA分別為139、99和46個;He等[9]對芋球莖肉質(zhì)纖維顏色形成過程進行轉錄組測序,鑒定出41和12個分別與類黃酮和花青素相關的差異轉錄本。在種質(zhì)資源研究和分子標記開發(fā)方面,You等[10]從轉錄組測序中鑒定5278個SSR位點,并將68份芋種質(zhì)資源分為三大類群;Wang等[11]從轉錄組測序中鑒定11363個SSR位點,使用18份芋種質(zhì)資源對隨機選取的150對引物進行驗證,結果顯示100對引物存在多態(tài)性信息含量值為0.042~0.778;Dong等[12]使用限制性位點關聯(lián)DNA測序(RAD-seq)鑒定4438個SSR位點,并將30份芋種質(zhì)資源分為三個類群。Wang等[2]對234份芋種質(zhì)資源開展特定長度擴增片段測序(SLAF-seq),共獲得132 869個單核苷酸多態(tài)性(SNP),并基于SNP標記篩選出一套包含41份種質(zhì)資源的核心種質(zhì)資源庫?,F(xiàn)階段,三代全長轉錄組測序技術已在許多植物上成功應用,如Wang等[8]對毛竹、Chen等[13]對紅花、潘敏等[14]對菠蘿蜜、尚驍堯等[15]對蒺藜苜蓿開展全長轉錄組測序,鑒定了大量AS事件、APA位點等轉錄本結構信息,為深入研究基因的功能和轉錄調(diào)控機制提供了依據(jù)?!颈狙芯壳腥朦c】雖然芋的基因組已被成功測序,但目前鮮見關于利用三代全長轉錄組測序?qū)τ筠D錄本結構進行分析的報道?!緮M解決的關鍵問題】利用SMRT技術對芋不同組織(葉片、葉柄、球莖、匍匐莖和根)的混合樣開展三代全長轉錄組測序,鑒定新基因和轉錄本,分析AS、APA、lncRNA、TF及SSR位點等轉錄本的結構信息,并挖掘淀粉生物合成相關基因和轉錄本,為后續(xù)闡明淀粉生物合成的分子機制及深入利用芋基因資源提供參考依據(jù)。

      1 材料與方法

      1.1 試驗材料

      供試材料為本課題組選育的芋新品種荔浦芋1號,2020年3月種植于廣西農(nóng)業(yè)科學院武鳴里建科學研究基地,農(nóng)事操作參考本課題組總結的檳榔芋水田輕簡化高效栽培技術[16]。對播種90 d的植株(3月齡)進行取樣,取樣部位為葉片、葉柄、球莖、匍匐莖和根,液氮速凍后保存于-80 ℃冰箱備用。

      1.2 試驗方法

      1.2.1 總RNA提取與文庫構建 參照天根生化科技(北京)有限公司的植物多糖多酚總RNA提取試劑盒(DP441)說明提取所有樣品的總RNA。使用Nanodrop 2000(Thermo Fisher)檢測總RNA濃度和純度(OD260/280),使用Agilent 2100(Agilent Technologies)檢測RNA的完整度(RIN值和28S/18S)。使用SMARTer PCR cDNA Synthesis Kit(TaKaRa,634926)將總RNA反轉錄成cDNA,然后將cDNA進行PCR擴增富集,使用AMpure PB(Pacbio,100-265-900)對擴增產(chǎn)物進行純化回收。將不同組織(葉片、葉柄、球莖、匍匐莖和根)的純化產(chǎn)物等量混合,然后使用SMRTbell?Express Template Prep Kit 2.0(PacBio,100-938-900)對混合產(chǎn)物進行損傷修復、末端修復及連接接頭,構建測序文庫。測序文庫質(zhì)檢合格后置于Sequel II(PacBio)測序儀上進行三代全長轉錄組測序。

      1.2.2 全長轉錄本序列獲取 全長轉錄組序列獲取的過程主要包括全長序列識別、全長序列聚類獲得一致序列和一致序列校正3個階段[17]。使用SMRT Link v7.0.0對下機數(shù)據(jù)進行過濾、去除接頭獲得Subread序列,以Full passes≥3且序列準確性>0.9的標準從Subread序列獲得環(huán)狀一致序列(CCS),根據(jù)CCS中是否存在3′引物、5′引物和poly(A)獲得全長非嵌合序列(FLNC);隨后將與FLNC相似的序列聚成一簇(Cluster),每簇得到一條一致序列;最后,對得到的一致序列進行校正,獲得高質(zhì)量序列。將得到的高質(zhì)量序列通過GMAP v2017-11-15與芋參考基因組(Niue 2,https://www.ncbi.nlm.nih.gov/bioproject/?term=PRJNA3 28799)進行序列比對[18],使用cDNA_Cupcake v6.1對比對結果去冗余,最終獲得非冗余全長轉錄本序列。

      1.2.3 新轉錄本的功能注釋和編碼區(qū)預測 將得到的新轉錄本序列與NR、eggNOG、SwissProt,GO、COG、KOG、Pfam和京都基因和基因組百科全書(KEGG)數(shù)據(jù)庫進行BLAST比對,獲得新轉錄本的注釋信息。使用TransDecoder v5.0.0[19]預測新轉錄本的編碼區(qū)序列。

      1.2.4 全長轉錄本序列結構分析 使用Astalavista v3.2[20]進行AS分析;使用TAPIS pipeline v1.2.1[21]識別APA位點,通過MEME v4.9.1[22]對轉錄本poly(A)位點上游50 bp進行motif分析;使用MISA v1.0進行SSR分析;使用iTAK v1.7a[23]進行TF預測;使用CPC2 v0.1[24]、CNCI v2.0[25]、PfamScan v1.6和CPAT v1.2.2[26]4種軟件對lncRNA進行預測,根據(jù)lncRNA在參考基因組注釋信息(gff)上的位置,對lncRNA進行分類,并基于位置關系和互補序列2種方式對lncRNA的靶基因進行預測;使用去冗余前的轉錄本進行基因組跨區(qū)域預測,鑒定融合轉錄本。

      1.2.5 淀粉生物合成相關基因挖掘 根據(jù)轉錄本在KEGG中淀粉與蔗糖代謝途徑(ko00500)的注釋信息,挖掘與芋淀粉生物合成相關的基因和轉錄本,并對其進行AS和APA分析。

      2 結果與分析

      2.1 芋全長轉錄組測序數(shù)據(jù)分析

      為了鑒定盡可能多的轉錄本,從芋3月齡植株的葉片、葉柄、球莖、匍匐莖和根等組織部位提取高質(zhì)量的總RNA構建混合樣測序文庫,在PacBio Sequel II平臺上進行全長轉錄組測序。下機數(shù)據(jù)經(jīng)過濾后獲得27.64 Gb測序數(shù)據(jù),根據(jù)Full passes≥3且序列準確性>0.9的條件從原始數(shù)據(jù)中提取CCS,共獲得CCS 275 469條,CCS總長度為535 289 684 bp,平均為1943 bp,平均Full passes數(shù)為44。通過篩選含有5′引物、3′引物和poly(A)的CCS,共獲得FLNC 209 160條,占CCS總數(shù)的75.93%。將FLNC進行聚類得到一致序列85 053條,對一致序列進行校正得到高質(zhì)量一致序列84 028條,將高質(zhì)量一致序列去冗余并與芋參考基因組進行比對,最終得到38 043條全長轉錄本序列。

      2.2 新轉錄本的功能注釋及編碼區(qū)預測

      通過與參考基因組進行比對,共鑒定出新基因1878個,新發(fā)現(xiàn)轉錄本31 058條。將新發(fā)現(xiàn)的轉錄本與NR、eggNOG、Swiss-Prot、Pfam、KOG、KEGG、COG和GO等數(shù)據(jù)庫進行比對,獲得各數(shù)據(jù)庫注釋的轉錄本數(shù)量在10 109~28 512條,共有28 785條轉錄本獲得功能注釋,占比83.68%(表1)。在獲得注釋的新轉錄本中,300 bp<長度<1000 bp的轉錄本數(shù)為1500條,長度>1000 bp的轉錄本數(shù)為27 278條。

      表1 芋新轉錄本的功能注釋統(tǒng)計Table 1 Functional annotation statistics of taro new transcripts

      將新轉錄本序列比對到NR數(shù)據(jù)庫,獲取相似性最高的同源序列,統(tǒng)計比對到不同物種的序列數(shù)量和比例,結果顯示,排在前三位的同源物種為在KOG數(shù)據(jù)庫中,共有18 531條轉錄本被注釋,并根據(jù)功能將其歸為25類,其中被注釋較多的功能分類有:一般功能預測(General function prediction only,3700條)及翻譯后修飾、蛋白質(zhì)翻轉和分子伴侶(Posttranslational modification,protein turnover,chaperones,2150條);信號轉導機制(Signal transduction mechanisms,2149條)和碳水化合物的運輸和代謝(Carbohydrate transport and metabolism,1225條)。

      Acanthamoebacastellanii、Capsasporaowczarzaki和Nematostellavectensis,比對到的同源序列分別有1920條(占比9.53%)、1303條(占比6.47%)和868條(占比4.31%),此外,還比對到其他物種的序列11 940條(占比59.24%)。

      在GO數(shù)據(jù)庫中,共有10 109條轉錄本被注釋,分為細胞組分(Cellular component)、分子功能(Molecular function)和生物過程(Biological process)三大類,每大類又細分為18、13和22個二級分類。在細胞組分中,排在前三位的分別是細胞部分(Cell part,3830條)、細胞(Cell,3731條)和細胞器(Organelle,2447條);在分子功能分類中,催化活性(Catalytic activity)最多(6156條),其次為連接(Binding,3941條)和轉運器活性(Transporter activity,406條);在生物過程中,細胞過程(Cellular process)最多(5383條),其次為代謝進程(Metabolic process,4989條)和單一有機體過程(Single-organism process,3008條)。

      對新轉錄本的編碼區(qū)序列進行預測,共鑒定出30 267個開放閱讀框(ORF),其中完整的ORF有20 046個。預測的ORF編碼蛋白序列為0~1000個氨基酸,其中以編碼100~200個氨基酸的ORF最多,數(shù)量為5530個,占比18.27%。

      2.3 全長轉錄本的結構分析

      基因在轉錄后可通過AS產(chǎn)生豐富的轉錄本,利用Astalavista v3.2將去冗余后的轉錄本進行AS分析,共鑒定9360個AS事件。對AS類型進行分析,結果顯示AS事件被分為5種類型,其中內(nèi)含子保留(IR)類型數(shù)量最多,AS事件4791個,占比51.19%;其次為3′端可變剪接(A3SS)類型,AS事件1889個,占比20.18%;第三種類型為外顯子跳躍(ES),AS事件1598個,占比17.07%;第四種類型為5′端可變剪接(A5SS),AS事件966個,占比10.32%;而互斥可變外顯子(MEE)類型數(shù)量最少,AS事件116個,占比1.24%。使用去冗余前的一致序列進行融合轉錄本預測,共鑒定1911個融合轉錄本。使用TAPIS pipeline v1.2.1對轉錄本進行APA分析,共鑒定6436個基因存在poly(A)位點,其中3283個基因具有2個或多個poly(A)位點(圖1)。利用MEME v4.9.1對poly(A)位點上游50 bp的序列進行分析,結果顯示在poly(A)剪切位點上游存在3個motif元件(CCCCC/TCCCCC/CCCTCC)。

      圖1 poly(A)位點分析結果Fig.1 Results of poly(A) sites analysis

      2.4 轉錄本的SSR檢測

      使用MISA v1.0對長度500 bp以上的轉錄本進行SSR分析,共檢測37 839條轉錄本序列,其中包含SSR位點的序列16 114條,占檢測序列數(shù)的42.58%。在含有SSR位點的序列中,含2個及以上SSR位點的序列有5821條,含混合SSR位點的序列有3121條。在所有序列中共檢測到25 081個SSR位點,其中,單核苷酸重復(Mononucleotide)最多,SSR位點10275個,平均分布密度為106.06個/Mb;其次為二核苷酸重復(Dinucleotide),SSR位點9431個,平均分布密度為78.95個/Mb;第三為三核苷酸重復(Trinucleotide),SSR位點5155個,平均分布密度為53.38個/Mb,其他SSR位點類型數(shù)量較少(圖2)。在重復單元中,二核苷酸重復排在前三位的重復單元為CT/AG、TC/GA和GA/TC,SSR位點數(shù)量分別為1517、1359和1041個,最少的為CG/CG,SSR位點數(shù)量為14個。三核苷酸重復排在前三位的重復單元為CAG/CTG、GGC/GCC和GCC/GGC,SSR位點數(shù)量分別為256、249和225個,最少的為TAC/GTA和AGT/ACT,SSR位點數(shù)量均僅各有1個。

      c為混合SSR,2個SSR位點距離小于100 bp;c*為混合SSR,2個SSR位點無間隔:p1為單核苷酸重復;p2為二核苷酸重復;p3為三核苷酸重復;p4為四核苷酸重復;p5為五核苷酸重復;p6為六核苷酸重復c represented compound SSR,2 SSR loci less than 100 bp apart;c* represented compound SSR with no spacing between two SSR loci;p1 represented mono nucleotide repeats;p2 represented dinucleotide repeats;p3 represented trinucleotide repeats;p4 represented tetranucleotide repeats;p5 represented pentanucleotide repeats;p6 represented hexanucleotide repeats圖2 轉錄本的SSR類型密度分布比較Fig.2 Comparison of the SSR type density distribution of transcripts

      2.5 轉錄本的lncRNA預測

      使用CPC、CNCI、CPAT和Pfam蛋白結構域4種方法對lncRNA進行鑒定,對4種分析結果取交集,共鑒定304個lncRNA(圖3)。根據(jù)lncRNA在參考基因組上的位置,將lncRNA分為4種類型,其中,基因間區(qū)lncRNA(lincRNA)最多,有147個,占比48.40%,其次為正義lncRNA(sense-lncRNA),有110個,占比36.20%,再次為反義lncRNA(antisense-lncRNA),有39個,占比12.80%,而內(nèi)含子型lncRNA(intronic-lncRNA)數(shù)量最少,僅有8個,占比2.60%?;谖锢砦恢?lncRNA與mRNA的位置關系)和互補序列(lncRNA與mRNA的堿基互補配對)的方法對lncRNA的靶基因進行預測,共預測靶基因2712個。

      圖3 轉錄本的lncRNA鑒定Fig.3 lncRNA identification

      2.6 轉錄因子分析

      使用iTAK v1.7a對TF進行預測,共預測到1608個TF,這些TF可分為28個家族,其中,MYB家族的TF最多,有395個,占比24.56%,其次為bHLH家族,有205個,占比12.75%(圖4)。

      圖4 轉錄因子類型分布情況比較Fig.4 Comparison of transcription factor type distribution

      2.7 淀粉生物合成相關基因挖掘

      通過KEGG代謝通路富集分析,共挖掘到淀粉生物合成相關基因14個,其中ADP-葡萄糖焦磷酸化酶(AGPase)6個,淀粉分支酶(SBE)3個,淀粉合成酶(SS)和淀粉磷酸化酶(SP)各2個,ADP-糖焦磷酸化酶(AspP)1個(表2)。從表2還可看出,不同的基因均檢測到1~12條轉錄本,其中,基因PB.9743檢測到的轉錄本數(shù)量最多,為12條,其次為基因PB.7121,檢測到轉錄本10條,基因PB.13928、PB.7537、PB.14152和PB.1105檢測到的轉錄本數(shù)量最少,均為1條。

      表2 芋淀粉生物合成基因挖掘Table 2 Identification results of starch biosynthesis genes in taro

      續(xù)表2 Continued table 2

      對淀粉生物合成的基因進行AS分析,結果(圖5和表3)顯示,6個AGPase基因中有3個發(fā)生AS事件,包括5種AS類型,其中,以基因PB.7121發(fā)生的AS類型最多,包含IR、A5SS、A3SS和MEE 4種類型;2個SP基因均發(fā)生AS事件,其中基因PB.9743含有4種AS類型,分別為A5SS、A3SS、IR和MEE,而基因PB.8912只有A3SS類型的AS事件;SBE基因中,只有基因PB.9363發(fā)生A3SS和IR 2種類型的AS事件;SS和AspP基因不發(fā)生AS事件。此外,對淀粉生物合成的基因進行APA分析結果(表2)表明,14個基因中有10個基因存在poly(A)位點,其中7個基因具有2個及2個以上poly(A)位點,尤其以基因PB.729的poly(A)位點數(shù)量最多(6個),其次為基因PB.7121和PB.9743(5個),基因PB.11557、PB.7516和PB.1105的poly(A)位點數(shù)量最少,均為1個。

      表3 芋淀粉生物合成相關基因AS事件統(tǒng)計Table 3 Statistical of AS events of genes related to taro starch biosynthesis

      3 討 論

      芋的基因組雖已公布,但并未深入分析其轉錄本的結構特征。Wang等[8]利用三代全長轉錄組測序技術糾正毛竹基因組錯誤注釋基因2241個,鑒定新轉錄本35 447條,尚驍堯等[15]通過三代全長轉錄組測序鑒定蒺藜苜蓿新基因7209個,新轉錄本52 636條。本研究結果與上述研究結果相似,通過三代全長轉錄組測序獲得芋全長轉錄本序列38 043條,鑒定新基因1878個,新轉錄本31 058條。說明三代全長轉錄組測序技術在完善植物基因組功能注釋中可發(fā)揮重要作用。

      由于三代全長轉錄組測序技術無需對RNA進行打斷和拼接,因此在轉錄本的結構分析方面具有極大優(yōu)勢。AS在植物生長發(fā)育、抗逆響應方面具有重要作用[6]。本研究通過三代全長轉錄組測序共鑒定9360個AS事件,與Wang等[8]對毛竹、尚驍堯等[15]對蒺藜苜蓿、Li等[27]對黃芪、Wang等[28]對海島棉的鑒定結果相似,說明三代全長轉錄組測序可有效鑒定轉錄本的AS。APA通過產(chǎn)生不同長度3′UTR或不同編碼序列的轉錄本來提高轉錄的復雜性,從而通過多種機制調(diào)控植物的基因表達[21]。本研究結果表明,6436個基因存在poly(A)位點,與Wang等[8]對毛竹、尚驍堯等[15]對蒺藜苜蓿、Abdel-Ghany等[21]對高粱的研究結果相似,說明三代全長轉錄組測序也可有效鑒定轉錄本的APA,進一步說明三代全長轉錄組測序技術在轉錄本結構鑒定中發(fā)揮重要作用。

      字體加粗代表發(fā)生AS事件的基因;IR:內(nèi)含子保留;ES:外顯子跳躍;A5SS:5′端可變剪接;A3SS: 3′端可變剪接;MEE:互斥可變外顯子;AGPase:ADP-葡萄糖焦磷酸化酶;SS:淀粉合成酶;SBE:淀粉分支酶;AspP:ADP-糖焦磷酸化酶;SP:淀粉磷酸化酶Bolded font represented the gene in which the AS event occurred;IR:Intron retention;ES:Exon skipping;A5SS:Alternative 5′splice site;A3SS:Alternative 3′ splice site;MEE:Mutually exclusive exon;AGPase:ADP-glucose pyrophosphorylase;SS:Starch synthase;SBE:Starch branching enzyme;AspP:ADP-sugar pyrophosphatase;SP:Starch phosphorylase圖5 芋淀粉生物合成途徑的AS事件示意圖Fig.5 Schematic diagram of AS events in the taro starch biosynthesis pathway

      SSR標記由于操作技術簡單、穩(wěn)定性好及具有共顯性等特點,已廣泛應用于開展植物遺傳多樣性分析、DNA指紋圖譜構建和遺傳作圖[29]。You等[10]、Wang等[11]分別從芋二代轉錄組測序中鑒定了5278和11 363個SSR位點,Dong等[12]使用RAD-seq技術從芋中鑒定了4438個SSR位點,而本研究通過三代全長轉錄組測序可檢測到25 081個SSR位點,可見,利用二代轉錄組測序和RAD-seq技術2種方法檢測到SSR的位點數(shù)明顯少本研究檢測的SSR位點數(shù)量,說明三代測序技術在鑒定SSR位點方面優(yōu)于上述2種方法,可鑒定更多的SSR位點。

      lncRNA是一類長度大于200 bp但缺乏編碼能力的轉錄本。已有許多研究表明,lncRNA在植物生長發(fā)育及響應生物和非生物脅迫方面發(fā)揮重要作用[30]。本研究鑒定了304個lncRNA,其中l(wèi)incRNA的數(shù)量最多,這與對其他植物的研究報道結果相似[15,31],說明三代全長轉錄組測序可有效鑒定lncRNA。TF是一類具有特殊結構的蛋白,通過與靶基因上游啟動子特異性結合而調(diào)控靶基因的表達,在植物生長發(fā)育中發(fā)揮重要作用[32]。本研究共鑒定了1608個TF,其中MYB家族的TF最多,這些鑒定的TF將為后續(xù)研究芋基因功能提供充實的數(shù)據(jù)。

      本研究從芋淀粉生物合成的基因中共挖掘到5種酶的14個基因和60條轉錄本。在其他研究中,如Liu等[33]通過二代轉錄組測序挖掘到淀粉生物合成的AGPase、SS、SBE和SP基因共9個,Dong等[3]通過比較轉錄組在球莖發(fā)育過程中富集到淀粉生物合成的基因(AGPase、SS、SBE和SP)共10個,說明三代全長轉錄組測序可挖掘到更多的基因數(shù)量。此外,本研究檢測到基因PB.9743的轉錄本數(shù)量多達12條,說明三代全長轉錄組測序可鑒定同一基因的不同轉錄本,而二代轉錄組測序較難實現(xiàn),這為研究轉錄本結構信息提供了可靠依據(jù)?;诖耍狙芯繉Φ矸凵锖铣赏返幕蜻M行AS和APA分析。AS分析結果顯示,AGPase基因、SBE基因和SP基因均發(fā)生了AS事件,包括IR、ES、A5SS、A3SS和MEE 5種類型,說明芋淀粉生物合成過程中存在豐富的轉錄調(diào)控。對其他植物的研究也獲得類似的結果,如Li等[34]對草莓進行AS分析,發(fā)現(xiàn)AS可影響草莓發(fā)育過程相關基因和TF的功能;孫銘陽等[35]對穿心蓮內(nèi)酯前體合成途徑基因進行AS分析,結果表明穿心蓮內(nèi)酯前體合成的兩條途徑(質(zhì)體MEP途徑和細胞質(zhì)MVA途徑)均發(fā)生了AS事件,其中有1個基因產(chǎn)生了6個可變啟動子式的IR亞型。本研究對芋淀粉生物合成的基因進行APA分析,結果發(fā)現(xiàn)14個基因中有10個基因存在poly(A)位點,其中7個基因具有2個及以上poly(A)位點,說明APA參與調(diào)控芋淀粉的生物合成。在其他植物的研究中,Simpson等[36]證實APA在擬南芥開花過程中具有重要的調(diào)控作用;Abdel-Ghany等[21]對高粱進行干旱處理,結果顯示同一個基因產(chǎn)生了不同的APA;Wang等[8]在毛竹中鑒定了11個纖維素合酶基因(CesA)、11個纖維素合成酶相似基因(CsI)和2個木質(zhì)素基因由APA調(diào)控,說明APA可能參與調(diào)控細胞壁結構和次生細胞壁的形成。

      4 結 論

      通過三代全長轉錄組測序分析能獲取芋全長轉錄本的序列和結構信息,并挖掘到參與芋淀粉生物合成相關的基因14個,轉錄本60條,可為后續(xù)闡明芋淀粉生物合成分子機制及深入利用芋基因資源提供科學依據(jù)。

      猜你喜歡
      核苷酸基因組淀粉
      單核苷酸多態(tài)性與中醫(yī)證候相關性研究進展
      從人工合成淀粉說開去
      徐長風:核苷酸類似物的副作用
      肝博士(2022年3期)2022-06-30 02:48:28
      牛參考基因組中發(fā)現(xiàn)被忽視基因
      Acknowledgment to reviewers—November 2018 to September 2019
      MMT/淀粉-g-PAA的制備及其對鉻(Ⅵ)的吸附
      蕉藕淀粉與薯類淀粉特性對比研究
      廣東人群8q24rs1530300單核苷酸多態(tài)性與非綜合征性唇腭裂的相關性研究
      基因組DNA甲基化及組蛋白甲基化
      遺傳(2014年3期)2014-02-28 20:58:49
      有趣的植物基因組
      世界科學(2014年8期)2014-02-28 14:58:31
      安义县| 潼南县| 公安县| 东兴市| 廉江市| 涞源县| 息烽县| 四会市| 怀宁县| 翼城县| 东乡县| 佛学| 黄梅县| 淮滨县| 丘北县| 左贡县| 思南县| 天镇县| 芦溪县| 潞西市| 宣威市| 呼玛县| 会理县| 顺昌县| 永福县| 蛟河市| 班玛县| 霍林郭勒市| 沭阳县| 凌海市| 洪泽县| 樟树市| 健康| 丁青县| 板桥市| 舞阳县| 石阡县| 苗栗县| 光山县| 涡阳县| 嵩明县|