謝倩 江來 賀進 劉玲玲 丁明月 陳清西
(福建農林大學園藝學院,福州 350002)
橄欖(Canarium album L.)是我國的特色木本果樹,作為重要的藥食同源果樹之一,澀味感與回甘度是影響其鮮食口感的主要因子[1-2],選育澀味淡、回甘明顯是橄欖新品種選育的主要目標。酚類物質類別含量直接影響橄欖澀味程度[3-6],糖[7]、氨基酸[8]等直接影響橄欖回甘程度。橄欖中酚類物質主要包括水解單寧、酚酸、黃酮類等[6,9-13],對橄欖果實品質具有重要作用。因此,挖掘橄欖酚類物質調控關鍵基因,解析其分子調控機制,對橄欖新品種選育具有重要指導意義。
轉錄組測序(RNA sequencing, RNA?seq)技術是高效獲取有效參考功能基因及標記位點的重要方式,也是獲得轉錄本定性和定量結果的有用工具,已經成為揭示目的性狀潛在分子調控機制的有效技術之一,加速了對未知功能基因的挖掘[14]。轉錄組是生物體在某種條件下所有轉錄產物的綜合,對于像橄欖這種沒有參考基因組的物種進行轉錄組測序,是連接基因型與表型的重要橋梁。轉錄因子(transcription factor, TF)通過調控其他基因的表達來影響相應的表型,是信號轉導的關鍵性節(jié)點,對于園藝植物次生代謝合成具有十分重要的作用[15-17]。轉錄組測序技術已被廣泛應用于園藝作物品質相關基因挖掘的相關研究中,如刺葡萄抗白腐病關鍵基因發(fā)掘[18]、獼猴桃果肉色澤調控基因挖掘[19]、鎘脅迫下梭魚草葉片苯丙烷代謝途徑相關基因挖掘[20]等。
酚類化合物主要通過莽草酸途徑(shikimate pathway, SP)、苯丙烷代謝途徑(phenylpropanoid metabolic pathway, PMP)與類黃酮代謝途徑(flavonoid metabolic pathway, FMP)合成,由糖酵解(embden?meyerhof?pamas pathway, EMP)途徑生成的磷酸烯醇式丙酮酸(phosphoenolpyruvate, PEP)和磷酸戊糖(phosphoenolpyruvate, PPP)途徑生成的赤蘚糖?4?磷酸(erythrose?4?pyosphate, E4P)經SP 途徑形成苯丙氨酸,苯丙氨酸在各種酶的催化作用下,經過PMP途徑和FMP 途徑形成的[21]。為深入研究不同鮮食品質橄欖酚類物質代謝途徑的分子調控機制,探究4 個品種(系)在成熟期基因轉錄水平差異,選取鮮食品質差異顯著的‘子陽1 號’和‘東山長穗’2個品種(系),比較分析在成熟過程的轉錄組差異,并進一步挖掘調控橄欖酚類合成相關轉錄因子,為深入研究酚類代謝途徑參與橄欖鮮食品質差異形成的分子機制奠定理論基礎。
‘惠圓’(HP)、‘子陽1 號’(SP)口味苦澀,較不適合鮮食;‘甜欖1 號’(TQ)、‘東山長穗’(DQ)澀味較淡,適合鮮食[2]。本研究以這4 個橄欖品種(系)(C.album)為材料,成熟果采于2020 年11 月中下旬成熟期,不同成熟時期果實采于2020 年8-11月(花后80 d、95 d、160 d)。樣本采自福州市橄欖種質資源圃(26°8'6'' N,119°15'58'' E),采后用液氮快速冷凍并于?80℃冰箱保存?zhèn)溆谩?/p>
為方便分析將花后80 d、95 d、160 d 分別表示為a、b、c。
1.2.1 果實總酚測定 總酚提取采用水浴鍋浸提[22],測定采用福林酚試劑法[23]進行,標準曲線為Y 濃度=(X吸光值- 0.008 9)/2.424 7(R2= 0.999 8,標準液為沒食子酸),試驗重復3 次。
1.2.2 RNA 提取與質量檢測 RNA 提取選用天根多糖多酚試劑盒,每個樣品設置3 個生物學重復,共構建24 個文庫。提取的RNA 采用1%瓊脂糖凝膠電泳(電壓180 V,電泳時間16 min)、Agilent 2100生物分析儀進行RNA 純度、完整性檢測;采用NanoPhotometer 分光光度計進行RNA 純度(OD260/280和OD260/230)檢測;采用Qubit 2.0 熒光計進行RNA濃度測定。
1.2.3 cDNA 文庫構建、質檢與測序 提取總RNA 后,通過Oligo(dT)磁珠富集mRNA,加入Fragmentation buffer 打斷成短片段,以短片段mRNA為模板,合成第一鏈cDNA;加入緩沖液、dNTPs與DNA polymerase I 合成二鏈cDNA 后純化雙鏈cDNA;純化的雙鏈cDNA 通過末端修復、加A 尾后連接測序接頭,AMPure XP beads 進行片段大小選擇后進行PCR 富集,完成cDNA 文庫構建。Insert size 符合預期后進行文庫濃度定量,然后用Illumina HiSeq 平臺進行混合樣本測序。
1.2.4 序列拼接 測序得到的原始數據經過濾、測序錯誤率檢查、GC 含量分布檢查,獲得Clean reads后,采用Trinity 組裝軟件對Clean reads 進行拼接。拼接得到的轉錄本序列,以Corset(官方網站https://code.google.com/p/corset?project/)層 次 聚 類 后得到最長Cluster 序列作為Unigene 用于本研究后續(xù)分析。
1.2.5 轉錄本功能注釋與編碼區(qū)預測 Unigene 序列使用BLAST 軟件分別在KEGG、NR、SwissProt、GO、KOG、Trembl 數據庫中進行比對(E?value ≤10-5);完成Unigene 氨基酸序列預測后,使用Pfam數據庫與HMMER 軟件進行序列比對,獲得相應Unigene 的功能注釋信息。
1.2.6 表達量注釋、差異表達基因篩選及功能分析 將得到的序列數標準化為FPKM 值,標準化后的FPKM 值即為該基因的表達量。差異表達基因(differentially expressed genes,DEGs) 選 用TBtools的DESeq2 插件,使用負二項分布模型來鑒定差異表達基因。成熟果DEGs 篩選條件:鮮食品質差的高酚品種(系)(SPc、HPc)與鮮食品質好的低酚品種(系)(TQc、DQc)間的“P < 0.05,|log2FPKM低酚/FPKM高酚|≥1”,定義了4 組差異基因,即SPc vs TQc、SPc vs DQc、HPc vs TQc、HPc vs DQc。其 中FPKM低酚>FPKM高酚,基因上調表達,稱為正選擇基因,反之下調表達稱為負選擇基因。使用TBtools(1.1043)對差異基因進行KEGG 通路富集分析,采用Origin Pro 2021 進行結果可視化。
1.2.7 權重基因共表達網絡分析 對橄欖不同品種(系)及成熟過程的24 個樣本的DEGs 進行加權基因共表達網絡分析(weighted gene co?expression network analysis,WGCNA)。首先對DEGs 進行過濾,設置IQR 篩選,Cutoff =0.5;數據過濾后對樣本進行WGCAN 分析,軟閾值β 值=16,最小模塊基因數50,相似模塊合并閾0.25。目標模塊基因互作網絡可視化采用Maximum clique centrality(MCC)拓撲分析法,以degree 值≥1 篩選與代謝途徑相關的關鍵轉錄因子。
1.2.8 RT?qPCR 驗 證 選 擇12 個 差 異 表 達 基 因Unigene 在2 個品種(系)果實間進行RT?qPCR,驗證轉錄組數據的可靠性。引物序列、RT?qPCR 橄欖品種(系)見表1,共18 個樣品。RNA 提取同1.2.2,以RNA 為 模 板, 按 TransScript? All?in?One First?Strand cDNA Synthesis SuperMix for qPCR 的說明書配制RT?qPCR 反應液,42℃孵育15 min,85℃滅活5 s,得到cDNA,?20℃冰箱保存?zhèn)溆谩?/p>
表1 RT-qPCR 引物序列Table 1 Primer sequences for RT-qPCR
根據Real Universal Color PreMix(SYBR Green)操作規(guī)程,用LightCycler96 儀進行RT?qPCR 擴增。以18S rRNA 基因為內參,反應體系:體系總容量20 μL,含10.0 μL 2× PerfectStart? Green qPCR SuperMix(+Dye II),2.0 μL 樣品cDNA,上游和下游引物各0.4 μL(20 μmol/L),ddH2O 7.2 μL;反應程序:94℃預變性30 s;94℃變性5 s;60℃退火和延伸30 s,40個循環(huán),4℃保存,每個樣品重復3 次,利用溶解曲線檢測引物的特異性,按照2-ΔΔCT公式計算基因相對表達量[24]。
1.2.9 數據分析 PCA 分析采用SIMCA14.1 軟件分析;層次聚類分析、柱狀圖、差異代謝物熱圖、KEGG 氣泡圖、韋恩圖等采用Origin Pro 2021 軟件分析制作;代謝路徑圖采樣Adobe Illustrator CC 2017 SP 軟件完成。DEGs 加權基因共表達網絡構建和分析以R 語言軟件中的 WGCNA 包進行,目標模塊內基因互作網絡可視化使用Cytoscape 3.9.1 軟件。
‘子陽1 號’(SP)與‘東山長穗’(DQ)隨著果實的成熟,總酚含量呈上升到趨于平緩的趨勢,成熟前期(80 DAF)兩品種(系)總酚含量差異不大(P >0.05),后期SP 總酚含量上升趨勢快于DQ,成熟時表現顯著高于DQ(P<0.05)(圖1)。4個品種(系)成熟果總酚含量SP 含量顯著高于其他3 個品種(系)(P<0.05);HP 顯著高于TQ 與DQ(P<0.05);TQ 與DQ 含量差異不顯著。
圖1 橄欖果實成熟過程及成熟期總酚含量Fig.1 Total phenol content in Chinese olive fruit ripening process and maturity period
為方便分析,把鮮食品質差的‘惠圓’(HP)、‘子陽1 號’(SP)稱為高酚橄欖,鮮食品質好的‘甜欖1 號’(TQ)、‘東山長穗’(DQ)稱為低酚橄欖。
序列拼接得到296 314 條Unigene,平均長度為1 163 bp,N50 為1 764 bp,超過2/5 的序列(123 611條Unigene)長度超過1 000 bp(表2)。
表2 橄欖轉錄組序列拼接結果Table 2 Sequence splicing results of Chinese olive transcriptome
215 062 條Unigene(72.58%)在NR 數據庫中獲得功能注釋的基因中,通過NR 數據庫比對發(fā)現(圖2),與橄欖同源性最高的序列主要為甜橙(Citrus sinensis)、克萊門氏小柑橘(Citrus clementina)、蜜柑(Citrus unshiu)、葡萄(Vitis vinifera)。
圖2 橄欖Unigene 基于NR 數據庫比對物種分布Fig.2 Species distribution of Chinese olive Unigene based on NR database alignment
轉錄組數據根據樣本基因FPKM 表達量計算24個樣本的相關性,統(tǒng)計結果見圖3,重復樣本間具有較高的相關性,相關性系數均大于0.8,說明樣本轉錄組數據重復性好。
圖3 橄欖各樣本轉錄組數據相關性熱圖Fig.3 Correlation heatmap of transcriptome data of Chinese olive samples
根據24 個樣品的轉錄水平,將至少在某一個樣品中FPKM > 0.1 的基因定義為表達基因。為篩選鮮食品質差異顯著(高酚/低酚)橄欖在轉錄組水平上的差異,對高酚低酚橄欖成熟果的表達基因進行DEGs 篩選,篩選條件為|log2FC|≥1,且P <0.05,結果如圖4?A 所示,22 631、17 313、19 763、16 958 個DEGs 在SPc 與DQc、SPc 與TQc、HPc 與DQc、HPc 與TQc 間呈現差異表達,其中低酚橄欖相對于高酚橄欖分別有11 360/11 271(SPc vs DQc)、8 036/9 277(SPc vs TQc)、9 802/9 961(HPc vs DQc)和7 778/9 180(HPc vs TQc)個基因顯著上調/下調表達。進一步通過維恩圖分析,見圖4?B,發(fā)現存在1 628 個共有DEGs,并進行KEGG 通路富集分析,富集結果如圖4?C,在“初級代謝”“乙醛酸和二羧酸代謝”“類黃酮生物合成”“過氧化物酶體”“類胡蘿卜素生物合成”等通路中顯著富集(P<0.05)。
圖4 不同品種(系)橄欖差異基因與KEGG 富集分析Fig.4 Differential genes and KEGG enrichment analysis of Chinese olive in different varieties(lines)
基于q 值與差異倍數的雙重篩選低酚橄欖DQ與高酚橄欖SP 成熟過程差異表達的基因數量。高酚橄欖SP 在成熟過程19 479、25 854、12 871 個基因分別在SPa 和SPb、SPa 和SPc、SPb 和SPc 中呈現差異表達,取并集得到38 277 個基因在果實成熟階段差異表達;低酚橄欖‘東山長穗’(DQ)在成熟過程2 946、25 929、22 635 個基因分別在DQa 和DQb、DQa 和DQc、DQb 和DQc 中呈現差異表達,取并集得到33 418 個基因在果實成熟階段差異表達(圖5?A、B)。
圖5 不同品種(系)橄欖成熟過程差異基因與KEGG 富集分析Fig.5 Differential genes and KEGG enrichment analysis of different varieties(lines)of Chinese olive ripening process
對SP 和DQ 成熟過程差異基因分別進行KEGG富集分析,分別63.3%(SP)、64.5%(DQ)的差異基因被比對到KEGG 數據庫中。富集結果如圖5?C,兩品種(系)在成熟過程,代謝通路在“初級代謝”“蛋白質”“碳水化合物代謝”等通路上顯著富集(P<0.05);“氨基酸代謝”途徑均富集不顯著(P>0.05);酚類物質合成相關代謝通路“苯丙烷類生物合成”“異黃酮生物合成”“類黃酮生物合成”中顯著富集(P<0.05)。
橄欖酚類代謝物主要包括酚酸、水解單寧、類黃酮(黃酮、黃酮醇、黃烷醇)化合物,它們合成的前體均是經由莽草酸途徑生成,同時成熟果共有差異基因在類黃酮生物合成途徑中顯著富集(圖4?C)。因此為了進一步探究高酚低酚橄欖成熟過程酚類物質的差異形成分子機制,對莽草酸-水解單寧/苯丙烷-類黃酮生物合成通路差異基因進行了表征。文中基因表達量用FPKM 值表示,差異表達倍數描述為某一基因的表達量在同一發(fā)育成熟期的低酚橄欖DQ 與高酚橄欖SP 的比值,相對表達譜描述為不同成熟過程經Log2 轉化的差異倍數。
高酚低酚不同品種(系)橄欖果實成熟過程莽草酸-水解單寧生物合成途徑結構基因的相對表達圖譜(圖6)發(fā)現,莽草酸途徑作為苯丙烷途徑的共同上游路徑,多數合成途徑上的差異基因在不同品種(系)有表現上調也有表現下調,并沒有表現絕對的高酚橄欖中高于低酚橄欖,如DPS、SKDH、SK、CS 等。UGTs 是水解單寧生物合成途徑的關鍵酶,表征的UGTs 差異基因多數表現為高酚橄欖顯著高于低酚橄欖。
圖6 不同品種(系)橄欖成熟過程莽草酸-水解單寧生物合成途徑差異基因分析Fig.6 Differential gene analysis of shikimic acid and hydrolyzed tannin biosynthesis pathway in different varieties(lines)of Chinese olive during maturation
高酚低酚不同品種(系)橄欖果實成熟過程苯丙烷-類黃酮生物合成途徑結構基因的相對表達圖譜(圖7)發(fā)現,多數合成途徑上的差異基因有上調也有下調。PAL 是整個苯丙烷代謝途徑的起始酶和限速酶,表征的PAL 差異基因多數表現為高酚橄欖高于低酚橄欖。CHS 是進入類黃酮途徑的起始酶和關鍵酶,也是限速酶,成熟期高酚橄欖的CHS 顯著高于低酚橄欖;CHI 是黃酮類化合物生物合成途徑上游的關鍵酶,篩選的多數CHI 差異基因表達量高酚橄欖高于低酚橄欖。F3H、FLS、DFR、ANS、ANR 基因在類黃酮合成階段的表達有所差異,F3'5'H 在不同品種(系)橄欖的表達水平沒有差異;LAR 平在不同品種(系)橄欖的表達水平沒有差異,但ANS、ANR 在不同品種(系)表達有高有低,ANS 在低酚橄欖表達量高于高酚橄欖。
圖7 不同品種(系)橄欖成熟過程苯丙烷-類黃酮生物合成途徑差異基因分析Fig.7 Differential gene analysis in phenylpropanes and flavonoids biosynthesis pathways in different varieties(lines)of Chinese olive during maturation
2.7.1 構建差異基因共表達網絡 試驗中共獲得80 981 個DEGs,根據IQR 值過濾50%的基因,選擇45 489 個DEGs 進行WGCNA 分析。結果如圖8?A-C,設定軟閾值為16,產生19 個共表達模塊,除了320 個基因歸入M20 模塊,代表未獲得指定模塊外,其余45 169 個均聚類到19 個共表達模塊中,一種顏色代表一個模塊,模塊內基因數量介于145-8 103 之間,權重值介于0.100-0.349;其中模塊最大的為M4 模塊,包含8 103 個基因,最小的為M12模塊,包括145 個基因。
圖8 基因共表達網絡的可視化Fig.8 Visualization of gene co-expression network
2.7.2 鑒定與酚類化合物相關的模塊及轉錄因子挖掘 為了探究橄欖酚類化合物生物合成的調控機制,結合模塊-性狀的熱圖,利用模塊內基因的調控關系篩選與模塊內莽草酸-水解單寧/苯丙烷-類黃酮代謝途徑結構基因共表達的轉錄因子。根據圖6、圖7 表征的莽草酸-水解單寧/苯丙烷-類黃酮代謝途徑的差異基因,其主要位于M3(20)、M2(19)、M18(17)、M4(13)、M1(8)、M5(4)、M17(3)、M8(3)、M9(1)、M15(1)、M10(1) 和M7(1)模塊。結合模塊-總酚熱圖中每個模塊與性狀的相關性(R2)和P 值,見圖9?A,M3、M4、M5 和M9與總酚的相關性較高,R2均大于0.5,且均達到極顯著水平(P<0.01),采用MCC 拓撲分析法,計算這4個模塊各節(jié)點degree 得分,以degree 值≥1 來篩選關鍵轉錄因子,并對這4 個模塊關鍵基因進行網絡可視化(圖9?B)。雖然M6 模塊與多數酚類化合物具有顯著相關性,但該模塊內沒有莽草酸-水解單寧/苯丙烷-類黃酮代謝路徑上的基因。
圖9 酚類化合物模塊鑒定及其相關轉錄因子挖掘Fig.9 Module identification of phenolic compounds and mining of their associated transcription factors
M3 模塊中包含莽草酸途徑DPS(1 個)、SK(1個)、pheA2(1 個)基因的Unigene,苯丙烷途徑PAL(1 個)、4CL(6 個)基因的Unigene,類黃酮途徑F3'H(2 個)基因的Unigene。利用模塊內基因的調控關系篩選與上述基因共表達轉錄因子的Unigene,共篩選到72 個轉錄因子的Unigene,這些轉錄因子Unigene 與上述1-9 個基因Unigene 具有一定的連通性,且以B3 類轉錄因子中的ARF 家族、HB 轉錄因子、MYB 轉錄因子為主,其中B3 以ARF家族、HB 以HD?Zip 家族為主。
M4 模塊包含莽草酸途徑多個基因的Unigene,DPS(1 個)、SKDH(1 個)、pheA2(1 個)、GOT1(1個)、TAT(1 個)、hisC(1 個);苯丙烷途徑4CL(1 個)基因Unigene;類黃酮途徑CHS(1 個)、CHI(2 個)、ANR(1 個)基因Unigene。利用模塊內基因的調控關系篩選與上述基因共表達的轉錄因子,篩選到45個轉錄因子相關的Unigene 與上述基因Unigene 共表達,來自bZIP、bHLH、HB、WRKY 等基因家族。
M5 模塊包含莽草酸途徑SKDH(1 個)基因的Unigene,苯丙烷途徑4CL(1 個)基因的Unigene,類黃酮途徑CHS(1 個)、CHI(1 個)基因的Unigene。利用模塊內基因的調控關系篩選與上述基因共表達的轉錄因子,篩選到14 個轉錄因子的Unigene 與上述基因共表達,來自SBP、MYB、bHLH 等基因家族。
M9 模塊包含莽草酸代謝途徑上CM(1 個)基因的Unigene。利用模塊內基因的調控關系篩選與上述基因共表達的轉錄因子,篩選到6 個轉錄因子Unigene 與之共表達,來自GRAS、NAC、WRKY、bHLH、bZIP 基因家族。
綜上,共篩選到137 個轉錄因子Unigene 與莽草酸-水解單寧/苯丙烷-類黃酮生物合成途徑的30 個結構基因Unigene 共表達,轉錄因子Unigene功能注釋后來自35 個基因家族,類別統(tǒng)計見圖9?C,其中最多的為鋅指蛋白(C2C2、C3H、C2H2、PHD),其次為B3、HB、MYB、NAC 基因家族,其他如bHLH、WRKY、bZIP 等。
為驗證轉錄組數據的可靠性,結合轉錄組差異表達基因和WGCNA 分析結果,隨機篩選18 個轉錄組FPKM 值對應的差異基因在不同品種(系)進行RT?qPCR。結果如圖10 所示,RT?qPCR 與轉錄組數據中的基因表達水平相關系數為0.822 1(P<0.01),表明轉錄組分析數據是可靠的。
圖10 RNA-Seq 與RT-qPCR 基因表達水平間的相關性Fig.10 Correlation of the gene expression obtained from RNA-Seq and RT-qPCR
轉錄組測序為研究橄欖鮮食品質形成及代謝途徑與關鍵基因挖掘提供了豐富的數據基礎。本研究共獲得了296 314 條Unigene,72.58% Unigene 在數據庫中獲得功能注釋;橄欖沒有基因組信息做參考,在NR 數據庫中獲得功能注釋的基因中,同源性最高的序列主要為甜橙(Citrus sinensis)、克萊門氏小柑橘(Citrus clementina),未在公共數據庫中得到注釋的Unigene,可能是橄欖中特異的編碼基因或潛在的長非編碼RNA,今后可進行深入探究。
通過RNA?seq 技術獲得的高通量數據可以客觀、完整地反映試驗樣本間的轉錄表達,許多研究試圖通過RNA?seq 來闡明酚類物質生物合成的分子基礎,如通過對不同澀味類型柿子的轉錄組學和代謝組學分析,確定了參與黃酮類生物合成的關鍵基因與轉錄因子[25];通過對山茶花花瓣的階段性轉錄組分析,確立了參與黃酮類生物合成的關鍵基因[26]。本研究4 個品種(系)橄欖成熟果共有DEGs 進行KEGG富集分析發(fā)現,在“類黃酮生物合成”途徑顯著富集,結合影響橄欖鮮食品質的酚類代謝物,包括酚酸、水解單寧、類黃酮(黃酮、黃酮醇、黃烷醇)等,確定與莽草酸-水解單寧/苯丙烷-類黃酮生物合成途徑有關的基因。酚類物質的生物合成復雜多樣,水解單寧需從莽草酸途徑中獲得底物[27],類黃酮、酚酸從苯丙烷途徑獲得底物[28],苯丙烷途徑又是經由莽草酸途徑合成前體物質[29]。很多編碼該途徑中酶的結構基因已被鑒定,如SKDH、UGTs、PAL、C4H、4CL、CHS、CHI、F3'H、FLS、F3'5'H等關鍵基因[30-32]。SKDH 是決定水解單寧生物合成的第一個關鍵酶,UGTs 負責催化沒食子酸糖基化,合成水解單寧的前體物質β-葡聚糖,是水解單寧生物合成途徑的關鍵酶,UGTs 在低酚橄欖表達量低于高酚橄欖,這也導致了高酚橄欖中水解單寧含量較高;PAL 是苯丙烷合成的第一種酶,是整個苯丙烷代謝途徑的起始酶和限速酶[33],在酚酸、香豆素、木質素、類黃酮的合成中發(fā)揮關鍵作用[34-35],在鮮食品質差(高酚)的橄欖中多數PAL 基因表達高于鮮食品質好(低酚)的橄欖。類黃酮合成起始于苯丙氨酸,經過苯丙烷類代謝途徑催化形成的4?香豆酰?CoA 與丙二醛?CoA 在CHS 和CHI 催化作用下形成黃烷酮,黃烷酮是下游黃酮、黃酮醇、黃烷醇合成之路的同體前體物質[36];CHS 是進入類黃酮途徑的起始酶和關鍵酶,也是限速酶,高酚橄欖CHS 成熟期表達量高于低酚橄欖;CHI 是黃酮類化合物生物合成途徑上游的關鍵酶,對于提高黃酮醇含量有重要作用[21],高酚橄欖CHI 表達量多數高于低酚橄欖。F3H、FLS、DFR、ANS、ANR 基因在類黃酮合成階段的表達有所差異,黃烷酮在F3H 催化下形成二氫黃酮醇,F3'H 和F3'5'H 催化黃烷醇,其產物是花青素和縮合單寧合成的關鍵中間體[37],F3'5'H在不同品種(系)橄欖的表達水平沒有差異;LAR、ANS 是類黃酮生物合成的下游基因,分別將無色花色素催化成2R,3S?黃烷?3?醇和花青素[38],ANR催化花青素生成2R,3R?黃烷?3?醇[36,39-40],本研究中不同品種(系)橄欖的LAR 表達水平沒有差異,但ANS、ANR 在不同品種(系)表達有高有低,ANS 在低酚橄欖表達量高于高酚橄欖,這也導致了高酚橄欖中兒茶素含量較高。
TF 在植物次生代謝中處于信號轉導的關鍵節(jié)點,可通過與基因啟動子上特有的順式作用原件結合,在特定時間和空間激活或者抑制靶基因表達,以實現對靶基因的轉錄調控[41]。果實酚類物質含量為數量性狀[42],多基因假說認為數量性狀受多基因控制[43]。許多來自不同基因家族和不同的物種的轉錄因子被報道參與酚類物質生物合成的轉錄調控網絡,如R2R3?MYB、NAC、bZIP 和bHLH等[34,44-45]。R2R3?MYB 是MBW 復合體的核心成員,通過與結構基因啟動子區(qū)域結合參與調控類黃酮的生物合成[46]。PpMYB17 已經被證實通過激活梨果實中的結構基因PpCHS、PpCHI、PpF3H 和PpFLS來正向調控類黃酮的生物合成[47]。bHLH 可以特異性識別并結合R3 類MYB 特異基序,通過彼此間的相互作用形成二元復合體從而完成對類黃酮合成的調控[48-49]。NAC 調控酚類物質的形成,如MdNAC9與紅肉蘋果的黃酮醇生物合成密切相關,在蘋果愈傷組織中過表達MdNAC9 后黃酮醇含量顯著增加[50]。銀杏GbbZIP08 和GbbZIP15 能參與銀杏花青素生物合成[51];蘋果bZIP 類轉錄因子MdHY5 參與調控蘋果花青苷素的合成,并且與MdWRKY41、MdWRKY11、MdMYB 等轉錄因子互作影響花青苷素的積累合成[52-54]。鋅指蛋白轉錄因子調控酚類物質合成機制研究相對較少[55],在柿果脫澀研究中發(fā)現,C2H2 型鋅指蛋白在高CO2環(huán)境下對柿果實脫澀的調節(jié)機制[56]。B3 基因家族主要在調控植物的生長發(fā)育、生物與非生物脅迫反應、器官形態(tài)建成、開花結實等生物學功能中發(fā)揮重要作用[57]。本研究通過WGCNA 挖掘了137 個轉錄因子Unigene 與莽草酸-水解單寧/苯丙烷-類黃酮生物合成途徑的30個結構基因Unigene 共表達,轉錄因子Unigene 來自35 個基因家族,最多的為鋅指蛋白(C2C2、C3H、C2H2、PHD),其次為B3、HB、MYB、NAC 基因家族,其他如bHLH、WRKY、bZIP 等基因家族。
4 個品種(系)橄欖成熟果共鑒定到1 628 個DEGs,DEGs 在“類黃酮生物合成”途徑顯著富集;挖掘到137 個調控酚類物質合成的轉錄因子Unigene與30 個酚類合成結構基因Unigene 相關,轉錄因子Unigene 功能注釋來自35 個基因家族,最多的為鋅指蛋白(C2C2、C3H、C2H2、PHD),其次為B3、HB、MYB、NAC 基因家族。