李 響,李中峰,高 俊,王 霞,張 欣,張卓勇
首都師范大學(xué)化學(xué)系,北京 100048
種子萌發(fā)是糧食作物生長(zhǎng)過(guò)程中極為重要的一個(gè)環(huán)節(jié),通常分為三個(gè)階段,第一階段,種子吸脹,細(xì)胞質(zhì)水合化; 第二階段,種子吸水速度緩慢,萌發(fā)過(guò)程的初始階段處于相對(duì)穩(wěn)定狀態(tài),代謝變化較少; 第三階段,胚根突破種皮幼苗成長(zhǎng)。此期間種子中的各種成分急劇變化[1],例如磷脂質(zhì)、甘油三酯、烴類含量不斷下降,而單甘油酯、甾醇類以及游離脂肪酸含量升高[2]。研究種子代謝過(guò)程中成分的變化能夠揭示種子萌發(fā)生長(zhǎng)中的關(guān)鍵代謝通路。通過(guò)核磁共振(NMR)、液相色譜-質(zhì)譜聯(lián)用(LC-MS)等高通量技術(shù)期望同時(shí)鑒定數(shù)十甚至數(shù)百種的代謝物來(lái)推測(cè)生物體內(nèi)發(fā)生的代謝變化[3],然而譜學(xué)技術(shù)獲得的代謝數(shù)據(jù)極其復(fù)雜,需要利用化學(xué)計(jì)量學(xué)方法提取其中有效的信息,了解生物功能,識(shí)別代謝機(jī)理和生物標(biāo)志物[4]。主成分分析(PCA),偏最小二乘(PLS),正交偏最小二乘(OPLS)等以潛變量之間相互正交為核心約束的方法在NMR代謝組學(xué)中應(yīng)用極為廣泛,然而數(shù)學(xué)上的正交并非儀器測(cè)量中自然物質(zhì)存在的信號(hào)規(guī)律,經(jīng)這些方法分析所獲得的結(jié)果往往很難與光譜庫(kù)進(jìn)行直接檢索。多元曲線分辨(MCR)方法能夠靈活地利用已知條件對(duì)數(shù)據(jù)實(shí)現(xiàn)約束,并獲得符合理化意義的波譜結(jié)果[5]。
本研究通過(guò)不同約束下的多元曲線分辨-交替最小二乘法(MCR-ALS)解析1H-NMR譜,以實(shí)現(xiàn)非靶向代謝組學(xué)研究分析植物特定時(shí)期的差異性代謝,解釋綠豆的不同萌發(fā)時(shí)間階段代謝物變化規(guī)律。
將綠豆用去離子水浸泡2 h后,用10%NaClO溶液消毒15 min,用去離子水清洗7次[6]。將清洗過(guò)的綠豆放入燒杯后,置于恒溫培養(yǎng)箱中進(jìn)行萌發(fā),選取萌發(fā)時(shí)間分別為24,36和48 h的樣本各30例,實(shí)驗(yàn)總樣本數(shù)為90例。將萌發(fā)后的綠豆樣品經(jīng)液氮處理后研磨,置于-80 ℃冷凍,凍干。凍干后的粉末樣品每份稱取100 mg,分別加入3 mL 50%甲醇超聲,提取代謝物,取上清液,氮吹后,凍干。測(cè)試前加入600 μL重水超聲溶解。采用VARIAN 600 MHz核磁共振氫譜儀(美國(guó)瓦力安公司)進(jìn)行1H-NMR測(cè)試,譜寬設(shè)定為20 ppm(12 kHz),掃描次數(shù)128,溫度為27 ℃,采樣數(shù)據(jù)點(diǎn)為16 k,以乳酸化學(xué)位移1.336 ppm的質(zhì)子信號(hào)為標(biāo)準(zhǔn)進(jìn)行定標(biāo)。
將測(cè)得的核磁數(shù)據(jù),利用MestReNova軟件進(jìn)行相位校正、基線校正和化學(xué)位移漂移校正。相位校正首先通過(guò)一階相位校正方法對(duì)數(shù)據(jù)進(jìn)行處理,見(jiàn)式(1)和式(2)
(1)
(2)
基線校正采用了多項(xiàng)式擬合方法,平均積分范圍內(nèi)的所有數(shù)據(jù)點(diǎn)對(duì)數(shù)據(jù)進(jìn)行分段積分,積分范圍包含0.80~9.20 ppm,去除重水峰4.50~5.23 ppm,去除甲醇峰3.35~3.39 ppm,積分區(qū)間為0.01。最后,通過(guò)對(duì)總面積進(jìn)行歸一化處理。
將積分后得到的數(shù)據(jù)導(dǎo)入Matlab中,得到90×841個(gè)變量的數(shù)據(jù)矩陣。
多元曲線分辨率(MCR)是基于雙線性模型的一種化學(xué)計(jì)量學(xué)方法,在數(shù)學(xué)上將混合物的響應(yīng),分解為所研究系統(tǒng)中涉及的每個(gè)主成分的純信號(hào)貢獻(xiàn)[7-8]。
多元曲線分辨-交替最小二乘法(MCR-ALS)以交替方法對(duì)數(shù)據(jù)進(jìn)行迭代,得到數(shù)據(jù)的濃度分布和光譜矩陣,原理如式(3)
D=CST+E
(3)
式(3)中,D(m×n)為核磁共振數(shù)據(jù)矩陣,有m個(gè)樣本,n個(gè)波譜變量,C(m×p)和ST(p×n)為提取后主成分的濃度矩陣和NMR波譜矩陣,C對(duì)應(yīng)代表綠豆代謝物的濃度矩陣,ST為綠豆代謝物主成分的核磁共振氫譜圖。E為誤差矩陣。p是該體系的主成分個(gè)數(shù)。
在雙線性模型中,不充分的約束會(huì)導(dǎo)致最終模型受到旋轉(zhuǎn)模糊的影響,存在非唯一解。在此工作中,NMR提供的代謝物信號(hào)不可能出現(xiàn)負(fù)值,代謝物的信號(hào)貢獻(xiàn)也不可能為負(fù)值,所以可以同時(shí)對(duì)光譜和濃度矩陣施加非負(fù)約束。此外,在不同時(shí)段存在特定代謝物的生成和消失,可通過(guò)選擇性約束對(duì)不同時(shí)段中的代謝物的濃度矩陣進(jìn)行約束。
首先,MCR模型需要確定主成分的個(gè)數(shù),這將直接影響到MCR對(duì)結(jié)果的解析。依據(jù)PCA結(jié)果確定主成分個(gè)數(shù)為3,這時(shí)解釋原變量方差的百分比為99.46%,選擇更多的主成分可能會(huì)過(guò)度擬合噪聲。
由于在僅使用非負(fù)約束的模型中存在不唯一解,將濃度下降趨于零的部分作為約束對(duì)象,推測(cè)此主成分對(duì)應(yīng)的代謝物是在代謝過(guò)程中降解的成分,于是使用選擇性約束以實(shí)現(xiàn)在迭代過(guò)程中尋找更接近真實(shí)的解。
在以往的報(bào)道中,核磁定量分析可以通過(guò)T1回溯轉(zhuǎn)換法得以實(shí)現(xiàn)但方法較為繁瑣,需要內(nèi)標(biāo)和待觀察物的T1值、以及非全弛豫一維譜圖[6]。通過(guò)對(duì)NMR數(shù)據(jù)得到的矩陣運(yùn)用MCR-ALS方法進(jìn)行處理,從而獲得三種主成分以及各主成分所包含的代謝物。將每種主成分的響應(yīng)數(shù)據(jù)繪制出箱型圖,可以根據(jù)箱型圖直觀地看出每種主成分中各個(gè)代謝物的相對(duì)含量變化趨勢(shì),此方法較為直觀和簡(jiǎn)便。
圖1為經(jīng)過(guò)預(yù)處理后的核磁共振譜,每條譜線對(duì)應(yīng)一個(gè)待測(cè)樣本的氫譜。通過(guò)圖1可以看出在各豆種子萌發(fā)的NMR圖譜中存在一定差異,然而由于代謝成分較為復(fù)雜,各化合物的特征峰高度重疊,難以獲得有用的代謝規(guī)律信息。
圖1 綠豆萌發(fā)代謝物的原始1H-NMR圖譜
圖2為MCR僅在對(duì)濃度和光譜方向使用非負(fù)約束下的結(jié)果,圖中分別顯示了三個(gè)時(shí)間段樣本濃度變化的箱型圖及其對(duì)應(yīng)主成分的NMR純光譜。NMR純光譜從圖(a2),(b2)和(c2)中可以看出三種主成分的光譜信息,具體特征峰對(duì)應(yīng)代謝物如表1。箱型圖由最小值(min),下四分位數(shù)(Q1),中位數(shù)(median),上四分位數(shù)(Q3),最大值(max)繪制而成。從濃度變化圖2(a1)中可以看出第一主成分在第一階段含量明顯降低。如圖2(b1)所示,第二主成分在整個(gè)萌發(fā)期間含量呈上升趨勢(shì)。如圖2(c1)所示,第三主成分在萌發(fā)初期含量升高,在萌發(fā)后期含量大幅下降。
圖2 僅使用非負(fù)約束條件下,MCR獲得的三種主成分對(duì)應(yīng)物質(zhì)的的含量變化及其1H-NMR圖(a): 第一主成分; (b): 第二主成分; (c): 第三主成分
其中第二主成分24 h組濃度趨向?yàn)?,推測(cè)此主成分對(duì)應(yīng)的代謝物在實(shí)際代謝變化中濃度在下降,可以使用選擇性約束對(duì)這一位置進(jìn)行約束。
如圖3所示,依照僅非負(fù)約束MCR結(jié)果的提示對(duì)第二主成分,在 24h組的樣本濃度方向施加選擇性約束。圖3(a1),(b1)和(c1)三幅圖分別為在此約束條件下,第一主成分、第二主成分以及第三主成分在24,36和48 h含量而得出的誤差圖。圖3(a2),(b2)和(c2)分別為第一主成分、第二主成分以及第三主成分的1H-NMR圖。如圖3(a1)所示,第一主成分在萌發(fā)初期含量下降,在萌發(fā)后期含量小幅度升高。如圖3(b1)所示,第二主成分在整個(gè)萌發(fā)期間含量保持上升趨勢(shì)。如圖3(c1)所示,第三主成分在萌發(fā)初期含量升高,在萌發(fā)后期含量大幅度下降。
圖3 MCR結(jié)合選擇性約束(第二個(gè)主成分, 24 h組)得到的各主成分的1H-NMR和濃度箱型圖(a): 第一主成分; (b): 第二主成分; (c): 第三主成分Fig.3 The boxplot of concentrations (a1—c1) and the 1H-NMR spectra (a2—c2)obtained by MCR with selectivity constraint(a): The first principal component; (b): The second principal component; (c): The third principal component
圖4 MCR結(jié)合選擇性約束(第二個(gè)主成分, 24 h組) 得到的各主成分的1H-NMR圖(a): 第一主成分; (b): 第二主成分; (c): 第三主成分Fig.4 The 1H-NMR sqectra (a—c) obtainedby MCR with selectivity constraint(a): The first principal component;(b): The second principal component;(c): The third principal component
根據(jù)文獻(xiàn)[6]對(duì)綠豆種子提取物中的代謝物特征峰進(jìn)行識(shí)別,可從MCR結(jié)果的圖譜中找到如表1所示代謝物。
其中,第一主成分中包含的代謝物有: 乳酸、乙酸、2-氨基-4-氧戊酸、膽堿、棉籽糖家族寡糖、α-半乳頹、蔗糖、N1-甲基煙酸; 第二主成分中包含的代謝物有: 纈氨酸、乙酸、α-酮戊二酸、2-氨基-4-氧戊酸、膽堿、棉籽糖家族寡糖、蔗糖、色氨酸、苯丙氨酸、肌苷、N1-甲基煙酸; 第三主成分中包含的代謝物有: 乳酸、2-氨基-4-氧戊酸、蘋果酸、檸檬酸、O-甲基鯊肌酸、磷酸膽堿、棉籽糖家族寡糖、α-半乳糖、N1-甲基煙酸。
表1 綠豆提取物的譜峰歸屬Table 1 Peak assignment of mung bean extract
通過(guò)MCR-ALS結(jié)合1H-NMR譜,實(shí)現(xiàn)了對(duì)綠豆種子萌發(fā)的非靶向代謝組學(xué)研究,模型充分利用了測(cè)定體系的先驗(yàn)信息進(jìn)行約束,得到了具有理化意義的光譜信息和相對(duì)濃度變化代謝信息。結(jié)果表明乙酸、膽堿在綠豆萌發(fā)前期存在,萌發(fā)后期含量呈現(xiàn)升高趨勢(shì); 蔗糖、纈氨酸、α-酮戊二酸色氨酸、苯丙氨酸、肌苷在萌發(fā)之前未見(jiàn)存在,隨綠豆萌發(fā)時(shí)間不斷延長(zhǎng),不斷合成,并且含量逐漸增加; O-甲基鯊肌酸、磷酸膽堿、α-葡萄糖在萌發(fā)前存在,在萌發(fā)初期不斷增加,直至萌發(fā)后期,因被消耗而含量逐漸降低,表現(xiàn)出先增加后降低的趨勢(shì)。乳酸、2-氨基-4-氧戊酸、蘋果酸、檸檬酸、膽堿、棉籽糖家族寡糖、α-半乳糖、N1-甲基煙酸在綠豆萌發(fā)期間一直存在,含量未見(jiàn)明顯變化。