趙 楠, 程孟春, 吳玉林,3, 劉 丹, 張曉哲*
(1.中國(guó)科學(xué)院分離分析化學(xué)重點(diǎn)實(shí)驗(yàn)室, 中國(guó)科學(xué)院大連化學(xué)物理研究所, 遼寧 大連 116023; 2.中國(guó)科學(xué)院大學(xué), 北京 100049; 3.河南中醫(yī)藥大學(xué), 河南 鄭州 450046)
多肽是由2~100個(gè)氨基酸以不同組成和排列方式構(gòu)成的相對(duì)分子質(zhì)量范圍為200 Da至10 000 Da的分子[1]。天然存在的多肽廣泛參與人體多種生理過程的調(diào)控,充當(dāng)神經(jīng)遞質(zhì)、激素、生長(zhǎng)因子和抗生素等,具有重要的生物學(xué)功能[2,3]。食物來源多肽與人體內(nèi)源肽結(jié)構(gòu)類似,因此它們可與人體相同受體相互作用以發(fā)揮相應(yīng)的生理功能[4]。食源多肽可以來自蛋白質(zhì)水解的穩(wěn)定肽,也可來自動(dòng)物、植物原生肽。植物多肽在植物的生長(zhǎng)、發(fā)育、繁殖、防御和應(yīng)激反應(yīng)中發(fā)揮著各種各樣的天然功能[5]。迄今,已報(bào)道被分離的上百種植物多肽,如寡肽、環(huán)肽、環(huán)肽生物堿、糖肽等,從不同角度展現(xiàn)出可喜的生物活性[6],開發(fā)前景廣闊。因此,對(duì)植物多肽分子的全面分析不僅可以更好地理解系統(tǒng)生物學(xué),且有助于藥用食品(營(yíng)養(yǎng)保健品)、藥品和改良作物的生產(chǎn)[7]。
多肽組學(xué)是生物樣品中多肽類物質(zhì)的綜合分析,其目標(biāo)是系統(tǒng)、全面、定性和定量地研究生物體內(nèi)源多肽的組成、功能及變化[8],被稱為蛋白質(zhì)組學(xué)的“邏輯續(xù)集”[9]。目前,多肽組學(xué)已被廣泛用于生物標(biāo)志物發(fā)現(xiàn)、疾病早期診斷、生物制藥等諸多領(lǐng)域[10,11]。然而,多肽組學(xué)很少用于中藥特別是植物藥的質(zhì)量控制。生物內(nèi)源多肽結(jié)構(gòu)多樣、含量與分子質(zhì)量動(dòng)態(tài)范圍寬泛、內(nèi)源多肽與代謝物和脂質(zhì)共存且相對(duì)分子質(zhì)量范圍重疊,使得多肽組學(xué)分析成為分析化學(xué)領(lǐng)域的重大挑戰(zhàn)[1]。盡管已有多種分析手段被用于多肽組學(xué),但目前液相色譜-質(zhì)譜聯(lián)用(LC-MS)技術(shù)由于結(jié)合了色譜強(qiáng)大的分離功能和質(zhì)譜的高靈敏、高通量、高選擇性,已經(jīng)逐漸成為多肽組學(xué)研究的主流技術(shù)。國(guó)內(nèi)外研究者目前已將LC-MS技術(shù)應(yīng)用于動(dòng)、植物活性組分、肉制品真實(shí)性鑒定等食物來源多肽的研究[12,13]。
人參為五加科(Araliaceae)多年生草本植物人參PanaxginsengC.A.Meyer的干燥根和根莖,被列為全球最受歡迎的天然產(chǎn)物,作為草藥、食品添加劑以及保健品使用[14]。人參具有免疫調(diào)節(jié)、抗腫瘤、抗抑郁、神經(jīng)保護(hù)等多種生物活性[15,16]。2015版《中國(guó)藥典》收載人參根及根莖均為人參藥用部位[17];并按不同形態(tài)區(qū)域?qū)⑷藚澐殖?個(gè)部位,即主根、支根、須根和蘆頭。人參市場(chǎng)中常將上述4個(gè)部位分別銷售,且市場(chǎng)價(jià)值差異較大。因此,闡明人參不同部位的化學(xué)差異對(duì)于人參的鑒定、藥用和質(zhì)量控制都具有重大意義。
目前已經(jīng)進(jìn)行了大量研究以評(píng)價(jià)人參不同部位的化學(xué)差異,但大多數(shù)研究?jī)H局限于人參主要活性成分人參皂苷類[18-20]。然而除人參皂苷外,人參還富含多種非皂苷類成分,如多糖、蛋白質(zhì)、多肽、聚乙炔、揮發(fā)油、黃酮、脂肪酸和氨基酸等[21]。隨著人參研究不斷深入,人參非皂苷類成分也顯示出人參藥效相關(guān)活性。全面描述人參中所有化學(xué)成分對(duì)人參在全球健康市場(chǎng)中獲得科學(xué)有效性至關(guān)重要[22]。近年來,人參內(nèi)源性多肽因其良好的藥理學(xué)性質(zhì),如抗炎、鎮(zhèn)痛、神經(jīng)保護(hù)、記憶增強(qiáng)、增殖、抗脂解和調(diào)節(jié)睡眠等作用受到越來越多的關(guān)注[23-26]。本團(tuán)隊(duì)建立了一種基于納升液相色譜-質(zhì)譜(nano-LC-MS)的多肽組學(xué)方法,通過數(shù)據(jù)挖掘和從頭測(cè)序,結(jié)合不同的質(zhì)譜碎裂方式,對(duì)人參提取物中的人參多肽進(jìn)行全面表征[27]。本研究采用基于超高效液相色譜-高分辨質(zhì)譜(UPLC-HRMS)的多肽組學(xué)技術(shù)對(duì)人參多肽類成分進(jìn)行全面分析,表征了人參多肽的結(jié)構(gòu);建立了模式識(shí)別模型用于人參主根、支根、須根和蘆頭多肽的差異分析,找到不同部位存在的差異多肽,并篩選出人參多肽標(biāo)志物,為進(jìn)一步的藥理學(xué)研究和臨床應(yīng)用提供了理論依據(jù),并為人參質(zhì)量控制及合理開發(fā)、應(yīng)用提供了新思路。
1290 Infinity超高效液相色譜儀、6520四極桿-飛行時(shí)間質(zhì)譜聯(lián)用儀(Q-TOF-MS,美國(guó)Agilent公司); ACQUITY超高效液相色譜儀(美國(guó)Waters公司)、二維線性離子阱靜電場(chǎng)軌道肼組合式高分辨質(zhì)譜儀(LTQ-Orbitrap-MS,美國(guó)Thermo公司); Milli-Q超純水儀(美國(guó)Milli-pore公司); YQ-1000C型超聲儀(上海易超凈公司); 1-16K型微型冷凍離心機(jī)(德國(guó)Sigma公司)。
甲醇和乙腈(色譜純)購自德國(guó)Merck公司;甲酸(色譜純)購自天津市科密歐化學(xué)試劑有限公司。
本研究共收集來自吉林省集安市4~6年新鮮園參樣本49例,全部為大馬牙型。樣品均有專人采集,并由專業(yè)人士進(jìn)行嚴(yán)格的品種鑒定。
將鮮園參樣品的不同形態(tài)區(qū)域(主根、支根、須根和蘆頭)分別風(fēng)干、研磨和過篩以獲得均勻粉末。精密稱取各粉末100 mg置于2 mL離心管中,加入1 mL 50%(v/v)甲醇水溶液渦旋混合30 s,然后超聲提取30 min,并以12 000 r/min高速離心20 min,吸取上清液并過0.22 μm過濾器。
質(zhì)量控制(QC)樣品由每個(gè)實(shí)際樣品提取液(49×4)等體積(50 μL)混合制備而成,以提供代表性樣品,用于監(jiān)控儀器的靈敏度和穩(wěn)定性。為表征人參多肽成分,分別吸取上述人參主根(n=49)、支根(n=49)、須根(n=49)、蘆頭(n=49)提取液,每份50 μL分別混合制成人參主根、支根、須根和蘆頭混合提取液,在氮?dú)饬飨麓蹈?并用500 μL含0.1%(v/v)甲酸的20%(v/v)乙腈水溶液復(fù)溶。
1.3.1UPLC-QTOF-MS條件
色譜條件 采用ZORBAX RRHD Eclipse Plus C18反相色譜柱(150 mm×3.0 mm, 1.8 μm, Agilent,美國(guó))。柱溫為60 ℃;進(jìn)樣體積為5 μL。流動(dòng)相A為0.1%(v/v)甲酸水溶液,流動(dòng)相B為0.1%(v/v)甲酸乙腈溶液。梯度洗脫程序:0~15.0 min, 5%B~100%B。流速為0.4 mL/min。
質(zhì)譜條件 ESI源,采用正離子模式;毛細(xì)管溫度為350 ℃,干燥氣流速為8 L/min,霧化氣壓力為276 kPa (40 psi),毛細(xì)管電壓為3.5 kV, Fragmentor電壓為200 V, Skimmer電壓為65 V;全掃描模式,質(zhì)譜掃描范圍為m/z50~3 000。
樣本序列運(yùn)行采用隨機(jī)進(jìn)樣方式。實(shí)際樣品運(yùn)行前連續(xù)5次進(jìn)樣QC樣品,用于平衡儀器;實(shí)際樣品運(yùn)行中,每20個(gè)人參樣品插入1個(gè)QC樣品和溶劑空白樣品。
1.3.2UPLC-LTQ-Orbitrap-MS條件
色譜條件 同1.3.1節(jié)。
質(zhì)譜條件 ESI源,正離子模式檢測(cè);分辨率設(shè)置為120 000;一級(jí)數(shù)據(jù)采集格式為profile,二級(jí)數(shù)據(jù)采集格式為centroid;一級(jí)全掃描質(zhì)量范圍為m/z300~2 000;霧化電壓為2.0 kV;選擇一級(jí)質(zhì)譜圖中前5個(gè)豐度最高的多電荷離子做二級(jí)碎裂;二級(jí)質(zhì)譜碎裂方式為碰撞誘導(dǎo)解離(CID)和高能碰撞誘導(dǎo)解離(HCD),其中歸一化的碰撞能量根據(jù)需要設(shè)定為25%、30%和35%。
將獲得的UPLC-LTQ-Orbitrap-MS/MS原始數(shù)據(jù)導(dǎo)入蛋白質(zhì)組學(xué)質(zhì)譜軟件Peaks Studio 7進(jìn)行過濾、解卷積、二級(jí)質(zhì)譜圖簡(jiǎn)化及從頭測(cè)序。具體參數(shù)設(shè)定:數(shù)據(jù)過濾閾值為數(shù)據(jù)品質(zhì)值大于0.3;過濾后的數(shù)據(jù)進(jìn)行自動(dòng)從頭測(cè)序,母離子誤差<10×10-6,子離子誤差<0.5 Da,裂解不指定酶的參與;設(shè)定可能的翻譯后修飾(PTM): Amidation(Δmass, -0.98), Acetylation (N-terminal)(Δmass,+42.01), Pyroglutamalytion from E(Δmass, -18.01), Pyroglutamalytion from Q(Δmass, -17.03), Methylation from KR(Δmass,+14.02), Disulfide bond(Δmass, -1.01,設(shè)定發(fā)生位置:C), Dehydration(Δmass, -18.01), Deamidation (NQ)(Δmass,+0.98), Carboxylation (E)(Δmass,+43.99), Oxidation from M(Δmass,+15.99)和Hexose(Δmass,+162.05)等;以Swiss-Prot和TrEMBL數(shù)據(jù)庫的人參蛋白質(zhì)數(shù)據(jù)庫為范圍進(jìn)行數(shù)據(jù)庫檢索,該數(shù)據(jù)庫從www.uniprot.org網(wǎng)站下載。搜索鑒定的假陽性率(FDR)<1%;對(duì)搜索和測(cè)序得到的肽序列結(jié)合其可信度(-10lgP)、肽鏈斷裂情況、子離子的分配情況及誤差范圍逐個(gè)進(jìn)行人工分析確認(rèn)。
將獲得的UPLC-QTOF-MS原始數(shù)據(jù)導(dǎo)入Progenesis QI軟件進(jìn)行峰提取、峰對(duì)齊等數(shù)據(jù)處理,以獲得包括所檢測(cè)特征的tR-m/z對(duì)、m/z、tR、離子強(qiáng)度和電荷狀態(tài)(z)的數(shù)據(jù)表。主要參數(shù)設(shè)置如下:數(shù)據(jù)強(qiáng)度過濾閾值為0.3;噪聲消除水平為絕對(duì)強(qiáng)度1 000;保留時(shí)間范圍為1.5 min至15 min。數(shù)據(jù)結(jié)果以CSV文件格式輸出。
將含有經(jīng)人參蛋白質(zhì)數(shù)據(jù)庫鑒定的人參多肽數(shù)據(jù)表導(dǎo)入SIMCA-P軟件,進(jìn)行主成分分析(PCA)和偏最小二乘判別分析(PLS-DA)等多變量統(tǒng)計(jì)分析,多變量分析之前使用Pareto縮放。采用在線數(shù)據(jù)處理軟件MetaboAnalyst 4.0(http://www.metaboanalyst.ca)進(jìn)行倍數(shù)變化(FC)和T檢驗(yàn)分析,分別獲得FC值和p值。使用SPSS 20.0軟件計(jì)算受試者工作特征曲線(ROC)的曲線下面積(AUC)。為滿足生物學(xué)重復(fù)性,所有多肽標(biāo)志物均符合“50%原則”要求。
二維線性離子阱靜電場(chǎng)軌道肼組合式高分辨質(zhì)譜儀結(jié)合了線性離子阱質(zhì)譜的多級(jí)掃描和靜電場(chǎng)軌道阱質(zhì)譜的超高分辨能力,可提供多肽的精確相對(duì)分子質(zhì)量、氨基酸序列、翻譯后修飾及位點(diǎn)等高質(zhì)量質(zhì)譜信息。Peaks Studio是基于前體蛋白質(zhì)數(shù)據(jù)庫及一級(jí)和二級(jí)質(zhì)譜數(shù)據(jù)實(shí)現(xiàn)多肽自動(dòng)識(shí)別的搜索引擎,功能包括數(shù)據(jù)精煉、denovo測(cè)序、多肽/蛋白質(zhì)鑒定、翻譯后修飾分析、序列同源性搜索等。Peaks軟件基于獨(dú)特的搜索引擎以極低的誤報(bào)率增加多肽覆蓋率,顯著提高數(shù)據(jù)庫檢索過程中多肽識(shí)別的準(zhǔn)確性和靈敏度[28]。本研究充分利用LTQ-Orbitrap-MS和Peaks Studio的優(yōu)勢(shì),將高分辨質(zhì)譜與數(shù)據(jù)庫、生物信息學(xué)檢索相結(jié)合,實(shí)現(xiàn)人參多肽高通量、高可信度的鑒別檢測(cè)。
表1 鑒定的人參多肽列表
為表征人參多肽類成分,將人參主根、支根、須根和蘆頭(n=49)各自的混合樣本進(jìn)行UPLC-LTQ-Orbitrap-MS分析,獲取數(shù)據(jù)。利用Peaks軟件結(jié)合蛋白質(zhì)檢索數(shù)據(jù)庫Uniprot人參蛋白質(zhì)數(shù)據(jù)庫(Swiss-Prot和TrEMBL),從人參提取物中共鑒定出62個(gè)高可信度的多肽序列(見表1)。圖1為人參提取物的總離子流色譜圖。鑒定的人參多肽的保留時(shí)間分布于2.26~6.98 min,相對(duì)分子質(zhì)量范圍為599.38至4 991.45 Da。上述多肽中,有19個(gè)序列含有翻譯后修飾,其中12個(gè)序列含有乙?;揎?1個(gè)序列含有酰胺化修飾,2個(gè)序列含有甲基化修飾,4個(gè)序列含有氧化修飾,3個(gè)序列含有二硫鍵,并且很多序列含有不止一種翻譯后修飾。
圖1 人參提取物的總離子流色譜圖
表1 (續(xù))
表1 (續(xù))
本研究所鑒定的人參多肽的前體蛋白檢索于兩類人參蛋白質(zhì)數(shù)據(jù)庫。第一類是經(jīng)Swiss-Prot數(shù)據(jù)庫檢索、經(jīng)過手工注釋、校驗(yàn)過的人參蛋白。該類人參多肽大多來源于一系列核糖核酸片段,包括核糖核酸酶1、核糖核酸酶2和核糖核酸酶存儲(chǔ)蛋白。在植物中,許多核糖核酸酶受發(fā)育和環(huán)境因素調(diào)控,并在多種生物進(jìn)程中發(fā)揮重要作用,包括自交不親和性、細(xì)胞程序性死亡、對(duì)磷饑餓響應(yīng)、植物防御和發(fā)育。已報(bào)道的不同人參屬植物中核糖核酸酶具有抗腫瘤活性和抗HIV-RT活性[29]。核糖核酸酶存儲(chǔ)蛋白是人參的主要蛋白質(zhì)(ginseng major protein, GMP),相對(duì)分子質(zhì)量為28 kDa。GMP雖然與植物RNA酶高度同源,但卻沒有RNA酶活性[30,31]。GMP的最主要生理功能是作為供氮源蛋白質(zhì)為人參根的生長(zhǎng)提供能量。有研究報(bào)道GMP在紅細(xì)胞溶血過程中表現(xiàn)出抗補(bǔ)體活性[32]。第二類是經(jīng)TrEMBL數(shù)據(jù)庫檢索到的計(jì)算機(jī)自動(dòng)注釋、未經(jīng)人工校驗(yàn)的人參蛋白。此類人參多肽主要源于人參脫水蛋白,包括脫水蛋白1、脫水蛋白2、脫水蛋白3、脫水蛋白4、脫水蛋白7和脫水蛋白8。脫水蛋白屬于晚期胚胎發(fā)育豐富(LEA)蛋白II家族成員,是普遍存在于高等植物中的干旱誘導(dǎo)蛋白,在種子成熟的脫水耐受過程中發(fā)揮重要作用,在低溫、干旱脅迫下也會(huì)大量累積以提高植物適應(yīng)不良環(huán)境的能力[33]。對(duì)人參多肽的深入研究有助于增加人參系統(tǒng)生物學(xué)及藥理活性的深刻理解。
四極桿-飛行時(shí)間質(zhì)譜聯(lián)用儀具有分析速度快、質(zhì)量范圍寬、分辨率高等特點(diǎn),特別是與UPLC結(jié)合在復(fù)雜樣品高通量的組學(xué)分析中具有獨(dú)特優(yōu)勢(shì)。多變量分析是用于分析和解釋大量組學(xué)實(shí)驗(yàn)數(shù)據(jù)必不可少的有力工具。本研究建立了基于UPLC-QTOF-MS結(jié)合多變量分析的高通量多肽組學(xué)方法,以揭示人參主根、支根、須根和蘆頭之間的多肽差異。
本研究首先采用無監(jiān)督的PCA法對(duì)所有人參樣本進(jìn)行總體輪廓分布趨勢(shì)分析,以觀察不同分組之間的分離程度。PCA結(jié)果顯示,所有QC樣本聚類緊密,表明系統(tǒng)穩(wěn)定,方法重復(fù)性良好且數(shù)據(jù)處理過程未引入任何偏差。圖2顯示人參主根與非主根部位顯著分離;支根、須根和蘆頭具有一定的分離趨勢(shì),表明不同形態(tài)區(qū)域的人參根中人參多肽具有區(qū)域性差異,以主根最顯著。
圖2 人參樣本4個(gè)不同部位的PCA結(jié)果
圖3 人參樣本4個(gè)不同部位的PLS-DA分析
有監(jiān)督的PLS-DA使不同組別樣品最大化分離,能夠更好地實(shí)現(xiàn)不同類別樣品的聚類分析。本研究利用PLS-DA建立了4個(gè)人參根的判別模型,并篩選標(biāo)志人參多肽。如圖3左側(cè)圖所示,PLS-DA模型可以將不同組別分開,表明人參不同部位中多肽組成和/或含量的差異。PLS-DA模型的擬合程度和預(yù)測(cè)能力通過參數(shù)R2Y和Q2Y評(píng)價(jià)。這兩個(gè)參數(shù)值越接近1,說明模型的擬合和預(yù)測(cè)能力越好[34]。本實(shí)驗(yàn)的R2Y為0.838~0.941,Q2Y為0.773~0.926,表明模型具有良好的擬合和預(yù)測(cè)能力,所建PLS-DA模型可靠。該P(yáng)LS-DA模型是否過擬合采用置換檢驗(yàn)法評(píng)估。通常,R2Y截距小于0.4且Q2Y截距小于0.05表明模型是有效的。200次置換相應(yīng)排序檢驗(yàn)表明(見圖3右側(cè)圖),該模型的R2Y和Q2Y截距都在有效范圍內(nèi),模型沒有過擬合。
本研究使用PLS-DA模型的變量權(quán)重值(VIP)篩選和確定人參潛在多肽標(biāo)志物。通常認(rèn)為VIP值大于1的變量對(duì)組間分類比較重要[34]。另外,使用單變量分析t-檢驗(yàn)法評(píng)估這些差異多肽的統(tǒng)計(jì)顯著性。因此,VIP值大于1,p值小于0.05及倍數(shù)變化大于2的已知人參多肽被篩選為人參根潛在多肽標(biāo)志物。共有25個(gè)多肽標(biāo)志物能夠區(qū)分人參主根、支根、須根和蘆頭(見表2)。具體地,共有包括GP26、GP28、GP29、GP31、GP33、GP34、GP36、GP39、GP42、GP46和GP53的11個(gè)潛在多肽標(biāo)志物在主根中高表達(dá);共有包括GP15、GP48和GP52的3個(gè)潛在多肽標(biāo)志物在支根中高表達(dá);共有包括GP5、GP12和GP23的3個(gè)潛在多肽標(biāo)志物在須根中高表達(dá);共有包括GP18、GP20、GP32、GP41、GP55、GP57、GP59和GP61的8個(gè)潛在多肽標(biāo)志物在蘆頭中高表達(dá)。
進(jìn)一步分析潛在標(biāo)志物的ROC以評(píng)價(jià)它們的預(yù)測(cè)能力。ROC的AUC表示標(biāo)志物的判別能力,AUC越接近1,表明標(biāo)志物判別能力越強(qiáng)。具體地,當(dāng)0.7≤AUC<0.8, 0.8≤AUC<0.9及0.9≤AUC時(shí),分別表示標(biāo)志物的判別能力合格、良好和優(yōu)秀[34]。如表2所示,本研究篩選得到的生物標(biāo)志物AUC值為0.77~1.00,且絕大多數(shù)大于0.85,表明它們具有很強(qiáng)的判別能力。
表2 人參主根、支根、須根和蘆頭的多肽生物標(biāo)志物
VIP: variable importance in the projection; FC: the ratio of source group to non-source group;pvalue:t-test adjusted by false discovery rate (FDR); AUC: area under the curve.
本研究發(fā)展了基于超高效液相色譜-高分辨質(zhì)譜的多肽組學(xué)方法,應(yīng)用其對(duì)人參主根、側(cè)根、須根和蘆頭多肽組進(jìn)行系統(tǒng)研究,發(fā)現(xiàn)人參4個(gè)部位的多肽組具有顯著差異,并篩選出不同部位人參多肽標(biāo)志物。傳統(tǒng)中醫(yī)認(rèn)為人參的主根藥效最優(yōu),本研究結(jié)果表明主根與其他部位多肽成分差別最大,為人參藥效研究提供了除人參皂苷外的化學(xué)基礎(chǔ)研究的新思路。