王志強(qiáng),張瑤,洪學(xué)傳,徐平
1 武漢大學(xué)藥學(xué)院 組合生物合成與新藥發(fā)現(xiàn)教育部重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 4300722 軍事醫(yī)學(xué)科學(xué)院放射與輻射醫(yī)學(xué)研究所 蛋白質(zhì)組學(xué)國家重點(diǎn)實(shí)驗(yàn)室 國家蛋白質(zhì)科學(xué)中心 (北京) 北京蛋白質(zhì)組研究中心 蛋白質(zhì)藥物國家工程研究中心,北京 1022063 中國科學(xué)院微生物研究所,北京 100101
綜 述
蛋白質(zhì)N末端組學(xué)研究進(jìn)展
王志強(qiáng)1,2,張瑤2,3,洪學(xué)傳1,徐平1,2
1 武漢大學(xué)藥學(xué)院 組合生物合成與新藥發(fā)現(xiàn)教育部重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430072
2 軍事醫(yī)學(xué)科學(xué)院放射與輻射醫(yī)學(xué)研究所 蛋白質(zhì)組學(xué)國家重點(diǎn)實(shí)驗(yàn)室 國家蛋白質(zhì)科學(xué)中心 (北京) 北京蛋白質(zhì)組研究中心 蛋白質(zhì)藥物國家工程研究中心,北京 102206
3 中國科學(xué)院微生物研究所,北京 100101
王志強(qiáng), 張瑤, 洪學(xué)傳, 等. 蛋白質(zhì)N末端組學(xué)研究進(jìn)展. 生物工程學(xué)報(bào), 2016, 32(8): 1001-1009.
Wang ZQ, Zhang Y, Hong XC, et al. N-terminomics: proteomic strategies for protein N-terminal profiling. Chin J Biotech, 2016,32(8): 1001-1009.
蛋白質(zhì)的 N末端作為合成的起始,其氨基酸序列組成及翻譯后修飾直接影響著蛋白質(zhì)的活性、穩(wěn)定性和細(xì)胞內(nèi)定位,調(diào)控著細(xì)胞內(nèi)的信號轉(zhuǎn)導(dǎo),甚至決定了這些蛋白質(zhì)的命運(yùn)。對蛋白質(zhì) N末端組學(xué)的系統(tǒng)研究不僅可以揭示 N末端區(qū)域?qū)φ麄€(gè)蛋白質(zhì)的重要作用,有助于我們深入地了解蛋白質(zhì)在各種生命活動中所扮演的角色,同時(shí)在實(shí)現(xiàn)蛋白質(zhì)組高覆蓋、基因組重注釋等方面也有著重要的價(jià)值。本文結(jié)合我們的現(xiàn)有工作,綜述了近年來蛋白質(zhì)N末端組學(xué)的研究進(jìn)展,尤其是一些重要的基于質(zhì)譜的N末端富集技術(shù)和方法。
蛋白質(zhì)組學(xué),蛋白質(zhì)N末端,質(zhì)譜,富集
蛋白質(zhì)的合成是以mRNA為模板,在核糖體、tRNA以及多種酶的參與下,經(jīng)過翻譯后修飾、信號肽切除等過程形成成熟的蛋白質(zhì)。N末端作為蛋白質(zhì)合成的起始,其序列組成及發(fā)生的翻譯后修飾等影響著整個(gè)蛋白質(zhì)的結(jié)構(gòu)和生物學(xué)功能。同時(shí),N末端序列有著很高的特異性,大約有78%-97%的蛋白可以通過測定其前5個(gè)氨基酸來實(shí)現(xiàn)鑒定[1],這樣極大地減小了蛋白質(zhì)組的復(fù)雜程度,為實(shí)現(xiàn)蛋白質(zhì)組的高覆蓋提供了可能。隨著蛋白質(zhì)基因組學(xué)的興起,利用蛋白質(zhì)組學(xué)數(shù)據(jù)對基因組進(jìn)行重注釋逐漸成為一個(gè)研究熱點(diǎn)。運(yùn)用蛋白質(zhì)組學(xué)的方法對蛋白質(zhì)N末端進(jìn)行大規(guī)模的鑒定和分析,有助于我們驗(yàn)證和校正已注釋基因,甚至發(fā)現(xiàn)一些新的基因。近20年,質(zhì)譜技術(shù)經(jīng)歷了快速的發(fā)展,人們對蛋白質(zhì)N末端組學(xué)的研究也更加深入,尤其是一些N末端富集技術(shù)和方法的建立、改進(jìn),使得蛋白質(zhì)N末端的大規(guī)模測序逐步成熟。本文對近年來蛋白質(zhì)N末端組學(xué)的研究方法特別是一些重要的富集策略進(jìn)行了綜述。
蛋白質(zhì)的合成起始于N末端,有時(shí)在翻譯結(jié)束后 (或者過程中) N末端序列會不同程度地發(fā)生翻譯后修飾、信號肽切除、蛋白質(zhì)水解等過程,而這些變化和N末端肽段本身的序列決定著蛋白質(zhì)的生物學(xué)功能,如蛋白質(zhì)的活性、穩(wěn)定性,甚至最終的成熟[2]。第一,N末端氨基酸序列對蛋白質(zhì)的穩(wěn)定性和半衰期有著重要影響。早在1986年,N末端降解因子就被發(fā)現(xiàn)廣泛存在于多種生物體中[3]。第二,蛋白質(zhì) N末端發(fā)生的翻譯后修飾會影響蛋白質(zhì)的生物學(xué)功能。比如,N末端乙酰化現(xiàn)象在真核生物體內(nèi)普遍存在,其在蛋白質(zhì)降解[4]、蛋白質(zhì)轉(zhuǎn)運(yùn)和定位[5-6]、蛋白質(zhì)復(fù)合體形成[7]等方面發(fā)揮著重要作用。而很多蛋白質(zhì)N末端的谷氨酸殘基或者谷氨酰胺殘基會在相應(yīng)環(huán)化酶的作用下轉(zhuǎn)變成焦谷氨酸殘基,這種翻譯后修飾能夠保護(hù)蛋白質(zhì)不被氨肽酶降解[8],同時(shí)調(diào)控一些肽類激素和神經(jīng)肽的生物活性[9]。第三,一些蛋白質(zhì)的 N末端含有一段信號肽,它們會影響蛋白質(zhì)的轉(zhuǎn)運(yùn)和定位,通常在蛋白質(zhì)到達(dá)指定位點(diǎn)后便會被切除[10]。此外,一些蛋白質(zhì)需要發(fā)生水解才能具備生物活性。例如我們常用的胰蛋白酶,它需要切除其保護(hù)基團(tuán)后才能暴露活性位點(diǎn),進(jìn)而發(fā)揮生物學(xué)功能[11]。
因此,對蛋白質(zhì)N末端的測定和分析不僅可以幫助我們明確其一級結(jié)構(gòu)及可能存在的變體形式,為蛋白質(zhì)及其變體的生物學(xué)功能研究及在生理、病理?xiàng)l件下生物學(xué)意義的闡述提供條件,同時(shí)在基因組重注釋方面也有助于我們驗(yàn)證和校正已注釋基因,發(fā)現(xiàn)新的基因編碼特征,從而完善并促進(jìn)基因組學(xué)的研究。
2.1化學(xué)測序
早在1949年,瑞典有機(jī)化學(xué)家Edman就提出了著名的蛋白質(zhì) N末端測序方法——Edman降解法[12]。其原理是蛋白質(zhì)的N末端氨基酸殘基首先和異硫氰酸苯酯 (PITC) 耦合,形成苯氨基硫甲酰 (PTC) 衍生物后用三氟乙酸 (TFA)從多肽鏈上切下修飾的殘基,再經(jīng)層析鑒定,余下的多肽鏈被回收再進(jìn)行下一輪降解循環(huán)。雖然Edman降解法被其他一些研究者進(jìn)一步發(fā)展和完善[13],但是其方法本身的限制無法忽視。例如,該法僅適用于一些純度較高的簡單蛋白,面對復(fù)雜樣本便無能為力;其次,Edman降解是以PITC對蛋白質(zhì)N末端氨基的修飾為基礎(chǔ)的,因而難以對N末端已發(fā)生修飾的蛋白進(jìn)行測序;而隨著大數(shù)據(jù)時(shí)代的到來,作為經(jīng)典的N末端測序方法,Edman降解已無法滿足研究者對蛋白質(zhì)N末端的大規(guī)模測序的需求。
2.2算法預(yù)測
隨著基因組測序技術(shù)的日趨成熟,對基因組進(jìn)行自動化的注釋也成為可能。目前已有不少預(yù)測蛋白質(zhì)N末端的算法能夠整合翻譯起始位點(diǎn)、翻譯后修飾以及信號肽切除等信息,例如ProTISA、EasyGene和GeneMarkS等[14-15],但是并不完善。在真核生物中,翻譯起始位點(diǎn)相當(dāng)保守,但一般的算法仍然難以對其進(jìn)行準(zhǔn)確地預(yù)測[16]。這個(gè)問題在原核生物中更為復(fù)雜,因?yàn)樗惴ū仨毧紤]多個(gè)可能的起始密碼子和核糖體結(jié)合序列[14],如 Nielsen等[17]對 143個(gè)原核生物的基因組進(jìn)行研究后發(fā)現(xiàn),有些基因組的注釋錯(cuò)誤達(dá)到60%,而蛋白質(zhì)N末端的注釋不對等現(xiàn)象更為突出[18]。隨著宏基因組研究的出現(xiàn),這些軟件在面對復(fù)雜的原核生物群時(shí),會遇到更大的挑戰(zhàn)[19]。另一方面,不少算法也被專門用來預(yù)測信號肽切除位點(diǎn),例如SignalP、Signal-3L和Signal-BLAST[20-21]等,這些算法通常根據(jù)N端的疏水區(qū)域和附近的中性氨基酸殘基來定位,因而并不能夠有效區(qū)分信號肽與信號錨以及跨膜螺旋結(jié)構(gòu)域[20,22]。SignalP 4.0被認(rèn)為是目前較為可靠的信號肽預(yù)測軟件[23],但通常情況下我們難以實(shí)現(xiàn)生物學(xué)實(shí)驗(yàn)的有效驗(yàn)證。
雖然上述這些預(yù)測算法在不斷地改進(jìn),但是面對生物體內(nèi)復(fù)雜的環(huán)境以及多種可能的生化反應(yīng),結(jié)果的準(zhǔn)確性仍舊存在很大的疑問。隨著近20年來質(zhì)譜技術(shù)的飛速發(fā)展,其高分辨率、高靈敏度、高通量的特性為很多研究者提供了有力的技術(shù)支持,一些新的基于質(zhì)譜的 N末端測序手段也不斷地被提出并廣泛應(yīng)用。
目前,大多數(shù)鑒定蛋白質(zhì)N末端的方法是基于鳥槍法的研究手段。即首先將蛋白質(zhì)混合物酶解為大量肽段,隨后進(jìn)行串聯(lián)質(zhì)譜檢測,最后利用生物信息的方法對樣品中的肽段和蛋白信息進(jìn)行分析。但是,由于復(fù)雜樣品中高豐度蛋白的存在,N末端肽段很容易淹沒在大量高豐度肽段中,這使得直接鑒定蛋白質(zhì)的N末端序列變得困難,甚至無法鑒定。因此,近年來發(fā)展出了不少特異性富集 N末端肽段的方法,大大提高了鑒定N末端肽段的有效性,并且已經(jīng)應(yīng)用到高通量的蛋白組學(xué)研究中。根據(jù)N末端肽段富集策略的不同,我們大致可以將其分為正向富集和反向富集兩類 (表1)。
3.1蛋白質(zhì)N末端的正向富集
表1 蛋白質(zhì)N末端的富集策略Tab le 1 Strategies for N-term inal enrichm ent
正向富集方法主要是利用N末端肽段與酶解后產(chǎn)生的中間肽段的差異來實(shí)現(xiàn)兩者的分離。一類正向富集的策略是在蛋白質(zhì)的N末端加一個(gè)化學(xué)標(biāo)簽,隨后通過特異結(jié)合標(biāo)簽手段富集到N末端肽段。TIMMER等[24]首先對樣本進(jìn)行還原烷基化處理,再利用胍基化反應(yīng)封閉蛋白質(zhì)中所有賴氨酸殘基的 ε氨基,隨后使用NHS-SS-biotin (sulfosuccinim idyl-2-(biotinamido)ethyl-1,3-dithiopropionate) 同N末端的α氨基反應(yīng),酶解后用鏈霉親和素富集到帶有生物素的N末端肽段。他們將這種策略分別應(yīng)用到酵母、大腸桿菌、鼠、人胚胎腎細(xì)胞和人血清等 5種樣本中,研究了其蛋白質(zhì)水解現(xiàn)象,比如甲硫氨酸切除、信號肽切除以及線粒體運(yùn)輸肽的切除等。另一種類似的做法是用SATA (N-succinimidyl S-acetylthioacetate) 代替NHS-SS-biotin 修飾蛋白的N末端,隨后用一種可和硫醇反應(yīng)的試劑實(shí)現(xiàn)富集[25]。與鏈霉親和素富集法相比,該法的反應(yīng)效率較高,富集的特異性達(dá)到 97%。研究者利用該方法在曲霉菌Aspergillus niger中共鑒定到1 672個(gè)N末端肽段和蛋白質(zhì)水解位點(diǎn)。Xu等[26]在 Edman降解法原理的基礎(chǔ)上開發(fā)了一種N-CLAP (N-term inalom ics by chem ical labeling of the α-am ine of proteins) 的N末端富集方法。研究者同樣使用異硫氰酸苯酯 (PITC)封閉所有蛋白質(zhì)的氨基 (包括N末端的α氨基和賴氨酸殘基支鏈上的ε氨基),接著使用三氟乙酸 (TFA) 處理使得蛋白 N末端暴露出 α氨基,和NHS-SS-biotin反應(yīng)后通過親和純化得到N末端肽段。這種方法同Edman降解一樣僅適用于N末端未發(fā)生修飾的蛋白,同時(shí)反應(yīng)步驟較多,增大了N末端肽段損失的可能性,因而富集效果有限。而 Bland等[27]則使用一種可以特異性修飾蛋白N末端的試劑——TMPP (N-tris (2,4,6-trimethoxyphenyl) phosphonium acetyl) 來修飾玫瑰桿菌R. denitrificans的全蛋白,酶解后通過反相液相色譜分為多個(gè)組分,再向每個(gè)組分中加入偶聯(lián)在磁珠上的TMPP抗體來富集N末端肽段。研究者共制備了 10種 TMPP抗體(anti-TMPP1-anti-TMPP10),經(jīng)過篩選與評估,最終選擇anti-TMPP6用作后續(xù)研究。結(jié)果共鑒定到269個(gè)N末端序列,同時(shí)發(fā)現(xiàn)了3個(gè)新基因。這種方法的優(yōu)點(diǎn)在于做法直接,且 TMPP抗體富集的特異性達(dá)到 97%,但是前期抗體的制備與篩選較為繁瑣,使得整個(gè)富集流程較長,難于推廣。
另一類正向富集N末端肽段的方法是利用N末端肽段與中間肽段電荷的不同,通過強(qiáng)陽離子交換 (SCX) 的手段分離得到N末端肽段。這種富集方法通常用于研究 N末端乙?;F(xiàn)象,流程簡單、可操作性強(qiáng)。在真核生物中,大約有 80%的蛋白會發(fā)生 N末端乙?;揎棧?8]。由于乙?;揎椀拇嬖?,酶切后的N末端肽段比中間肽段少帶一個(gè)正電荷,這樣可在強(qiáng)陽離子交換柱中實(shí)現(xiàn)分離。同時(shí),還可以結(jié)合不同酶 (例如Lys-C和Lys-N) 的特點(diǎn)來提高N末端肽段的覆蓋度[29]。Chen等[30]在上述基礎(chǔ)上引入了雙甲基化標(biāo)記的方法,用于分析HepG2 細(xì)胞的N末端乙?;闆r,結(jié)果發(fā)現(xiàn)絕大多數(shù) N末端乙?;亩卧谇皟蓚€(gè) SCX組分(共8個(gè)組分) 被鑒定到,同時(shí)發(fā)現(xiàn)了一些僅在N末端序列上存在差異的蛋白質(zhì)變體,如ERK 1/ERK2、β-actin/γ-actin等。相比化學(xué)修飾的正向富集策略,強(qiáng)陽離子交換的分析手段更為簡捷,但該法僅對如N末端乙?;@樣特定的翻譯后修飾形式適用,難于成為一種N末端蛋白質(zhì)組研究的通用方法。
3.2蛋白質(zhì)N末端的反向富集
盡管蛋白質(zhì) N末端的正向富集方法已有不少應(yīng)用,鑒于其策略本身的局限性 (如大多數(shù)正向富集法依賴于蛋白質(zhì)N末端未被修飾的α氨基),近年來關(guān)于反向富集方法的研究和應(yīng)用更為廣泛。反向富集方法通常是在酶解后去除中間肽段來獲得N末端肽段。其中使用較多的是Gevaert 和Vandekerckhove 在2003年開發(fā)的COFRADIC (Combined fractional diagonal chromatography)法[31]。該方法首先在常規(guī)的還原烷基化后封閉蛋白質(zhì)所有的氨基,隨后第一次反相液相色譜分離為若干組分,再利用一種帶有較強(qiáng)疏水性的試劑TNBS (2,4,6-trinitrobenzenesulfonic acid) 同中間肽段的 α氨基反應(yīng),二次反相液相色譜分離后得到N末端肽段。該法雖然需要經(jīng)過兩次反相液相色譜分離,但其靈敏度較高,加上與其他技術(shù)和方法的交叉,已發(fā)展成為一種主要的N末端富集方法。例如,Bland等[32]在COFRADIC方法中引入了TMPP,對R. denitrificans進(jìn)行研究,結(jié)果共鑒定到 534個(gè) N末端肽段,包括 5個(gè)新基因和41個(gè)新的翻譯起始位點(diǎn)。Venne等[33]還在COFRADIC方法的基礎(chǔ)上結(jié)合強(qiáng)陽離子交換的分離手段開發(fā)了ChaFRADIC (Charge-based fractional diagonal chromatography) 方法,后者更加簡便易行,靈敏度也更高。在總量為50 μg的樣本中,僅從40%的組分就鑒定到1 459個(gè)N末端肽段,最終共有36個(gè)icp55的底物被鑒定到,包括一個(gè)新的底物Isa2。
另一種較為成熟的反向富集策略是 TAILS (Term inal am ine isotopic labeling of substrates)方法[34-36],該方法首先用同位素化合物標(biāo)記蛋白質(zhì)中所有的氨基,酶解后利用一種富含醛基的聚合物HPG-ALD除去中間肽段,剩余即為N末端肽段?;诜€(wěn)定同位素標(biāo)記通常有dimethyl-TAILS[36]和 iTRAQ-TAILS[35]兩種定量研究N末端蛋白質(zhì)組的方法,這兩種方法的標(biāo)記效率均比較高,且HPG-ALD聚合物清除中間肽段的能力也較強(qiáng),因此,TAILS方法被應(yīng)用到多個(gè)研究中。例如,Prudova等[35]利用iTRAQ-TAILS法在鼠胚胎成纖維細(xì)胞中研究了兩個(gè)結(jié)構(gòu)相似的基質(zhì)金屬蛋白酶變體 MMP-2 和MMP-9,結(jié)果共鑒定到201個(gè)MMP-2的酶切產(chǎn)物和19個(gè)MMP-9的酶切產(chǎn)物。同時(shí),這種方法還被用作研究 MMP-10[37]和鑒定二肽酶DP8和 DP9的內(nèi)源性酶切底物[38]。而 DICAS (Dimethyl isotope-coded affinity selection) 方法[39]的設(shè)計(jì)同TAILS法類似,不同點(diǎn)在于利用另一種含有醛基的基質(zhì) (POROS-AL) 除去中間肽段,但是該法的清除效率較低,因此應(yīng)用前景有限。此外,還有PTAG (Phospho tagging)法[40],這種方法主要是在中間肽段的N末端添加一個(gè)磷酸化標(biāo)簽,再利用鎳柱除去中間肽段。研究者在奈瑟氏菌Neisseria meningitidis和酵母Sacchoromyces cerevisiae中分別鑒定到753個(gè)和928個(gè)N末端肽段。
3.3其他富集策略
上述COFRADIC方法和TAILS方法是目前較為主流的N端富集方法,而另一種鑒定N末端的方法N-TOP (N-term inal-oriented proteom ic)也有一定應(yīng)用[41]。該法是Gallien等在2009年開發(fā),首先利用 TMPP修飾恥垢分枝桿菌Mycobacterium smegmatis全蛋白,隨后進(jìn)行1D SDS-PAGE分離,分離后一半使用trypsin酶切,一半使用Asp-N酶切,結(jié)果共鑒定到443個(gè)N末端序列。嚴(yán)格意義上來講,N-TOP方法并不存在富集,但其與 TMPP的結(jié)合同樣能夠?qū)崿F(xiàn)N末端肽段的有效鑒定。TMPP之所以會在 N末端富集策略中備受青睞,原因大致有以下幾點(diǎn):1) 在pH 8.2時(shí),TMPP能夠特異地和蛋白質(zhì)N末端的α氨基反應(yīng),為后續(xù)的富集奠定了基礎(chǔ);2) TMPP本身帶有+1價(jià),有效提高了肽段的離子化效率[42],彌補(bǔ)了N末端肽段豐度低的劣勢;3) TMPP修飾肽段的疏水性增強(qiáng),多在反相液相色譜中保留時(shí)間較大的位置出現(xiàn),降低了肽段的復(fù)雜程度;4) TMPP修飾后的肽段在質(zhì)譜中的二級碎裂主要以a、b離子為主,譜圖較為干凈,利于鑒定[43]。之后 Bertaccini等[44]在此基礎(chǔ)上發(fā)展出了dN-TOP (Doublet N-term inal oriented proteom ics) 的方法,即利用輕、重同位素標(biāo)記的 TMPP分別修飾蛋白質(zhì)的N末端,1∶1混合后進(jìn)行LC-MS/MS檢測。這樣不僅提高了N末端蛋白質(zhì)組鑒定的準(zhǔn)確性,還能夠達(dá)到定量的目的。
作者所在的實(shí)驗(yàn)室也開展了N末端蛋白質(zhì)組的研究工作。如我們將泛素 (Ubiquitin) 作為模型蛋白,分析TMPP修飾前后其N末端序列(MQIFVK) 在色譜和質(zhì)譜行為上的變化。結(jié)果發(fā)現(xiàn),TMPP修飾后的N末端序列(TMPP-MQIFVK) 在反相液相色譜中的保留時(shí)間明顯增大,這表明 TMPP基團(tuán)能夠顯著增強(qiáng)N末端序列的疏水性;同時(shí),在高能碰撞誘導(dǎo)碎裂 (HCD) 模式下,其二級碎裂結(jié)果不同于常規(guī)的b、y離子序列,而主要表現(xiàn)為a、b離子序列。TMPP的這兩個(gè)特點(diǎn)為我們下一步在反相液相色譜梯度優(yōu)化、質(zhì)譜參數(shù)優(yōu)化以及譜圖過濾等方面提供了重要信息,有利于N末端肽段的分離、鑒定和確認(rèn)。隨后,我們利用TMPP修飾模式生物S. cerevisiae的全蛋白,并嘗試了不同的蛋白酶 (如 Lys-N) 對上述樣本進(jìn)行酶切,結(jié)合強(qiáng)陽離子交換的分離手段,探索新的高效分離N末端肽段的方法,實(shí)現(xiàn)N末端肽段的正向富集 (另文發(fā)表)。
綜上所述,雖然近年來對蛋白質(zhì)N末端組學(xué)的研究在持續(xù)發(fā)展,各種富集策略也在不斷地被提出、改進(jìn),但是從總體情況來看,N末端的覆蓋度仍舊比較低[21]。歸納起來,大致有內(nèi)源和外源兩方面的原因。內(nèi)源性的原因主要有以下幾點(diǎn):1) 相對于整個(gè)蛋白質(zhì)組來說,N末端肽段的比例較低;2) 有些N末端肽段特殊的理化性質(zhì)使其難以被質(zhì)譜檢測,如分子量小、離子化效率低等因素[40];3) N末端肽段存在的多種翻譯后修飾不利于化學(xué)標(biāo)記。外源性的原因主要是在富集過程中產(chǎn)生的,有三個(gè)方面:1) 樣品會在提取、制備以及標(biāo)記過程中發(fā)生降解;2) 富集過程會增加樣品的復(fù)雜程度和N末端肽段的損失;3) 不完全的標(biāo)記和富集會影響N末端肽段最終的收率。
目前,基于蛋白質(zhì)組學(xué)的方法研究蛋白質(zhì)N末端逐漸地走向成熟,并且已經(jīng)展現(xiàn)出其在蛋白質(zhì)N末端的鑒定、定量以及揭示蛋白質(zhì)生物學(xué)功能方面的重要價(jià)值。這不僅幫助我們清楚地了解蛋白質(zhì)N末端的氨基酸序列、所發(fā)生的翻譯后修飾等信息,同時(shí)也提示我們進(jìn)一步探究更為復(fù)雜的生命現(xiàn)象。雖然當(dāng)前研究蛋白質(zhì)N末端組學(xué)的技術(shù)和富集手段并不完善,但是隨著質(zhì)譜技術(shù)的不斷發(fā)展,針對蛋白質(zhì)N末端組學(xué)開發(fā)出更加有效的材料、試劑甚至全新的理論和策略,尤其是一些預(yù)測算法的逐步改進(jìn)和成熟,我們一定會用更短的時(shí)間得到更加可靠、更加全面的N末端信息,從而使我們能夠更加深入地了解蛋白質(zhì)N末端在整個(gè)生命活動中所發(fā)揮的重要作用。
REFERENCES
[1] W ilkins MR, Ou K, Appel RD, et al. Rapid protein identification using N-term inal “sequence tag”and am ino acidanalysis. Biochem Bioph Res Co,1996, 221(3): 609-613.
[2] LaiZW, Petrera A, and Schilling O. Protein am ino-term inal modifications and proteom ic approaches for N-term inal profiling. Curr Opin Chem Biol, 2015, 24: 71-79.
[3] Bachmair A, Finley D, andVarshavsky A. In vivohalf-life of a protein is a function of its am ino-term inal residue. Science, 1986,234(4773): 179-186.
[4] PerssonB, Flinta C, Heijne G, et al. Structures of N-term inally acetylated proteins. Eur J Biochem,1985, 152(3): 523-527.
[5] Forte GM, Pool MR, and Stirling CJ. N-term inal acetylation inhibits protein targeting to the endoplasm ic reticulum. PLoS Biol, 2011, 9(5): 1102.
[6] Dikiy I and Eliezer D. N-term inal acetylation stabilizes N-term inal helicity in lipid-and m icelle-bound α-synuclein and increases its affinity for physiological membranes. J Biol Chem, 2014, 289(6): 3652-3665.
[7] Scott DC, Monda JK, Bennett EJ, et al. N-term inal acetylation acts as an avidity enhancer w ithin an interconnected multiprotein complex. Science,2011, 334(6056): 674-678.
[8] Van Coillie E, Proost P, Van Aelst I, et al. Functional comparison of two human monocyte chemotactic protein-2 isoforms, role of the am ino-term inal pyroglutam ic acid and processing by CD26/dipeptidyl peptidase IV. Biochem, 1998,37(36): 12672-12680.
[9] Shih YP, Chou CC, Chen YL, et al. Linked production of pyroglutamate-modified proteins via self-cleavage of fusion tags w ith TEV protease and autonomous N-term inal cyclization w ith glutam inyl cyclase in vivo. PLoS ONE, 2014, 4: e94812.
[10] Zybailov B, Rutschow H, Friso G, et al. Sorting signals, N-term inal modifications and abundance of the chloroplast proteome. PLoS ONE, 2008,3(4): e1994.
[11] Naldini L, Tamagnone L, Vigna E, et al. Extracellular proteolytic cleavage by urokinase is required for activation of hepatocyte grow th factor/scatter factor. EMBO J, 1992, 11(13): 4825.
[12] Edman P. A method for the determ ination of am ino acid sequence in peptides. A rch Biochem,1949, 22(3): 475.
[13] Chen W, Yin X, M u J, et al. Subfem tomole level protein sequencing by Edman degradation carried out in a m icrofluidic chip. Chem Commun, 2007,(24): 2488-2490.
[14] Hu G.Q, Zheng X, Yang YF, et al. ProTISA: a comprehensive resource for translation initiation site annotation in prokaryotic genomes. Nucleic Acids Res, 2008, 36(suppl 1): D114-D119.
[15] Hyatt D, Chen GL, LoCascio PF, et al. Prodigal: prokaryotic gene recognition and translation initiation site identification. BMC Bioinformatics,2010, 11(1): 119.
[16] Van der Burgt A, Severing E, Collemare J, et al. Automated alignment-based curation of gene models in filamentous fungi. BMC Bioinformatics,2014, 15(1): 19.
[17] Nielsen P and Krogh A. Large-scale prokaryotic gene prediction and comparison to genome annotation. Bioinformatics, 2005, 21(24): 4322-4329.
[18] Raghavan R, Sage A, and Ochman H. Genome-w ide identification of transcription start sites yields a novel thermosensing RNA and new cyclic AMP receptor protein-regulated genes in Escherichia coli. J Bacteriol, 2011, 193(11): 2871-2874.
[19] Liu Y, Guo J, Hu G, et al. Gene prediction in metagenom ic fragments based on the SVM algorithm. BMC Bioinformatics, 2013, 14(Suppl 5): S12.
[20] IvankovDN, Payne SH, Galperin MY, et al. How many signal peptides are there in bacteria?Environ M icrobiol, 2013,15(4): 983-990.
[21] Hartmann EM and Armengaud J. N-term inom ics and proteogenom ics, getting off to a good start. Proteom ics, 2014, 14(23-24): 2637-2646.
[22] Nielsen H, Engelbrecht J, Brunak S, et al. Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites. Protein Eng, 1997, 10(1): 1-6.
[23] Petersen TN, Brunak S, von Heijne G, et al. SignalP 4.0: discrim inating signal peptides from transmembrane regions. Nat Methods, 2011,8(10): 785-786.
[24] Timmer J, Enoksson M, W ildfang E, et al. Profiling constitutive proteolytic events in vivo. Biochem J, 2007, 407: 41-48.
[25] Kim JS, Dai Z, Aryal UK, et al. Resin-assisted enrichment of N-term inal peptides for characterizing proteolytic processing. Anall Chem, 2013, 85(14): 6826-6832.
[26] Xu G, Shin SBY, and Jaffrey SR. Global profiling of protease cleavage sites by chemoselective labeling of protein N-term ini. Proc Natl Acad Sci USA, 2009, 106(46): 19310-19315.
[27] Bland C, Bellanger L, and Armengaud J. Magneticimmunoaffinity enrichment for selective capture and ms/ms analysis of n-term inal-TMPP-labeled peptides. J Proteome Res, 2013, 13(2): 668-680.
[28] Arnesen T, Van Damme P, Polevoda B, et al. Proteom ics analyses reveal the evolutionary conservation and divergence of N-term inal acetyltransferases from yeast and humans. Proc Natl Acad Sci USA, 2009, 106(20): 8157-8162.
[29] Hennrich ML, Groenewold V, Kops GJPL, et al. Improving depth in phosphoproteom ics by using a strong cation exchange-weak anion exchange-reversed phase multidimensional separation approach. Anal Chem, 2011, 83(18): 7137-7143.
[30] Chen SH, Chen CR, Chen SH, et al. Improved N-α-acetylated peptide enrichment follow ing dimethyl labeling and SCX. J Proteome Res, 2013,12(7): 3277-3287.
[31] Gevaert K, Goethals M, Martens L, et al. Exploring proteomes and analyzing protein processing by mass spectrometric identification of sorted N-term inal peptides. Nat Biotechnol, 2003,21(5): 566-569.
[32] Bland C, Hartmann EM, Christie-Oleza JA, et al. N-term inal-oriented proteogenom ics of the marine bacterium Roseobacter denitrificans Och114 using (N-Succinim idyloxycarbonylmethyl) tris (2,4, 6-trimethoxyphenyl) phosphonium brom ide (TMPP) labeling and diagonal chromatography. Mol Cell Proteom ics, 2014, 13(5): 1369-1381.
[33] Venne AS, Vogtle FN, Meisigner C, et al. Novel highly sensitive, specific, and straightforward strategy for comprehensive N-term inal proteom ics reveals unknown substrates of the m itochondrial peptidase Icp55. J Proteome Res, 2013, 12(9): 3823-3830.
[34] K leifeld O, Doucet A, auf dem Keller U, et al. Isotopic labeling of term inal am ines in complex samples identifies protein N-term ini and protease cleavage products. Nat Biotechnol, 2010, 28(3): 281-288.
[35] K leifeld O, Doucet A, Prudova A, et al. Identifying and quantifying proteolytic events and the natural N term inome by term inal am ine isotopic labeling of substrates. Nat Protoc, 2011,6(10): 1578-1611.
[36] W ilson CH, Indarto D, Doucet A, et al. Identifying natural substrates for dipeptidyl peptidases 8 and 9 using term inal am ine isotopic labeling of substrates (TAILS) reveals in vivo roles in cellular homeostasis and energy metabolism. J Biol Chem, 2013, 288(20): 13936-13949.
[37] Schlage P, Egli FE, Nanni P, et al. Time-resolved analysis of the matrix metalloproteinase 10 substrate degradome. M ol Cell Proteom ics, 2014,13(2): 580-593.
[38] Shahinian H, Loessner D, Biniossek ML, et al. Secretome and degradome profiling show s that Kallikrein-related peptidases 4, 5, 6, and 7 induce TGFβ-1 signaling in ovarian cancer cells. M ol Oncol, 2014, 8(1): 68-82.
[39] Shen PT, Hsu JL, and Chen SH. Dimethyl isotope-coded affinity selection for the analysis of free and blocked N-term ini of proteins using LC-MS/MS. Anal Chem, 2007, 79(24): 9520-9530.
[40] M ommen GPM, van de Waterbeemd B, Meiring HD,et al. Unbiased selective isolation of protein N-term inal peptides from complex proteome samples using phospho tagging (PTAG) and TiO2-based depletion. Mol Cell Proteom ics, 2012,11(9): 832-842.
[41] Gallien S, Perrodou E, Carapito C, et al. Ortho-proteogenom ics: multiple proteomes investigation through orthology and a new MS-based protocol. Genome Res, 2009, 19(1): 128-135.
[42] Chen W, Lee PJ, Shion H, et al. Improving de novo sequencing of peptides using a charged tag and C-term inal digestion. Anal chem, 2007, 79(4): 1583-1590.
[43] An M, Dai J, W ang Q, et al. Efficient and clean charge derivatization of peptides for analysis by mass spectrometry. Rapid Commun Mass Sp,2010, 24(13): 1869-1874.
[44] Bertaccini D, Vaca S, Capaito C, et al. An improved stable isotope N-term inal labeling approach w ith light/heavy TMPP to automate proteogenom ics data validation: dN-TOP. J Proteome Res, 2013, 12(6): 3063-3070.
(本文責(zé)編 陳宏宇)
October 20, 2015; Accepted: November 24, 2015
Ping Xu. Tel: +86-10-61777113; Fax: +86-10-80705155; E-mail: xupingghy@gmail.com
N-term inom ics: proteom ic strategies for protein N-term inal profiling
Zhiqiang Wang1,2, Yao Zhang2,3, Xuechuan Hong1, and Ping Xu1,2
1 Key Laboratory of Combinational Biosynthesis and Drug Discovery (Wuhan University), M inistry of Education, School of Pharmaceutical Science, Wuhan University, Wuhan 430072, Hubei, China
2 National Engineering Research Center for Protein Drugs, Beijing Proteome Research Center, National Center for Protein Sciences,State Key Laboratory of Proteomics, Beijing Institute of Radiation Medicine, Beijing 102206, China
3 Institute of Microbiology, Chinese Academy of Sciences, Beijing 100101, China
Protein N-term ini, as the beginning of translation, has a major impact on protein's biological functions. Its sequence and various post-translational modifications often affect protein activation, stability and cellular-localization,regulate the signal transduction, and even determ ine protein's final destiny. The systematic study of protein N-term ini can clarify the vital function of the N-term inus, and provide in-depth know ledge of the multifunctional roles that protein has played in diverse biological processes. In addition, N-term inal research may help us to achieve high-coverage proteom ics and re-annotate genom ics. Combined w ith our own research, this review highlights recent progress of N-terminom ics,especially some important enrichment strategies and technologies based on mass spectrometry.
proteomics, protein N-termini, mass spectrometry, enrichment
Supported by: National Natural Science Foundation of China (Nos. 31400697, 31470809, 31400698), National Natural Science Foundation of Beijing (Nos. 5144027, 5152008), Key Projects in the National Science & Technology Pillar Program (No. 2012BAF14B00).
國家自然科學(xué)基金 (Nos. 31400697, 31470809, 31400698),北京市自然科學(xué)基金 (Nos. 5144027, 5152008),國家重大儀器專項(xiàng) (No. 2012BAF14B00) 資助。
網(wǎng)絡(luò)出版時(shí)間:2016-01-06 網(wǎng)絡(luò)出版地址:http://www.cnki.net/kcms/detail/11.1998.Q.20160106.1106.003.html