馮亞寧,姜志強(qiáng),馬曉玲,李江偉
(1.新疆大學(xué)生命科學(xué)與技術(shù)學(xué)院/新疆自治區(qū)生物資源基因工程重點(diǎn)實(shí)驗(yàn)室,烏魯木齊 830046;2 .新疆生產(chǎn)建設(shè)兵團(tuán)第十二師104團(tuán)牧一場,烏魯木齊 830076)
?
新疆雙峰駝納米抗體噬菌體展示文庫多樣性的生物信息學(xué)分析
馮亞寧1,姜志強(qiáng)2,馬曉玲1,李江偉1
(1.新疆大學(xué)生命科學(xué)與技術(shù)學(xué)院/新疆自治區(qū)生物資源基因工程重點(diǎn)實(shí)驗(yàn)室,烏魯木齊 830046;2 .新疆生產(chǎn)建設(shè)兵團(tuán)第十二師104團(tuán)牧一場,烏魯木齊 830076)
【目的】駱駝免疫系統(tǒng)中只存在重鏈抗體,其可變區(qū)VHH片段是最小的天然抗體片段。通過對雙峰駝VHH基因進(jìn)行序列分析,了解雙峰駝VHH基因特征,分析VHH文庫多樣性組成?!痉椒ā坎捎眯陆p峰駝VHH特異引物擴(kuò)增全部抗體基因片段,連接到M13噬菌粒載體上,與pIII蛋白融合表達(dá)在噬菌體表面,構(gòu)建噬菌體展示文庫?;驕y序和菌落PCR方法,分析文庫大小和陽性克隆插入率。NCBI-IgGBLAST工具對抗體序列進(jìn)行IMGT編號命名,WebLogo工具分析抗體保守序列分布頻率,MEGA6軟件對VHH序列進(jìn)行同源性比對和系統(tǒng)進(jìn)化樹構(gòu)建?!窘Y(jié)果】利用免疫的新疆雙峰駝淋巴細(xì)胞,構(gòu)建了庫容量為1.4×109的VHH抗體噬菌體展示文庫。對91個隨機(jī)挑選的文庫TG1單菌落進(jìn)行PCR。結(jié)果表明該文庫VHH陽性插入率為97%,DNA測序表明文庫多樣性為97.8%。對91個克隆DNA測序結(jié)果進(jìn)一步分析表明,這些基因中除2個為常規(guī)VH抗體外,其余均為重鏈VHH抗體。根據(jù)抗體序列中的特征氨基酸分布,將91個抗體序列劃分為7個亞群?!窘Y(jié)論】構(gòu)建的新疆雙峰駝VHH文庫多樣性較好,生物信息學(xué)分析揭示出文庫中多樣性克隆的分布和特征,有助于新疆雙峰駝納米抗體噬菌體展示文庫的進(jìn)一步構(gòu)建。
雙峰駝;單域抗體;噬菌體展示文庫;VHH序列;生物信息學(xué)分析
【研究意義】駱駝科動物免疫系統(tǒng)中存在天然缺失輕鏈的重鏈抗體,為單一的折疊單元,保留了完整的抗原結(jié)合活性,由駱駝重鏈可變區(qū)結(jié)合抗原的單一結(jié)構(gòu)域構(gòu)成的抗體為單域重鏈抗體(variable domain of the heavy-chain of heavy-chain antibody,VHH),又稱為納米抗體,是目前天然來源分子最小的抗體[1]。鯊魚體內(nèi)也存在一種由重鏈同源二聚體組成的天然小分子抗體稱作免疫球蛋白新抗原受體(immunoglobin new antigen receptor, IgNAR)[2]。近年來,VHH在疾病診斷、分子檢測和治療方面的應(yīng)用受到了研究者的廣泛關(guān)注[3]。當(dāng)前,納米抗體主要通過噬菌體展示技術(shù)獲得。噬菌體展示抗體庫是指利用B淋巴細(xì)胞抗體全套可變區(qū)基因,通過噬菌體展示技術(shù),把抗體或抗體片段( Fab、Fv或scFv)表達(dá)在噬菌體表面的噬菌體群體構(gòu)建成噬菌體抗體庫,是制備大多數(shù)的基因工程抗體的主要方法[4]。通過親和淘洗技術(shù)可以從該文庫中篩選獲得抗原特異的抗體。然而抗體庫的質(zhì)量,包括文庫的大小、陽性克隆插入率和文庫多樣性等決定了獲得的抗體的親和力和活性[5]。因此,在對文庫親和篩選前,對文庫質(zhì)量的鑒定和評價尤為重要?!厩叭搜芯窟M(jìn)展】對文庫質(zhì)量進(jìn)行評價的主要方法是對文庫獲得的克隆進(jìn)行PCR和DNA測序分析。主要的評價指標(biāo)為庫容量(library size)和多樣性(diversity)[6]。盡管庫容量對篩選獲得抗體的高親和力有很大影響,但文庫的多樣性決定了能否獲得抗原特異的抗體,尤其是在非免疫文庫中獲得針對任何抗原的抗體。由于在文庫構(gòu)建過程中采用不同引物和不同的PCR擴(kuò)增方法,導(dǎo)致構(gòu)建文庫的代表性和序列正確性都有很大不同?!颈狙芯壳腥朦c(diǎn)】全面分析文庫多樣性對于文庫質(zhì)量的評估至關(guān)重要[7]。一個良好的抗體文庫除具有高的多樣性外,還需要多樣性的CDR3長度分布和氨基酸組成,并且文庫中能夠涵蓋的抗體亞群盡可能多。在進(jìn)行文庫篩選之前,利用生物信息學(xué)分析手段系統(tǒng)分析文庫序列信息,有助于制定合理的文庫篩選策略?!緮M解決的關(guān)鍵問題】探討新的文庫多樣性分析方法,研究以構(gòu)建自非免疫駱駝的VHH抗體噬菌體展示文庫為起始材料,采用序列測定結(jié)合生物信息學(xué)分析等方法對文庫VHH序列進(jìn)行系統(tǒng)分析,初步闡明新疆雙峰駝VHH序列特征和文庫的多樣性。
1.1 材 料
采集5峰新疆雙峰駝外周血約50 mL。利用淋巴細(xì)胞分離液分離淋巴細(xì)胞。Trizol試劑提取淋巴細(xì)胞總RNA。以O(shè)ligo(dT)為引物,反轉(zhuǎn)錄合成cDNA。分別采用兩輪PCR擴(kuò)增VHH基因片段。第一輪PCR引物為:Call01, 5’-GTCCTGGCTGCTCTTCTACAAGG-3’,Call02,5’-CTAGTGCGGCCGCTGAGGAGACGGTGACCTGGG T-3’;第二輪PCR引物為:VHH-back,5’-GGTACGTGCTGTTGAACTGTTCC-3’, 和 PMCF 5’-GATGTGCAGCTGCAGGAGTCTGGRGGAGG-3’。采用SfiⅠ分別酶切pCANTAB 5E質(zhì)粒和基因片段,回收后進(jìn)行連接反應(yīng)。連接產(chǎn)物電擊轉(zhuǎn)化TG1感受態(tài)細(xì)胞,從而獲得VHH抗體基因文庫。VHH噬菌體展示文庫的制備按文獻(xiàn)[8]方法采用M13K07輔助噬菌體感染TG1文庫細(xì)菌,分離和純化噬菌體獲得。
1.2 方 法
1.2.1 文庫克隆的Sanger測序和菌落PCR
隨機(jī)挑取91個文庫TG1單菌落,采用含有VHH基因上游引物MP57(5’-ATGCTTCCGGCTCGTATG-3’),送華大基因公司進(jìn)行Sanger測序。菌落PCR采用pCANTAB 5E載體上的兩條引物MP57和GIII(5’-CCACAGACAGCCCTCATAG-3’),用牙簽挑取微量100個菌落,在PCR管中直接進(jìn)行PCR擴(kuò)增。
1.2.2 測序結(jié)果的生物信息學(xué)分析
Sanger測序結(jié)果采用NCBI-IgGBLAST進(jìn)行序列分析,以劃分VHH抗體序列和進(jìn)行氨基酸位點(diǎn)IMGT編號及CDR序列識別。VHH序列相似性采用MEGA6軟件進(jìn)行多重比對。VHH序列亞群的分類采用Harris[9]方法進(jìn)行,以序列中決定抗體結(jié)構(gòu)的關(guān)鍵氨基酸的種類和出現(xiàn)頻率為分類依據(jù)。各亞群抗體保守序列分布頻率采用WebLogo工具[10]進(jìn)行分析和可視化顯示。
1.2.3 文庫多樣性分析
文庫克隆插入片段陽性率采用菌落PCR和DNA測序分析91個單個TG1菌落。文庫多樣性按下列公式計算:(獨(dú)特序列的數(shù)量/測序序列數(shù)量)×100%。
2.1 新疆雙峰駝重鏈抗體噬菌體展示文庫的構(gòu)建
采用PCR擴(kuò)增得到兩條帶,結(jié)果表明,主帶約 650~700 bp,另外在1 000 bp 處有弱帶圖1A。分別代表駱駝IgG常規(guī)抗體和重鏈抗體?;厥丈喜?PCR 的 650~700 bp 的條帶,作為后續(xù) PCR 的模板,使用VHH-back 和 PMCF 引物擴(kuò)增VHH,結(jié)果表明,其中450 bp 的 DNA 片段為VHH基因片段圖1B。圖1
采用SfiⅠ分別酶切pCANTAB 5E質(zhì)粒和VHH片段,回收后進(jìn)行連接反應(yīng)。電轉(zhuǎn)化感受態(tài)TG1細(xì)胞,系列梯度稀釋后,計算平皿中菌落數(shù)量。其中 10-5平皿上得到克隆 465 個,10-6平皿上得到克隆 25 個,計算最終建庫庫容為(圖2):
(465+25×10)/2×105×40=1.4×109.
2.2 文庫VHH插入片段陽性率評估
對91個文庫TG1單菌落進(jìn)行菌落PCR鑒定,結(jié)果91個克隆中有88個擴(kuò)增出VHH片段(約為450 bp),而其余3個克隆未擴(kuò)增出450 bp的VHH片段。菌落PCR結(jié)果表明,文庫VHH片段陽性率為97%。同時這91個克隆的DNA測序結(jié)果(結(jié)果見2.3)顯示所有克隆含有VHH基因序列,陽性率為100%。圖3
A.采用引物 Call01-leader 和 Call02-CH2 擴(kuò)增VHH片段。B. 采用VHH-back 和 PMCF 引物擴(kuò)增VHH片段
Call01-leader and Call02-CH2(A)andVHH-back and PMCF primer pairs(B)
圖1 PCR擴(kuò)增駱駝淋巴細(xì)胞cDNA中VHH基因片段
Fig.1 PCR amplification ofVHHgene fragments with
2.3 文庫克隆Sanger測序
采用Sanger測序分析建庫的 91個克隆,其中8個樣品(2、9、12、15、21、26、61 和 91)出現(xiàn)套峰,可能的原因是這些克隆在平皿上未完全分離,或者是同一個宿主菌中轉(zhuǎn)入了多個克隆。從測序結(jié)果明確的序列來看,有2個克隆出現(xiàn)內(nèi)部終止密碼子,L10和L50,L45和L28為重復(fù)序列,其他克隆測序結(jié)果良好,均為單個序列,DNA長度約在350~410 bp,序列閱讀框架正確。根據(jù)獨(dú)特序列的數(shù)量計算文庫多樣性為97.8%。分析抗體序列FR2特征氨基酸位點(diǎn)發(fā)現(xiàn),除兩個克隆為常規(guī)VH抗體特征(V42,G49,L50和W52)外,其余均為重鏈抗體VHH特征氨基酸(V42Y/V42F,G49E,L50R和W52X)。這些VHH序列CDR3長度分布介于9~30氨基酸之間,平均19氨基酸。豐度最高的CDR3長度為19個氨基酸,占整個測序序列的16%。文庫中缺少長度為11,27,28和29氨基酸的CDR3序列。91個克隆中CDR3序列長度分布情況見圖4,CDR3序列105-117位點(diǎn)的氨基酸組成和使用頻率見圖5。圖4~5
圖2 系列稀釋培養(yǎng)基中VHH基因轉(zhuǎn)化TG1菌落數(shù)量(用于測定文庫大小)Fig.2 The number of TG1 colonies at serial dilution transformed with VHH genes
2.4VHH序列特征氨基酸位點(diǎn)分析及亞群的分類
為評估構(gòu)建文庫的多樣性,采用MEGA6軟件對Sanger測序的91個VHH序列進(jìn)行序列同源性比對并構(gòu)建系統(tǒng)進(jìn)化樹(圖6A)。聚類分析表明,91個VHH序列可以劃分為7個聚類(cluster),其特征氨基酸在FR1序列中位于第12,15,24和26位點(diǎn),在CDR1序列中位于第27和38位氨基酸,在FR2序列中位于第39,42,49,50,52和55位氨基酸,在CDR2序列中位于第56和66位氨基酸,在CDR3序列中位于第105,106和117位點(diǎn),以及FR4序列中的118位點(diǎn)。這些特征氨基酸分布見WebLogo圖(圖6B),表明7個類群各具有特征氨基酸分布群。圖6
圖3 菌落PCR擴(kuò)展文庫菌落VHH基因片段代表圖Fig.3 Colony PCR amplification of VHH inserts in transformed TG1 E.coli
圖4 VHH序列中CDR3長度分布頻率(用于統(tǒng)計的總序列數(shù)為91)Fig.4 Frequency of the CDRH3 lengths and distribution within the VHH. CDRH3 lengths are expressed in amino acids. Total number ofVHH sequences subjected to statistical are 91
圖5 文庫中91個VHH克隆CDR3不同位點(diǎn)的氨基酸組成Fig.5 Amino acid composition at the different positions of CDR3 in the library
圖6 91個序列聚類分析(A)和不同類群特征氨基酸的WebLogo圖比較(B)Fig.6 Clustering analysis (A) and WebLogo plots (B) presenting sequence differences between diferent clusters
噬菌體抗體表面展示文庫技術(shù)是近年來發(fā)展較快制備單克隆抗體的有效手段,尤其可直接克隆抗體可變區(qū)基因,以利于進(jìn)一步構(gòu)建具有廣闊應(yīng)用前景的各種基因工程抗體。利用這種技術(shù)從HCAbs得到的VHHs和IgNAR單域抗體,與早期基因工程抗體Fab或scFv相比,水溶性更好,穩(wěn)定性更高,并且擴(kuò)大了對特殊抗原表位,如一些酶的活性中心位點(diǎn)的結(jié)合[11-13]。
能否從噬菌體抗體庫篩選到有價值的抗體,與抗體庫,尤其是非免疫文庫的多樣性有很大關(guān)系。文庫的多樣性不僅決定于文庫大小,還決定于文庫中多樣性的VHH序列[14]。研究中從新疆雙峰駝的淋巴細(xì)胞中構(gòu)建了一個庫容較大的非免疫VHH噬菌體展示文庫。生物信息學(xué)分析了其中91個克隆的CDR3長度分布,特征氨基酸組成以及抗體序列分群,為今后評價文庫多樣性提供了新的指標(biāo)。
在對文庫克隆VHH插入片段陽性率分析中,DNA測序結(jié)果(100%)與菌落PCR(97%)不完全相符,可能原因是菌落PCR中由于菌落處理不當(dāng)或數(shù)量過低導(dǎo)致的假陰性。這也表明DNA測序的結(jié)果更可靠和直接。
通過對VHH序列的比較分析,鑒定出新疆雙峰駝免疫庫中VHH抗體存在多個特征氨基酸位點(diǎn)(IMGT編號)15,40,42,49,50,52,87,96和106,常規(guī)抗體VH序列在這些位點(diǎn)的氨基酸往往不同[15]。這個結(jié)果與其他研究者相符。在分析的91個克隆中僅有2個代表了VH序列,VHH是所占比例高達(dá)98%。而多個研究者在VHH抗體文庫中發(fā)現(xiàn)存在相當(dāng)比例的VH序列[16-17]。研究構(gòu)建的文庫中VHH序列多的原因可能是新疆雙峰駝中存在的VHH基因序列的豐度要遠(yuǎn)高于VH序列。根據(jù)VHH特征氨基酸的種類和分布頻率,從91個VHH序列中劃分出7個亞群,然而由于測序數(shù)量較少,還不足認(rèn)定這些亞群是否穩(wěn)定存在于抗體庫中。進(jìn)一步的分析依賴于對文庫進(jìn)行高通量的測序,可以一次測定107序列,這樣就能夠獲得對抗體庫多樣性的全面分析和評估。
References)
[1]Hamerscasterman, C., Atarhouch, T., Muyldermans, S., Robinson, G., Hamers, C., & Songa, E. B., et al. (1993). Naturally occurring antibodies devoid of light chains.Nature, 363(6428): págs. 446-448.
[2] Andrew S. Greenberg, David Avila, Marianne Hughes, Hughes, A., E. Churchill McKinney, & Martin F. Flajnik. (1995). A new antigen receptor gene family that undergoes rearrangement and, extensive somatic diversification in sharks.Nature, 374(6518): 168-173.
[3] Peter Timmerman §, Susana G. Shochat ? §, Johan Desmet §, Rodrigo Barderas §, Jose Ignacio Casal §, & Rob H. Meloen §, et al. (2010). Binding of cdr-derived peptides is mechanistically different from that of high-affinity parental antibodies.JournalofMolecularRecognitionJmr, 23(6):559-568.
[4] Smith, G. P., & Petrenko, V. A. (1997). Phage display.ChemicalReviews, 97(97):391-410.
[5] Kretzschmar, T., & Rüden, T. V. (2002). Antibody discovery: phage display.CurrentOpinioninBiotechnology, 13(6):598-602.
[6] Bratkovic, T. (2010). Progress in phage display: evolution of the technique and its application.Cellular&MolecularLifeSciencesCmls, 67(5):749-767.
[7] Hust, M., & Dübel, S. (2004). Mating antibody phage display with proteomics.TrendsinBiotechnology, 22(1):8-14.
[8] Silacci, M., Brack, S., Schirru, G., M?rlind, J., Ettorre, A., & Merlo, A., et al. (2005). Design, construction, and characterization of a large synthetic human antibody phage display library.Proteomics, 5(9):2,340-2,350.
[9] Harris, L., & Bajorath, J. (2008). Profiles for the analysis of immunoglobulin sequences: comparison of v gene subgroups.ProteinScience, 4(2):306-310.
[10] Crooks, G. E., Hon, G., Chandonia, J. M., & Brenner, S. E. (2004). Weblogo: a sequence logo generator.GenomeResearch, 14(6):1,188-1,190.
[11] Liu, J., Anderson, G. J., Baumann, R., Hayhurst, A., & Goldman, E. (2007). Selection of cholera toxin specific ignar single-domain antibodies from a naive shark library.MolecularImmunology, 44(7):1,775-1,783.
[12] Genst, E. D., Silence, K., Decanniere, K., Conrath, K., Loris, R., & Kinne, J., et al. (2006). Molecular basis for the preferential cleft recognition by dromedary heavy-chain antibodies.ProceedingsoftheNationalAcademyofSciences, 103(12):4,586-4,591.
[13] Arbabi, G. M., Desmyter, A., Wyns, L., Hamers, R., & Muyldermans, S. (1997). Selection and identification of single domain antibody fragments from camel heavy-chain antibodies.FEBSLetters, 414(3):521-526.
[14] Pansri, P., Jaruseranee, N., Rangnoi, K., Kristensen, P., & Yamabhai, M. (2009). A compact phage display human scfv library for selection of antibodies to a wide variety of antigens.BMCBiotechnology, 9(1): 6.
[15] Harmsen, M. M., Ruuls, R. C., Nijman, I. J., Niewold, T. A., Frenken, L. G. J., & Geus, B. D. (2000). Llama heavy-chain v regions consist of at least four distinct subfamilies revealing novel sequence features.MolecularImmunology, 37(10):579-590.
[16] Saerens D; Pellis M; Loris R; Pardon E; Dumoulin M; Matagne A; Wyns L; Muyldermans S; Conrath K. (2005). Identification of a universal vhh framework to graft non-canonical antigen-binding loops of camel single-domain antibodies.JournalofMolecularBiology, 352(3):597-607.
[17] Desmyter, A., Transue, T. R., Ghahroudi, M. A., Thi, M. H., Poortmans, F., & Hamers, R., et al. (1996). Crystal structure of a camel single-domain VH antibody fragment in complex with lysozyme.NatureStructuralBiology, 3(9):803-811.
Fund project:Supported by National Natural Science Foundation of China ( 31570935) and Hi-tech research and development projects of Xinjiang, China, (201110102)
Analysis of the Diversity of VHH Library from Bactrian Camel (Camelusbactrianus) with Bioinformatics
FENG Ya-ning1, JIANG Zhi-qiang2, MA Xiao-ling1, LI Jiang-wei1
(1. College of Life Science and Technology, Xinjiang University, Urumqi 830046, China;2.No. 104AgriculturalandAnimalHusbandryRegimentalFarmofNo.12AgriculturalProductionDivisionofXinjiangProductionandConstructionCorps,Urumqi830076,China)
【Objective】 Heavy chain antibodies exist only in the immune system of the camel and theVHHfragment of the variable region is the smallest natural antibody fragment. Through the sequence analysis ofVHHgene to understand the genetic characteristics of Bactrian camel, camelVHH, and analyze the diversity ofVHHLibrary are the purpose of this project.【Method】TheVHHlibrary was constructed by PCR amplification of theVHHsequences from Xinjiang Bactrian camel (Camelusbactrianus) peripheral blood lymphocytes. Sanger DNA sequencing and colony PCR were used to determine the size andVHHinserts of the library. A comprehensive analysis ofVHHgene including the sequence homologous, CDR3 length distribution, sequence clustering were conducted via bioinformatics.【Result】The size of theVHHlibrary was 1.4×109. The positiveVHHinserts in the 91 randomly selected clones was 97% in colony PCR detection. The result of DNA sequencing revealed the diversity of the library was 97.8%. Bioinformatics analysis showed almost all sequences wereVHHderived except that from two clones. According to the sequence similarity, 91 sequences were classified into 7 clusters.【Conclusion】The constructed library has relatively large diversity and it will be helpful for analyzing the diversity of library by using bioinformatics tools.
Bactrian camel;nanobody; phage display library;VHHsequence;bioinformatics analysis
10.6048/j.issn.1001-4330.2016.08.023
2016-03-23
國家自然科學(xué)基金面上項(xiàng)目(31570935);新疆維吾爾自治區(qū)高技術(shù)研究發(fā)展項(xiàng)目(201110102)
馮亞寧(1990-),女,新疆烏魯木齊人,碩士,研究方向?yàn)樯锘瘜W(xué)與分子生物學(xué),(E-mail)fengyaning81@163.com
李江偉(1967-),男,河南人,教授,博士,研究方向?yàn)榛蚬こ炭贵w,(E-mail)jwli67@sina.com
S182
A
1001-4330(2016)08-1533-06