陳凱麗 孫延鳴++沈文++陳冬梅 +郭海英
摘要:以湖羊SPLUNC1基因為研究對象,利用生物信息學方法對其編碼的蛋白進行理化性質(zhì)、信號肽、跨膜區(qū)域、亞細胞定位、二級結構、三級結構、保守區(qū)域分析,并構建系統(tǒng)發(fā)育樹。結果表明,湖羊SPLUNC1蛋白的分子量為26.53 ku,理論等電點為5.07。SPLUNC1蛋白N端存在信號肽,亞細胞定位在細胞外。SPLUNC1蛋白質(zhì)的二級結構主要為α螺旋和無規(guī)則卷曲。該蛋白由4 股反平行的肽段形成的β折疊片和2個α螺旋組成的桶形結構域組成。系統(tǒng)發(fā)育樹分析表明,湖羊的SPLUNC1蛋白在山羊、牛、豬、人、小鼠中,與山羊首先聚為一類,后與牛聚為一類,這與動物學分類結果一致。
關鍵詞:湖羊;短的上腭、肺及鼻咽上皮克隆1(SPLUNC1);生物信息學分析
中圖分類號: Q781文獻標志碼: A
文章編號:1002-1302(2016)02-0048-03
收稿日期:2015-01-27
基金項目:國家自然科學基金(編號:31460686)
作者簡介:陳凱麗(1988—),女,河南南陽人,碩士,主要從事動物學研究。E-mail:kellyhenan@163.com。
通信作者:孫延鳴,博士,教授,主要從事臨床獸醫(yī)學研究。E-mail:sym@shzu.edu.cn。
短的上腭、肺及鼻咽上皮克隆1(short palate,lung and nasal epithelium clone 1,[WTBX][STBX]SPLUNC1[WTBZ][STBZ])因其特異表達于上腭、肺及鼻咽上皮而被命名。Weston等首次克隆了小鼠的[WTBX][STBX]SPLUNC1[WTBZ][STBZ]基因[1]。SPLUNC1具有分泌物的生化特性[2],分布于細胞胞漿中[3]。人、小鼠、牛、豬[WTBX][STBX]SPLUNC1[WTBZ][STBZ]分別定位于20號染色體、2號染色體、13號染色體、17號染色體。研究表明哺乳類動物物種擁有共同的[WTBX][STBX]SPLUNC1[WTBZ][STBZ]表達模式,即在口咽部、上呼吸道、唾液腺和氣管表達,且在革蘭陰性細菌引起的呼吸道感染中能起到抗菌及抗炎雙重作用[4]。Liu等證明了SPLUNC1是吸道病原菌感染肺部黏膜固有免疫防御相關決定性成分[5]。Chu等證實SPLUNC1是一種新的宿主防御肺炎支原體蛋白,體內(nèi)過表達的SPLUNC1能顯著地抑制肺部肺炎支原體的載荷量[6]。此外,SPLUNC1在維持上呼吸道穩(wěn)態(tài)方面也起了重要的作用[7]。目前,有關人和小鼠的[WTBX][STBX]SPLUNC1[WTBZ][STBZ]基因功能已有相關報道,但未見有關羊的[WTBX][STBX]SPLUNC1[WTBZ][STBZ]相關功能及其生物信息學分析的報道。在此前的研究中,筆者采用RACE技術,從湖羊的肺組織中克隆得到[WTBX][STBX]SPLUNC1[WTBZ][STBZ] cDNA序列,并在GenBank上登錄(登錄號:KJ749828.1)。本研究利用生物信息學方法對湖羊[WTBX][STBX]SPLUNC1[WTBZ][STBZ]基因序列進行分析,為進一步研究湖羊SPLUNC1蛋白的生物學功能奠定基礎。
1材料與方法
1.1生物信息學數(shù)據(jù)庫和軟件
NCBI(美國生物技術研究中心):http://www.ncbi.nlm.nih.gov/blastEXPASY:http://www.us.expasy.ch(蛋白質(zhì)數(shù)據(jù)庫);MEGA 5.05軟件;RasMol軟件。
1.2湖羊[WTBX][STBX]SPLUNC1[WTBZ][STBZ]基因cDNA全長的獲得
從湖羊肺組織中提取RNA,利用RACE技術分別擴增出[WTBX][STBX]SPLUNC1[WTBZ][STBZ]的3′末端和5′末端序列并送基因公司測序,用DNAMAN軟件將測序結果進行拼接,獲得湖羊[WTBX][STBX]SPLUNC1[WTBZ][STBZ] cDNA 的全長序列。湖羊[WTBX][STBX]SPLUNC1[WTBZ][STBZ] cDNA的全長序列的具體克隆步驟參照文獻[8]。
1.3生物信息分析方法
利用在線分析工具ProtParam(http://web.expasy.org/protparam/)對湖羊[WTBX][STBX]SPLUNC1[WTBZ][STBZ]基因編碼的蛋白質(zhì)進行氨基酸理化分析。利用在線分析工具NetNGlyc 1.0 Server(http://www.cbs.dtu.dk/services/NetNGlyc/)對湖羊[WTBX][STBX]SPLUNC1[WTBZ][STBZ]基因編碼的蛋白質(zhì)進行糖基化位點分析。利用在線分析工具WoLF PSORT(http://wolfpsort.org)、TargetP 1.1 Server(http://www.cbs.dtu.dk/services/TargetP/)和SignalP-3.0(http://www.cbs.dtu.dk/services/SignalP-3.0/)對湖羊SPLUNC1蛋白在真核細胞的亞細胞位置和信號肽進行分析。利用在線分析工具TMPred(http://www.ch.embnet.org/software/TMPRED_form.html)對湖羊SPLUNC1蛋白進行跨膜區(qū)分析。利用在線分析工具SOPMA(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)預測湖羊SPLUNC1蛋白二級結構進行分析。利用NCBI的在線分析工具Blast(http://blast.ncbi.nlm.nih.gov/Blast.cgi?CMD=Web&PAGE_TYPE=BlastHome)對湖羊SPLUNC1蛋白的保守結構域進行預測。利用在線分析工具3D-PSSM(http//www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index)和RasMol軟件對湖羊SPLUNC1蛋白的三級結構進行分析。利用NCBI 的在線分析工具Blast對湖羊的SPLUNC1進行氨基酸序列比對。利用MEGA 5.05構建湖羊SPLUNC1蛋白的分子進化樹。
2結果與分析
2.1湖羊[WTBX][STBX]SPLUNC1[WTBZ][STBZ]基因基本信息與理化性質(zhì)分析
研究利用ExPaSy蛋白數(shù)據(jù)庫中的ProtParam在線工具對湖羊[WTBX][STBX]SPLUNC1[WTBZ][STBZ]基因編碼的蛋白質(zhì)(GenBank登錄號:AIG92771.1)進行氨基酸理化性質(zhì)分析,結果表明,蛋白質(zhì)分子式為C1206H2031N305O348S5,原子總數(shù)為3 895,蛋白質(zhì)分子質(zhì)量為26.53 ku,理論等電點為5.07;不穩(wěn)定系數(shù)為 29.88,說明該蛋白為穩(wěn)定蛋白;脂肪系數(shù)為152.08,總平均親水性為0.704,說明該蛋白是疏水蛋白。湖羊[WTBX][STBX]SPLUNC1[WTBZ][STBZ]基因編碼的255個氨基酸中含量最高的是Leu、Gly 和Val,各有62個、24個和24個,分別占24.3%、9.4%和9.4%,且不含有Pyl、 Trp和Sec。利用NetNGlyc 1.0 Server預測N-糖基化序列,發(fā)現(xiàn)湖羊的SPLUNC1序列中含有2個糖基化序列,分別是:NITA和NLTG。由圖1可知,使用亮氨酸拉鏈公式:Leu-X6-Leu-X6-Leu-X6-Leu (X 指代任意氨基酸殘基),在N末端發(fā)現(xiàn)了亮氨酸拉鏈序列。
[FK(W6][TPCKL1.tif][FK)]
2.2湖羊SPLUNC1蛋白的信號肽、亞細胞定位及跨膜區(qū)域分析
結合Emanuelsson1等和Paul等的亞細胞定位方法對湖羊的SPLUNC1進行信號肽、亞細胞定位分析[9-10]。使用這2篇文獻中提到的在線分析工具進行分析。
WoLF PSORT預測運用最鄰近結點算法(k-nearest neighbor algorithm,KNN),K值為32,queryProtein details extr:28,E.R.:3 (extr即extracellular細胞外的,E.R.即內(nèi)質(zhì)網(wǎng))。點擊網(wǎng)頁結果中的”details“查看與湖羊SPLUNC1匹配的32個蛋白中,有28個與細胞外蛋白相似,且評論大部分為分泌蛋白;有3個與內(nèi)質(zhì)網(wǎng)有關,1個與溶酶體蛋白相似。
TargetP 1.1 Server結果表明湖羊SPLUNC1具有分泌途徑,且含有19個氨基酸的信號肽。
按照Emanuelsson1等的建議[9],對TargerP 1.1 Server預測的信號肽使用SignalP-3.0進行再次分析,得出的結果采用neural networks (NN)算法,湖羊SPLUNC1蛋白的信號肽切割位點為第19個氨基酸和第20個氨基酸之間(圖2)。
[FK(W10][TPCKL2.tif][FK)]
利用在線TMPred工具對目標蛋白質(zhì)進行跨膜區(qū)預測,結果為:有2個可能的模型值得考慮,其中一個模型是N末端在內(nèi)部,有2個大的跨膜螺旋,分別位于1~21位氨基酸(由內(nèi)到外),47~68位氨基酸(由外到內(nèi)),總分:2 611;另一種模型是有1個大的跨膜螺旋,位于1~19位氨基酸(由外到內(nèi)),總分:1 260(圖3)。
[FK(W10][TPCKL3.tif][FK)]
綜上所述,湖羊SPLUNC1蛋白含有1個19位氨基酸的信號肽,亞細胞定位于細胞外,有2個大的跨膜螺旋。
2.3湖羊SPLUNC1蛋白二級結構預測分析
本研究利用SOPMA工具預測該基因編碼蛋白質(zhì)的二級結構,結果顯示參與形成螺旋(alpha helix)的氨基酸有135個、占52.94%,參與形成延伸直鏈(extended strand)的氨基酸有38個,占14.90%,參與形成無規(guī)則卷曲(random coil)的氨基酸有69個,占27.06%。二級結構分布見圖4。
[FK(W9][TPCKL4.tif][FK)]
2.4湖羊SPLUNC1蛋白三級結構預測分析
本研究利用SWISS-MODEL蛋白質(zhì)三維結構建模工具預測湖羊[WTBX][STBX]SPLUNC1[WTBZ][STBZ]基因編碼蛋白質(zhì)的三維結構,獲得該蛋白的三維結構模型。使用SWISS-MODEL模板庫匹配靶序列的進化相關結構進行Blast和HHBlits搜索,在匹配的23個模板里,模板4 kgo.1.A與湖羊SPLUNC1序列的相似最高。使用RasMol軟件查看預測結果,發(fā)現(xiàn)該蛋白由4 股反平行的肽段形成的β折疊片和2個α螺旋組成的桶形結構域組成(圖5)。
2.5湖羊SPLUNC1蛋白保守區(qū)域預測
利用NCBI的Blast比對預測湖羊SPLUNC1的結構域,由圖6可見,湖羊SPLUNC1蛋白有2個結構域,其中第58個氨基酸到第233個氨基酸構成的保守結構域與LBP_BPI_CEPT結[CM(25]構域相似,第104個氨基酸到第231個氨基酸構成的保守[CM)]
[FK(W6][TPCKL5.tif][FK)]
結構域與BPI1結構域相似。
2.6湖羊SPLUNC1蛋白的系統(tǒng)發(fā)育樹分析
使用NCBI 的Blast在線工具對湖羊SPLUNC1的氨基酸進行序列比對,結果表明,湖羊與山羊、家牛、豬、人、小鼠物種相似性為98%、92%、78%、79%、67%。利用Clustal X 1.81軟件對6個物種[WTBX][STBX]SPLUNC1[WTBZ][STBZ]基因氨基酸序列進行比對,然后使
[FK(W6][TPCKL6.tif][FK)]
用MEGA 5.05的鄰近法(Neighbor-Joining,NJ)基于該基因氨基酸序列的比對結果構建6個物種的系統(tǒng)發(fā)育樹,進而反映不同物種的系統(tǒng)進化及親緣關系(由圖7可見,分支節(jié)點處數(shù)字為1 000次Bootstrop檢驗的支持百分比)。結果表明,湖羊和山羊的[WTBX][STBX]SPLUNC1[WTBZ][STBZ]基因同屬一個分支,親緣關系比較密切,聚為一類,隨后這2者與牛聚為一類,而后與豬聚為一類,而人和小鼠的[WTBX][STBX]SPLUNC1[WTBZ][STBZ]基因單獨為1支。
[FK(W9][TPCKL7.tif][FK)]
3結論與討論
本研究通過DNAMAN、NCBI等在線工具和軟件,對湖羊[WTBX][STBX]SPLUNC1[WTBZ][STBZ]基因的蛋白結構和功能進行了分析。由分析結果可知,克隆的湖羊[WTBX][STBX]SPLUNC1[WTBZ][STBZ]基因cDNA全長(GenBank登錄號:KJ749828.1)為1 091 bp,含1個完整的開放閱讀框(ORF)768 bp,共編碼255個氨基酸。將湖羊[WTBX][STBX]SPLUNC1[WTBZ][STBZ]基因翻譯的氨基酸序列與已發(fā)表文章小鼠和豬[1,11]SPLUNC1的信息進行比較,發(fā)現(xiàn)湖羊的SPLUNC1與小鼠在N端都有亮氨酸拉鏈,且排列的位置相同。小鼠的為MFLVGSLVVLCGLLAHSTAQLAGLPLPL,湖羊的為MFQIGSLIVLCGLLAQTTALLEALPVPL,豬的N端未發(fā)現(xiàn),表明亮氨酸拉鏈在物種進化上存在差異。另外小鼠的糖基化序列是NPTD、NITA和NLTG,湖羊是NITA和NLTG,豬只有1個糖基化序列NITV。同時,在小鼠的[WTBX][STBX]SPLUNC1[WTBZ][STBZ]序列上發(fā)現(xiàn)的PLPL結構域以及保守結構域蛋白激酶C(SLK)和酪蛋白激酶Ⅱ(SFVD和SGLD)在湖羊[WTBX][STBX]SPLUNC1[WTBZ][STBZ]上沒有被發(fā)現(xiàn),而豬的[WTBX][STBX]SPLUNC1[WTBZ][STBZ]序列上卻發(fā)現(xiàn)有蛋白激酶C(SLK)序列。
最早先采用的是信號肽預測軟件SignalP 4.0分析湖羊SPLUNC1蛋白,發(fā)現(xiàn)信號肽切割位點在23~24,而報道的小鼠和豬的信號肽切割位點在19~20之間,人的SPLUNC1 蛋白的N 端的信號肽長度為19個氨基酸[12],但是結合了亞細胞定位后,支持了信號肽切割位點為19~20。在亞細胞定位時參考了孫偉等和杜慕云等的亞細胞定位方法[13-14],對序列進行分析發(fā)現(xiàn),用Signal 3.0分析有2個結果,neural networks (NN)的分析結果為信號肽切割位點為 19~20,hidden Markov models (HMM)的分析結果為信號肽切割位點為23~24。綜合比較后,判斷湖羊SPLUNC1的信號肽切割位點應為 19~20之間,但是仍需試驗數(shù)據(jù)支持。
從近些年的研究報道中,可以看出大部分的SPLUNC1生物學研究功能主要在人和鼠上,鮮見羊SPLUNC1生物學功能的相關報道。此次研究運用生物信息學的方法對湖羊SPLUNC1蛋白的基本理化性質(zhì)、信號肽、跨膜區(qū)域、二級結構等進行分析,初步預測了湖羊SPLUNC1蛋白所擁有的部分特性,以期為深入探討其生物學功能提供理論依據(jù)。
[HS2][HT8.5H]參考文獻:[HT8.SS]
[1][ZK(#]Weston W M,Leclair E E,Trzyna W,et al. Differential display identification of plunc,a novel gene expressed in embryonic palate,nasal epithelium,and adult lung[J]. The Journal of Biological Chemistry,1999,274(19):13698-13703.
[2]Campos M A,Abreu A R,Nlend M C,et al. Purification and characterization of PLUNC from human tracheobronchial secretions[J]. American Journal of Respiratory Cell and Molecular Biology,2004,30(2):184-192.
[3]肖丁良,鐘禮立,梁沫,等. 肺炎支原體脂質(zhì)膜蛋白誘導人支氣管上皮細胞[WTBX][STBX]SPLUNC1[WTBZ][STBZ] 的表達[J]. 醫(yī)學臨床研究,2013,30(6):1041-1045.
[4][JP3]Di Y P,Harper R,Zhao Y,et al. Molecular cloning and characterization of spurt,a human novel gene that is retinoic acid-inducible and encodes a secretory protein specific in upper respiratory tracts[J]. The Journal of Biological Chemistry,2003,278(2):1165-1173.
[5]Liu Y,Bartlett J A,Di M E,et al. SPLUNC1/BPIFA1 contributes to pulmonary host defense against Klebsiella pneumoniae respiratory infection[J]. The American Journal of Pathology,2013,182(5):1519-1531.
[6]Chu H W,Thaikoottathil J,Rino J G,et al. Function and regulation of SPLUNC1 protein in Mycoplasma infection and allergic inflammation[J]. Journal of Immunology,2007,179(6):3995-4002.
[7]Mcgillivary G,Bakaletz L O. The multifunctional host defense peptide SPLUNC1 is critical for homeostasis of the mammalian upper airway[J]. PLoS One,2010,5(10):e13224.
[8]陳凱麗,孫延鳴,沈文,等. RACE法克隆湖羊[WTBX][STBX]SPLUNC1[WTBZ][STBZ]基因及序列分析[J]. 西北農(nóng)業(yè)學報,2015,24(3):8-13.
[9][ZK(#]Emanuelsson O,Brunak S,Von Heijne G,et al. Locating proteins in the cell using TargetP,SignalP and related tools[J]. Nature Protocols,2007,2(4):953-971.
[10][ZK(#]Horton P,Park K J,Obayashi T,et al. WoLF PSORT:protein localization predictor[J]. Nucleic Acids Research,2007,35(Web Server issue):W585-W587.
[11]Larsen K,Madsen L B,Bendixen C. Porcine SPLUNC1:molecular cloning,characterization and expression analysis[J]. Biochimica et Biophysica Acta,2005,1727(3):220-226.
[12]郭小芳,陳攀,李夏雨,等. 新的天然免疫保護分子SPLUNC1的結構與功能研究進展[J]. 生物化學與生物物理進展,2012,39(10):945-951.
[13]孫偉,李達,蘇銳,等. 綿羊[WTBX][STBX]YAP1[WTBZ][STBZ]基因全長cDNA克隆及生物信息學分析[J]. 中國農(nóng)業(yè)科學,2013,46(8):1725-1735.
[14]杜慕云,楊仁德,李劍,等. 草菇α-淀粉酶基因的生物信息學分析[J]. 食用菌學報,2014,21(3):6-12.