苗孟君,丁彥蕊
1.江南大學(xué)物聯(lián)網(wǎng)工程學(xué)院,江蘇無(wú)錫214122
2.江南大學(xué)數(shù)字媒體學(xué)院,江蘇無(wú)錫214122
PPI網(wǎng)絡(luò)比對(duì)用于植物乳桿菌的糖代謝研究
苗孟君1,丁彥蕊2
1.江南大學(xué)物聯(lián)網(wǎng)工程學(xué)院,江蘇無(wú)錫214122
2.江南大學(xué)數(shù)字媒體學(xué)院,江蘇無(wú)錫214122
CNKI網(wǎng)絡(luò)出版:2017-04-01,http://kns.cnki.net/kcms/detail/11.2127.TP.20170401.0853.034.html
植物乳桿菌有助于調(diào)節(jié)人和動(dòng)物的機(jī)體微生物菌群的平衡,增強(qiáng)機(jī)體的免疫系統(tǒng),并且具有多種保健功能,其主要存在于人和動(dòng)物胃、腸道以及肉類(lèi)中。Kleerebezem[1]等人于2003年測(cè)序出植物乳桿菌WCFS1的完整基因序列,此后,其逐漸成為研究植物乳桿菌的模型菌株之一。而由Zhang[2]等人測(cè)序出的植物乳桿菌JDM1的基因序列與WCFS1高度相似(>90%),但由于JDM1長(zhǎng)期生活在富營(yíng)養(yǎng)的環(huán)境中,使得JDM1中缺失了一些糖轉(zhuǎn)移和代謝基因。針對(duì)這一現(xiàn)象,Zhang[2]等人從基因序列的角度說(shuō)明JDM1較WCFS1缺失了一些糖轉(zhuǎn)移和代謝基因。然而,生物體內(nèi)的細(xì)胞功能和生物過(guò)程是通過(guò)蛋白質(zhì)之間的相互作用完成的,因此,只從WCFS1和JDM1的某段序列或者某個(gè)編碼的蛋白質(zhì)分析闡明兩個(gè)菌株的糖代謝功能機(jī)制的差異是片面的。因此,構(gòu)建WCFS1和JDM1的糖代謝功能模塊的PPI網(wǎng)絡(luò)[3],運(yùn)用智能網(wǎng)絡(luò)比對(duì)算法研究?jī)煞N植物乳桿菌糖代謝功能模塊的差異具有重要的意義。
生物分子網(wǎng)絡(luò)比對(duì)是利用生物分子的相似性和生物分子網(wǎng)絡(luò)的拓?fù)湫畔⒉⒔Y(jié)合圖理論,對(duì)生物分子網(wǎng)絡(luò)進(jìn)行比對(duì),是理解不同生物系統(tǒng)之間的相似性和差異性的一種有效方法。陳璟[4]等人通過(guò)比對(duì)產(chǎn)甲烷的常溫古細(xì)菌和嗜熱古細(xì)菌的代謝網(wǎng)絡(luò),發(fā)現(xiàn)了常溫古細(xì)菌和嗜熱古細(xì)菌的保守代謝途徑,推測(cè)嗜熱菌的耐熱性可能與胞內(nèi)酪氨酸有關(guān)。蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)的比對(duì),可以有效地預(yù)測(cè)蛋白質(zhì)-蛋白質(zhì)相互作用、蛋白質(zhì)功能,挖掘不同物種之間的保守區(qū)域,分析功能模塊的差異性。Seah[5]等人提出網(wǎng)絡(luò)比對(duì)算法DualAligner,通過(guò)區(qū)域到區(qū)域的蛋白質(zhì)相互作用網(wǎng)絡(luò)比對(duì),發(fā)現(xiàn)了人類(lèi)和酵母之間的高度保守區(qū)域。
近年來(lái),PPI網(wǎng)絡(luò)比對(duì)算法發(fā)展迅速,這促進(jìn)了研究者們對(duì)蛋白質(zhì)-蛋白質(zhì)相互作用的探索,并且有利于蛋白質(zhì)功能的預(yù)測(cè)和保守功能模塊挖掘的研究。網(wǎng)絡(luò)比對(duì)算法分為兩種類(lèi)型:局部網(wǎng)絡(luò)比對(duì)和全局網(wǎng)絡(luò)比對(duì)。局部網(wǎng)絡(luò)比對(duì)是不明確的,因?yàn)橐粋€(gè)網(wǎng)絡(luò)中的節(jié)點(diǎn)可以與另一個(gè)網(wǎng)絡(luò)中的多個(gè)節(jié)點(diǎn)相匹配。PathBLAST[6]是一種最早期的局部網(wǎng)絡(luò)比對(duì)算法之一,其通過(guò)尋找蛋白質(zhì)相互作用途徑的高比對(duì)得分進(jìn)行網(wǎng)絡(luò)比對(duì),Network-BLAST[7]是此算法的改進(jìn)形式。在全局網(wǎng)絡(luò)比對(duì)中,網(wǎng)絡(luò)中的每一個(gè)節(jié)點(diǎn)都與另一個(gè)網(wǎng)絡(luò)中的唯一一個(gè)節(jié)點(diǎn)相匹配。Berger[8]等人首次提出了PPI網(wǎng)絡(luò)的全局比對(duì)算法,IsoRank,并進(jìn)一步改進(jìn)此算法,形成IsoRankN[9]和PISwap[10]。Kuchaiev等人完全利用網(wǎng)絡(luò)的拓?fù)湫畔ⅲ岢鏊惴ǎ篏RAAL[11]和MI-GRAAL[12],并且通過(guò)這些算法發(fā)現(xiàn)人類(lèi)和酵母的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)非常相似。Milenkovic等人發(fā)展了這些算法,提出H-GRAAL[13]。HGA-2N[14]改進(jìn)匈牙利貪心算法(HGA),并實(shí)現(xiàn)了圖形處理單元的并行計(jì)算。MAGNA[15]基于遺傳算法尋求最大化精度的全局網(wǎng)絡(luò)比對(duì)。Evolutionary Graph Edit Distance Algorithm(GEDEVO)[16]則是一種利用圖編輯距離作為優(yōu)化模型以尋求最優(yōu)比對(duì)的進(jìn)化算法。
由于植物乳桿菌WCFS1和JDM1在糖代謝模塊存在較大差異,為了更加精確地分析WCFS1和JDM1關(guān)于糖代謝模塊的差異,本文通過(guò)分別構(gòu)建植物乳桿菌WCFS1和JDM1的糖酵解模塊,戊糖磷酸途徑模塊,檸檬酸循環(huán)模塊的蛋白質(zhì)-蛋白質(zhì)相互作用(PPI)網(wǎng)絡(luò),采用網(wǎng)絡(luò)比對(duì)算法GEDEVO,對(duì)構(gòu)建的PPI網(wǎng)絡(luò)進(jìn)行比對(duì),從系統(tǒng)水平上分析植物乳桿菌JDM1和WCFS1的糖代謝功能模塊之間的差異,挖掘糖代謝功能模塊的保守區(qū)域,尋找WCFS1和JDM1糖代謝功能模塊的差異路徑,預(yù)測(cè)蛋白質(zhì)-蛋白質(zhì)相互作用。
本文從KEGG數(shù)據(jù)庫(kù)獲得植物乳桿菌WCFS1(Lactobacillus plantarum WCFS1)和JDM1(Lactobacillus plantarum JDM1)的糖酵解模塊(Glycolysis),戊糖磷酸途徑模塊(Pentose phosphate pathway),檸檬酸循環(huán)模塊(Citrate cycle)的全部蛋白質(zhì)數(shù)據(jù),并結(jié)合STRING數(shù)據(jù)庫(kù),分別獲得這三個(gè)模塊的蛋白質(zhì)-蛋白質(zhì)相互作用數(shù)據(jù)。這三個(gè)模塊的全部蛋白質(zhì)的相互作用是根據(jù)STRING數(shù)據(jù)庫(kù)中蛋白質(zhì)-蛋白質(zhì)相互作用數(shù)據(jù)可信度確定的[17-18],選擇標(biāo)準(zhǔn)為可信度大于0.7[19]。
根據(jù)從STRING數(shù)據(jù)庫(kù)獲得的蛋白質(zhì)-蛋白質(zhì)相互作用數(shù)據(jù),分別構(gòu)建WCFS1和JDM1的糖酵解功能模塊,戊糖磷酸途徑功能模塊,檸檬酸循環(huán)功能模塊的PPI網(wǎng)絡(luò)。本文用圖G=(V,E)表示蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò),其中,V代表蛋白質(zhì)集合,E代表蛋白質(zhì)-蛋白質(zhì)之間的相互作用集合。具體信息如表1所示。
表1 WCFS1和JDM1的糖代謝模塊的PPI網(wǎng)絡(luò)數(shù)據(jù)
生物網(wǎng)絡(luò)比對(duì)結(jié)合圖理論和生物信息,通過(guò)一定規(guī)則,使得網(wǎng)絡(luò)中的節(jié)點(diǎn)相互對(duì)應(yīng)。其中,PPI網(wǎng)絡(luò)比對(duì),利用網(wǎng)絡(luò)比對(duì)算法,使得網(wǎng)絡(luò)中的蛋白質(zhì)相互對(duì)應(yīng),預(yù)測(cè)蛋白質(zhì)-蛋白質(zhì)相互作用、蛋白質(zhì)功能,挖掘保守功能模塊,分析功能模塊之間的差異。本文選取GEDEVO算法分別對(duì)植物乳桿菌JDM1和WCFS1的糖酵解模塊,戊糖磷酸途徑模塊,檸檬酸循環(huán)模塊的PPI網(wǎng)絡(luò)進(jìn)行比對(duì)。GEDEVO是一種利用圖編輯距離作為優(yōu)化模型以尋求最優(yōu)比對(duì)的進(jìn)化算法,其受自然靈感啟發(fā),模仿規(guī)則“適者生存”,廣泛用于解決許多NP難問(wèn)題。GEDEVO基于進(jìn)化算法思想,將一對(duì)PPI網(wǎng)絡(luò)模型作為兩個(gè)無(wú)向不加權(quán)圖G1=(V1,E1)和G2=(V2,E2),并利用圖編輯距離優(yōu)化映射f使V1和V2中的節(jié)點(diǎn)一對(duì)一映射。定義G1和G2之間的圖編輯距離為:
其中,GEDf()G1,G2表示圖G1和G2的圖編輯距離,(u,v)表示圖G1中的節(jié)點(diǎn)u和v之間的邊,E1為圖G1中的邊集;f()u和f(v)分別為節(jié)點(diǎn)u和v的映射節(jié)點(diǎn),E2為圖G2中的邊集,(u′,v′)表示圖G2中的節(jié)點(diǎn)u′和v′之間的邊,f-1(u′)和f-1(v′)分別為節(jié)點(diǎn)u′和v′的映射節(jié)點(diǎn)。
GEDEVO算法主要分為3個(gè)步驟,分別為:
步驟1初始化種群和個(gè)體評(píng)價(jià)
初始化種群的個(gè)體是兩個(gè)PPI網(wǎng)絡(luò)的一個(gè)映射。
個(gè)體評(píng)價(jià)即評(píng)價(jià)一個(gè)映射的質(zhì)量。設(shè)每對(duì)節(jié)點(diǎn)u∈V1和v∈V2之間的映射為v=f(u)。定義節(jié)點(diǎn)對(duì)得分pairScoref(u,v)表示節(jié)點(diǎn)u和v之間的映射質(zhì)量,公式如下:
其中,PairGEDf(u,v)表示通過(guò)映射f,使節(jié)點(diǎn)u和v對(duì)應(yīng)所要增加或刪除的邊的數(shù)量。grletsf(u,v)表示graphlet度標(biāo)簽距離(GSD)[20],grletsf(u,v)被定義為兩個(gè)節(jié)點(diǎn)的鄰近拓?fù)浣Y(jié)構(gòu)差異。
其中,ui表示節(jié)點(diǎn)u的第i個(gè)特征向量[20],vi表示節(jié)點(diǎn)v的第i個(gè)特征向量[20],wi表示同構(gòu)圖i的權(quán)重,grletsf(u,v)的值在0到1之間,grletsf(u,v)的值越大,說(shuō)明節(jié)點(diǎn)u和v的鄰近區(qū)域的拓?fù)涮卣髟较嗨芠21-22]。
步驟2生成子代
為了產(chǎn)生新的映射f,并且保持種群多樣性避免局部最優(yōu),得到高且快速收斂的最佳方案,進(jìn)行如下操作:
(1)將兩個(gè)PPI網(wǎng)絡(luò)中的蛋白質(zhì)分別進(jìn)行隨機(jī)排列,并隨機(jī)產(chǎn)生一個(gè)映射f。
(2)采取部分映射交叉(PMX)變異思想,把映射中所有蛋白質(zhì)對(duì)得分的平均值作為閾值,把一個(gè)映射分成低得分組和高得分組。然后,隨機(jī)交換高得分組。為了避免局部最小,也交換概率較低的低得分對(duì)(PPI網(wǎng)絡(luò)的1%)。
(3)在一個(gè)映射f的交叉結(jié)果中,從父代中保護(hù)低得分對(duì)。
(4)對(duì)于定點(diǎn)變異,在一個(gè)映射f中,選擇低得分對(duì)進(jìn)行交換,最終保留高得分對(duì)。
步驟3終止迭代
GEDEVO的收斂時(shí)間主要取決于種群的大小以及輸入的PPI網(wǎng)絡(luò)的拓?fù)湫再|(zhì)。GEDEVO可以設(shè)定收斂條件:(1)迭代次數(shù);(2)運(yùn)行時(shí)間;(3)個(gè)體的最佳映射沒(méi)有隨著迭代次數(shù)發(fā)生明顯改變時(shí)(迭代次數(shù)為30時(shí))。
網(wǎng)絡(luò)比對(duì)結(jié)果的質(zhì)量標(biāo)準(zhǔn)常常反映在拓?fù)浞矫婧蜕锓矫?。本文采用?jié)點(diǎn)正確性(Node Correctness,NC)[15]和邊正確性(Edge Correctness,EC)[16]評(píng)價(jià)網(wǎng)絡(luò)比對(duì)結(jié)果。EC被定義為輸入網(wǎng)絡(luò)邊的比對(duì)的百分比,用于衡量輸入網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)的相似程度,EC值越高,輸入的網(wǎng)絡(luò)越相似。NC被定義為輸入的第一個(gè)網(wǎng)絡(luò)中的節(jié)點(diǎn)正確比對(duì)第二個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)的百分比。EC和NC的計(jì)算公式如下表示:
其中,#sharedInteractions表示網(wǎng)絡(luò)G1和G2中對(duì)應(yīng)的邊的數(shù)目,|E1|和|E2|分別表示網(wǎng)絡(luò)G1和G2中邊的數(shù)目。
其中,g是正確的節(jié)點(diǎn)映射,f(u)=g(u)表示節(jié)點(diǎn)的比對(duì)結(jié)果與正確的節(jié)點(diǎn)映射相同。顯然,正確比對(duì)節(jié)點(diǎn)的映射g要預(yù)先知道。這里,設(shè)置g為比對(duì)的兩個(gè)網(wǎng)絡(luò)中節(jié)點(diǎn)(蛋白質(zhì))的同源性。
植物乳桿菌WCFS1和JDM1的基因序列非常相似(>90%),由于JDM1長(zhǎng)期生活在富營(yíng)養(yǎng)環(huán)境中,使得JDM1缺失了一些糖代謝基因,這導(dǎo)致WCFS1和JDM1在糖代謝功能模塊存在一定差異。因此,本文利用網(wǎng)絡(luò)比對(duì)方法對(duì)WCFS1和JDM1的糖代謝(糖酵解、戊糖磷酸途徑、檸檬酸循環(huán))功能模塊的PPI網(wǎng)絡(luò)進(jìn)行比對(duì),挖掘兩者的糖代謝模塊的保守路徑,并分析兩者的差異。
本文選擇GEDEVO算法,對(duì)植物乳桿菌WCFS1和JDM1的糖酵解,戊糖磷酸途徑,檸檬酸循環(huán)模塊的PPI網(wǎng)絡(luò)進(jìn)行比對(duì)。并利用邊正確性(公式(4))和節(jié)點(diǎn)正確性(公式(5))評(píng)價(jià)比對(duì)結(jié)果。其中,計(jì)算節(jié)點(diǎn)正確性時(shí),以KEGG數(shù)據(jù)庫(kù)中蛋白質(zhì)的同源性數(shù)據(jù)為標(biāo)準(zhǔn)。另外,本文將GEDEVO算法的比對(duì)結(jié)果與GRAAL、MAGNA算法進(jìn)行了比較。表2表示了GEDEVO算法、GRAAL算法、MAGNA算法在糖酵解、戊糖磷酸途徑、檸檬酸循環(huán)模塊中的邊正確性結(jié)果。表3表示了GEDEVO算法、GRAAL算法、MAGNA算法在糖酵解、戊糖磷酸途徑、檸檬酸循環(huán)模塊中的節(jié)點(diǎn)正確性結(jié)果。
從表2的邊正確性來(lái)看,GEDEVO算法和MAGNA算法明顯優(yōu)于GRAAL算法,尤其在糖酵解和戊糖磷酸途徑的比對(duì)中優(yōu)勢(shì)明顯。從表3的節(jié)點(diǎn)正確性來(lái)說(shuō),GEDEVO算法在所有網(wǎng)絡(luò)的比對(duì)中都明顯高于GRALL和MAGNA。綜合邊正確性和節(jié)點(diǎn)正確性來(lái)看,GEDEVO算法更適合于WCFS1和JDM1的網(wǎng)絡(luò)比對(duì)。因此,本文采用GEDEVO算法進(jìn)行網(wǎng)絡(luò)比對(duì)。
從表2可以看出,GEDEVO算法對(duì)于WCFS1和JDM1的糖酵解、戊糖磷酸途徑、檸檬酸循環(huán)模塊的比對(duì)結(jié)果的邊正確性都大于90%,分別是93.6%、96%、100%。這表明植物乳桿菌WCFS1和JDM1的這三個(gè)模塊的PPI網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)非常相似。表3中,WCFS1和JDM1的糖酵解、戊糖磷酸途徑、檸檬酸循環(huán)模塊的比對(duì)結(jié)果的節(jié)點(diǎn)正確性都大于80%,分別是82.9%、88%、100%。WCFS1和JDM1的糖酵解、戊糖磷酸途徑、檸檬酸循環(huán)模塊中的蛋白質(zhì)大部分互為同源蛋白質(zhì),但也存在一些差異。
此外,為了驗(yàn)證實(shí)驗(yàn)結(jié)果的可靠性,分別對(duì)三個(gè)功能模塊做了10組(共30組)比對(duì)實(shí)驗(yàn),分別計(jì)算每個(gè)功能模塊實(shí)驗(yàn)結(jié)果的平均值和方差,具體數(shù)據(jù)如表4所示。
表2 GEDEVO、GRAAL、MAGNA算法對(duì)糖酵解、戊糖磷酸途徑、檸檬酸循環(huán)模塊的PPI網(wǎng)絡(luò)比對(duì)的EC值分布%
表3 GEDEVO、GRAAL、MAGNA算法對(duì)糖酵解、戊糖磷酸途徑、檸檬酸循環(huán)模塊的PPI網(wǎng)絡(luò)比對(duì)的DC值分布%
表4 對(duì)三個(gè)功能模塊進(jìn)行比對(duì)的EC值和DC值的平均值和方差
從表4中可以看出,糖酵解模塊、戊糖磷酸途徑模塊和檸檬酸循環(huán)模塊的DC值的平均值都大于0.85,EC值的平均值都大于0.9,方差都小于0.002 5,這表明實(shí)驗(yàn)結(jié)果非??煽坎⑶液芊€(wěn)定。
下面將根據(jù)比對(duì)結(jié)果,闡明WCFS1和JDM1的這三個(gè)功能模塊的差異。
圖1描述了植物乳桿菌WCFS1和JDM1的戊糖磷酸途徑模塊的PPI網(wǎng)絡(luò)比對(duì)結(jié)果。圖的左邊表示JDM1的PPI網(wǎng)絡(luò),右邊是WCFS1的PPI網(wǎng)絡(luò)。從圖中可以看出,JDM1中的蛋白質(zhì)ribose-phosphate pyrophosphokinase(prs1)、ribokinase(rbsK3)、transketolase(tkt4)、fructosebisphosphate aldolase(fba)、2-keto-3-deoxy-6-phosphogluconate aldolase(JDM1_0578)、glucose-6-phosphate isomerase(pgi)、glucose-6-phosphate 1-dehydrogenase(gpd)、ribulose-phosphate 3-epimerase(rpe)之間通過(guò)相互作用連接成一條蛋白質(zhì)相互作用路徑prs1-rbsK3-tkt4-fba-JDM1_0578-pgi-gpd-rpe,與WCFS1中的蛋白質(zhì)ribose-phosphate pyrophosphokinase(prs1)、Ribokinase(rbsK1)、transketolase(tkt4)、fructose-bisphosphate aldolase(fba)、glucose-6-phosphate isomerase(pgi)、glucose-6-phosphate 1-dehydrogenase(gpd)、ribulose-phosphate 3-epimerase(rpe)、2-keto-3-deoxygluconate kinase(kdgk)組成的路徑prs1-rbsK1-tkt4-fba-pgi-gpd-rpe-kdgk非常相似,如兩者的prs1-rbsK3(rbsK1)-tkt4-fba路徑是一致的。但是這兩條路徑又存在差異,如圖1右邊網(wǎng)絡(luò)中的蛋白質(zhì)kdgk,JDM1中并沒(méi)有與之對(duì)應(yīng)的蛋白質(zhì)。WCFS1中的蛋白質(zhì)kdgk是一種磷酸化的激酶,它可以生成蛋白質(zhì)2-keto-3-deoxy-6-phospho-gluconate aldolase(JDM1_0578)[23],并且,其在原核生物中的葡萄糖分解代謝和糖酸降解中起著關(guān)鍵作用[24],JDM1_0578則通過(guò)雙功能KDPG醛縮酶裂解丙酮酸和甘油醛-3-磷酸(GAP)。此外,JDM1中沒(méi)有蛋白質(zhì)與WCFS1中的蛋白質(zhì)deoxyribose-phosphate aldolase(deoC)相對(duì)應(yīng),而蛋白質(zhì)deoC是一種可以從死亡細(xì)胞中產(chǎn)生脫氧核苷的參與分解代謝的酶。這種酶經(jīng)常出現(xiàn)在生活在營(yíng)養(yǎng)缺失的環(huán)境中的生物體中[25]。因?yàn)閃CFS1生活在營(yíng)養(yǎng)缺失的環(huán)境中,它會(huì)用這種酶從死亡的細(xì)胞中獲得營(yíng)養(yǎng)物質(zhì),使其生長(zhǎng)。而JDM1則長(zhǎng)期生活在富營(yíng)養(yǎng)環(huán)境中,因此它不需要這種酶。
圖1 WCFS1和JDM1的戊糖磷酸途徑PPI網(wǎng)絡(luò)比對(duì)圖
圖2描述了植物乳桿菌WCFS1和JDM1的糖酵解模塊的PPI網(wǎng)絡(luò)比對(duì)結(jié)果。圖的左邊表示JDM1的糖酵解PPI網(wǎng)絡(luò),右邊是WCFS1的糖酵解PPI網(wǎng)絡(luò)。從表2中可以看出,兩者的拓?fù)浣Y(jié)構(gòu)非常相似,EC值達(dá)到了93.6%。如,兩者中的蛋白質(zhì)glucose-6-phosphate isomerase(pgi)都處于PPI網(wǎng)絡(luò)的中心位置,與上下兩邊的許多蛋白質(zhì)都具有相互作用,可見(jiàn),蛋白質(zhì)glucose-6-phos-phate isomerase(pgi)在WCFS1和JDM1的糖酵解模塊中分別具有至關(guān)重要的作用。JDM1中的蛋白質(zhì)glucokinase(glk)和WCFS1中的蛋白質(zhì)bifunctional protein:transcription regulator和sugar kinase(lp_1573)都與醛糖異構(gòu)酶(aldose 1-epimerase、galM1、galM2、galM3)相互作用,其中蛋白質(zhì)glk和lp_1573互為同源蛋白質(zhì)。但是,WCFS1和JDM1的糖酵解模塊也存在差異。JDM1中的蛋白質(zhì)bifunctional acetaldehyde-CoA/alcohol dehydrogenase(adhE)與蛋白質(zhì)pyruvate dehydrogenase complex,E2 component(pdhC)相互作用,與之對(duì)應(yīng)的,WCFS1中的蛋白質(zhì)bifunctional protein:alcohol dehydrogenase、acetaldehyde dehydrogenase(adhE)和蛋白質(zhì)pyruvate dehydrogenase complex、E2 component(pdhC)和phosphoenolpyruvate carboxykinase(ATP)(pck)相互作用??梢酝茰y(cè),JDM1中的adhE與蛋白質(zhì)pck相互作用。JDM1中的蛋白質(zhì)pdhC有4條邊,與其有相互作用的蛋白質(zhì)分別是pck、pyruvate dehydrogenase complex(pdhA)、pyruvate dehydrogenase complex、E1 component,beta subunit(pdhB)、dihydrolipoamide dehydrogenase(pdhD)。而WCFS1中的pdhC除了與這四個(gè)蛋白質(zhì)相互合作,還與蛋白質(zhì)pyruvate kinase(pyk)相互作用。可見(jiàn),JDM1中的pdhC與蛋白質(zhì)pyk具有相互作用[26]。通過(guò)網(wǎng)絡(luò)比對(duì),發(fā)現(xiàn)了WCFS1和JDM1的糖酵解模塊中存在許多保守路徑,并且預(yù)測(cè)了JDM1中的一些蛋白質(zhì)之間的相互作用。
圖2 WCFS1和JDM1的糖酵解PPI網(wǎng)絡(luò)比對(duì)圖
圖3描述了植物乳桿菌WCFS1和JDM1的檸檬酸循環(huán)模塊的PPI網(wǎng)絡(luò)比對(duì)結(jié)果。圖的左邊是JDM1的檸檬酸循環(huán)PPI網(wǎng)絡(luò),右邊是WCFS1的檸檬酸循環(huán)PPI網(wǎng)絡(luò)。從圖中可以看出,WCFS1和JDM1的檸檬酸循環(huán)模塊中,對(duì)應(yīng)蛋白質(zhì)的鄰居節(jié)點(diǎn)個(gè)數(shù)相同,并且由表2可知,其EC值為100%,這表明兩者的拓?fù)浣Y(jié)構(gòu)非常相似。WCFS1和JDM1的檸檬酸循環(huán)模塊的PPI網(wǎng)絡(luò)都分為兩部分,圖中,上下兩部分的蛋白質(zhì)之間并沒(méi)有相互作用。通常情況下,完成一個(gè)功能模塊,需要蛋白質(zhì)之間的相互合作,因此,能推測(cè),JDM1和WCFS1的檸檬酸循環(huán)模塊需要與檸檬酸循環(huán)模塊之外的蛋白質(zhì)互相合作,完成檸檬酸循環(huán)功能。此外,JDM1的檸檬酸循環(huán)模塊中有11個(gè)蛋白質(zhì),WCFS1中有10個(gè)蛋白質(zhì),JDM1中的蛋白質(zhì)fumarate reductase/succinate dehydrogenase(JDM1_0211)沒(méi)有與WCFS1中的蛋白質(zhì)對(duì)應(yīng)。
圖3 WCFS1和JDM1的檸檬酸循環(huán)PPI網(wǎng)絡(luò)比對(duì)圖
本文選擇GEDEVO算法分別比對(duì)植物乳酸桿菌JDM1和WCFS1的糖酵解,戊糖磷酸途徑,檸檬酸循環(huán)功能模塊的蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)。發(fā)現(xiàn)JDM1和WCFS1的糖酵解、戊糖磷酸途徑、檸檬酸循環(huán)的PPI網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)非常相似,并挖掘了許多保守路徑。如,戊糖磷酸途徑中,JDM1中的蛋白質(zhì)glucokinase(glk)和WCFS1中的與其同源的蛋白質(zhì)bifunctional protein:transcription regulator;sugar kinase(lp_1573)都與醛糖異構(gòu)酶(aldose 1-epimerase,galM1,galM2,galM3)相互作用。但也存在差異,在糖酵解功能模塊中,JDM1中的蛋白質(zhì)相互作用路徑prs1-rbsK3-tkt4-fba-JDM1_0578-pgi-gpd-rpe和WCFS1中的蛋白質(zhì)相互作用路徑prs1-rbsK1-tkt4-fba-pgi-gpd-rpe-kdgk非常相似,但也存在差異。其中蛋白質(zhì)2-keto-3-deoxygluconate kinase(kdgK)的產(chǎn)物是2-keto-3-deoxy-6-phosphogluconate aldolase(JDM1_0578)。在本文中,利用PPI網(wǎng)絡(luò)比對(duì)的方法,不僅挖掘了JDM1和WCFS1在糖代謝模塊的保守路徑,發(fā)現(xiàn)了糖代謝模塊的差異,還預(yù)測(cè)了蛋白質(zhì)-蛋白質(zhì)相互作用,如,戊糖磷酸途徑中,JDM1中的adhE與蛋白質(zhì)pdhD發(fā)生相互作用。綜上所述,JDM1和WCFS1的糖代謝功能模塊的拓?fù)浣Y(jié)構(gòu)非常相似,但也存在差異。通過(guò)利用PPI網(wǎng)絡(luò)比對(duì)方法,對(duì)兩者的糖代謝功能模塊進(jìn)行比對(duì),挖掘兩者糖代謝功能模塊的保守路徑,以及存在差異的路徑,并預(yù)測(cè)了蛋白質(zhì)-蛋白質(zhì)相互作用。通過(guò)實(shí)驗(yàn)進(jìn)一步表明,PPI網(wǎng)絡(luò)比對(duì)對(duì)于預(yù)測(cè)蛋白質(zhì)-蛋白質(zhì)之間的相互作用,挖掘保守模塊,發(fā)現(xiàn)物種及功能模塊之間的差異具有重要意義。
[1] Kleerebezem M,Boekhorst J,van Kranenburg R,et al.Complete genome sequence of Lactobacillus plantarum WCFS1[J].Proceeding of the National Academy of Sciences of the United States of America,2003,100(4):1990-1995.
[2] Zhang Zhuoyang,Liu Chang,Zhu Yongzhang,et al.Complete genome sequence of Lactobacillus plantarum JDM1[J].Journal of Bacteriology,2009,191(15):5020-5021.
[3] Barabasi A L,Oltvai Z N.Network biology:understanding the cell's functional organization[J].Nature Reviews Genetics,2004,5(2):101-113.
[4] 陳璟,須文波.產(chǎn)甲烷的常溫古細(xì)菌和嗜熱古細(xì)菌的代謝網(wǎng)絡(luò)比對(duì)研究[J].小型微型計(jì)算機(jī)系統(tǒng),2015,36(8):1869-1873.
[5] Seah B S,Bhowmick S S,Dewey Jr C F.DualAligner:A dual alignment-based strategy to align protein interaction networks[J].Bioinformatics Advance Access,2014,30(18):2619-2626.
[6] Kelley B P,Yuan Bingbing,Lewitter F,et al.PathBLAST:A tool for alignment of protein interaction networks[J].Nucleic acids research,2004,32:83-88.
[7] Kalaev M,Smoot M,Ideker T,et al.NetworkBLAST:Comparative analysis of protein networks[J].Bioinformatics,2008,24:594-596.
[8] Singh R,Xu J,Berger B.Pairwise global alignment of protein interaction networks by matching neighborhood topology[C]//International Conference on Research in Computational Molecular Biology,2007,4453:16-31.
[9] Liao C S,Lu Kanghao,Baym M,et al.IsoRankN:Spectral methods for global alignment of multiple protein networks[J].Bioinformatics,2009,25(12):253-258.
[10] Chindelevitch L,Liao C S,Berger B,et al.Local optimization for global alignment of protein interaction networks[C]//Pacific Symposium on Biocomputing,Hawaii,USA,2010:123-132.
[11] Kuchaiev O,Milenkovi? T,Memi?evi? V,et al.Topological network alignment uncovers biological function and phylogeny[J].Journal of the Royal Society Interface,2010,50(7):1341-1354.
[12] Kuchaiev O,Przˇulj N.Integrative network alignment reveals large regions of global network similarity in yeast and human[J].Bioinformatics,2011,27:1390-1396.
[13] Milenkovic T,Ng W L,Hayes W,et al.Optimal network alignment with graphlet degree vectors[J].Cancer Inform,2010,9:121-137.
[14] Xie J,Zhou Z,Ma J et al.Graphics processing unitbased alignment of protein interaction networks[J].IET Systems Biology,2015,9(4):120.
[15] Saraph V,Milenkovic T.MAGNA:Maximizing accuracy in global network alignment[J].Bioinformatics,2014,30(20):2931-2940.
[16] Ibragimov R,Malek M,Guo Jiong,et al.GEDEVO:An evolutionary graph edit distance algorithm for biological network alignment[C]//German Conference on Bioinformatics,2013,34:68-79.
[17] Franceschini A,Szklarczyk D,F(xiàn)rankild S,et al.STRING v9.1:Protein-protein interaction networks,with increased coverage and integration[J].Nucleic Acids Research,2013,41(1):808-815.
[18] Von M C,Jensen L J,Snel B,et al.STRING:Known and predicted protein-protein associations,integrated and transferred across organisms[J].Nucleic Acids Research,2005,33:433-437.
[19] Melak T,Gakkhar S.Maximum flow approach to prioritize potential drug targets of Mycobacterium tuberculosis H37Rv from protein-protein interaction network[J].Clinical and Translational Medicine,2015,4(1):61.
[20] Milenkovi? T,Pr?ulj N.Uncovering biological network function via graphlet degree signatures[J].Cancer Informatics,2008,6(1):257.
[21] Przulj N.Biological network comparison using graphlet degree distribution[J].Bioinformatics,2007,23(2):177-183.
[22] Milenkovi? T,Ng W L,Hayes W,et al.Optimal network alignment with graphlet degree vectors.[J].Cancer Informatics,2010,9(9):121-137.
[23] Pickl A,Johnsen U,Archer R M,et al.Identification and characterization of 2-keto-3-deoxygluconatekinase and 2-keto-3-deoxygalactonate kinase in the haloarchaeon Haloferax volcanii[J].Fems Microbiology Letters,2014,361(1):76-83.
[24] Ahmed H,Ettema T J G,Tjaden B,et al.The semiphosphorylative Entner-Doudoroff pathway in hyperthermophilic archaea:A re-evaluation[J].Biochemical Journal,2005,390(2):529-540.
[25] Han T K,Zhu Zhiwen,Dao M L.Identification,molecular cloning,and sequence analysis of a deoxyribose aldolase in streptococcus mutans GS-5[J].Current Microbiology,2004,48(3):230-236.
[26] Matthews L R,Vaglio P,Reboul J,et al.Identification of potential interaction networks using sequence-based searches for conserved protein-protein interactions or“Interologs”[J].Genome Research,2001,11(12):2120-2126.
MIAO Mengjun,DING Yanrui.PPI network alignment for study on carbohydrate metabolism of Lactobacillus Plantarum.Computer Engineering andApplications,2018,54(6):49-54.
MIAO Mengjun1,DING Yanrui2
1.School of Internet of Things,Jiangnan University,Wuxi,Jiangsu 214122,China 2.School of Digital Media,Jiangnan University,Wuxi,Jiangsu 214122,China
Protein-Protein Interaction network(PPI network)alignment is an important method for predicting proteinprotein interaction,and analyzing functional differences between different species.In this paper,in order to study the differences of the functional modules of the carbohydrate metabolism in Lactobacillus plantarum WCFS1 and JDM1,the PPI network of Glycolysis module,Pentose phosphate pathway module,Citrate cycle module in WCFS1 and JDM1 are aligned,by Evolutionary Graph Edit Distance Algorithm.Experiment shows that the Edge Correctness of three modules in WCFS1 and JDM1 reaches 93.6%,96%,100%,respectively.It indicates that the topological structure of the carbohydrate metabolism module is very similar.And in pentose phosphate pathway of WCFS1 and JDM1,finding that WCFS1 has protein 2-keto-3-deoxygluconate kinase(kdgK)and JDM1 only has its product 2-keto-3-deoxy-6-phospho-gluconate aldolase(JDM1_0578)no kdgK.In addition,in Glycolysis module,inferring protein pyruvate dehydrogenase complex,E2 component(pdhC)and protein pyruvate kinase(pyk)have interaction.The experimental results show that PPI network alignment can clarify the differences of the carbohydrate metabolism module,topological similarity and can predict the interaction between proteins by aligning the PPI network.
PPI network alignment;Lactobacillus plantarum WCFS1 and JDM1;carbohydrate metabolism functional modules
蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)(PPI網(wǎng)絡(luò))比對(duì)是預(yù)測(cè)蛋白質(zhì)相互作用,分析不同物種之間功能差異的重要手段。為研究植物乳桿菌WCFS1和JDM1糖代謝功能模塊差異,采用Evolutionary Graph Edit Distance Algorithm算法對(duì)兩者的糖酵解、戊糖磷酸途徑、檸檬酸循環(huán)三個(gè)模塊PPI網(wǎng)絡(luò)進(jìn)行比對(duì)。實(shí)驗(yàn)表明,兩者的三個(gè)模塊邊正確性分別達(dá)到93.6%、96%、100%,表明其拓?fù)浣Y(jié)構(gòu)極其相似,戊糖磷酸途徑中,WCFS1存在蛋白質(zhì)2-keto-3-deoxygluconate kinase(kdgK),但JDM1中沒(méi)有kdgK,卻有其產(chǎn)物2-keto-3-deoxy-6-phospho-gluconate aldolase(JDM1_0578)。糖酵解模塊中,推測(cè)蛋白質(zhì)pyruvate dehydrogenase complex,E2 component(pdhC)與pyruvate kinase(pyk)具有相互作用。實(shí)驗(yàn)表明,PPI網(wǎng)絡(luò)比對(duì)可以闡明兩者糖代謝PPI網(wǎng)絡(luò)的拓?fù)湎嗨菩约澳K差異,預(yù)測(cè)蛋白質(zhì)之間的相互作用。
PPI網(wǎng)絡(luò)比對(duì);植物乳桿菌WCFS1和JDM1;糖代謝功能模塊
2016-11-15
2017-01-04
1002-8331(2018)06-0049-06
book=54,ebook=59
A
TP399
10.3778/j.issn.1002-8331.1611-0279
國(guó)家自然科學(xué)基金(No.21541006)。
苗孟君(1991—),女,碩士研究生,研究領(lǐng)域?yàn)樯镄畔?,E-mail:15906197927@163.com;丁彥蕊(1976—),女,博士,教授,研究領(lǐng)域?yàn)樯镄畔ⅰ?/p>