何毅剛 石 鑫 于建平 王 婧 張亞男 劉宏斌 陳為凱
胃腸道間質(zhì)瘤(gastrointestinal stromal tumor,GIST)是胃腸道最常見的間質(zhì)腫瘤之一,約占所有軟組織肉瘤的20%[1]。GIST起源于Cajal的間質(zhì)細(xì)胞并可發(fā)生在胃腸道的任何部位,最常見的是胃約占GIST的50%~60%,其次是小腸約30%~35%、結(jié)腸和直腸約5%,最后是食管約<1%[2]。近年來,隨著KIT和PDGFRA基因被證實(shí)為GIST的可靠分子標(biāo)志物,確診為GIST的患者數(shù)量逐年增加。研究表明,約85%~90%的GIST存在KIT或PDGFRA突變即突變型GIST(MUT-GIST),余下為未發(fā)生KIT/PDGFRA突變的GIST即為野生型GIST(WT-GIST)[3]。目前,伊馬替尼作為小分子選擇性酪氨酸激酶抑制劑,已被廣泛應(yīng)用于GIST的綜合治療中。諸多研究表明,伊馬替尼治療GIST的療效取決于KIT/PDGFRA的基因突變,而對WT-GIST患者療效不佳,且關(guān)于WT-GIST患者遺傳改變的相關(guān)研究鮮有報(bào)道[4]。本研究通過對3個(gè)基因表達(dá)矩陣進(jìn)行聯(lián)合生物信息學(xué)分析,將WT-GIST與MUT-GIST樣本進(jìn)行對比,旨在探索調(diào)控WT-GIST發(fā)生、發(fā)展的關(guān)鍵基因,尋找診斷、治療WT-GIST的潛在分子標(biāo)志物及靶點(diǎn),為WT-GIST的診斷及治療提供新依據(jù)。
1.材料:基因表達(dá)數(shù)據(jù)來源于GSE17743、GSE20708和GSE132542 3個(gè)基因芯片,下載于美國國家生物技術(shù)中心(National Center for Biotechnology Information,NCBI)的基因表達(dá)綜合數(shù)據(jù)庫(Gene Expression Omnibus Database,GEO),且均基于GPL570平臺(Affymetrix Human Genome U133 Plus 2.0 Array; Thermo Fisher Scientific, Inc., Waltham, MA, USA)。其中GSE132542數(shù)據(jù)集包含29個(gè)GIST樣本,均為KIT基因突變樣本,由Amirnasr等[5]于2019年提交;GSE17743數(shù)據(jù)集包含29樣本,其中15個(gè)KIT基因突變樣本,11個(gè)PDGFRA基因突變樣本,3個(gè)WT-GIST樣本,由Ostrowski等[6]于2009年提交;GSE20708數(shù)據(jù)集包含22個(gè)GIST樣本,其中13個(gè)KIT基因突變樣本,5個(gè)PDGFRA基因突變樣本,4個(gè)WT-GIST樣本,由Astolfi等[7]于2010年提交。本研究將3個(gè)基因表達(dá)矩陣合并后共得到80個(gè)樣本的RNA表達(dá)數(shù)據(jù),將MUT-GIST設(shè)為對照組共73個(gè)樣本,將WT-GIST設(shè)為實(shí)驗(yàn)組共7個(gè)樣本。
2.基因表達(dá)數(shù)據(jù)預(yù)處理:3個(gè)芯片的原始數(shù)據(jù)下載后,將所得的CLE文件轉(zhuǎn)換為基因表達(dá)矩陣,并利用R軟件(3.4.4版本)的Affy包中的Robust多陣列平均算法對合并矩陣進(jìn)行歸一化處理;應(yīng)用Sva包去除批次效應(yīng);應(yīng)用pamr包繪制批次矯正前后基因密度圖及Q-Q plot圖;應(yīng)用prcomp函數(shù)對矩陣進(jìn)行主成分分析并應(yīng)用ggplot2包對分析結(jié)果進(jìn)行可視化處理;下載源自官方網(wǎng)站的Affymetrix Human Genome U133 Plus 2.0 Array最新版注釋文件HG-U133_Plus_2,將表達(dá)矩陣的探針名稱轉(zhuǎn)換為基因名稱。如果一個(gè)基因被多個(gè)探針匹配,則計(jì)算該基因的平均表達(dá)值。
3.差異基因篩選:應(yīng)用R軟件(3.4.4版本)的limma包進(jìn)行MUT-GIST和WT-GIST的DEGs篩選,并對fold change(FC)值進(jìn)行l(wèi)og2FC計(jì)算,以校正后P<0.05和|log2FC|>1為篩選標(biāo)準(zhǔn),得到兩組間的DEGs,并利用R軟件的pheatmap包繪制DEGs表達(dá)熱圖。
4.GO分析及KEGG富集分析:應(yīng)用DAVID數(shù)據(jù)庫(6.8版本,https:∥david.ncifcrf.gov/)以P<0.01為篩選標(biāo)準(zhǔn)對DEGs進(jìn)行GO分析,并應(yīng)用Cytoscape軟件的BiNGO插件進(jìn)行可視化網(wǎng)絡(luò)的繪制。應(yīng)用KOBAS數(shù)據(jù)庫(3.0版本,https:∥kobas.cbi.pku.edu.cn/download.php)以P<0.01為篩選標(biāo)準(zhǔn)對DEGs進(jìn)行KEGG分析[8,9]。
5.蛋白互作網(wǎng)絡(luò)繪制及子網(wǎng)絡(luò)篩選:應(yīng)用SRING數(shù)據(jù)庫(https:string-db.org)對DEGs進(jìn)行PPI繪制,對可信指數(shù)(confidence scores)≥0.4的網(wǎng)絡(luò)進(jìn)行篩選,并應(yīng)用Cytoscape軟件進(jìn)行可視化繪制(圖6),利用cytoHubba插件中的MCC算法,選取前25個(gè)基因?yàn)镠UBs。以默認(rèn)設(shè)置(degree cutoff=2, node score cutoff=0.2, k-core=2, max. depth=100)為篩選標(biāo)準(zhǔn),應(yīng)用MCODE插件進(jìn)行PPI子網(wǎng)絡(luò)的篩選。以MCODE評分≥6且節(jié)點(diǎn)數(shù)≥6為篩選標(biāo)準(zhǔn)篩選子網(wǎng)絡(luò),并將篩選后的子網(wǎng)絡(luò)組成基因納入HUBs。最后,利用DAVID和KOBAS數(shù)據(jù)庫對HUBs進(jìn)行GO分析和KEGG分析。
1.數(shù)據(jù)預(yù)處理與差異基因的篩選:批次效應(yīng)處理前后所有基因的表達(dá)量均符合正態(tài)分布。主成分分析 (PCA分析) 結(jié)果表明,數(shù)據(jù)質(zhì)量可靠,可進(jìn)行生物信息學(xué)分析(圖1A)。根據(jù)篩選標(biāo)準(zhǔn),與MUT-GIST組比較,WT-GIST組中共鑒定出628個(gè)DEGs,其中226個(gè)上調(diào)基因和402個(gè)下調(diào)基因,繪制DEGs的火山圖(圖1B)及熱圖(圖2)。
圖1 主成分分析及差異基因火山圖A.主成分分析是通過聚類分析表明樣本之間的相似程度,不同樣本在空間上距離越近,則說明樣本間的差異越小。所有的樣本可根據(jù)WT-GIST組和MUT-GIST組基本分開,說明兩組的樣本有可比性;B.MUT-GIST樣本與WT-GIST樣本基因分布的火山圖比較,紅色節(jié)點(diǎn)表示上調(diào)的DEGs,綠色節(jié)點(diǎn)表示下調(diào)的DEGs(log2FC≥1和P<0.05),黑色節(jié)點(diǎn)代表沒有顯著表達(dá)變化的基因
圖2 差異基因?qū)哟尉垲悷釄DA.腫瘤中差異高表達(dá)的基因熱圖;B.腫瘤中差異低表達(dá)的基因熱圖。水平軸表示樣本,垂直軸表示基因名,紅色代表上調(diào)的差異基因,綠色代表下調(diào)的差異基因
2.DEGs的GO分析:對226個(gè)上調(diào)基因和402個(gè)下調(diào)基因分別進(jìn)行GO分析。結(jié)果顯示,差異基因主要富集于細(xì)胞黏附、質(zhì)膜細(xì)胞黏附分子的異嗜性等生物過程,細(xì)胞表面、細(xì)胞外間隙、細(xì)胞外小體等細(xì)胞組成以及肝素結(jié)合、鈣離子結(jié)合、整合素結(jié)合等分子功能(圖3)。
圖3 差異表達(dá)基因的GO分析結(jié)果A.基于3個(gè)亞分類差異基因的GO聚類分析,不同顏色代表不同類別的功能聚類,綠色代表生物進(jìn)程(biological process),藍(lán)色代表細(xì)胞組分(cellular component),紫色代表細(xì)胞功能(molecular function)(P<0.01);B.基于P值差異基因的GO聚類分析,橫坐標(biāo)為聚類基因數(shù)目,縱坐標(biāo)為具體GO聚類注釋,顏色代表P值,紅色表示最小P值(P<0.01)
3.DEGs的KEGG分析:DEGs主要富集于細(xì)胞黏附分子(CAMS)、PI3K-Akt信號通路、瘧疾、神經(jīng)活性配體-受體相互作用、黑色素瘤、局灶性黏附、ECM-受體相互作用、肌動蛋白細(xì)胞骨架調(diào)控、cAMP信號通路、Rap1 信號通路、多巴胺能突觸、膽堿能突觸、癌癥通路、百日咳、長期抑郁、酗酒、NF-κB 信號通路、安非他明成癮、內(nèi)分泌抵抗、RAS信號通路、催乳素信號通路、可卡因成癮、胰島素抵抗、醛固酮合成和分泌、磷脂酶D信號通路、調(diào)節(jié)脂肪細(xì)胞脂解、谷氨酸能突觸、前列腺癌、血小板活化、催產(chǎn)素信號通路、AMPK 信號通路、膠質(zhì)瘤、晝夜節(jié)律、色氨酸代謝、膀胱癌、孕酮介導(dǎo)的卵母細(xì)胞成熟、雌激素信號通路、代謝通路、逆行內(nèi)源性大麻素信號轉(zhuǎn)導(dǎo)、系統(tǒng)性紅斑狼瘡、便血、胰島素信號轉(zhuǎn)導(dǎo)途徑、致心律失常性右心室心肌病(ARVC)、Toll樣受體信號通路、乙型肝炎、凝血功能、心機(jī)細(xì)胞腎上腺素能信號轉(zhuǎn)導(dǎo)、肌萎縮性側(cè)索硬化(ALS)、EGFR酪氨酸激酶抑制劑抗性等信號通路(圖4)。
圖4 基于P值差異基因的KEGG聚類分析橫坐標(biāo)為聚類基因數(shù)目,縱坐標(biāo)為具體KEGG聚類注釋,顏色代表P值,紅色表示最小P值(P<0.01)
4.蛋白互作網(wǎng)絡(luò)繪制及HUBs篩選:本研究以可信指數(shù)≥0.4為標(biāo)準(zhǔn),所得PPI網(wǎng)絡(luò)由489個(gè)節(jié)點(diǎn)和1033條連線構(gòu)成。于PPI網(wǎng)絡(luò)中共得到25個(gè)HUBs(圖5)并構(gòu)建PPI網(wǎng)絡(luò)(圖6),包括KLHL41、KBTBD8、FBXO4、KLHL13、FBXO6、FBXL16、CISH、HERC5、NEDD4L、SOCS2、ADCY3、PENK、GRIA2、HIST2H2BE、CCND1、GNAI1、GRIA1、GPR37、PTH1R、HIST1H2AC、HIST1H2BK、OPRK1、HTR7、ADM、ACKR3。GO分析結(jié)果表明,HUBs主要富集于“細(xì)胞外谷氨酸門控離子通道活性”等(表1)。KEGG分析結(jié)果表明,HUBs主要富集于“PI3K-Akt信號通路”、“癌癥通路”等(表2)。
KIT/PDGFRA基因突變是GIST的主要遺傳改變,且為近年來GIST分子靶向治療的唯一有效靶點(diǎn)。然而即便現(xiàn)已依據(jù) SDHB 基因的缺失表達(dá)衍生出諸多WT-GIST亞分類,但其尚缺乏臨床指導(dǎo)意義,單一手術(shù)切除及重復(fù)應(yīng)用既往獲益靶向藥物的治療模式仍未改變[10]。IGF1R曾被證實(shí)在WT-GIST 中特異性高表達(dá)并參與調(diào)控 PI3K/Akt/mTOR 信號通路,但因其抑制劑在臨床試驗(yàn)中并未令WT-GIST獲益而失去研究價(jià)值[11,12]。目前,關(guān)于MUT-GIST與WT-GIST間遺傳差異的研究鮮有報(bào)道。本研究通過生物信息學(xué)分析對MUT-GIST與WT-GIST間基因表達(dá)水平進(jìn)行探索,尋找WT-GIST的潛在分子標(biāo)志物及治療靶點(diǎn),從而為WT-GIST的診斷及治療提供新依據(jù)。
圖5 差異基因的蛋白質(zhì)互相作用網(wǎng)絡(luò)圖紅色節(jié)點(diǎn)代表上調(diào)基因,綠色節(jié)點(diǎn)代表下調(diào)基因。每個(gè)節(jié)點(diǎn)的大小表示每個(gè)基因鏈接的程度,線表示節(jié)點(diǎn)之間的相互作用關(guān)系
圖6 關(guān)鍵差異基因的蛋白質(zhì)相互作用網(wǎng)絡(luò)圖橙色代表關(guān)鍵差異基因,顏色深度代表基于MCC算法計(jì)算后的關(guān)鍵差異基因排序,綠色代表與關(guān)鍵基因具有相互作用關(guān)系的基因
表1 關(guān)鍵基因的GO分析結(jié)果
表2 關(guān)鍵基因的KEGG分析結(jié)果
本研究中共篩選出628個(gè)DEGs,其GO分析的結(jié)果顯示,DEGs主要參與Wnt信號通路的調(diào)節(jié)、生長因子活性的調(diào)控、轉(zhuǎn)化生長因子-β受體信號通路的調(diào)控、異型細(xì)胞-細(xì)胞黏附等重要過程,且主要分布于細(xì)胞外的區(qū)域。Wnt信號通路通過調(diào)節(jié)細(xì)胞周期、干細(xì)胞自我更新和上皮-間質(zhì)轉(zhuǎn)化等重要進(jìn)程,在腫瘤的發(fā)生、發(fā)展中發(fā)揮著重要作用[13,14]。研究表明,Wnt信號通路的激活是GIST發(fā)生、發(fā)展之必需,Shan等[15]研究發(fā)現(xiàn)Wnt通路抑制劑PKF118-310、XAV939、GK007-LK在不同的GIST模型中均具有顯著的抗腫瘤效果。筆者的研究共發(fā)現(xiàn)CCND1、SHISA2、SFRP4、CITED1、HIC1、DKK4 6個(gè)基因被富集于Wnt信號通路調(diào)節(jié)功能中(P=0.18)。Shan等研究發(fā)現(xiàn),GIST細(xì)胞Wnt信號通路的激活時(shí),CCND1的表達(dá)顯著增加。DKK4作為Wnt通路拮抗劑已被廣泛報(bào)道,Wang等[16]研究發(fā)現(xiàn),DKK4的表達(dá)量在高危險(xiǎn)度GIST中顯著上調(diào),同時(shí)認(rèn)為DKK4的表達(dá)與GIST預(yù)后不良密切相關(guān)。但本研究發(fā)現(xiàn)DKK4在WT-GIST樣本中顯著降低,這可能與KIT/PDGFRA的突變相關(guān),仍需進(jìn)一步驗(yàn)證。SHISA2、SFRP4、CITED1、HIC1是否參與了WT-GIST發(fā)生、發(fā)展的調(diào)控尚未有研究報(bào)道,這些基因?yàn)閃T-GIST的研究提供了新思路。DEGs的KEGG分析結(jié)果顯示,在WT-GSIT的發(fā)生、發(fā)展過程中,DEGs參與了PI3K-Akt、Rap1、細(xì)胞外基質(zhì)受體相互作用 (ECM-receptor interaction)、cAMP等重要信號通路的調(diào)節(jié)。研究表明,PI3K-Akt信號通路的激活與GIST伊馬替尼耐藥顯著相關(guān),且耐藥后PI3K-Akt-mTOR通路仍發(fā)生部分激活[17]。同時(shí),PI3K-Akt的激活還會促進(jìn)GIST細(xì)胞增殖并抑制其凋亡[18]。由此看來,調(diào)控PI3K-Akt信號通路的相關(guān)基因,將可能成為WT-GIST治療的潛在靶點(diǎn)。
研究還對628個(gè)DEGs進(jìn)行PPI繪制,并從中獲取了KLHL41、KBTBD8、FBXO4、KLHL13、FBXO6、FBXL16、CISH、HERC5等共25個(gè)HUBs。PENK是神經(jīng)遞質(zhì)腦啡肽的編碼基因,相對分子質(zhì)量為34kDa,位于人類染色體8q12.1上。它主要分布于細(xì)胞基質(zhì),也存在于細(xì)胞膜、細(xì)胞核和線粒體中。PENK是一種神經(jīng)遞質(zhì),編碼一種前體蛋白,其經(jīng)蛋白水解處理后可產(chǎn)生多種蛋白質(zhì)。PENK衍生肽作為神經(jīng)遞質(zhì)、神經(jīng)調(diào)節(jié)劑和神經(jīng)激素,具有阿片類活性并參與對壓力和疼痛的反應(yīng),有助于調(diào)節(jié)食欲和睡眠。此外,PENK基因還在幾個(gè)非神經(jīng)元組織中表達(dá),包括內(nèi)分泌腺,如腎上腺髓質(zhì)、免疫系統(tǒng)細(xì)胞和胚胎皮膚間充質(zhì)細(xì)胞。研究表明在胃腸道腫瘤中,PENK的酶產(chǎn)物阿片生長因子,已被證實(shí)為腫瘤抑制因子,并且OGF-OGF受體軸在胃腸道腫瘤的生長抑制過程中發(fā)揮重要作用[19]。Tang等[20]發(fā)現(xiàn),與高風(fēng)險(xiǎn)度GIST比較,低風(fēng)險(xiǎn)度和中風(fēng)險(xiǎn)度GIST組的PENK顯著高表達(dá),且與GIST的腫瘤直徑、有絲分裂計(jì)數(shù)顯著相關(guān)。同時(shí),PENK還與頭頸部惡性腫瘤等疾病密切相關(guān)[21]。本研究發(fā)現(xiàn)PENK在WT-GIST樣本中低表達(dá),與GAD1、NEFL、ADCY3、ACKR3、CDH2、OPRK1、GPR37、ADM、GNI1存在相互作用,共同參與調(diào)控WT-GIST的發(fā)生、發(fā)展。
FBXO4屬于F-box蛋白的FBXO亞家族,主要介導(dǎo)靶蛋白泛素化及蛋白酶體降解。FBOX4以兩種不同的方式識別兩種底物cyclin D1和Pin2。FBOX4介導(dǎo)cyclin D1的泛素化依賴于Thr-286殘基的磷酸化及與一種小的熱休克蛋白AB-晶狀體蛋白的相互作用,而Pin2的泛素化不需要磷酸化。FBOX4活性受到抑制后會導(dǎo)致細(xì)胞核cyclin D1的累積并發(fā)生致癌轉(zhuǎn)化,這可能是cyclin D1在人類惡性腫瘤疾病中過表達(dá)的重要原因[22]。在肝細(xì)胞癌中,F(xiàn)BXO4的表達(dá)水平顯著低于非腫瘤組織,在Sk-Hep1和NIH3T3兩株肝癌細(xì)胞系中,F(xiàn)bx4β、Fbx4γ、Fbx4δ 3個(gè)FBXO4的剪接變異體均在肝癌組織高表達(dá)并可促進(jìn)肝癌細(xì)胞增殖和遷移,破壞cyclin D1的降解[23]。本研究中,F(xiàn)BXO4在WT-GIST低表達(dá),與NEDD4L、KBTBD8、FBXL16、FBXO6、CCND1、HERC5、KLHL13、KLHL41存在相互作用關(guān)系,其在GIST相關(guān)領(lǐng)域尚未有研究報(bào)道,或可作為WT-GIST相關(guān)研究新的方向。
ACKR3為非典型趨化因子受體-3編碼基因,非典型趨化因子受體屬于A類G蛋白偶聯(lián)受體。CXCL12和CXCL11可與之相結(jié)合。自ACKR3蛋白作為HIV侵入的輔助受體被首次報(bào)道以來,諸多研究發(fā)現(xiàn)其可在許多病理生理進(jìn)程中發(fā)揮重要作用。研究表明,ACKR3在炎癥、感染、缺血相關(guān)的各種疾病中顯著上調(diào),重要的是,在許多惡性腫瘤如前列腺癌、腎癌、肝癌、子宮頸癌、腦癌、肺癌和乳腺癌中也檢測到了ACKR3的差異表達(dá)并參與調(diào)控疾病的發(fā)生、發(fā)展[24]。Gao等[25]研究發(fā)現(xiàn),ACKR3的高表達(dá)可促性肺癌細(xì)胞增殖、侵襲、遷移從而促進(jìn)腫瘤生長和轉(zhuǎn)移。Behnam等[26]研究發(fā)現(xiàn)ACKR3的過表達(dá)與肺癌患者的不良預(yù)后和生存期顯著相關(guān)。Li等[27]研究發(fā)現(xiàn),通過LPS-TLR4-MD-2信號通路可上調(diào)胃癌細(xì)胞中ACKR3的表達(dá),從而提高了胃癌細(xì)胞的增殖和遷移能力。胃癌組織中TLR4、MD-2和CXCR7的表達(dá)顯著高于癌旁組織。并發(fā)現(xiàn)TLR4、MD-2和CXCR7的表達(dá)水平與胃癌TNM分期和淋巴結(jié)轉(zhuǎn)移密切相關(guān)。本研究同樣發(fā)現(xiàn)在WT-GIST樣本中,ACKR3存在顯著差異表達(dá),并可與GNAI1、PENK、GPR37、ADCY1、OPRK1相互作用,參與WT-GIST的調(diào)控。可見ACKR3的高表達(dá)可能在消化道腫瘤中同樣發(fā)揮著重要作用。目前尚未有研究報(bào)道ACKR3與WT-GIST的關(guān)系,該基因可能成為未來WT-GIST的潛在診斷或治療靶點(diǎn)。
綜上所述,通過生物信息學(xué)分析,筆者發(fā)現(xiàn)與MUT-GIST樣本比較,在WT-GIST樣本中篩選出了628個(gè)DEGs,這些DEGs可能與GIST的發(fā)生、發(fā)展密切相關(guān)。此外,本研究還篩選出了25個(gè)HUBs,其中包括PENK、FBXO4及ACKR3等,并對其進(jìn)行了GO分析和KEGG分析。本研究存在一定局限性,所利用的3個(gè)基因芯片均未提供正常胃腸道組織基因表達(dá)數(shù)據(jù),無法識別GIST組織與正常組織間的差異基因,且研究結(jié)果需通過細(xì)胞及動物實(shí)驗(yàn)進(jìn)一步驗(yàn)證。以上結(jié)果可為未來GIST相關(guān)實(shí)驗(yàn)研究提供實(shí)驗(yàn)依據(jù)和方向,從而為GIST的臨床診斷和治療提供新策略。