沈琦瑋 鐘宗燁
(1 復旦大學附屬中山醫(yī)院手術室,上海市 200032;2 上海市老年醫(yī)學中心手術室,上海市 201100;3 復旦大學附屬中山醫(yī)院康復醫(yī)學科,上海市 200032)
軟骨肉瘤是常見的惡性原發(fā)性骨腫瘤,占骨骼系統惡性腫瘤的1/3,發(fā)病人群以20~60歲成年人為主[1]。軟骨肉瘤的年發(fā)病率為0.2/100 000,常發(fā)生在骨盆、股骨和肱骨等部位[2]。軟骨肉瘤的遠處轉移風險較高,故大多數患者預后不良。軟骨肉瘤細胞對放療和化療幾乎不敏感,外科手術是目前唯一有可能治愈軟骨肉瘤的方法[3]。目前軟骨肉瘤的發(fā)病機制尚未完全闡明,尋找有意義的調控基因及信號通路,對預防及治療軟骨肉瘤具有重大意義。
雖然已有很多研究探索單個分子與軟骨肉瘤的關系[3-5],但是軟骨肉瘤的進展過程涉及多種基因,并且這些基因的表達變化會影響其他相關基因,產生相互作用?;蛐酒夹g是一種高通量檢測手段,可同步檢測上萬個分子的表達水平,是探究基因之間相互作用的新方法[6]。因此,本研究利用人類軟骨肉瘤基因芯片數據集,通過生物信息學技術分析軟骨肉瘤的關鍵基因及可能的發(fā)病機制,探索其診療靶點,為該病的早期診斷、早期干預提供新思路。
1.1 基因芯片數據集的收集 從GEO數據庫(https://www.ncbi.nlm.nih.gov/geo/)下載兩個人類軟骨肉瘤相關基因芯片數據集GSE48418、GSE30835。其中,GSE48418數據集共6例樣本,包括3例軟骨肉瘤患者樣本和3例健康對照者樣本;GSE30835數據集共27例樣本,根據所需組織樣本類型,本研究選擇其中的14例軟骨肉瘤患者樣本和4例健康對照者樣本。GSE48418、GSE30835均是Illumina公司的產品,芯片平臺號分別是GPL10558和GPL6884。
1.2 數據處理和差異表達基因分析 應用R語言軟件(V3.6.3)中的sva包去除數據間的批次效應,并標注軟骨肉瘤組和健康組。應用R語言軟件中的limma包進行差異表達基因(differentially expressed genes,DEGs)分析,并對結果去重。以|log2FC|≥1且調整后P值<0.05作為DEGs的篩選條件。應用R語言軟件中的ggplot2包繪制火山圖,然后應用VennDiagram包對從兩個數據集篩選出的DEGs取交集并制作韋恩圖,獲得共同DEGs。
1.3 富集分析 針對共同DEGs,利用DAVID數據庫(https://www.david.ncifcrf.gov)進行基因本體論(Gene Ontology,GO)功能富集分析和京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析,以調整后P值<0.05表示有統計學意義。使用R語言軟件中的ggplot2包,根據分析結果繪制氣泡圖。
1.4 蛋白質-蛋白質相互作用網絡的構建和關鍵基因的篩選 將共同DEGs導入STRING數據庫(https://cn.string-db.org),設置篩選條件為置信度≥0.15、相互作用最大值=0,分析各DEGs之間的關系。將STRING數據庫的運算數據導入Cytoscape軟件(版本:3.8.0)進行可視化處理,構建蛋白-蛋白相互作用(protein-protein interaction,PPI)網絡。應用Cytoscape軟件中的MCODE模塊,在保持自有系數的基礎上發(fā)掘關系緊密的集團,再運用cytoHubba插件中的連接度模式篩選出前10個關鍵基因。
2.1 DEGs的篩選結果 在GSE48418數據集中篩選出2 587個DEGs,其中表達上調的基因有1 283個,表達下調的基因有1 304個;在GSE30835數據集中篩選出284個DEGs,其中表達上調的基因有125個,表達下調的基因有159個,見圖1。兩個數據集的共同DEGs有62個,包括28個表達上調的DEGs和34個表達下調的DEGs,見圖2。
圖1 DEGs分析結果
圖2 韋恩圖
注:A為GSE48418數據集,B為GSE30835數據集。圖中綠色圓點代表表達下調的DEGs,紅色圓點代表表達上調的DEGs,灰色圓點代表表達無差異的基因。
2.2 富集分析結果 GO功能富集分析結果顯示,共同DEGs富集在細胞與基質黏附、細胞與基質黏附的調節(jié)、肌細胞遷移、小梁形態(tài)發(fā)生、小梁組成等生物學過程,富集在含膠原的細胞外基質(extracellular matrix,ECM)、內質網腔、膠原三聚體等細胞組分,涉及糖胺聚糖結合、ECM結構成分提供的抗壓支持、含硫化合物結合等分子功能,見圖3。KEGG通路富集分析結果顯示,DEGs與黏著力、磷脂酰肌醇-3-激酶(phosphoinositide-3-kinase,PI3K)/蛋白激酶B(protein kinase B,AKT)、ECM-受體相互作用、糖尿病并發(fā)癥中的晚期糖基化終末產物(advanced glycation end product,AGE)-AGE受體(receptor for AGE,RAGE)、蛋白質消化與吸收等信號通路相關,見表1。
表1 共同DEGs的KEGG通路富集分析結果
圖3 共同DEGs的GO功能富集分析結果
注:僅展現前5個條目。BP為生物學過程,由上而下分別為細胞與基質黏附、細胞與基質黏附的調節(jié)、肌細胞遷移、小梁形態(tài)發(fā)生、小梁組成;CC為細胞組分,由上而下分別為含膠原的ECM、內質網腔、膠原三聚體、ECM組分、膠原三聚體復合物;MF為分子功能,由上而下分別為糖胺聚糖結合、ECM結構成分、含硫化合物結合、肝素結合、ECM 結構成分提供的抗壓支持。
2.3 PPI網絡及關鍵基因 PPI網絡由39個節(jié)點和69條邊組成,見圖4A。根據連接度篩選出前10個關鍵基因,包括Ⅰ型膠原蛋白α1鏈(collagen type Ⅰ alpha 1 chain,COL1A1)、Ⅲ型膠原蛋白α1鏈(collagen type Ⅲ alpha 1 chain,COL3A1)、卵泡抑素樣蛋白1(follistatin-like protein 1,FSTL1)、凝血酶敏感蛋白2(thrombospondin 2,THBS2)、Ⅳ型膠原蛋白α4鏈(collagen type Ⅳ alpha 4 chain,COL4A4)、細胞周期蛋白D1(cyclin D1)、細胞骨架相關蛋白4(cytoskeleton-associated protein 4,CKAP4)、膠原三螺旋重復蛋白1(collagen triple helix repeat containing protein 1,CTHRC1)、Ⅷ型膠原蛋白α1鏈(collagen type Ⅷ alpha 1 chain,COL8A1)、尿激酶型纖溶酶原激活因子(plasminogen activator,urokinase,PLAU),見圖4B。
圖4 共同DEGs的PPI網絡及關鍵基因篩選結果
軟骨肉瘤是一種起源于軟骨的惡性骨腫瘤,主要影響股骨、骨盆、膝關節(jié)和脊柱的軟骨細胞,其發(fā)病機制和病因尚未被完全闡明[7]。探尋軟骨肉瘤的生物標志物和分析其發(fā)病機制有助于疾病的預防、早診斷、早治療及預后判斷。
本研究通過分析基因芯片數據集獲取軟骨肉瘤的62個DEGs,包括28個表達上調基因和34個表達下調基因。GO功能富集分析結果顯示,上述DEGs富集在細胞與基質黏附、細胞與基質黏附的調節(jié)等生物學過程,富集在含膠原的ECM、內質網腔等細胞組分,涉及ECM結構成分提供的抗壓支持、糖胺聚糖結合等分子功能。KEGG通路富集分析結果顯示,上述DEGs富集的主要信號通路包括PI3K/AKT信號通路、 ECM-受體相互作用信號通路等。軟骨肉瘤的ECM主要由纖維狀膠原蛋白組成,且糖胺聚糖是ECM的重要組成成分。既往研究顯示,軟骨肉瘤細胞是通過腫瘤內部和周圍ECM的降解來侵入正常組織[8]。ECM的分解代謝反應在軟骨肉瘤的發(fā)病過程中占主導地位,主要與ECM蛋白的損失及軟骨破壞有關[9]。在軟骨肉瘤中,PI3K/AKT/糖原合成酶激酶3β信號通路和Scr信號通路被異常激活,且兩種通路可相互作用[10]。楊鵬[11]發(fā)現,基質細胞衍生因子1/趨化因子受體4信號通路可以通過PI3K/AKT信號通路增強Survivin的表達,從而調控軟骨肉瘤細胞周期和上皮-間質轉化。由此可見,相關DEGs可通過調控ECM代謝及PI3K/AKT信號通路來參與軟骨肉瘤的發(fā)生。
本研究通過構建PPI網絡,篩選出COL1A1、COL3A1、FSTL1、THBS2、COL4A4、cyclin D1、CKAP4、CTHRC1、COL8A1及PLAU這10個與軟骨肉瘤相關的關鍵基因。其中,COL1A1是一種蛋白質編碼基因,主要生成Ⅰ型膠原,在骨、真皮和肌腱中高表達。COL1A1已被發(fā)現在多種惡性腫瘤中高表達,例如胃腺癌組織[12]、肝細胞癌組織[13]等。FSTL1與心血管疾病、癌癥、關節(jié)炎、肺纖維化和肥胖等多種疾病相關,可以作為評估病情的標志物,并具有作為治療靶點的潛在價值[14]。FSTL1可以促使腫瘤侵襲,在促進腫瘤細胞轉移中具有重要作用。THBS2主要參與細胞遷移的調節(jié)及腫瘤血管生成過程,在肺癌、胃癌等多種惡性腫瘤的發(fā)生和發(fā)展中具有重要作用[15]。Romeo等[16]發(fā)現COL4A4會干擾軟骨的分化。有學者發(fā)現,硒可通過miR-29a-3p靶向調控靶基因COL4A2,從而促進雞肝癌細胞的轉移和侵襲[17]。cyclin D1則是已明確的癌基因[18],與腫瘤的侵襲和轉移有關[19]。cyclin D1在高級別中央軟骨肉瘤中低表達,可反映腫瘤細胞周期進程和細胞黏附功能的受損情況[16]。肝內膽管細胞癌患者體內的CKAP4表達增加,CKAP4表達水平與病灶大小、轉移程度及TNM分期有關[20]。CTHRC1在胃癌、黑色素瘤、口腔癌等實體瘤中過表達,并在腫瘤發(fā)生和轉移中起到重要作用[21]。COL3A1在胃癌的發(fā)生、發(fā)展中發(fā)揮了重要作用,敲減該基因可有效抑制胃癌細胞的增殖、侵襲及遷移[22]。COL8A1參與胃癌前病變進展為胃癌的過程,并可促進胃癌細胞增殖[23]。有學者發(fā)現,PLAU在宮頸癌中過度表達,敲減該基因可以抑制宮頸癌細胞的遷移和侵襲,是宮頸癌治療的潛在靶點[24]。由此可見,上述多種關鍵基因與腫瘤的惡性生物學行為有關,可能在軟骨肉瘤的發(fā)生、發(fā)展中起到重要作用。
綜上所述,COL1A1、FSTL1、THBS2及cyclin D1等基因對軟骨肉瘤的發(fā)生有重要作用,其可能通過調控ECM代謝和PI3K/AKT等信號通路來參與軟骨肉瘤的發(fā)生。這些基因與信號通路可為軟骨肉瘤的診治提供新方向,值得深入研究。