葛毅 劉爽 何超 李忻昊 徐清源 張雪
作者單位:佳木斯大學基礎醫(yī)學院,黑龍江 佳木斯 154000
OSCC 是臨床上常見的腫瘤,除酒精和煙草的使用外,近年來HPV感染也被確定為危險因素之一,口交性行為和接吻可能是導致口腔HPV感染的原因[1]。在我國不同地區(qū)HPV 陽性OSCC 占OSCC總數(shù)的比例也不盡相同,數(shù)據(jù)顯示,華南、華東和東北地區(qū)分別為20.8%(43/207)、11.7%(22/188)和5.51%(81/1470)[2~4]。對于HPV 陽性OSCC 的治療,早期HPV 陽性OSCC 患者進行單一的手術或放療,局部晚期患者需要二者同時進行,遠處轉移患者使用多西他賽聯(lián)合順鉑氟尿嘧啶誘導化療是標準治療方式[5]。目前正在進行有關西妥昔單抗的臨床試驗,評估并強化治療策略,以降低基于順鉑放化療相關的嚴重副作用[6]。因此對于中晚期HPV 陽性OSCC 患者治療效果不理想,迫切需要探究HPV感染導致OSCC 的發(fā)展機制。高危HPV 病毒過度表達E6、E7 癌蛋白與癌癥相關信號通路的激活有關,如E6/E7 導致細胞應答抗凋亡的特性與p53蛋白(Tumor protein 53,p53)和視網膜細胞瘤基因(Retinoblastoma,RB)的降解有關,也與雷帕霉素靶標(Mechanistic target of rapamycin,mTOR)信號通路有關[7]。E6 可滅活PDZ 蛋白(Post synaptic density protein-drosophila disk large tumor suppressor-zonula occludens-1 proteins,PDZ),同時激活磷酸肌醇3-激酶(Phosphoinositide 3-kinase,PI3K)/蛋白激酶B(Protein kinase B,Akt)、Wnt 和Notch 通路;E7 能激活PI3K/Akt 通路[8]。以上癌癥相關信號通路的激活,導致正常細胞發(fā)生癌變,促進腫瘤的發(fā)展。
對于OSCC 而言,HPV 可通過影響多個基因促進腫瘤發(fā)生。與HPV 陰性OSCC 相比,HPV 陽性OSCC 中c-MYC 基因表達量升高,錯配修復蛋白(MutL homologue-1,MLH1)表達量降低[9],二者可能參與了腫瘤信號通路。與HPV 陰性OSCC 細胞相比,HPV 陽性OSCC 細胞的過氧化物氧化蛋白2(Peroxiredoxin typical 2-Cys,PRDX2)表達上調,促進HPV 陽性OSCC 細胞的生長[10]。本研究從HPV 陽性OSCC 與HPV 陰性OSCC 的差異基因著手,篩選出HPV 介導OSCC 的關鍵基因,為探究HPV 介導OSCC 發(fā)展的分子機制及臨床治療方法提供新思路。
1.1 獲取數(shù)據(jù)集并進行差異分析通過NCBI 的GEO 數(shù)據(jù)庫[Home-GEO DataSets-NCBI(nih.gov)]得到本次分析需要的HPV 陽性OSCC 侵襲性上皮組織mRNA 芯片(GSE56142)的原始數(shù)據(jù),芯片樣本來源于2 個HPV 陰性原發(fā)性侵襲性OSCC 上皮組織樣本、2 個HPV 陰性正常上皮組織樣本、10 個HPV 陽性原發(fā)性侵襲性OSCC 上皮組織樣本和10個HPV 陽性正常上皮組織樣本。在芯片樣本中,選取2 個HPV 陰性原發(fā)性侵襲性OSCC 上皮組織樣本作為對照組,10 個HPV 陽性原發(fā)性侵襲性OSCC上皮組織樣本作為實驗組。數(shù)據(jù)集GSE56142 由英國劍橋大學提供,數(shù)據(jù)集的差異分析使用GEO2R在線分析工具[GEO2R-GEO-NCBI(nih.gov)]。以P<0.05 且|logFC|>1.5 為標準進行篩選。將此數(shù)據(jù)進行下載后,利用R 語言進行數(shù)據(jù)轉換并繪制熱圖和火山圖。
1.2 蛋白質互作網絡與信號通路的構建使用STRING[STRING:functional protein association networks(string-db.org)]數(shù)據(jù)庫對蛋白質之間互作網絡進行分析,使用Cytoscape(版本3.8.2)軟件繪制基因互作網絡。
1.3 基因的功能富集分析使用R 語言(版本4.0.1)進行GO(Gene ontology)和KEGG(Kyoto encyclopedia of genes and genomes)富集分析,利用Graph Pad Prism 8 軟件繪制柱形圖。
1.4 基因在染色體的定位使用NCBI 的基因組數(shù)據(jù)瀏覽器(Genome data viewer,GDV)進行基因在染色體上位置關系的查找,并利用Mapchart 軟件(版本2.32)繪制差異基因的位置。
1.5 生存曲線的繪制使用基于基因表達水平值的交互式分析平臺(Gene expression profiling interactive analysis,GEPIA)分析關鍵基因在高表達與低表達時對癌癥患者生存時間的影響,并繪制生存曲線。
2.1 HPV 陽性OSCC 與HPV 陰性OSCC 差異基因的篩選使用GEO2R 在線分析工具對GSE56142數(shù)據(jù)集進行差異基因分析,得到80 個差異顯著的基因,利用R 語言繪制熱圖(見圖1),將全部的差異基因繪制火山圖(見圖2)。熱圖中GSM1356635 和GSM1356629 為HPV 陰性OSCC 對照組,其他變量為HPV 陽性OSCC 實驗組,熱圖表明HPV 陽性和HPV 陰性OSCC 的基因表達量存在差異?;鹕綀D表明,與HPV 陰性OSCC 相比,HPV 陽性OSCC 下調的基因有69 個,上調的基因有11 個。
圖1 HPV 陽性與陰性OSCC 差異基因的熱圖
圖2 HPV 陽性與陰性OSCC 差異基因的火山圖
2.2 關鍵基因互作網絡的構建使用STRING 數(shù)據(jù)庫對80 個差異顯著的基因構建蛋白質互作網絡,并將此數(shù)據(jù)導入Cytoscape 軟件。其中,有50 個基因可形成大范圍基因相互作用的關系(見圖3),可能是HPV 影響OSCC 發(fā)生的關鍵基因。
圖3 HPV 介導OSCC 形成的基因互作網絡中的50 個基因
2.3 50 個關鍵基因的功能富集分析使用R 語言對關鍵基因進行GO 和KEGG 富集分析,利用Graph Pad Prism 8 軟件進行整理繪制柱形圖。GO 富集結果顯示:關鍵基因聚集在生物學過程中的中性粒細胞介導的免疫、中性粒細胞激活、對傷害反應的調節(jié)等;細胞組分中的肌節(jié)、肌原纖維和收縮纖維等;分子功能中的肌動蛋白結合、肽鏈內切酶活性和生長因子受體結合等信號通路(見圖4)。KEGG 富集到的信號通路為蛋白聚糖參與癌癥進展、唾液的分泌和流體剪切應力與動脈粥樣硬化等(見圖5)。其中,蛋白聚糖參與癌癥進展和唾液分泌的信號通路所參與的基因數(shù)量最多。蛋白聚糖參與癌癥的信號通路富集金屬蛋白酶組織抑制劑3(Tissue inhibitor of metalloproteinase 3,TIMP3)、HBEGF、凝血酶敏感蛋白-1(Thrombospondin-1,THBS1)、CAV1、FLNC。唾液分泌的信號通路富集CALML5、視網膜細胞瘤基因1(Retinoblastoma 1,PRB1)、視網膜細胞瘤基因2(Retinoblastoma 2,PRB2)、富酪蛋白(Statherin,STATH)和惡性腦腫瘤1(Deleted in malignant brain tumours 1,DMBT1)。
圖4 50 個關鍵基因GO 富集分析圖
圖5 50 個關鍵基因KEGG 信號通路富集圖
2.4 HPV 介導的OSCC 中50 個關鍵基因的染色體定位通過GDV 查詢,關鍵基因大多聚集在7 號染色體上,而13、17、18 號和XY 染色體上沒有關鍵基因的分布(見圖6、7)。在7 號染色體上聚集到的關鍵基因分別為AGR2(Anterior gradient 2)、周期蛋白依賴性激酶(Cyclin-dependent kinase 6,CDK6)、SAMD 家族蛋白9(Sterile α motif domain containing 9,SAMD9)、電壓門控鈣離子通道(Voltage-gated Ca2+channels,CAV1)、細絲蛋白C(Filamin C,F(xiàn)LNC)和催乳素誘導蛋白(Prolactin-inducible protein,PIP),這些基因與癌癥的發(fā)生有關。
圖6 不同染色體上含50 個關鍵基因的數(shù)量
圖7 50 個關鍵基因的染色體定位
2.5 50 個關鍵基因的不同表達量對頭頸部鱗狀細胞癌總生存的影響使用GEPIA 在線工具對關鍵基因繪制生存曲線,搜索并匯總有關頭頸部鱗狀細胞癌(Head and neck squamous cell carcinoma,HNSCC)的數(shù)據(jù)。其中,以log rankP<0.05 進行篩選并進行排序,log rankP<0.05 表明該基因在高表達或低表達時與患者的生存率有關,共篩選出14個基因(見表1)。將前兩個基因繪制生存曲線(見圖8)。圖中表明高表達鈣調素蛋白5(Calmodulinlike protein 5,CALML5)患者生存時間優(yōu)于低表達CALML5 患者,低表達肝素結合表皮生長因子(Heparin-binding EGF-like growth factor,HBEGF)患者生存時間優(yōu)于高表達HBEGF 患者。
表1 關鍵基因在不同表達量下對患者生存的影響
2.6 上調和下調的前3 個基因與影響生存時間的基因交集為找出50 個互作網絡中可能對HPV 陽性OSCC 的發(fā)展具有較大作用的基因,從50 個互作網絡基因中找出上調的前3 個基因與下調的前3 個基因(見表2),分別將上調和下調的前3 個基因與影響患者生存時間的14 個基因取得交集,得到CALML5和脂質運載蛋白(Lipocalin-1,LCN1)兩個基因。
表2 關鍵基因中上調和下調的前3 個基因
HPV 在影響OSCC 惡性進展過程中,相比于其他基因,CALML5 和LCN1 兩個基因的影響較大。利用GEPIA 數(shù)據(jù)庫找到CALML5(見圖8A)和LCN1 不同表達量下HNSCC 患者生存曲線(見圖9)。生存曲線顯示LCN1 在高表達時患者生存時間優(yōu)于低表達時,表明LCN1 可能抑制HPV 陽性OSCC 的惡性進展。最后,利用Cytoscape 軟件找出與CALML5、LCN1 相互作用的相關基因(見圖10)。
圖8 關鍵基因不同表達量下HNSCC 患者總生存曲線
圖9 LCN1 的生存曲線
圖10 與CALML5、LCN1 相互作用的基因
口腔癌是世界上第11 位最常見的惡性腫瘤[17],HPV感染是OSCC 比例上升的原因之一:在上世紀80年代的美國,只有16%的OSCC 為HPV 陽性,而在本世紀初,大約73%的OSCC 為HPV 陽性[18]。HPV 促進癌癥的發(fā)生主要是通過E6、E7 對病毒基因組的保護并促進宿主細胞進入S 期[19]。目前,HPV 陽性OSCC 患者主要通過p16 高表達確診[20],本研究通過GEO2R 在線分析工具得到了HPV 陽性OSCC 與HPV 陰性OSCC 的差異基因,利用STRING 數(shù)據(jù)庫構建關鍵基因互作網絡,分析了關鍵基因的染色體定位,利用GEPIA 在線分析工具繪制了關鍵基因分別在高、低表達量下對HPV 陽性OSCC 患者生存時間的影響。
KEGG 分析結果顯示:蛋白聚糖參與癌癥進展和唾液分泌的信號通路所參與的基因數(shù)量最多。在蛋白聚糖參與癌癥的信號通路中,TIMP3 與細胞外基質結合,抑制OSCC 細胞生長、血管生成、遷移和侵襲。TIMP3 通過增加上皮標記物的表達和減少間充質標記物的表達來調控上皮-間充質轉化,對OSCC 的發(fā)生具有抑制作用[21]。在晚期HNSCC患者中,若HBEGF 和環(huán)氧化酶2(Cyclooxygenase-2,COX-2)的表達量增高,則復發(fā)率較高,并參與順鉑耐藥。順鉑耐藥的抗性是通過增加HBEGF 和COX-2 的表達實現(xiàn)的。表皮生長因子(Epidermal growth factor,EGF)或檳榔提取物激活AKT 信號通路,由AKT 信號通路上調COX-2 的表達,再由COX-2 上調HBEGF 的表達,且呈現(xiàn)前列腺素E2(Prostaglandin E2,PGE2)的依賴性。在HNSCC 患者的組織樣本中,COX-2 與HBEGF 的表達呈顯著正相關[22]。來自OSCC 外泌體中的THBS1 參與了M1 巨噬細胞的極化,促進OSCC 的惡性進展[23]。CAV1 和FLNC 基因在7 號染色體上同樣參與癌癥的進展。
在唾液分泌的信號通路中,5 個基因都參與了腫瘤的進展。研究表明,CALML5 在HPV 陽性口咽癌中出現(xiàn)了甲基化,表明CALML5 可能是篩查HPV陽性口咽癌的替代方法[24]。HPV16 E7 癌蛋白在體內外通過PRB 泛素化而降解,導致PRB 結合到E2F(Early 2 factor)轉錄因子的量減少,又由于細胞周期蛋白依賴性激酶4/6(Cyclin-dependent kinases 4/6,CDK4/6)使PRB 與E2F 解離,E2F 轉錄因子釋放量增多,使E2F 轉錄出的Cyclin E、Cyclin A 增多,迫使細胞提前進入S 期,從而導致細胞癌變[25,26]。PRB1抑制細胞周期進程,激活干擾素應答基因,增強對免疫治療的敏感性,HPV E7 癌蛋白破壞PRB1 從而逃避免疫監(jiān)視[27]。在人視網膜上皮細胞中PRB2和p130 主要分布在細胞質中,而纖溶酶原激活物抑制劑-2(Plasminogen activator inhibitor type-2,PAI-2)則主要聚集在細胞核中。慢性孕酮的暴露可誘導PRB2/p130 在核亞細胞定位重排,PRB2/p130 與PAI-2 位于細胞核共同的免疫定位,導致細胞在G2/M 期聚集,顯著減少壞死,有利于凋亡的激活[28]。在口腔癌癌變前期以及口腔癌患者的唾液中,STATH 蛋白的表達水平降低[29]。DMBT1 基因被認為是腦癌、食管癌、胃癌、結直腸癌和肺癌的潛在抑癌基因,也是OSCC 的抑癌基因,DMBT1 在大約半數(shù)的OSCC 組織中表達下調或缺失[30]。
關鍵基因大多聚集在 7 號染色體,其中AGR2在起源于舌根的腫瘤細胞中表達[25]。過表達CDK6與OSCC 的發(fā)生發(fā)展和非發(fā)育不良上皮細胞的癌變密切相關[26]。在人角質形成細胞中,SAMD9 與低危HPV E6 相互作用,可能抑制低危HPV 病毒的復制[27]。在原發(fā)性OSCC 組織中,相比于低表達CAV1 患者,高表達CAV1 患者的預后較差。CAV1可激活OSCC 細胞的轉移和侵襲能力,尤其是在淋巴結轉移情況下表達,預示OSCC 的預后較差[28]。多形性膠質母細胞瘤(Glimoblastoma,GBM)中FLNC的表達量增加,與細胞侵襲性呈正相關,與遷移無關,并與患者預后不良相關[29]。PIP 通過AKT/絲裂原活化蛋白激酶(Mitogen-activated protein kinase,MAPK)信號通路抑制OSCC 細胞的增殖、遷移和侵襲[30]。
分析關鍵基因的不同表達量對HNSCC 患者生存時間的影響,共獲得CALML5、HBEGF 和MYL2等14 個對患者生存時間影響較大的基因??傮w而言,可查詢到多數(shù)基因對于癌癥的發(fā)生有顯著影響。在這14 個基因中,部分基因可以促進多種癌癥的發(fā)生,如HBEGF 表達量升高增加胃癌細胞侵襲和遷移性[31],且HBEGF 在卵巢癌、乳腺癌、黑色素瘤和膠質母細胞瘤中表達量顯著升高,HBEGF 也可激活EGFR 和細胞外調節(jié)蛋白激酶(Extracellular regulated protein kinases,ERK)的信號通路。目前臨床上已經采用針對HBEGF 治療癌癥的方法:白喉毒素突變體蛋白(Cross-reacting material 197,CRM197)與HBEGF 結合,抑制HBEGF 與EGF 的結合,阻斷有絲分裂活性,紫杉醇促進HBEGF 外域脫落,因此臨床上聯(lián)合CRM197 和紫杉醇進行治療[32]。有的基因影響免疫系統(tǒng)活性:NT5E 由CD73(Cluster of differentiation 73)編碼,在健康器官和組織中執(zhí)行許多穩(wěn)態(tài)功能,作為抑制性免疫檢查點分子,NT5E 產生的游離腺苷抑制細胞免疫反應,從而促進腫瘤細胞的免疫逃逸[33,34]。當然,有一些基因還未在癌癥的發(fā)生發(fā)展過程中進行實驗研究,如通過生物信息學表明LCN1 可能是一個潛在的預測乳腺癌的生物標志物,但未進行實驗驗證[35]。在未來的研究中,可以嘗試分析這些基因在癌癥發(fā)展中的機制。
本研究使用GEO 數(shù)據(jù)庫中的HPV 陽性與陰性OSCC 芯片,篩選出HPV 介導OSCC 的關鍵基因,并對其進行功能富集分析和生存曲線的繪制,得到了CALML5、HBEGF 和MYL2 等潛在的治療靶點。但本研究并未進行實驗驗證,因此,需要我們將來對癌癥產生的分子機制、潛在的治療靶點通過體內/體外實驗進行驗證,通過更進一步的研究,闡明HPV介導OSCC 的發(fā)展機制,為臨床治療提供新思路。