杜 強,姚義勇,曾 剛
(南京醫(yī)科大學附屬蘇州醫(yī)院呼吸與危重癥醫(yī)學科,江蘇 蘇州 215008)
目前,肺癌的發(fā)病率和致死率在惡性腫瘤中位居首位。2018年全球腫瘤統(tǒng)計報告顯示,新發(fā)肺癌患者達210 萬,肺癌患者死亡人數(shù)為180 萬(約占癌癥死亡人數(shù)的1/5),其中東亞地區(qū)男性肺癌發(fā)病率全球最高,而女性患者發(fā)病率最高的是北美及歐洲等西方國家[1]。非小細胞肺癌是最常見的肺癌病理類型,占所有肺癌的85%,其中肺腺癌是最常見的非小細胞肺癌亞型,占比可達40%[2]。近年研究發(fā)現(xiàn),異常紡錘體樣小頭畸形相關基因(abnormal spindle-like microcephalyassociated gene,ASPM)參與神經(jīng)系統(tǒng)的發(fā)育、調(diào)節(jié)干細胞特性等功能[3]。此外,在神經(jīng)系統(tǒng)、消化系統(tǒng)、生殖系統(tǒng)等多種惡性腫瘤中,ASPM 表達水平較癌旁組織高,且高表達患者預后較差。但其影響腫瘤預后的分子作用機制不明確,此前報道可能通過調(diào)控細胞周期、p53、Wnt 等通路促進腫瘤的發(fā)生發(fā)展[4],目前ASPM在肺腺癌中的作用研究甚少,缺乏ASPM對肺腺癌患者生存預后影響及潛在機制方面的研究。本研究旨在通過生物信息學方法研究ASPM 在肺腺癌中表達情況、對肺癌預后的影響及可能的作用機制。
從TCGA 數(shù)據(jù)庫下載肺腺癌患者RNASeq-2GeneNorm 表達譜數(shù)據(jù)和相關臨床數(shù)據(jù)共585 例(數(shù)據(jù)截止更新日期為2016 年01 月28 日),其中肺腺癌515例,剔除資料不全的樣本,具有完整生存隨訪時間的肺腺癌病例共470 例,其中男性病人219 例,女性病人251例,具有配對的癌旁組織共計58例;主要臨床資料包括年齡、吸煙史、TNM分期及生存狀態(tài)等。
1.2.1 生存分析將肺腺癌患者按照ASPM 表達水平高低進行排序,以ASPM 表達水平中位數(shù)為界,分為低表達組和高表達組,使用SPSS 軟件中以Kaplan-Meier法分析患者的ASPM表達水平與生存期關系,進行l(wèi)og-rank 檢驗;并采用Cox 回歸模型分析影響預后的危險因素,計算風險比及95%置信區(qū)間,P<0.05為差異具有統(tǒng)計學意義。
1.2.2 差異基因篩選從TCGA 數(shù)據(jù)庫下載表達數(shù)據(jù),按照ASPM 表達水平的中位數(shù)為界,分為低表達組和高表達組,使用R語言中的ballgown及ggplot軟件包進行高低表達組間差異基因篩選[閾值設置:差異基因上調(diào)倍數(shù)(fold change,F(xiàn)C)≥1.3 或下調(diào)倍數(shù)≤0.8,P<0.05]。
1.2.3 差異基因GO 分析在DAVID 6.8 在線數(shù)據(jù)庫中(https://david.ncifcrf.gov/),對差異基因進行GO(gene ontology)分析(物種和背景均為Homo sapiens),主要涉及細胞組分(cellular component,CC)、生物過程(biological process, BP) 和 分 子 功 能(molecular function,MF)。
1.2.4 ASPM 相關的信號通路富集分析按照ASPM表達水平分高表達組和低表達組,使用GSEA4.0.3進行KEGG 信號通路分析,參數(shù)設置:Gene sets database:c2.cp.kegg.v7.1.symbols;Number of permutations:1 000 次;以|NES|>1,NOMP-value<0.05,F(xiàn)DRqvalue<0.25作為基因顯著富集的判斷標準。
1.2.5 蛋白交互網(wǎng)絡分析利用在線分析工具STRING(https://string-db.org/)預測差異蛋白間的相互作用,在STRING中輸入183個差異基因并分析,綜合評分≥0.7被認為是有意義的,繪制蛋白質(zhì)網(wǎng)絡分析圖[5],將STRING 得到的差異基因?qū)隒ytoscape 軟件中,利用Cytohubba 插件基于最大鄰域分量法(maximum neighborhood component,MNC)分析關鍵基因。
癌和癌旁組織表達差異基因采用R 語言分析(ballgown及ggplot軟件包);統(tǒng)計分析使用SPSS 21.0軟件;ASPM mRNA 在癌和癌旁組織表達水平的差異采用GraphPad Prism 7 軟件作圖,采用配對樣本t檢驗;ASPM mRNA 表達與肺腺癌患者臨床病理學特征的關系采用χ2檢驗;生存分析采用Kaplan-Meier 法及l(fā)og-rank檢驗;并運用Cox比例風險回歸模型分析影響患者預后危險因素,P<0.05為差異有統(tǒng)計學意義。
在TCGA 數(shù)據(jù)庫中具有完整資料的肺腺癌和匹配的癌旁組織共計58例,對其ASPM mRNA表達水平進行分析顯示癌組織表達水平明顯高于匹配的癌旁組織,且差異有統(tǒng)計學意義(P<0.05),見圖1。
圖1 癌和癌旁組織中ASPM的表達差異
通過篩選TCGA 數(shù)據(jù)庫中肺腺癌患者RNAseq 2GeneNorm 表達數(shù)據(jù)和相關臨床數(shù)據(jù),得到具有完整資料的腺癌病例470 例。采用卡方檢驗分析ASPM mRNA 表達與臨床相關指標如年齡(≤65 歲,>65 歲)、性別、吸煙史、T 分期、N 分期相關性。結(jié)果顯示,ASPM mRNA 表 達 與 年 齡(P=0.034)、性 別(P=0.026)、吸煙史(P=0.016)、T 分期(P=0.003)相關,即ASPM mRNA在≤65歲、男性、有吸煙史及T2~4期的人群中表達量高,與N分期(P=0.327)無明顯相關,見表1。
對470 例肺腺癌病例采用Kaplan-Meier 法及l(fā)ogrank 檢驗分析,結(jié)果顯示ASPM mRNA 表達水平高的肺腺癌患者的生存期短(P=0.002),見圖2。對影響因素進行單因素分析顯示年齡、性別、吸煙史與患者的生存期無明顯關系(P>0.05),而T 分期(P=0.004)、N 分期(P<0.01)與患者生存期相關,即T分期、N分期越晚總體生存率越低;進一步Cox 分析結(jié)果顯示N 分期[HR=2.313,95%CI(1.696,3.154),P<0.01)]、ASPM表達水平[HR=1.521,95%CI(1.114,2.076),P=0.008]均為影響肺腺癌預后的獨立危險因素。見表2。
表1 ASPM mRNA表達與臨床病理參數(shù)相關性
圖2 生存曲線ASPM高低表達組的生存曲線
表2 肺腺癌患者生存期預后影響因素的單因素和多因素分析
將470 例肺腺癌患者按照ASPM mRNA 表達水平分為高表達組和低表達組,使用R 語言中ballgown 及ggplot軟件篩選出差異基因183個,其中上調(diào)倍數(shù)≥1.3倍的有97 個,下調(diào)倍數(shù)≤0.8 的有86 個,P<0.01,根據(jù)上述數(shù)據(jù)構(gòu)建差異基因火山圖(圖3),列出其中表達差異最大的前10個基因(表3)。
圖3 差異基因的火山圖
利用DAVID 6.8軟件對183個差異基因進行GO富 集分析(數(shù)目≥4,P<0.05),將差異基因分為BP、CC和MF 3 個亞類(圖4)。在生物過程方面主要富集于蛋白質(zhì)分解、細胞信號轉(zhuǎn)導、細胞蛋白質(zhì)代謝過程、氧化應激反應等,在細胞組分方面,主要富集于細胞外間隙、細胞外區(qū)、細胞表面、蛋白質(zhì)細胞外基質(zhì)、核小體等,分子功能方面差異基因主要富集于鈣離子結(jié)合、絲氨酸型內(nèi)肽酶活性、激素活性、蛋白質(zhì)結(jié)合橋接、鈣依賴性蛋白結(jié)合方面。
按照ASPM mRNA 的表達量分為高表達組和低表達組,進行GSEA 分析發(fā)現(xiàn)有18條通路出現(xiàn)有意義富集(表4),|NES|>2 的富集通路有7 條(圖5),主要集中于卵母細胞減數(shù)分裂、細胞周期、孕酮介導的卵母細胞成熟、p53 信號通路、同源重組、一碳代謝及DNA復制。
表3 表達差異最明顯的前10個基因
圖4 GO功能富集分析
表4 KEGG信號通路富集分析
通過STRING 在線工具對差異基因進行分析,以綜合評分(high confidence)大于0.7 作為篩選標準構(gòu)建PPI網(wǎng)絡圖(圖6)。隨后將STRING獲取的節(jié)點數(shù)據(jù)導入Cytoscape 軟件中使用CytoHubba 插件篩選出關鍵基因4 個(圖7),分別為絲酶抑制蛋白家族D1 成員(serpin family D member 1,SERPIND1,MNC=7),纖維蛋白原β鏈(fibrinogen beta chain,F(xiàn)GB,MNC=7),纖維蛋白原α鏈(fibrinogen alpha chain,F(xiàn)GA,MNC=9),纖維蛋白原γ鏈(fibrinogen gamma chain,F(xiàn)GG,MNC=9)。
圖5 GSEA富集KEGG pathway基因集
圖6 差異表達蛋白的相互作用
圖7 蛋白相互作用中的關鍵基因
肺癌是全世界范圍內(nèi)發(fā)生率和死亡率最高的腫瘤,按病理可分為小細胞和非小細胞肺癌兩大類,其中85%以上都是非小細胞肺癌。盡管目前藥物和手術方式上都有了很大進展,但由于缺乏早期癥狀且轉(zhuǎn)移風險高,多數(shù)患者確診時已處于晚期,5 年生存率低于15%[6]。肺腺癌屬于非小細胞肺癌一種,是原發(fā)性肺癌中發(fā)生率最高的亞型,占到全部肺癌病例的40%且呈現(xiàn)持續(xù)上漲的趨勢[7]。多數(shù)肺癌患者確診時已進入進展期或者出現(xiàn)遠處轉(zhuǎn)移,失去了手術機會,放化療等成為主要的治療方式。腫瘤的發(fā)生發(fā)展是一個復雜的過程,包括原發(fā)部位脫落、細胞外基質(zhì)降解、侵犯周圍組織、進入血液及淋巴系統(tǒng)并最終形成一個新的病灶[8],涉及的機制眾多,常見的包括細胞周期、細胞凋亡、細胞自噬、免疫逃避及細胞信號轉(zhuǎn)導等[9],而發(fā)現(xiàn)新的分子標記物能夠讓腫瘤診斷窗口期前移,增加腫瘤患者手術治療機會,并能更準確評估患者預后。
本研究通過分析TCGA 數(shù)據(jù)庫中肺腺癌和癌旁組織臨床資料及mRNA 表達譜數(shù)據(jù),發(fā)現(xiàn)ASPM mRNA在肺腺癌組織中表達顯著上調(diào),其表達水平與年齡、性別、吸煙史、T 分期相關,進一步生存分析發(fā)現(xiàn)ASPM mRNA 表達水平、N 分期及T 分期與肺腺癌預后顯著相關,且ASPM mRNA 高表達組患者總體生存率顯著下降。進一步的多因素生存分析顯示ASPM 高表達是肺腺癌預后不良的獨立危險因素,可作為判斷腫瘤預后的標志物。
ASPM基因位于人類染色體1q31,編碼3 477 個氨基酸(蛋白410 kDa),由1個潛在的微管結(jié)合結(jié)構(gòu)域氨基末端、2個鈣調(diào)蛋白同源結(jié)構(gòu)域、81個異亮氨酸-谷氨酰重復序列和1 個未知功能的羧基末端組成,ASPM 蛋白以剪接異構(gòu)體的形式存在,包括124、164、218、250 和410 kDa,其中250 和410 kDa 富集于中心體和中間體,提示這兩種形式的剪接異構(gòu)體是ASPM蛋白的主要功能形式[10]。
最早發(fā)現(xiàn)ASPM 是參與神經(jīng)系統(tǒng)發(fā)育和腦體積增大中的關鍵蛋白[11],主要參與紡錘體的調(diào)節(jié)進而在有絲分裂過程中發(fā)揮作用,該基因突變會導致常染色體隱性原發(fā)性小頭[12]。隨著研究的深入,發(fā)現(xiàn)ASPM是一種干細胞標記物[13],并且在多種腫瘤細胞中高表達,如膠質(zhì)瘤、胰腺癌、卵巢癌和肝細胞癌組織[14-16]。在膠質(zhì)瘤中,ASPM 在腫瘤組織中表達升高[17],結(jié)果在體外實驗和大鼠成瘤實驗得到進一步驗證,且ASPM 的表達水平與腫瘤的分期和復發(fā)率密切相關,其可能機制是影響腫瘤干細胞的擴增。在胰腺導管腺癌中,Xiong等[18]研究者通過RT-PCR方法證實ASPM 在癌組織中高表達,且與腫瘤進展密切相關。在前列腺癌中,Pai 等[19]研究發(fā)現(xiàn)ASPM 可能通過激活Wnt 信號通路促進前列腺腫瘤進展。ASPM 首先與通路上游Dvl-3 相互作用增加β-catenin 穩(wěn)定性并抑制其降解,使細胞內(nèi)β-catenin 濃度增加,通過Wnt-Frizzled-Dvl3-βcatenin 信號傳導方式促進下游靶基因表達,敲低ASPM 后則相應出現(xiàn)侵襲增殖能力、克隆形成能力以及腫瘤細胞干性和成瘤能力的下降,由此可見ASPM 能夠促進前列腺癌進展。在侵襲性乳腺癌中,Shubbar等[20]研究發(fā)現(xiàn)只有ASPM和Cyclin B2與其相關存活率和臨床病理參數(shù)有關,兩者共同參與乳腺癌發(fā)生、發(fā)展,推測參與細胞周期調(diào)控有關,但詳細作用機制尚未闡明。
本文通過GO 分析發(fā)現(xiàn)ASPM 廣泛分布在細胞表面、胞質(zhì)內(nèi)及細胞核中,可能通過橋接作用、絲氨酸磷酸化等機制,參與蛋白質(zhì)分解、細胞間信號傳導等方面參與腫瘤的發(fā)生發(fā)展,通過PPI 網(wǎng)絡圖,本研究發(fā)現(xiàn)了與ASPM 有密切作用的4 個蛋白(SERPIND1、FGB、FGA、FGG),并分析了KEGG 信號通路,發(fā)現(xiàn)ASPM 參與的機制眾多,主要集中于細胞分化的早期階段,如DNA 復制、減數(shù)分裂及細胞周期等,提示ASPM 可以通過多個方面的分子機制共同促進腫瘤發(fā)展。
綜上所述,本研究利用生物信息學方法分析ASPM mRNA 在肺腺癌組織中高表達且與患者總體生存率呈負相關,是肺腺癌的一項新的獨立預后指標,SERPIND1、FGB、FGA、FGG 4 個蛋白是ASPM 起作用的關鍵分子,通過影響細胞發(fā)育的早期階段來促進肺腺癌進展,這些可以作為肺腺癌的潛在診斷和治療靶點。本研究局限性在于僅基于公共數(shù)據(jù)庫所提供的mRNA 表達水平分析,缺乏足夠的臨床樣本及細胞、動物實驗支持,本課題組后續(xù)將通過相關實驗研究進一步探索ASPM 在肺腺癌中的具體機制,為肺癌的診斷和治療提供一個新方向。