龔藝貞,鄧騰,廖錫文,王向坤,馬輝△
1 廣西醫(yī)科大學第一附屬醫(yī)院結直腸肛門外科 廣西南寧 530021
2 廣西醫(yī)科大學附屬腫瘤醫(yī)院神經外科 廣西南寧 530021
3 廣西醫(yī)科大學第一附屬醫(yī)院肝膽外科 廣西南寧 530021
2018年全球癌癥數(shù)據(jù)統(tǒng)計顯示新發(fā)結直腸癌(colorectal cancer,CRC)病例超過180萬例,死亡人數(shù)超過86萬例,約占全部癌癥病例和死亡人數(shù)的10%,CRC在癌癥發(fā)病率中排名第三,在死亡率中排名第二[1]。與許多其他癌癥一樣,CRC被視為一種異質性疾病,遺傳變異、細胞環(huán)境和外部環(huán)境影響與腫瘤的發(fā)生、發(fā)展和轉移相關[2]。超過60%的CRC發(fā)生在結腸[3],結腸癌與直腸癌的病因并不一樣[1,3-5],所以二者的發(fā)病機制也可能不同,結腸癌中最常見的病理類型是結腸腺癌(colon adenocarcinom,COAD)。既往的多項研究已經描述了幾種潛在的機制,包括多種分子改變,它們參與結腸直腸癌發(fā)生和進展過程[6-8]。但目前未有研究對全基因組參與的結腸腺癌發(fā)病機制進行較為系統(tǒng)的分析,本研究通過分析癌癥基因圖譜(the cancer genome atlas,TCGA)數(shù) 據(jù) 庫(https://cancergenome.nih.gov/)中COAD的全基因組RNA測序數(shù)據(jù)集中癌組織和癌旁正常結腸組織的GSEA分析即富集分析(Gene set enrichment analysis,GSEA),探索結腸腺癌的發(fā)病機制,現(xiàn)報告如下。
本研究使用TCGA數(shù)據(jù)符合TCGA的出版指南(https://www.cancer.gov/about-nci/organization/ccg/res earch/structural-genomics/tcga/using-tcga/citing-tcga)相關內容,所有TCGA中的COAD數(shù)據(jù)現(xiàn)在可以在出版物或演示文稿中不受限制地使用。本研究中各組基因RNA測序數(shù)據(jù)集均來自TCGA,而非作者通過對人類參與者或動物所做的任何試驗研究獲得,不需經醫(yī)學研究倫理委員會審核批準。
COAD的RNA測序數(shù)據(jù)集從TCGA下載(https://cancergenome.nih.gov;訪問日期:2018年11月30日)。檢索式為Project id is TCGA-COAD AND Workflow Type is HTSeq-Counts AND Experimental Strategy is RNA-Seq。下載的全基因組RNA測序數(shù)據(jù)集由DESeq包在R平臺中進行歸一化,將其中基因表達量平均值小于1的基因剔除。
以COAD患者癌組織和癌旁正常結腸組織作為分組變量,使用GSEA2-2.2.3版本分析癌組織和癌旁正常結腸組織全基因組基因表達變化對各種生物學功能和通路的影響。本研究分別使用來自分子特征數(shù)據(jù)庫(molecular signatures database,MSigDB)的“c2:curated gene sets(c2.cp.kegg.v6.2.symbols.gmt)”和“c5:gene ontology(GO)gene sets(c5.all.v6.2.symbols.gmt)”作為參照基因集進行GSEA富集分析。Number of permutations設置為重復1000次[9-10]。
GSEA中的FDR根據(jù)Benjamini-Hochberg程序進行校正[11]。|NES|>1、Norminal-P<0.05和錯誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)<0.25的富集結果被認為差異有統(tǒng)計學意義。
研究從TCGA的COAD隊列中獲得456例患者的480個癌組織標本和41個癌旁正常結腸組織標本的Level 3全基因組RNA測序數(shù)據(jù)集,一共獲得15 768個編碼基因。
在以c5為參照基因集的GSEA分析中,作者發(fā)現(xiàn)在COAD患者癌組織中可以顯著富集到細胞周期G1 S期轉變(cell cycle G1 S phase transition)、DNA復制(DNA replication)和DNA修復(DNA repair)等生物學功能,而在癌旁正常結腸組織中富集到與脂質分解代謝過程(lipid catabolic process)、脂肪酸分解代謝過程(fatty acid catabolic process)和調節(jié)鈣跨膜轉運蛋白活性(regulation of calcium transmembrane transporter activity)等生物學功能(圖1);在以c2為參照基因集的GSEA分析在癌組織中富集到細胞周期(cell cycle)通路、DNA復制(DNA replication)通路和核苷酸切除修復(nucleotide excision repair)等代謝通路,在癌旁正常結腸組織中富集到PPAR信號通路(PPAR signaling pathway)、自噬的調節(jié)(regulation of autophage)通路和趨化因子信號通路(chemokine signaling pathway)等代謝通路(圖2)。
圖1 COAD癌組織和癌旁正常結腸組織以c5參考基因集的GSEA富集分析
圖2 COAD癌組織和癌旁正常結腸組織以c2參考基因集的GSEA富集分析
TCGA計劃是2006年由美國國家癌癥研究所(the national cancer institute,NCI)和國家人類基因組研究所(the national human genome research institute,NHGRI)發(fā)起,包含人類33種癌癥數(shù)據(jù),含有超過兩萬個原發(fā)癌和與其匹配的正常樣本。TCGA采用大規(guī)模測序和基因組分析,通過廣泛的合作,匯集來自不同學科和多個機構的研究人員研究癌癥的分子機制,提高對癌癥分子基礎的認識,提升對癌癥的診斷、治療和預防能力。
本研究通過GSEA分析TCGA數(shù)據(jù)庫中COAD的癌組織和癌旁正常結腸組織的全基因組mRNA表達差異進行GO富集分析和KEGG通路分析,GO富集分析結果顯示COAD的腫瘤發(fā)生可能與細胞周期、DNA復制、DNA修復、脂質代謝過程的調節(jié)和離子轉運等生物學功能有關。Soreide等[12]報道細胞周期和凋亡與CRC的預后相關。Potter等[13]的研究提示高脂肪飲食,特別是動物脂肪,與CRC風險增加有關。大量攝入動物脂肪會增加患結腸癌的風險[14]。Bernstein等[15]的進一步研究證實脂肪可能通過產生氧化物和脂肪酸而致癌。Djamgoz等[16]的研究顯示癌細胞的遷移通過調節(jié)細胞形狀或其粘附來響應各種機械和化學信號,而癌細胞中的離子轉運與正常細胞中的離子轉運存在很大的差異。
在參與COAD發(fā)生發(fā)展的通路分析結果中,PPAR信號通路通常與Wnt/β-連環(huán)蛋白途徑一起作用參與結腸癌的形成和調節(jié)過程[17-19]。Zhou等[20]的研究提示自噬與癌癥的致瘤和保護作用有關。然而,自噬在CRC中的作用仍不清楚。本研究富集到的自噬調節(jié)信號通路可能有助于未來進一步研究自噬對COAD發(fā)生發(fā)展的作用機制。既往的研究顯示趨化因子CXC亞家族基因與CRC的發(fā)生發(fā)展有廣泛的相關[21],Ma等[22]的研究提示沉默趨化因子CXCL12基因通過下調MAPK/PI3K/AP-1信號通路,可顯著抑制某些類型結腸癌細胞的增殖,侵襲和血管生成能力。
本研究通過利用TCGA全基因組RNA測序數(shù)據(jù)集,通過GSEA手段對結腸腺癌的發(fā)病機制進行了初步探索,發(fā)現(xiàn)DNA修復、復制與脂質代謝等生物學過程,以及細胞周期、DNA復制、核酸修復、PPAR、趨化因子和自噬等相關通路可能參與結腸腺癌的發(fā)生,但這些機制仍有待進一步的實驗進行驗證。