李戴牟 吳留成 梁榜輝 潘佳宇 王婷安 韋尉元 金欽文 凌通 黃名威 覃宇周
在我國乃至全球范圍內(nèi),胃癌的發(fā)病率和致死率長期以來居高不下[1-2]。盡管胃癌在臨床治療上已經(jīng)取得較大進(jìn)展,但其早期癥狀隱匿,篩查手段也較局限,同時(shí)缺乏敏感性高、特異性強(qiáng)的生物標(biāo)志物,因此整體預(yù)后仍然不理想。深入研究胃癌發(fā)生發(fā)展的分子機(jī)制及其相關(guān)基因有助于發(fā)掘更有效的靶點(diǎn)。胃癌是異質(zhì)性極高的腫瘤,不同組織學(xué)類型的胃癌生物學(xué)行為及預(yù)后差別巨大。根據(jù)常用的Lauren分型,胃癌一般分為腸型、彌漫型和介于兩者之間的混合型。胃癌中約30%為彌漫型,通常彌漫型胃癌具有更強(qiáng)的惡性生物學(xué)行為和更少的靶向治療選擇[3-4],加之疾病進(jìn)展迅速,容易侵犯漿膜造成腹膜轉(zhuǎn)移,因此成為臨床治療的一個(gè)挑戰(zhàn)[5-7]。本研究利用轉(zhuǎn)錄組測(cè)序分析彌漫型胃癌中的優(yōu)勢(shì)基因集,并結(jié)合TCGA數(shù)據(jù)庫對(duì)優(yōu)勢(shì)基因集的表達(dá)及其與Lauren分型進(jìn)行相關(guān)性分析,同時(shí)對(duì)核心基因LUM(Lumican)的表達(dá)進(jìn)行擴(kuò)大樣本量驗(yàn)證,為彌漫型胃癌尋找新的預(yù)測(cè)標(biāo)志物和治療靶點(diǎn)提供依據(jù)。
選取2021年1月—2021年12月在廣西醫(yī)科大學(xué)附屬腫瘤醫(yī)院首次診斷并經(jīng)術(shù)后病理確診為胃癌的29例患者為研究對(duì)象,其中5例彌漫型胃癌樣本用于轉(zhuǎn)錄組測(cè)序,24例胃癌樣本用于驗(yàn)證轉(zhuǎn)錄組測(cè)序結(jié)果。所有癌組織及其配對(duì)癌旁正常組織樣本手術(shù)切除后立即速凍于液氮,并置于-80℃冰箱保存。樣本與病例資料收集經(jīng)廣西醫(yī)科大學(xué)附屬腫瘤醫(yī)院倫理委員會(huì)批準(zhǔn)(批件號(hào):LW2022011)。
1.2.1 總RNA質(zhì)檢、文庫構(gòu)建及Illumina測(cè)序 根據(jù)RNeasy Mini Kit[天根生化科技(北京)有限公司]提供的標(biāo)準(zhǔn)操作流程提取總RNA,經(jīng)NanoDrop ND-2000分光光度計(jì)及Agilent Bioanalyzer 4200質(zhì)檢合格后用于后續(xù)的文庫構(gòu)建。經(jīng)去除rRNA、打斷、雙鏈cDNA合成、降解第二鏈、末端修復(fù)、3'末端加A、連接接頭、擴(kuò)增實(shí)驗(yàn)等過程后,采用鏈特異性建庫和PE150測(cè)序策略,最終獲得原始數(shù)據(jù)。每個(gè)樣品的下機(jī)數(shù)據(jù)量不低于10 Gb,由上海華盈生物醫(yī)藥科技有限公司完成。
1.2.2 數(shù)據(jù)質(zhì)量評(píng)估、預(yù)處理及比對(duì)分析 原始數(shù)據(jù)應(yīng)用測(cè)序質(zhì)量Q值進(jìn)行評(píng)估,經(jīng)過堿基識(shí)別及誤差過濾后,使用Seqtk軟件進(jìn)行預(yù)處理,經(jīng)去除接頭序列、所屬物種的ribosome RNA reads、長度小于25的低質(zhì)量reads和3'端質(zhì)量低于Q20(堿基錯(cuò)誤率小于0.01)的堿基等步驟,最終獲得后續(xù)分析使用的clean reads。clean reads經(jīng)HISAT2軟件進(jìn)行基因組mapping分析,參數(shù)設(shè)置為默認(rèn)參數(shù),參考基因組版本為GRCh38。
1.2.3 基因差異表達(dá)分析 使用edgeR軟件中的TMM算法對(duì)fragment counts進(jìn)行歸一化,根據(jù)假設(shè)檢驗(yàn)?zāi)P陀?jì)算P-value,經(jīng)多重假設(shè)檢驗(yàn)校正后得到FDR值(Q.value)。使用FPKM(Fragments Per Kilobase of exon model per Million mapped reads)表示基因表達(dá)水平,通過 FPKM計(jì)算差異倍數(shù)(Fold-change,F(xiàn)C),過濾掉在50%樣本中表達(dá)量低于1的基因,差異基因篩選標(biāo)準(zhǔn):FC>2且Q.value<0.05?;鹕綀D繪制涉及R語言分析報(bào)告包:ggplot2包、ggrepel包。
1.2.4 差異基因的富集分析 通過GO數(shù)據(jù)庫,從生物過程、細(xì)胞組分、分子功能三個(gè)層面上分析差異基因的功能,再利用KEGG分析差異基因的通路。涉及R語言分析包:clusterProfiler包、org.Hs.eg.db包、ggplot2包。
1.2.5 差異基因的蛋白互作網(wǎng)絡(luò) 使用cytoscape軟件中的stringApp,以默認(rèn)參數(shù)輸出差異基因的蛋白互作網(wǎng)絡(luò)[8-9];使用MCODE,以默認(rèn)參數(shù)進(jìn)行聚類功能模塊分選[10];使用cytoHubba的Degree算法評(píng)估網(wǎng)絡(luò)并計(jì)算每個(gè)差異基因的得分[11]。
1.2.6 差異基因功能簇分析 通過MSigDB Collections數(shù)據(jù)庫中獲取h.all.v7.2.symbols.gmt(Hallmarks)數(shù)據(jù),提取上皮-間充質(zhì)轉(zhuǎn)化(epithelial-mesenchymal transition,EMT)通路中的基因信息。
采用TransZol Up Plus RNA Kit試劑盒(北京全式金生物技術(shù)股份有限公司)提取胃癌組織及其癌旁正常組織樣本的總RNA,用Trans Script Uni All-in-one First-strand cDNA Synthesis Supermix for qPCR試劑盒(北京全式金生物技術(shù)股份有限公司)逆轉(zhuǎn)錄成cDNA,最后使用Perfectstart Green qPCR Supermix試劑盒(北京全式金生物技術(shù)股份有限公司)在ABI Prism 7500儀器中進(jìn)行實(shí)時(shí)熒光定量PCR反應(yīng)。按照試劑盒說明書配制反應(yīng)體系,采用推薦的兩步法反應(yīng)條件進(jìn)行反應(yīng):94℃預(yù)變性30 s,隨后94℃變性5 s、60℃退火34 s依次循環(huán),于退火時(shí)采集熒光信號(hào),共計(jì)循環(huán)40次。引物序列由北京擎科生物科技有限公司合成:LUM上游5'-TGGCTGATAGTGGAATACCTGGAA-3',下游5'-ATGCTTGATCTTGGAGTAGGATAATGG-3';β-actin上游 5'-GTCATTCCAAATATGAGATGCGT-3',下游 5'-GCATTACATAATTTACACGAAAGCA-3'。檢測(cè)結(jié)果采用2-△Ct和2-△△Ct法計(jì)算。
通過TCGA數(shù)據(jù)庫(https://portal.gdc.cancer.gov/)獲取STAD(胃癌)項(xiàng)目下完整的RNAseq數(shù)據(jù)和臨床數(shù)據(jù),F(xiàn)PKM格式的RNAseq數(shù)據(jù)經(jīng)log2(FPKM+1)轉(zhuǎn)化后用于后續(xù)分析。通過cBioPortal數(shù)據(jù)庫(http://www.cbioportal.org/)獲取胃癌(TCGA,Nature 2014)臨床資料[12],作為Lauren分型資料的補(bǔ)充,篩選出Lauren分型中的彌漫型、腸型和混合型樣本ID號(hào),通過樣本ID號(hào)匹配RNAseq數(shù)據(jù)和臨床資料數(shù)據(jù)。
采用SPSS 20.0軟件、GraphPad Prism 8.0軟件和R 4.1.1軟件進(jìn)行統(tǒng)計(jì)學(xué)分析及繪制結(jié)果圖。在TCGA數(shù)據(jù)庫的資料分析中,涉及主要R語言分析包:ggpubr包、ggplot2包、survival包、survminer包,當(dāng)基因的表達(dá)量符合正態(tài)性和方差齊性要求時(shí),兩組間比較采用獨(dú)立樣本t檢驗(yàn),多組間采用單因素方差分析進(jìn)行差異比較;當(dāng)基因的表達(dá)量不符合正態(tài)性和方差齊性的要求,兩組間比較采用Wilcoxon秩和檢驗(yàn),多組間采用Kruskal-Wallis檢驗(yàn)進(jìn)行差異比較。采用Kaplan-Meier法計(jì)算生存率,組間比較采用log-rank檢驗(yàn)。在胃癌組織及其配對(duì)正常組織的RT-qPCR結(jié)果中,資料不滿足正態(tài)性和方差齊性的要求,配對(duì)樣本采用Wilcoxon符號(hào)秩檢驗(yàn)進(jìn)行差異比較,事后兩兩比較采用Bonferroni法。以雙側(cè)P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
以FC>2且Q.value<0.05為篩選條件,彌漫型胃癌樣本中癌組織與配對(duì)正常組織共有175個(gè)差異基因,其中上調(diào)基因91個(gè),下調(diào)基因84個(gè),見圖1。
圖1 彌漫型胃癌中癌組織與配對(duì)正常組織的差異基因火山圖Fig.1 Volcano map of differentially expressed genes in diffuse gastric cancer tissues and matched normal tissues
差異基因經(jīng)富集分析后,分別選取GO分析中生物過程、細(xì)胞組件分子功能和KEGG通路中排名前5的條目進(jìn)行展示,見圖2。其中,富集的生物過程包括細(xì)胞外結(jié)構(gòu)組織、細(xì)胞外基質(zhì)組織、骨骼發(fā)育、平滑肌收縮、膠原原纖維組織;富集的細(xì)胞組件包括含膠原蛋白的細(xì)胞外基質(zhì)、細(xì)胞頂端部分、頂端質(zhì)膜、細(xì)胞外基質(zhì)成分、膠原三聚體的復(fù)合物;富集的分子功能包括細(xì)胞外基質(zhì)結(jié)構(gòu)成分、賦予抗壓能力的細(xì)胞外基質(zhì)結(jié)構(gòu)成分、生長因子結(jié)合、碳水化合物跨膜轉(zhuǎn)運(yùn)蛋白活性、血小板衍生生長因子結(jié)合。GO富集分析提示彌漫型胃癌存在多種方式參與細(xì)胞外基質(zhì)相關(guān)的細(xì)胞過程改變。富集的KEGG通路包括蛋白質(zhì)消化和吸收、血小板活化、礦物質(zhì)吸收、補(bǔ)體和凝血級(jí)聯(lián)、胃酸分泌,提示彌漫型胃癌中存在多種信號(hào)通路共同調(diào)控惡性進(jìn)展。
圖2 差異基因的GO和KEGG分析結(jié)果Fig.2 GO and KEGG analysis of differentially expressed genes
將175個(gè)差異基因用于繪制蛋白互作網(wǎng)絡(luò)(圖3),差異基因共可富集出4個(gè)功能基因集,其中最大功能基因集包含的差異基因數(shù)遠(yuǎn)大于另外3個(gè),且大多數(shù)由cytoHubba評(píng)分高的基因組成,推測(cè)該基因集在彌漫型胃癌的功能調(diào)控中占主導(dǎo)地位。最大基因集包括LUM、BGN、COL1A2、ADAMTS2、COL3A1、COL4A1、COL12A1、COL5A2、SPARC、NID2、COL1A1、CDH11和COL6A3,其中LUM是最大基因集中的核心基因,也同時(shí)是cytoHubba中的高評(píng)分基因。結(jié)合Hallmarks進(jìn)一步分析,結(jié)果顯示,12/13的基因參與EMT過程,因此稱該基因集為EMT相關(guān)基因集。
圖3 差異基因的蛋白互作網(wǎng)絡(luò)Fig.3 Protein-protein interaction network of differentially expressed genes
分析TCGA數(shù)據(jù)庫中EMT相關(guān)基因集的表達(dá),結(jié)果顯示,在彌漫型胃癌中,COL6A3較癌旁正常組織、腸型胃癌組織和混合型胃癌組織高表達(dá)(P<0.05);LUM、COL1A2、SPARC、COL1A1、CDH11、COL3A1、NID2、BGN和COL4A1較癌旁正常組織和腸型胃癌組織高表達(dá)(P<0.05),但與混合型胃癌比較差異無統(tǒng)計(jì)學(xué)意義(P>0.05);ADAMTS2、COL12A1和COL5A2較癌旁正常組織高表達(dá)(P<0.05),但與腸型和混合型胃癌組織比較差異無統(tǒng)計(jì)學(xué)意義(P>0.05),見圖4。這一結(jié)果進(jìn)一步確定了COL6A3、LUM、COL1A2、SPARC、COL1A1、CDH11、COL3A1、NID2、BGN和COL4A1是彌漫型胃癌中EMT相關(guān)的關(guān)鍵基因。
圖4 EMT相關(guān)基因在胃癌組織中的表達(dá)Fig.4 Expression of EMT-associated genes in gastric cancer tissues
基于TCGA數(shù)據(jù)庫中的55例彌漫型胃癌患者的臨床隨訪資料,分析EMT相關(guān)基因表達(dá)水平與彌漫型胃癌總生存期的關(guān)系。結(jié)果顯示,LUM基因高表達(dá)的彌漫型胃癌患者總生存期縮短(P=0.043),其他EMT相關(guān)基因表達(dá)水平與彌漫型胃癌總生存期無關(guān),見圖5A。說明在EMT相關(guān)基因集中,LUM是彌漫型胃癌潛在的預(yù)后相關(guān)核心基因。
圖5 EMT相關(guān)基因的預(yù)后分析及核心基因LUM表達(dá)量的驗(yàn)證Fig.5 Prognostic analysis of EMT-associated gene and verification of hub gene LUM expression
收集24例初診胃癌患者樣本,對(duì)LUM的mRNA相對(duì)水平表達(dá)量進(jìn)行驗(yàn)證,結(jié)果與測(cè)序結(jié)果一致,均表現(xiàn)為LUM在胃癌組織中高表達(dá)(P=0.014),見圖5B;且LUM在彌漫型胃癌組織中的表達(dá)高于腸型和混合型(均P<0.05),見圖5C。
2015年,亞洲癌癥研究組(ACRG)在Nature Medicine上將胃癌分為4種分子亞型:微衛(wèi)星不穩(wěn)定型(MSI)、上皮間質(zhì)轉(zhuǎn)化型(MSS/EMT)、p53活躍型(MSS/p53+)和p53不活躍型(MSS/p53-),其中彌漫型胃癌主要存在于MSS型中,且預(yù)后最差的MSS/EMT型中超過80%屬于彌漫型[13]。一項(xiàng)關(guān)于彌漫型胃癌的蛋白質(zhì)組學(xué)研究基于差異蛋白的聚類分析將彌漫性胃癌分為3種亞型:PX1(細(xì)胞周期型),PX2(EMT型)和PX3(免疫過程增強(qiáng)亞型),再次證實(shí)了EMT過程在彌漫型胃癌中的重要地位[14]。這些分子表征加深了對(duì)彌漫型胃癌內(nèi)分子異質(zhì)性的理解,表明彌漫型胃癌在基因背景穩(wěn)定下可能通過EMT相關(guān)機(jī)制推動(dòng)癌細(xì)胞的惡性生物學(xué)行為。
EMT是惡性腫瘤的特征之一,常以漸進(jìn)、可逆的形式發(fā)生,并推動(dòng)細(xì)胞獲得干性特征、轉(zhuǎn)移潛能和治療抗性[15]。細(xì)胞外基質(zhì)由于能提供腫瘤細(xì)胞黏附和遷移的支持結(jié)構(gòu),在腫瘤發(fā)展過程中往往受到一系列信號(hào)通路調(diào)控,因此其結(jié)構(gòu)成分和機(jī)械性能發(fā)生重塑,從而影響包括EMT在內(nèi)的各種關(guān)鍵細(xì)胞事件[16-17]。本研究的GO分析結(jié)果提示彌漫型胃癌中存在多種方式參與細(xì)胞外基質(zhì)相關(guān)的生物學(xué)過程,其核 心 基 因 集 中COL6A3、LUM、COL1A2、SPARC、COL1A1、CDH11、COL3A1、NID2、BGN和COL4A1的表達(dá)均高于正常組織,且在彌漫型胃癌中的表達(dá)高于腸型。在 EMT 相關(guān)基因集中,COL6A3[18]、COL1A2[19]、COL3A1[20]、COL1A1[21]和 COL4A1[22]是膠原蛋白家族基因,主要參與細(xì)胞外基質(zhì)組成,誘導(dǎo)腫瘤細(xì)胞發(fā)生EMT轉(zhuǎn)變。SPARC可作為腫瘤抑制或啟動(dòng)因子,在腫瘤進(jìn)展的不同階段重塑細(xì)胞外基質(zhì),并通過EMT過程促進(jìn)腫瘤侵襲和轉(zhuǎn)移[23]。CDH11[24]和 BGN[25]也可以通過不同通路參與EMT過程。因此認(rèn)為,本研究中的EMT相關(guān)基因集可能作為彌漫型胃癌轉(zhuǎn)移和預(yù)后的生物標(biāo)志物。
進(jìn)一步基于TCGA數(shù)據(jù)庫和臨床樣本進(jìn)行驗(yàn)證,發(fā)現(xiàn)LUM是EMT相關(guān)基因集中的核心基因,且在彌漫型胃癌中高表達(dá),且LUM是EMT相關(guān)基因集中唯一影響彌漫型胃癌總生存期的基因,因此推測(cè)LUM是彌漫型胃癌的核心基因。LUM是參與細(xì)胞外基質(zhì)組織構(gòu)成和細(xì)胞外信號(hào)傳導(dǎo)的關(guān)鍵介質(zhì),也是Ⅱ類富含亮氨酸重復(fù)序列的小分子蛋白聚糖的家族成員(small leucine-rich proteoglycans,SLRPs),在肝臟、心臟、腎臟和腸等多種組織中廣泛表達(dá),可促進(jìn)癌細(xì)胞增殖、侵襲和轉(zhuǎn)移[26-30]。近年來在多種癌癥中進(jìn)行了關(guān)于LUM機(jī)制的研究,例如,在膀胱癌細(xì)胞中敲除LUM可通過失活MAPK信號(hào)通路傳導(dǎo)抑制細(xì)胞增殖和遷移[31]。在乳腺癌中,LUM能抑制CD44表達(dá),并下調(diào)包括FAK、ERK1/2 MAPK 42/44和AKT等整合素下游通路[32]。在頭頸鱗狀細(xì)胞癌的耐藥研究中,化療耐受組中LUM的表達(dá)顯著上調(diào),而沉默LUM表達(dá)可顯著增強(qiáng)順鉑介導(dǎo)的細(xì)胞凋亡[33]。在胃癌中,LUM能通過激活整合素β1-FAK信號(hào)通路促進(jìn)細(xì)胞增殖、侵襲和遷移[34]。綜合以上研究結(jié)果,說明LUM可能作為癌基因促進(jìn)彌漫型胃癌的發(fā)生進(jìn)展。
綜上所述,本研究從轉(zhuǎn)錄組測(cè)序、RT-qPCR以及TCGA數(shù)據(jù)庫角度均證實(shí)LUM在彌漫型胃癌中表達(dá)增強(qiáng),且彌漫型胃癌的轉(zhuǎn)錄組特征表現(xiàn)為EMT相關(guān)基因集處于優(yōu)勢(shì)地位,其核心基因LUM高表達(dá)患者總生存期縮短,因此LUM可能是彌漫型胃癌潛在的預(yù)后標(biāo)志物和治療靶點(diǎn)。但本研究受限于單中心小樣本,優(yōu)勢(shì)基因集在彌漫型胃癌中的作用及機(jī)制仍需進(jìn)一步研究證實(shí)。