黃河 李成長 彭燕 姜洪波
(1新鄉(xiāng)市中心醫(yī)院(新鄉(xiāng)醫(yī)學(xué)院第四臨床學(xué)院)呼吸與危重癥醫(yī)學(xué)科一,河南 新鄉(xiāng) 453000;2新鄉(xiāng)醫(yī)學(xué)院基礎(chǔ)醫(yī)學(xué)院生理學(xué)與病理生理學(xué)系;3新鄉(xiāng)醫(yī)學(xué)院第三附屬醫(yī)院營養(yǎng)科)
肺癌是臨床常見的惡性腫瘤,是全球范圍內(nèi)癌癥相關(guān)死亡的主要病因。肺癌分為小細(xì)胞肺癌(SCLC)和非小細(xì)胞肺癌(NSCLC), 肺腺癌是最常見的NSCLC亞型〔1〕。肺腺癌的發(fā)病率為(283~ 489)/10 萬人。 盡管癌癥治療取得了進(jìn)展,但肺腺癌的5年生存率僅為14.6%〔2〕。肺腺癌初期癥狀不明顯,往往容易被忽視,等疾病癥狀明顯時(shí)已經(jīng)處于晚期。晚期的治療手段有放療、化療、免疫檢查點(diǎn)抑制劑治療和分子靶向治療等,其中分子靶向治療是晚期肺腺癌的一個(gè)重要的治療手段。阿來替尼和吉非替尼是晚期肺腺癌治療的常見分子靶向藥物。盡管這兩種藥物上市時(shí)間相差近20年,但臨床研究發(fā)現(xiàn)兩者在腺癌患者中都出現(xiàn)了不同程度的耐藥〔3,4〕。出現(xiàn)這種現(xiàn)象的原因是腫瘤具有異質(zhì)性,在不同空間和時(shí)間條件下,即使同一種腫瘤其生物學(xué)特性也會(huì)有很大不同〔5,6〕?;诖耍枰_發(fā)更多的分子靶向藥物對(duì)不同亞型的肺腺癌進(jìn)行治療。
為探索有效的肺腺癌分子治療靶標(biāo),許多學(xué)者就該病的發(fā)病機(jī)制開展了大量探索。Yuanhua 等〔7〕的研究發(fā)現(xiàn)角蛋白16過表達(dá)通過促進(jìn)上皮-間質(zhì)細(xì)胞轉(zhuǎn)化誘發(fā)肺腺癌,角蛋白16因此可作為肺腺癌發(fā)生發(fā)展及預(yù)后標(biāo)志物。Yerukala 等〔1〕利于優(yōu)化支持向量的方法對(duì)miRNA表達(dá)譜芯片進(jìn)行分析,結(jié)果發(fā)現(xiàn)了18個(gè)miRNA腫瘤標(biāo)志物,這些標(biāo)志物與腺癌的發(fā)生密切相關(guān)。Richardson等〔8〕的研究表明波形蛋白是成纖維細(xì)胞活動(dòng)導(dǎo)致腫瘤細(xì)胞侵襲所必需的物質(zhì),它通過腫瘤細(xì)胞-成纖維細(xì)胞的相互作用參與肺腺癌轉(zhuǎn)移。綜上,肺腺癌方面的研究很多,每個(gè)學(xué)者都強(qiáng)調(diào)自己所研究的信號(hào)分子可作為肺腺癌分子治療的靶標(biāo),但癌癥是一種多因素誘發(fā)多基因突變引起的疾病,參與其發(fā)生發(fā)展的基因很多,要從大量信號(hào)分子中找到關(guān)鍵作用的靶標(biāo)仍然是一件非常困難的事,傳統(tǒng)的動(dòng)物實(shí)驗(yàn)方法效果不佳,只能揭示該疾病發(fā)生發(fā)展的冰山一角。基于此,本課題利于生物信息學(xué)方法構(gòu)建導(dǎo)致腺癌發(fā)生發(fā)展的蛋白互作網(wǎng)絡(luò),利用圖論的相關(guān)算法尋找肺腺癌發(fā)病的關(guān)鍵基因。
1.1基因表達(dá)數(shù)據(jù)的獲取 基因芯片表達(dá)數(shù)據(jù)集(GSE10072)來源于基因表達(dá)數(shù)據(jù)庫(GEO,http://www.ncbi.nlm.nih.gov/geo/),實(shí)驗(yàn)樣本取自肺腺癌組織(58例)和正常組織(49例),實(shí)驗(yàn)平臺(tái)是GPL96(HG-U133A:Affymetrix Human Genome U133A Array)。
1.2差異基因分析 差異基因分析使用GEO提供的在線工具GEO2R(https://www.ncbi.nlm.nih.gov/geo/geo2r/)完成,該工具基于R語言的limma包和GEOquery包比較肺腺癌組織與正常肺組織的基因表達(dá)差異, 研究結(jié)果為根據(jù)顯著性差異排序的基因列表。P<0.05且|Log2FC|>1為表達(dá)顯著性變化的差異基因的篩選標(biāo)準(zhǔn)。
1.3差異基因的富集分析 用DAVID(http://david.abcc.ncifcrf.gov/)基因在線富集分析工具對(duì)所有差異基因進(jìn)行基因本體論(GO)與京都基因與基因組百科全書(KEGG)富集分析。GO富集分析主要包括GO生物過程(biological process)、細(xì)胞組成(cellular component)和分子功能(molecular function)3個(gè)方面。KEGG富集分析主要對(duì)經(jīng)典的生物學(xué)通路進(jìn)行富集分析。
1.4利用STRING數(shù)據(jù)庫構(gòu)建差異基因的蛋白互作網(wǎng)絡(luò) STRING數(shù)據(jù)庫(https://string-db.org/cgi/input.pl)是一個(gè)可用于搜尋蛋白質(zhì)之間相互作用關(guān)系的數(shù)據(jù)庫?;プ麝P(guān)系的依據(jù)來源于實(shí)驗(yàn)數(shù)據(jù)、生物信息學(xué)方法預(yù)測(cè)及PubMed文獻(xiàn)信息的數(shù)據(jù)挖掘。差異基因的蛋白互作網(wǎng)絡(luò)構(gòu)建比較簡(jiǎn)單,登陸STRING數(shù)據(jù)庫,數(shù)據(jù)輸入采用Multiple Proteins模式,參數(shù)均采用默認(rèn)數(shù)值,可信度為0.40,物種為人。輸入所有差異基因相應(yīng)的基因名,即可生成蛋白互作網(wǎng)絡(luò)。
1.5關(guān)鍵基因的鑒別 將STRING數(shù)據(jù)庫所生成的互作網(wǎng)絡(luò)數(shù)據(jù)導(dǎo)出,利用Cytoscape軟件對(duì)互作網(wǎng)絡(luò)進(jìn)行可視化,CytoHubba是Cytoscape軟件的一個(gè)插件,集成了11種可用于關(guān)鍵基因選擇算法,這些算法分別基于節(jié)點(diǎn)的連接度(degree)、邊緣滲出組件(EPC)、最大鄰居組件(MNC)、最大鄰居組件的密度(DMNC)、最大團(tuán)中心性(MCC)、瓶頸值(BN)、緊密度(closeness)、偏心度(Eccentricity)、應(yīng)力(stress) 、發(fā)散性(radiality)和中介性(betweenness)等進(jìn)行關(guān)鍵基因的鑒別。研究表明MCC法準(zhǔn)確度相對(duì)更佳,本課題因此采用MCC算法分析網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),進(jìn)而選取排名前十位的基因即關(guān)鍵基因。
1.6生存分析 生存分析(Survival analysis)是研究疾病影響因素與生存時(shí)間和結(jié)果相關(guān)關(guān)系的數(shù)據(jù)分析方法。腫瘤基因的生存分析使用Kaplan Meier plotter( http://kmplot.com/analysis/)在線工具完成,該數(shù)據(jù)庫包含10 461個(gè)癌癥及存活樣本的數(shù)據(jù),可用于評(píng)估54 675個(gè)基因?qū)颊呱鏁r(shí)間的影響。為研究MCC算法所選取的關(guān)鍵基因?qū)︻A(yù)后是否有影響,本研究所選取的關(guān)鍵基因都利用該分析工具進(jìn)行生存分析,數(shù)據(jù)分析參數(shù)均采用網(wǎng)站默認(rèn)數(shù)值。
2.1差異表達(dá)基因 對(duì)58例肺腺癌和49例正常肺組織樣本進(jìn)行基因表達(dá)的差異分析,共產(chǎn)生855個(gè)差異基因,其中有558個(gè)下調(diào)基因,297個(gè)上調(diào)基因。
2.2GO和KEGG富集分析 肺腺癌和正常肺組織差異表達(dá)基因的 GO 富集分析結(jié)果顯示:顯著富集的生物學(xué)過程包括細(xì)胞黏附、細(xì)胞外基質(zhì)組織、白細(xì)胞遷移、對(duì)藥物的反應(yīng)、膠原分解代謝過程、對(duì)機(jī)械刺激的反應(yīng)、對(duì)雌二醇的反應(yīng)、對(duì)缺氧的反應(yīng)、血管生成和基因表達(dá)的正調(diào)節(jié)。與肺腺癌發(fā)生相關(guān)的顯著富集細(xì)胞組分有:細(xì)胞外空間、細(xì)胞外泌體、蛋白質(zhì)性細(xì)胞外基質(zhì)、細(xì)胞表面、細(xì)胞外區(qū)域、細(xì)胞外基質(zhì)、細(xì)胞表面質(zhì)膜的整體成分、膠原蛋白三聚體、膜筏和質(zhì)膜。GO分子功能顯著富集于肝素結(jié)合、蛋白質(zhì)結(jié)合、蛋白質(zhì)同源二聚化活化、鈣離子結(jié)合、整合素結(jié)合、相同蛋白的結(jié)合、轉(zhuǎn)錄激活因子活化、RNA聚合酶Ⅱ核心啟動(dòng)子近端區(qū)序列特異性結(jié)合、蛋白激酶結(jié)合、肌動(dòng)蛋白結(jié)合 。KEGG富集分析顯示顯著富集的生物學(xué)通路包括阿米巴病、癌癥途徑、細(xì)胞周期、磷脂酰肌醇-3激酶(PI3K)-蛋白激酶B(Akt)信號(hào)通路、細(xì)胞黏附分子通路、黏附斑通路、p53信號(hào)通路、蛋白消化與吸收、細(xì)胞外基質(zhì)(ECM)-受體互作、補(bǔ)體與凝血級(jí)聯(lián)通路。
2.3差異基因蛋白質(zhì)互作網(wǎng)絡(luò)的構(gòu)建 利用顯著富集在GO生物過程的相關(guān)差異基因,構(gòu)建蛋白質(zhì)互作網(wǎng)絡(luò),所構(gòu)建網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)為334、邊數(shù)為1 962、平均節(jié)點(diǎn)度為11.7、局部聚類系數(shù)為0.434、PPI富集P<0.001。見圖1。圖中節(jié)點(diǎn)代表蛋白,節(jié)點(diǎn)之間的連線代表蛋白之間的有直接互作關(guān)系。
圖1 利于數(shù)據(jù)庫構(gòu)建的差異基因蛋白質(zhì)互作網(wǎng)絡(luò)
2.4關(guān)鍵基因選取 基于MCC算法對(duì)差異基因構(gòu)建的蛋白互作網(wǎng)絡(luò)的拓樸結(jié)構(gòu)進(jìn)行分析,連接度排名前十的基因,即我們選取的10個(gè)關(guān)鍵基因分別是:細(xì)胞周期蛋白(CCN)B1、紡錘體檢測(cè)點(diǎn)蛋白(BUB1B)、極光激酶(AURK)A、生存素(BIRC5)、Xklp2靶蛋白(TPX2)、胞質(zhì)分裂蛋白調(diào)節(jié)因子(PRC)1、細(xì)胞周期有絲分裂紡錘體檢測(cè)點(diǎn)絲/蘇氨酸激酶(BUB1)、有絲分裂阻滯缺陷2樣蛋白(MAD2L)1、著絲粒蛋白(CENP)F和周期素依賴性激酶抑制因子(CDKN)3。見圖2。
這些節(jié)點(diǎn)為根據(jù)MCC算法選取的關(guān)鍵基因,顏色越深,代表基因的重要度越高,顏色越淺,代表基因的重要性越低圖2 基于MCC算法所選取的關(guān)鍵基因
2.5生存分析 利用Kaplan Meier生存分析分別對(duì)選取的10個(gè)關(guān)鍵基因進(jìn)行分析,結(jié)果表明這些基因高表達(dá),肺癌患者的總體存活時(shí)間顯著縮短(P<0.05)。見圖3。
圖3 關(guān)鍵基因的Kaplan Meier生存分析結(jié)果
本課題分析的差異基因均是與肺癌的發(fā)生與發(fā)展密切相關(guān),10個(gè)關(guān)鍵基因的過表達(dá)與患者生存時(shí)間顯著減少密切相關(guān)。Gao等〔9〕利用生物信息學(xué)方法結(jié)合實(shí)時(shí)定量PCR發(fā)現(xiàn)CCNB1、CCNB2、CCNA2、神經(jīng)元PAS結(jié)構(gòu)域蛋白(NPAS)2、鳥嘌呤核甘酸結(jié)合蛋白γ-7(GNG7)、幾丁質(zhì)酶(CHIA)和葡萄糖轉(zhuǎn)運(yùn)體(SLC2A)1是肺腺癌發(fā)生發(fā)展的關(guān)鍵基因,最重要的基因CCNB1跟本研究一致,但其余的基因明顯不同,腫瘤的空間和時(shí)間異質(zhì)性是造成這種差異的重要原因。Chen等〔10〕的研究發(fā)現(xiàn)BUB1B基因敲除可抑制肺腺癌離體細(xì)胞系的增殖。Song等〔11〕的研究表明BUB1B可能是肺腺癌發(fā)生發(fā)展的關(guān)鍵基因,目前尚未發(fā)現(xiàn)BUB1B在體方面的臨床研究。Zhang等〔12〕研究表明AURKA和TPX2的mRNA水平升高與吸煙相關(guān)肺腺癌的預(yù)后不良相關(guān)。Cao等〔9〕研究表明BIRC5在肺腺癌中的表達(dá)顯著上調(diào)并與患者的預(yù)后明顯相關(guān)。Zhan等〔13〕研究表明PRC1可能通過Wnt/β-catenin信號(hào)傳導(dǎo)途徑參與肺腺癌的腫瘤發(fā)生。He等〔14〕通過基因集富集分析和薈萃分析顯示BUB1是調(diào)節(jié)和控制肺腺癌預(yù)后的關(guān)鍵基因。Shi等〔15〕發(fā)現(xiàn)MAD2L1對(duì)肺腺癌的預(yù)后具有重要的意義。整合分析發(fā)現(xiàn)CENPF和BUB1B在肺腺癌的發(fā)生和發(fā)展中可能發(fā)揮了重要的作用,并具有一定的預(yù)后價(jià)值〔11〕。細(xì)胞和組織水平的研究表明CDKN3可能通過促進(jìn)有絲分裂活性增強(qiáng),引起肺腺癌的發(fā)生〔16〕。
綜上,本課題研究的肺腺癌關(guān)鍵基因跟此前的報(bào)道既有相同之處,又有區(qū)別,腫瘤具有異質(zhì)性可能是造成本研究與前人成果差異的重要原因。本課題所篩選肺腺癌的關(guān)鍵基因大多數(shù)都得到前人研究結(jié)果的支持,這些關(guān)鍵基因高表達(dá)與肺腺癌患者較差的預(yù)后有明顯的相關(guān)性,這些關(guān)鍵基因的發(fā)現(xiàn)將為肺腺癌治療藥物的開發(fā)提供新的重要分子靶標(biāo)。