徐易德,陳琪,白雪瑩,韓亞錄,張?jiān)葡?,常福?2,3
(1.內(nèi)蒙古醫(yī)科大學(xué)藥學(xué)院,內(nèi)蒙古 呼和浩特 010000;2.內(nèi)蒙古自治區(qū)新藥篩選工程研究中心,內(nèi)蒙古 呼和浩特 010000;3.內(nèi)蒙古醫(yī)科大學(xué)新藥安全評(píng)價(jià)研究中心,內(nèi)蒙古 呼和浩特 010000)
腎細(xì)胞癌(renal cell carcinoma,RCC)作為最常見的腎癌形式,約占成人癌癥的2%~3%[1],其中接近25%~30%的RCC患者被診斷為局部晚期甚至轉(zhuǎn)移階段,嚴(yán)重威脅人類的健康和生命[2]。臨床病理學(xué)分析大多數(shù)RCC屬于透明細(xì)胞亞型(clear cell renal cell carcinoma,ccRCC),其中約10%為乳頭狀亞型,5%為嫌色細(xì)胞型,其他亞型如集合管癌、移行細(xì)胞癌和髓樣癌約占5%~10%[3]。RCC的治療方式包括手術(shù)切除和放療,治療藥物包括VEGF和VEGF-R抑制劑,mTOR抑制劑以及免疫檢查點(diǎn)抑制劑(immune checkpoint inhibitors,ICI)近幾年也同樣受到關(guān)注[4-6],然而,腫瘤對化療不敏感性以及逐漸形成多藥耐藥性,是治療RCC的難點(diǎn)之一。因此需要尋找更加合適的治療方式。
隨著中醫(yī)藥現(xiàn)代化的發(fā)展,在中藥中尋找干預(yù)癌癥的天然化合物的研究愈發(fā)涌現(xiàn)。本研究利用生物信息以及網(wǎng)絡(luò)藥理學(xué)方法,篩選ccRCC癌變和進(jìn)展的差異表達(dá)基因 (differentially expressed genes, DEGs),探究ccRCC相關(guān)機(jī)制,接著通過文本挖掘?qū)ふ铱捎绊戧P(guān)鍵靶點(diǎn)的天然化合物,借助在線數(shù)據(jù)平臺(tái)反向?qū)ふ液心繕?biāo)化合物的中藥,為中醫(yī)藥干預(yù)ccRCC的研究鋪墊基礎(chǔ)工作。
1.1 腎透明組織基因表達(dá)譜數(shù)據(jù)獲取 ccRCC芯片數(shù)據(jù)GSE781[7]源于美國國立生物技術(shù)信息中心(NCBI)中的GEO數(shù)據(jù)庫[8](Gene Express Ominibus,http://www.ncbi.nlm.nih.gov/geo),該數(shù)據(jù)集包含17個(gè)組織樣品的基因芯片表達(dá)譜,其中12例ccRCC組織和5例鄰近癌癥的正常組織。每個(gè)總RNA樣品均與兩個(gè)不同的陣列雜交:Affymetrix U133A(GPL96,Affymetrix Human Genome U133A Array)和U133B(GPL97,Affymetrix Human Genome U133B Array)。
1.2 篩選癌癥差異表達(dá)基因 借助GEO2R在線分析工具(http://www.ncbi.nlm.nih.gov/geo/geo2r),為精準(zhǔn)篩選差異目標(biāo),將P<0.05和∣log2(fold change)∣>2為截取標(biāo)準(zhǔn),進(jìn)行ccRCC 組織相對正常鄰旁組織的 DEGs 分析。并利用Venn[9](http://www.biovenn.nl/index.php)統(tǒng)計(jì)兩組共有的上、下調(diào)基因。
1.3 差異基因的功能富集 為明確DEGs的功能以及分布區(qū)域,對其進(jìn)行基因功能富集分析,包括生物過程(biologicalprocess,BP)、分子功能(molecular function, MF)和細(xì)胞成分(cellular component, CC)。將DEGs導(dǎo)入DAVID 數(shù)據(jù)庫[10](https://david.ncifcrf.gov/)進(jìn)行基因功能富集的同時(shí)預(yù)測DEGs映射的KEGG通路。
1.4 PPI網(wǎng)絡(luò)篩選核心基因 STRING 數(shù)據(jù)庫[11]https://string-db.org/cgi/input.pl)可以預(yù)測蛋白質(zhì)及研究蛋白質(zhì)間的相互作用關(guān)系。將DEGs導(dǎo)入STRING數(shù)據(jù)庫計(jì)算后可視化展示,可視化條件為combine score≥0.7,在隱藏孤立及部分連接節(jié)點(diǎn)后,構(gòu)建蛋白質(zhì)相互作用網(wǎng)絡(luò)圖(protein protein interac-tion,PPI),使用Cytoscape軟件中的cytohuba插件基于重要程度篩選關(guān)鍵基因。
1.5 核心基因的預(yù)后分析 運(yùn)用基因表達(dá)譜動(dòng)態(tài)數(shù)據(jù)庫GEPIA[12](http://gepia.cancer-pku.cn/),以標(biāo)準(zhǔn)條件∣log2(fold change)∣>1、P<0.01對篩選得到的核心基因在ccRCC進(jìn)行表達(dá)水平的驗(yàn)證,驗(yàn)證背景JitterSize=0.4,匹配數(shù)據(jù)庫為TCGA以及GTEx。同時(shí)評(píng)估利用生存曲線明確核心基因在ccRCC患者中的預(yù)后價(jià)值。
1.6 影響核心基因的潛在中藥成分 明確具有預(yù)后價(jià)值的核心基因后,借助在線工具毒性與基因比較數(shù)據(jù)庫 CTD[13](http://ctdbase.org/)搜索基于文獻(xiàn)報(bào)道與核心基因具有相互作用的化合物,對得到的化合物進(jìn)行整理分類得到天然化合物。
1.7 基于潛在化合物反向篩選中藥 得到目標(biāo)天然化合物后,反向篩選含有目標(biāo)化合物的中草藥,分析過程利用TCMSP[14](https://tcmspw.com/index.php)數(shù)據(jù)庫探索。
2.1 ccRCC對于正常組織中的DEGs 對基因芯片GSE781進(jìn)行分析,在GPL96中篩選到 552個(gè)差異DEGs,包括264個(gè)上調(diào)基因和258個(gè)下調(diào)基因 (見圖1A); 在GPL97中檢測到220個(gè)顯著DEGs,包括110個(gè)上調(diào)基因和110個(gè)下調(diào)基因(見圖1B)。將兩組中共有357個(gè)上調(diào)基因,353個(gè)下調(diào)基因定義為ccRCCDEGs(見圖1C/D)。
圖1 ccRCCDEGs火山圖及Venn圖
2.2 篩選獲取的核心基因 將ccRCCDEGs輸入到STRING數(shù)據(jù)庫,利用Cytoscape軟件處理PPI網(wǎng)絡(luò)圖,利用MCODE插件對目標(biāo)網(wǎng)絡(luò)進(jìn)行分析,Degree Cutoff:2,其余參數(shù)默認(rèn)。得到27個(gè)模塊,圖中展示分?jǐn)?shù)前五的模塊(見圖2A),結(jié)果得到模塊基因大多為上調(diào)基因。利用cytohuba基于degree篩選排名前20的基因?yàn)楹诵幕?見圖2B)。
圖2 基因模塊圖及核心基因
2.3 Hub基因在ccRCC標(biāo)本中表達(dá)驗(yàn)證及其與患者預(yù)后生存的關(guān)系 GEPIA驗(yàn)證了篩選的20個(gè)Hub基因中有15個(gè)在ccRCC標(biāo)本中高表達(dá),2個(gè)基因顯著下調(diào),與正常組織標(biāo)本形成鮮明對比(見圖3)。為了進(jìn)一步探究Hub基因?qū)cRCC預(yù)后的影響,利用Kaplan Meier plotter確定Hub基因的生存數(shù)據(jù),發(fā)現(xiàn)特有的9個(gè)Hub基因均與ccRCC患者預(yù)后不良相關(guān)(見圖4),ASPM、BUB1、C3、KIF20A、RRM2、TOP2A的高表達(dá)的總生存期更低,EDN1、PTPN11、VWF的低表達(dá)對生存時(shí)間更有利。
圖3 GEPIA數(shù)據(jù)庫驗(yàn)證圖
圖4 生存曲線驗(yàn)證圖
2.4 ccRCCDEGs涉及的生物過程、分子功能、細(xì)胞成分和信號(hào)通路 為了解差異基因模塊中有相互作用的基因富集情況,將ccRCCDEGs導(dǎo)入David網(wǎng)站進(jìn)行GO及KEGG富集分析。富集結(jié)果證明在疾病發(fā)生發(fā)展過程中涉及較多生物功能,其中生物過程包括氧化還原過程、排泄、對藥物的反應(yīng)、對缺氧的反應(yīng)、白細(xì)胞遷移等,分子功能包括蛋白質(zhì)二聚活性、運(yùn)輸活動(dòng)、受體結(jié)合、無機(jī)陰離子交換活性、肝素結(jié)合等,細(xì)胞定位在細(xì)胞外泌體、質(zhì)膜的組成部分、頂質(zhì)膜、細(xì)胞外空間、基底外側(cè)質(zhì)膜等。在KEGG信號(hào)中富集到PPAR信號(hào)通路、碳代謝、甘氨酸,絲氨酸和蘇氨酸的代謝、代謝途徑、乙醛酸和二羧酸的代謝、纈氨酸,亮氨酸和異亮氨酸的降解、PI3K-Akt信號(hào)通路、檸檬酸鹽循環(huán)(TCA循環(huán))、泛酸和CoA生物合成等信號(hào)通路。
2.5 反向篩選可能影響關(guān)鍵基因的天然化合物及中藥 研究將有明確差異以及有預(yù)后意義的BUB1、C3、KIF20A、RRM2、TOP2A基因確定為目標(biāo)繼續(xù)探究,篩選后得到影響目標(biāo)基因的天然化合物共72個(gè),分析發(fā)現(xiàn)不同化合物對同一目標(biāo)基因的表達(dá)是不同的,如雌二醇可以導(dǎo)致TOP2A mRNA表達(dá)增加,而兒茶素卻導(dǎo)致TOP2A mRNA表達(dá)水平下降。而同一種化合物對得到的不同目標(biāo)基因影響趨勢也不一致,如甲基睪丸激素使RRM2 mRNA表達(dá)增加,但卻誘導(dǎo)TOP2A mRNA表達(dá)降低,具體內(nèi)容如圖5。探索所含篩選化合物的中草藥,結(jié)果發(fā)現(xiàn)每一種化合物至少對應(yīng)一種中草藥,其中含有如槲皮素的中草藥要多達(dá)188種,篇幅限制,表1中列出藥物最多十種。
表1 含有目標(biāo)化合物的中草藥
圖5 影響目標(biāo)基因的化合物信息及關(guān)系
ccRCC早期并無明顯癥狀,臨床診斷不僅缺乏前期診斷標(biāo)志物,而且容易轉(zhuǎn)移,多數(shù)患者確診時(shí)已發(fā)生轉(zhuǎn)移,導(dǎo)致預(yù)后差、死亡率高,因涉及基因突變、表觀遺傳、編碼及非編碼基因表達(dá)變化等諸多因素,導(dǎo)致病理發(fā)生機(jī)制復(fù)雜,以至臨床治療手段受限[15]。外科手術(shù)切除雖然是原發(fā)性腎癌的第一選擇,但總體預(yù)后較差,分子靶向治療也存在個(gè)體差異,藥物耐受、費(fèi)用昂貴等問題依舊對臨床治療提出新的挑戰(zhàn)。
在我國,中醫(yī)藥作為癌癥的治療手段已經(jīng)廣泛應(yīng)用于臨床抗癌,從患者的全身特點(diǎn)和病程考慮用藥,而不只局限在癌癥病灶本身,在癌的綜合治療中發(fā)揮了獨(dú)特的作用。傳統(tǒng)中醫(yī)理論認(rèn)為“正氣存內(nèi),邪不可干”,個(gè)體的體質(zhì)是決定機(jī)體發(fā)病的內(nèi)在條件,體質(zhì)因素在某種程度上決定個(gè)體對腫瘤的易感性[16]。利用現(xiàn)代醫(yī)學(xué)觀念闡述此話,則為行使相似功能的蛋白表達(dá)水平不同,故利用基因表達(dá)芯片數(shù)據(jù)分析ccRCC與正常人的差異基因,探究在疾病過程中異常表達(dá)的蛋白差異程度,得到結(jié)果為BUB1, KIF20A等目標(biāo)基因高表達(dá)。BUB1是一種絲氨酸/蘇氨酸蛋白激酶,在有絲分裂早期被召集,可促進(jìn)著絲粒紡錘體組裝檢查點(diǎn)(soindle assembly checkpint SAV)的組裝。BUB1被Mps1激酶磷酸化后,招募有絲分裂檢查點(diǎn)復(fù)合體(mitotic checkpoint complex,MCC),發(fā)出有絲分裂后期的信號(hào)[17]。有明確研究發(fā)現(xiàn)BUB1在子宮內(nèi)膜癌[18]、卵巢癌[19]、乳腺癌[20]等多種癌癥中高表達(dá),證明與腫瘤發(fā)生、侵襲和轉(zhuǎn)移相關(guān),并參與細(xì)胞增殖、腫瘤干細(xì)胞潛能等多個(gè)過程。KIF20A(Kinesin family member 20A)是驅(qū)動(dòng)蛋白Kinesin6家族成員,涉及關(guān)鍵細(xì)胞功能,包括細(xì)胞器和囊泡胞內(nèi)運(yùn)動(dòng)、紡錘體形成和胞質(zhì)分裂,其表達(dá)水平和活性參與細(xì)胞內(nèi)轉(zhuǎn)運(yùn)和細(xì)胞分裂的調(diào)控,在癌癥發(fā)生發(fā)展中起著重要作用[21],研究證明如果沉默KIF20A,可以誘導(dǎo)抗紫杉醇乳腺癌細(xì)胞MCF-7的有絲分裂障礙,抑制增殖活性[22]。當(dāng)敲低KIF20A亦可抑制肝癌細(xì)胞的增殖,并且使細(xì)胞周期阻滯在G2/M期,出現(xiàn)多核細(xì)胞,可能由于胞質(zhì)分裂異常引起[23]。以上均證實(shí)抑制KIF20A基因的表達(dá)時(shí),可發(fā)揮誘導(dǎo)細(xì)胞凋亡、改變細(xì)胞周期、血管生成和抑制轉(zhuǎn)移作用[24]。RRM2(核糖核酸還原酶亞單位M2,ribonucleotide reductase M2)基因是細(xì)胞凋亡的重要調(diào)控基因,在各種惡性腫瘤中都有表達(dá),同時(shí)與腫瘤生長和浸潤呈正相關(guān),與腫瘤耐藥的形成有密切關(guān)系[25]。細(xì)胞在S期時(shí),RRM2表達(dá)最高,調(diào)控細(xì)胞周期相關(guān)蛋白,顯著促進(jìn)了腫瘤細(xì)胞的生長和侵襲,與腫瘤生長密切相關(guān)。目前對 RRM2的研究不多,主要集中在胰腺癌、膀胱癌、胃癌上。RRM2與DNA合成代謝相關(guān),導(dǎo)致DNA抗損傷能力增加而出現(xiàn)耐藥,抑制RRM2的表達(dá)則降低腫瘤細(xì)胞DNA的抗損傷能力,通過沉默RRM2基因,胃癌細(xì)胞對不同濃度順鉑敏感性顯著提高[26-27]。
表1(續(xù))
表1(續(xù))
TOP2A(拓?fù)洚悩?gòu)酶Ⅱα)又稱旋轉(zhuǎn)酶,參與機(jī)體內(nèi)基因復(fù)制、細(xì)胞增殖等過程[28]。具有明顯的細(xì)胞周期特異性,在細(xì)胞增殖S期末和G2/M過渡期高表達(dá),而在有絲分裂結(jié)束后表達(dá)下調(diào),當(dāng)細(xì)胞停止增殖活動(dòng)時(shí),TOP2A的表達(dá)則受到抑制[29],研究指出,TOP2A是影響胃癌患者總生存期的獨(dú)立危險(xiǎn)因素[30]。以上討論證明利用生物信息學(xué)方法篩選得到潛在干預(yù)靶點(diǎn)準(zhǔn)確,但中藥成方制劑直接作用上述靶點(diǎn)研究較少,可能為中醫(yī)并無“腎癌”病名,對于以痛性血尿、腰痛、腰部或上腹部腫塊等臨床表現(xiàn)中醫(yī)將腎癌歸屬 “尿血”“癥積”“腎積”“中石疽”等病的范疇[31], 腎癌為本虛標(biāo)實(shí)病機(jī),臨床中化痰除濕解毒以及活血化瘀應(yīng)各有側(cè)重。預(yù)測到藥物中豆蔻為芳香化濕藥,川芎、乳香等為活血化瘀藥符合上述辯證觀,今后的治療中在符合中醫(yī)理論指導(dǎo)下可能對ccRCC具有干預(yù)作用。同時(shí)全身屬虛,腎癌以氣血俱虛為主,臨證應(yīng)祛邪不忘扶本,尤重氣血,調(diào)理脾腎。研究驗(yàn)證到本次實(shí)驗(yàn)預(yù)測到當(dāng)歸具有補(bǔ)血活血之功效,體外實(shí)驗(yàn)中亦驗(yàn)證可有效抑制人腎透明細(xì)胞癌的增殖,同時(shí)對預(yù)測到的PI3k信號(hào)通路同樣被顯著干預(yù)[32]。
本次研究中利用生物信息學(xué)的方法探索ccRCC的關(guān)鍵差異靶點(diǎn),探究疾病對信號(hào)通路的多途徑積累改變,與中醫(yī)學(xué)的整體觀念及中藥多靶弱效的顯著特點(diǎn)相結(jié)合,希望借助現(xiàn)代技術(shù)探索到可干預(yù)中醫(yī)未被定義疾病的中草藥,以現(xiàn)代醫(yī)學(xué)觀念剖析中草藥的潛在價(jià)值,本研究中發(fā)現(xiàn)同一核心基因可以被多種不同的化合物不同方向干預(yù),不同成分可能包含于在同一種中草藥中,這對闡述單一中草藥影響ccRCC的不明確作用機(jī)制仍需探索,本研究預(yù)測藥物較多,僅部分藥物或單質(zhì)實(shí)驗(yàn)驗(yàn)證為對目標(biāo)疾病有療效,但仍未經(jīng)過實(shí)驗(yàn)驗(yàn)證的預(yù)測結(jié)果需要繼續(xù)深入探索,為中醫(yī)藥的發(fā)展做出努力。