李萍,劉怡茜
南京醫(yī)科大學(xué)第一附屬醫(yī)院 腫瘤科,南京 210009
胰腺癌是一種病死率高、生存期短的惡性腫瘤。2020年美國胰腺癌新發(fā)病例為57 600例,死亡病例為47 050例,占癌癥導(dǎo)致的死亡原因的第四位,5年生存率在所有腫瘤中最低(9%)[1]。2019年中國最新癌癥報(bào)告顯示,胰腺癌發(fā)病和死亡均位居惡性腫瘤前十位。無疑,胰腺癌已日益成為危害人類健康的重大疾病。
細(xì)胞外基質(zhì)(extracellular matrix,ECM)由基底膜和細(xì)胞間質(zhì)組成,一直以來被認(rèn)為與惡性腫瘤的發(fā)生、發(fā)展、侵襲和轉(zhuǎn)移等多種生物過程密切相關(guān)。Ⅴ型膠原蛋白α2(COL5A2)是ECM的主要成分之一。相關(guān)研究及數(shù)據(jù)分析表明,COL5A2參與多種惡性腫瘤的病理過程,且與患者的預(yù)后密切相關(guān),包括舌鱗癌[2]、乳腺癌[3]、結(jié)直腸癌[4]、膀胱癌[5-6]和卵巢癌[7]等。目前國內(nèi)外有關(guān)COL5A2與胰腺癌的研究尚少,僅局限于Zhou等[8]通過整合轉(zhuǎn)錄組分析中發(fā)現(xiàn)的關(guān)鍵基因(hub genes)。
Oncomine數(shù)據(jù)庫是目前全球最大的癌基因芯片數(shù)據(jù)庫和整合數(shù)據(jù)挖掘平臺(tái),其宗旨在于挖掘癌癥基因信息,目前已收錄包括715個(gè)基因表達(dá)數(shù)據(jù)集、86 733個(gè)癌癥組織和正常組織在內(nèi)的樣本數(shù)據(jù)。Kaplan-Meier Plotter數(shù)據(jù)庫[9]是目前分析預(yù)后應(yīng)用較廣泛的在線數(shù)據(jù)庫,涵蓋了包括胰腺癌、乳腺癌、卵巢癌、肺癌、胃癌等在內(nèi)的21種腫瘤類型,可對54 000個(gè)基因進(jìn)行包括總生存、無復(fù)發(fā)生存、無進(jìn)展生存等在內(nèi)的相關(guān)預(yù)后分析,結(jié)果較為客觀。本研究主要采用Oncomine數(shù)據(jù)庫和Kaplan-Meier Plotter數(shù)據(jù)庫分析COL5A2在胰腺癌中的表達(dá)及其與預(yù)后的關(guān)系,為進(jìn)一步闡明胰腺癌的發(fā)生、發(fā)展機(jī)制提供線索。
根據(jù)本研究需求,在Oncomine數(shù)據(jù)庫(https://www.oncomine.org/resource/login.html)中 設(shè) 定 篩 選和挖掘數(shù)據(jù)的條件:①cancer type:pancreatic cancer;②gene:COL5A2;③data type:mRNA;④analysis type:cancer vs normal analysis;⑤臨界值設(shè)定條件:P<0.05,fold change>2,gene rank=All。
根據(jù)本研究需求,在NCBI網(wǎng)站(https://www.ncbi.nlm.nih.gov/)篩選挖掘數(shù)據(jù):①GEO profiles;②輸入關(guān)鍵詞:COL5A2 and pancreatic cancer;
利用Kaplan-Meier Plotter數(shù)據(jù)庫(http://kmplot.com/analysis/)中的Pan cancer(mRNA)數(shù)據(jù)集進(jìn)行生存分析。篩選條件:①Gene symbol:COL5A2;②Split patients by:Auto select best cutoff;③Survival:OS/RFS;④Follow up threshold:All;⑤Cancer:Pancreatic ductal adenocarcinoma(n=177)。本研究預(yù)后評價(jià)指標(biāo)包括總生存期(overall survival,OS)和無復(fù)發(fā)生存期(relapse-freesurvival,RFS)。OS定義為癌癥診斷之日起至因任何原因引起死亡的時(shí)間。RFS定義為從癌癥初次治療至最早出現(xiàn)局部復(fù)發(fā)、遠(yuǎn)處轉(zhuǎn)移或死亡的時(shí)間。
采用Kaplan-Meier Plotter數(shù)據(jù)庫和Graphpad Prism 5統(tǒng)計(jì)軟件進(jìn)行數(shù)據(jù)分析。采用x±s描述COL5A2基因的表達(dá)量,其在正常組織與胰腺癌組織的差異分析采用獨(dú)立樣本t檢驗(yàn)。采用Kaplan-Meier法分析COL5A2表達(dá)與胰腺癌預(yù)后的關(guān)系,組間比較用Log-rank檢驗(yàn)。雙側(cè)P<0.05認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。
Oncomine數(shù)據(jù)庫共收集了417項(xiàng)不同類型腫瘤組織與正常組織中COL5A2的比較研究結(jié)果,其中COL5A2表達(dá)差異有統(tǒng)計(jì)學(xué)意義的78項(xiàng),包括高表達(dá)的研究75項(xiàng)、低表達(dá)的研究3項(xiàng)(圖1)。
2003年以來,Oncomine數(shù)據(jù)庫中共有7項(xiàng)芯片研究比較COL5A2在胰腺癌組織及正常組織中的表達(dá),共178個(gè)樣本(圖2)[10-16]。在Oncomine數(shù)據(jù)庫中對上述7項(xiàng)研究結(jié)果進(jìn)行薈萃分析發(fā)現(xiàn),與正常組織相比,所有差異表達(dá)基因中COL5A2中位數(shù)值排名為790,并在胰腺癌組織中呈高表達(dá)(P=0.008)。
Oncomine數(shù)據(jù)庫中COL5A2在不同胰腺癌研究芯片中的表達(dá)情況如圖3a~g所示。在Oncomine數(shù)據(jù)庫的7項(xiàng)研究中,有5項(xiàng)揭示COL5A2在胰腺癌組織中的表達(dá)量明顯高于正常組織(P<0.05,F(xiàn)old change>2),分別是 Badea Pancreas、Segara Pancreas、Grutzmann Pancreas、Logsdon Pancreas和Pei Pancreas研究芯片。Ishikawa Pancreas、Buchholz Pancreas這2項(xiàng)研究芯片中兩者表達(dá)量差異無統(tǒng)計(jì)學(xué)意義(P>0.05)。分析NCBI/GEO Profiles數(shù)據(jù)庫中的數(shù)據(jù)GDS4102同樣顯示COL5A2在胰腺癌組織中的表達(dá)量明顯高于正常組織(P<0.05),見圖3h、i。
圖1 Oncomine數(shù)據(jù)庫中COL5A2在不同類型腫瘤研究中的表達(dá)情況
圖2 Oncomine數(shù)據(jù)庫中COL5A2在胰腺癌中的表達(dá)
NCBI/GEO Profiles數(shù)據(jù)庫中GDS5627數(shù)據(jù)顯示,與達(dá)沙替尼敏感細(xì)胞株相比,達(dá)沙替尼耐藥細(xì)胞株中COL5A2的表達(dá)明顯升高(P<0.05)(圖4)。
NCBI/GEO Profiles數(shù)據(jù)庫中GDS4106數(shù)據(jù)顯示(圖5),與未經(jīng)處理的細(xì)胞相比,胰腺癌細(xì)胞株P(guān)anc-1在接受TGF-β處理48 h后,COL5A2的表達(dá)明顯升高(**P<0.01,***P<0.001)。
采用Kaplan-Meier Plotter數(shù)據(jù)庫分析COL5A2表達(dá)量與胰腺癌患者預(yù)后的關(guān)系,結(jié)果顯示COL5A2高、低表達(dá)組胰腺癌患者OS無統(tǒng)計(jì)學(xué)差異(HR=1.45,95%CI:0.96~2.18,P=0.077),但高表達(dá)組胰腺癌患者的RFS明顯差于低表達(dá)組(HR=4.13,95%CI:1.46~11.72,P=0.0045)(圖 6)。
胰腺癌早期缺乏特異性的癥狀與體征,且具有早期侵犯的生物學(xué)特征,如浸潤血管、“圍膽管”和神經(jīng)侵犯,致使大多數(shù)胰腺癌患者在確診時(shí)已屬于中晚期,預(yù)后不良,生存期短,胰腺癌的發(fā)病率幾乎等同于死亡率[17]。因此,闡明胰腺癌的發(fā)生、發(fā)展機(jī)制,尋找關(guān)鍵分子或靶點(diǎn),一直是備受關(guān)注和研究的熱點(diǎn)。
圖3 COL5A2在不同胰腺癌研究芯片中的表達(dá)情況
圖4 COL5A2在達(dá)沙替尼耐藥細(xì)胞株中的表達(dá)情況
圖5 COL5A2在TGF-β處理后的表達(dá)情況
Zhou等[8]通過整合轉(zhuǎn)錄基因組發(fā)現(xiàn)的胰腺癌關(guān)鍵基因COL5A2引起了我們的興趣。早期的多項(xiàng)研究發(fā)現(xiàn)一種少見的遺傳性結(jié)締組織病Ehlers-Danlos綜合征主要與COL5A2等的基因突變有關(guān)[18],近期相關(guān)文獻(xiàn)報(bào)道COL5A2基因參與了多種腫瘤的病理過程。Vargas等[3]通過一系列研究觀察到,與乳腺原位導(dǎo)管腺癌相比,包括COL5A2在內(nèi)的與ECM重塑相關(guān)分子在浸潤性導(dǎo)管腺癌中的表達(dá)明顯升高,提示這些表達(dá)水平的變化可能參與促進(jìn)疾病從原位向浸潤性癌癥的轉(zhuǎn)變,因此可能是疾病發(fā)生發(fā)展過程中的關(guān)鍵點(diǎn)。同樣,F(xiàn)ischer等[4]發(fā)現(xiàn)COL5A2在正常腸黏膜組織中無表達(dá),但在結(jié)直腸癌組織中有表達(dá),提示其可能參與了結(jié)直腸癌的發(fā)生發(fā)展。Zeng等[5]發(fā)現(xiàn)COL5A2低表達(dá)的膀胱癌患者具有良好的臨床病理分型和預(yù)后。當(dāng)然,對于該基因?qū)δ[瘤預(yù)后的影響尚存在一定的分歧。Chen等[2]利用組織芯片發(fā)現(xiàn),與正常組織相比,COL5A1和COL5A2在舌鱗癌組織中高表達(dá),COL5A1高表達(dá)與臨床病理分期較晚和淋巴結(jié)轉(zhuǎn)移密切相關(guān)且預(yù)后較差,而COL5A2高表達(dá)患者預(yù)后良好。因此,研究者認(rèn)為高(COL5A1)2/低(COL5A2)表達(dá)的舌鱗癌患者預(yù)后不良。另外,Januchowski等[7]的研究發(fā)現(xiàn)COL5A2基因可能與卵巢癌細(xì)胞的多藥耐藥有關(guān)。但是,目前國內(nèi)外尚無該基因與胰腺癌的系統(tǒng)研究。
圖6 COL5A2基因表達(dá)與胰腺癌患者預(yù)后的關(guān)系
我們發(fā)現(xiàn)Oncomine數(shù)據(jù)庫中有關(guān)COL5A2在不同胰腺癌研究芯片中表達(dá)情況的研究共7項(xiàng),其中2項(xiàng)研究芯片中表達(dá)量差異無統(tǒng)計(jì)學(xué)意義,考慮可能與單項(xiàng)研究中的樣本量過小有關(guān)。進(jìn)一步對上述7項(xiàng)研究結(jié)果進(jìn)行薈萃分析發(fā)現(xiàn),與正常組織相比,在所有差異表達(dá)基因中COL5A2中位數(shù)值排名為790,并在胰腺癌組織中呈高表達(dá),與NCBI/GEO Profiles數(shù)據(jù)庫的分析結(jié)果一致。采用Kaplan-Meier Plotter數(shù)據(jù)庫分析發(fā)現(xiàn)COL5A2高、低表達(dá)組胰腺癌患者OS無統(tǒng)計(jì)學(xué)差異,但高表達(dá)組胰腺癌患者的RFS明顯差于低表達(dá)組。正如前文所述,胰腺癌是一種病死率高、生存期短的惡性腫瘤,在整體OS較差的情況下,患者的RFS顯得尤為重要。
胰腺癌耐藥一直是臨床面臨的一大難題,因?yàn)槎嗨幠退幍陌l(fā)生,導(dǎo)致胰腺癌治療效果不佳,預(yù)后不良。部分研究認(rèn)為ECM[19]和上皮間質(zhì)轉(zhuǎn)化(epithelial-to-mesenchymal transition,EMT)[20]參與了胰腺癌的耐藥過程。達(dá)沙替尼是Src激酶抑制劑,可用于治療包括胰腺癌在內(nèi)的多種腫瘤[21]。我們通過NCBI/GEO Profiles數(shù)據(jù)庫分析發(fā)現(xiàn),胰腺癌細(xì)胞株P(guān)anc-1在接受TGF-β處理48 h后,COL5A2的表達(dá)明顯升高。與達(dá)沙替尼敏感細(xì)胞株相比,達(dá)沙替尼耐藥細(xì)胞株中COL5A2的表達(dá)也明顯升高。TGF-β是促進(jìn)EMT發(fā)生發(fā)展的一個(gè)重要分子,TGF-β處理后的胰腺癌細(xì)胞中COL5A2表達(dá)升高提示COL5A2的表達(dá)變化可能與EMT過程密切相關(guān),另外,COL5A2同時(shí)也是ECM的主要成分之一,結(jié)合這兩點(diǎn)可以部分解釋達(dá)沙替尼耐藥細(xì)胞株中COL5A2的表達(dá)升高,從而為胰腺癌的耐藥提供了新的思路。當(dāng)然,這些研究僅局限于對數(shù)據(jù)庫中的資料進(jìn)行的二次分析,其具體機(jī)制仍須進(jìn)一步闡明。
綜上所述,COL5A2基因在胰腺癌組織中高表達(dá),且與胰腺癌患者的無復(fù)發(fā)生存和耐藥密切相關(guān),有望成為協(xié)助胰腺癌診斷、治療和評估預(yù)后的生物標(biāo)志物。本研究主要采用數(shù)據(jù)庫進(jìn)行分析,避免樣本量過小產(chǎn)生的誤差,分析結(jié)果可信度較高,但這些數(shù)據(jù)均來自芯片檢測結(jié)果,相關(guān)結(jié)論尚有待后續(xù)驗(yàn)證。