盛福梅, 連 旭, 韓崇旭1,
(1. 揚州大學(xué)醫(yī)學(xué)院, 江蘇 揚州, 225001; 2. 揚州大學(xué)醫(yī)學(xué)院附屬六合醫(yī)院 檢驗科, 江蘇 南京, 211500;3. 江蘇省蘇北人民醫(yī)院/揚州大學(xué)臨床醫(yī)學(xué)院 醫(yī)學(xué)檢驗科, 江蘇 揚州, 225001)
甲狀腺癌(THCA)是內(nèi)分泌系統(tǒng)常見的惡性腫瘤。近些年, THCA發(fā)病率快速上升,根據(jù)中國癌癥中心網(wǎng)2018年統(tǒng)計[1]顯示, THCA居常見惡性腫瘤的第7位以及女性常見惡性腫瘤的第4位。THCA已成為耳鼻咽喉頭頸外科學(xué)、腺體外科學(xué)、內(nèi)分泌學(xué)和腫瘤學(xué)共同的研究熱點[2]。THCA的發(fā)病率以女性居多,學(xué)者們揭示了在THCA發(fā)生及發(fā)展過程中有著重要影響的體細胞基因的改變,但對相關(guān)基因表達差異對THCA發(fā)病影響的研究較少。本研究運用統(tǒng)計學(xué)方法分析江蘇省揚州地區(qū)THCA患病情況,并用生物信息學(xué)分析篩選參與女性THCA癌變和進展的差異表達基因(DEGs), 以揭示女性THCA發(fā)生發(fā)展的分子機制,尋找具有臨床意義的生物標志物,現(xiàn)報告如下。
收集江蘇省蘇北人民醫(yī)院2020年1—12月診斷為THCA患者的臨床資料,共納入患者1 780例,年齡13~84歲,平均(50.3±11.8)歲。根據(jù)性別分為男性組(n=300)和女性組(n=1 480), 其中男性組年齡13~81歲,平均(52.37±12.70)歲; 女性組年齡13~84歲,平均(49.88±11.60)歲。男性患者占總體的16.85%, 女性患者占83.15%。女性THCA發(fā)病率高于男性,男女發(fā)病的性別比為1∶4.93。
患者均符合美國甲狀腺學(xué)會修訂發(fā)布的《成人甲狀腺結(jié)節(jié)與分化型THCA治療指南(2015)》[3]中THCA的診斷標準。本研究已獲倫理委員會批準(倫理批號: 2021ky028)。
采用統(tǒng)計軟件SPSS 25.0分析數(shù)據(jù),計數(shù)資料以率表示,組間比較采用卡方檢驗,以P<0.05表示差異有統(tǒng)計學(xué)意義。
從GEO數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo)下載基因表達譜數(shù)據(jù)GSE329265, 該芯片為Affymetrix人基因組U133 2.0芯片(HGU133_Plus_2, 安捷倫GPL570平臺)。GSE29265數(shù)據(jù)集共包括THCA組織及癌旁正常組織20對。男性組為男性腫瘤(MT)、男性正常(MN),女性組為女性腫瘤(FT)、女性正常(FN)。通過在線工具GEO2R(https://www.ncbi.nlm.nih.gov/geo/geo2r/), 以P<0.05和|logFC|>2對2組基因表達數(shù)據(jù)進行分析。利用Venn軟件(http://bioinformatics.psb. ugent. be/webtools/Venn/)在線獲取各組上調(diào)基因、下調(diào)基因。logFC>0的DEGs被認為是上調(diào)基因, logFC<0的DEGs被認為是下調(diào)基因。
利用數(shù)據(jù)分析軟件STRING(https://string-db. org/cgi/input. pl)分別對FT和MT差異基因編碼蛋白進行相互作用分析(置信度≥0.4, 互作最大值=0), 并建立PPI網(wǎng)絡(luò)。通過Cytoscape 3.6.0軟件的MCODE 插件從構(gòu)建的PPI 網(wǎng)絡(luò)中選取連接最緊密的模塊進一步分析(設(shè)置參數(shù)為degree=2, node score=0.2, k-core=2, max. depth=100), 模塊所含基因為關(guān)鍵樞紐基因(Hub基因)。
通過在線DAVID網(wǎng)站(https://david.ncifcrf.gov/)對DEGs進行基因本體(GO)功能注釋和京都基因與基因組百科全書(KEGG)通路富集,分析這些基因的生物學(xué)過程、細胞組成、分子功能以及主要涉及的腫瘤相關(guān)通路。
60歲以下年齡段,男性和女性THCA患病率隨年齡增長均呈增高趨勢(男性趨勢χ2=191.1,P<0.000 1; 女性趨勢χ2=562.2,P<0.000 1), 女性THCA 40~49歲年齡段的分布高于男性, ≥60歲年齡段的分布低于男性,差異有統(tǒng)計學(xué)意義(P<0.05 )。見表1。
表1 不同性別THCA年齡分布比較[n(%)]
通過在線工具GEO2R和Venn分析,在MT中檢測到165個差異倍數(shù)達 4 倍以上的顯著DEGs, 包括70個上調(diào)基因和95個下調(diào)基因; 在FT中檢測到163個顯著DEGs, 包括83個上調(diào)基因和80個下調(diào)基因,見圖1。2組共有55個上調(diào)差異基因, 59個下調(diào)差異基因,見圖2。
A: 男性組; B: 女性組。
A: MT、FT上調(diào)差異表達基因; B: MT、FT下調(diào)差異表達基因。MT: 男性腫瘤; FT: 女性腫瘤。
分別將MT、FT中篩選獲得的164、190個差異基因輸入到STRING網(wǎng)站,構(gòu)建各自PPI 網(wǎng)絡(luò)(圖3A、圖4A), 然后用Cytoscape軟件中MCODE 插件提取PPI 網(wǎng)絡(luò)中連接最為緊密的模塊基因。MT中評分最高的模塊包含了8個基因,共形成了28種相互作用關(guān)系,為MT的Hub基因(圖3B)。FT中具有最高連接度的模塊包含了10個Hub基因,共形成25種相互作用關(guān)系(圖4B)。結(jié)果顯示, Hub基因中有SERPINA1、FN1、CHRDL1和GPC34種基因在2組同時存在,其中SERPINA1、FN1為上調(diào)基因,CHRDL1、GPC3為下調(diào)基因;APOE、TIMP1、FAM20A和CDH2在MT中獨立存在,均為上調(diào)基因; 而PROM1、EVA1A、PRSS23、ITGA2、NCAM1和KIT這6個基因在FT中獨立存在,其中PROM1、NCAM1與KIT為下調(diào)基因,EVA1A、PRSS23和ITGA2為上調(diào)基因,提示性別因素對THCA的發(fā)病機制存在一定影響。
A: PPI網(wǎng)絡(luò); B: 模塊分析。圖3 男性DEGs構(gòu)建的PPI網(wǎng)絡(luò)和模塊分析
A: PPI網(wǎng)絡(luò); B: 模塊分析。圖4 女性DEGs構(gòu)建的PPI網(wǎng)絡(luò)和模塊分析
GO分析表明THCA女性組Hub基因:ITGA2、FN1、NCAM1參與細胞黏附生物學(xué)過程;KIT、FN1參與基因表達的正調(diào)控等生物學(xué)過程。SERPINA1、FN1、GPC3、PROM1、PRSS23與細胞外泌體細胞組分相關(guān);FN1、PROM1與內(nèi)質(zhì)網(wǎng)-高爾基體中間區(qū)室細胞組分相關(guān)。SERPINA1、KIT主要分子功能為蛋白酶結(jié)合。KEGG分析顯示FT中DEGs主要富集于3條信號通路,富集于蛋白聚糖腫瘤信號通路的基因有ITGA2、GPC3、FN1; 富集于PI3K-Akt信號通路的基因有ITGA2、KIT、FN1; 富集于癌癥信號通路的基因為ITGA2、KIT、FN1。
THCA是最常見的內(nèi)分泌惡性腫瘤,約占所有內(nèi)分泌惡性腫瘤的90%。流行病學(xué)研究[1]發(fā)現(xiàn),女性THCA患病率顯著高于男性,其原因尚不明確?;蛲蛔兪荰HCA發(fā)生發(fā)展的重要因素之一,并與其疾病診斷、預(yù)后評估及分子靶向藥物治療密切相關(guān)。
本研究分析揚州地區(qū)1 780例THCA患者臨床資料,發(fā)現(xiàn)女性THCA發(fā)病率高于男性,男、女發(fā)病的性別比為1∶4.93。60歲以下人群中,男、女THCA患病率隨年齡增長均呈增高趨勢。女性THCA 40~49歲年齡段的分布高于男性, ≥60歲年齡段的分布卻低于男性,差異有統(tǒng)計學(xué)意義(P<0.05)。研究[4]顯示女性THCA患病率約為男性的3倍,并發(fā)現(xiàn)雌激素可能是甲狀腺良惡性細胞的一種有效生長因子。RUBIO G A等[5]實驗發(fā)現(xiàn),絕經(jīng)后雌激素受體α表達增加可能與甲狀腺乳頭狀癌的侵襲有關(guān),這與本研究結(jié)果一致,女性THCA的發(fā)病率隨年齡增長逐漸增加,絕經(jīng)后開始呈下降趨勢。本研究篩選女性組和男性組內(nèi)差異表達基因,建立各自組內(nèi)的PPI網(wǎng)絡(luò),從中將聯(lián)系最緊密的一個模塊基因提取出來作為關(guān)鍵基因研究。篩選2組共同表達的差異基因,并鑒定為非性別差異性基因, 4個為MT特有基因, 6個FT特有基因。6個FT特有基因為:KIT、EVA1A、ITGA2、NCAM1、PROM1和PRSS23, 其表達水平變化可能在女性THCA的發(fā)生發(fā)展中起關(guān)鍵作用。
KIT基因編碼Ⅲ型受體酪氨酸激酶,其在造血、黑色素的生成、精子的生成以及Cajal間質(zhì)細胞的發(fā)育中起多種作用,并已證實其激活突變與多種腫瘤類型相關(guān)[6-7]。研究[8]表明,與良性甲狀腺組織相比,甲狀腺惡性病變中的KIT基因表達降低,這與本研究中女性組KIT基因低表達一致。在正常甲狀腺上皮轉(zhuǎn)化為腫瘤細胞的過程中,KIT基因表達低下,提示該基因可能參與甲狀腺細胞的分化和腫瘤的進展。EVA1A基因位于染色體2p12, 是一種新型的溶酶體和內(nèi)質(zhì)網(wǎng)相關(guān)蛋白表達基因,參與自噬和細胞凋亡[9]。研究[10-11]證明,EVA1A基因在肝細胞癌和非小細胞肺癌中低表達,且通過自噬、凋亡抑制腫瘤細胞的生長。在結(jié)腸腺癌以及彌漫性大B細胞淋巴瘤中,癌組織中的EVA1A基因表達明顯高于在正常組織中的表達。LIN B Y[12]等發(fā)現(xiàn)EVA1A是增強THCA侵襲性的有效癌基因。
ITGA2基因編碼整合素蛋白α2, 該蛋白與β亞基形成異源二聚體,主要介導(dǎo)細胞內(nèi)外信號傳導(dǎo),在腫瘤浸潤、侵襲和轉(zhuǎn)移中發(fā)揮重要作用[13]。研究[14-16]表明ITGA2的表達與癌癥的轉(zhuǎn)移及預(yù)后相關(guān),許多組學(xué)研究已將ITGA2作為胃癌、前列腺癌及乳腺癌早期診治及預(yù)后分析的潛在分子標志物。CHERNAYA G等[17]發(fā)現(xiàn)在甲狀腺乳頭狀癌(PTC )組織中,ITGA2基因表達水平高于正常甲狀腺組織,并通過實驗發(fā)現(xiàn)侵襲性PTC中miR-16的下調(diào)導(dǎo)致ITGA2基因表達上調(diào),從而促進腫瘤的入侵和遷移。 神經(jīng)細胞黏附分子(NCAM1)是一種膜蛋白表達基因,主要在神經(jīng)系統(tǒng)中表達。實驗[18-19]發(fā)現(xiàn),NCAM1異常表達與多種癌癥的發(fā)生發(fā)展有關(guān),如急性髓細胞性白血病和小細胞肺癌[19]。NCAM1同樣存在于正常甲狀腺組織的濾泡上皮細胞中, GOLU I等[20]發(fā)現(xiàn)NCAM1的表達可使PTC與非腫瘤性病變的其他甲狀腺疾病區(qū)分開,具有非常好的敏感性,并認為標志物NCAM1在診斷PTC時,具有評估邊界病變的發(fā)展?jié)摿Α?/p>
由PROM1基因編碼的CD133是一種戊聚糖跨膜糖蛋白,具有作為泛癌靶標的巨大潛力,其通常與包括THCA在內(nèi)的多種不同腫瘤類型的癌癥干細胞有關(guān)[21-22]。研究[23]發(fā)現(xiàn),乙酰膽堿通過激活CD133-Akt途徑增高CD133的表達量,從而提高THCA細胞的自我更新和免疫逃逸能力。PRSS23是一種新發(fā)現(xiàn)的絲氨酸蛋白酶基因,與多種類型的癌癥進展有關(guān),如卵巢癌、胃癌[24-25], 敲低PRSS23基因可抑制EIF2信號傳導(dǎo),進而在體內(nèi)外抑制胃癌的生長。目前暫未有研究發(fā)現(xiàn)PRSS23與THCA的相關(guān)性。上述均提示該6個基因與THCA有較為密切的聯(lián)系本研究進一步運用GO和KEGG富集分析,發(fā)現(xiàn)女性組DEGs對細胞黏附、基因表達的正調(diào)控等生物學(xué)過程有一定影響,并參與PI3K-Akt、蛋白聚糖腫瘤、癌癥等信號通路的調(diào)控。PI3K-Akt信號傳導(dǎo)途徑被認為是癌癥的主要調(diào)控因子[26]。研究[27]表明, Akt 作為PI3K-Akt信號通路的關(guān)鍵分子,可使細胞周期激酶抑制劑失活,從而促進細胞的生長及腫瘤的生成。同時,該通路的異常活化促進腫瘤細胞的增殖、分化及轉(zhuǎn)移。因此,監(jiān)測該通路可有助于預(yù)測女性THCA的進展。
綜上所述,本研究分析了揚州地區(qū)THCA患者的臨床資料,篩選出THCA性別差異基因,有助于闡明女性THCA發(fā)生發(fā)展的分子機制,并為潛在的生物標志物提供理論依據(jù),但后續(xù)還需分子生物學(xué)研究來驗證結(jié)果。