【摘要】目的 基于生物信息學分析溶質(zhì)載體(SLC)15A1基因表達與孤獨癥譜系障礙(ASD)的相關(guān)性,為臨床治療提供參考。方法 使用基因表達公共(GEO)數(shù)據(jù)庫,檢索溶質(zhì)載體相關(guān)基因(SCRGs)和孤獨癥譜系障礙(ASD)患者血液RNA表達譜芯片或測序的研究數(shù)據(jù)集得到2個訓練集(GSE6575、GSE77103數(shù)據(jù)集)和1個驗證集(GSE49105數(shù)據(jù)集),對2個訓練集進行去批次合并處理,將得到的新數(shù)據(jù)集作為本研究的訓練集。對訓練集進行差異表達分析,得到差異基因(DEGs),使用Venny 2.1獲取SCRGs和DEGs的交集靶點溶質(zhì)載體差異基因(DE-SCRGs)并建立DE-SCRGs的關(guān)聯(lián)網(wǎng)絡(luò)圖。對DE-SCRGs進行富集分析,得到其主要參與的生物學過程。通過機器學習方法[LASSO、隨機森林(RF)、支持向量機的遞歸特征消除(SVM-RFE)算法]在驗證集中篩選出生物標志物,并分析生物標志物在ASD中的預(yù)測價值。在訓練集和驗證集中比較ASD男童與健康對照(NC)組研究對象中DE-SCRGs的表達水平差異,在訓練集中比較ASD男童和女童樣本中DE-SCRGs的表達水平差異?;赟LC15A1、SLC5A4、SLC28A3、SLC50A1基因構(gòu)建列線圖,分析以上4個基因的表達水平與ASD發(fā)生的相關(guān)性。結(jié)果 GSE6575和GSE77103數(shù)據(jù)集去批次后數(shù)據(jù)分布較均勻,獲得1 010個DEGs,其中692個在ASD樣本中下調(diào),318個在ASD樣本中上調(diào),并獲得25個DE-SGRGs。關(guān)聯(lián)網(wǎng)絡(luò)圖顯示:27個基因呈102對相關(guān)性,其中SLC15A1基因與其他分析的基因均正相關(guān),具有代表性。GO通路富集分析結(jié)果顯示:DE-SCRGs參與的生物學過程主要是跨膜運輸?shù)裙δ埽籏EGG通路富集分析結(jié)果顯示:DE-SCRGs參與的部分信號通路主要是蛋白質(zhì)消化吸收、氮代謝等過程。通過LASSO、SVM-RFE、RF算法各得到16、16、7個候選特征基因,取交集后得到4個候選基因(SLC15A1、SLC5A4、SLC28A3、SLC50A1)作為生物標志物。受試者操作特征(ROC)曲線分析結(jié)果顯示:4個生物標志物預(yù)測ASD發(fā)生的曲線下面積(AUC)均>0.7,整體模型的AUC=0.896。在訓練集和驗證集中,SLC15A1、SLC28A3、SLC50A1基因的表達趨勢保持一致,SLC5A4基因的表達在驗證集中無差異;訓練集中ASD男童、女童樣本的SLC50A1基因表達有差異。列線圖結(jié)果顯示:SLC15A1基因的表達與ASD的發(fā)生呈負相關(guān)。實驗驗證結(jié)果顯示:ASD組患兒血液樣品中SLC15A1基因表達水平低于NC組(P<0.05)。結(jié)論 SLC15A1基因表達水平與ASD呈負相關(guān),異常表達可降低寡肽物質(zhì)的轉(zhuǎn)運,進而影響ASD的發(fā)生或加重。
【關(guān)鍵詞】溶質(zhì)載體15A1基因;孤獨癥譜系障礙;差異基因
【中圖分類號】R729 【文獻標識碼】A 【文章編號】2096-2665.2024.14.0027.05
DOI:10.3969/j.issn.2096-2665.2024.14.009
孤獨癥譜系障礙(autism spectrum disorder, ASD)是一種具有強遺傳性的多基因疾病,也是復雜的神經(jīng)發(fā)育障礙性疾病,其特點包括社交溝通障礙、重復刻板行為、興趣狹窄等[1-2]。 ASD早期診斷較困難,需綜合觀察兒童的行為、發(fā)展狀況,且醫(yī)生需通過專業(yè)的評估工具和臨床經(jīng)驗判斷并確診,因此,探尋分子層面的易感基因?qū)膊〉脑缙谠\療至關(guān)重要。溶質(zhì)載體(SLC)家族有439個成員,由SLC基因編碼合成,是典型的跨膜蛋白,并基于基因特異性在不同組織細胞中差異性表達[3]。 SLC介導的跨膜運輸包含神經(jīng)遞質(zhì)前體,神經(jīng)遞質(zhì)在大腦中的正常傳遞和平衡對神經(jīng)功能(包括社交行為、認知和情感調(diào)節(jié)等)至關(guān)重要,因此, SLC基因突變與多種ASD表型相關(guān)[4-5]。例如, SLC6A4基因控制5-羥色胺再攝取,其啟動子區(qū)rs25531多態(tài)性與ASD密切相關(guān)[6];在孤獨癥模式大鼠中, SLC9A9基因可通過調(diào)節(jié)神經(jīng)元突觸表面的膜受體分布影響ASD的發(fā)生[7]; SLC6A8基因突變會導致神經(jīng)元攝取肌酸異常,神經(jīng)元的能量代謝失衡會影響神經(jīng)信號的傳遞、神經(jīng)網(wǎng)絡(luò)的發(fā)育和功能,進而導致ASD的發(fā)生[8]。基于此,本研究基于基因表達公共數(shù)據(jù)庫(GEO),利用生物信息學方法,探尋與ASD相關(guān)的溶質(zhì)載體差異基因(DE-SCRGs),并分析其生物學意義,為其基礎(chǔ)研究和臨床應(yīng)用提供參考,現(xiàn)報道如下。
1 材料與方法
1.1 分析流程 搜索GEO中關(guān)于ASD患者血液RNA表達譜芯片或測序的研究數(shù)據(jù),共找到GSE6575、GSE77103、 GSE491053個數(shù)據(jù)集(均包含ASD患兒和健康對照的血液基因表達數(shù)據(jù)),使用GSE6575、GSE77103數(shù)據(jù)集作為訓練集, GSE49105數(shù)據(jù)集作為驗證集。分析流程如下:⑴下載GSE6575、 GSE77103、GSE49105數(shù)據(jù)集。⑵使用sva包中的ComBat函數(shù)對GSE6575和GSE77103數(shù)據(jù)集進行去批次合并處理,處理后作為本研究的訓練集進行后續(xù)分析。⑶在GEO中以“solute carrier”為關(guān)鍵詞,以“Score>15”為篩選閾值,對檢索到的基因進行去重,得到本研究中的溶質(zhì)載體相關(guān)基因(SCRGs)數(shù)據(jù)。⑷通過limma包對訓練集進行差異表達分析,得到差異表達基因(DEGs),使用Venny 2.1軟件獲取SCRGs與DEGs的交集靶點DE-SCRGs,并繪制Venny圖。同時用R包中集群配置文件(clusterProfile)對獲得的DE-SCRGs進行功能富集分析。⑸用機器學習方法[LASSO算法、隨機森林(RF)、支持向量機的遞歸特征消除(SVM-RFE)]篩選出訓練集中的生物標志物。⑹分析生物標志物在ASD中的預(yù)測價值,使用R包“RMS”構(gòu)建生物標志物的列線圖,分析生物標志物與ASD發(fā)生的相關(guān)性,見圖1。
1.2 實驗驗證 ⑴標本采集及處理:選取2021年9月至2023年5月華中科技大學同濟醫(yī)學院附屬武漢兒童醫(yī)院收治的24例ASD的患兒和20例同期健康兒童為研究對象,分別作為ASD組和健康對照(NC)組。樣本的使用遵循人體生物樣本使用倫理規(guī)范[9],所有兒童監(jiān)護人均對標本采集知情同意。采集兩組兒童空腹靜脈血4 mL,加入淋巴細胞分離液,以8 000 r/min(10 cm半徑)離心7 min,分離并收集有核細胞。經(jīng)trizol法提取RNA后立即經(jīng)逆轉(zhuǎn)錄為cDNA第一鏈凍存?zhèn)溆?。⑵定量聚合酶鏈反?yīng)(qPCR)檢測: SLC15A1基因引物F: CAACATCATTGTGCTCATCGTG,R: GTAAGTATAGAACCGAGCCATGATG; β-肌動蛋白(β-actin)引物 F: AGAGCTACGAGCTGCCTGAC, R: AGCACTGTGTTGGCGTACAG。⑶統(tǒng)計學分析:采用2-△△ct法分析結(jié)果數(shù)據(jù),行t檢驗。以P<0.05為差異有統(tǒng)計學意義。
2 結(jié)果
2.1 差異基因的篩選結(jié)果 GSE6575和GSE77103數(shù)據(jù)集去批次后數(shù)據(jù)分布較均勻,見圖2A。在去批次合并處理后的訓練集中共獲得1 010個DEGs,其中692個在ASD樣本中下調(diào), 318個在ASD樣本中上調(diào),見圖2B。將1 010個DEGs和417個SCRGs重疊,得到25個DE-SCRGs,見圖2C。使用“igraph”包建立DE-SCRGs(添加了額外兩個碳酸酐酶基因CA1和CA9)關(guān)聯(lián)網(wǎng)絡(luò)圖,以相關(guān)性|r|>0.3為閾值,該網(wǎng)絡(luò)圖中包含27個基因,分別為SLC44A3、 SLC25A37、 SLC50A1、 SLC1A5、 SLC12A5、SLC24A3、 SLC39A6、 SLC12A3、 SLC36A1、 SLC16A5、 SLC27A4、 SLC13A4、 SLC26A3、 OSCP1、 CA1、 SLC22A12、 SLC35F5、 SLC10A4、 SLC16A1、 SLC28A3、 SLC22A31、 SLC5A4、 SLC7A3、 SLC15A1、 SLCO6A1、 SLC16A8、 CA9,呈102對相關(guān)性,其中SLC15A1與其他分析的基因均呈正相關(guān),具有代表性,見圖2D。
2.2 GO和KEGG通路富集分析結(jié)果 GO通路富集分析結(jié)果顯示, DE-SCRGs參與的生物學過程主要是跨膜運輸?shù)裙δ?,見圖3A; KEGG通路富集分析結(jié)果顯示,DE-SCRGs參與的部分信號通路主要是蛋白質(zhì)消化吸收、氮代謝等過程,見圖3B。
2.3 機器學習方法驗證結(jié)果 通過LASSO算法檢索到16個候選特征基因,分別為SLC15A1、 SLC25A37、SLC5A4、 SLC12A5、 SLC28A3、 SLC7A3、 SLC13A4、SLC10A4、 SLC16A5、 SLCO6A1、 SLC27A4、 OSCP1、SLC16A8、 SLC24A3、 SLC44A3、 SLC50A1,見圖4A。選擇所有特征通過SVM-RFE算法檢索到16個候選特征基因,分別為SLC27A4、 SLC5A4、 SLC44A3、 SLC16A5、OSCP1、 SLC16A8、 SLC50A1、 SLC10A4、 SLC16A1、SLC12A5、 SLC25A37、 SLCO6A1、 SLC13A4、 SLC22A31、SLC28A3、 SLC15A1,結(jié)果為選擇前16個特征時誤差最小,故選這16個特征基因作為候選生物標志物,見圖4B。通過RF算法挖掘出7個候選特征基因,分別為SLC15A1、 SLC5A4、 SLC28A3、 SLC16A1、 SLC35F5、SLC50A1、 SLC26A3,見圖4C。通過重疊機器學習方法對所有獲得的候選特征基因取交集,識別出4個特征基因即為生物標志物,分別為SLC15A1、 SLC5A4、 SLC28A3、 SLC50A1,見圖4D。預(yù)測價值采用受試者操作特征(ROC)曲線進行分析,結(jié)果以曲線下面積(AUC)表示,以AUC>0.7為準確性高。 ROC曲線分析結(jié)果顯示:4個生物標志物預(yù)測ASD發(fā)生的AUC值均>0.7,整體模型的AUC值=0.896,見圖4E。
2.4 DE-SCRGs表達情況及相關(guān)性分析結(jié)果 計算DE-SCRGs在ASD組男童健康對照的血液基因表達數(shù)據(jù)表達水平并作圖。在訓練集和驗證集中, SLC15A1、 SLC28A3、 SLC50A1基因的表達趨勢保持一致, SLC5A4基因的表達在驗證集中無差異,見圖5A、圖5B。進一步比較訓練集中ASD男童、女童樣本的差異基因表達,發(fā)現(xiàn)SLC50A1基因表達有差異,見圖5C。利用“rms”包基于SLC15A1、SLC5A4、 SLC28A3、 SLC50A1基因構(gòu)建列線圖,通過各因素評分推斷ASD發(fā)生率,其中SLC15A1基因的表達水平與ASD的發(fā)生呈負相關(guān),見圖5D。
2.5 實驗驗證結(jié)果 ASD組患兒SLC15A1基因表達水平低于NC組,差異有統(tǒng)計學意義(P<0.05),見圖6。
3 討論
ASD是一種復雜的神經(jīng)發(fā)育障礙,基因在其發(fā)生發(fā)展中起著重要作用,部分基因突變或異常表達(如多個基因上的微小變異、染色體拷貝數(shù)變異等),可影響兒童神經(jīng)發(fā)育過程(包括神經(jīng)元的連接、突觸的形成和功能等)進而影響大腦的正常發(fā)育和功能。在診斷ASD上引入譜系概念,可概括一大類具有不同程度的類似臨床癥狀的綜合征。其功能障礙發(fā)生在中樞神經(jīng)系統(tǒng),相應(yīng)的歸因研究中發(fā)現(xiàn),在大體相同的外部因素下,篩選出疾病易感性相關(guān)的基因表達差異是較為有效的方法[10]。本研究通過生物信息學方法,在已公開的測序和芯片RNA表達數(shù)據(jù)中篩選出ASD相關(guān)的DESCRGs,在此基礎(chǔ)上探索DE-SCRGs作為易感基因的分子基礎(chǔ),并找出可能參與其中的外部誘導因素。
差異基因可視作疾病的易感基因,其負責的功能所涉及的外源性分子可成為疾病易感的外部誘因,SLC15A1負責跨膜轉(zhuǎn)運二肽或三肽等寡肽,理論上如果其負責轉(zhuǎn)運的寡肽出現(xiàn)蓄積可能導致相應(yīng)的病理生理過程[11]。本研究結(jié)果顯示,ASD患兒血液SLC15A1基因表達水平低于NC組研究對象,這提示SLC15A1基因表達不足,會導致神經(jīng)發(fā)育過程中的某些環(huán)節(jié)出現(xiàn)異常,增加 ASD 發(fā)生的風險。分析原因為,SLC15A1基因表達水平降低,會導致血細胞緩沖系統(tǒng)清除血液中二肽類物質(zhì)的能力減弱,使有害二肽進入中樞神經(jīng)系統(tǒng)的含量增加,影響其功能加重ASD癥狀。有研究指出,ASD患者中SLC15A1基因的表達或功能發(fā)生改變,可能影響神經(jīng)遞質(zhì)的傳遞、免疫系統(tǒng)的功能或其他與ASD相關(guān)的生理過程[12-13]。然而,要確定SLC15A1基因表達與ASD發(fā)病的確切相關(guān)性,還需從以下研究方向進行。⑴基因研究:分析更多ASD患者的SLC15A1基因,尋找突變或多態(tài)性,并研究其與ASD的關(guān)聯(lián);⑵功能研究:探究SLC15A1基因表達在神經(jīng)細胞中的具體功能,以及其如何影響神經(jīng)遞質(zhì)的運輸和信號傳導;⑶動物模型:建立SLC15A1基因敲除或突變的動物模型,觀察它們是否表現(xiàn)出類似ASD的行為和生理特征;⑷臨床研究:通過大規(guī)模的臨床研究,確定SLC15A1基因在ASD診斷或治療中的潛在應(yīng)用價值。
綜上所述,SLC15A1基因表達水平與ASD呈負相關(guān),其異常表達可影響寡肽物質(zhì)的轉(zhuǎn)運過程,進而影響ASD的發(fā)生或加重。
參考文獻
MAENNER M J, WARREN Z, WILLIAMS A R, et al. Prevalence and characteristics of autism spectrum disorder among children aged 8 years-autism and developmental disabilities monitoring network, 11 sites, united states, 2020. [J]. MMWR Surveill Summ, 2023, 72(2): 1-14.
韋金盈,方曉慧,陳嘉怡,等.微生物-腸-腦軸機制與孤獨癥譜系障礙[J].臨床與病理雜志, 2023, 3(2): 400-407.
PIZZAGALLI M D, BENSIMON A, SUPERTI-FURGA G.A guide to plasma membrane solute carrier proteins[J]. FEBS J, 2021, 288(9): 2784-2835.
JIANG C C, LIN L S, LONG S, et al.Signalling pathways in autism spectrum disorder: Mechanisms and therapeutic implications[J]. Signal Transduct Target Ther, 2022, 7(1): 229.
MIR A, ALMUDHRY M, ALGHAMDI F, et al. SLC gene mutations and pediatric neurological disorders: Diverse clinical phenotypes in a saudi arabian population[J]. Hum Genet, 2022, 141(1): 81-99.
CHAKRABORTI B, VERMA D, GUHATHAKURTA S, et al. Gender-specific effect of 5-HT and 5-HIAA on threshold level of behavioral symptoms and sex-bias in prevalence of autism spectrum disorder[J]. Front Neurosci, 2020, 13: 1375.
WANG L, WANG B, WU C, et al.Autism spectrum disorder: neurodevelopmental risk factors, biological mechanism, and precision therapy[J]. Int J Mol Sci, 2023, 24(3): 1819.
JAISWAL P, GUHATHAKURTA S, SINGH A S, et al.SLC6A4 markers modulate platelet 5-HT level and specific behaviors of autism: A study from an Indian population[J]. Prog Neuropsychopharmacol Biol Psychiatry, 2015, 56: 196-206.
申潔,劉劍,魯瑞萍.醫(yī)學科研人體標本使用倫理審查分析[J].浙江臨床醫(yī)學, 2015, 17(12): 2223, 2246.
張紅梅,薛曼,王斌,等.孤獨癥譜系障礙早期遺傳診斷和治療研究進展[J].中華精神科雜志,2022,55(3):232-237.
ITO K, HIKIDA A, KAWAI S, et al.Analysing the substrate multispecificity of a proton-coupled oligopeptide transporter using a dipeptide library[J]. Nat Commun, 2013, 4: 2502.
張彤,劉雅楠,曹憲振,等.孤獨癥譜系障礙與氧化應(yīng)激標志物的相關(guān)性研究進展[J].分子診斷與治療雜志, 2023, 15(10): 1846-1850.
安雷婷,楊丁丁,萬向東,等.孤獨癥譜系障礙與神經(jīng)炎癥[J].神經(jīng)解剖學雜志, 2023, 39(4): 481-484.