區(qū)錦濤,吳 東,黃 丹,李 文* (.廣東醫(yī)科大學(xué),廣東湛江 5403;.廣東醫(yī)科大學(xué)附屬醫(yī)院,廣東湛江 5400)
吸煙是全世界最主要的公共衛(wèi)生問題之一。在中國約有3.2億吸煙者[1]。煙草煙霧中包含了超過7 000種化合物,主動(dòng)或被動(dòng)煙霧暴露可導(dǎo)致多種呼吸系統(tǒng)疾病[2-3]。如慢性阻塞性肺疾病(COPD)最常見的環(huán)境危險(xiǎn)因素是吸煙,與不吸煙者相比,吸煙者更容易出現(xiàn)呼吸系統(tǒng)癥狀和肺功能異常[4]。金屬硫蛋白(MT)是一類低分子量的蛋白家族,以重金屬和半胱氨酸含量高為主要特征。MT有重金屬解毒的功能,同時(shí)還具有抗氧化和抑制炎癥反應(yīng)的作用[5-6]。miRNA是長度約20個(gè)核苷酸的單鏈非編碼RNA,其在轉(zhuǎn)錄后調(diào)節(jié)基因表達(dá)的作用已引起廣泛關(guān)注[7]。hsa-miR-4722-5p于2011年 被Persson等[8]測(cè)序和鑒定,但目前仍未有其與COPD相關(guān)的研究。本文利用公共基因表達(dá)綜合數(shù)據(jù)庫(GEO),運(yùn)用大樣本量的整合分析和生物信息學(xué)方法,探討吸煙對(duì)MT表達(dá)的影響及其潛在機(jī)制。
在GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/) 中獲取GSE97010和GSE14383矩陣數(shù)據(jù)。GSE-97010用于探索急性煙霧暴露對(duì)氣道基因表達(dá)的影響;GSE14383用于研究人支氣管上皮細(xì)胞長期暴露于低劑量香煙煙霧冷凝物(CSC)的影響。使用R語言GEOquery、Biobase、Bioc Generics和AnnotationDbi包,按以下標(biāo)準(zhǔn)進(jìn)行探針過濾和基因映射:(1)排除無效和多基因注釋探針;(2)如果一個(gè)基因有多個(gè)探針,則選擇表達(dá)平均值最大的探針。對(duì)MT基因表達(dá)值進(jìn)行l(wèi)og2轉(zhuǎn)換后,使用GraphPad Prism 8軟件繪制GSE97010矩陣急性煙霧暴露后MT表達(dá)差異、GSE14383矩陣CSC組與對(duì)照組MT表達(dá)差異。矩陣GSE97010急性煙霧暴露后與自身基礎(chǔ)狀態(tài)的比較進(jìn)行配對(duì)t檢驗(yàn),P<0.05表示差異有統(tǒng)計(jì)學(xué)意義。
1.2.1 獲取和篩選微陣列數(shù)據(jù) 查詢GEO公共功能基因組數(shù)據(jù)庫(www.ncbi.nlm.nih.gov/geo/)進(jìn)行篩選,關(guān)鍵字為“smoker”或“smoke”,選擇物種為“Homo sapiens”。 篩選標(biāo)準(zhǔn)依次為:(1)納入初始矩陣的獨(dú)占樣本,確保后續(xù)矩陣中被重新分析的樣本不會(huì)被重新納入;(2)檢測(cè)樣本取自氣道;(3)包含吸煙組與不吸煙組;(4)每組受試者人數(shù)3人及以上;(5)矩陣的基因表達(dá)值不能為零或 “不可用(NA)” 。19個(gè)基因矩陣(GSE10006、GSE10135、GSE11784、GSE11906、 GSE14633、 GSE19027、 GSE19722、GSE22047、 GSE3320、 GSE4302、 GSE43079、GSE43939、 GSE4498、 GSE5056、 GSE5057、GSE5059、GSE7895、GSE8545、GSE994)的753個(gè)獨(dú)占樣本被選出并用于整合分析。19個(gè)矩陣及其753個(gè)獨(dú)占樣本見表1。
1.2.2 探針過濾和基因映射 使用R語言GEOquery、Biobase、BiocGenerics和AnnotationDbi包,按以下標(biāo)準(zhǔn)進(jìn)行探針過濾和基因映射:(1)排除無效和多基因注釋探針;(2)如果一個(gè)基因有多個(gè)探針,則選擇表達(dá)平均值最大的探針。對(duì)MT基因表達(dá)值進(jìn)行l(wèi)og2轉(zhuǎn)換。
1.2.3 組內(nèi)相關(guān)系數(shù)(ICC) 選擇矩陣GSE22047中7位受試者的大、小氣道MT表達(dá)值,使用R語言irr包計(jì)算雙向隨機(jī)/混合模型、絕對(duì)一致性計(jì)算類型、單一度量的組內(nèi)相關(guān)系數(shù)[ICC(A,1)]作為衡量大、小氣道MT表達(dá)值一致性和可靠性的指標(biāo),并進(jìn)行F檢驗(yàn)。ICC取值在0~1,ICC<0.2說明一致性程度較差,0.2~0.4說明一致性程度一般,0.5~0.6說明一致性程度中等,0.7~0.8說明一致性程度較強(qiáng),0.9~1.0說明一致性程度很強(qiáng);P<0.05表示拒絕大、小氣道MT表達(dá)不一致的虛無假設(shè)。
表1 19個(gè)矩陣的基本特征
1.2.4 統(tǒng)計(jì)分析 使用篩選得到的19個(gè)微陣列矩陣、753個(gè)獨(dú)占樣本的基因表達(dá)值,對(duì)各矩陣吸煙與不吸煙組的表達(dá)差異進(jìn)行整合分析,使用R語言meta、metafor包進(jìn)行異質(zhì)性檢驗(yàn)統(tǒng)計(jì)量法的Q檢驗(yàn)、I2檢驗(yàn)、H檢驗(yàn)以評(píng)估各矩陣的異質(zhì)性,計(jì)算逆方差(IV)加權(quán)的標(biāo)準(zhǔn)化均數(shù)差(SMD);根據(jù)Cochrane干預(yù)措施系統(tǒng)評(píng)價(jià)手冊(cè)(version 5.0.1)及組內(nèi)相關(guān)系數(shù)分析結(jié)果,采用固定效應(yīng)模型(FEM)進(jìn)行敏感性分析;采用漏斗圖不對(duì)稱的加權(quán)線性回歸檢驗(yàn)評(píng)估發(fā)表偏倚。pval.Q<0.05表示矩陣間可能有顯著異質(zhì)性;0% 進(jìn)一步篩選表1的19個(gè)矩陣,設(shè)定自變量x為吸煙者的packyear指數(shù)(吸煙指數(shù)=packyear×20),因變量y為吸煙者氣道MT表達(dá)值與不吸煙者平均值的log2變化倍數(shù),建立過原點(diǎn)(0,0)的線性回歸模型,斜率(即回歸系數(shù))為自變量x對(duì)因變量y干預(yù)效應(yīng)的大小,斜率非零的P值用于評(píng)估干預(yù)效應(yīng)的顯著性。建立吸煙者與不吸煙者氣道MT基因的表達(dá)差異與吸煙指數(shù)的線性回歸模型,并假設(shè)誤差服從均值為0的正態(tài)分布,自變量x、因變量y的注釋如下: 其中ai為不吸煙者的氣道MT表達(dá)值,bj、dj為吸煙者的氣道MT表達(dá)值、packyear指數(shù)。248個(gè)吸煙者、14個(gè)MT家族基因共2 473個(gè)點(diǎn),使用GraphPad Prism 8軟件將2 473個(gè)點(diǎn)繪制散點(diǎn)圖,建立線性回歸模型,假設(shè)0 packyear指數(shù)的吸煙者氣道MT表達(dá)值與不吸煙者相等并強(qiáng)制線性回歸方程經(jīng)過原點(diǎn)(0,0),采用GraphPad Prism 8軟件分析線性回歸方程結(jié)果。 使用miRDB的自定義預(yù)測(cè)功能預(yù)測(cè)靶向16個(gè)MT的miRNA,CLUSTAL W軟件對(duì)16個(gè)MT的信使RNA進(jìn)行多序列比對(duì)。 基因表達(dá)矩陣數(shù)據(jù)集GSE97010對(duì)63名吸煙者在急性吸煙暴露后與自身基礎(chǔ)狀態(tài)的氣道MT表達(dá)進(jìn)行比較,發(fā)現(xiàn)除MT3外所有MT亞型表達(dá)均增高,其中MT1B、MT1H、MT1IP、MT1L、MT1M、MT1X和MT4的mRNA顯著上調(diào)(P<0.05或0.01)。見圖1。 圖1 急性煙霧暴露后MT的表達(dá) 基因表達(dá)矩陣數(shù)據(jù)集GSE14383顯示,CSC能夠誘導(dǎo)BEAS-2B細(xì)胞MT1和MT2的表達(dá),而MT3和MT4的變化則不顯著。見圖2。 圖2 CSC對(duì)MT的影響 矩陣GSE22047的7位受試者大、小氣道MTICC(A,1)的中位數(shù)為0.8558。F檢驗(yàn)P<0.05,拒絕虛無假設(shè),大、小氣道MT表達(dá)高度一致且可信度高。見表2。 整合分析結(jié)果顯示:MT1G和MT3可能有顯著異質(zhì)性但其效應(yīng)較低,只有MT1F可能存在中度異質(zhì)性或?qū)嵸|(zhì)性異質(zhì)性。吸煙組氣道MT1、MT2和MT3被顯著抑制,而長期煙霧暴露對(duì)MT4無顯著的干預(yù)效應(yīng)。敏感性分析在每次刪除1個(gè)矩陣數(shù)據(jù)后將重新計(jì)算的SMD與原SMD比較,沒有發(fā)現(xiàn)有任何一個(gè)矩陣在本次整合分析中起關(guān)鍵作用,發(fā)表偏倚不顯著。見表3。 由表4可知:樣本量>200的MT1、MT2、MT3線性回歸方程斜率<0且顯著非零,提示吸煙者氣道MT1、MT2、MT3的表達(dá)與吸煙指數(shù)呈顯著負(fù)相關(guān)(P<0.05),吸煙指數(shù)對(duì)氣道MT4表達(dá)的干預(yù)效應(yīng)不顯著(P>0.05)。 所有MT1、MT2、MT3亞型的miRNA預(yù)測(cè)結(jié)果的交集為hsa-miR-4722-5p,MT1、MT2、MT3亞型的信使RNA序列包含3~5個(gè)“CTCCTGC”片段,可與hsa-miR-4722-5p種子區(qū)域匹配,MT4的信使RNA序列未發(fā)現(xiàn)hsa-miR-4722-5p種子區(qū)域結(jié)合位點(diǎn)。hsa-miR-4722-5p可能參與MT1、MT2、MT3基因轉(zhuǎn)錄后調(diào)控。 盡管已有研究證明吸煙者氣道MT的表達(dá)被抑制,但很少有文獻(xiàn)詳細(xì)報(bào)道急、慢性煙霧暴露的氣道MT有相反的表達(dá)趨勢(shì):矩陣GSE97010和GSE 14383分析所示,急性煙霧暴露和低劑量煙霧冷凝物能夠上調(diào)所有的MT1和MT2。我們根據(jù)公開的GEO矩陣數(shù)據(jù)集,通過對(duì)大量樣本的吸煙者與不吸煙者氣道MT表達(dá)譜進(jìn)行整合分析,更加準(zhǔn)確地評(píng)估了慢性煙霧暴露對(duì)氣道MT的抑制效應(yīng)。 表2 矩陣GSE22047的7名受試者大、小氣道MT表達(dá)的一致性 表3 MT表達(dá)差異的整合分析結(jié)果 圖3 吸煙者氣道MT變化倍數(shù)與packyear指數(shù)的關(guān)系 表4 吸煙者氣道MT變化倍數(shù)與packyear指數(shù)線性回歸模型的特征 圖4 hsa-miR-4722-5p靶向MT1、MT2、MT3的結(jié)合位點(diǎn) 研究發(fā)現(xiàn),與不吸煙者相比,吸煙者血液、腎臟、肝臟組織的MT mRNA和蛋白水平均升高,而上升的肺MT在持續(xù)煙霧暴露后又將降至正常[12]。尸體解剖亦發(fā)現(xiàn)重度吸煙者的肺MT表達(dá)下降,表明慢性煙霧暴露能夠特異性降低肺/氣道MT的表達(dá),導(dǎo)致氣道對(duì)氧化應(yīng)激的敏感性增高,造成活性氧積累,破壞呼吸系統(tǒng)正常的修復(fù)和防御機(jī)制[13]。本研究首次證明了慢性吸煙者氣道MT1、MT2、MT3亞型的表達(dá)與吸煙指數(shù)顯著負(fù)相關(guān)。亦有研究證實(shí)吸煙者被抑制的MT即使在戒煙后仍難以回升,提示MT可能是COPD等吸煙相關(guān)肺疾病發(fā)生、發(fā)展的關(guān)鍵,可作為監(jiān)測(cè)吸煙強(qiáng)度的標(biāo)志物[14-15]。 本研究使用生物信息學(xué)方法探索了慢性煙霧暴露抑制氣道MT1、MT2、MT3表達(dá)的潛在機(jī)制。根據(jù)miRDB預(yù)測(cè)結(jié)果和CLUSTAL W多序列比對(duì),MT1、MT2、MT3的信使RNA高度同源,且包含“CTCCTGC”序列可與hsa-miR-4722-5p種子區(qū)域相匹配,較好地解釋了MT1、MT2、MT3同步下降及MT4無顯著變化的原因。但迄今為止,尚未有研究報(bào)道MT蛋白家族與hsa-miR-4722-5p的關(guān)系。 總之,本研究證實(shí)了慢性煙霧暴露能夠顯著抑制吸煙者氣道MT1、MT2、MT3亞型表達(dá),且與吸煙指數(shù)呈顯著負(fù)相關(guān)。慢性煙霧暴露可能通過hsamiR-4722-5p抑制氣道MT1、MT2、MT3。MT和hsamiR-4722-5p或可為減少吸煙損傷和預(yù)防COPD等吸煙相關(guān)肺疾病的發(fā)展提供新的治療靶點(diǎn)。1.3 建立線性回歸模型
1.4 miRNA預(yù)測(cè)[10-11]
2 結(jié)果
2.1 急性煙霧暴露和CSC對(duì)MT的影響
2.2 長期煙霧暴露對(duì)氣道MT1、 MT2和MT3表達(dá)的影響
2.3 吸煙指數(shù)對(duì)氣道MT1、MT2和MT3的影響
2.4 hsa-miR-4722-5p對(duì)長期煙霧暴露氣道MT1、MT2、MT3的影響
3 討論