冉卓楠 劉潔星 王芬 信彩巖 沈湘 曾山 宋章永 熊彬
隨著高通量測(cè)序技術(shù)的發(fā)展,研究[1]發(fā)現(xiàn)健康人肺部存在大量微生物定植,一些無(wú)法通過(guò)傳統(tǒng)培養(yǎng)法培養(yǎng)出的菌種可通過(guò)高通量測(cè)序檢出。目前有研究[2]表明肺部微生物菌群與口腔菌群微吸入有關(guān)。既往多項(xiàng)研究證實(shí)肺部微生物菌群與呼吸系統(tǒng)疾病如哮喘[3]、慢性阻塞性肺疾病[4,5]、肺囊性纖維化[6]等疾病的發(fā)生密切相關(guān)。
肺癌是一種惡性腫瘤,在世界范圍內(nèi)發(fā)病率、死亡率均較高,非小細(xì)胞肺癌(non-small cell lung cancer,NSCLC)患者5年生存率僅為21%,小細(xì)胞肺癌(small cell lung cancer, SCLC)患者5年生存率則僅為7%[7]。肺癌的臨床癥狀出現(xiàn)晚,早期缺乏特異性篩查手段是其死亡率高的原因之一[8]。流行病學(xué)證據(jù)[9]表明,反復(fù)使用抗生素與增加肺癌風(fēng)險(xiǎn)之間存在關(guān)聯(lián),但肺部微生物菌群對(duì)肺癌的影響尚不清楚。有一項(xiàng)研究[10]表明肺癌患者化療期間院內(nèi)感染率可達(dá)44.77%。已有多項(xiàng)研究[11-13]證實(shí)肺癌患者肺部微生態(tài)較健康人群發(fā)生變化。但對(duì)于不同組織學(xué)類(lèi)型肺癌之間肺部微生態(tài)差異性研究仍較少,特別是缺乏關(guān)于SCLC患者肺部微生態(tài)研究。
為明確不同組織學(xué)類(lèi)型肺癌患者肺部微生物組成差異性,探討臨床變量與實(shí)驗(yàn)數(shù)據(jù)之間的相關(guān)性,篩選可能存在的肺癌微生物標(biāo)志物,本研究采用Illumina HiSeq測(cè)序平臺(tái)對(duì)晚期肺癌患者痰樣本進(jìn)行細(xì)菌16S rDNA的V3-V4區(qū)測(cè)序及生物信息學(xué)分析。
1.1 試劑及儀器 FastDNA SPIN kit試劑盒;二硫蘇糖醇;甲醇;熒光劑;臺(tái)式離心機(jī);振蕩器;水浴鍋;電泳儀;凝膠成像系統(tǒng);Illumina HiSeq高通量測(cè)序由北京百邁客公司完成。
1.2 受試者招募 招募西南醫(yī)科大學(xué)附屬醫(yī)院呼吸與危重癥醫(yī)學(xué)科2018年10月-2019年9月收治的肺癌患者。納入標(biāo)準(zhǔn):①西南醫(yī)科大學(xué)附屬醫(yī)院呼吸與危重癥醫(yī)學(xué)科收治的晚期肺癌患者;②年齡40歲-75歲;③組織學(xué)確診肺癌;④所有患者對(duì)本研究知情同意。排除標(biāo)準(zhǔn):①長(zhǎng)期使用免疫抑制劑史;②胸腔手術(shù)史;③自身免疫性疾病病史;④氣管插管、有創(chuàng)/無(wú)創(chuàng)機(jī)械通氣操作史;⑤口腔疾病病史。
1.3 樣本收集 囑患者漱口清潔口腔后取痰樣本于無(wú)菌杯中,將收集好的樣本置于干冰保溫盒內(nèi)運(yùn)送至實(shí)驗(yàn)室,放置于-80oC保存。統(tǒng)一將采集好的樣本從-80oC冰箱取出,放置于冰上解凍。樣本預(yù)處理:采用甲醇及二硫蘇糖醇對(duì)采集好的痰樣本進(jìn)行預(yù)處理:30%甲醇5 mL+甲醇-二硫蘇糖醇(30%甲醇1 mL+二硫蘇糖醇0.24 g)500 μL溶解15 min,20,000 rpm離心10 min,棄掉上清液,剩余物質(zhì)用于DNA提取。
1.4 宏基因組的提取、保存及測(cè)序 采用FastDNA SPIN kit試劑盒對(duì)預(yù)處理的痰樣本進(jìn)行DNA提取(提取步驟詳見(jiàn)試劑盒說(shuō)明書(shū))。使用80 μL DES洗脫保存DNA,將提取DNA進(jìn)行電泳,電泳產(chǎn)生明亮條帶則DNA提取成功。將提取DNA -20oC冰箱保存。將保存于-20oC的DNA同時(shí)上機(jī)測(cè)序:根據(jù)保守區(qū)設(shè)計(jì)得到引物,在引物末端加上測(cè)序接頭,進(jìn)行PCR擴(kuò)增并對(duì)其產(chǎn)物進(jìn)行純化、定量和均一化,形成測(cè)序文庫(kù),建好的文庫(kù)先進(jìn)行文庫(kù)質(zhì)檢,質(zhì)檢合格的文庫(kù)用Illumina HiSeq 2500進(jìn)行測(cè)序。高通量測(cè)序得到的原始圖像數(shù)據(jù)文件,經(jīng)堿基識(shí)別分析轉(zhuǎn)化為原始測(cè)序序列,結(jié)果以FASTQ文件格式存儲(chǔ)。
1.5 統(tǒng)計(jì)學(xué)分析 使用FLASH v1.2.7軟件對(duì)每個(gè)樣品的序列進(jìn)行拼接,得到的拼接序列即原始數(shù)據(jù);使用Trimmomatic v0.33軟件,對(duì)拼接得到的原始數(shù)據(jù)進(jìn)行過(guò)濾,使用UCHIME v4.2軟件,鑒定并去除嵌合體序列,得到最終有效數(shù)據(jù);使用QIIME(version 1.8.0)軟件對(duì)序列的相似度為97%的水平下進(jìn)行聚類(lèi)、獲得操作分類(lèi)單元(operational taxonomic units, OTU),基于OTU分析結(jié)果,進(jìn)行物種豐度統(tǒng)計(jì);對(duì)數(shù)據(jù)進(jìn)行樣品多樣性及差異性分析(分類(lèi)學(xué)注釋、Alpha多樣性分析、Beta多樣性分析、樣品差異分析),發(fā)掘臨床變量與實(shí)驗(yàn)數(shù)據(jù)之間的相關(guān)性。
2.1 樣本特點(diǎn)及測(cè)序質(zhì)量 一共收集到18例肺癌患者合格痰樣本18個(gè)(n=18),其中按照組織學(xué)分類(lèi):腺癌(adenocarcinoma, AD)患者樣本6個(gè),SCLC樣本2個(gè),鱗狀細(xì)胞癌(squamous cell carcinoma, SCC)患者樣本7個(gè),混合型小細(xì)胞肺癌(combined-SCLC, C-SCLC)樣本3個(gè)。所有患者中14例有吸煙史,4例有化療藥物治療史,具體患者信息見(jiàn)表1。18個(gè)樣本共獲得1,065,790條原始序列,拼接、過(guò)濾后共產(chǎn)生900,016條優(yōu)質(zhì)序列,平均長(zhǎng)度為424 bp。所有樣本測(cè)序有效序列占測(cè)得序列數(shù)百分比均大于70%,所有樣本平均序列長(zhǎng)度415 bp-427 bp,質(zhì)量值≥30的堿基占總堿基數(shù)的百分比為91.81%-94.83%,具體樣本測(cè)序質(zhì)量見(jiàn)表2。
2.2 物種豐度統(tǒng)計(jì) 使用QIIME(version 1.8.0)軟件中的UCLUST對(duì)序列在97%的相似度水平下進(jìn)行聚類(lèi)、根據(jù)序列不同的相似度水平,對(duì)所有序列進(jìn)行OTU劃分所有樣本共獲得371個(gè)OTU,其中SCLC樣本OTU平均值最高,AD組次之,而樣本量最大的SCC組OTU值最小。SCLC樣本OTU平均值最高n=210.500,AD組n=204.667,C-SCLC組n=182.667,SCC組OTU值最小n=160.143。
根據(jù)OTU統(tǒng)計(jì)出各樣品中各等級(jí)的注釋到物種的序列數(shù),最終得到每組樣本的門(mén)(圖1A)、屬(圖1C)、種(圖1E)平均數(shù)。18個(gè)樣本一共發(fā)現(xiàn)物種216種,不同組織學(xué)類(lèi)型肺癌組物種平均數(shù)AD組物種平均值最高,SCLC組次之,而SCC組物種平均值最小。不同組織學(xué)類(lèi)型肺癌其主要細(xì)菌種類(lèi)不同,AD組以厚壁菌門(mén)及擬桿菌門(mén)為主;SCC組及C-SCLC組以厚壁菌門(mén)為主,SCLC組以擬桿菌門(mén)為主,變形菌門(mén)次之(圖1B)??梢?jiàn)SCLC肺部菌落組成與其他類(lèi)型肺癌有較大區(qū)別。屬水平方面:AD組以鏈球菌屬及奈瑟氏菌屬為主,其次為韋榮氏球菌屬,SCLC組以奈瑟氏菌屬為主,其次為鏈球菌屬,SCC組以鏈球菌屬為主,其次為奈瑟氏菌屬,C-SCLC組以鏈球菌屬為主,其次為普雷沃氏菌屬(圖1D),總體上,肺癌患者痰樣本中鏈球菌屬仍占主要地位。在種水平上,肺炎鏈球菌是肺癌患者痰樣本中的主要菌種,其次為韋榮氏菌及奈瑟氏菌(圖1F)。
2.3 多樣性分析 使用Mothur(version v.1.30)軟件,對(duì)樣品Alpha多樣性指數(shù)進(jìn)行評(píng)估。結(jié)果顯示:SCLC樣本生物多樣性最大,其次為AD,C-SCLC次之,而SCC樣本生物多樣性最小,詳見(jiàn)表3。
使用QIIME軟件對(duì)數(shù)據(jù)進(jìn)行Beta多樣性分析。采用非加權(quán)組平均法(unweighted pair-group method with arithmetic mean, UPGMA)對(duì)數(shù)據(jù)進(jìn)行分析。結(jié)果顯示:SCLC組內(nèi)差異較小,C-SCLC組內(nèi)差異較大,SCC與AD組間差異較大,C-SCLC與其他類(lèi)型肺癌組組間差異最大,而SCLC標(biāo)本與AD組間差異較小。
利用置換多元方差分析(Anosim)對(duì)不同分組的樣品之間Beta多樣性是否有顯著差異進(jìn)行檢驗(yàn)。圖3顯示R值為0.233,提示組間差異顯著,C-SCLC與其他組織類(lèi)型肺癌組差異尤其顯著,AD最大值與最小值差值較小,且上四分位數(shù)與下四分位數(shù)差值較小,提示組內(nèi)差異較小,而SCC組內(nèi)差異較大(P<0.05)。
2.4 組間差異顯著性分析 為研究?jī)山M樣品間微生物群落豐度的差異,利用Metastats軟件對(duì)組間的物種豐度數(shù)據(jù)進(jìn)行T檢驗(yàn)。結(jié)果顯示:普雷沃氏菌屬(Prevotella)、慢生根瘤菌(Bradyrhizobium)在AD與SCLC樣本中豐度具有明顯差異(P<0.05),擬普雷沃菌屬(Alloprevotella)、硫桿菌屬(Desulfovibrio)在AD與SCC中豐度具有明顯差異(P<0.05),奈瑟菌屬(Neisseria)、孿生球菌屬(Gemella)、甲基桿菌屬(Methylobacterium)在AD與C-SCLC中豐度具有明顯差異(P<0.05),普雷沃氏菌屬(Prevotella)、鞘氨醇單胞菌屬(Sphingomonas)、鏈球菌屬(Streptococcus)在SCLC與SCC中豐度具有明顯差異(P<0.05),普雷沃氏菌(Prevotella)、沉積物桿狀菌屬(Sediminibacterium)在SCLC與C-SCLC中豐度具有明顯差異(P<0.05),沉積物桿狀菌屬(Sediminibacterium)、梭桿菌屬(Fusobacterium)、奈瑟菌屬(Neisseria)在SCC和C-SCLC中豐度具有明顯差異(P<0.05)。為尋找可能存在的不同肺癌類(lèi)型的生物標(biāo)志物,我們采用組間樣品LEfSe分析[Line Discriminant Analysis (LDA) Effect Size]對(duì)不同分組數(shù)據(jù)進(jìn)行分析篩選,C-SCLC中篩選出一種具有統(tǒng)計(jì)學(xué)意義的生物標(biāo)志物Candidatusterrybacteria(圖4),該菌種具體在C-SCLC中發(fā)揮什么樣的作用,其因果關(guān)系如何,它是否會(huì)加速病情的進(jìn)展,這些問(wèn)題仍待進(jìn)一步研究證實(shí)。
表 1 入組患者的臨床病例特征Tab 1 Clinical and pathologic characters of enrolled patients
表 3 各組樣本Alpha多樣性指數(shù)平均值Tab 3 Average Alpha diversity index for each group
既往研究結(jié)果[11-13]表明:對(duì)肺癌患者非癌變部位和癌變部位、健康者肺部進(jìn)行刷片檢測(cè),發(fā)現(xiàn)鏈球菌屬在癌癥病例中的含量明顯高于健康組,奈瑟菌屬在肺癌患者癌變部位也呈上升趨勢(shì)。肺癌患者手術(shù)取得的肺癌組織樣本中發(fā)現(xiàn)厚壁菌門(mén)(鏈球菌屬)和擬桿菌門(mén)(普雷沃氏菌屬)的豐度較正常樣本明顯升高。肺癌痰液樣本中鏈球菌屬豐度明顯高于健康對(duì)照組。這與本實(shí)驗(yàn)結(jié)果有一致性,即肺癌患者肺部細(xì)菌微生物組中以鏈球菌屬占優(yōu)勢(shì),其次為奈瑟氏菌屬。鏈球菌屬在肺癌的發(fā)生發(fā)展中發(fā)揮怎樣的作用?既往有肺部基礎(chǔ)疾病病史如慢性阻塞性肺疾病、肺結(jié)核、肺炎的患者罹患肺癌的幾率會(huì)增加[14],有研究表明慢性呼吸系統(tǒng)感染可能會(huì)增加人體對(duì)致癌物的易感性,促進(jìn)肺癌的發(fā)生[15],而肺炎鏈球菌是常見(jiàn)的社區(qū)獲得性肺炎的致病菌[16],這提示鏈球菌在肺癌進(jìn)程中可能發(fā)揮著一定的作用。
圖 2 UPGMA分析圖。樣品越靠近,枝長(zhǎng)越短,說(shuō)明兩個(gè)樣品的物種組成越相似。不同顏色代表不同分組。Fig 2 UPGMA analysis diagram.The closer of the samples means the species composition of the two samples is more similar.Different colors represent different groups.
不同類(lèi)型肺癌組微生物多樣性不同,SCLC樣本生物多樣性最大,其次為AD,C-SCLC次之,而SCC樣本生物多樣性最小,C-SCLC與其他組織類(lèi)型肺癌間物種多樣性組間差異明顯,而SCC物種多樣性組內(nèi)差異較大,這與疾病本身之間是否存在相關(guān)性及其因果關(guān)系現(xiàn)仍不明確,仍有待進(jìn)一步研究證實(shí)。我們發(fā)現(xiàn)不同組織類(lèi)型肺癌痰樣本中的優(yōu)勢(shì)菌群不同,SCC樣本鏈球菌屬、硫桿菌屬豐度高于AD,擬普雷沃氏菌屬豐度低于AD,這與既往一項(xiàng)研究結(jié)果[17]相悖,其發(fā)現(xiàn)AD患者唾液樣本中鏈球菌屬和卟啉單胞菌屬明顯高于SCC患者,而SCC患者肺部微生物多樣性明顯低于AD。既往肺癌患者肺部微生物組學(xué)研究極少報(bào)道SCLC數(shù)據(jù),而本研究納入了SCLC樣本,我們發(fā)現(xiàn)不同于其他組,SCLC以擬桿菌門(mén)豐度最大,變形菌門(mén)次之,SCLC中普雷沃氏菌屬豐度明顯大于其他組(P<0.05)。C-SCLC是指肺癌患者肺組織病理檢查為SCLC合并其他組織類(lèi)型如AD、鱗癌、大細(xì)胞肺癌、大細(xì)胞神經(jīng)內(nèi)分泌癌[18]。既往沒(méi)有關(guān)于C-SCLC的肺部微生態(tài)研究,本次通過(guò)Beta多樣性分析發(fā)現(xiàn)C-SCLC組內(nèi)差異較大,與其他組組間差異也較大,而C-SCLC是唯一一個(gè)組間樣品LEfSe分析篩選出生物標(biāo)志物的肺癌組。C-SCLC組織成分與SCLC有相似點(diǎn),但其生物多樣性及物種組成與SCLC均有較大差異。C-SCLC生物多樣性明顯低于SCLC,C-SCLC樣本中沉積物桿狀菌屬(Sediminibacterium)及Stomatobaculum豐度高于SCLC,普雷沃氏菌屬豐度低于SCLC(P<0.05)。本實(shí)驗(yàn)仍存在不足,因SCLC及C-SCLC發(fā)病率較其他類(lèi)型肺癌低,臨床上患者數(shù)量較少,導(dǎo)致樣本量不足,后續(xù)研究需加大樣本量,減少抽樣誤差。
圖 3 置換多元方差分析箱形圖。Anosim分析得到的R值介于-1到1之間,越接近1表示組間差異越大于組內(nèi)差異,R>0提示組間差異顯著,P<0.05時(shí)說(shuō)明檢驗(yàn)的可信度高??v坐表示Bray-Curtis距離;“All between treat”上方箱圖代表所有組間樣品Bray-Curtis距離數(shù)據(jù),“All within treat”上方箱圖代表所有組內(nèi)樣品Bray-Curtis距離數(shù)據(jù),后面的箱型圖分別是不同分組的組內(nèi)樣品間的Beta距離數(shù)據(jù)。SCLC因數(shù)據(jù)量少未納入計(jì)算。Fig 3 Anosim analysis box plot.The R value obtained by Anosim analysis was between -1 and 1.The closer to 1, the difference between groups was greater than that within groups.When P value is less than 0.05, the reliability of the test is high.Longitudinal seating represents the Bray-Curtis distance.The box diagram above "All Between Treat"represents the Bray-Curtis distance data of all between-treat samples.The box diagram above "All within Treat" represents the Bray-Curtis distance data of all within-treat samples.The box diagram behind represents the Beta distance data of samples in different groups.SCLC was not included in the calculation due to the small amount of data.
總之,本研究通過(guò)對(duì)18例晚期肺癌患者痰液進(jìn)行高通量測(cè)序,發(fā)現(xiàn)不同組織學(xué)肺癌間微生物結(jié)構(gòu)不同,且各自有其主要的微生物組成,其中SCLC及C-SCLC肺部微生物多樣性為首次報(bào)道。本研究挖掘了不同組織學(xué)類(lèi)型肺癌肺部微生物差異性,豐富了肺部微生物研究數(shù)據(jù)。
圖 4 進(jìn)化分支圖。本圖為C-SCLC測(cè)序數(shù)據(jù)通過(guò)LEfSe分析得出的進(jìn)化分支圖。由內(nèi)至外輻射的圓圈代表了由門(mén)至種的分類(lèi)級(jí)別;在不同分類(lèi)級(jí)別上的每一個(gè)小圓圈代表該水平下的一個(gè)分類(lèi),小圓圈直徑大小與相對(duì)豐度大小呈正比;著色原則為將無(wú)顯著差異的物種統(tǒng)一著色為黃色,其他差異物種按該物種所在豐度最高的分組進(jìn)行著色。Fig 4 Cladogram.The Cladogram was obtained by LEfSe analysis of C-SCLC sequencing data.The circle from inside to outside represents the classification level from phylum to species.Each small circle represents a classification at the level.Species with no significant differences were uniformly colored yellow, while others were colored according to the group with the highest abundance of the species.
Author contributions
Ran ZN, Liu JX, Song ZY, Xin CY and Xiong B conceived and designed the study.Ran ZN, Liu JX, Wang F, Shen X, Zeng S,and Song ZY performed the experiments.Ran ZN, Liu JX, Wang F, Xin CY, Song ZY and Xiong B analyzed the data.Song ZY,Xin CY and Xiong B contributed analysis tools.Wang F, Shen X,Zeng S, Song ZY and Xiong B provided critical inputs on design,analysis, and interpretation of the study.All the authors had access to the data.All authors read and approved the final manuscript as submitted.