王澍,汪崇文,顧兵,董浩,?,帬q,張龍,李志剛,劉勇(.中國科學(xué)院合肥物質(zhì)科學(xué)研究院 安徽光學(xué)精密機械研究所,合肥00;.安徽農(nóng)業(yè)大學(xué)生命科學(xué)學(xué)院,合肥00;.廣東省人民醫(yī)院檢驗科,廣州45000)
由于抗菌藥物的濫用,耐甲氧西林金黃色葡萄球菌(methicillin-resistantStaphylococcusaureus, MRSA)已成為臨床上常見的多重耐藥菌之一[1-2]。目前,在MRSA的臨床檢驗中仍然以費時耗力的生化鑒定方法為主[3],新興的PCR、質(zhì)譜、DNA測序等檢測方法在耗時、靈敏度、便捷性上無法統(tǒng)一[4]。開發(fā)一種高靈敏、快速、準(zhǔn)確、便捷的MRSA鑒定方法有著重要的現(xiàn)實意義。
表面增強拉曼散射(surface enhanced Raman scatter, SERS)是指檢測對象靠近金、銀等納米粒子時,貴金屬增強基底表面的電磁場大幅度放大了細(xì)菌的固有分子振動指紋(拉曼光譜)[5]。SERS細(xì)菌檢測的顯著優(yōu)點是快速、易于操作、高靈敏度和指紋檢測(無標(biāo)簽)。將納米金、銀顆粒與細(xì)菌直接混合后進(jìn)行SERS檢測是常用的微生物檢測方法[6],但是絕大多數(shù)細(xì)菌在溶液中呈現(xiàn)較強的負(fù)電性[7],而膠體銀、金等常用的SERS基底大多是利用檸檬酸鈉還原法制備獲得,表面具有大量負(fù)電荷[8],同種電荷的相斥會使基底與細(xì)菌的結(jié)合程度不高。另外,常用的光譜分析算法如主成分分析(PCA)、線性判別分析(LDA)等在應(yīng)用于高相似度的拉曼光譜分類時能效不足。近兩年來,深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)逐漸應(yīng)用于多種類、高相似度的細(xì)菌Raman光譜分析中[9-10],SERS與CNN結(jié)合有望成為一種強大而具有應(yīng)用前景的病原體檢測手段。
本研究制備帶正電荷的銀納米顆粒(positively charged silver nanoparticles, AgNPs+)用于獲得金黃色葡萄球菌(Staphylococcusaureus,S.aureus)高質(zhì)量的SERS指紋譜,并設(shè)計構(gòu)建一個淺層的CNN模型用于MRSA和對甲氧西林敏感金黃色葡萄球菌(methicillin-susceptibleStaphylococcusaureus, MSSA)的SERS指紋譜的準(zhǔn)確分類識別。
1.1主要試劑與儀器 硼氫化鈉(NaBH4)、AgNO3、十六烷基三甲基溴化銨(CTAB)、氨水(上海化學(xué)試劑有限公司),哥倫比亞血平板培養(yǎng)基(法國bioMérieux公司),IQ7000無菌去離子水(德國Milli-Q公司),單晶硅晶片(浙江立晶光電公司)。H-7650透射電子顯微鏡(transmission electron microscope, TEM)(日本Hitachi公司),2600紫外可見光譜儀(日本島津公司)。i-Raman Plus BWS465-785H便攜式拉曼光譜儀(美國B&W Tek公司),BSS9700H細(xì)菌比濁儀(大連貝爾分析儀器),Vitek 2 compact全自動細(xì)菌鑒定儀(法國bioMérieux公司)。
1.2菌株來源及菌液制備 90株金黃色葡萄球菌臨床分離株,包括45株MRSA和45株MSSA,由廣東省人民醫(yī)院顧兵教授提供,均通過Vitek 2 compact全自動細(xì)菌鑒定儀及藥敏卡片獲得穩(wěn)定可靠的結(jié)果。細(xì)菌菌株使用哥倫比亞血平板培養(yǎng)基在37 ℃環(huán)境下過夜培養(yǎng),使用無菌去離子水制備菌懸液,采用BSS9700H細(xì)菌比濁儀校準(zhǔn)菌液濃度,600 nm處吸光度(A600 nm)=1時細(xì)菌濃度約為107cells/mL。
1.3AgNPs+的制備及性能表征 根據(jù)文獻(xiàn)[11]中的方法制備AgNPs+,并進(jìn)行改動,步驟如下:(1)配制A溶液:向20 mL去離子水中加入3.7 mg CTAB,10 mg AgNO3以及0.5 mL氨水;(2)配制B溶液:向20 mL去離子水中加入3.7 mg CTAB和6.1 mg NaBH4;(3) 混合:將A溶液置于錐形瓶中冰浴攪拌(500 r/min),再將B溶液緩慢滴加入錐形瓶中并封口,繼續(xù)攪拌3 h;(4)停止攪拌并撕掉封口膜,加熱至沸騰并持續(xù)10 min,冷卻至室溫后置于陰暗處4 ℃保存。使用H-7650 TEM對合成的AgNPs+進(jìn)行表征,在80 kV加速電壓下獲得TEM圖像。使用2600紫外可見光譜儀測量材料的紫外-可見(ultraviolet-visible, UV-Vis)吸收光譜。
1.4SERS測量與數(shù)據(jù)集構(gòu)建 取50 μL菌液與50 μL制備好的AgNPs+置于Eppendorf管中,吹打混勻后溫育15 min,形成細(xì)菌與納米銀的復(fù)合物(MRSA@AgNPs或MSSA@AgNPs)。使用TEM對AgNPs+與金黃色葡萄球菌的結(jié)合效果進(jìn)行表征。取2 μL混合物滴加到單晶硅晶片上,自然風(fēng)干后,使用便攜式拉曼光譜儀測量細(xì)菌的SERS指紋譜,激發(fā)光源785 nm,激發(fā)功率20 mw,聚焦物鏡50倍長,積分時間設(shè)置為5 s,避免樣品燃燒,檢測光譜范圍為399~1 799 cm-1。測量前,使用硅片在520 cm-1處的拉曼峰進(jìn)行校準(zhǔn)。
在訓(xùn)練數(shù)據(jù)集構(gòu)建上,各挑選40株細(xì)菌進(jìn)行SERS指紋譜采集,對每個菌株按照上述SERS法制作3份混合液, 然后在每份混合液中吸取10個位點進(jìn)行拉曼檢測,在每個位點采集3條Raman光譜并取平均值,即每個菌株收集30條光譜,一共采集1 200條MRSA和1 200條MSSA的SERS指紋譜用于算法訓(xùn)練。另外按照上述方法在剩余的5株MRSA和5株MSSA中各采集150條SERS指紋譜制作成一個小型的測試數(shù)據(jù)集,用于考察分類算法的準(zhǔn)確性。當(dāng)菌液的濃度降低時,拉曼信號的強度會隨之衰減,表現(xiàn)為各個拉曼峰的峰值大幅度降低[12],因此定義107cells/mL菌液濃度下采集的SERS指紋譜為標(biāo)準(zhǔn)信號。為減少預(yù)處理不當(dāng)給數(shù)據(jù)分析帶來的不確定性,未進(jìn)行數(shù)據(jù)平滑以及扣除基線等預(yù)處理操作。
1.5淺層CNN的構(gòu)建 如圖1所示,構(gòu)建1個一維卷積層加1個全鏈接層的淺層CNN進(jìn)行訓(xùn)練。卷積層Convolution中設(shè)置了128個尺寸為5×1(光譜波段)的卷積核,采用“relu”激活函數(shù);Flatten為一維化層;由于是二分類任務(wù),在全鏈接層Dense中采用“sigmoid”激活函數(shù);在模型的編譯過程中,采用二元交叉熵(binary_crossentropy)以及“sgd”優(yōu)化器,10折交叉驗證(訓(xùn)練集與驗證集比例為9∶1,隨機劃分),學(xué)習(xí)率設(shè)置為0.001,小批次數(shù)量(batch size)設(shè)置為32,所有數(shù)據(jù)的迭代次數(shù)(epoch)設(shè)置為100。測試在圖像分類中比較先進(jìn)的其他CNN網(wǎng)絡(luò),但在MRSA與MSSA的二分類任務(wù)上,效果不如簡單的淺層網(wǎng)絡(luò)。
1.6快速檢測工作原理 圖2A展示金黃色葡萄球菌耐藥性SERS檢測模型的構(gòu)建過程:制備粒徑約為20~50 nm的AgNPs+用于獲得細(xì)菌的拉曼增強信號,建立一個標(biāo)準(zhǔn)化的MSSA與MRSA的SERS指紋譜數(shù)據(jù)集,并在數(shù)據(jù)集上訓(xùn)練構(gòu)建的一維CNN,生成MSSA與MRSA的二分類模型。圖2B是金黃色葡萄球菌快速SERS檢測的操作順序:挑取金黃色葡萄球菌菌落與AgNPs+混合溫育并獲得SERS指紋譜;將SERS指紋譜輸入已建立好的MSSA/MRSA鑒定模型即可得到鑒定結(jié)果。
注:Convolution,卷積層;Flatten,一維化層;Dense,全鏈接層;relu與sigmoid,激活函數(shù)。
注:A,MRSA 和MSSA SERS鑒定模型的建立;B,基于AgNPs+與一維CNN的MRSA快速鑒定流程。
2.1AgNPs+的合成及性能表征 AgNPs+的TEM圖像顯示AgNPs+在溶液中的分散性較好。銀納米顆粒的UV-Vis吸收光譜觀察到在407 nm處出現(xiàn)最大吸收峰,且半峰寬相對較窄,表明合成的AgNPs+的尺寸均勻性較好。見圖3。
注:A,TEM圖;B,UV吸收光譜,內(nèi)置圖片為合成的AgNPs+溶液。
使用TEM對AgNPs+與金黃色葡萄球菌結(jié)合效果進(jìn)行表征,見圖4,可觀察到AgNPs緊密地吸附在MRSA和MSSA的菌體外表面并聚集成簇。
注:A、B, MRSA、MRSA@AgNPs復(fù)合物的TEM表征;C、D,MSSA、MSSA@AgNPs復(fù)合物的TEM表征。
2.2基于AgNPs+的金黃色葡萄球菌SERS測量 圖5為各種物質(zhì)的SERS指紋譜,與銀納米顆粒、硅片和S.aureus相比,結(jié)合AgNPs+的S.aureus產(chǎn)生明顯的SERS效應(yīng),654、731、958、1 050、1 328、1 458以及1 577 cm-1共7個波段均有明顯的特征峰都被增強出。
圖5 AgNPs+、硅片、S. aureus以及S. aureus@AgNPs復(fù)合物的拉曼光譜
通過AgNPs+技術(shù)測量MRSA和MSSA各20個不同批次樣本的SERS指紋譜(每個樣品隨機選取5個點位進(jìn)行測量并取平均值),圖6展示了MSSA和MRSA的拉曼光譜測量結(jié)果以及710~740 cm-1波段主峰的相對標(biāo)準(zhǔn)偏差(relative standard deviation,RSD),分別為2.42%以及4.87%。
參考文獻(xiàn)[13]對7處明顯拉曼峰的譜帶歸屬進(jìn)行指認(rèn)。表1展示金黃色葡萄球菌的主要拉曼峰歸屬,731 cm-1處最強的拉曼峰為糖苷鍵產(chǎn)生,來自于細(xì)胞壁中豐富的肽聚糖;958 cm-1及1 050 cm-1處為蛋白質(zhì)C-O基團(tuán)及C-N基團(tuán)的特征峰,屬于細(xì)胞壁上的蛋白質(zhì)、肽和氨基酸;1 458 cm-1處為飽和脂質(zhì)的特征峰,來自細(xì)胞壁上的脂質(zhì);而654 cm-1、1 328 cm-1及1 577 cm-1為酪氨酸和腺嘌呤的拉曼峰,推測由于納米顆粒進(jìn)入細(xì)胞壁后造成DNA變性而產(chǎn)生。
圖6 對MRSA和MSSA進(jìn)行20次SERS測量的重現(xiàn)性
表1 金黃色葡萄球菌拉曼光譜的主要譜帶歸屬[13]
2.3CNN用于MRSA與MSSA的分類鑒定 構(gòu)建訓(xùn)練數(shù)據(jù)集所用的SERS數(shù)據(jù)來自于40株MRSA與40株MSSA,各1 200條光譜。測試數(shù)據(jù)來自于剩余的5株MRSA與5株MSSA,各150條光譜。圖7A展示采集的部分?jǐn)?shù)據(jù),MRSA和MSSA的SERS指紋譜特征峰位置以及強度并無明顯差異,通過人工進(jìn)行準(zhǔn)確區(qū)分較困難。
MRSA和MSSA各100條,圖7B為在本文方法標(biāo)準(zhǔn)濃度(107cells/mL)的菌液上采集的正常SERS指紋譜與在低濃度菌液(105、102cells/mL)上采集的弱SERS信號對比,可見105、102cells/mL樣本中采集的SERS信號的拉曼峰強度明顯降低,當(dāng)細(xì)菌濃度為102cells/mL時,只有730 cm-1處的主峰可以明確辨認(rèn)。
注:A,107 cells/mL濃度樣本測量得到的SERS指紋譜(彩色譜線為50條數(shù)據(jù)的平均值);B,102 cells/mL、105 cells/mL及107 cells/mL濃度樣本測量的SERS指紋譜對比。
將本文構(gòu)建的淺層CNN模型在上述2 400條數(shù)據(jù)上進(jìn)行訓(xùn)練,并分別對300條常規(guī)強度信號(107cells/mL)、200條弱信號(105cells/mL)以及200條弱信號(102cells/mL)進(jìn)行測試。為考察分類算法的性能,還構(gòu)建了一個25層的殘差卷積網(wǎng)絡(luò)“ResNet25”[10]并選取傳統(tǒng)機器學(xué)習(xí)中的logistic回歸(Logistic)、支持向量機(SVM)、隨機林(RF)和K-近鄰(KNN)算法進(jìn)行對比[14-15]。實驗基于Python編程語言環(huán)境開展,CNN使用Keras框架,機器學(xué)習(xí)算法的調(diào)用使用“sklearn”庫。
表2為不同算法的測試結(jié)果,對于107cells/mL濃度菌液中采集的高強度SERS指紋譜,幾種分類上都取得較好的成果,其中淺層CNN、ResNet25、SVM以及Logistic均取得100%的分類準(zhǔn)確率。對于105cells/mL和102cells/mL低濃度菌液中采集的低強度SERS指紋譜,傳統(tǒng)機器學(xué)習(xí)算法SVM、Logistic、RF以及KNN的平均識別準(zhǔn)確率均跌至80%以下,ResNet25的識別準(zhǔn)確率也明顯降低,而研究構(gòu)建的淺層CNN依舊保持94%以上的識別準(zhǔn)確率,平均高出其他方法25%以上。
表2 多種方法對正常SERS指紋譜與弱SERS指紋譜的識別準(zhǔn)確率(%)
本研究建立了一種基于正電納米銀以及CNN的表面增強拉曼光譜檢測方法用于金黃色葡萄球菌耐藥性的快速鑒定。通過TEM觀察到制備的AgNPs+具有較好的分散性與均勻性,在溶液中能夠通過靜電引力吸附在帶負(fù)電荷的細(xì)菌菌體表面并聚集成簇,從而增強出高質(zhì)量的SERS指紋譜,654 cm-1、731 cm-1等多個波段均有明顯的特征峰被增強出來,與文獻(xiàn)報道結(jié)果一致。20次SERS測量的平均RSD<5%,具有較好的重現(xiàn)性。
在實際檢測過程中,往往會因采樣濃度不足或其他影響因素導(dǎo)致采集的拉曼信號強度偏弱,數(shù)據(jù)特征顯著度降低,從而影響數(shù)學(xué)分類算法的正確率?;跍\層CNN的光譜分析方法分別對107cells/mL、105cells/mL和102cells/mL濃度樣本上采集的不同強度的SERS指紋譜數(shù)據(jù)取得了100%、98%、94.5%的識別準(zhǔn)確率,優(yōu)于SVM、KNN等傳統(tǒng)機器學(xué)習(xí)方法及卷積層較深的ResNet25,展現(xiàn)出了優(yōu)異的穩(wěn)定性,更適合于實際應(yīng)用。SERS-CNN檢測方法在MASA和MSSA的檢測工作中取得較好的成果,且能夠較為容易地推廣應(yīng)用于其他致病菌的識別或分型,希望該工作能在細(xì)菌檢測、微生物學(xué)研究等領(lǐng)域的研究中起到積極的作用。