周炳文,朱麗麗,朱 林,趙爽利,李任時(shí), 劉秀峰,劉吉華,戚 進(jìn),余伯陽(yáng)*
(1.中國(guó)藥科大學(xué) 中藥學(xué)院 中藥可追溯與標(biāo)準(zhǔn)化研究中心,江蘇 南京 211198;2.中國(guó)藥科大學(xué) 中藥學(xué)院 江蘇省中藥評(píng)價(jià)與轉(zhuǎn)化重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 211198)
中醫(yī)藥是我國(guó)獨(dú)有的醫(yī)療體系和文化傳承。我國(guó)幅員遼闊,中藥種類繁多,由于歷代本草記載及地區(qū)用藥名稱和使用習(xí)慣的不同,致使中藥基源混亂現(xiàn)象嚴(yán)重,且近緣種屬間性狀及顯微特征十分相似,不易區(qū)分。而中藥材作為商品在市場(chǎng)流通中更是來(lái)源各異,優(yōu)劣混雜,一些不法商販為謀取更大利益利用近似藥材或近似藥用部位混摻銷售,嚴(yán)重影響中醫(yī)臨床用藥的有效性和安全性,并阻礙了中醫(yī)藥的現(xiàn)代化和國(guó)際化進(jìn)程[1]。因此實(shí)現(xiàn)快速準(zhǔn)確鑒別中藥品種對(duì)中醫(yī)臨床用藥及保障患者生命安全具有重要意義。
目前,傳統(tǒng)的中藥品種鑒定四大方法為基源鑒別、性狀鑒別、顯微鑒別和理化鑒別,在實(shí)際鑒別過(guò)程中常將幾種方法聯(lián)合應(yīng)用[2-3]。由于傳統(tǒng)的鑒別主要依靠鑒別師的工作經(jīng)驗(yàn)積累及藥材鑒別知識(shí)的儲(chǔ)備,鑒別者需具備專業(yè)的知識(shí)和豐富的實(shí)踐經(jīng)驗(yàn),且受主觀判斷影響較大,因此鑒別難度大,準(zhǔn)確率不高[4]。隨著分析手段的不斷提高,薄層色譜[5]、高效液相色譜[6]、氣相色譜[7]、紫外光譜[8]、紅外光譜[9]及DNA分子生物學(xué)[10]等識(shí)別方法開始應(yīng)用于中藥鑒定,衍生出能夠表征化學(xué)特征的中藥指紋圖譜,體現(xiàn)遺傳差異的DNA條形碼[11]等,促進(jìn)了中藥鑒定的發(fā)展。但中藥的化學(xué)成分受生長(zhǎng)環(huán)境、采集時(shí)間、生長(zhǎng)年限、加工及儲(chǔ)藏方法等多種因素的影響,同種也存在多元化現(xiàn)象[12-14],采用上述方法仍不能完全準(zhǔn)確鑒別中藥材的摻偽摻假等現(xiàn)象,準(zhǔn)確率有待進(jìn)一步提高。此外,由于不同操作者采用不同標(biāo)準(zhǔn)各自形成相關(guān)質(zhì)量控制方法,不同方法間缺乏統(tǒng)一性,使得這些方法大多難以普及,即使一些已經(jīng)頒布的標(biāo)準(zhǔn)也存在容錯(cuò)率低和系統(tǒng)適應(yīng)性差等缺點(diǎn)。因此,亟待通過(guò)標(biāo)準(zhǔn)化設(shè)計(jì),建立一種可推廣的、客觀精準(zhǔn)的用于多種中藥品種的識(shí)別方法?;诖?,本文提出一種具有普適性的中藥一法通識(shí)品種鑒定新方法,對(duì)中藥材進(jìn)行統(tǒng)一化、標(biāo)準(zhǔn)化處理,并基于高效液相色譜法構(gòu)建了能夠全面表征中藥化學(xué)信息的多元多息指紋圖譜,結(jié)合卷積神經(jīng)網(wǎng)絡(luò)對(duì)指紋圖譜進(jìn)行識(shí)別,可實(shí)現(xiàn)中藥品種快速、準(zhǔn)確、高效的鑒別。
表1 50種藥材編號(hào)信息Table 1 Information of 50 kinds of medicinal materials
Agilent 1260 Prime UPLC色譜儀(安捷倫科技有限公司);中藥打粉機(jī)(南京平崗機(jī)械設(shè)備有限公司);NV222ZH電子天平(百分之一,奧豪斯儀器有限公司);SK-O180-E震蕩儀(南京拓海自動(dòng)化科技有限公司);5804R離心機(jī)(德國(guó)Eppendorf股份有限公司);SB-5200DTD超聲波清洗儀、DK-S24水浴鍋(南京以馬內(nèi)利儀器設(shè)備有限公司)。
乙腈(色譜級(jí),德國(guó)Merck公司);甲醇(色譜級(jí),上海星可高純?nèi)軇┯邢薰?;乙酸、甲酸、乙酸銨(色譜級(jí),上海Aladdin試劑公司);超純水(美國(guó)Millipore公司)。
50味藥材均為市售或藥材種植基地直銷,經(jīng)中國(guó)藥科大學(xué)余伯陽(yáng)教授鑒定基源準(zhǔn)確,可用于實(shí)驗(yàn)研究(表1)。
將50批供試藥材打成粉末,過(guò)四號(hào)篩(250 μm ± 9.9 μm)。精密稱取1.0 g藥材粉末于50 mL具塞錐形瓶中,加入25 mL 75%乙醇溶液,稱定重量,在功率240 W、頻率40 kHz及25 ℃條件下超聲30 min,于室溫下補(bǔ)足失重,以8 000 r/min在20 ℃下離心15 min后,分離上清液備用。
取上清液2 mL,低溫(≤50 ℃)揮干,用超純水復(fù)溶并定容至2 mL,過(guò)0.22 μm水系膜,作為分子排阻色譜供試品。
取上清液5 mL,緩慢滴加乙腈,進(jìn)行有機(jī)溶劑沉淀至乙腈濃度達(dá)95%,于4 ℃條件下靜置12 h,以8 000 r/min離心10 min,分離上清液與沉淀,沉淀備用。上清液低溫(≤50 ℃)揮干,以現(xiàn)制75%乙腈復(fù)溶并定容至5 mL,過(guò)0.22 μm有機(jī)濾膜,作為反相色譜供試品; 取上述沉淀部分,加入10 mL 70%甲醇溶解,在20 ℃下以8 000 r/min離心10 min,取上清液,低溫(≤50 ℃)揮干,以50%乙腈復(fù)溶并定容至5 mL,過(guò)0.22 μm有機(jī)濾膜,作為親水色譜供試品。
Agilent ZORBAX Extend C18(4.6 mm × 150 mm,5 μm)色譜柱;流動(dòng)相為乙腈(A)-0.1%冰乙酸水溶液(B),流速1.0 mL/min,梯度洗脫程序:0~30 min,5%~35% A;30~50 min,35%~95% A;50~60 min,95% A。柱溫25 ℃,進(jìn)樣量5 μL,二極管陣列檢測(cè)器檢測(cè),檢測(cè)波長(zhǎng)為205、230、254、280、305、330、365、420 nm,步長(zhǎng)1 nm。
Poroshell 120HILIC-Z(3.0 mm ×100 mm,2.7 μm)色譜分析柱;流動(dòng)相為含0.1%乙酸的10 mmol/L乙酸銨水溶液(A)-10 mmol/L乙酸銨乙腈溶液(B),流速0.4 mL/min,梯度洗脫程序:0~5 min,100% A;5~10 min,100%~95% A;10~35 min,95%~90% A;35~45 min,90%~75% A;45~60 min,75%~65% A。柱溫30 ℃,分析時(shí)間60 min,進(jìn)樣量5 μL,二極管陣列檢測(cè)器檢測(cè),檢測(cè)波長(zhǎng)同反相色譜,步長(zhǎng)1 nm。
Sepax SRT SEC-150?(7.8 mm×300 mm,5 μm)分子排阻色譜分析柱,流動(dòng)相為5 mmol/L乙酸銨-甲醇(100 ∶1),等度洗脫,流速0.6 mL/min,柱溫30 ℃,分析時(shí)間為80~100 min,進(jìn)樣量5 μL,二極管陣列檢測(cè)器檢測(cè),檢測(cè)波長(zhǎng)同反相色譜,步長(zhǎng)1 nm。
1.6.1 數(shù)據(jù)預(yù)處理液相色譜圖以保留時(shí)間-信號(hào)響應(yīng)值的形式導(dǎo)出,并按公式(x′=(x-xmin)/(xmax-xmin),式中x為原始值,x′為歸一化后的值,xmin和xmax分別為單張圖譜中最小值和最大值)進(jìn)行歸一化處理,同一藥材在同一波長(zhǎng)下,按照正相色譜、反相色譜以及分子排阻色譜的順序重新合并為新的色譜圖,作為卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)集。采用K折交叉驗(yàn)證[15]策略將所有數(shù)據(jù)隨機(jī)打亂后劃分為5份,每次取其中4份,即80%的數(shù)據(jù)作為訓(xùn)練集,剩余20%作為測(cè)試集評(píng)估神經(jīng)網(wǎng)絡(luò)模型的性能,直到所有數(shù)據(jù)都分別作為測(cè)試集,最后將所得5個(gè)模型測(cè)試集準(zhǔn)確率的平均值作為最后模型的準(zhǔn)確率。
圖1 一法通識(shí)反相色譜條件考察——色譜柱考察
1.6.2 卷積神經(jīng)網(wǎng)絡(luò)模型超參數(shù)的正交優(yōu)化本試驗(yàn)采用深度殘差網(wǎng)絡(luò)Resnet18作為網(wǎng)絡(luò)架構(gòu),該網(wǎng)絡(luò)架構(gòu)中提出的殘差結(jié)構(gòu)能夠有效改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)在深度加深時(shí)產(chǎn)生的梯度爆炸與梯度彌散,提升模型的性能[16]。選取學(xué)習(xí)率(Learning rate:0.01、0.001、0.000 1)、卷積核大小(Kernel size:3、5、7)以及學(xué)習(xí)次數(shù)(Epochs:100、500、1 000)為影響因素,設(shè)計(jì)3因素3水平的正交實(shí)驗(yàn)對(duì)模型參數(shù)進(jìn)行微調(diào)。
本研究所建立的判別方法為以一種標(biāo)準(zhǔn)化的樣品制備及色譜數(shù)據(jù)獲取方法,通過(guò)建立識(shí)別系統(tǒng),用于廣泛識(shí)別多種中藥材。因此,本實(shí)驗(yàn)以分離度、色譜峰數(shù)目為考察指標(biāo)對(duì)液相條件進(jìn)行優(yōu)化,綜合考察色譜條件在不同藥材中的表現(xiàn),確定反相色譜、親水色譜以及分子排阻色譜的最優(yōu)條件。
圖2 一法通識(shí)反相色譜條件考察——流動(dòng)相條件 考察(以丹參為例)Fig.2 Conditions of reverse chromatography—— mobile phase(salvia) S1:methanol-0.1% formic acid;S2:methanol-water; S3:methanol-5 mmol/L ammonium acetate;S4:methanol- 0.1% acetic acid;S5:acetonitrile-0.1% formic acid; S6:acetonitrile-water;S7:acetonitrile-5 mmol/L ammonium acetate;S8:acetonitrile-0.1% acetic acid
2.1.1 反相色譜條件的優(yōu)化以陳皮為例比較了7種常用的反相色譜柱對(duì)陳皮、黃連、麥冬、丹參、升麻、白芍、荷葉7種藥材的分離效果(圖1)。結(jié)果顯示:Dikma Diamonsil C18、Agilent ZORBAX Extend-C18、Phenomenex Luna?C18、Agilent ZORBAX SB-C18、Sepax HP-C18、SHIMADZU Shim-pack VP-ODS、Waters Atlantis?T3 7種不同色譜柱的出峰效果差別較大,綜合黃連等其他六味中藥的色譜圖發(fā)現(xiàn)Agilent ZORBAX Extend C18獲得的色譜峰數(shù)量較多,且峰高及峰面積較高,分離效果較好,因此選擇Agilent ZORBAX Extend C18作為一法通識(shí)方法用色譜柱。
以丹參為例考察了8種不同流動(dòng)相體系(甲醇-0.1%甲酸水溶液、甲醇-水溶液、甲醇-5 mmol/L乙酸銨水溶液、甲醇-0.1%乙酸水溶液、乙腈-0.1%甲酸水溶液、乙腈-水、乙腈-5 mmol/L乙酸銨水溶液、乙腈-0.1%乙酸水溶液)對(duì)分離的影響(圖2)。結(jié)果顯示:不同流動(dòng)相組合對(duì)色譜峰的分離度和色譜峰數(shù)目影響較大,綜合對(duì)比黃連等其他六味中藥的色譜圖發(fā)現(xiàn),以乙腈-0.1%乙酸水溶液為流動(dòng)相時(shí)獲得的色譜圖最佳,因此選取乙腈-0.1%乙酸水溶液為流動(dòng)相。
以葛根為例比較了常用色譜柱溫度(40、30、25、20 ℃)對(duì)7種藥材的分離效果。結(jié)果發(fā)現(xiàn),當(dāng)柱溫為25 ℃時(shí)分離效果最好。綜合其他6種藥材的色譜出峰情況,確定25 ℃作為一法通識(shí)方法的反相色譜柱溫條件。
2.1.2 親水色譜條件優(yōu)化通過(guò)比較當(dāng)歸在Poroshell 120 HILIC-Z、Amide-80HR色譜柱的分離情況,結(jié)果發(fā)現(xiàn)Poroshell 120 HILIC-Z分離的峰形較好,分離效果最佳,故選擇Poroshell 120 HILIC-Z色譜柱作為一法通識(shí)親水色譜條件的色譜柱。
以當(dāng)歸為例比較了不同流動(dòng)相體系(乙腈-5 mmol/L甲酸銨-0.1%甲酸水溶液、乙腈-5 mmol/L乙酸銨-0.1%乙酸水溶液、乙腈-15 mmol/L甲酸銨-0.1%甲酸水溶液、乙腈-15 mmol/L乙酸銨-0.1%乙酸水溶液、乙腈-10 mmol/L乙酸銨-0.1%乙酸水溶液、乙腈-10 mmol/L甲酸銨-0.1%甲酸水溶液)的分離效果。結(jié)果顯示,乙腈-10 mmol/L乙酸銨-0.1%乙酸水溶液具有最好的分離效果,色譜圖基線穩(wěn)定,色譜峰個(gè)數(shù)最多,響應(yīng)最高。
2.1.3 分子排阻色譜條件優(yōu)化綜合考慮分子排阻柱的分離效果、耐用性、普適性及經(jīng)濟(jì)性,選擇Sepax SRT SEC-150?分子排阻分析柱作為一法通識(shí)分子排阻色譜法的分析柱。
以麥冬為例比較了不同流動(dòng)相體系(5 mmol/L乙酸銨-1%甲醇、5 mmol/L乙酸銨-10%甲醇、5 mmol/L乙酸銨-10%乙腈、10%乙腈、10 mmol/L乙酸銨、5 mmol/L乙酸銨水溶液)的分離效果。結(jié)果發(fā)現(xiàn)以5 mmol/L乙酸銨-1%甲醇為流動(dòng)相時(shí),分離效果更好,色譜圖基線穩(wěn)定,色譜峰數(shù)量最多。因此選擇5 mmol/L乙酸銨-1%甲醇為流動(dòng)相。
實(shí)驗(yàn)還比較了不同流動(dòng)相流速(0.4、0.6、0.9 mL/min)對(duì)液相出峰的影響,并綜合考慮出峰數(shù)量、出峰時(shí)間及總檢測(cè)時(shí)長(zhǎng),最終選擇0.6 mL/min作為一法通識(shí)分子排阻色譜法的流速。
2.2.1 精密度以陳皮、黃芩、前胡三味藥材為對(duì)象考察反相色譜及分子排阻色譜方法,以大黃和當(dāng)歸藥材為對(duì)象考察親水色譜方法,按“1.2”方法制備樣品溶液,分別連續(xù)進(jìn)樣6次。結(jié)果顯示,中藥材中各主要色譜峰相對(duì)時(shí)間及其相對(duì)峰面積均滿足相對(duì)標(biāo)準(zhǔn)偏差(RSD)<3.0%,相似度均大于0.9,表明各方法均符合指紋圖譜研究技術(shù)要求,精密度良好。
2.2.2 穩(wěn)定性試驗(yàn)以陳皮、黃芩、前胡三味藥材為對(duì)象考察反相色譜及分子排阻色譜方法,以大黃和當(dāng)歸為對(duì)象考察親水色譜方法,按“1.2”方法制備樣品溶液,分別于0、2、4、8、12、24 h檢測(cè)各藥材的指紋圖譜。結(jié)果顯示,中藥材中各主要色譜峰的相對(duì)保留時(shí)間及其相對(duì)峰面積均符合RSD<3.0%,相似度均大于0.9,表明各提取方法下樣品在24 h內(nèi)穩(wěn)定,滿足指紋圖譜研究技術(shù)要求。
2.2.3 重現(xiàn)性實(shí)驗(yàn)以陳皮、黃芩、前胡三味藥材為對(duì)象考察反相色譜及分子排阻色譜方法,以大黃和當(dāng)歸為對(duì)象考察親水色譜方法,精密稱取6份藥材粉末,按照“1.2”方法制備樣品溶液進(jìn)樣測(cè)定。結(jié)果顯示,各藥材中主要色譜峰的相對(duì)保留時(shí)間及其相對(duì)峰面積均符合RSD<3.0%,相似度均大于0.9,表明方法重現(xiàn)性良好,符合指紋圖譜研究技術(shù)的要求。
表2 卷積神經(jīng)網(wǎng)絡(luò)超參數(shù)正交實(shí)驗(yàn)表Table 2 Orthogonal test factorTable of convolutional neural network hyperparameters
2.3.1 正交試驗(yàn)優(yōu)化實(shí)驗(yàn)通過(guò)基于Torch的開源python機(jī)器學(xué)習(xí)庫(kù)PyTorch構(gòu)建Resnet卷積神經(jīng)網(wǎng)絡(luò)。再將上述液相色譜條件下所得圖譜作為卷積神經(jīng)網(wǎng)絡(luò)的輸入,通過(guò)卷積核提取特征,以神經(jīng)元計(jì)算各特征權(quán)重,最后由全連接層通過(guò)Softmax函數(shù)輸出神經(jīng)網(wǎng)絡(luò)的判別結(jié)果(圖3)。判別結(jié)果通常是以判別概率的形式輸出,神經(jīng)網(wǎng)絡(luò)判別當(dāng)前輸入的藥材是某一類藥材的概率,并以概率最大的為最后輸出結(jié)果,通過(guò)計(jì)算輸出結(jié)果與給予的標(biāo)簽之間的差異,并將差異反向傳播反饋給前面的神經(jīng)元,不斷更正權(quán)重系數(shù),從而達(dá)到不斷學(xué)習(xí)的效果。卷積神經(jīng)網(wǎng)絡(luò)的超參數(shù)直接影響模型學(xué)習(xí)性能,本文根據(jù)正交試驗(yàn)優(yōu)化了模型的3個(gè)超參數(shù),并根據(jù)K折交叉驗(yàn)證所劃分的數(shù)據(jù)集依次帶入模型訓(xùn)練,對(duì)5次模型在測(cè)試集上的準(zhǔn)確率取平均值作為模型的準(zhǔn)確率,以期得到性能更優(yōu)越的模型,正交實(shí)驗(yàn)結(jié)果見表2。由表中數(shù)據(jù)可見最優(yōu)的超參數(shù)組合為學(xué)習(xí)率0.001、卷積核大小為3、學(xué)習(xí)500次,其測(cè)試集準(zhǔn)確率達(dá)92%。
圖3 卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)概率結(jié)果Fig.3 Predicted probability of convolutional neural network
2.3.2 正交試驗(yàn)結(jié)果驗(yàn)證將上述正交試驗(yàn)所得卷積神經(jīng)網(wǎng)絡(luò)最佳參數(shù)帶入Resnet18網(wǎng)絡(luò)結(jié)構(gòu)中,將數(shù)據(jù)集隨機(jī)打亂后按訓(xùn)練集 ∶測(cè)試集=8 ∶2進(jìn)行劃分(圖4)。由圖可見,人工智能神經(jīng)網(wǎng)絡(luò)在訓(xùn)練400次后訓(xùn)練集準(zhǔn)確率穩(wěn)定在100%,在測(cè)試集上的準(zhǔn)確率為88%,而測(cè)試集的準(zhǔn)確率在500次時(shí)達(dá)到最優(yōu)(92%)。
本研究建立了一種中藥一法通識(shí)品種鑒定的新方法,根據(jù)中藥材中化學(xué)成分的不同性質(zhì),將其大致拆分成三個(gè)部位,并通過(guò)不同的液相色譜體系在多個(gè)維度下進(jìn)行信息采集,對(duì)中藥化學(xué)成分信息進(jìn)行全方位展示。通過(guò)卷積神經(jīng)網(wǎng)絡(luò)對(duì)所得一法通識(shí)液相圖譜進(jìn)行分類識(shí)別,這種識(shí)別模式在保證準(zhǔn)確率的情況下,克服了傳統(tǒng)中藥識(shí)別所帶的主觀色彩。本方法的訓(xùn)練與預(yù)測(cè)數(shù)據(jù)主要針對(duì)中藥材的化學(xué)物質(zhì)信息,因此對(duì)失去原本樣貌的藥材也可鑒別。更為重要的是,卷積神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)的代表算法之一,不僅性能強(qiáng)勁,且隨著訓(xùn)練次數(shù)的不斷增多,其模型準(zhǔn)確率、容錯(cuò)率及泛化能力將不斷增強(qiáng),是一種可持續(xù)發(fā)展的鑒別新模式。本文目前所展示的神經(jīng)網(wǎng)絡(luò)對(duì)于50味藥材的鑒別僅為階段性成果,并不代表該網(wǎng)絡(luò)的識(shí)別能力僅限于50味藥材,隨著后期標(biāo)準(zhǔn)化實(shí)驗(yàn)數(shù)據(jù)的不斷增加,中藥鑒別種類的拓寬,中藥品種鑒別的精度與寬度將不斷增加。