賈一飛+張盈盈+徐冰+王安冬+詹雪艷
[摘要] 模型傳遞可使特定條件下建立的近紅外模型能夠應(yīng)用于新的樣品狀態(tài)、環(huán)境條件或儀器狀態(tài)。正交信號(hào)回歸是一類(lèi)基于“光譜背景校正”的模型傳遞方法,利用虛擬標(biāo)準(zhǔn)光譜擬合主從批次光譜間的線(xiàn)性關(guān)系,將從批次光譜向主批次光譜映射,以實(shí)現(xiàn)近紅外定量模型的傳遞,但該方法對(duì)虛擬光譜的代表性要求較高,回歸過(guò)程中易出現(xiàn)較大偏差。因此,該文提出一種直接正交信號(hào)校正法(direct orthogonal signal correction,DOSC)聯(lián)合斜率截距校正算法(slope and bias correction,SBC)(DOSC-SBC)的數(shù)據(jù)處理方法,針對(duì)近紅外定量模型對(duì)不同批次樣本制劑過(guò)程中目標(biāo)成分含量預(yù)測(cè)準(zhǔn)確度較差的問(wèn)題,分析不同批次樣本間因組分差異帶來(lái)的光譜背景差異和模型預(yù)測(cè)誤差的性質(zhì),通過(guò)DOSC消除與目標(biāo)值無(wú)關(guān)的光譜背景差異,聯(lián)合SBC算法對(duì)不同批次間樣本批次間系統(tǒng)誤差進(jìn)行校正,實(shí)現(xiàn)近紅外定量模型在不同批次間傳遞。該研究將DOSC-SBC應(yīng)用于金銀花水提和醇沉制劑過(guò)程中,模型對(duì)新批次樣本的預(yù)測(cè)誤差由32.3%,237%降低到7.30%,4.34%,預(yù)測(cè)準(zhǔn)確度顯著提高,實(shí)現(xiàn)了制劑過(guò)程中新批次樣本目標(biāo)成分的快速定量。DOSC-SBC模型傳遞方法實(shí)現(xiàn)了近紅外定量模型在不同批次間傳遞,且該方法不需要標(biāo)準(zhǔn)樣品,有利于促進(jìn)近紅外技術(shù)在中藥制劑過(guò)程的應(yīng)用,為中藥生產(chǎn)過(guò)程中有效成分的實(shí)時(shí)監(jiān)測(cè)提供參考。
[關(guān)鍵詞] DOSC-SBC; 近紅外定量分析; 模型傳遞; 中藥質(zhì)量控制
[Abstract] Near infrared model established under a certain condition can be applied to the new samples status, environmental conditions or instrument status through the model transfer. Spectral background correction and model update are two types of data process methods of NIR quantitative model transfer, and orthogonal signal regression (OSR) is a method based on spectra background correction, in which virtual standard spectra is used to fit a linear relation between master batches spectra and slave batches spectra, and map the slave batches spectra to the master batch spectra to realize the transfer of near infrared quantitative model. However, the above data processing method requires the represent activeness of the virtual standard spectra, otherwise the big error will occur in the process of regression. Therefore, direct orthogonal signal correction-slope and bias correction (DOSC-SBC) method was proposed in this paper to solve the problem of PLS model′s failure to predict accurately the content of target components in the formula of different batches, analyze the difference between the spectra background of the samples from different sources and the prediction error of PLS models. DOSC method was used to eliminate the difference of spectral background unrelated to target value, and after being combined with SBC method, the system errors between the different batches of samples were corrected to make the NIR quantitative model transferred between different batches. After DOSC-SBC method was used in the preparation process of water extraction and ethanol precipitation of Lonicerae Japonicae Flos in this paper, the prediction error of new batches of samples was decreased to 7.30% from 32.3% and to 4.34% from 237%, with significantly improved prediction accuracy, so that the target component in the new batch samples can be quickly quantified. DOSC-SBC model transfer method has realized the transfer of NIR quantitative model between different batches, and this method does not need the standard samples. It is helpful to promote the application of NIR technology in the preparation process of Chinese medicines, and provides references for real-time monitoring of effective components in the preparation process of Chinese medicines.
[Key words] direct orthogonal signal correction-slope and bias correction (DOSC-SBC); NIR quantitative model; model transfer; quality control of traditional Chinese medicine
紅外光譜技術(shù)因其快速、環(huán)保、無(wú)損等優(yōu)勢(shì)已被廣泛應(yīng)用于醫(yī)藥、食品、農(nóng)業(yè)等領(lǐng)域。近紅外定量模型是將光譜數(shù)據(jù)與被測(cè)量進(jìn)行關(guān)聯(lián)并建立兩者之間的關(guān)系。但在特定條件下建立的定量模型,對(duì)于來(lái)自不同儀器、不同來(lái)源或者不同環(huán)境下的樣本,其預(yù)測(cè)準(zhǔn)確度可能會(huì)下降,出現(xiàn)模型“失效”的問(wèn)題,而對(duì)不同儀器、環(huán)境、來(lái)源的樣本分別建模,則會(huì)消耗大量的人力物力。因此,需要對(duì)在特定條件下建立的模型進(jìn)行模型傳遞以提高模型的穩(wěn)健性和包容性。
模型傳遞是通過(guò)一定數(shù)量的傳遞樣本,在不同的樣本狀態(tài)、環(huán)境條件或儀器狀態(tài)下,用數(shù)學(xué)方法在檢測(cè)信號(hào)之間尋求一種變換關(guān)系,來(lái)增強(qiáng)光譜數(shù)據(jù)間的通用性和可比性。模型傳遞可使特定條件下建立的模型能夠應(yīng)用于新的樣品狀態(tài)、環(huán)境條件或儀器狀態(tài)。目前,國(guó)內(nèi)外主要從基于“預(yù)測(cè)值校正”和 “光譜背景校正”2種思想開(kāi)展近紅外定量模型傳遞方法的研究。基于“預(yù)測(cè)值校正”通常采用斜率截距校正算法(slope and bias correction,SBC)[1]來(lái)建立主從儀器光譜預(yù)測(cè)值間的線(xiàn)性關(guān)系,利用該線(xiàn)性關(guān)系實(shí)現(xiàn)新樣本預(yù)測(cè)值的校正?;凇肮庾V背景校正”的模型傳遞方法有直接校正法(direct standardization,DS) [2]、分段直接校正法(piecewise direct standardization,PDS)[3]、正交信號(hào)校正法(orthogonal signal correction,OSC)[4]、直接正交信號(hào)校正法(direct orthogonal signal correction,DOSC)[5]以及正交信號(hào)回歸(orthogonal signal regression,OSR)[7]等。其中,DS和PDS法針對(duì)同一樣本不同測(cè)量條件下的光譜變異進(jìn)行校正,常用于不同儀器間的模型傳遞,但沒(méi)有考慮待測(cè)量的特征,難以在校正無(wú)關(guān)干擾信息的同時(shí)不損失與待測(cè)量有關(guān)的光譜信息,而正交信號(hào)校正法(OSC)、直接正交信號(hào)校正法(DOSC)將光譜正交分解后,僅去除與待測(cè)量無(wú)關(guān)(即正交)的光譜信息,能很好地校正光譜中其他組分、溫度、時(shí)間、儀器等因素變動(dòng)帶來(lái)的光譜背景的影響[6],OSR是利用DOSC光譜預(yù)處理后,利用主從批次的虛擬標(biāo)準(zhǔn)光譜擬合主從批次的光譜間的線(xiàn)性關(guān)系,完成從批次光譜向主批次光譜的映射,實(shí)現(xiàn)近紅外定量模型批次間的傳遞[7],但是該方法對(duì)主批次和從批次虛擬光譜的代表性要求較高,回歸過(guò)程中容易出現(xiàn)大的偏差。如果主從批次光譜間存在線(xiàn)性關(guān)系,主從批次的預(yù)測(cè)值間也線(xiàn)性相關(guān),可以利用SBC算法對(duì)從批次預(yù)測(cè)值校正,實(shí)現(xiàn)近紅外定量模型在主從批次間的傳遞。
不同批次樣本制劑過(guò)程因?yàn)樵?、工藝的波?dòng),不同批次的原藥材制劑過(guò)程中樣本內(nèi)組分群的差異,造成近紅外光譜背景差異和定量模型的較大預(yù)測(cè)誤差,導(dǎo)致PLS線(xiàn)性模型預(yù)測(cè) “失效”。本文對(duì)不同批次樣本間因組分差異帶來(lái)的光譜背景差異和PLS線(xiàn)性模型預(yù)測(cè)誤差的性質(zhì)進(jìn)行分析,提出DOSC聯(lián)合SBC的模型傳遞方法,通過(guò)DOSC減小不同批次樣本的光譜背景差異,聯(lián)合SBC算法對(duì)不同批次間樣本預(yù)測(cè)的系統(tǒng)誤差進(jìn)行校正,實(shí)現(xiàn)近紅外定量模型在不同批次樣本間的傳遞。
1 材料
1.1 儀器
Waters 1525高效液相色譜儀(美國(guó)Waters公司),Breeze2 HPLC色譜工作站,Waters 2998二級(jí)管陣列檢測(cè)器,Waters 2707自動(dòng)進(jìn)樣器,Waters 038040柱溫箱。XDS PROCESS ANALYZER 近紅外光譜儀(Foss公司),夾套式100 L多功能提取罐(天津市隆業(yè)中藥設(shè)備有限公司)。
1.2 試劑
綠原酸對(duì)照品(上海源葉生物科技有限公司);磷酸(分析純,北京化工廠);乙腈[色譜純,賽默飛世爾科技(中國(guó))有限公司];乙醇(北京化工廠);水為去離子水。
1.3 藥材
金銀花藥材(批次Ⅰ、批次Ⅱ購(gòu)于安國(guó)長(zhǎng)安中藥材有限公司;批次Ⅲ、批次Ⅳ購(gòu)于安國(guó)云天中藥行;批次Ⅴ購(gòu)于安國(guó)永益中藥材有限公司)。
2 方法
2.1 數(shù)據(jù)來(lái)源
2.1.1 金銀花水提液的數(shù)據(jù) 金銀花提取液中綠原酸含量按照《中國(guó)藥典》(2015 年版)金銀花藥材項(xiàng)下規(guī)定的方法進(jìn)行測(cè)定[8]。金銀花藥材投料量為 6 kg,一煎加水12倍,加熱回流提取1 h,并于提取前浸泡30 min。二煎加水10 倍,加熱回流提取1 h。浸泡及一煎過(guò)程 3 min采樣10 mL;二煎過(guò)程每4 min采樣10 mL。利用Foss公司的XDS PROCESS ANALYZER在線(xiàn)采集中試金銀花水提液樣品NIR透射光譜,光程2 mm,光譜范圍12 500~5 263 cm-1,掃描次數(shù)32次,分辨率7.8 cm-1,實(shí)驗(yàn)采用空氣作為參比,每個(gè)樣品平行采集 3 次。
本實(shí)驗(yàn)采用購(gòu)自安國(guó)長(zhǎng)安中藥材有限公司的金銀花制備中試水提樣本批次Ⅰ和Ⅱ,采用購(gòu)自安國(guó)云天中藥行的金銀花制備中試水提樣本批次Ⅲ,用3個(gè)批次的66個(gè)樣本作為建模樣本,以K-S法選擇42個(gè)代表性的樣本建模,剩下的24個(gè)作為內(nèi)部預(yù)測(cè)集。以購(gòu)自安國(guó)永益中藥材有限公司的金銀花水提樣本批次Ⅳ的19個(gè)樣本作為外部預(yù)測(cè)集,各數(shù)據(jù)集對(duì)應(yīng)的綠原酸濃度分布見(jiàn)表1。
2.1.2 金銀花醇沉液的數(shù)據(jù) 取一定量的金銀花藥材,加水煎煮2次,一煎加水15 倍,二煎10倍,每次 0.5 h。合并提取液,濾過(guò),濃縮密度至1.10。3 000 mL燒杯中取400 mL濃縮液,在500 r·min-1的轉(zhuǎn)速下,以75 mL·min-1速度加入95%乙醇,不同批次加入不同量的乙醇。乙醇加入完畢后繼續(xù)攪拌30 min。每隔30 s取樣1.5 mL,9 000 r·min-1離心10 min,取上清液分別測(cè)量NIR光譜和參考值。利用Thermo Nicolet Antaris FT-NIR Analyzer 室溫下采集透射光譜,光程8 mm,分辨率為4 cm-1,掃描范圍1萬(wàn)~4 000 cm -1,掃描次數(shù)16 次,增益為4,每個(gè)樣品平行采集3 次。
本研究采用5批醇沉液(批次Ⅰ~Ⅴ)進(jìn)行過(guò)程定量分析。前3批(批次Ⅰ~Ⅲ)用K-S的方法篩選出120個(gè)樣本作為初始校正集,剩余60個(gè)樣本作為內(nèi)部測(cè)試集,批次Ⅳ和Ⅴ的110個(gè)樣本作為外部測(cè)試集,各數(shù)據(jù)集對(duì)應(yīng)的綠原酸濃度分布見(jiàn)表2。
2.2 數(shù)據(jù)處理
數(shù)據(jù)處理均在Unscrambler數(shù)據(jù)分析軟件(version 9.7挪威CAMO軟件公司)和MATLAB軟件(version7.0,美國(guó)Math Works公司)上完成。
2.3 直接信號(hào)校正(DOSC)算法
DOSC算法是在OSC算法的基礎(chǔ)上提出的一種改進(jìn)算法[5],其作為一種光譜預(yù)處理方法,是將光譜矩陣(X)與濃度矩陣(Y)正交,將正交后與Y無(wú)關(guān)的信號(hào)濾過(guò),保留與目標(biāo)值Y相關(guān)的光譜信息,并基于以上光譜信息建立定量分析模型。該方法的實(shí)現(xiàn)過(guò)程簡(jiǎn)介如下。
求建模集濃度(Ym)在光譜矩陣(Xm)所張開(kāi)的空間中的投影Ypj,Ypj=XmXm+Ym(Xm+代表X的廣義逆);計(jì)算Xm在Ypj正交補(bǔ)空間的投影Xpj,Xpj=(1-YpjYpj+)Xm;對(duì)XpjXpj′進(jìn)行主成分提取,取前幾個(gè)主成分得到得分矩陣T,[T,D]=SVD(XpjXpj′);計(jì)算權(quán)重矩陣W,W=Xm+T;重新計(jì)算得分矩陣,Tnew=XmW;計(jì)算載荷矩陣P,P=XmTnew/(T′newTnew);去除正交信號(hào)后,可得新的光譜矩陣,Xnew=Xm-TnewP′=Xm-XmWP′=Xm(E-WP′);由DOSC方法可知,對(duì)于待轉(zhuǎn)移的光譜數(shù)據(jù)Xtest,根據(jù)載荷矩陣P及權(quán)重矩陣W即可求出校正后的光譜,XDOSCtest=Xtest-XtestWP′=Xtest(E-WP′)。
從上可以看出該算法是將原光譜Xm經(jīng)過(guò)矩陣(E-WP′)投影到一個(gè)由建模集光譜X和濃度Y確立的空間中,光譜X在此空間中只保留了與Y相關(guān)的部分,與Y無(wú)關(guān)的部分被過(guò)濾,因此消除了光譜中與目標(biāo)值Y無(wú)關(guān)的背景信息造成的偶然誤差。通常利用DOSC算法光譜預(yù)處理后所建PLS模型能夠取得比未經(jīng)過(guò)光譜預(yù)處理更好的結(jié)果。
但是經(jīng)過(guò)映射后,光譜本身可能存在的系統(tǒng)誤差也同時(shí)被映射到同一個(gè)空間中,故DOSC可能會(huì)將原本系統(tǒng)誤差放大,因此需要能消除系統(tǒng)誤差的算法來(lái)彌補(bǔ)本方法的不足。
2.4 SBC算法
SBC算法是一種常用的模型傳遞方法,通過(guò)對(duì)模型斜率和截距的調(diào)整,使待轉(zhuǎn)移樣本與建模樣本的預(yù)測(cè)結(jié)果相近。
假設(shè)原線(xiàn)性校正模型的參數(shù)為[β,b],其中β為系數(shù)矩陣,b為偏差,主批次光譜X1,從批次光譜X2,這2條光譜對(duì)應(yīng)同一個(gè)參考值Y,X2對(duì)應(yīng)的原模型預(yù)測(cè)值為Y2,X1與X2存在一定的線(xiàn)性關(guān)系[20],可寫(xiě)作X1=kX2+L(其中k為斜率,L為截距);由于所見(jiàn)模型是適合于主批次的,故Y=βX1+b;合并二式可得Y=β(kX2+L)+b;又因Y2為X2的預(yù)測(cè)值,故Y2=βX2+b;由此可以得到Y(jié)與Y2的關(guān)系:Y=kY2+(L×Σβ+b-kb)。
因k,L以及模型[β,b]為常數(shù),可知Y與Y2之間存在線(xiàn)性關(guān)系,可利用少量從批次光譜的原模型預(yù)測(cè)值和參考值擬合得到式中k和L×Σβ+b-kb。
2.5 DOSC-SBC算法簡(jiǎn)介
DOSC-SBC模型傳遞方法先利用DOSC算法來(lái)消除不同批次樣本間由不確定的光譜背景差異造成的偶然誤差,然后利用SBC算法消除不同批次光譜間存在的系統(tǒng)誤差,具體實(shí)現(xiàn)步驟見(jiàn)圖1。
首先采用DOSC處理后的模型光譜X1建立PLS模型,然后用所得模型對(duì)從批次代表性樣本X2,即轉(zhuǎn)移樣本進(jìn)行預(yù)測(cè),將其預(yù)測(cè)值Y2t與參考值Y2進(jìn)行線(xiàn)性回歸,建立近紅外定量模型對(duì)新批次樣本預(yù)測(cè)值與參考值間的線(xiàn)性關(guān)系Y2 = slope×Y2t+ bias,基于該線(xiàn)性關(guān)系將原模型對(duì)從批次樣本集X3預(yù)測(cè)值進(jìn)行回歸校正,完成模型傳遞,得到從批次待轉(zhuǎn)移光譜經(jīng)過(guò)DOSC-SBC模型傳遞后的預(yù)測(cè)值Y3′。
DOSC聯(lián)合 SBC模型傳遞方法適用于不同批次樣本制劑過(guò)程的光譜背景同時(shí)存在不確定偶然誤差和較大系統(tǒng)誤差的情況,如果不存在系統(tǒng)誤差,使用本方法可能會(huì)出現(xiàn)過(guò)擬合的現(xiàn)象。
3 結(jié)果與討論
3.1 誤差分析
3.1.1 金銀花水提過(guò)程光譜誤差分析 對(duì)金銀花水提過(guò)程中水提液光譜與綠原酸濃度進(jìn)行相關(guān)性分析,8 500~7 300 cm-1波段與綠原酸含量的預(yù)測(cè)密切相關(guān),該波段所建的綠原酸定量模型預(yù)測(cè)性能最佳,因此選取光譜中該波段的光譜數(shù)據(jù)進(jìn)行分析,分析同批次和不同批次樣本光譜的誤差來(lái)源,見(jiàn)圖2。
圖2中的a圖中同一批次金銀花水提液樣本2條光譜基本重合,c圖分別以2光譜的吸光度A作橫軸和縱軸,2條光譜A基本落在y=x(對(duì)應(yīng)的空心圓散點(diǎn)連線(xiàn))這一直線(xiàn)上,偏離較小,且A偏離不具有單向性,這些小的偏離可以看作平行測(cè)量間的偶然誤差。b圖中不同批次金銀花水提液樣本光譜可以看出在7 800~7 300 cm-1發(fā)生了較大偏離,d圖中這2條光譜的A作橫軸和縱軸,線(xiàn)性關(guān)系較為明顯,但2條光譜A偏離y=x(對(duì)應(yīng)的空心圓散點(diǎn)連線(xiàn))這一直線(xiàn)較大,可以看出不同批次的樣本光譜A的偏離除了測(cè)量的偶然誤差外,還存在較大的不同批次金銀花的組分差異造成的光譜背景差異。
3.1.2 金銀花醇沉過(guò)程光譜誤差分析 金銀花醇沉液光譜中8 500~7 300 cm-1波段所建的綠原酸定量模型預(yù)測(cè)性能最佳,因此選取光譜中該波段的光譜數(shù)據(jù)進(jìn)行分析,分析同批次和不同批次樣本光譜的誤差來(lái)源,見(jiàn)圖3。圖3 a圖中相同綠原酸濃度同一批次的金銀花醇沉樣本2條光譜基本重合,c圖以綠原酸濃度為4.462 g·L-1的同批次2條光譜吸光度分別作為橫縱坐標(biāo)作散點(diǎn)圖,其值基本落于y=x(對(duì)應(yīng)的空心圓散點(diǎn)連線(xiàn))直線(xiàn)上,有較小偏離且上下波動(dòng)不具有單向性,這些可以看作平行測(cè)量之間的偶然誤差;b圖中,不同批次之間2條相同濃度的光譜在7 400~7 300 cm-1波段基本重合,然而在8 500~7 400 cm-1波段偏離較為明顯;d圖中綠原酸濃度為2.235 g·L-1不同批次2條光譜吸光度關(guān)系圖中,線(xiàn)性關(guān)系較為明顯,但所作散點(diǎn)均位于y=x(對(duì)應(yīng)的空心圓散點(diǎn)連線(xiàn))以下,偏離較大,且偏向性明顯,說(shuō)明不同批次的光譜之間除了偶然誤差之外,還存在由于不同批次而造成的較大系統(tǒng)誤差。
3.2 結(jié)果分析
為了對(duì)比DOSC與DOSC-SBC進(jìn)行光譜數(shù)據(jù)處理的效果,本實(shí)驗(yàn)用來(lái)自同批次樣本的內(nèi)部和來(lái)自不同批次樣本的外部驗(yàn)證集的RPD與RSEP 2個(gè)指標(biāo)衡量預(yù)測(cè)效果。驗(yàn)證集中各樣本模型預(yù)測(cè)值和化學(xué)測(cè)量值相關(guān)系數(shù)Rp和RPD越大,RSEP越小,說(shuō)明預(yù)測(cè)效果越好。不同光譜預(yù)處理下金銀花水提過(guò)程和醇沉過(guò)程近紅外光譜近紅外模型的預(yù)測(cè)結(jié)果見(jiàn)表3,4。
表3中以3個(gè)批次金銀花水提過(guò)程的樣本光譜直接建模,校正集預(yù)測(cè)相對(duì)誤差為8.36%,選擇與校正集相同一批次金銀花重復(fù)制劑,該過(guò)程中水提液樣本綠原酸含量預(yù)測(cè)相對(duì)誤差為4.99%,誤差較小,符合快速含量預(yù)測(cè)的要求,但是對(duì)于不同批次金銀花在相同條件下水提樣本綠原酸含量預(yù)測(cè)的相對(duì)誤差達(dá)32.3%,預(yù)測(cè)誤差過(guò)大,不能用于新批次金銀花制劑過(guò)程中綠原酸含量的預(yù)測(cè)。
DOSC 光譜預(yù)處理后,校正集的預(yù)測(cè)相對(duì)誤差由8.36%下降到4.55%,校正集預(yù)測(cè)準(zhǔn)確度提高;內(nèi)部驗(yàn)證集的相對(duì)誤差由4.99%變?yōu)?.08%,雖略有升高但仍符合快速含量測(cè)定的要求;外部驗(yàn)證集的RSEP由32.3%降低到21.9%,預(yù)測(cè)相對(duì)誤差有所降低,但還未控制在10%以?xún)?nèi),預(yù)測(cè)誤差過(guò)大,不能用于新批次制劑過(guò)程的預(yù)測(cè)。以上數(shù)據(jù)表明DOSC有一定的光譜背景校正效果,但還不能消除不同批次樣本間的所有誤差,僅僅起到了消除背景誤差的作用。
利用SBC算法對(duì)外部驗(yàn)證集的預(yù)測(cè)結(jié)果進(jìn)行校正,預(yù)測(cè)相對(duì)誤差由32.3%下降到7.5%,表明SBC能夠顯著消除不同批次樣本光譜間的系統(tǒng)誤差。
對(duì)校正集進(jìn)行DOSC光譜預(yù)處理并聯(lián)合SBC算法對(duì)不同批次的外部測(cè)試集進(jìn)行校正,原模型對(duì)外部驗(yàn)證集RSEP由32.3%降低到7.3%,RPD由1.17提高到5.19,與僅使用DOSC或SBC一種方法相比,預(yù)測(cè)準(zhǔn)確度均得到提高,表明DOSC-SBC能夠較好的校正和消除不同批次樣本的光譜差異,實(shí)現(xiàn)金銀花水提過(guò)程中不同批次間的模型傳遞。
表4以金銀花醇沉液光譜中的8 500~7 300 cm-1波段直接建模,校正集預(yù)測(cè)相對(duì)誤差為7.45%,內(nèi)部驗(yàn)證集中同批次金銀花醇沉過(guò)程綠原酸含量預(yù)測(cè)相對(duì)誤差為9.64%,誤差較小,符合快速含量預(yù)測(cè)的要求,但對(duì)外部驗(yàn)證集不同批次樣本預(yù)測(cè)的相對(duì)誤差達(dá)到237%,預(yù)測(cè)誤差過(guò)大,模型不能用于新批次金銀花醇沉過(guò)程中綠原酸含量的預(yù)測(cè)。
對(duì)光譜進(jìn)行DOSC光譜預(yù)處理后,校正集相對(duì)預(yù)測(cè)誤差由7.45%減小至4.43%,內(nèi)部測(cè)試集相對(duì)預(yù)測(cè)誤差由9.64%減小至8.16%,表明DOSC算法消除光譜中與綠原酸含量無(wú)關(guān)的光譜背景差異,但模型對(duì)外部驗(yàn)證集中不同批次樣本的預(yù)測(cè)相對(duì)誤差很大,對(duì)外部測(cè)試集的預(yù)測(cè)值進(jìn)行SBC校正后,預(yù)測(cè)相對(duì)誤差降低到5.25%,表明SBC校正能夠顯著消除批次間的系統(tǒng)誤差。
對(duì)金銀花醇沉液進(jìn)行DOSC光譜預(yù)處理,并聯(lián)合SBC算法對(duì)新批次樣本的外部測(cè)試集進(jìn)行校正,RSEP由237%降低到4.34%,RPD由0.125提高到6.80,預(yù)測(cè)結(jié)果優(yōu)于僅使用DOSC或SBC一種方法的結(jié)果,表明DOSC算法消除與目標(biāo)值無(wú)關(guān)的光譜背景差異后,再采用SBC方法校正批次間的系統(tǒng)誤差,進(jìn)一步減小模型的預(yù)測(cè)誤差,DOSC-SBC校正對(duì)于批次間的模型傳遞起到了更為顯著的校正效果。
4 結(jié)論
本文將DOSC光譜預(yù)處理方法與SBC斜率截距校正法相結(jié)合,用于金銀花水提和醇沉制劑過(guò)程中不同批次間的模型傳遞,對(duì)新批次金銀花水提和醇沉制劑過(guò)程樣本的預(yù)測(cè)誤差分別由28.7%降低到8.33%以及由237%降低到4.34%。2組金銀花制劑過(guò)程中的數(shù)據(jù)處理結(jié)果表明,DOSC-SBC方法能夠有效消除金銀花水提或醇沉過(guò)程中批次間的差異,實(shí)現(xiàn)制劑過(guò)程近紅外定量模型批次間的傳遞和制劑過(guò)程新批次樣本目標(biāo)成分的快速定量。本方法通過(guò)DOSC消除與目標(biāo)值無(wú)關(guān)的光譜背景批次間的小差異,然后通過(guò)SBC校正批次間系統(tǒng)誤差,從而實(shí)現(xiàn)近紅外定量模型批次間的傳遞。但本方法仍然存在一定的局限性:首先本方法適用于批次間光譜本身確實(shí)存在系統(tǒng)誤差,如果只存在平行測(cè)量的偶然誤差,可以?xún)H用DOSC來(lái)減小。其次,原模型的預(yù)測(cè)值與樣本的參考值之間存在一定的線(xiàn)性關(guān)系,才能利用SBC校正的預(yù)測(cè)誤差滿(mǎn)足快速定量的要求。本研究提出了一種新的數(shù)據(jù)處理策略,實(shí)現(xiàn)中藥制劑過(guò)程中近紅外定量模型在不同批次間的傳遞。此外,本方法的實(shí)現(xiàn)不需要標(biāo)準(zhǔn)樣品,便于在實(shí)際制劑過(guò)程的應(yīng)用,為進(jìn)一步促進(jìn)中藥中試乃至大規(guī)模生產(chǎn)過(guò)程中有效成分的實(shí)時(shí)監(jiān)測(cè)和質(zhì)量控制提供參考方法。
[參考文獻(xiàn)]
[1] Bouveresse E, Hartmann C,Massart D, et al. Standardization of near-infrared spectrometric instruments [J]. Anal Chem, 1996,68(6):982.
[2] 李慶波,張廣軍,徐可欣,等. DS算法在近紅外光譜多元校正模型傳遞中的應(yīng)用 [J].光譜學(xué)與光譜分析,2007,27(5):43.
[3] Wang Y,Veltkamp D, Kowalski B. Multivariate instrument standardization[J]. Anal Chem,1991,63(23):2750.
[4] Wold S,Antti H,Lindgren F,et al. Orthogonal signal correction of near-infrared spectra [J]. Chemom Intell Lab Syst,1998,44(1): 175.
[5] Westerhuis J A, de Jong S, Smilde A K. Direct orthogonal signal correction [J]. Chemom Intell Lab Syst,2001,56:13.
[6] Soldado A, Fearn T,Martinez-Fernandez A,et al . The transfer of NIR calibrations for undried grass silage from the laboratory to on-site instruments: comparison of two approaches [J]. Talanta,2013,105(1):8.
[7] Lin Z Z, Xu B,Yang L,et al. Application of orthogonal space regression to calibration transfer without standards [J]. J Chemometrics,2013,11(27):406.
[8] 中國(guó)藥典. 一部[S]. 2015:221.
[責(zé)任編輯 孔晶晶]