柯 櫻,朱振明,張爍陽,王薇青,陸 峰 (. 上海醫(yī)藥集團股份有限公司,上海 0000;. 上海上藥中西制藥有限公司,上海 0806;. 海軍軍醫(yī)大學(xué),上海 004)
過程分析技術(shù)(process analytical technology,PAT)通過對關(guān)鍵質(zhì)量數(shù)據(jù)包括原始物料質(zhì)量、中間物料質(zhì)量和工藝過程參數(shù)進行實時監(jiān)測以確保成品質(zhì)量[1]。其中,近紅外光譜(near infrared spectroscopy,NIRS)分析技術(shù)是PAT 的核心技術(shù)之一,其獨特優(yōu)勢在于測試方便、分析速度快、分析效率高,非常適用于在線分析[2]。目前該技術(shù)在國外藥企已有很多應(yīng)用,如對流化過程中干燥終點的控制[3]、監(jiān)測包衣過程[4]、測定片劑中原料藥和輔料的含量[5]等。
硫酸羥氯喹是臨床上治療類風(fēng)濕性關(guān)節(jié)炎、系統(tǒng)性紅斑狼瘡的常用藥物[6-8]。硫酸羥氯喹制粒工藝為濕法制粒,而濕法制粒的產(chǎn)品質(zhì)量控制主要在制粒過程中。為縮小批間差異和改善工藝,利用PAT 技術(shù)建立定量或定性模型以檢測顆粒水分、混合均勻度和粒徑等一系列指標(biāo),而水分含量既影響粒徑分布也影響混勻程度,故需要優(yōu)先測量[9]。目前,硫酸羥氯喹顆粒在干燥過程中使用快速水分測定儀測定水分含量,以監(jiān)測干燥終點。這種分析方法在干燥過程中取樣測定水分,會帶來人為干擾因素,且水分測定儀的測量時間較長,在等待測量結(jié)果時,流化床內(nèi)的物料水分仍在不斷變化。使用NIR 分析技術(shù)對硫酸羥氯喹顆粒的水分含量進行實時監(jiān)測,將有助于提高硫酸羥氯喹的生產(chǎn)效率、降低因等待測量結(jié)果時物料水分仍在不斷降低帶來的生產(chǎn)風(fēng)險,以及提高產(chǎn)成品的質(zhì)量,有助于向生產(chǎn)全自動化發(fā)展。目前,國內(nèi)使用NIR 分析技術(shù)監(jiān)測物料水分含量的報道以離線方式居多[10-13]。課題組之前建立了硫酸羥氯喹顆粒離線水分定量模型[10],本研究在此基礎(chǔ)上先在小試部分建立在線水分定量模型,并在試運行情況良好的基礎(chǔ)上將模型轉(zhuǎn)移到車間生產(chǎn)線。結(jié)果表明該模型能滿足生產(chǎn)過程在線監(jiān)測硫酸羥氯喹顆粒水分的需求。
Thermo Antaris MX 近紅外光譜儀、TQ Analyst 9.5 軟件(美國Thermo Fisher 公司),HX204 鹵素水分測定儀(瑞士Mettler-Toledo 公司),硫酸羥氯喹顆粒(上海上藥中西制藥有限公司),MATLAB 2014a(美國MathWorks 公司),DPL-0.5 型多功能制粒/包衣機(重慶精工制藥機械有限責(zé)任公司),DG400 流化床(上海東富龍科技股份有限公司)。
在流化床鍋體的下半部分安裝藍寶石窗口,并將Thermo Antaris MX 近紅外光譜儀的探頭固定于窗口上,取樣口在流化床的另一側(cè)。將制粒后的濕顆粒倒入流化床中進行干燥,實驗所用樣品是在流化床干燥過程中從取樣口實時取出得到的樣品:流化床開始進風(fēng)干燥并開始連續(xù)采集樣品光譜,光譜采集完成后立即取樣。因物料溫度在30 ℃前樣品水分變化較快,故取樣間隔時間較短,每隔30 s取一次樣品;在物料溫度高于35 ℃時水分變化較慢,取樣的間隔時間延長,每隔2 min 取一次樣品,待物料溫度繼續(xù)上升到55 ℃時停止干燥(覆蓋了工藝范圍以得到全面的樣品光譜信息)。一批物料需分成4 鍋流化床完成,每做一鍋流化床采集約10 個樣本,一批可采集約40 個樣品,共12 批采集519 個樣品建立模型。
用水分測定儀測定樣品的水分質(zhì)量含量為1.00%~7.50%(涵蓋了工藝優(yōu)化值1.00%~4.00%)。
使用近紅外光譜儀以漫反射光纖探頭的采集方式連續(xù)采集干燥過程中的樣品的近紅外光譜。光譜的掃描范圍為10 000~4 500 cm-1,掃描次數(shù)為64 次,分辨率為8 cm-1,增益值為8×,每次采集光譜前均進行背景光譜的采集,采集得到的近紅外光譜如圖1 所示。
圖1 硫酸羥氯喹顆粒近紅外光譜對數(shù)圖
利用TQ Analyst 9.5 軟件結(jié)合化學(xué)計量學(xué)的PLS 算法,建立硫酸羥氯喹顆粒含水量的定量分析模型。首先采用Chauvenet 準(zhǔn)則檢驗結(jié)合杠桿值-學(xué)生化殘差圖鑒別并剔除異常樣本[14],進而采用SPXY 分類算法將其余樣本劃分為校正集和驗證集。通過一系列參數(shù),包括校正集誤差均方根(RMSEC)、驗證集誤差均方根(RMSEP)和相關(guān)系數(shù)R 等評價模型進行考察[15]。當(dāng)模型相關(guān)系數(shù)R 越接近1,說明模型擬合效果好,分析準(zhǔn)確度越高。當(dāng)RMSEC 和RMSEP 值越小且越彼此接近,即|RMSEP-RMSEC|趨近0,表明模型具有好的穩(wěn)定性,且當(dāng)RMSEP 值較小時,模型具有較高預(yù)測能力。
2.4.1 異常樣本的剔除
異常樣本會對NIR 模型產(chǎn)生很大的影響,例如誤導(dǎo)光譜變量的選擇,影響模型的參數(shù)估計,降低模型的預(yù)測準(zhǔn)確度和穩(wěn)定性[16-18]。采用Chauvenet準(zhǔn)則檢驗結(jié)合杠桿值-學(xué)生化殘差圖,鑒別并剔除13 個異常樣本:23、58、61、70、79、95、96、97、139、223、276、350 和473。
2.4.2 樣本集劃分
在NIR 模型建立的過程中如何挑選具有代表性的樣本,對最終模型的預(yù)測準(zhǔn)確性與穩(wěn)定性有很大影響。SPXY[19]分類方法是近紅外樣本分類中一種常用的方法,同時考慮了樣本的光譜和濃度特征。進行模型建立的樣本共有519 份,在“2.4.1”項下剔除了13 份樣品,將剩余506 份樣品使用SPXY分類法進行分類,344 份樣品作為校正集,162 份樣品作為驗證集。主成分分析結(jié)果表明,樣本的驗證集均勻分布在校正集中。
2.4.3 光譜預(yù)處理
光譜預(yù)處理方法包括MSC、SNV 及求導(dǎo)等一系列算法。MSC 通過數(shù)學(xué)方法將光譜中的散射信號與化學(xué)信息進行分離,用于消除由于樣品顆粒分布不均及顆粒大小不同所產(chǎn)生的散射對其光譜的影響。SNV 的作用與MSC 基本相同,均是用于消除由于顆粒散射及光程差異給光譜帶來的影響[15]。
對光譜進行求導(dǎo),同時運用Savitzky-Golay(SG)平滑濾波,或者Karl Norris 平滑濾波對光譜進行平滑。求導(dǎo)可以增強光譜信號,平滑可以濾除噪聲。從表1 可以看出NIR 光譜經(jīng)過MSC、一階導(dǎo)數(shù)以及Karl Norris 平滑,能得到較好的數(shù)據(jù)處理結(jié)果。
2.4.4 建模波段的選擇
選擇合適的波段用于模型的建立,對最終所建模型的預(yù)測準(zhǔn)確度和穩(wěn)定性有重要的影響。為了得到NIR 光譜的特征信息,首先對前3 個主成分的載荷向量進行分析[20],圖2A 為前3 個主成分全光譜范圍的載荷圖。由PC1 載荷圖可知,光譜在4 935~5 336 cm-1和6 911~7 297 cm-1附近的波段范圍包含更多的特征信息。由PC2 和PC3 載荷圖可知,在上述波段附近也包含較多的光譜信息。同時,與得到求導(dǎo)后的一階光譜(圖2B)相比較,確定上述兩個波段與水分之間確實具有較強的相關(guān)性,是NIR 光譜中水分的主要吸收峰,可用于水分模型的建立。
表1 不同光譜預(yù)處理方法得到的模型參數(shù)
2.4.5 主因子數(shù)的選擇
主因子數(shù)的選擇在建立模型的過程中至關(guān)重要,選擇正確的主因子數(shù)既能完全利用NIR 光譜信息,還能避免出現(xiàn)過擬合現(xiàn)象。根據(jù)TQAnlyst9.5中的PRESS 圖,以RMSECV 和PRESS 最小時所對應(yīng)的主因子數(shù)即為最佳主因子數(shù)(本研究中主因子數(shù)為6)。
2.4.6 NIR 模型的建立
根據(jù)SPXY 分類法得到的校正集建立模型,用驗證集對模型進行驗證。以MSC+一階導(dǎo)數(shù)+Karl Norris 平滑為光譜的預(yù)處理方式,選擇的建模波段為4 935~5 336 cm-1和6 911~7 297 cm-1,結(jié)合化學(xué)計量學(xué)中的PLS 算法建立NIR 定量分析模型(圖3):RMSEC 為0.408,相關(guān)系數(shù)為0.952 9;RMSEP為0.435,相關(guān)系數(shù)為0.936 6;主因子數(shù)為6。從圖3 可以看出校正集和驗證集的數(shù)據(jù)點在模型范圍(1.00%~7.50%)內(nèi)分布均勻,且校正集分布在驗證集的范圍內(nèi),表明用校正集建立的模型對驗證集的驗證有效,同時|RMSEP-RMSEC|的數(shù)值為0.027,趨近于0,以上結(jié)果均表明所建模型較為穩(wěn)定。
2.4.7 模型準(zhǔn)確度的評價
RPD 值是驗證集標(biāo)準(zhǔn)偏差與預(yù)測集標(biāo)準(zhǔn)偏差的比值,即RPD=SDV/SEP。本研究以RPD 值對模型進行評價。其中,SDV 為驗證集所有樣本濃度值的標(biāo)準(zhǔn)偏差,SEP 為預(yù)測集標(biāo)準(zhǔn)偏差。驗證集樣本的性質(zhì)分布越均勻,SEP 值越小,RPD 值越大。本研究中,通過計算得到RPD 值為5.18(大于5),表明模型的預(yù)測結(jié)果可以接受[10]。
圖2 硫酸羥氯喹近紅外光譜圖
圖3 硫酸羥氯喹顆粒定量模型
將建立完成的模型應(yīng)用于一批物料(PAT190601-6)的干燥過程,按“2.1”項下操作,采集所取樣品光譜。將采集的光譜導(dǎo)入“2.4.6”項下建立的模型,得到光譜的預(yù)測值,用快速水分測定儀測定每份樣品的參考值。預(yù)測集的RMSEP=0.265。將預(yù)測集樣本的預(yù)測值與參考值進行配對樣本t 檢驗,顯著性水平設(shè)為0.05。檢驗結(jié)果|t|=0.195,小于t 雙尾臨界值1.990,F(xiàn)=1.10<1.46,說明預(yù)測值與參考值之間無統(tǒng)計學(xué)差異。圖4 為預(yù)測值與參考值水分變化曲線,從圖中可以看出兩個曲線的重合性較好,進一步表明模型的誤差較小,穩(wěn)定性較好(鑒于流化床體積,一個批次樣品需要分為4 份進入流化床干燥)。
在模型已初步建立完成并應(yīng)用情況較好的小試基礎(chǔ)上,將儀器移入車間,開始對大生產(chǎn)過程中物料水分變化進行實時檢測。將藍寶石窗口置于流化床底部,探頭切合于窗口,取樣口于窗口的對面處??紤]到儀器所處環(huán)境的改變可能對光譜產(chǎn)生影響,包括吸收峰的偏移、展寬、吸收強度的非線性變化等[21],需要對模型在車間的可應(yīng)用性重新評價。
對一批物料(PAT-191223)進行干燥實驗,該批樣品需分兩批進入流化床,每批采集3~4 g 樣品后,用水分測定儀測定水分值。預(yù)測集的RMSEP=0.265。將預(yù)測集樣本的預(yù)測值與參考值進行配對樣本t 檢驗,顯著性水平設(shè)為0.05。檢驗結(jié)果|t|=0.265,小于t 雙尾臨界值2.110,F(xiàn)=0.78<3.18,說明預(yù)測值與參考值之間無統(tǒng)計學(xué)差異。
將模型導(dǎo)入Result Operation 軟件,可實時反映物料(PAT-191223)的水分值變化,由圖5 可見水分值平穩(wěn)下降、直至趨于穩(wěn)定。在干燥過程中,在線取出5 份樣品,用水分測定儀測量參考值并標(biāo)于圖中(紅色為參考值,黑色為預(yù)測值)??梢婎A(yù)測值與參考值的重合性較好,表明模型的誤差較小且穩(wěn)定性較好。
模型的誤差有兩個來源:①探頭與取樣口間隔較遠,降低了采集得到的光譜與樣品的空間對應(yīng)性,對模型的準(zhǔn)確度帶來影響;②取樣口的通道較窄,會造成濕物料堆積,對樣品的水分值造成影響。解決方法:①光譜采集完成后立即取樣,可以保證光譜與樣品的時間對應(yīng)性,對于提高空間對應(yīng)性的解決方法是可在窗口附近安裝取樣口;②及時清理取樣口堆積的物料,避免對樣品水分值產(chǎn)生影響。
工藝要求硫酸羥氯喹顆粒水分值為1.00%~4.00%,模型預(yù)測范圍為1.00%~7.50%,包含了工藝要求的范圍,可應(yīng)用此模型縮小批間的水分差異。例如,當(dāng)預(yù)測值在2.00%時停止干燥,為工藝的改善和提高提供基礎(chǔ)。從圖5 可以看出,部分時間段的水分值上下波動,而非持續(xù)下降,且在接近干燥終點時,水分值在2.00%處波動,且無明顯下降趨勢。原因可能為采集得到的NIR 光譜反映的是表層樣品的光譜,無法準(zhǔn)確反映較深處即流化床鍋體內(nèi)部的物料水分情況,而下一張光譜有可能為內(nèi)部的物料吹到窗口處采得,因此,預(yù)測的水分值略有升高。
圖4 4 份樣品預(yù)測值與參考值的水分變化曲線
圖5 硫酸羥氯喹顆粒水分含量變化圖
本實驗采集了11 批次藥品用于含水量模型的建立。由于在硫酸羥氯喹的實際生產(chǎn)過程中,原輔料的不同批次之間存在批間差異,此外,生產(chǎn)過程中存在影響硫酸羥氯喹顆粒質(zhì)量的其他因素,這也導(dǎo)致不同批次的硫酸羥氯喹顆粒之間也存在批間差異。故在建立模型時盡可能包含較多批次,以包含更多批間差異,雖然模型的誤差可能會增加,但可提高后期模型在實際大生產(chǎn)中的可應(yīng)用性。因此,在以后的生產(chǎn)過程中仍需不斷累計數(shù)據(jù),更新并完善模型。