張坤峰,王 政,曹君杰,張志強,喬延江,5*,徐 冰*
( 1.北京中醫(yī)藥大學 中藥信息學系,北京 102400;2.北京市科委 中藥生產過程控制與質量評價北京市重點 實驗室,北京 102400;3.教育部中藥制藥與新藥開發(fā)關鍵技術工程研究中心,北京 102400;4.北京康仁堂 藥業(yè)有限公司,北京 101301;5.中藥配方顆粒關鍵技術國家地方聯合工程研究中心,天津 301700)
中藥片劑、顆粒劑、膠囊劑、丸劑、散劑等口服固體制劑的成型過程多以粉末為原料,粉末的性質對制劑工藝與成品質量有很大影響[1]。基于粉體學基本理論對中藥粉末的性質進行評價和控制,對指導中藥制劑工藝設計和生產過程控制具有重要意義。本課題組前期通過物理指紋圖譜表征了中藥提取物粉末的物理性質[2],并基于物性參數建立了中藥原輔料粉末物性數據庫iTCM[3],該數據庫目前收錄了91批輔料和73批中藥浸膏粉的性質參數。Dai等[4]基于iTCM數據庫建立了粉體壓縮行為分類系統(tǒng),指導直接壓片處方設計。
國外藥用輔料數據庫,如NIPTE-FDA數據庫[5],除收錄粉末物料的物理性質參數外,還采用近紅外(Near-infrared,NIR)、拉曼、中紅外光譜等手段表征材料理化和結構信息,以及評價物料批間和批內質量的一致性。其中,近紅外光譜屬于分子振動光譜,產生于C—H、O—H、N—H、S—H等含氫基團非諧振動的倍頻和組合頻[6],具有操作簡便、分析速度快、不破壞樣品、不需要其他化學試劑、易于實現現場(At-line)和在線(On-line)分析的特點。目前,NIR在制藥領域應用廣泛,如測定粉末混合均勻度、監(jiān)測物料水分和粒徑、監(jiān)測物料晶型的轉變等[7-9]。
本文采用便攜式近紅外光譜儀對多來源、多批次、代表性中藥口服固體制劑原輔料進行快速分析,建立了原輔料近紅外光譜數據集,并存儲至iTCM數據庫,擴展了iTCM數據庫物性參數類型?;贜IR光譜數據,探討物料分類、物性預測的方法和可能性,可為中藥原輔料粉末質量控制、制劑處方及工藝設計提供參考。
光譜采集采用便攜式近紅外光譜儀(NIR-S-G1型,譜鉅科技股份有限公司),配備ISC-NIRScan-GUI-VS-WPF軟件。該近紅外光譜儀采用微電子機械系統(tǒng)(Micro-electro-mechanical systems,MEMS)加工工藝,由微傳感器、信號處理及控制電路、通訊接口和電源等部件組成。數據分析采用The Unscrambler 9.7(CAMO公司)、SIMCA 13.0(Umetrics公司)、Matlab2016b(MathWorks公司)軟件。
共收集149批粉末樣品,包括79批中藥浸膏粉和70批藥用輔料。79批中藥浸膏粉由北京康仁堂藥業(yè)有限公司提供,藥用部位包括根及根莖、果實、種子、地上部分等。70批藥用輔料均為購買,供應商和批號等信息可查看iTCM數據庫[3],包括填充劑、稀釋劑、崩解劑、黏合劑和潤滑劑等。
將待測粉末松散填裝于直徑2.7 cm,高2 cm圓柱形盒內,輕輕振搖使表面平整。手持NIR-S-G1型近紅外光譜儀,將掃描窗口貼近粉末樣品表面,采用漫反射方式采集光譜。NIR光譜掃描范圍為900~1 700 nm,以近紅外光譜儀內置背景為參比,掃描次數為32次,可編程增益放大器(PGA Gain)設置為64,光學分辨率為10 nm。在同一個樣品表面的不同部位測量3次,取其平均光譜作為該樣品的原始光譜。測試后用洗耳球吹掃掃描窗口。在整個實驗過程中,環(huán)境相對濕度保持在14%~50%,近紅外光譜儀的系統(tǒng)溫度保持在28.0~40.0 ℃。
采集的近紅外光譜數據中除包含樣品自身理化性質信息外,還包含了儀器噪聲和雜散光等無關信息。標準正態(tài)變量(Standard normal variate,SNV)變換和多元散射校正(Multiplicative scatter correction,MSC)可以用來消除顆粒分布不均及顆粒大小不同產生的散射影響。MSC與SNV線性相關,兩種方法的處理結果相似[10],但MSC假定光散射與波長及樣品的濃度變化無關,故對組分性質變化較寬的樣品處理效果較差。樣品背景顏色和粉體密度差異等因素常導致NIR光譜出現明顯的位移或漂移,可采用求導的方法進行基線校正。NIR光譜分析中常用的基線校正方法有一階導數(1st derivative)和二階導數(2nd derivative)。一階導數可有效消除光譜平移對測量的影響,二階導數可消除光譜旋轉對測量的影響。信號平滑是消除噪聲的常用方法,常用的信號平滑方法有移動平均平滑法和Savitzky-Golay(SG)卷積平滑法[11]。本文在對原始NIR光譜數據進一步分析處理前,將嘗試采用不同的光譜預處理方法對NIR光譜進行預處理。
iTCM數據庫采用Visual Basic語言和SQL Server 2000數據庫管理系統(tǒng)。目前數據庫中存儲了相關物料的18個物理質量屬性參數,如表1所示。iTCM數據庫在線版本[12]提供檢索、查詢物料的名稱、來源、生產廠家、批號和物性參數等數據。
表1 iTCM數據庫中物料的物性參數Table 1 Material properties in iTCM database
按照“1.2”所述方法,采集149批原輔料粉末近紅外光譜數據。將采集的NIR光譜數據以及測量時的系統(tǒng)溫度、濕度、日期等信息,導入iTCM數據庫。70批藥用輔料和79批中藥浸膏粉的原始近紅外光譜分別如圖1A和圖1B所示。其最大吸收波長為1 317~1 327 nm。在最大吸收波長區(qū)域,與中藥浸膏粉相比,部分藥用輔料的NIR吸光強度偏大,如糊精、玉米淀粉、硬脂酸鎂等。原輔料原始近紅外光譜圖于1 300 ~1 500 nm處出現較強的吸收帶,該區(qū)間對應O—H的一級倍頻和水分子的組合頻吸收峰[13]。藥用輔料在1 400~1 600 nm存在一個顯著的波動區(qū)間,中藥浸膏粉則在1 000~1 200 nm存在明顯的波動區(qū)間。
針對本文收集的70批藥用輔料,選擇其中13批微晶纖維素(Microcrystalline cellulose,MCC)、10批乳糖(Lactose)、8批乙基纖維素(Ethyl cellulose,EC)、6批交聯聚維酮(Polyvinylpolypyrrolidone,PVPP)和6批羥丙基甲基纖維素(Hydroxypropyl methylcellulose,HPMC),構成5類化學性質明確且可明顯區(qū)分的物料。采用主成分分析(Principal component analysis,PCA)方法將70批藥用輔料多變量NIR光譜數據降維,在主成分空間內分別研究NIR光譜數據對上述5類物料的區(qū)分能力。在對NIR光譜進行PCA前,按照“1.3”方法對光譜進行預處理,并考慮多種預處理方法組合,如SG+1d、SNV+SG+1d等,如表2所示。SG平滑選用7點3 階數據平滑,由于SNV+SG+1d預處理光譜數據時,最前面和最后面6個波長點的數據為零或絕對值過大,所以將這12個波長點的數據去除。分別經SNV+SG+1d和MSC+SG+1d預處理的近紅外光譜圖如圖2A和圖2B所示。為將NIR光譜數據與其他物性參數數據進行對比,按照“1.4”方法,整理70批藥用輔料物性參數數據集(70×18),并對其進行PCA分析。
表2 不同PCA模型潛變量空間內5類輔料的類間和類內馬氏距離的平均值Table 2 The average values of Mahalanobis distances between and within classes of the five categories of pharmaceutical excipients in the latent variable space of different PCA models
計算上述5類物料中心點之間及各類內樣品之間馬氏距離的平均值,結果見表2。在計算樣品的馬氏距離時,選擇前3個主成分進行計算。各類內的平均距離越小,各類間的平均距離越大,表明輔料各類之間區(qū)分越好。結果顯示,經SNV+SG+1d預處理的光譜數據PCA得分圖的各類間平均距離最大,各類內平均距離的平均值最小,說明其區(qū)分這5類物料的能力最好。
圖3A展示了對物性參數進行PCA分析所得前兩個主成分的得分圖。圖3B、圖3C和圖3D分別為基于原始NIR光譜數據、SNV+SG+1d預處理NIR光譜數據和MSC+SG+1d預處理NIR光譜數據進行PCA分析后,第一和第二主成分的得分圖。本文使用2維數據的95%置信橢圓可視化數據的聚集程度,求得PCA前兩個主成分得分值矩陣的每列均值及其協方差矩陣的特征值和特征向量,繼而求得95%置信橢圓的散點數據,并用平滑的曲線連接[14]。從得分圖中各類輔料95%置信橢圓的重疊程度來看,物性參數和原始光譜數據PCA得分圖上5類物料的區(qū)分較差;圖3A得分圖可以將乳糖和其他4類物料區(qū)分,這與乳糖密度較大有關。而在SNV+SG+1d和MSC+SG+1d預處理的光譜數據PCA得分圖中,各類輔料的95%置信橢圓重疊少,僅HPMC和PVPP存在部分重疊,區(qū)分較好。結合馬氏距離和PCA得分圖95%置信橢圓重疊程度的結果可知,SNV+SG+1d預處理光譜數據區(qū)分這5類物料的能力最好。與iTCM數據庫中的物性參數相比,近紅外光譜數據由于同時包含了物料的部分物理性質和化學性質信息[6],所以在潛變量空間內對不同類別的輔料的區(qū)分能力較強。同時,光譜數據經預處理去除無關信息和噪聲后對這5類輔料的區(qū)分能力進一步提高。值得注意的是,當輔料的物理化學性質較為相近時,不同類的輔料會聚集在一起較難區(qū)分,以圖3C為例(圖中用黑色圓圈標注輔料名稱),圈1為3批硬脂酸鎂,與圈2中的硬脂酸鈣較為接近;圈3為2批氫氧化鋁,與藍圈中的PVPP較為接近;圈4為3批交聯羧甲基纖維素鈉,與圈5內的淀粉類和纖維素類的輔料不能明顯區(qū)分。
表3 不同光譜數據預處理方法所得PLS模型對物性參數的預測能力比較Table 3 Comparison of the predictive ability of PLS models obtained by different pretreated spectral data for material properties
在粉末直接壓片中,片劑質量與處方物料物理性質和壓片過程參數密切相關。Dai等[4]建立了基于物料物理性質和壓片力預測片劑抗張強度和孔隙率的PLS模型。除蘋果酸(批號:A0369948)、磷酸氫鈣(批號:A0369948)和款冬花(批號:KD201709-1)外,本文原輔料研究對象與Dai等建模時所用的物料有67批相同?!?.2”和“2.3”的研究結果表明,NIR數據與粉末物料理化性質有關,因此本文進一步將物料NIR光譜數據與其其他物理性質組合,探討在Dai等[4]建立的PLS模型輸入變量中添加NIR數據對直接壓片片劑質量預測能力的影響。
可用于直接壓片片劑質量預測的PLS模型的輸入變量和輸出變量如表4所示。其中,作為模型輸入的變量(自變量)包括粉末物料的物理性質、NIR光譜數據和壓片力;模型輸出變量(因變量)為片劑機械性質,即抗張強度(Tensile strength,TS)和固相分數(Solid fraction,SF)。物料物理性質包括18個物性參數和9個壓縮參數,NIR數據為經過SNV+SG+1d預處理的數據。
表4 PLS模型的輸入變量和輸出變量Table 4 Description of input and output variables for the PLS model
表5 不同輸入變量的PLS模型評價指標Table 5 Diagnostics of four PLS models with different input variables
圖4 變量投影重要性指標(VIP)Fig.4 VIP indexes for independent variables of the PLS model
模型4變量的變量投影重要性指標(Variable importance in projection,VIP)值如圖4所示,VIP值大于1的變量有壓片力(P),密度類參數(Dc、Dt、SFp),壓縮參數(Py、Kb、d、g),內聚力指數Icd,吸濕性%H和SNV+SG+1d預處理光譜數據PCA的PC2和PC5得分值。這與Dai等的研究相似[4]。模型4中輸出變量抗張強度(TS)和固相分數(SF)的系數值如圖5A和圖5B所示,其中變量的系數越大對模型越重要。從圖中可以看出,PC5的得分值對片劑抗張強度的影響較大,而PC2的得分值對片劑的固相分數影響較大。
圖5 PLS模型抗張強度(TS)(A)和固相分數(SF)(B)值的系數圖Fig.5 The coefficient plot of TS values(A) and SF values(B) for PLS
本文采用NIR-S-G1型便攜式近紅外光譜儀,采集了149批中藥口服固體制劑原輔料樣品的NIR光譜,豐富了iTCM中藥物性數據庫的數據類型?;贜IR光譜,可實現已知類型藥用輔料的模式識別。通過多變量預測分析,發(fā)現NIR光譜對粉末粒徑、密度類參數和吸濕性的預測性較好。直接壓片片劑質量預測時,將NIR光譜添加至模型輸入中,可提高模型的預測性能。上述研究證明,NIR光譜數據是iTCM數據庫物性參數數據的有益補充,物性參數與NIR光譜的結合能更全面地表征原輔料的性質。一般來說,原輔料物性參數的分析較為復雜費時,且消耗樣品量較多。后期實驗將探究用NIR快速測定或代替某些物性參數,降低物性表征所需的工作量和樣品量,提高模型應用的可靠性。