欒奕博,張依,郭圣璇,李璇,胡思源
天津中醫(yī)藥大學第一附屬醫(yī)院,國家中醫(yī)針灸臨床醫(yī)學研究中心,天津 300381
目前,我國兒童用藥存在品種少、劑型少、規(guī)格少和標識少的問題,中成藥作為兒童用藥的重要組成部分,在緩解兒童用藥需求、保障兒童生命健康方面有重要價值和良好前景。然而中成藥在兒童人群的合理應用面臨問題和挑戰(zhàn),主要為用法用量信息不完善,難以規(guī)范地指導臨床應用,超說明書用藥現(xiàn)象普遍存在,如兒童專用中成藥的低年齡段用法用量缺失、成人兒童共用中成藥大多僅標注“兒童酌減”或“兒童在醫(yī)師指導下服用”、成人中成藥應用于兒童等。因此,完善用于兒童的中成藥用法用量信息十分必要。
隨著中醫(yī)藥理論、人用經(jīng)驗和臨床試驗相結合的中藥注冊審評證據(jù)體系的構建與優(yōu)化,以及《“十四五”中醫(yī)藥發(fā)展規(guī)劃》[1]、《基于人用經(jīng)驗的中藥復方制劑新藥臨床研發(fā)指導原則(試行)》[2]、《中藥注冊管理專門規(guī)定》[3]等的發(fā)布,人用經(jīng)驗證據(jù)在中藥注冊審評中的應用日益受到高度重視。真實世界研究(RWS)是形成人用經(jīng)驗證據(jù)的重要方法,利用RWS整理和分析基于醫(yī)院信息系統(tǒng)(HIS)的人用經(jīng)驗數(shù)據(jù),可總結中成藥的適應證、適用人群、療程、用藥劑量等基本要素,以提供人用經(jīng)驗證據(jù),支持兒童中藥新藥注冊和說明書變更等情形的探索性臨床研究[4]。
雙清合劑是治療風溫肺熱、衛(wèi)氣同病型急性支氣管炎的中成藥,屬成人用藥品種,缺乏兒童用法用量信息,但在兒科臨床應用多年,人用經(jīng)驗豐富,具有大樣本量、可靠真實和結構完整的來源于HIS的人用經(jīng)驗數(shù)據(jù)[5]。本研究以雙清合劑的HIS數(shù)據(jù)為切入點,通過機器學習方法,整理和分析其人用經(jīng)驗數(shù)據(jù),構建探索年齡段成人-兒童用藥劑量折算模型和兒童中成藥用藥劑量多分類預測模型,獲得符合臨床實踐的兒童人群用法用量,以期優(yōu)化雙清合劑的臨床用藥方案,為變更兒童人群的注冊申請或說明書的完善提供人用經(jīng)驗證據(jù)支持。
本研究為回顧性數(shù)據(jù)庫研究,數(shù)據(jù)來源于天津中醫(yī)藥大學第一附屬醫(yī)院HIS數(shù)據(jù)庫,提取2012年9月—2021年10月至少使用過1次雙清合劑的患兒的診療信息。
1.2.1 納入標準
①年齡1~14歲;②就診方式為兒科門診/急診。
1.2.2 排除標準
①處方存在明顯邏輯錯誤;②合并使用中藥湯劑;③無法對疾病診斷進行規(guī)范化的患兒。
①基本信息:年齡、性別、就診方式;②診斷信息:西醫(yī)診斷、中醫(yī)診斷;③用藥信息:研究用藥(包括療程、劑量)、合并用藥(包括名稱、類別)。
1.4.1 數(shù)據(jù)提取與清洗
以Excel2021建立數(shù)據(jù)庫,采用Python3.8.12軟件進行數(shù)據(jù)處理。
數(shù)據(jù)提取:根據(jù)納入和排除標準,剔除不符合標準的患兒數(shù)據(jù)。
數(shù)據(jù)清洗:包括重復數(shù)據(jù)、邏輯錯誤和缺失數(shù)據(jù)的清洗等。在保證數(shù)據(jù)完整的前提下,去除重復數(shù)據(jù)及不相關數(shù)據(jù);進行邏輯檢查,去除邏輯錯誤的數(shù)據(jù),包括出生年月與按年齡推算不符、單日用藥劑量為100 mL、給藥途徑為皮試等;對缺失數(shù)據(jù)進行處理,根據(jù)完整的數(shù)據(jù)分析進行必要填補。
1.4.2 數(shù)據(jù)規(guī)范
規(guī)范診斷信息和處方信息。西醫(yī)診斷信息參照《國際疾病分類(第11次修訂本)》[6]和《兒科學(第8版)》[7]進行規(guī)范化,中醫(yī)診斷信息參照《中醫(yī)病證分類與代碼(修訂版)》[8]進行規(guī)范;西藥采用《藥物的解剖學、治療學及化學分類系統(tǒng)》[9]分類合并;中成藥以藥物成分為準,將成分相同、劑型不同者合并,參照藥品說明書對其名稱進行規(guī)范。
采用R語言4.2.0對數(shù)據(jù)進行統(tǒng)計分析,主要采用描述性統(tǒng)計和建模分析的方法。
用藥特征的描述性統(tǒng)計:組合運用dplyr及ggplot2函數(shù)庫,分別對年齡、性別、就診方式、西醫(yī)診斷、中醫(yī)診斷、研究用藥療程和劑量、合并用藥名稱和類別進行描述性統(tǒng)計。定量數(shù)據(jù)描述例數(shù)、均數(shù)、標準差;定性數(shù)據(jù)描述頻數(shù)、百分率或構成比。
用藥劑量建模分析:①采用一維優(yōu)化K-means算法[10]構建探索年齡段成人-兒童用藥劑量折算模型。設置排名前5位西醫(yī)診斷為篩選條件,各診斷對應的診療數(shù)據(jù)為數(shù)據(jù)子集,患兒年齡為特征變量(自變量),雙清合劑兒童用藥劑量較成人用藥劑量的折算百分比為目標變量(因變量)。將K-means模型的聚類數(shù)量的初始范圍設定為3~5,以Calinski-Harabaz指數(shù)[11]為評估指標,針對不同診斷的數(shù)據(jù)子集,采用迭代檢驗的優(yōu)化策略。②基于患兒用藥特征的描述性統(tǒng)計結果,采用XGBoost算法[12]構建兒童中成藥用藥劑量多分類預測模型。設置年齡、性別、就診方式、西醫(yī)診斷、中醫(yī)診斷、研究用藥療程、合并用藥數(shù)量、合并用藥名稱等為特征變量(自變量),目標變量被整合為[0,10)、[10,20)、[20,30)、[30,40)、[40,50)、[50,60)、[60,70)、[70,80)和[80,90]的區(qū)間進行多極分類預測。隨機抽取樣本中80%數(shù)據(jù)訓練模型,20%數(shù)據(jù)驗證模型,經(jīng)過多次隨機交叉檢驗,根據(jù)計算預測結果的混淆矩陣檢驗模型準確度,對各年齡段患兒最佳用藥劑量區(qū)間進行預測。
本研究共收集用藥記錄51 958條,按納入標準、排除標準篩選和處理數(shù)據(jù)后,納入用藥記錄31 303條。男性16 861例(53.86%),女性14 442例(46.14%)。急診17 882例(57.13%),門診13 421例(42.87%)。年齡1~14歲,平均(5.44±3.14)歲,各年齡段均有分布,以學齡前期患兒最多,共11 181例(35.72%)。
31 303例患兒信息中包含診斷信息44 146條。西醫(yī)診斷主要涉及呼吸系統(tǒng),除說明書中明確的急性支氣管炎外,還涉及急性上呼吸道感染、急性扁桃體炎、急性喉炎、肺炎等上呼吸道感染和下呼吸道感染。急性上呼吸道感染有廣義和狹義之分,廣義指外鼻孔至環(huán)狀軟骨下緣包括鼻腔、咽或喉部急性炎癥的總稱,臨床表現(xiàn)主要類型為普通感冒、急性病毒性咽-扁桃體炎,還可包括皰疹性咽峽炎、咽結合膜熱、急性細菌性咽扁桃體炎、急性喉炎等;狹義指普通感冒這一臨床表現(xiàn)。通過分析原始數(shù)據(jù)特點,本研究所指急性上呼吸道感染屬狹義范疇。結果顯示,患兒以急性上呼吸道感染最多見,共17 733例(40.17%),其次為急性支氣管炎(8 330例,18.87%)和急性扁桃體炎(2 044例,4.63%)。中醫(yī)診斷主要涉及肺系和脾胃系疾病,集中在感冒(6 275例,14.21%)和咳嗽(5 188例,11.75%),也可見于肺炎喘嗽、乳蛾和積滯等。見表1。
表1 使用雙清合劑患兒主要中西醫(yī)診斷(前5位)
2.3.1 用藥療程
用藥療程平均為(3.06±1.16)d,排名前5位西醫(yī)診斷的療程分別為急性上呼吸道感染(3.01±1.17)d、急性支氣管炎(3.09±1.01)d、急性扁桃體炎(3.04±0.95)d、肺炎(3.0±1.11)d和急性喉炎(3.38±0.96)d。
2.3.2 用藥劑量
單日用藥平均劑量為(40.61±12.15)mL,急性扁桃體炎的用藥劑量最多,為(45.56±12.9)mL,急性喉炎的用藥劑量最少,為(39.67±10.77)mL。
無兒童用量的兒童中成藥用藥劑量,一般采用基于國內通用年齡分期、分年齡段、按成人用藥劑量的折算方法,固定年齡段折算比例為幼兒期用1/2成人量、學齡前期用2/3成人量和學齡期用成人量[13]。本研究中,排名前5位西醫(yī)診斷的固定年齡段成人-兒童用藥劑量折算比例的趨勢一致,均在幼兒期用1/2~3/5成人量、學齡前期用2/3~3/4成人量和學齡期用4/5~1成人量,幼兒期高于用1/2成人量、學齡前期用2/3成人量、學齡期用成人量的范圍內。不同診斷的各年齡段內折算比例存在差異,考慮與適應證的病情嚴重程度有關。相同診斷的單獨用藥和合并用藥的各年齡段內折算比例差異較小。見表2。
表2 西醫(yī)診斷排名前5位的固定年齡段成人-兒童用藥折算比例(%)
22 272例患兒采用合并用藥,包含合并用藥信息36 031條。共使用60種西藥和43種中成藥。合并用藥使用頻率前10位的藥物和藥物作用類型見表3、表4??梢姡魉幾畛Ec抗生素類藥物合用,使用頻率最高為阿奇霉素(8.05%);中成藥最常與解表清熱劑合用,使用頻率最高為小兒豉翹清熱顆粒(12.10%)。
表3 使用雙清合劑患兒合并用藥情況(前10位)
表4 使用雙清合劑患兒合并用藥藥物類型(前10位)
2.5.1 探索年齡段成人-兒童用藥劑量折算模型
固定年齡段成人-兒童用藥劑量折算比例大多為相對較大的區(qū)間。本研究在雙清合劑的兒童用藥劑量中尋找規(guī)律,結合不同適應證特點,采用一維優(yōu)化K-means算法構建探索年齡段兒成人-兒童用藥劑量折算模型,以Calinski-Harabaz指數(shù)為評估指標,針對不同診斷的數(shù)據(jù)子集,分別通過20次迭代檢驗確定模型的最優(yōu)聚類數(shù)量與對應結果,合理劃分為3個或4個年齡段,并分別計算出用藥劑量折算比例。見圖1、圖2。
圖1 不區(qū)分用藥的探索年齡段成人-兒童用藥劑量折算比例
圖2 單獨使用雙清合劑的探索年齡段成人-兒童用藥劑量折算比例
2.5.2 兒童中成藥用藥劑量多分類預測模型
為探索不同年齡段劃分規(guī)則下的各年齡段最佳用藥劑量閾值,基于雙清合劑在兒童臨床應用的基本信息、診斷信息和用藥信息,采用XGBoost算法構建用于預測兒童用藥最佳劑量區(qū)間的多分類模型,經(jīng)過10次隨機交叉檢驗,完成對模型準確度的驗證,結果發(fā)現(xiàn),當n_estimators=100,max depth=10,gamma=0,colsample_bytree=1,min_child_weight=1,subsample=1時模型表現(xiàn)最佳,準確度為84.1%,見圖3。通過特征變量在模型中的重要性得分,發(fā)現(xiàn)對模型準確度影響最大的是患兒年齡,對模型準確度影響最小的為是否合并中成藥。各特征變量對模型影響程度的評分和排序見圖4。
圖3 模型準確度評估
圖4 特征變量對模型準確度的重要性評分
本研究建立黑箱式應用系統(tǒng),系統(tǒng)后端為建模結果,前端為用戶界面,臨床醫(yī)生或研究者可在用戶界面輸入數(shù)據(jù),并得到預測用量區(qū)間。同時,所得的預測用量區(qū)間與臨床醫(yī)生或研究者輸入的數(shù)據(jù)綁定,傳遞給兒童中成藥用藥劑量多分類預測模型,擴展模型的訓練數(shù)據(jù)。系統(tǒng)界面示意圖見本文OSID碼。
本文采用回顧性數(shù)據(jù)庫研究方法,整理并分析雙清合劑在兒童人群的人用經(jīng)驗數(shù)據(jù),構建探索年齡段成人-兒童用藥劑量折算模型和兒童中成藥用藥劑量多分類預測模型,探索本品種適應證、適用人群范圍和兒童用藥劑量,以優(yōu)化臨床用藥方案并支持后續(xù)臨床研究的開展。
研究結果顯示,患兒各年齡段均有分布,以學齡前期最為多見,提示若需增加兒童適用人群時,建議優(yōu)先考慮3~7歲患兒。診斷信息方面,急性支氣管炎和咳嗽屬說明書適應證,臨床還常見于急性上呼吸道感染(感冒)、急性扁桃體炎(乳蛾)、肺炎(肺炎喘嗽)和急性喉炎等,提示若需增加功能主治時,可考慮上述適應證。
用藥劑量是兒童中成藥合理應用于臨床的關鍵要素,如何確定用藥劑量是兒童藥品上市前和上市后密切關注的內容之一,兒童中成藥一般采用分年齡段給藥的方式,兒童用藥劑量可以按成人劑量折算,即按照一定比例直接折算到兒童,折算比例多為相對較大區(qū)間。目前,大多采用基于國內通用年齡分期的固定年齡段成人-兒童用藥折算比例,本研究中,幼兒期用藥劑量為通用折算比例,學齡前期和學齡期用藥劑量低于通用折算比例。但通用的年齡段劃分區(qū)間較大,可考慮根據(jù)具體品種特性、適應證特點和臨床經(jīng)驗,合理劃分1個或多個年齡段并分別計算使用劑量[14]。因此,根據(jù)雙清合劑的數(shù)據(jù)特點,通過基于一維優(yōu)化K-means算法的建模分析的方法,合理劃分年齡段,并分別計算出各年齡段的用藥劑量折算比例。
另外,合并用藥亦是影響用藥劑量的因素之一。本研究發(fā)現(xiàn),合并其他藥物治療時,雙清合劑的用藥劑量更低;合并用藥數(shù)量、合并用藥種類可能對研究藥物的用藥劑量產(chǎn)生影響。
因此,本研究設置年齡、性別、就診方式、西醫(yī)診斷、中醫(yī)診斷、研究用藥療程、合并用藥數(shù)量、合并用藥名稱等特征變量,輸出用藥劑量區(qū)間為目標變量,構建基于XGBoost算法的兒童中成藥用藥劑量多分類預測模型,探索不同年齡段劃分規(guī)則下的各年齡段最佳用藥劑量閾值,即模型輸出的用藥區(qū)間由2個數(shù)值界定的范圍構成,最小劑量和最大劑量均為藥物有效劑量,臨床醫(yī)生處方時和臨床研究設計可在區(qū)間內選擇合適劑量。
本研究尚存在局限性:①為單中心研究,數(shù)據(jù)來源缺乏廣泛性,今后將開展多中心、更深層次的研究。②提取的數(shù)據(jù)缺乏處方醫(yī)生的職稱信息,可能對處方準確性產(chǎn)生影響。③本研究方案中包含對中醫(yī)證候診斷信息的提取,但經(jīng)過篩選和數(shù)據(jù)處理后,中醫(yī)證候診斷信息的數(shù)據(jù)樣本量較小,因此未納入分析。④僅以成人中成藥雙清合劑為示范品種,探索為擴大到兒童適用人群提供證據(jù)支持的方法,今后還需要應用在更多的同類型品種,以及推廣到其他類型兒科中成藥開發(fā),如院內制劑,兒童中成藥或成人兒童共用中成藥增加新的兒童適用人群、增加功能主治等用法用量的選擇與確定,提供方法學借鑒。
本研究揭示了雙清合劑在兒科真實醫(yī)療環(huán)境的用藥特征,其適用人群以3~7歲為主,適應證常見于急性上呼吸道感染(感冒)、急性支氣管炎(咳嗽)、急性扁桃體炎(乳蛾)、肺炎(肺炎喘嗽)和急性喉炎等。本研究構建了基于機器學習算法的模型,規(guī)范兒童分年齡段用藥劑量折算比例和各年齡段最佳用藥劑量閾值,可為雙清合劑在兒童臨床應用提供用藥方案參考,并為本品種變更兒童人群的注冊申請或說明書的完善提供人用經(jīng)驗證據(jù)支持。