屈瑞 陳芳宇 劉廷薇 陶秀梅
(1.武漢科技大學(xué),湖北武漢 430070;2.北京諾康達(dá)醫(yī)藥科技股份有限公司,北京 100176)
數(shù)統(tǒng)分析是一項藥物臨床試驗過程中非常重要的一個環(huán)節(jié),真實、可靠、可溯源的數(shù)據(jù)是藥物最后獲批上市的關(guān)鍵。試驗過程中產(chǎn)生的數(shù)據(jù)必須是真實的、可靠的,從而才能從根本中解決現(xiàn)在臨床數(shù)據(jù)庫中的問題。
如今,各國家的衛(wèi)健委及研究人員對藥物質(zhì)的安全性及有用性的認(rèn)識不斷提高。世界衛(wèi)生組織、歐盟、日本、美國及我國都相繼頒出有關(guān)臨床試驗數(shù)據(jù)管理與統(tǒng)計分析的指導(dǎo)原則,對藥品試驗數(shù)統(tǒng)分析也做出了明確的規(guī)定。美國制定出關(guān)于臨床研究實驗中采用網(wǎng)絡(luò)行業(yè)指導(dǎo)規(guī)范,另外,美國為規(guī)范電子化數(shù)據(jù)過程制定了臨床醫(yī)學(xué)試驗數(shù)據(jù)的規(guī)章制度。我國正在實施的藥品臨床試驗管理的法律法規(guī)及其他各類藥物臨床試驗的指導(dǎo)原則,尤其臨床試驗過程中的數(shù)據(jù)管理進(jìn)行了詳盡的描述。本文將詳細(xì)介紹幾種不同的數(shù)統(tǒng)分析方法及應(yīng)用,針對臨床研究中如何進(jìn)行設(shè)計、實施、分析和評價提供參考,以保證藥物臨床試驗的科學(xué)、真實和規(guī)范。
適當(dāng)?shù)呐R床試驗數(shù)據(jù)管理與統(tǒng)計分析是確保招募到的受試者利益得到保障、提高臨床試驗質(zhì)量的前提。以下為人體生物等效性試驗中常用的數(shù)統(tǒng)分析方法,本文將從原理出發(fā),對其進(jìn)行詳細(xì)的介紹。
描述性統(tǒng)計為通過制作表格、圖形以及使用總結(jié)性的說明來描述數(shù)據(jù)的離散和集中趨勢、峰度、偏度。其中缺失值填充常用的方法有:均值法、剔除法、決策樹法、比率回歸法;正態(tài)性檢驗常用的方法有:非參數(shù)檢驗的K-量檢驗、P-P圖、Q-Q圖、W檢驗等。臨床試驗中通常使用的描述統(tǒng)計方法有:平均值、標(biāo)準(zhǔn)差、離散值、中位數(shù)、最小值和最大值以及正常值范圍等。
統(tǒng)計推斷學(xué)是現(xiàn)代統(tǒng)計方法學(xué)中的最基礎(chǔ)的方法,在統(tǒng)計研究中得到了廣泛的使用,能研究根據(jù)樣本量的數(shù)據(jù)去推斷整體的數(shù)量值,對研究總體的數(shù)量特征做出一個統(tǒng)計的說明。統(tǒng)計推斷就是在概率時間的基礎(chǔ)上依據(jù)樣本數(shù)據(jù)內(nèi)容,對統(tǒng)計分析其他描述性參數(shù)做出一個合理的預(yù)判。
1.2.1 差異性檢驗
在臨床試驗過程中,常常使用Fisher檢驗對安全性指標(biāo),即不良事件發(fā)生率進(jìn)行的評價。單組設(shè)計的定性資料常用于樣本和總體之間差異性檢驗。成組設(shè)計的定性資料中若對應(yīng)的變量是二分類型,通常用到的方法是制成一個四格表。
單組設(shè)計的定量資料和以上定性資料相比無較大差異,只是樣本估計時用的參數(shù)為均值和中位數(shù),運用正態(tài)性檢驗得到的結(jié)果選擇一個適合的統(tǒng)計方法。對于成組設(shè)計的定量資料,如果兩組定量資料之間是配對關(guān)系,第一步需計算差值,之后可采用單組設(shè)計的統(tǒng)計學(xué)方法。在結(jié)果描述時用差異值(均值、中位數(shù)等)以及95%的可信區(qū)間等內(nèi)容。
1.2.2 相關(guān)分析和回歸分析
相關(guān)分析和回歸分析是融合為一體的,但兩者研究的重點不同。相關(guān)分析作為回歸分析的基石,回歸分析作為相關(guān)分析的深入研究。
使用相關(guān)分析是為了衡量兩個變量間的線性關(guān)系。在臨床研究中常會用到的回歸分析方法有:多重的線性回歸、Poisson回歸(計數(shù)型變量,Poisson分布)、Logistic回歸(二項分布等)、負(fù)二項回歸(負(fù)二項分布等)、COX模型回歸等[1]。
1.2.3 生存資料的分析
臨床試驗研究的試驗結(jié)果需要做長期或定期的隨訪才能得到最終的準(zhǔn)確數(shù)據(jù),評估影響因素和干預(yù)因素時,需要對試驗過程中的事件進(jìn)行true的分析,還要考慮到完成試驗所要經(jīng)歷時間的長短。生存資料分析是將最終發(fā)生的事件判斷是否為true,并且要結(jié)合完成的時間的統(tǒng)計分析方法[2]。
1.3.1 樣本量預(yù)估和檢驗效能
臨床研究不采用總體目標(biāo)人群而是采用有代表性的樣本來進(jìn)行研究分析。根據(jù)假設(shè)檢驗的原理,樣本如果較小,就無法檢驗出實際存在的差異,最終得到的結(jié)果缺乏可信的證據(jù);樣本如果太大,會造成人和物力以及時間的不必要浪費,更嚴(yán)重的會適得其反。除此之外,樣本量的大小影響因素很多,如試驗設(shè)計類型、檢驗水準(zhǔn)、把握度、期望的效應(yīng)值和標(biāo)準(zhǔn)差等[3]。
1.3.2 匹配
在非隨機(jī)性的對照試驗中,如果未提前對研究的對象進(jìn)行隨機(jī),某些不為人知的因素會在組間分布不均勻,這就是的組件沒有了可比性,從而無法可靠的評價分組因素的內(nèi)在的作用。隨著數(shù)統(tǒng)分析的發(fā)展,匹配越來越在樣本量較大的檢驗中得到應(yīng)用。常用的匹配方法有:個體匹配、多元匹配等[4]。
1.3.3 敏感性分析
敏感性分析適用于評價分析方法和結(jié)論的穩(wěn)固性。臨床研究的設(shè)計和分析方法一般以一個的假設(shè)為前提,如果不滿足其假設(shè)分析方法是不適合的。通過改變統(tǒng)計分析方法和假設(shè)等方法來檢驗研究結(jié)果的一致性的敏感性問題。常見的情況有研究方案違背、缺失值、離群值、研究結(jié)束轉(zhuǎn)歸情況的不同定義、基線不均衡等[5]。
描述性統(tǒng)計分析中最為常用的方法之一就是SPSS的頻數(shù)分析。通過試驗過程中各參數(shù)值的頻數(shù)的分析,可得平均值、最大值、最小值、方差、標(biāo)準(zhǔn)差、極差、平均數(shù)標(biāo)準(zhǔn)誤、偏度系數(shù)和峰度系數(shù)等重要的描述統(tǒng)計量,還可以通過分析得到合理的統(tǒng)計圖。王宇虹等[6]在“糖尿病合并子宮肌瘤臨床治療及效果評估”中記錄了70例糖尿病并患有子宮肌瘤的患者,對照組為血糖控制和子宮肌瘤切除的方法,試驗組為血糖控制和子宮肌瘤切除手術(shù)聯(lián)合中藥的治療方法,通過統(tǒng)計兩組患者的血糖控制達(dá)標(biāo)率、手術(shù)切口愈合率、治療效果滿意率等。田煒超等[7]在“布洛芬緩釋膠囊在中國健康受試者中生物等效性研究”中采用隨機(jī)、開放、單中心、兩制劑、兩周期、兩序列、自身交叉的單劑量生物等效性試驗設(shè)計。在其安全性評價中對空腹及餐后試驗過程中的不良事件及其發(fā)生率,以及對象的年齡、身高、體重等指標(biāo)進(jìn)行均值、標(biāo)準(zhǔn)差、中位數(shù)、最小值和最大值或范圍的描述。
統(tǒng)計推斷包括參數(shù)計算與假設(shè)檢驗,國際醫(yī)學(xué)統(tǒng)計學(xué)界和醫(yī)學(xué)期刊編輯界在關(guān)于統(tǒng)計推斷結(jié)果表達(dá)的規(guī)范中要求有報告檢驗統(tǒng)計量值和確切值范圍,并且能給出相應(yīng)的均數(shù)或率的可信區(qū)間。報告統(tǒng)計推斷結(jié)果時,應(yīng)同時給出相應(yīng)均數(shù)、率的可信區(qū)間。羅云萍等[8]在“急性白血病患者的白細(xì)胞介素和腫瘤壞死因子水平改變及意義”中對急性白血病息者與正常人活性水平進(jìn)行了比較,兩組樣本的活性指標(biāo)分布屬非正態(tài)的;不滿足參數(shù)法檢驗的條件,故選取非參數(shù)秩和檢驗,或中位數(shù)法描述和檢驗。在評價第二代三唑類藥物伏立康唑和兩性霉素B脂質(zhì)體抗真菌的療效和安全性中,研究人員采用多中心、隨機(jī)臨床試驗,其中四百多例分配到了伏立康唑組,400多例分配到兩性霉素 B 脂質(zhì)體組。各個成功率分別為26.0%和30.6%。推斷療效相等則伏立康唑和兩性霉素B脂質(zhì)體治療成功率的差異不可超過10%,因此可評價兩種治療方法的成功率是具有等效性的[9]。在藥物或醫(yī)療器械臨床試驗中,重復(fù)測量得到的數(shù)據(jù)是一種很常見的數(shù)據(jù)類型[10]。另外,隨著當(dāng)前藥物和醫(yī)療器械市場在臨床驗證產(chǎn)品的日益增加,非劣效試驗設(shè)計已成為廣泛應(yīng)用的一種設(shè)計方法,吳振強(qiáng)等[11]探討了適用于非劣效試驗設(shè)計下重復(fù)測量數(shù)據(jù)的統(tǒng)計分析方法,得到在基于非劣效試驗設(shè)計的重復(fù)測量數(shù)據(jù)中,當(dāng)數(shù)據(jù)存在缺失時,會降低組間的差異;而MMRM和GEE在不同的缺失值比例下都能有較好的性能。
缺失值是臨床試驗過程中發(fā)生偏倚的原因,應(yīng)盡可能地滿足研究試驗方案中與相關(guān)的檢索資料和數(shù)據(jù)管理的各類規(guī)定。在實際試驗中任何一項研究不可避免會有缺失值。然而一個試驗中如果解決缺失值的方法是敏感的,尤其是其方法已在方案中體現(xiàn),則可認(rèn)為是有效的,統(tǒng)計師應(yīng)當(dāng)注意此結(jié)果得出分析具有敏感性,常見的處理方法有整例刪除、單次補(bǔ)填、非條件均值估計、條件分布估計等。曹陽等[12]描述缺失性數(shù)據(jù)的特征和模式,對Rubin提出了的多重填補(bǔ)的基本概念,并且運用填補(bǔ)和分析缺失數(shù)據(jù)的方法,結(jié)合起來進(jìn)行了探討,分析了多重填補(bǔ)方法的特點、局限性以及應(yīng)用此方法處理多個完整數(shù)據(jù)集時需要注意的地方。閆世艷等[13]介紹了一種較為簡便的多重填補(bǔ)敏感性分析方法,當(dāng)假定數(shù)據(jù)符合隨機(jī)缺失機(jī)制進(jìn)行填補(bǔ)后,進(jìn)行結(jié)果的測定。Sposato等[14]研究了卒中前、卒中后房顫、以及缺血性卒中復(fù)發(fā)的三種情況時,使用了3個統(tǒng)計模型,對受試者的年齡、性別等變量進(jìn)行了不同方面的驗證。
開展一項臨床研究時,目標(biāo)人群的總體不會被直接定義,通常應(yīng)用統(tǒng)計學(xué)原理和方法進(jìn)行總體樣本的推斷。在根據(jù)預(yù)試驗的樣本量得到的結(jié)果后,運用合適的統(tǒng)計公式推算出滿足正式試驗的樣本量。試驗過程中運用到的數(shù)據(jù)統(tǒng)計學(xué)無處不在:試驗討論與設(shè)計、數(shù)據(jù)管理計劃的確定、數(shù)據(jù)審核計劃的確定、數(shù)據(jù)管理報告的確定、統(tǒng)計分析計劃制定、統(tǒng)計分析報告的制定和審核。臨床試驗結(jié)果需科學(xué)、真實的進(jìn)行統(tǒng)計分析,才能得出臨床研究中的準(zhǔn)確、可靠的結(jié)論。為逐漸規(guī)范我國臨床試驗方案中的統(tǒng)計方法描述,近幾年相繼發(fā)布了《化學(xué)藥物和生物制品臨床試驗的生物統(tǒng)計學(xué)技術(shù)指導(dǎo)原則》《藥物臨床試驗的生物統(tǒng)計學(xué)指導(dǎo)原則》等指導(dǎo)原則,成為加強(qiáng)臨床數(shù)據(jù)管理及統(tǒng)計的內(nèi)容和責(zé)任。