廖緒亮,姜彥彪,王歡,趙夢娜,朱敏,劉欣語,尚志忠,吳安虎,魏鶴翔,田家樂,楊宏焱,張瑞星,郭星辰,任磊,馬彬
自1989年Iain Chalmers爵士發(fā)表第一篇現(xiàn)代意義上的系統(tǒng)評價以來[1],該研究方法在臨床醫(yī)學(xué)領(lǐng)域得到了廣泛應(yīng)用和空前的發(fā)展。近年來,系統(tǒng)評價這一研究方法也逐漸應(yīng)用于基礎(chǔ)醫(yī)學(xué)領(lǐng)域中,特別是在動物實驗中[2]。1993年第一篇動物實驗系統(tǒng)評價發(fā)表[3],此后其數(shù)量呈現(xiàn)逐年遞增趨勢。對動物實驗進(jìn)行系統(tǒng)評價,可更好的了解其生物學(xué)合理性[4-7],并促進(jìn)其結(jié)果向臨床的轉(zhuǎn)化,降低其轉(zhuǎn)化時的風(fēng)險[8]。高質(zhì)量的系統(tǒng)評價可提供基于當(dāng)前可獲得證據(jù)的無偏倚的綜合結(jié)論[9],對指導(dǎo)實踐和今后的研究方向具有重要價值和意義。相比較于系統(tǒng)評價這一研究方法在臨床實踐領(lǐng)域下的成熟應(yīng)用,其在動物實驗領(lǐng)域的應(yīng)用較少,且方法學(xué)還存在較多挑戰(zhàn)。因此,本研究將全面對比分析動物實驗系統(tǒng)評價與臨床試驗系統(tǒng)評價在研究特點、方法和報告質(zhì)量等方面的差異,為今后動物實驗系統(tǒng)評價的開展和實施提供參考依據(jù)。
1.1 納入/排除標(biāo)準(zhǔn)納入動物實驗系統(tǒng)評價,不限制動物種屬;納入臨床試驗系統(tǒng)評價,不限制臨床試驗類型。對于同時包含動物實驗數(shù)據(jù)與人體實驗數(shù)據(jù)的系統(tǒng)評價則排除。
1.2 樣本的選擇和來源計算機(jī)檢索PubMed數(shù)據(jù)
庫,具體檢索策略參見框1。考慮到臨床試驗系統(tǒng)評價與動物實驗系統(tǒng)評價在發(fā)表數(shù)量上的巨大差異,對于其檢索時間分別隨機(jī)限定在2016年10月和2016年1月至12月間的數(shù)據(jù)。具體的檢索策略參見圖1~2。
圖1 臨床試驗系統(tǒng)評價檢索策略
圖2 動物實驗系統(tǒng)評價檢索策略
1.3 文獻(xiàn)篩選由5名研究者(廖緒亮、朱敏、趙夢娜、姜彥彪、唐曉宇)按照上述納入/排除標(biāo)準(zhǔn),獨立進(jìn)行文獻(xiàn)篩選,并進(jìn)行交叉核對。如果遇到不同的意見,由第三位研究者(馬彬)裁決或討論決定。
1.4 數(shù)據(jù)的提取與分析由5名研究者(廖緒亮、朱敏、趙夢娜、姜彥彪、侯皓中)獨立提取相關(guān)資料并交叉核對。提取信息如下:①一般特征:被引次數(shù)、作者數(shù)量、發(fā)表期刊特點(綜合期刊、專業(yè)期刊)、納入研究數(shù)量、納入研究樣本量、涉及疾病和干預(yù)范圍等;②方法特征:檢索特征(數(shù)據(jù)庫數(shù)量、是否實施補(bǔ)充檢索、是否報告檢索詞/檢索式、是否進(jìn)行語言限制、是否至少報告一個數(shù)據(jù)庫的檢索策略、是否報告研究人員資質(zhì)、是否報告文獻(xiàn)篩選流程圖等)、其它特征(是否評估納入研究內(nèi)在偏倚風(fēng)險、是否進(jìn)行數(shù)據(jù)合成(MAs)、是否進(jìn)行了異質(zhì)性分析、是否評估發(fā)表偏倚等)。
1.5 統(tǒng)計分析采用Office Excel 2013進(jìn)行統(tǒng)計學(xué)分析計數(shù)資料(如被引次數(shù)、期刊類別、雜志性質(zhì)、納入研究數(shù)量、納入研究樣本量)采用例數(shù)(N)和百分比(%)進(jìn)行統(tǒng)計描述;計量資料(如作者數(shù)量)采用中位數(shù)和四分位數(shù)間距進(jìn)行統(tǒng)計描述;采用SPSS 20.0軟件,組間比較使用卡方檢驗和OR值,檢驗水準(zhǔn)α。
2.1 文獻(xiàn)篩選結(jié)果文獻(xiàn)篩選流程及結(jié)果詳見(圖3),最終納入680篇研究,其中臨床系統(tǒng)評價共624篇、動物系統(tǒng)評價共56篇。
2.2 納入研究一般信息
圖3 文獻(xiàn)篩選結(jié)果
2.2.1 發(fā)表國家無論是臨床試驗系統(tǒng)評價還是動物實驗系統(tǒng)評價,其發(fā)表數(shù)量排在前三位的分別為中國、美國和英國(圖4)。
圖4 納入研究的發(fā)表國家
2.2.2 涉及疾病范圍624篇已發(fā)表的臨床試驗系統(tǒng)評價中,研究疾病排在前三位的分別是腫瘤(14.3%,89/624)、肌肉骨骼系統(tǒng)和結(jié)締組織疾?。?2.2%,76/624)和消化系統(tǒng)疾?。?0.7%,67/624);56篇已發(fā)表的動物實驗系統(tǒng)評價中,疾病排在前三位的分別是循環(huán)系統(tǒng)疾?。?3.2%,13/56)、肌肉骨骼系統(tǒng)和結(jié)締組織疾病(14.3%,8/56)和神經(jīng)系統(tǒng)疾病(10.7%,6/56),如圖5。
圖5 臨床試驗SRs/動物實驗SRs涉及疾病范圍(參考Clinical Description and Diagnostic Guidelines[M].WHO,1993.)
2.2.3 涉及干預(yù)措施就干預(yù)措施范圍而言,無論是臨床試驗SRs(28.5%,178/624)還是動物實驗SRs(49.2%,24/56),其干預(yù)措施大多涉及“藥物-化學(xué)物質(zhì)”方面(圖6)。
圖6 動物實驗SRs/臨床試驗SRs涉及干預(yù)類型分類(分類標(biāo)準(zhǔn)參考自:Kilkenny C,Parsons N,Kadyszewski E,et al. Survey of the quality of experimental design, statistical analysis and reporting of research using animals[J]. Plos One,2009,4(11):e7824.)
2.3 納入研究方法特征
2.3.1 檢索特征動物實驗系統(tǒng)評價在檢索數(shù)據(jù)庫數(shù)量≥3個研究數(shù)量(26.8% vs. 74.4%)(P=0.000)、實施補(bǔ)充檢索(0/56 vs. 12.7%)(P=0.005)、未進(jìn)行語言限制(62.5% vs.76.6%)(P=0.019)和報告文獻(xiàn)篩選流程圖(19.6% vs. 27.4%)(P=0.209)方面的比例均低臨床試驗系統(tǒng)評價,且在前三個方面之間的差異均具有統(tǒng)計學(xué)意義(圖7)。
圖7 納入研究方法特征
2.3.2 其他方法特征與臨床試驗系統(tǒng)評價相比,動物實驗系統(tǒng)評價在實施數(shù)據(jù)合成(MAs)(73.2% vs. 80.3%)(P=0.270)、進(jìn)行異質(zhì)性分析(44.6% vs. 56.7%)(P=0.081)和評估發(fā)表偏倚(32.1% vs. 36.1%)(P=0.558)方面的比例均較低,但差異均無統(tǒng)計學(xué)意義。
總所周知,相比較于系統(tǒng)評價這一研究方法在臨床實踐領(lǐng)域下的成熟應(yīng)用,在動物實驗領(lǐng)域的應(yīng)用還較少,且方法學(xué)還存在較多的挑戰(zhàn)。本研究是第一個全面開展對比分析動物實驗系統(tǒng)評價與臨床試驗系統(tǒng)評價在研究特點、方法和報告質(zhì)量等方面的差異,可為今后動物實驗系統(tǒng)評價的開展和實施提供一定的參考依據(jù)。
3.1 納入研究一般特征我們的研究顯示,總體而言,動物實驗系統(tǒng)評價發(fā)表的數(shù)量遠(yuǎn)低于臨床試驗系統(tǒng)評價,且國家分布亦較少,這可能與動物實驗系統(tǒng)評價起步較晚,目前方法學(xué)尚不完善,以及在基礎(chǔ)醫(yī)學(xué)領(lǐng)域的宣傳和普及度較低有關(guān)。Ma等[10]的研究亦顯示,在266名受訪者中,雖然大多數(shù)受訪者(77.4%)聽說過系統(tǒng)評價,但僅31.2%的人曾閱讀過動物實驗系統(tǒng)評價,且很少有受訪者實施(6.0%)或發(fā)表(4.1%)過動物實驗系統(tǒng)評價。
此外,動物實驗系統(tǒng)評價和臨床試驗系統(tǒng)評價在涉及疾病和干預(yù)范圍方面,基本一致。這在一定程度上也說明了臨床前研究是后續(xù)臨床研究得以延續(xù)、轉(zhuǎn)化和發(fā)展的重要來源和基礎(chǔ),亦是連接基礎(chǔ)研究與臨床試驗的重要橋梁[11,12],其結(jié)果直接影響著許多臨床領(lǐng)域研究課題成果的確立和水平的高低。
3.2 納入研究方法特征系統(tǒng)評價是證據(jù)綜合研究方法之一,檢索的全面性和廣泛性在一定程度上決定了系統(tǒng)評價研究結(jié)果的可信度[13,14]。由于當(dāng)前沒有一種數(shù)據(jù)庫能全面收錄所有已發(fā)表的醫(yī)學(xué)文獻(xiàn),且各數(shù)據(jù)庫收錄的期刊均不相同,每種期刊收錄文獻(xiàn)的標(biāo)準(zhǔn)同樣均有差異[13]。因此,需要通過對多個數(shù)據(jù)資源的查詢,以達(dá)到全面廣泛的目的。但我們的研究依然顯示:已發(fā)表的動物實驗系統(tǒng)評價中,低于1/3的研究檢索超過3個以上數(shù)據(jù)庫,近一半的研究實施語種限制、無研究實施補(bǔ)充檢索,低于20%的研究報告文獻(xiàn)篩選流程圖,這些比例明顯低于臨床試驗系統(tǒng)評價[15],這可能與關(guān)于動物實驗檢索策略制定的標(biāo)準(zhǔn)和規(guī)范也是近幾年發(fā)表有關(guān)[16]。但需要注意的是,我們已經(jīng)考慮到這些標(biāo)準(zhǔn)發(fā)布時間與實際研究實施時間之間滯后性,樣本均發(fā)表于2016年。因此,說明動物實驗檢索策略的標(biāo)準(zhǔn)和規(guī)范推行力度不夠,今后需要聯(lián)系相關(guān)專業(yè)期刊,將動物實驗檢索策略的標(biāo)準(zhǔn)與規(guī)范引入到“稿約”中,并且需要采取恰當(dāng)?shù)拇胧?,加大?guī)范對動物實驗檢索策略制定方法學(xué)的宣傳、教育和推廣,以促進(jìn)動物實驗系統(tǒng)評價質(zhì)量的提高。
對納入研究的偏倚風(fēng)險進(jìn)行科學(xué)、準(zhǔn)確的評估,是制作系統(tǒng)評價的核心步驟之一。盡管2014年,基于Cochrane風(fēng)險評估工具,由來自荷蘭動物實驗系統(tǒng)評價研究中心的Hooijmans等[17]起草、制定并頒布了SYRCLE動物實驗風(fēng)險評估工具(SYRCLE's risk of bias tool for animal studies),該工具也是目前唯一專門適用于動物實驗內(nèi)在真實性評估的工具。但我們的研究依然顯示,僅一半的動物實驗系統(tǒng)評價(51.8%)對納入研究的偏倚風(fēng)險進(jìn)行了評估,其中SYRCLE 動物實驗風(fēng)險評估工具的使用比例僅為5.4%[18]。因此,非常有必要今后在國內(nèi)進(jìn)一步加大對該評估工具的推廣和宣傳,促進(jìn)國內(nèi)基礎(chǔ)研究領(lǐng)域人員更為科學(xué)、嚴(yán)謹(jǐn)設(shè)計動物實驗,以提高動物實驗的內(nèi)在真實性。
Sutton等基于48個已發(fā)表的系統(tǒng)評價,評估發(fā)表偏倚對系統(tǒng)評價結(jié)果的影響,結(jié)果顯示[19],50%的系統(tǒng)評價結(jié)果受到發(fā)表偏倚的影響,其中10%的系統(tǒng)評價的結(jié)果被完全改變。因此,科學(xué)評估發(fā)表偏倚對解讀動物實驗系統(tǒng)評價結(jié)果的可信度具有重要意義。我們的研究顯示,僅1/3的動物實驗系統(tǒng)評價對發(fā)表偏倚進(jìn)行了評估,該比例明顯低于Korevaar等[20]和Peters等[21]的研究。對動物實驗而言,目前尚缺乏類似臨床試驗的注冊制度,且大多數(shù)動物實驗納入樣本數(shù)量較少。目前如何對其發(fā)表偏倚進(jìn)行評估尚未形成共識,仍存在巨大挑戰(zhàn)[22]。為盡量降低和避免發(fā)表偏倚,我們建議在制作動物實驗系統(tǒng)評價時,除保證檢索數(shù)據(jù)庫的廣泛性外,非常有必要與作者實驗室和其他相關(guān)研究機(jī)構(gòu)聯(lián)系獲取未發(fā)表的數(shù)據(jù)。
眾所周知,應(yīng)用Meta分析的前提是納入研究間具有足夠的同質(zhì)性[23,24]。我們的研究顯示:雖然大部分(73.2%)動物實驗系統(tǒng)評價進(jìn)行了數(shù)據(jù)合成(Meta分析),僅44.6%的研究對納入研究進(jìn)行了異質(zhì)性分析。研究顯示:動物實驗研究間的異質(zhì)性大且消除困難[25],如何科學(xué)評估動物實驗間異質(zhì)性,也是目前開展此類型系統(tǒng)評價研究的難點和挑戰(zhàn)。我們建議動物實驗Meta分析中選擇隨機(jī)效應(yīng)模型合并效應(yīng)量比較穩(wěn)妥。合并多個研究的結(jié)局變量時,離散型結(jié)局變量通常以O(shè)R表達(dá),若為連續(xù)型結(jié)局變量,可采用標(biāo)準(zhǔn)化的結(jié)局變量或利用研究報告的資料將連續(xù)型變量轉(zhuǎn)化為相對的OR值后計算效應(yīng)值。當(dāng)定量Meta分析不適合時亦可采用其他合成研究的方法,如Meta回歸和貝葉斯 Meta分析,后者可分析異質(zhì)性來源。
目前,相比較臨床系統(tǒng)評價而言,動物系統(tǒng)評價發(fā)表數(shù)量相對較少,且在在數(shù)據(jù)庫檢索規(guī)范、偏倚風(fēng)險評估的準(zhǔn)確性、異質(zhì)性的分析和識別等重要影響方法質(zhì)量的環(huán)節(jié)方面存在局限性。因此,今后有必要進(jìn)一步完善動物實驗系統(tǒng)評價在以上制作環(huán)節(jié)方法學(xué)的不斷完善和發(fā)展,并采取恰當(dāng)?shù)拇胧?,對目前已?jīng)形成的如檢索策略的制定、偏倚風(fēng)險的準(zhǔn)確評估等規(guī)范加大宣傳、教育和推廣,以促進(jìn)動物實驗系統(tǒng)評價質(zhì)量的提高。