周英鳳 朱政 胡雁 邢唯杰 顧鶯 張曉菊 陳瑜
(1.復旦大學護理學院 復旦大學JBI循證護理合作中心 上海市循證護理中心,上海 200032;2.復旦大學附屬兒科醫(yī)院,上海 201102;3.復旦大學附屬腫瘤醫(yī)院,上海 200032)
從1996年David Sackett[1]提出循證醫(yī)學的概念起,循證實踐意味著臨床人員將最好的研究證據(jù)與專業(yè)人員的臨床經(jīng)驗及患者價值觀相結合,進行臨床決策,由此可見,證據(jù)是循證實踐的核心。而近50年來,醫(yī)學、護理及健康科學領域的飛速發(fā)展,形成了數(shù)量龐大的知識與信息,但正如著名未來學家John Naisbitt[2]在其著作《大趨勢》中所言:“與過去面對知識的饑荒相比,時至今日我們卻淹沒于信息的海洋。在信息社會,失去控制和沒有組織的信息不再是一種資源,而是一種嚴重的威脅”。因此,決策者面對浩瀚的信息海洋,如何獲取真實、可靠的證據(jù)指導其臨床決策,成為信息社會的最大挑戰(zhàn)。循證醫(yī)學誕生至今,盡管國內(nèi)外學者對證據(jù)尚缺乏統(tǒng)一的定義,但從證據(jù)產(chǎn)生的角度,“內(nèi)在真實性”是證據(jù)最本質(zhì)的特征,即證據(jù)應真實可信;而從證據(jù)應用的角度,“外在真實性”是證據(jù)的重要特征,即證據(jù)應具有一定的適用性[3]。因此,對決策者、實踐者甚至患者來說,基于證據(jù)進行臨床決策時,不僅要關注證據(jù)的內(nèi)在真實性,更應關注證據(jù)的外在真實性,以確保臨床決策的有效性,避免將不恰當、無效甚至錯誤的證據(jù)應用到實踐中。
本文旨在闡述證據(jù)的內(nèi)涵及特征,介紹證據(jù)評價的原則與方法,在此基礎上,提出關于如何對證據(jù)進行科學評價以推動證據(jù)臨床轉化的思考和建議。
縱觀國內(nèi)外不同的研究者或機構對證據(jù)的界定,有助于了解證據(jù)的內(nèi)涵和外延,明確人們對證據(jù)這一概念認識的演進。2000年,循證醫(yī)學奠基人David Sackett等[4]將臨床證據(jù)定義為“以患者為研究對象的各種臨床研究(包括防治措施、診斷、病因、預后經(jīng)濟學評價與研究等)所得到的結果和結論”,這一概念明確界定了證據(jù)是由臨床研究得出的結論。此后,Gordon Guyatt等[5]認為,“任何經(jīng)驗性的觀察都可以構成潛在的證據(jù),不論該證據(jù)是否被系統(tǒng)或不被系統(tǒng)收集”。根據(jù)這一定義,將研究得出的結論和經(jīng)驗都界定為證據(jù)。2005年,加拿大衛(wèi)生服務研究基金采用系統(tǒng)評價的方法將證據(jù)定義為“證據(jù)是最接近事實本身的一種信息,其形式取決于具體情況,高質(zhì)量及方法恰當?shù)难芯拷Y果是最佳證據(jù)”[5],這一定義明確了證據(jù)具有等級性這一特點。從循證護理的角度,澳大利亞JBI循證衛(wèi)生保健中心基于證據(jù)多元主義的哲學觀,將證據(jù)定義為“證據(jù)是用于判斷某個觀點是否可信的數(shù)據(jù)或信息”[6],而胡雁、郝玉芳教授[7]主編的《循證護理學》第2版中,則將證據(jù)定義為“經(jīng)過研究及臨床應用后,證明可信、有效、能夠有力地促進醫(yī)療或護理結局向積極方向改變的措施、方法”,與之前對證據(jù)定義最大的不同之處在于,這一概念是站在實踐者而非研究者的角度去界定證據(jù)的內(nèi)涵,更強調(diào)證據(jù)內(nèi)在真實性與外在真實性相統(tǒng)一。
證據(jù)作為循證實踐三要素的核心,具有4個特征[7]:(1)多元性:盡管隨機對照試驗被認為是評價療效的金標準,但衛(wèi)生保健領域問題的多樣性決定了不同的研究問題需要由不同的研究方法來解決。因此,多元主義的證據(jù)觀已經(jīng)被普遍接受,不但研究(包括量性研究和質(zhì)性研究)可以作為證據(jù)的來源,習慣與傳統(tǒng)、經(jīng)驗、專業(yè)判斷、推理等都可以作為證據(jù)的來源。(2)等級性:雖然證據(jù)的來源多元化,但不同的證據(jù)提供的論證強度并不同,這就意味著證據(jù)具有等級性。證據(jù)的等級性是循證醫(yī)學中證據(jù)最鮮明的特征,證據(jù)的等級系統(tǒng)包括證據(jù)的質(zhì)量等級和推薦級別。最早對證據(jù)進行等級劃分的是加拿大衛(wèi)生部成立的定期體檢工作組[8],在1979年首次基于試驗設計,將證據(jù)分為三級,設計良好的RCT級別最高,專家意見級別最低,由此開啟了對證據(jù)進行分級的時代。目前被廣泛接受和使用的證據(jù)分級系統(tǒng)主要有牛津大學循證醫(yī)學中心、GRADE工作組及澳大利亞JBI循證衛(wèi)生保健中心提出的證據(jù)分級系統(tǒng)。(3)情景相關性:基于特定時間、特定人群、特定條件生產(chǎn)出來的證據(jù),并不一定適用于所有的情景,這意味著證據(jù)具有情景相關性,這與該情景的資源分布、實踐條件、政策、文化、習俗、信仰等因素有關。既往的研究也指出,即使是基于相同的證據(jù),也可能會導致不同情境下指南推薦意見的差異[9]。(4)動態(tài)變化性:衛(wèi)生保健及健康科學領域的發(fā)展日新月異,推動著研究不斷發(fā)展和人們的認知不斷更新,因此證據(jù)不是一成不變的,而是具有動態(tài)變化性。既往的研究指出,臨床實踐指南在發(fā)布后,平均3.6年便過時[10]。
證據(jù)評價包括對其內(nèi)在真實性和外在真實性兩方面的評價,內(nèi)在真實性是指證據(jù)本身應真實可信,而外在真實性是指證據(jù)應具有一定的外推性及適用性。因此,證據(jù)的內(nèi)在真實性是外在真實性的前提,若一項證據(jù)缺乏內(nèi)在真實性,則沒有必要再去評價其外在真實性。不同的研究者從不同的角度對證據(jù)的內(nèi)在和外在真實性進行評價,目前最常用的評價依據(jù)包括FAME策略和VIP策略。
3.1FAME策略 澳大利亞JBI循證衛(wèi)生保健中心Alan Pearson等[11]從證據(jù)內(nèi)在真實性和臨床適用性角度出發(fā),提出了證據(jù)的四大屬性,即FAME策略,從4個方面對證據(jù)的內(nèi)在真實性(即有效性)和外在真實性(即可行性、適宜性和臨床意義)進行了評價:(1)Feasibility(證據(jù)的可行性):主要指證據(jù)在多大程度上可應用于實踐,包括證據(jù)應用所需的資源是否具有可及性,是否有足夠的經(jīng)驗和能力開展該實踐,開展該項實踐的成本效果如何等。(2)Appropriateness(證據(jù)的適宜性):主要指證據(jù)應用與特定情境是否適合或匹配的程度,包括該實踐方式在文化、政策、倫理、組織上是否可接受,該實踐方式可否在大多數(shù)人群中轉化或運用等。(3)Meaningfulness(證據(jù)的臨床意義):主要指證據(jù)應用給患者帶來的積極體驗的程度,包括證據(jù)應用是否給患者帶來積極或不良的體驗,是否符合患者的價值觀、意愿或信念。(4)Effectiveness(證據(jù)的有效性):關注證據(jù)的內(nèi)在真實性,主要指證據(jù)應用在多大程度上能達到預期效果,包括該項實踐活動是否獲益,是否具有安全性,是否改善患者健康結局等。
3.2VIP策略 循證醫(yī)學則提出了證據(jù)評價的VIP策略[3],從3個方面評價證據(jù)的內(nèi)在和外在真實性:(1)Validity(證據(jù)的真實性):主要指證據(jù)是否真實、可靠,評價研究實施過程中各種偏倚風險對證據(jù)內(nèi)在真實性的影響程度,包括選擇偏倚、實施偏倚、失訪偏倚及測量偏倚等。(2)Importance(證據(jù)的重要性):主要指證據(jù)是否具有臨床應用價值,評價結局指標的統(tǒng)計效應量,然后結合專業(yè)判斷,評價結局指標是否具有臨床意義。(3)Practice(證據(jù)的適用性):主要指證據(jù)的外部真實性,證據(jù)是否適合具體的臨床情景,證據(jù)產(chǎn)生的情景與證據(jù)所要應用的情景是否一致,研究對象是否具有相似的特征,證據(jù)應用是否符合患者的意愿及價值觀,證據(jù)應用可能的獲益與風險,證據(jù)應用所需的技術與資源是否具備等。
證據(jù)內(nèi)在真實性評價主要是針對研究的方法學質(zhì)量進行評價,其評價方法在各大循證醫(yī)學及循證護理教科書中已經(jīng)有非常系統(tǒng)、規(guī)范的描述,并且針對不同研究設計的原始研究和2次研究,均提供了清晰的評價清單(具體見本系列文章的第5篇)。
本文將重點介紹證據(jù)外在真實性的評價方法,將證據(jù)應用到研究人群以外的情景時,需要依據(jù)專業(yè)判斷評價證據(jù)的臨床適用性。
5.1定量評價法 定量評價方法是通過數(shù)學計算得出評價結論的方法,是指按照數(shù)量分析方法,通過數(shù)學運算及統(tǒng)計分析,從客觀量化角度對研究現(xiàn)象進行評價與篩選[12]。定量分析方法具有科學性、客觀性及嚴密性等特點,為人們提供了系統(tǒng)、客觀的數(shù)量分析方法,使結果更加直觀、具體。在對證據(jù)外在真實性進行評價時,可遴選相關領域的經(jīng)驗豐富的專家,通過專家會議法、Delphi專家咨詢法或橫斷面調(diào)查,以證據(jù)的FAME屬性為判斷依據(jù),從證據(jù)應用的可行性、適宜性、臨床意義及有效性4個方面,以打分的形式對證據(jù)的臨床適用性做出評價。然后通過統(tǒng)計分析,評價專家對證據(jù)的臨床適用性判斷意見的集中程度和離散程度,作為是否在實踐中應用此證據(jù)的依據(jù)。采用定量評價法進行證據(jù)評價,雖然評價結果比較量化、直觀,但無法對評價結果進行深層次剖析,無法了解某些證據(jù)臨床適用性差的具體原因,且該方法受專家個人的學術背景及專業(yè)判斷的影響較大,因此,該方法具有一定的局限性。
5.2定性評價法 定性評價方法是是運用分析和綜合、比較與分類、歸納和演繹等邏輯分析的方法,利用專家的知識、經(jīng)驗和判斷對評價對象做出定性結論的價值判斷[12]。定性評價方法具有描述性、歸納性及靈活性等特點,為人們提供了關注內(nèi)容實質(zhì)與本質(zhì)的分析方法,使結果更深入、更系統(tǒng)。在對證據(jù)臨床適用性進行評價時,也可遴選相關領域的經(jīng)驗豐富的專家,通過專家會議法、焦點小組訪談法或利益相關者個人訪談,以證據(jù)的FAME屬性為訪談或討論提綱,從證據(jù)應用的可行性、適宜性、臨床意義及有效性四個方面,以訪談或討論的方式對證據(jù)的臨床適用性進行深入探討。系統(tǒng)收集專家的意見、觀點及建議,進行系統(tǒng)的歸納,深入分析某些證據(jù)臨床適用性差的障礙因素,并探討這些障礙因素如何解決。采用定性評價法進行證據(jù)評價,雖然評價結果比較深入,但評價結果不夠精確,有時甚至難以得出一致的結論,且該方法受專家個人價值觀和背景影響很大,因此,該方法也具有一定的局限性。
5.3定量與定性混合評價法 定量評價強調(diào)用數(shù)學工具來進行評價和分析,而定性評價傾向于用語言描述的方法進行解釋與說明,基于兩種評價方法各有優(yōu)勢和缺陷,因此,采用兩種評價方法相結合的方式,定性評價方法使得定量評價所得到的數(shù)字獲得有意義的解釋,更具有目的性,而定量評價方法又使得對客體的認識更具有準確性,增加了說服力[12]。因此,在對證據(jù)外在真實性進行評價時,可以先通過定量評價的方法,請專家對證據(jù)的臨床實用性依據(jù)FAME屬性進行打分,在統(tǒng)計分析的基礎上,針對得分較低及得分變異較大的條目,再通過定性評價的方法,深入探討和分析該證據(jù)臨床適用性差的障礙因素。亦可以先通過定性評價方法,對證據(jù)的臨床適用性從FAME 4個方面進行分析和討論,根據(jù)討論結果對證據(jù)進行遴選,然后再通過定量評價方法,得出一致的結論。定量和定性相結合的評價方法,能確保評價結果更準確、更客觀、更科學。
6.1證據(jù)評價是將證據(jù)應用于實踐前的必要環(huán)節(jié) 證據(jù)是循證實踐應遵循的核心要素,但并非所有的研究結論都可成為證據(jù)。循證實踐強調(diào)科學的臨床決策應當依賴于當前可獲得的最佳外部證據(jù),而最佳證據(jù)指來自設計嚴謹且具有臨床意義的研究的結論,只有真實可信的最佳證據(jù)才能作為決策的依據(jù)[7]。而研究結論的真實性取決于研究過程中對各種偏倚風險的控制程度,即研究的方法學質(zhì)量,偏倚風險越小,研究質(zhì)量就越高,研究結果的可信度就越高。但研究具有內(nèi)在真實性,并不意味著具有很好的臨床適用性,因為證據(jù)的情景相關性的特點,在一定情境下真實可信的證據(jù),應用到其他情景未必有效。因此,將證據(jù)應用于臨床實踐之前,采用嚴謹方法對證據(jù)的內(nèi)在真實性和外在真實性進行科學的評價,是確保做出最佳臨床決策的重要保障。
6.2證據(jù)評價是依據(jù)臨床經(jīng)驗和專業(yè)判斷的過程 除來自研究的最佳外部證據(jù)外,循證實踐決策的核心要素還包括來自專業(yè)人員經(jīng)驗與判斷的內(nèi)部證據(jù)。當對研究的真實性、重要性和臨床適用性進行評價時,都離不開專業(yè)判斷。首先,在對研究結論的真實性進行評價時,并不僅僅依據(jù)是否采取了控制偏倚風險的措施,更重要的是結合專業(yè)背景和臨床實際情況,判斷所采取的措施是否恰當,有無違背客觀規(guī)律及倫理原則。其次,在對研究結論的外部真實性進行評價時,更需要依據(jù)專業(yè)知識和經(jīng)驗評價證據(jù)對特定人群的可行性、適宜性、臨床意義及有效性,將證據(jù)與實際問題相結合,做出合理的決策。因此,對證據(jù)進行評價時,僅依據(jù)統(tǒng)計學或臨床流行病學的方法學知識進行評價是不夠的,不管是對證據(jù)進行內(nèi)在真實性進行評價,還是對外在真實性進行評價,都應當結合專業(yè)人員的臨床經(jīng)驗和知識,做出科學的專業(yè)判斷。
6.3證據(jù)評價有助于證據(jù)的遴選及明確證據(jù)應用可能的障礙因素 由于受到多種因素的影響,包括證據(jù)本身的真實性及有效性,特定情景的資源、技術、政策、文化以及患者的價值觀和意愿等,來自研究的證據(jù)并非都能應用到臨床實踐中。因此,通過對證據(jù)的科學評價,明確證據(jù)的臨床適用性、復雜性、可行性及有效性,遴選出復雜性低、與現(xiàn)行臨床標準具有較好的一致性(例如不需要對現(xiàn)行實踐流程進行大規(guī)模調(diào)整)、患者接受度好、及應用后患者結局很可能被改善,且結局指標容易被測量的證據(jù),優(yōu)先進行轉化和推廣實施。此外,證據(jù)評價也有助于明確開展臨床轉化可能存在的障礙因素,比如系統(tǒng)層面資源的缺乏、實踐者層面技能的不足、患者層面支持性工具的缺乏等,為后續(xù)轉化策略的構建提供參考和依據(jù)。