谷恒明,胡良平
(軍事醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)統(tǒng)計學(xué)咨詢中心,北京 100850 通信作者:胡良平,E-mail: lphu812@sina.com)
?
正確把握精神衛(wèi)生臨床試驗設(shè)計三要素的要領(lǐng)(Ⅲ)
——觀測指標
谷恒明,胡良平
(軍事醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)統(tǒng)計學(xué)咨詢中心,北京100850 通信作者:胡良平,E-mail: lphu812@sina.com)
明確闡釋在進行精神衛(wèi)生臨床試驗設(shè)計時,正確把握“觀測指標”的意義和要領(lǐng)。從基本常識出發(fā),基于精神衛(wèi)生科研的特點,尋找和發(fā)現(xiàn)在此研究領(lǐng)域中,怎樣做才能被稱為正確把握了“觀測指標”。通過結(jié)合本專業(yè)的特點,并結(jié)合實例,獲得如下的結(jié)果,即在進行精神衛(wèi)生臨床試驗設(shè)計時,必須把握好以下五個方面,①觀測指標的分類;②觀測指標的選定;③觀測指標取值的測定方法;④觀測指標測定時間的確定;⑤觀測指標測定次數(shù)的確定。在如何確定觀測指標問題上,正確把握好前述提及的五個方面,就是抓住了問題的本質(zhì),是提高臨床試驗研究質(zhì)量的一個重要環(huán)節(jié)。
精神衛(wèi)生;臨床試驗設(shè)計;觀測指標;靈敏度;特異度
1.1試驗效應(yīng)和觀測指標
試驗效應(yīng)就是影響因素作用于受試對象后所產(chǎn)生的結(jié)果,它是通過具體的觀測指標來體現(xiàn)的,是研究結(jié)果的最終體現(xiàn),也是試驗研究的核心內(nèi)容。換句話說,觀測指標是用來反映影響因素作用強弱的重要“尺子”,必須結(jié)合影響因素的性質(zhì)和特點、儀器、試劑和技術(shù)水平等多方面綜合考慮,找出“特異性強、靈敏度高、準確、可靠”的觀測指標,以“客觀指標”為主,以“半客觀和主觀指標”為輔;如果指標選擇不當,未能準確反映影響因素的作用,獲得的研究結(jié)果就缺乏科學(xué)性。因此,選擇好的指標是關(guān)系科學(xué)研究成敗的重要環(huán)節(jié)。
1.2精神衛(wèi)生科研領(lǐng)域中觀測指標的特點
在精神衛(wèi)生學(xué)術(shù)論文中,觀測指標通常有“單一型”和“復(fù)合型”兩種表象。所謂“單一型”觀測指標,是指每個觀測指標僅代表一個特定的專業(yè)內(nèi)容或含義,如血清IL-1、IL-4、IL-6、IL-10、CRP水平[1]就是五個“單一型”觀測指標;又如HRSD評分[2]、PANSS評分和WCST評分[3]均來自某種特定量表上多個項目的綜合評分,屬于“復(fù)合型”觀測指標。
2.1按功能分類
從功能上分類,觀測指標可被分為三類:診斷性指標、療效性指標和安全性指標。
2.2按主次分類
按照主次分類,觀測指標可分為主要指標和次要指標。因為無論是診斷性、療效性和安全性指標都有很多,應(yīng)突出重點,不能眉毛胡須一把抓。通常每類指標中的主要指標只設(shè)定一個,因為主要指標多了,依據(jù)它們的取值,經(jīng)過統(tǒng)計分析,得出自相矛盾的結(jié)果時,不便作出結(jié)論。
確定一個研究項目各類指標中的主要指標有以下三點好處:其一,重點突出;其二,便于試驗前估算樣本含量;其三,可以有效避免統(tǒng)計分析結(jié)果出現(xiàn)自相矛盾的現(xiàn)象。
3.1主要與次要診斷性指標的確定
需要對受試對象是否患有某種待研究疾病進行認真檢查,作出診斷結(jié)論。明確診斷是臨床試驗設(shè)計時制訂“納入標準”的重要條件之一。為確定受試對象是否患有某種疾病,診斷的指標往往并非一個,而有多個。
結(jié)合基本常識、專業(yè)知識及預(yù)試驗的結(jié)果,確定一個最有說服力的指標為主要診斷指標,其他為次要診斷指標。最好有“金標準”,金標準即診斷某受試對象患了某病,該患者就一定患了此病,反之亦然。
3.2主要與次要療效性指標的確定
主要療效指標又稱主要終點,是與試驗?zāi)康挠斜举|(zhì)聯(lián)系的、能確切反映治療有效性的觀察指標。通常主要療效指標只有1個,偶爾會設(shè)定2~3個。如果存在多個主要療效指標時,應(yīng)該在設(shè)計方案中考慮控制Ⅰ類錯誤的方法,如有5個主要療效指標,對它們進行假設(shè)檢驗時,應(yīng)調(diào)整每次假設(shè)檢驗的顯著性水平α的取值,通常α=0.05,而有5個主要療效指標時,對每個主要療效指標分析時,將其設(shè)定為α'=0.05/5=0.01。
主要療效指標應(yīng)根據(jù)試驗?zāi)康倪x擇易于量化、客觀性強、重復(fù)性好,并易于在相關(guān)研究領(lǐng)域估計的指標。次要療效指標是指與試驗?zāi)康南嚓P(guān)的輔助性指標,一般來說,次要療效指標的數(shù)目較多。
3.3主要與次要安全性指標的確定
在臨床試驗中,安全性評價是非常重要的一個方面。在臨床試驗的早期,這一評價主要是探索性的,且只能發(fā)現(xiàn)常見的不良反應(yīng);在后期,一般可通過較大的樣本進一步了解藥物的安全性。后期的對照試驗是一個重要的以無偏倚的方式探索任何新的潛在的藥物不良反應(yīng)的方法。安全性指標也應(yīng)有主次之分,通常主要安全性指標只有一個,次要安全性指標可以有多個。
藥物安全性評價的常用統(tǒng)計指標為不良事件發(fā)生率和不良反應(yīng)發(fā)生率。當試驗時間較長、有較大的退出治療比例或死亡比例時,需用生存分析計算累計不良事件發(fā)生率。構(gòu)成安全性評價的資料則主要來源于不良事件的臨床表現(xiàn)、實驗室檢查等。從受試者中收集的安全性指標應(yīng)盡可能全面,主要包括受試者出現(xiàn)的所有不良事件的類型、發(fā)生時間、嚴重程度、處理措施、持續(xù)的時間、轉(zhuǎn)歸以及藥物劑量與試驗藥物的關(guān)系。所有的安全性指標在評價中都需被重視,其主要分析方法需在研究方案中說明。
4.1選取的一般原則
觀測指標的取值反映影響因素作用于受試對象后所產(chǎn)生的試驗效應(yīng),這些指標包括定性指標和定量指標等。觀測指標的選擇必須注意它的針對性,即選用的指標必須與研究目的具有本質(zhì)性聯(lián)系,且能確切反映影響因素的效應(yīng)。否則,不能作出正確的判斷。
4.2選取指標時應(yīng)注意的事項4.2.1指標的合理性
所謂“合理”就是指所選指標能真實客觀地反映出干預(yù)措施的臨床效應(yīng),在專業(yè)上能得到合理的解釋。
4.2.2指標的先進性
課題的先進性一般由指標的先進性體現(xiàn)出來,先進指標更能深入地反映所研究的問題,揭示事物的本質(zhì)。
4.2.3指標的客觀性
在臨床試驗中應(yīng)盡量選擇客觀性指標,即通過測試儀器或工具獲得觀測結(jié)果的指標而避免選用由研究者主觀判斷觀測結(jié)果或根據(jù)受試對象主訴獲取觀測結(jié)果的主觀性指標。若是主觀指標,最好將其客觀化。
4.2.4指標的靈敏性和特異性
靈敏性是指所選用的指標對干預(yù)措施反應(yīng)的靈敏程度,指標的特異性即檢測結(jié)果的專一性,以便把假陽性結(jié)果控制在最低水平。最好選用靈敏度高、特異性好的指標。
【解說】舉一個骨科藥物臨床試驗的真實實例:在評價一種治療骨折藥物療效的臨床試驗研究中,研究者確定的主要療效指標為“骨密度”、“骨鈣素”、“脛骨缺損處周長”等。顯然,選擇上述指標來評價藥物對骨折的治療效果既不敏感又不特異,失去了“針對性”,那些指標用來反映患者“骨質(zhì)疏松狀況”比較合適。那么,哪些指標用來反映骨折愈合效果合適呢?根據(jù)基本常識和骨科專業(yè)知識得知,應(yīng)選擇“骨形態(tài)”、“X線片”、“病理檢查結(jié)果”和“功能恢復(fù)情況”等[4]。
在精神衛(wèi)生科研領(lǐng)域中,在選取觀測指標方面,是否存在像上面那樣“張冠李戴”的現(xiàn)象,需要具有豐富專業(yè)知識的學(xué)者花很多時間去細讀大量的學(xué)術(shù)論文,才能給出答案。
4.2.5指標的精確性
指標的精確性包括指標的精密度與準確度。
4.2.6指標的經(jīng)濟性
指標的經(jīng)濟性是指檢測成本應(yīng)在受試對象所能承受的范圍之內(nèi)。
4.2.7指標的標準化
指標的標準化是指對指標的采集方法、部位、時間、保存、運輸、測定時間、測定方法、測定條件等方面進行嚴格地規(guī)定,應(yīng)確保不同的操作者或同一操作者在不同時間操作,效果基本相同。若不進行標準化,這些與測定結(jié)果有關(guān)的非試驗因素會干擾研究效果,或者成為混雜因素,影響研究結(jié)果的準確性。
確定反映試驗效應(yīng)的指標以后,還要規(guī)定指標觀察的常規(guī)方法,如觀察方法、標準、時間、記錄方法及記錄格式等。指標的觀察或測量應(yīng)避免偏性,否則會影響結(jié)果的比較和分析。有些總體表現(xiàn)(氣色、精神狀態(tài)、營養(yǎng)狀態(tài)等)、主觀癥狀(疼痛、抑郁、焦慮等)、動物行為學(xué)變化(活躍與否、異常行為等)及某些形態(tài)變化(如器官外觀、動物毛色、紅腫、潰爛等),這些指標的判斷帶有主觀性,研究者的心理常偏向于陽性結(jié)果,醫(yī)生常偏向于新療法組。
如果試驗效應(yīng)的觀察帶有偏性,會影響結(jié)果的比較和分析。為了消除或最大限度地減少這種偏性,有三種解決途徑:一是通過培訓(xùn)來掌握統(tǒng)一評價標準。二是在試驗設(shè)計時常采用盲法(blind method),單盲法(single blind method):僅受試對象不知道自己被分在哪一組;雙盲法(double blind method):受試對象和試驗執(zhí)行者均不知道受試對象被分在哪一組;三盲法(triple blind method):受試對象、試驗執(zhí)行者和統(tǒng)計分析人員三者均不知道受試對象被分在哪一組。雙盲法和三盲法在臨床試驗中應(yīng)用非常廣泛。三是通過一些精心設(shè)計的量表,全面度量某些方面的情況,以便取代簡單的提問,有利于提高結(jié)論的可信度。
6.1一個觀測時間點的確定
通常,當各組受試對象接受特定的處理后,需要在一個恰當?shù)臅r間點上觀測指標的取值,問題是如何確定這個“最佳時間點”。這需要結(jié)合基本常識、專業(yè)知識和必要的預(yù)試驗結(jié)果來粗估計處理因素發(fā)揮作用的時間長短,再參考有經(jīng)驗的同行或?qū)<业囊庖姡?jīng)過深思熟慮后確定下來。
6.2多個觀測時間點的確定
在實際科研工作中,有時很難找準一個最恰當?shù)挠^測時間點。比如,堅持鍛煉身體有利于人身體健康,用不同方式鍛煉多長時間后,觀測身體素質(zhì)好壞合適呢?這里很難給定一個具體的時間段,此時應(yīng)多選擇幾個時間點,并且時間點之間的間隔也要慎重考慮后才能確定。有些試驗因素產(chǎn)生試驗效應(yīng)很快,此時觀測指標取值的時間間隔就應(yīng)短一些;而有些試驗因素產(chǎn)生試驗效應(yīng)很慢,此時觀測指標取值的時間間隔就應(yīng)長一些。具體短到什么程度、長到什么程度,必須結(jié)合基本常識、專業(yè)知識和預(yù)試驗結(jié)果來綜合考慮后再確定。
7.1指標選取中常見的問題及對策
在臨床科研(特別是心理測量、精神衛(wèi)生研究和中醫(yī)中藥研究等)中,就如何選擇觀測指標這一環(huán)節(jié)來看,有如下普遍存在且不容忽視的問題:第一,研究者要么羅列出幾十項觀測指標,且不告知哪些是主要的療效性與安全性指標、哪些是次要的療效性與安全性指標;第二,要么運用幾十項、甚至上百項內(nèi)容的“測量量表”,并采用量表中多項得分之和作為主要評價指標的觀測值。
第一種做法的不妥之處在于:在眾多指標中分不清主次,導(dǎo)致“眉毛胡須一把抓”和“出現(xiàn)互相矛盾的分析結(jié)果”等混亂局面和無法作出肯定結(jié)論的尷尬結(jié)局;第二種做法的不妥之處在于從表面上看,采用量表總評分反映每位受試者的試驗效應(yīng)似乎是合情合理的,其實不然,因為量表中有些項目是高優(yōu)指標(即指標取值越大越好),有些項目是低優(yōu)指標(即指標取值越小越好);另外,眾多指標彼此之間的重要性程度不同,如某兩項指標均得8分,但反映患者病情的實際改善程度可能相差很多。
由于上述兩方面原因,對量表中的幾十項、甚至上百項內(nèi)容所得分值簡單求和作為主要評價指標的取值,其科學(xué)性與合理性難免受到質(zhì)疑。
比較科學(xué)且具有可操作性的做法是:結(jié)合基本常識和專業(yè)知識,并匯集眾多同行專家的意見和建議,從眾多的療效指標中篩選出1~2個主要指標,同樣,從眾多的安全性指標中篩選出1~2個主要指標,其他指標一律視為次要指標。若實在無法找出少量的主要指標,可找出5~10個相對重要的指標,先對它們進行“趨同化處理”,即將它們都轉(zhuǎn)變成“高優(yōu)指標(如治愈率)”或“低優(yōu)指標(如死亡率)”,再采用綜合評價方法[5-6]將它們合并成一個復(fù)合型的“主要指標”。
7.2觀測指標的時間點選擇不合適
例如,在一個關(guān)于某感冒藥臨床試驗的療效與安全性評價的臨床試驗資料中,設(shè)計者將評價療效的時間點定在服藥后2周末。請問:妥否?
【解說】顯然,觀測指標取值的時間點選得不合適。因為感冒是常見的小毛病,很多人感冒后不接受任何藥物治療,1周之后就自愈了。服藥后2周再來觀測療效,試驗組與對照組的“療效”可能非常接近了。即便試驗藥與對照藥療效明顯不同,到2周末,自然就把“自愈”的效應(yīng)也包括進去了。所以,在這個臨床試驗研究項目中,可能比較恰當?shù)挠^測時間點為服藥后“1周末”。
下面有一個出給學(xué)生做的考題,其中,部分學(xué)生給出的答案令人啼笑皆非。
統(tǒng)計學(xué)老師曾出過這樣一道統(tǒng)計學(xué)考題:為了通過試驗研究,證明“早睡早起身體好”的古訓(xùn)是否正確,請寫出試驗設(shè)計方案。
【解說】很多考生根據(jù)統(tǒng)計學(xué)教科書和自己學(xué)習(xí)試驗設(shè)計知識后的體會,寫出了初步的試驗設(shè)計方案。其中,在確定觀測主要評價指標(假定為肺活量)的時間點這個問題上,相當多的考生給出的答案是“試驗開始后2、4、6、8、10、12、14、16、18、20小時”觀測結(jié)果。
這樣確定的時間點是沒有實用價值的!因為身體素質(zhì)的提高與否,是一個比較緩慢的過程,不可能鍛煉后2小時就產(chǎn)生“效應(yīng)”,時間間隔為2小時,也是不切合實際的。
試驗效應(yīng)(更具體地說,即觀測指標)是試驗設(shè)計三要素之一,其實,它也是調(diào)查研究中的重要要素之一。任何一個沒有觀測指標的研究項目都是沒有實際意義的,然而,即使有了觀測指標,研究結(jié)果也不一定有意義。本文對與“觀測指標”有關(guān)的內(nèi)容作了比較系統(tǒng)的歸納和總結(jié),因篇幅所限,可能還不盡完善。需要時,讀者還可參考有關(guān)文獻[7-10]。
[1]郭永芳,周小東,付華斌,等.改良電痙攣治療對精神分裂癥患者血清細胞因子及C-反應(yīng)蛋白水平的影響[J].四川精神衛(wèi)生,2015,28(2):119-122.
[2]牛亞杰,楊少杰,楊可冰,等.西酞普蘭合并改良電休克治療對抑郁發(fā)作的療效及認知功能的影響[J].四川精神衛(wèi)生,2015,28(2):123-126.
[3]韓勇,卞清濤.氯氮平聯(lián)合阿立哌唑?qū)﹂L期住院精神分裂癥患者療效及認知功能的影響[J]. 四川精神衛(wèi)生,2015,28(2):131-133.
[4]胡良平.實用醫(yī)學(xué)統(tǒng)計學(xué)[M].北京:金盾出版社,2014:1-11.
[5]胡良平.科研設(shè)計與統(tǒng)計分析[M].北京:軍事醫(yī)學(xué)科學(xué)出版社,2012:469-486.
[6]孫振球.醫(yī)學(xué)統(tǒng)計學(xué)[M].北京:人民衛(wèi)生出版社,2002:373-396.
[7]胡良平,王琪,毛瑋,等.如何正確把握實驗設(shè)計的三要素[J].中國骨傷,2009,22(4):324-326.
[8]王琪,胡良平.試驗設(shè)計的三要素[J].藥學(xué)服務(wù)與研究,2010,10(2):85-88.
[9]胡良平,關(guān)雪.科研課題的研究設(shè)計與統(tǒng)計分析-如何正確把握試驗設(shè)計的三要素[J].中華腦血管病雜志(電子版),2010,4(4):46-50.
[10] 胡良平.面向問題的統(tǒng)計學(xué)——(1)科研設(shè)計與統(tǒng)計基礎(chǔ)[M].北京:人民衛(wèi)生出版社,2012:42-89.
(本文編輯:唐雪莉)
To correctly hold the essentials of "Three Key Points" of the clinical trial design of mental health:Part Ⅲ the "outcomes"
GUHeng-ming,HULiang-ping*
(ConsultingCenterofBiomedicalStatistics,AcademyofMilitaryMedicalSciences,Beijing100850,China*CorrespondingAuthor:HULiang-ping:E-mail:lphu812@sina.com)
To explain clearly that the meanings and essentials of "outcomes" should be grasped correctly, when conducting the clinical trial design of mental health. Starting from the basic common sense, and based on the characteristics of mental health study, in what way it can be considered to correctly grasp the "outcomes" by searching and finding an approach to this research field. By combining the features with some real examples in the specialty of mental health, the following results acquired: Need to master the following five aspects when conducting the clinical trial design of mental health.①The classification of outcomes; ②The selection of outcomes; ③The method for measuring the values of outcomes; ④The determination of measuring time of outcomes; ⑤The determination of measuring times.It is an important link to improve the quality of clinical trials to correctly hold the previous five aspects, which is to seize the essence of the issue on answering the question of how to determine the outcomes.
Mental health; The design of clinical trial; Outcomes;Sensitivity; Specificity
R195.1
A
10.11886/j.issn.1007-3256.2016.03.004
2016-02-18)