董秀玥 趙瑞芹
1北京協(xié)和醫(yī)學(xué)院,中國(guó)醫(yī)學(xué)科學(xué)院腫瘤醫(yī)院放療科,中華醫(yī)學(xué)會(huì)雜志社《中華放射腫瘤學(xué)雜志》編輯部,北京,100021;2中國(guó)醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所《醫(yī)學(xué)研究雜志》編輯部,北京,100020
?
臨床醫(yī)學(xué)文獻(xiàn)中的模糊信息分析與對(duì)策研究
董秀玥1趙瑞芹2
1北京協(xié)和醫(yī)學(xué)院,中國(guó)醫(yī)學(xué)科學(xué)院腫瘤醫(yī)院放療科,中華醫(yī)學(xué)會(huì)雜志社《中華放射腫瘤學(xué)雜志》編輯部,北京,100021;2中國(guó)醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所《醫(yī)學(xué)研究雜志》編輯部,北京,100020
摘要臨床醫(yī)學(xué)文獻(xiàn)中的“模糊”信息不同于制假卻嚴(yán)重影響了文獻(xiàn)的質(zhì)量。本文從臨床醫(yī)學(xué)文獻(xiàn)入手,發(fā)現(xiàn)存在“模糊”信息如下:①組間資料分布、討論比較過(guò)程中的可比性問(wèn)題;②隨訪過(guò)程中的隨訪時(shí)間、隨訪率問(wèn)題;③檢驗(yàn)結(jié)果與圖形選取上不夠具體和準(zhǔn)確。就如何杜絕“模糊”提出信息應(yīng)注意的地方如下:①組間資料分布是否存在偏倚,是否滿(mǎn)足相同標(biāo)準(zhǔn);②要重視隨訪過(guò)程中實(shí)際樣本為提升文獻(xiàn)質(zhì)量,本文數(shù)量;③應(yīng)交代具體P值,并依據(jù)橫坐標(biāo)變量性質(zhì)來(lái)選擇不同的圖形。
關(guān)鍵詞臨床醫(yī)學(xué)文獻(xiàn); 文獻(xiàn)質(zhì)量; “模糊”信息
中國(guó)共產(chǎn)黨年十六次代表科學(xué)研究究大會(huì)以來(lái)由于科學(xué)研究領(lǐng)域更加重視科技發(fā)展與創(chuàng)新,科技期刊得以飛速發(fā)展。在1978年“文革”后恢復(fù)出版的科技期刊有780余種,到2007年底我國(guó)大陸科技期刊已經(jīng)達(dá)到約5100種,增長(zhǎng)了5.5倍,文獻(xiàn)數(shù)量得到大幅增加。然而在中國(guó)科技期刊文獻(xiàn)數(shù)量增快的同時(shí),文獻(xiàn)之間的質(zhì)量差距較大[1]。醫(yī)學(xué)期刊同樣也存在上述問(wèn)題。因此,如何縮小文獻(xiàn)質(zhì)量差距是當(dāng)下一項(xiàng)重要的研究?jī)?nèi)容。本文著眼于臨床醫(yī)學(xué)文獻(xiàn),提出通過(guò)不斷把好文獻(xiàn)質(zhì)量關(guān)的方法來(lái)杜絕文獻(xiàn)中的“模糊”信息,從而來(lái)提升文獻(xiàn)質(zhì)量和影響力。
1 臨床醫(yī)學(xué)文獻(xiàn)中的可比性問(wèn)題分析
所謂可比性,是指組間資料分布是否存在偏倚,是否滿(mǎn)足相同標(biāo)準(zhǔn),否則比較就毫無(wú)意義和價(jià)值。因此,首先要交代清楚入組條件和排除標(biāo)準(zhǔn),然后對(duì)組間資料分布進(jìn)行差異性檢驗(yàn)。當(dāng)可比性檢驗(yàn)結(jié)果顯示組間資料分布無(wú)差異后,方可進(jìn)行組間臨床治療效果的比較。但在部分文獻(xiàn)中存在以下幾種現(xiàn)象:①缺乏組間詳細(xì)資料分布,可比性檢驗(yàn)無(wú)從談起;②缺乏重要資料分布檢驗(yàn),因此可比性檢驗(yàn)結(jié)果不完善;③籠統(tǒng)地說(shuō)組間具有可比性,無(wú)詳細(xì)資料分布比較結(jié)果。部分“模糊”文獻(xiàn)存出上述情況,主要表現(xiàn)在文獻(xiàn)的科學(xué)性嚴(yán)重缺失。因此要特別留意文獻(xiàn)中有關(guān)組間資料分布的描述是否完整,組間資料分布是否均衡,特別是那些可能影響最終結(jié)果的因素是否已考慮在內(nèi)。
另外,可比性問(wèn)題還包含在文獻(xiàn)所討論的內(nèi)容中。在討論中常常會(huì)將作者與其他研究者的研究結(jié)果進(jìn)行簡(jiǎn)單比較,這是模糊滋生的土壤,實(shí)際上應(yīng)該仔細(xì)對(duì)文獻(xiàn)內(nèi)容進(jìn)行閱讀,考量作者的研究時(shí)間與方法是否具有可比性。比如研究方法的不同(前瞻性與回顧性),研究時(shí)間的不同(起止點(diǎn)差異),隨訪時(shí)間不同(起止點(diǎn)差異),其研究結(jié)果之間也就無(wú)可比性。應(yīng)交代清楚各自研究方法、研究時(shí)間和隨訪時(shí)間內(nèi)容,將各自研究結(jié)果清晰羅列出來(lái),讓讀者清楚地看到研究方法的優(yōu)劣以及研究的可比性。
2 臨床醫(yī)學(xué)文獻(xiàn)中的隨訪問(wèn)題分析
由于大部分臨床腫瘤治療學(xué)的研究文獻(xiàn)是回顧性成組研究,因此其存在的問(wèn)題也非常突出。
①前瞻性隨機(jī)對(duì)照研究中的樣本數(shù)問(wèn)題。由于患者是隨機(jī)選好后開(kāi)始進(jìn)行不同方法的治療,隨訪的起點(diǎn)相近,隨訪截止時(shí)隨訪時(shí)間范圍也相近,一般不用隨訪時(shí)間中位數(shù)表述,比如在2000年2月1日隨機(jī)入組200例患者,每例患者均要經(jīng)歷的1個(gè)月左右的治療,到5月1日全部治療結(jié)束,假如每例患者隨訪開(kāi)始于治療結(jié)束后;可見(jiàn)隨訪開(kāi)始時(shí)間最多只相差3個(gè)月,但分別到2003、2005、2008、2010年的5月1日后,200例患者均能滿(mǎn)足3、5、8、10年的隨訪時(shí)間(這里要注意的是,不是隨訪3、5、8、10年時(shí)除死亡外或失訪例數(shù)后的存活例數(shù)),計(jì)算的3、5、8、10年生存率等均是200例樣本數(shù)的結(jié)果(除外某年度因失訪患者被刪除對(duì)樣本總數(shù)的影響)。
圖1滿(mǎn)隨訪時(shí)間的例數(shù)分布情況
②回顧性對(duì)照研究中的樣本數(shù)問(wèn)題。因?yàn)槿虢M病例資料的隨訪起點(diǎn)不一致,有的甚至相差10年多,在隨訪截止時(shí)隨訪時(shí)間范圍也會(huì)相差很多。比如回顧分析2000年2月1日至2010年5月1日間入組的200例患者資料,到2012年時(shí)其隨訪時(shí)間可以為2個(gè)月至12年;可見(jiàn)隨訪時(shí)間最多可相差11年10個(gè)月,但到2003、2005、2008、2010年的每個(gè)5月1日后,能滿(mǎn)足3、5、8、10年隨訪時(shí)間(這里要注意的是,不是隨訪3、5、8、10年時(shí)除外死亡或失訪例數(shù)后的存活例數(shù))的患者均不足200例,計(jì)算的3、5、8、10年生存率等均不是200例樣本的結(jié)果。這樣就引出問(wèn)題了,如何知道3、5、8、10年生存率等的分母是多少,即是多少樣本數(shù)量計(jì)算的結(jié)果。其實(shí)最科學(xué)的做法是具體交代清楚滿(mǎn)足3、5、8、10年隨訪時(shí)間的例數(shù),即各年度實(shí)際樣本數(shù)量。如果是繪制生存曲線則應(yīng)將每年入組研究的患者數(shù)交代清楚,并在圖題內(nèi)用括號(hào)標(biāo)出,如隨訪時(shí)間滿(mǎn)1、2、3、4、5年患者分別為x1、x2、x3、x4、x5例。另外,在回顧性成組研究中也應(yīng)不用“中位生存時(shí)間”,因?yàn)槊磕甓壬媛室呀?jīng)具體客觀反映了生存情況,因此,它不平等對(duì)待了不同時(shí)間起點(diǎn)而相同時(shí)間終點(diǎn)的情況。這好比把不是在同一起跑線的人的同一終點(diǎn)成績(jī)進(jìn)行比較,把沒(méi)有可比性的分?jǐn)?shù)綜合一起計(jì)算平均成績(jī)。
③中位隨訪時(shí)間中的樣本數(shù)問(wèn)題。由于國(guó)外期刊在交代隨訪時(shí)間范圍時(shí),常常也交代“中位隨訪時(shí)間”。這是因?yàn)殡S訪時(shí)間資料分布屬于非正態(tài)分布,在用平均數(shù)表示時(shí),不能用簡(jiǎn)單的算數(shù)平均數(shù)、幾何平均數(shù)算法,故采用了中位數(shù)的形式。其實(shí)中位隨訪時(shí)間的稱(chēng)謂并不科學(xué),它實(shí)際是隨訪時(shí)間的中位數(shù),是描述隨訪時(shí)間數(shù)據(jù)中的平均值概念,其對(duì),應(yīng)的樣本數(shù)量也必然分布在最小值至最大值之間,如圖1。但國(guó)內(nèi)有些讀者誤認(rèn)為“中位隨訪時(shí)間”是平均每個(gè)患者的隨訪時(shí)間,比如隨訪時(shí)間為2個(gè)月至12年,中位數(shù)是6年多,讀者卻誤讀為每個(gè)患者隨訪時(shí)間都大于6年,不用交代6年之前的每年實(shí)際隨訪的樣本數(shù)量。因此在科學(xué)研究中應(yīng)務(wù)必重視和認(rèn)真對(duì)待“中位隨訪時(shí)間”的概念和應(yīng)用,特別是“中位隨訪時(shí)間”與樣本數(shù)量之間的關(guān)系。實(shí)際上年度生存率等都是具體數(shù)據(jù)計(jì)算結(jié)果,樣本數(shù)量大小反映了結(jié)果的準(zhǔn)確性、科學(xué)性高低。因此,重視交代滿(mǎn)隨訪年的樣本數(shù)量和隨訪率,遠(yuǎn)比重視交代隨訪時(shí)間更加重要。
圖2正確使用線段形式示例
隨訪率=(1-失訪人數(shù))/總?cè)藬?shù)[2]。關(guān)注失訪數(shù)的目的也是要反映樣本數(shù)量。另外,強(qiáng)調(diào)隨訪率的清晰描述,不僅是為了描述所計(jì)算的年度生存率等指標(biāo)所需的樣本數(shù)量[5],同時(shí)也為了防止產(chǎn)生數(shù)據(jù)偏移現(xiàn)象而影響統(tǒng)計(jì)結(jié)果,因此隨訪率必須保持在90%以上[3]。此外,由于出院時(shí)間越長(zhǎng),失訪率可能越高,分母項(xiàng)樣本數(shù)量減少幅度就越小,因此應(yīng)逐年計(jì)算隨訪率(甚至詳細(xì)到不同組別內(nèi)),并交代隨訪時(shí)間滿(mǎn)后逐年的樣本數(shù)量,只有這樣讀者才能徹底清楚所計(jì)算的逐年生存率的實(shí)際樣本數(shù)量(實(shí)際樣本數(shù)量=逐年計(jì)算隨訪率×隨訪時(shí)間滿(mǎn)逐年樣本數(shù)量)。
3 臨床醫(yī)學(xué)文獻(xiàn)中檢驗(yàn)結(jié)果與圖形選取問(wèn)題分析
改革開(kāi)放以前,國(guó)內(nèi)對(duì)文獻(xiàn)統(tǒng)計(jì)檢驗(yàn)的意識(shí)淡薄,出現(xiàn)將P<0.05與P>0.05意義混淆現(xiàn)象,對(duì)統(tǒng)計(jì)學(xué)不重視還表現(xiàn)在,沒(méi)有真正進(jìn)行過(guò)檢驗(yàn)就隨意寫(xiě)上P<0.05或P>0.05,“模糊”了統(tǒng)計(jì)學(xué)的意義和價(jià)值。為了杜絕這種現(xiàn)象,中華醫(yī)學(xué)會(huì)系列雜志要求作者提供獲得P值前的統(tǒng)計(jì)量值(t、Z、F、χ2值等),最后甚至要求提供具體P值[4]。
圖3正確使用直方圖形式示例
圖4直方圖錯(cuò)用線段形式表示示例
準(zhǔn)確選擇圖像表達(dá)形式是正確表達(dá)研究結(jié)果的基礎(chǔ),當(dāng)橫坐標(biāo)表達(dá)的是連續(xù)變量時(shí)應(yīng)使用線段表述,見(jiàn)圖2[5]。當(dāng)橫坐標(biāo)表達(dá)的不是連續(xù)變量時(shí)應(yīng)使用條形圖表述,見(jiàn)圖3。文獻(xiàn)中有時(shí)存在橫坐標(biāo)不是連續(xù)變量時(shí)使用了線段表述的情況,見(jiàn)圖4, 這就“模糊”了圖形所要表達(dá)的意義和價(jià)值。錯(cuò)誤的表述方式會(huì)誤導(dǎo)讀者。原來(lái)是比較相同季度下東、西、北部間差異以及各部在不同季節(jié)時(shí)的差異,令讀者誤區(qū)解為是比較東、西、北部隨不同季度各自變化情況以及其間差異。
4 小結(jié)
臨床醫(yī)學(xué)文獻(xiàn)中的“模糊”信息與文獻(xiàn)制假有著根本不同之處,前者是真實(shí)的內(nèi)容,只是寫(xiě)作過(guò)程中忽視了細(xì)致、嚴(yán)謹(jǐn)?shù)淖黠L(fēng);而后者則是品德上的問(wèn)題,特別是高水平的制假文獻(xiàn)看不出來(lái)“模糊”問(wèn)題,危害更大。因此,應(yīng)首先排除造假文獻(xiàn)的可能,再考慮如何杜絕“模糊”文獻(xiàn)。要使文獻(xiàn)整體質(zhì)量得到提升,首先應(yīng)從杜絕和制止“模糊”信息入手,準(zhǔn)確識(shí)別制假與“模糊”文獻(xiàn)的區(qū)別,正確理解“模糊”文獻(xiàn)的定義,做到有的放矢,杜絕發(fā)表“模糊”文獻(xiàn),從整體上提升文獻(xiàn)水平。
參考文獻(xiàn)
[1]馮長(zhǎng)根.中國(guó)科技期刊數(shù)量增幅快質(zhì)量差距不小[EB/OL][2013-3-19].http://scitech.PeoPle.com.cn/GB/131715/8233749.html.
[2]洪明晃.隨訪率應(yīng)逐年計(jì)算[J].中國(guó)腫瘤,1997,6(6):27.
[3]隊(duì)列研究和病例對(duì)照研究中的偏倚及控制 [EB/OL][2013-5-13].http://blog.renren.com/share/165413505/4270424386.
[4]中華醫(yī)學(xué)會(huì)雜志社.中華醫(yī)學(xué)會(huì)第五次雜志工作會(huì)議資料匯編[M].北京:中華醫(yī)學(xué)會(huì)雜志社,2009:143.
[5]李暉.實(shí)用醫(yī)學(xué)統(tǒng)計(jì)方法[M].鄭州:河南大學(xué)出版社,1989.
Analysis and Countermeasure Research on "Vague" Phenomenon of Clinical Medical Literature
Dong Xiuyue et al
EditorialBoardofChineseJournalofRadiationOncology,ChineseMedicalAssociation
PublishingHouse,ChineseAcademyofMedicalSciences,Beijing, 100021
AbstractClinical medical literature in “vague” phenomenon is different from counterfeits. but it seriously offects the quality of clinical medical literature. I study with a clinical oncology literature and discovered “vague” phenomenon, they are the comparability problem of grouped data distribution, comparing of discuss; the problem of follow-up time and follow-up rate; Test results and graphics were selected on the lack of specific and accurate. In order to enhance the quality of clinical medical literature,this paper giues specific recommendations and methods, they are: grouped data distribution whether there is bias, whether to meet the same standards; To pay attention to the actual number of samples during follow-up; To explain the specific value of P, and based on the abscissa variable properties to choose a different graphics. I hope to cause widespread concern and play a catalyst role.
Key WordsClinical Medicine Literature; Literature Quality; “Vague” Information
(收稿日期2014-09-01;編輯馮達(dá))
中圖分類(lèi)號(hào)R195.1
文獻(xiàn)標(biāo)識(shí)碼A
DOI:10.13723/j.yxysh.2015.01.015