閆娟,李國琪
摘 要:檢索關于“醫(yī)學稿件統(tǒng)計學方法誤用”主題的中文研究論文,對論文中提及的統(tǒng)計學誤用方法進行系統(tǒng)分析并匯總,總結關于該主題論文的分布規(guī)律和發(fā)展脈絡,并提出對該問題的應對策略。
關鍵詞:醫(yī)學稿件;統(tǒng)計學方法;誤用;評價
中圖分類號:C81 文獻標識碼:A 文章編號:1672-8122(2013)02-0058-02
醫(yī)學統(tǒng)計學為醫(yī)學研究提供了手段和方法,已經廣泛地應用到醫(yī)學科學研究中,是醫(yī)學研究不可分割的部分。據(jù)研究,有86%的文章都使用了統(tǒng)計學方法[1]。統(tǒng)計學方法應用的正確與否,直接關系到研究的結果,然而醫(yī)學稿件中的統(tǒng)計學方法誤用的情況卻較多,有研究對應用了統(tǒng)計學分析的1371篇醫(yī)學稿件研究發(fā)現(xiàn),在統(tǒng)計學處理方面完全符合要求的只有26.7%[2]。本文通過對以往發(fā)表的關于醫(yī)學稿件中統(tǒng)計學方法誤用方面的文獻進行系統(tǒng)分析,總結歸納出主要的統(tǒng)計學問題,并提出應對措施。
一、研究對象和方法
以“醫(yī)學”、“期刊”、“稿件”、“文章”、“論文”、“統(tǒng)計學方法”為關鍵詞,在中國生物醫(yī)學文獻光盤數(shù)據(jù)庫(CBM)、中文科技期刊數(shù)據(jù)庫(維普)、中國知網(CNKI)及萬方數(shù)據(jù)上進行檢索。檢索到關于醫(yī)學稿件統(tǒng)計學方法誤用相關主題的論文題錄58篇,將題錄導入NoteExpress2.0軟件,通過逐條閱讀題錄的題目、關鍵詞和摘要,結合本研究內容制定的篩選標準,最終獲取到密切相關文獻的全文40篇。其中關于醫(yī)學論文統(tǒng)計學方法誤用問題方面的研究性論文29篇,關于醫(yī)學論文統(tǒng)計學方法正確應用方面的繼續(xù)教育性質論文11篇。通過逐篇閱讀,提取文中所提及的有關論文統(tǒng)計學方法方面的信息。
二、文章基本信息分析
1.研究性論文時段分布。29篇研究論文中,6篇發(fā)表于上世紀90年代,最早的一篇《關于論文中數(shù)據(jù)的統(tǒng)計學處理問題》發(fā)表于1991年3期的《中華護理雜志》。23篇發(fā)表于2000—2011年,其中近5年發(fā)表的論文占69.6%(16/23)。
2.研究性論文發(fā)表刊物分布及論文作者情況。8篇發(fā)表于編輯出版專業(yè)刊物《編輯學報》和《中國科技期刊研究》上,其他主要發(fā)表在醫(yī)學院學報、預防醫(yī)學雜志及其他醫(yī)學類專業(yè)期刊上。論文第一作者專業(yè)為編輯學者14人,占48.3%(14/29);為流行病和衛(wèi)生統(tǒng)計者8人,占27.6%(8/29)。
3.研究性論文選題分布。29篇中有25篇是關于醫(yī)學稿件統(tǒng)計學問題的專題研究,占86.2%,其他4篇是兼論,還提及了科研設計、表格設計及論文投稿過程中的其他問題。從研究方式來看,有10篇(34.5%)是通過對以往發(fā)表論文進行調查研究的客觀總結,其他的多是作者根據(jù)自己閱讀文獻或審理稿件時發(fā)現(xiàn)的統(tǒng)計學問題,梳理后的經驗總結。
4.繼教論文情況分析。11篇關于醫(yī)學統(tǒng)計學的繼教論文中,有7篇刊登于2000年之后。8篇是雜志社邀請的有關專家書寫的專題論文,多是連續(xù)刊登多個專題,刊登在“教育園地”和“繼續(xù)醫(yī)學教育”等欄目;余下3篇是期刊編輯部在自己期刊上發(fā)表的有關醫(yī)學統(tǒng)計學方面的繼教文章,多刊登在“讀者·編者·作者”欄目。
三、醫(yī)學稿件中常見的統(tǒng)計學問題
1.將t檢驗視為處理定量資料的“萬能鑰匙”。主要分為兩種情況,一種是將2組t檢驗用于方差分析后的組間兩兩比較,這樣會增加Ⅰ型錯誤的概率[3],致使假陽性結果。這是最常見的統(tǒng)計學方法誤用類型,幾乎所有關于統(tǒng)計學方法誤用的文章都提到了這個問題。滕洪松等[4]通過對6所學報期刊3個年度的論著文章進行分析發(fā)現(xiàn),這種誤用情況占所有誤用文章的44.4%~60.5%,平均達半數(shù)以上。沈進等[5]對544篇論著的統(tǒng)計學方法研究發(fā)現(xiàn),該種錯誤占63.09%,可見此種誤用類型的普遍性。另一種是將成組t檢驗用于配對設計資料。因為配對資料已經從設計時盡量減少了實驗誤差,本該用配對t檢驗的資料若還用成組t檢驗,無疑會增大了混雜因素,降低了實驗的精準度和結果的可信度。還有研究提到了將t檢驗和χ2檢驗相互誤用的情況,如劉英等[6]舉例,比較兩種治療方法的遠期臨床不良事件發(fā)生情況,應采用率表示,分析應采用χ2檢驗,而有的研究卻誤用了t檢驗,從而導致結果完全不同。隨著多數(shù)作者科研水平的提高,這種“簡單錯誤”已經較少見。
2.將χ2檢驗視為處理定性資料的“通用方法”。常見的誤用類型有:(1)誤用χ2檢驗代替確切概率法。當四格表資料的n<40或最小理論頻數(shù)<1時,應該用確切概率法[7]。但許多研究都沒有考慮到這個因素,而簡單用了四格表χ2檢驗,劉英等[6]比較了2種藥物治療心絞痛的療效,若正確的使用確切概率法,結果顯示差異無統(tǒng)計學意義,若錯誤的使用χ2檢驗,則會得到相反的結果。(2)誤用χ2檢驗代替秩和檢驗和Ridit分析。若是行×列表資料,且表格一個方向是等級資料,當?shù)燃墧?shù)大于3時,應該用秩和檢驗,但很多研究都用了χ2檢驗,萬瑜等[8]將2002—2006年《中華骨科雜志》5年發(fā)表的論著文獻中常見的統(tǒng)計學方法誤用類型進行分析發(fā)現(xiàn),行×列表資料誤用χ2檢驗這種類型占所有統(tǒng)計學誤用文獻的15.1%,是除方差分析誤用t檢驗之外的排名第二的誤用類型,和滕洪松等[4]的研究結果基本一致。
3.誤用單因素方差分析。當定量資料屬于2個因素 2個水平的組合設計時, 應該采用析因設計資料的方差分析,而不能簡單化為單因素4個水平(多水平)設計資料的方差分析[2]。當資料屬于重復測量定量資料時,應該采用重復測量的兩因素設計定量資料的方差分析。當需要對多因素設計中的某個因素各水平下的平均值進行兩兩比較時,若因素之間的交互作用項具有統(tǒng)計學意義,不應簡單地采用單因素多水平設計定量資料的q檢驗法、LSD-t檢驗法或Dunnett-t檢驗法,而應建立在相應設計定量資料的方差分析基礎之上[9]。上述t檢驗、χ2檢驗及方差分析是最基本最常用的統(tǒng)計推斷方法,但據(jù)統(tǒng)計,出現(xiàn)錯誤最多的就是這些最基本的概念和經典的統(tǒng)計方法[10]。除此之外,還有很多關于統(tǒng)計學指標和結果表述等問題,都會影響研究結果的正確表達。
4.統(tǒng)計學指標運用不當。(1)率與構成比的誤用。如作者統(tǒng)計分析某市某年乙型腦炎不同年齡段的發(fā)生情況,將患者按≤3歲、3~9歲、≥10歲3個年齡階段,分析不同年齡段患者所占比率,即構成比,而非率[2]。(2)患病率與發(fā)病率混淆誤用。發(fā)病率是指觀察期內(年、季、月等)新發(fā)生某病的例數(shù)與同期平均人口數(shù)之比,強調在觀察期內的新發(fā)病例數(shù);而患病率則指觀察時點某病的現(xiàn)患病例數(shù)與該時點人口數(shù)之比,強調的是該觀察時點上某病的現(xiàn)患(新、舊病例)情況。然而在論文撰寫中,許多作者沒能正確區(qū)分觀察、統(tǒng)計的時間,將二者混淆誤用[11]。(3)病死率和死亡率的混淆誤用。死亡率=死亡人數(shù)/同期人口數(shù),是觀察人群中某病的死亡頻率,反映了觀察人口因某病的死亡水平,是一個人口學指標,一般以10萬分率表示;而病死率=死亡人數(shù)/患某病的患者總數(shù),是某病患者中因該病而死亡的頻率,反映了某病的死亡危險性,一般以百分率表示。而部分作者常將某病住院病死率誤認為某病的死亡率[12]。
5.統(tǒng)計學結果表述和解釋不當。對于統(tǒng)計結果的展示,一般要求應給出具體的統(tǒng)計量和P值,而很多文獻只標明P>0.05,P<0.05,而未給出統(tǒng)計量,這是最常見的統(tǒng)計學錯誤[13]。還有對統(tǒng)計學結果的解釋,很多文章易將統(tǒng)計學結果和專業(yè)結論混淆,將P>0.05解釋為“差異不顯著”,P<0.05為“差異顯著”,P<0.01為“差異非常顯著”,這都是不對的[14]。P<0.01只能說是有此樣本推斷總體的把握性更大,P值越小,就越有理由認為被比較的均數(shù)或率之間有差異。至于差異有多大,要由它們之間實際相差有多大再結合專業(yè)知識來確定。
四、研究性論文綜合評價
筆者通過對文章內容分析發(fā)現(xiàn),早期的關于醫(yī)學稿件統(tǒng)計學方面的文章內容相對較淺,涉及的統(tǒng)計分析方法簡單,后期的文章除了談及常見的統(tǒng)計學問題外,還涉及到了科研設計和較復雜的統(tǒng)計學方法。如劉英等[6]提及在科研設計階段要注意樣本量和“隨機、對照、均衡、重復”四大原則等,在統(tǒng)計學分析時,談到了析因設計和重復測量方差分析。關于此主題文章的發(fā)展趨勢,基本是隨著稿件資料的復雜和設計的完善,統(tǒng)計學方法應用正確率逐漸提高,也越來越完善和豐富。從客觀指標被引頻次排名來看,發(fā)表在編輯學報上的關于這一主題的文章被引率較高,見表1。
統(tǒng)計學處理在醫(yī)學科技論文中的地位舉足輕重,統(tǒng)計學方法的正確使用與否直接關系到結果的差異有無統(tǒng)計學意義。因此,應從多方面做起,提高統(tǒng)計學方法的正確使用率。首先,編輯人員應從思想上重視對統(tǒng)計學處理的把關,還應加強統(tǒng)計學專業(yè)知識的系統(tǒng)學習,提高自己的能力,遇到有異議的地方要翻閱資料以求正確解決。其次,可聘請統(tǒng)計專業(yè)的專家給予指導。當然,對于某些稿件來說,上述措施實屬“亡羊補牢”,因為可能最初的實驗設計階段就存在一些問題,致使后期的統(tǒng)計學處理無法滿足研究者的分析需求。這就需要從源頭抓起,提高作者的統(tǒng)計學處理能力。編輯部可以舉辦關于稿件統(tǒng)計學處理的專題培訓班,還可以在期刊上開設相關欄目,對讀者進行系統(tǒng)的繼續(xù)醫(yī)學教育。
參考文獻:
[1] 賴娟,李征,何集篇等.臨床醫(yī)學雜志論著中統(tǒng)計學方法應用的對比研究[J].中國耳鼻咽喉顱底外科雜志,2010(2).
[2] 李霞,張印朋,閆蘇平.醫(yī)學期刊作者來稿統(tǒng)計學應用與表述常見問題分析[J].中國科技期刊研究,2011(1).
[3] 李晶,徐秦,楊愛萍.醫(yī)學論文中的常見統(tǒng)計學問題及其處理[J].新疆醫(yī)科大學學報,2002(2).
[4] 滕洪松,周曉彬.山東省醫(yī)學院校學報論著中統(tǒng)計學方法應用狀況調查[J].預防醫(yī)學情報雜志,2007(6).
[5] 沈進,茍莉,湯潔.生物醫(yī)學期刊的統(tǒng)計學方法應用情況分析[J].中國修復重建外科雜志,2007(5).
[6] 劉英,廖玉華.醫(yī)學論文統(tǒng)計學方法常見問題及對策[J].醫(yī)學信息(上旬刊),2010(6).
[7] 章新生,姚仁斌,劉璐.醫(yī)學稿件中常見統(tǒng)計學方法誤用辨析[J].蚌埠醫(yī)學院學報,2011(6).
[8] 萬瑜,馬駿,張鳳菊.《中華骨科雜志》論著文章統(tǒng)計學方法應用現(xiàn)狀[J].預防醫(yī)學情報雜志,2007(2).
[9] 胡良平.如何合理選擇統(tǒng)計分析方法處理實驗資料[J].中國醫(yī)藥生物技術,2007(1).
[10] 王玖,徐天和,祁愛琴等.醫(yī)學論文統(tǒng)計學誤用及其防范對策[J].編輯學報,2002(6).
[11] 宋雙明.醫(yī)學論文中統(tǒng)計學的幾個問題[J].編輯學報,1998(2).
[12] 金明,周慶泰.醫(yī)學論文中常見的統(tǒng)計錯誤分析[J].蚌埠醫(yī)學院學報,1992(2).
[13] 李永紅.醫(yī)學論文中常見的統(tǒng)計學錯誤與處理[J].海峽預防醫(yī)學雜志,2007(1).
[14] 肖麗娟,孫茂民.醫(yī)學論文中統(tǒng)計學處理常見問題及應對措施[J].編輯學報,2010(6).