張建軍 (《首都醫(yī)科大學(xué)學(xué)報》編輯部,北京 100069)
?
·醫(yī)學(xué)教育·
醫(yī)學(xué)論文寫作中常見的統(tǒng)計學(xué)問題及分析
張建軍(《首都醫(yī)科大學(xué)學(xué)報》編輯部,北京 100069)
【摘要】從實(shí)驗(yàn)設(shè)計、數(shù)據(jù)的統(tǒng)計分析方法、結(jié)果分析以及統(tǒng)計術(shù)語的書寫等方面分析了醫(yī)學(xué)論文中常見的統(tǒng)計學(xué)問題或錯誤,以期對科研人員和醫(yī)學(xué)期刊的編輯人員有所幫助,盡量減少醫(yī)學(xué)論文寫作中的統(tǒng)計學(xué)錯誤,提高論文的學(xué)術(shù)質(zhì)量.
【關(guān)鍵詞】醫(yī)學(xué)論文;統(tǒng)計學(xué);科技期刊
0引言
科學(xué)研究很早就已經(jīng)從簡單的定性分析深入到細(xì)致的定量分析,科研工作者要面對大量的數(shù)據(jù)分析問題,科研數(shù)據(jù)的統(tǒng)計分析結(jié)果直接影響著論文的結(jié)果分析. 只有通過嚴(yán)格縝密的實(shí)驗(yàn)設(shè)計和數(shù)據(jù)分析,才能保證論文的科學(xué)性和可靠性;只有如實(shí)地對研究數(shù)據(jù)進(jìn)行分析,才能真實(shí)反映研究內(nèi)容的本質(zhì);也是通過嚴(yán)格的數(shù)據(jù)分析,才能排除偶然因素對事物內(nèi)在規(guī)律的影響. 所以統(tǒng)計分析的前提必須可靠,要在周密設(shè)計的基礎(chǔ)上收集準(zhǔn)確而完整的原始資料,遵循隨機(jī)抽樣的原則,實(shí)驗(yàn)組間具有可比性并設(shè)置對照組. 不具備可靠的前提,即使進(jìn)行了統(tǒng)計分析,也不能彌補(bǔ)或糾正科研設(shè)計的不足,其研究結(jié)論也缺乏可信度[1]. 因此科研人員一定要選擇正確合適的實(shí)驗(yàn)設(shè)計和數(shù)據(jù)統(tǒng)計方法,才可能保證科研結(jié)果的正確性. 對醫(yī)學(xué)研究來說,醫(yī)學(xué)論文的研究結(jié)果可以說與人類健康息息相關(guān),這就要求醫(yī)學(xué)研究人員在研究中盡量避免出現(xiàn)實(shí)驗(yàn)設(shè)計和數(shù)據(jù)統(tǒng)計方面的錯誤,也要求醫(yī)學(xué)期刊的編輯人員具備一定的醫(yī)學(xué)統(tǒng)計學(xué)知識. 然而,在中國醫(yī)學(xué)論文中存在的統(tǒng)計學(xué)錯誤非常普遍[2],統(tǒng)計學(xué)的誤用率約為80%,即便是國家級基金資助的科研論文其統(tǒng)計學(xué)誤用率也達(dá)到50%[3-4]. 目前,一些醫(yī)學(xué)研究院、所都有專門的統(tǒng)計學(xué)處理機(jī)構(gòu)和人員,可為本單位或外單位提供實(shí)驗(yàn)數(shù)據(jù)的統(tǒng)計分析服務(wù);一些有實(shí)力的醫(yī)學(xué)期刊也擁有專職或者兼職的論文統(tǒng)計學(xué)審稿專家,對論文的統(tǒng)計學(xué)問題進(jìn)行把關(guān). 這些對減少醫(yī)學(xué)論文設(shè)計和寫作過程中的統(tǒng)計學(xué)錯誤有很大幫助,但是一個不可避免的事實(shí)是仍有大量的醫(yī)學(xué)研究人員和編輯部缺乏相應(yīng)的論文統(tǒng)計學(xué)幫助. 作為一門專業(yè)的知識,讓每位科研人員和編輯從業(yè)者都精通統(tǒng)計學(xué),的確是一件比較困難的事情. 不過,在醫(yī)學(xué)論文的寫作中,有一些常見的統(tǒng)計學(xué)問題或者錯誤,卻是我們可以通過學(xué)習(xí),容易掌握并可避免出現(xiàn)的. 本研究擬從實(shí)驗(yàn)設(shè)計、數(shù)據(jù)的統(tǒng)計分析方法、結(jié)果分析以及統(tǒng)計術(shù)語的書寫等方面進(jìn)行闡釋,以期對醫(yī)學(xué)論文乃至科研論文的寫作人員和編輯人員有所幫助和借鑒.
1實(shí)驗(yàn)設(shè)計常見問題及分析
一個完整的研究設(shè)計,其基本內(nèi)容應(yīng)包括研究的目的、意義、研究對象、研究內(nèi)容與方法,還包括研究進(jìn)度及其預(yù)期結(jié)果等. 統(tǒng)計設(shè)計是整個研究中最重要的一環(huán),是研究工作應(yīng)遵循的依據(jù). 實(shí)驗(yàn)設(shè)計要遵循隨機(jī)、對照、重復(fù)和均衡四原則. 醫(yī)學(xué)論文中實(shí)驗(yàn)設(shè)計中存在很多問題,如樣本量不足或者過多、研究對象的背景資料不清楚、樣本缺乏代表性等. 在眾多常見的問題中,以下幾點(diǎn)是更容易發(fā)生且可避免的:①沒有設(shè)置對照組或者對照組設(shè)置不合理;②實(shí)驗(yàn)分組未采用隨機(jī)化;③樣本缺乏代表性;④樣本量達(dá)不到統(tǒng)計分析要求或樣本量過大.
1.1對照組缺乏或者對照組設(shè)置不合理設(shè)立對照是臨床醫(yī)學(xué)科研設(shè)計的核心問題之一,也是描述性研究和分析性研究的主要區(qū)別. 如果缺乏對照或?qū)φ赵O(shè)置不當(dāng),就無法正確分析實(shí)驗(yàn)結(jié)果[5]. 在實(shí)驗(yàn)設(shè)計中、尤其是醫(yī)學(xué)基礎(chǔ)研究和臨床研究中,對照組和實(shí)驗(yàn)組的樣本來源背景要一致,這樣才能保證組間樣本的基礎(chǔ)狀況具有可比性;在一些特殊的實(shí)驗(yàn)中,如配對實(shí)驗(yàn)中,還需要對照組和實(shí)驗(yàn)組的樣本數(shù)量盡量一致,如因取材等原因難以保證一致,也盡量不要差別太大. 在醫(yī)學(xué)論文中,很多對治療性方法進(jìn)行總結(jié)的文章中,往往會忘記設(shè)置對照組,在沒有設(shè)置對照組或者有效對照組的情況下,就僅僅以本院的回顧性病例為基礎(chǔ),根據(jù)治愈率得出某種藥物或治療方法有效等結(jié)論[5].
1.2實(shí)驗(yàn)分組未采用隨機(jī)化隨機(jī)化原則是研究設(shè)計中必須遵循和貫徹的原則,是實(shí)驗(yàn)設(shè)計中避免偏倚和混雜因素最有效的方法. 在實(shí)驗(yàn)過程中其實(shí)會有許多非實(shí)驗(yàn)因素(如一些人為的主觀因素)干擾實(shí)驗(yàn)結(jié)果的科學(xué)性和準(zhǔn)確性,而研究者可能對此還不知情. 為了避免這些隨機(jī)誤差的干擾,就有必要采用隨機(jī)化的辦法來抵消或者盡量減少這些干擾因素的影響. 在很多醫(yī)學(xué)論文中,往往缺乏對樣本隨機(jī)化的分組,只是簡單的隨意分組,難以保證樣本之間的可比性;也或者盡管采用了隨機(jī)化分組和隨機(jī)抽樣,但缺乏對隨機(jī)抽樣方法的具體說明,如采用的是單純隨機(jī)抽樣還是系統(tǒng)抽樣等. 其實(shí),利用隨機(jī)數(shù)字表或者計算機(jī)生成隨機(jī)數(shù)字就可以簡單快捷地完成隨機(jī)抽樣.
1.3樣本缺乏代表性在很多實(shí)際研究中,由于研究對象的總體太大,或者研究對象本身的取材就很難,要得到研究對象的總體是不可能的,這就需要從總體中抽取若干個體組成集合(即樣本)進(jìn)行研究,通過樣本特征來對總體進(jìn)行判斷. 因此,從總體中抽取的每個個體都一定要具有代表性和普遍性,而不是一些特殊個體,否則難以反應(yīng)總體特征. 對臨床研究而言,因?yàn)槭苋肆Α⑽锪Φ葪l件限制很難直接對總體進(jìn)行研究,但臨床研究的結(jié)果直接關(guān)乎人類健康,因此,樣本是否具有代表性,將直接影響研究結(jié)果的適用性[5].
1.4樣本量達(dá)不到統(tǒng)計要求或樣本量過大對任何研究而言,在隨機(jī)分組的前提下,如果能得到更多的樣本,即樣本量越大,組間的非處理因素的均衡性也就越好,樣本統(tǒng)計值也越可靠,更貼近總體特征. 但在實(shí)際研究過程中,當(dāng)樣本量太大時,其實(shí)會給整個實(shí)驗(yàn)和質(zhì)量控制工作帶來很多不必要的困難,同時也會造成不必要的浪費(fèi). 但樣本容量過小,就無法進(jìn)行有效的統(tǒng)計分析,或者統(tǒng)計效能會降低,不能得到準(zhǔn)確和可靠的分析結(jié)果. 同時,我們還要根據(jù)不同的研究對象來確定合適的樣本量. 如對一些特殊病例的研究,總體數(shù)量本來就稀少,要得到一個大樣本的數(shù)據(jù),也就不容易了. 一般來說,醫(yī)學(xué)統(tǒng)計中,樣本容量一般要求在100以上,同時對照組和實(shí)驗(yàn)組樣本量還要盡可能相等或者接近.
2數(shù)據(jù)的統(tǒng)計方法常見問題及分析
實(shí)驗(yàn)設(shè)計的方法直接決定了數(shù)據(jù)采取何種統(tǒng)計學(xué)方法. 因?yàn)槊糠N統(tǒng)計方法都要求數(shù)據(jù)滿足一定的前提和假定,所以論文在實(shí)驗(yàn)設(shè)計的時候,就要考慮到以后將采取哪種數(shù)據(jù)統(tǒng)計方法更可靠. 醫(yī)學(xué)統(tǒng)計方法的錯誤千差萬別,其中最主要的就是統(tǒng)計方法和實(shí)驗(yàn)設(shè)計不符,造成數(shù)據(jù)統(tǒng)計結(jié)果不可靠. 這里列舉一些常見的可以避免的問題和錯誤.
2.1數(shù)據(jù)統(tǒng)計分析方法使用錯誤或不當(dāng)醫(yī)學(xué)論文中,最常見的此類錯誤就是實(shí)驗(yàn)設(shè)計是多組(≥3組)研究,需要對數(shù)據(jù)使用方差分析的時候,而作者都采用了兩樣本的均數(shù)檢驗(yàn).
2.2統(tǒng)計方法闡述不清楚在同一篇醫(yī)學(xué)論文中,不同數(shù)據(jù)要采取不同統(tǒng)計處理方法,這就需要作者清楚地描述出每個統(tǒng)計值采用的是何種統(tǒng)計學(xué)方法,但在許多使用一種以上數(shù)據(jù)統(tǒng)計分析方法的醫(yī)學(xué)論文中,作者往往只是簡單地把論文采用的數(shù)據(jù)統(tǒng)計方法進(jìn)行了整體羅列,并沒有對每個數(shù)據(jù)結(jié)果分析分別交代具體的統(tǒng)計方法,這就很難讓讀者確認(rèn)某一具體結(jié)果作者到底采用的是何種數(shù)據(jù)分析方法.
2.3統(tǒng)計表和統(tǒng)計圖缺失或者重復(fù)統(tǒng)計表或者統(tǒng)計圖可以直觀地讓讀者了解統(tǒng)計結(jié)果. 一個好的統(tǒng)計表或統(tǒng)計圖應(yīng)該具有獨(dú)立性,即作者即使不看文章內(nèi)容,也可從統(tǒng)計表或統(tǒng)計圖中推斷出正確的實(shí)驗(yàn)結(jié)果. 而一些醫(yī)學(xué)論文只是簡單地堆砌了大量的統(tǒng)計數(shù)字,缺乏直觀的統(tǒng)計圖或表;或者雖然也列出了統(tǒng)計表或統(tǒng)計圖,但表或圖內(nèi)缺項(xiàng)很多,讓讀者難以從中提取太多有用的信息. 另外,也有作者為了增加文章篇幅,同時列出統(tǒng)計表和統(tǒng)計圖,造成不必要的浪費(fèi)和重復(fù). 統(tǒng)計表的優(yōu)點(diǎn)是詳細(xì),便于分析研究各類問題. 統(tǒng)計圖(尤其是條形統(tǒng)計圖)的優(yōu)點(diǎn)是能夠直觀反映變量的數(shù)量差異.
3結(jié)果分析中常見錯誤和分析
醫(yī)學(xué)論文中對數(shù)據(jù)統(tǒng)計結(jié)果的解釋,最常見的兩個錯誤就是過度信賴P值(結(jié)果可信程度的一個遞減指標(biāo))和回避陰性結(jié)果. 前一個錯誤的原因是因?yàn)橐恍┳髡邔值含義理解有誤,把數(shù)據(jù)的統(tǒng)計學(xué)意義和研究的臨床意義混淆. 比如高血壓患者的藥物降壓實(shí)驗(yàn),對照組不使用降壓藥物,實(shí)驗(yàn)組使用某種降壓藥后人均降壓6 mmHg左右,如果單純地比較統(tǒng)計學(xué)結(jié)果,這樣的差異是非常顯著的,但不能由此得出該種降壓藥物對高血壓患者有效. 因?yàn)榻Y(jié)合實(shí)際的臨床效果來看,高血壓患者血壓下降6 mmHg并不具備實(shí)際的臨床意義. 所以醫(yī)學(xué)研究人員一定要注意不能單純依靠統(tǒng)計值武斷地得出一些結(jié)論,一定要把統(tǒng)計結(jié)果和臨床實(shí)踐結(jié)合在一起,這樣才會避免出現(xiàn)類似的錯誤. 至于回避陰性結(jié)果,只提供陽性結(jié)果,是因?yàn)椴簧僮髡咴谘芯吭O(shè)計時,難以擺脫的一種單向的思維定式就是主觀地先認(rèn)定自己所預(yù)想的某種結(jié)果結(jié)論. 在歸納某種結(jié)果原因時,從一個方向的實(shí)驗(yàn)就下完美的結(jié)論,尤其是如果這個結(jié)論可能對實(shí)際情形非常有意義時. 這樣的思維定勢過于強(qiáng)調(diào)統(tǒng)計差異的顯著性,有時會刻意回避報道差異的不顯著結(jié)果,不思考和探究差異不顯著的原因和意義,反而會因此忽視一些重大的科學(xué)發(fā)現(xiàn). 當(dāng)然,目前也的確存在很多醫(yī)學(xué)期刊只接受陽性研究結(jié)果,這也是需要醫(yī)學(xué)期刊界反思的. 不過一些醫(yī)學(xué)期刊已經(jīng)注意到這樣的情況,比如有一些醫(yī)學(xué)期刊專門發(fā)表一些陰性結(jié)果的論文.
4統(tǒng)計術(shù)語書寫常見問題和分析
在醫(yī)學(xué)論文中,這方面的問題相對前面的3個問題不是那么嚴(yán)重,但卻非?,嵥椋沂亲髡咴跁鴮戇^程中只要認(rèn)真就完全可以避免的錯誤. 下面列舉一些常見的問題和錯誤.
4.1統(tǒng)計符號書寫錯誤統(tǒng)計學(xué)符號在醫(yī)學(xué)論中被經(jīng)常使用,正確使用統(tǒng)計學(xué)符號能夠準(zhǔn)確、清晰地表述實(shí)驗(yàn)結(jié)果,增強(qiáng)論文的說明力[6]. 在此類錯誤中,最常見的問題是統(tǒng)計學(xué)符號的大小寫混淆、正斜體混淆和統(tǒng)計符號的誤用. 如樣本量n寫成大寫N或者正體n;或者誤用n代替自由度df;標(biāo)準(zhǔn)差s還繼續(xù)使用非標(biāo)準(zhǔn)的符號SD表示,P值使用小寫p或者正寫P表示等.
4.2統(tǒng)計值不完整其實(shí),許多國外醫(yī)學(xué)期刊中也存在此類問題,就是僅僅給出統(tǒng)計值P值,而不列出其他統(tǒng)計結(jié)果值,如F值(方差分析中F檢驗(yàn)方法的一個檢驗(yàn)值),df值,t值等.
4.3統(tǒng)計術(shù)語的用詞不準(zhǔn)確比如,在大多數(shù)醫(yī)學(xué)論文中,在方法一項(xiàng)中都采用“以P<0.05或者0.01為統(tǒng)計具有差異性”來定義檢驗(yàn)水準(zhǔn). 這里建議使用更專業(yè)的術(shù)語“差異顯著性水平a=0.05 或者0.01”,或更為準(zhǔn)確的是“檢驗(yàn)水準(zhǔn)a=0.05 或者0.01”進(jìn)行表達(dá). 另外,現(xiàn)在也基本不再使用“結(jié)果差異顯著”或者“結(jié)果差異極顯著”來描述統(tǒng)計結(jié)果,而采用統(tǒng)計學(xué)上主張的“差異有統(tǒng)計學(xué)意義”或“差異有高度統(tǒng)計學(xué)意義”來表述.
5小結(jié)
其實(shí),以上列舉的只是醫(yī)學(xué)論文中最常見的一些統(tǒng)計學(xué)問題和錯誤,在醫(yī)學(xué)論文中,還有其他很多更專業(yè)的統(tǒng)計學(xué)錯誤,但要求所有作者和編輯人員都能全部掌握這些知識過于困難,而以上歸納的幾點(diǎn)問題,卻是大部分作者和編輯通過簡單的統(tǒng)計學(xué)習(xí)就可以基本掌握,在寫作或編輯過程可以盡量避免的一些錯誤. 通過不斷的學(xué)習(xí)和使用,作者和編者同時提高統(tǒng)計學(xué)方面的知識,這對于提高期刊的學(xué)術(shù)質(zhì)量也具有重要意義.
【參考文獻(xiàn)】
[1] 肖麗娟. 從編輯角度談醫(yī)學(xué)論文寫作中的統(tǒng)計學(xué)應(yīng)用問題[J]. 蘇州大學(xué)學(xué)報:工科版,2006,26(5):90-92.
[2] 邱芬,曾令霞,國榮. 統(tǒng)計學(xué)審查在醫(yī)學(xué)論文審稿中的必要性[J]. 中國科技期刊研究,2011,22(4):574-576.
[3] 胡良平,李子健. 醫(yī)學(xué)統(tǒng)計學(xué)基礎(chǔ)與典型錯誤辨析[M]. 北京:軍事醫(yī)學(xué)科學(xué)出版社,2003:4.
[4] 胡良平,張?zhí)烀? 影響我國科研成果和學(xué)術(shù)論文質(zhì)量的要因分析[J]. 科學(xué)觀察,2006,1(4):9-19.
[5] 王晴,李剛. 醫(yī)學(xué)論文中常見的統(tǒng)計學(xué)問題分類簡析[J]. 編輯學(xué)報,2006,18(4):270-272.
[6] 李軍紀(jì),馬艷霞,王沁萍. 醫(yī)學(xué)論文中統(tǒng)計學(xué)符號n的幾種錯誤書寫形式[J]. 中國科技期刊研究,2006,17(3):501.
Common statistics problems and its analysis in medical paper’s writing
ZHANGJian-Jun
Editorial Office of Journal of Capital Medical University, Beijing 100069, China
【Abstract】From the experimental design, the method of statistical analysis, the analysis of results and the writing of statistical terminology, to summarize and analysis the common statistics problems or errors in medical papers. It is hoped to help medical researchers and editorial staff of medical journals to minimize the statistics errors in medical paper’s writing or editing, so to improve the quality of academic papers.
【Keywords】medical thesis; statistics; science and technology journal
【中圖分類號】Z62
【文獻(xiàn)標(biāo)識碼】A
作者簡介:張建軍. 副編審,副研究員. Tel:010-83911349E-mail:syxuebao@ccmu.edu.cn
收稿日期:2015-12-02;接受日期:2015-12-18
文章編號:2095-6894(2016)01-88-03
轉(zhuǎn)化醫(yī)學(xué)電子雜志2016年1期