王鑫
摘 要:不管從理論還是實踐角度來看,正態(tài)分布都是統(tǒng)計學中的重要方式之一。在實際的工作生活中,多種隨機變量情況都能服從正態(tài)分布或者近似正態(tài)分布,如降雨量、儀器中的誤差測量、金融指標等。正態(tài)分布既是一種極限分布,又包含了概率密度和分布函數(shù)的多種優(yōu)勢,所以正態(tài)分布模型是工作學習中不可缺少的數(shù)據(jù)分析模型。本文首先對正態(tài)分布所具備的特點進行介紹,再將其與極限定理的關系和應用進行分析,最后詳細闡述了正態(tài)分布在醫(yī)學生化指標、部分住院指標和醫(yī)學教育等方面的應用情況。
關鍵詞:正態(tài)分布;極限定理;醫(yī)學
一、正態(tài)分布的有關知識
1.正態(tài)分布的特點
正態(tài)分布的早期發(fā)現(xiàn)者是棣莫弗,他在求解二項分布時發(fā)現(xiàn)了該規(guī)律。而后高斯在進行誤差測量時,再次導出了該公式,同時對正態(tài)分布的性質進行了研究,所以又稱之為高斯分布[1]。正態(tài)分布在數(shù)學、物理等領域的應用非常廣泛,在統(tǒng)計學中有著不可或缺的影響力。
2.正態(tài)分布的圖形特點
正態(tài)分布曲線呈鐘形,圖形兩端低,中間高,且左右對稱分布,所以又稱之為鐘形曲線,如圖1所示。正態(tài)分布由兩個重要的參數(shù)構成,即均數(shù)μ和標準差σ[2]。μ值決定了圖形靠左或靠右,即決定了圖形的分布位置;σ決定了圖形陡峭或平穩(wěn),即決定了圖形的形狀。當σ為常數(shù)時,μ越大,曲線越向橫軸的右方向移動,反之μ越小,則曲線越往橫軸的左方向移動。標準差主要描述正態(tài)分布的曲線形狀,當μ為常數(shù)時,σ越大,正態(tài)分布曲線越平穩(wěn);σ越小,曲線越陡峭。當μ=0,σ=1時為標準正態(tài)分布。
二、正態(tài)分布與中心極限定理
1.中心極限定理
在統(tǒng)計學中,中心極限定理有著重要的意義。當樣本容量足夠大時,隨機變量近似服從標準正態(tài)分布。中心極限定理是處理大樣本數(shù)據(jù)的重要工具[3]。
2.正態(tài)分布與中心極限定理的應用
正態(tài)分布與中心極限定理的應用體現(xiàn)在多個方面,本文主要以下述兩個方面做出具體說明:
(1)計算累積概率,可得出正態(tài)分布面積
假設2018年某醫(yī)院新聘用護士的平均身高μ=163cm,標準差為σ=20cm,請問隨機抽取16個護士樣本身高均數(shù)超過168cm的概率是多少?
解:設X作為樣本均值,則樣本均值的期望即標準差=總體的標準差=
所求概率P{X>168}則P{}=P{Z>1}=0.16
所以,樣本平均身高超過168cm的概率為16%。
(2)運用于證明某理論或假說
在醫(yī)學科研中,存在著很多的理論和假說需要證明,我們可以通過正態(tài)分布模型來對其進行推論。如在進行醫(yī)學研究時,往往需要從總體數(shù)據(jù)中隨機抽取出一些樣本進行研究。隨著樣本量的增加,樣本的均數(shù)和標準差也會更接近數(shù)據(jù)總體的μ和σ,樣本的平均數(shù)和正態(tài)分布面積也會逐漸趨于穩(wěn)定。如果總體數(shù)據(jù)已呈現(xiàn)正態(tài)分布,那么隨機抽取的大樣本(n>100)也會呈現(xiàn)正態(tài)分布,服從正態(tài)分布的規(guī)律,同時通過對均值μ進行替換,做出假設檢驗,以確定總體與樣本存在的差異,找到分布規(guī)律,進而進行判斷,從而對某些理論、假說進行驗證[4]。
三、正態(tài)分布與醫(yī)學的聯(lián)系
醫(yī)學領域包羅萬象,本文在研究正態(tài)分布與醫(yī)學的聯(lián)系時,主要選用了生化指標、部分住院指標和醫(yī)學教育等三個領域進行闡述。
1.正態(tài)分布與生化指標的關系
一些醫(yī)學上的指標,如紅細胞數(shù)量、血紅蛋白含量、以及人體內的微量元素、抗體產生及分布規(guī)律等,都呈現(xiàn)正態(tài)或者近似正態(tài)分布曲線的情況。而有些指標雖然是以偏態(tài)分布為主,但是經過數(shù)據(jù)轉換與處理后,所形成的新指標仍為正態(tài)或近似正態(tài)分布曲線,可以利用正態(tài)分布公式進行考量。例如對數(shù)正態(tài)分布,其從原理上看是一種非正態(tài)的連續(xù)分布圖形,其概率密度函數(shù)可用如下公式進行描述:
人體中的不少微量元素正常含量、抗體分布、疾病恢復時間和食物中毒潛伏期的分布曲線等都與上文描述的對數(shù)正態(tài)分布相類似[5]。為了讓這些生化指標更容易被讀懂看懂,通常會將各變量轉為對數(shù),對數(shù)值的分布通常會變成近似的正態(tài)分布曲線。
2.正態(tài)分布與部分住院指標的關系
評價一個醫(yī)院效率、效益等綜合指標可通過病人住院時間、住院費用和日均費用等體現(xiàn),這些指標可以充分體現(xiàn)出醫(yī)院在醫(yī)療、技術和管理等多方面的有效性和先進性水平。這些指標的計算對于醫(yī)院管理和機關單位評估等都有著重要的意義。
選擇濟南市某三甲醫(yī)院2018年9月全部出院患者資料,將每位患者的住院時間、總費用和日均費用等作為調查對象,通過對這三個指標的所有數(shù)據(jù)進行均值處理,得出三個指標的偏度值和峰度值均略大于0,圖形呈現(xiàn)較偏右狀態(tài)。而正態(tài)分布曲線正是呈現(xiàn)左右對稱、峰值居中。初步表明這三個指標具有正態(tài)輪廓,但有所偏差。再采用散點圖進行測試,結果發(fā)現(xiàn)點與線只存在小幅偏差,再次驗證該指標具有正態(tài)分布規(guī)律。由此可見,簡單的均值無法準確衡量部分指標的正態(tài)分布概率,也無法得出合理的評估結果。所以,在研究正態(tài)分布與部分住院指標的關系時,可引入中位數(shù),將原始數(shù)據(jù)進行中位數(shù)處理后,再進行正態(tài)檢驗,就能比較容易得到近似的正態(tài)曲線[6],進而進行合理的數(shù)據(jù)分析。
3.正態(tài)分布與醫(yī)學教育的關系
在醫(yī)學教育中,學生的考試成績分布一直是教育界學者研究的重點。醫(yī)學知識博大精深,需要有容納百川的學習能力才能將各科知識融會貫通,而醫(yī)學教育工作者也認為,如若一屆醫(yī)學生的成績分布呈現(xiàn)“中間高,兩頭低”的正態(tài)曲線狀態(tài),說明該屆醫(yī)學生綜合能力較強,可塑性很強。
本文選擇了某醫(yī)科大學49門課程的考試成績進行研究,發(fā)現(xiàn)分數(shù)分布主要有四種類型,具體如表1所示:
如表1所示,各科成績呈現(xiàn)不同的概率分布類型。如若對各科教學效果做出科學評定,呈現(xiàn)近似正態(tài)分布的13門課教學效果最好,其他學科應當效仿。利用該信息,教學老師可以在教學方法和學生復習方法等方面多做研究,將另外三中呈現(xiàn)不均衡分布的科目成績、教學成果等轉化為正態(tài)分布模式,讓更多的學生學到有用的知識,造福病人和全社會。由此可以看出,正態(tài)分布模型能間接為醫(yī)學教育改善提供方向。
結論:綜上所述,正態(tài)分布模型在統(tǒng)計學上具有重要的意義,在醫(yī)學領域的應用也相當廣泛,尤其在生化指標分析上,可以通過正態(tài)轉換,將指標變得簡單易懂好分析;在醫(yī)院指標評估上,通過引入中位數(shù),可以將各指標與正態(tài)分布更好的結合,從而得出更精確的質量評估;以及在醫(yī)學教育上,正態(tài)分布模型可以為教學效果研究提供合理的改善方向。
參考文獻
[1]肖庭英.正態(tài)分布在醫(yī)學研究中的應用[J].贛南醫(yī)專學報,1987(01):62-65+59.
[2]施濟民.正態(tài)得分檢驗在醫(yī)學上的應用[J].中國衛(wèi)生統(tǒng)計,1988(01):24-25.
[3]祝俠麗,侯琳,賈永艷.正態(tài)分布在本科生藥劑學成績分析中的應用[J].科技創(chuàng)新導報,2013(34):197.
[4]馮一鳴.正態(tài)分布在教育上的應用[J].川北教育學院學報,1996(02):5-8.
[5]馮忠蕙.變異與正態(tài)分布的應用[J].中華兒童保健雜志,1997(02):139-141.
[6]雷鳴.正態(tài)性檢驗的直線相關分析法在醫(yī)學統(tǒng)計中的應用[J].北華大學學報(自然科學版),2010,11(01):61-62.