張嬌霞 賈云濤
摘 要:本文主要通過R軟件對數(shù)學(xué)建模中常見的定性數(shù)據(jù)中的四格表進(jìn)行獨立性檢驗,F(xiàn)isher精確檢驗等相關(guān)分析。
關(guān)鍵詞:四格表;獨立性檢驗;Fisher精確檢驗
數(shù)學(xué)建模中除了定量數(shù)據(jù),定性數(shù)據(jù)也是經(jīng)常會遇到的一種數(shù)據(jù)類型,比如人的性別,民族,對某項服務(wù)的評價等級優(yōu),良,中,差等。四格表中的數(shù)據(jù)都是定性數(shù)據(jù),是最簡單的二維列聯(lián)表。本文主要通過使用R軟件對四格表進(jìn)行獨立性檢驗,F(xiàn)isher精確檢驗等相關(guān)分析。
一、四格表的獨立性檢驗
案例背景:吸煙的惡果之所以會引起人們嚴(yán)重的關(guān)切,最早是由于對肺癌患者吸煙情況的觀察。1927年英國醫(yī)生泰勒哥德博士說,他所看到的肺癌患者幾乎都是吸煙的。隨著很多醫(yī)生關(guān)于肺癌患者吸煙情況報導(dǎo)資料的不斷積累,人們越來越感到有必要對吸煙惡果問題進(jìn)行科學(xué)研究?,F(xiàn)選擇63個肺癌病例和43個與肺癌患者年齡、性別和其他屬性相類似的健康人(健康人稱為對照組),調(diào)查這些人的吸煙情況,得到下表:
根據(jù)以上得到的p值,我們均得到拒絕原假設(shè)的結(jié)論,并且在有方向的Fisher精確檢驗中,我們得到了在總體中肺癌患者吸煙比例比健康人的吸煙比例要高的結(jié)論。
參考文獻(xiàn):
[1]王靜龍,梁小筠,王黎明.屬性數(shù)據(jù)分析.北京:高等教育出版社,2013.7.
[2]張堯庭.定性資料的統(tǒng)計分析.南寧:廣西師范大學(xué)出版社,1991.
[3]Robert I.Kabacoff.R in Action Data Analysis and Graphics with R.(中譯本:R語言實戰(zhàn).高濤,肖楠,陳鋼譯.北京:人民郵電出版社,2014.1)