羅 盛 劉德平 陳景武
對(duì)應(yīng)分析(相應(yīng)分析)其基本思想首先由理查森(Richardson)和庫(kù)德(Kuder)在1933年提出,后來(lái)法國(guó)統(tǒng)計(jì)學(xué)家Jean-Paul Benzecri和日本統(tǒng)計(jì)學(xué)家Hayashi Chikio對(duì)該方法進(jìn)行了發(fā)展〔1〕,主要用于分析二維數(shù)據(jù)陣中行因素和列因素間的關(guān)系。目前對(duì)應(yīng)分析已被廣泛地應(yīng)用于自然科學(xué)和社會(huì)科學(xué)的各個(gè)領(lǐng)域,取得了可喜的成果〔2-4〕。
本次調(diào)查對(duì)象是2010年青州市小學(xué)1~6年級(jí)在校學(xué)生。采用橫斷面的隨機(jī)抽樣調(diào)查方法,對(duì)學(xué)校按地理分布分為城區(qū)、平原丘陵地區(qū)、山區(qū)三層,以學(xué)校為抽樣單位,進(jìn)行分層整群抽樣,對(duì)抽取學(xué)校的小學(xué)生進(jìn)行調(diào)查。共調(diào)查12個(gè)學(xué)校7144人,其中城區(qū)2個(gè)學(xué)校2404人,平原丘陵7個(gè)學(xué)校2515人,山區(qū)3個(gè)學(xué)校2225人。表1是主要15種眼病患病資料:H10.4慢性結(jié)膜炎、H52.1近視(單純性、病理性)、H53.0弱視、H53.5色覺(jué)缺陷、H13.1衣原體性沙眼、H52.0遠(yuǎn)視、H50.0內(nèi)斜視、H50.1外斜視、H02.0瞼內(nèi)翻和倒睫、H10.2急性結(jié)膜炎、S05眼外傷、H55眼球震顫、H52.3屈光參差、Q12.0先天性白內(nèi)障、Q10.0先天性上瞼下垂。地區(qū)用英文字母表示。12所學(xué)校劃歸為3個(gè)地區(qū),城區(qū)(cq):團(tuán)結(jié)小學(xué)、職工子弟小學(xué);農(nóng)村平原(np):大王、大尹、東壩、貫店、黃樓、潘劉、陽(yáng)河小學(xué);農(nóng)村山區(qū)(ns):蓮花盆、邵莊、五里小學(xué)。為了解這3個(gè)地區(qū)與主要眼病間的聚集性,應(yīng)用SAS 8.0對(duì)資料進(jìn)行對(duì)應(yīng)分析。
表1 3個(gè)地區(qū)15種主要眼病患病率(%)
對(duì)表1進(jìn)行對(duì)應(yīng)分析發(fā)現(xiàn),前兩個(gè)特征根λ1、λ2累計(jì)貢獻(xiàn)率為100%,說(shuō)明前2個(gè)因子能解釋原始資料的全部信息,此時(shí)用前2個(gè)因子表示的二維因子載荷圖能充分表達(dá)原始資料中眼病患病率與地區(qū)兩屬性變量間的關(guān)系。
表1資料的行因素(地區(qū))及列因素(眼病)的第一因子負(fù)荷(Dim1)和第二因子負(fù)荷(Dim2),列于表2。
表2 眼病患病率的因子載荷
將表2行因素及列因素的第1、第2因子負(fù)荷分別繪在同一因子圖上,得因子載荷圖。由圖可以看出三個(gè)地區(qū)分布在三個(gè)不同的象限。H52.1近視(單純性、病理性)、H02.0(瞼內(nèi)翻和倒睫)聚集性比較大,代表地區(qū)為城區(qū)(cq);H53.5色覺(jué)缺陷、H53.0弱視聚集性比較大,代表地區(qū)為農(nóng)村平原(np);H13.1衣原體性沙眼、H10.4慢性結(jié)膜炎、S05眼外傷聚集性比較大,代表地區(qū)為農(nóng)村山區(qū)(ns)。另外H52.3屈光參差、H10.2急性結(jié)膜炎與H50.0內(nèi)斜視有一定的相關(guān)性;Q10.0先天性上瞼下垂、Q12.0先天性白內(nèi)障與H55眼球震顫有一定的相關(guān)性;H52.0遠(yuǎn)視與H50.0內(nèi)斜視有一定的相關(guān)性。且H52.3屈光參差、H10.2急性結(jié)膜炎高發(fā)區(qū)可能是H52.0遠(yuǎn)視、H50.0內(nèi)斜視的低發(fā)區(qū)。
(3)眼病患病率的假設(shè)檢驗(yàn)
對(duì)應(yīng)分析雖然可以揭示行因素和列因素間的關(guān)系,但它不能代替兩個(gè)變量之間的假設(shè)檢驗(yàn)。根據(jù)研究目的需要,可以對(duì)經(jīng)對(duì)應(yīng)分析顯示與3個(gè)地區(qū)之間有關(guān)聯(lián)性傾向的主要眼病分別進(jìn)行假設(shè)檢驗(yàn),來(lái)進(jìn)一步分析不同眼病患病率在地區(qū)間的差異是否具有統(tǒng)計(jì)學(xué)意義。
(1)近視眼患病率的假設(shè)檢驗(yàn)
表3 3個(gè)地區(qū)近視眼患病情況
經(jīng)卡方檢驗(yàn)得χ2=67.448,P<0.0001,差別有統(tǒng)計(jì)學(xué)意義,可認(rèn)為近視眼患病率在三個(gè)地區(qū)間有差異,經(jīng)兩兩比較得城區(qū)與農(nóng)村平原患病率有差異(χ2=55.922,P <0.0001),城區(qū)與農(nóng)村山區(qū)有差異(χ2=39.168,P<0.0001),農(nóng)村平原與農(nóng)村山區(qū)間無(wú)差異(χ2=0.978,P>0.05),且城區(qū)患病率最高,為25.7%。
(2)瞼內(nèi)翻和倒睫患病率的假設(shè)檢驗(yàn)
表4 3個(gè)地區(qū)瞼內(nèi)翻和倒睫患病情況
經(jīng)卡方檢驗(yàn)得χ2=7.187,P<0.05,差別有統(tǒng)計(jì)學(xué)意義,可認(rèn)為瞼內(nèi)翻和倒睫患病率在三個(gè)地區(qū)間有差異。經(jīng)兩兩比較得城區(qū)與農(nóng)村平原患病率有差異(χ2=6.832,P=0.009),城區(qū)與農(nóng)村山區(qū)無(wú)差異(χ2=2.184,P>0.05),農(nóng)村平原與農(nóng)村山區(qū)間無(wú)差異(χ2=1.213,P>0.05),且城區(qū)患病率最高,為1.1%。
(3)色覺(jué)缺陷患病率的假設(shè)檢驗(yàn)
表5 3個(gè)地區(qū)色覺(jué)缺陷患病情況
經(jīng)卡方檢驗(yàn)得χ2=0.949,P>0.05,差別無(wú)統(tǒng)計(jì)學(xué)意義,尚不能認(rèn)為色覺(jué)缺陷患病率在三個(gè)地區(qū)間有差異。
(4)弱視患病率的假設(shè)檢驗(yàn)
表6 3個(gè)地區(qū)弱視患病情況
經(jīng)卡方檢驗(yàn)得 χ2=2.658,P>0.05,差別無(wú)統(tǒng)計(jì)學(xué)意義,尚不能認(rèn)為弱視患病率在三個(gè)地區(qū)間有差異。
(5)衣原體性沙眼患病率的假設(shè)檢驗(yàn)
表7 3個(gè)地區(qū)衣原體性沙眼患病情況
經(jīng)卡方檢驗(yàn)得 χ2=1.976,P>0.05,差別無(wú)統(tǒng)計(jì)學(xué)意義,尚不能認(rèn)為衣原體性沙眼患病率在三個(gè)地區(qū)間有差異。
(6)慢性結(jié)膜炎患病率的假設(shè)檢驗(yàn)
表8 3個(gè)地區(qū)慢性結(jié)膜炎患病情況
經(jīng)卡方檢驗(yàn)得 χ2=0.896,P>0.05,差別無(wú)統(tǒng)計(jì)學(xué)意義,尚不能認(rèn)為慢性結(jié)膜炎患病率在三個(gè)地區(qū)間有差異。
(7)眼外傷患病率的假設(shè)檢驗(yàn)
表9 3個(gè)地區(qū)眼外傷患病情況
經(jīng)確切概率法得,P>0.05,差別無(wú)統(tǒng)計(jì)學(xué)意義,尚不能認(rèn)為眼外傷患病率在三個(gè)地區(qū)間有差異。
對(duì)應(yīng)分析可以直觀地表現(xiàn)多項(xiàng)分類列聯(lián)表資料中行因素和列因素間的對(duì)應(yīng)情況,通過(guò)因子載荷圖使行因素和列因素間關(guān)系得以直觀的展示,從量上發(fā)現(xiàn)有聚集性傾向的眼病和主要眼病對(duì)應(yīng)的高發(fā)區(qū)。但是這種直觀的有關(guān)聯(lián)性僅僅說(shuō)明了一種傾向或趨勢(shì),為進(jìn)一步研究指出了方向,并無(wú)具體的計(jì)量標(biāo)志,也不能代表有統(tǒng)計(jì)學(xué)意義,根據(jù)研究目的,我們可以在對(duì)應(yīng)分析的基礎(chǔ)上結(jié)合有關(guān)假設(shè)檢驗(yàn)來(lái)進(jìn)一步分析,以檢驗(yàn)不同地區(qū)和對(duì)應(yīng)眼病間的聚集性有無(wú)統(tǒng)計(jì)學(xué)意義,從而可以確定不同眼病的高發(fā)地和低發(fā)地及不同眼病的相關(guān)性。同時(shí),在方法學(xué)上把無(wú)具體的計(jì)量標(biāo)志的對(duì)應(yīng)分析方法進(jìn)一步擴(kuò)展,得出更精確的“量化”結(jié)論。
本研究運(yùn)用對(duì)應(yīng)分析對(duì)山東省青州市3個(gè)地區(qū)小學(xué)生眼病患病率資料進(jìn)行分析,由因子負(fù)荷圖可以直觀地看出城區(qū)、農(nóng)村平原和農(nóng)村山區(qū)與眼病的對(duì)應(yīng)關(guān)系以及不同眼病的聚集性,然后運(yùn)用卡方檢驗(yàn)分別對(duì)與3個(gè)地區(qū)間有關(guān)聯(lián)性傾向的眼病患病率進(jìn)行假設(shè)檢驗(yàn)以確定聚集性有無(wú)統(tǒng)計(jì)學(xué)意義。經(jīng)卡方檢驗(yàn)得出近視眼患病率(H52.1)、瞼內(nèi)翻和倒睫患病率(H02.0)與城區(qū)的聚集性有統(tǒng)計(jì)學(xué)意義,說(shuō)明城區(qū)是這兩種眼病的高發(fā)地,從而我們可以提出針對(duì)性的防治措施,為降低本地區(qū)小學(xué)生近視眼和瞼內(nèi)翻和倒睫發(fā)病率提供科學(xué)的依據(jù)。
1.何曉群.多元統(tǒng)計(jì)分析.中國(guó)人民大學(xué)出社,2004:195-219.
2.Alain F.Canonical correspondence analysis of lowland pasture vegetation in the humid tropics of Mexico .Statistics for Biology and Health,2007:561-547.
3.Mao DQ.Correspondence analysis on images of Jiangxi Province as a tourist destination.Chinese Geographical Science,2005,15(3):275-280.
4.Ken R.The use of correspondence analysis to develop a scale to measure workplace morale from multi-level data.Social Indicators Research,2002,3:339-351.