朱 寧,嚴(yán)冠東
(桂林電子科技大學(xué) 數(shù)學(xué)與計(jì)算科學(xué)學(xué)院,廣西 桂林 541004)
考慮一般線(xiàn)性模型:
Allen(1971)[6]提出 PRESS 統(tǒng)計(jì)量,用來(lái)度量模型擬合的好壞。
定義1:在Stein嶺型主成分估計(jì)下,把 PRESS=
AP統(tǒng)計(jì)量是由Andrew,D.F.和Pregibon,D.[9]提出的,在協(xié)方差比的基礎(chǔ)上進(jìn)一步考慮(yi,xi′)對(duì) σ^2的影響。Drape和John[9]對(duì)AP統(tǒng)計(jì)量進(jìn)行分解,提出探測(cè)強(qiáng)影響點(diǎn)的統(tǒng)計(jì)量新形式。
Cook統(tǒng)計(jì)量是Cook(1977)[10]提出Cook統(tǒng)計(jì)量作為度量第i個(gè)數(shù)據(jù)點(diǎn) (yi,xi′)影響大小的數(shù)量指標(biāo)。
引理4:廣義Cook統(tǒng)計(jì)量為
本案例的數(shù)據(jù)來(lái)自文獻(xiàn)[1],這組數(shù)據(jù)存在較為嚴(yán)重的共線(xiàn)性,為了避免其共線(xiàn)性對(duì)估計(jì)量帶來(lái)較大誤差,我們?cè)谶@定義Stein嶺型主成分估計(jì)是必要的。我們主要考慮數(shù)據(jù)刪除模型的擬合好壞程度。如果線(xiàn)性模型擬合較好,則去掉一、二個(gè)數(shù)據(jù)點(diǎn)后得到相應(yīng)數(shù)據(jù)刪除模型參數(shù)的估計(jì)量應(yīng)該不會(huì)有顯著的影響;如果有顯著的影響,則說(shuō)明數(shù)據(jù)集中有異常點(diǎn)或強(qiáng)影響點(diǎn)。計(jì)算影響度量統(tǒng)計(jì)量結(jié)果如下表:
從上表結(jié)果,我可以看出:
表1 凈化煤數(shù)據(jù)
Stein嶺型主成分估計(jì)下數(shù)據(jù)刪除模型與最小二乘估計(jì)下線(xiàn)性模型的估計(jì)量存在關(guān)系,可以通過(guò)表達(dá)式互相表示。
通過(guò)上面的討論,得出結(jié)論:第九號(hào)數(shù)據(jù)是強(qiáng)影響點(diǎn),由表中的度量數(shù)據(jù)的影響方面總體效果具有一致性,都可以用來(lái)分析強(qiáng)影響點(diǎn),因此這四個(gè)統(tǒng)計(jì)量對(duì)診斷數(shù)據(jù)是否為強(qiáng)影響點(diǎn)是具有統(tǒng)計(jì)意義的。
[1]韋博成.統(tǒng)計(jì)診斷引論[M].南京:東南大學(xué)出版社,1991.
[2]林路.數(shù)據(jù)刪除模型和均值漂移模型對(duì)嶺估計(jì)的影響[J].邵陽(yáng)師專(zhuān)學(xué)報(bào),1994,(2).
[3]錢(qián)峰,石麗娟.數(shù)據(jù)刪除模型對(duì)于廣義嶺估計(jì)的影響[J].南通大學(xué)學(xué)報(bào),2008,7(1).
[4]朱寧,黃黎平.嶺型主成分估計(jì)下數(shù)據(jù)刪除模型的強(qiáng)影響分析[J].統(tǒng)計(jì)與決策,2012,(15).
[5]朱寧,李建軍,李兵.一種有偏嶺-壓縮組合估計(jì)的新形式[A].曾玲,劉克.第八屆中國(guó)青年運(yùn)籌信息管理學(xué)者大會(huì)論文集[C]桂林:桂林電子科技大學(xué),2006.
[6]Allen D M.Mean Square Error of Prediction As A Criterion for Selecting Variables[J].Technometrics,1971,(13).
[7]張堯庭,方開(kāi)泰.多元統(tǒng)計(jì)分析引論[M].北京:科學(xué)出版社,1982.
[8]Andrews D F,Pregibon D.Finding The Outliers That Matter[J].J.Roy.Statist.Soc.B,1978(40).
[9]Draper N R,John J A.Influence Observations and Outliers in Regression[J].Technometrics,1981,23(1).
[10]Cook R D.Detection of Influential Observations in Linear Regression[J].Technometrics,1977(19).