王延停 歸慶明 張倩倩
(1)解放軍信息工程大學(xué)理學(xué)院,鄭州 450001 2)解放軍信息工程大學(xué)測(cè)繪學(xué)院,鄭州450052)
基于Kullback-Leiber距離粗差探測(cè)的Bayes方法*
王延停1)歸慶明1,2)張倩倩1)
(1)解放軍信息工程大學(xué)理學(xué)院,鄭州 450001 2)解放軍信息工程大學(xué)測(cè)繪學(xué)院,鄭州450052)
從影響分析角度,基于Kullback-Leiber距離提出了粗差探測(cè)的Bayes方法。對(duì)非等權(quán)獨(dú)立觀測(cè)情形,在一定先驗(yàn)分布下,對(duì)數(shù)據(jù)刪除模型、方差膨脹模型和均值漂移模型進(jìn)行了比較分析,給出3種模型相應(yīng)的Kullback-Leiber距離的計(jì)算公式,建立了粗差探測(cè)的判別法則。最后將該方法應(yīng)用于邊角網(wǎng)的粗差探測(cè),取得了較好的效果。
Bayes方法;影響分析;Kullback-Leiber距離;粗差探測(cè);方差膨脹模型
在我國(guó),就粗差探測(cè)研究而言,起步較晚,相應(yīng)成果發(fā)表甚少[1]。歸慶明等[2,3]提出的基于事件后驗(yàn)概率的粗差探測(cè)法和基于真誤差的后驗(yàn)概率法,沒有給出判別粗差的閾值且運(yùn)算復(fù)雜,計(jì)算效率低下,從而使這些方法還只停留在理論研究上。李新娜等[4]提出的基于識(shí)別變量的后驗(yàn)概率法,解決了多個(gè)粗差的探測(cè)問(wèn)題,并討論了粗差的掩蓋和淹沒現(xiàn)象,同時(shí)引入MCMC等現(xiàn)代統(tǒng)計(jì)計(jì)算方法,大大提高了計(jì)算效率。衡廣輝等[5]提出的相關(guān)觀測(cè)粗差探測(cè)的Bayes方法,對(duì)相關(guān)觀測(cè)數(shù)據(jù)的粗差探測(cè)進(jìn)行了討論??疾爝@些粗差探測(cè)方法[2-10],都不是從影響分析的角度進(jìn)行研究。為此,本文從影響分析角度,基于Kullback-Leiber距離,根據(jù)測(cè)量平差實(shí)際,運(yùn)用Bayes統(tǒng)計(jì)理論和方法[11],給出了數(shù)據(jù)刪除模型、方差膨脹模型和均值漂移模型相應(yīng)的距離計(jì)算公式,建立了粗差探測(cè)的判別法則,提出了基于Kullback-Leiber距離的粗差探測(cè)的Bayes方法。最后將該方法應(yīng)用于邊角網(wǎng)的粗差探測(cè),取得了很好的效果。
其中L=(L1,L2,…,Ln)T為n×1觀測(cè)值向量,A= (a1,…,an)T為n×1設(shè)計(jì)矩陣且列滿秩,X為t×1未知參數(shù)向量,Δ=(Δ1,…,Δn)T為n×1觀測(cè)誤差向量為未知單位權(quán)方差。記P=diag(p1,…,pn),τ=
假定參數(shù)(X,τ)服從正態(tài)-伽瑪先驗(yàn)分布,即{X |τ}~Nt(X0,τ-1),τ~Γ(α0,α1),其中X0為給定的t×1向量,Σ0為給定的t×t階正定矩陣,α0和α1為給定的常數(shù)。
定理1 參數(shù)X、τ的后驗(yàn)分布以及X的邊緣后驗(yàn)分布分別為
將上式在X的參數(shù)空間內(nèi)積分,即可證式(3)。同理將上式對(duì)τ積分,即可證式(4)。
考慮測(cè)量平差的Gauss-Markov模型,第i個(gè)觀測(cè)值相應(yīng)的數(shù)據(jù)刪除模型、方差膨脹模型和均值漂移模型分別為:
定理2 在上述假定下,關(guān)于參數(shù)X、τ的后驗(yàn)分布以及X的邊緣后驗(yàn)分布結(jié)果有:
其中,τ的后驗(yàn)分布為Gamma分布,各變量的具體表達(dá)式為:
證明過(guò)程類似定理1,在此忽略。
設(shè)p1、p2分別為兩個(gè)分布的密度函數(shù),定義兩個(gè)分布的Kullback-Leiber距離為
K(p1,p2)是衡量?jī)蓚€(gè)分布接近程度的一種很好的度量,因此可應(yīng)用這個(gè)距離作為Bayes估計(jì)的影響度量。
定義
Ki(X)反映了第i個(gè)觀測(cè)值刪除前后對(duì)于X的Bayes估計(jì)的影響。它的值越大,則基于L求得的X的Bayes估計(jì)和基于L(i)求得的X的Bayes估計(jì)的差異越大,因而第i個(gè)觀測(cè)值對(duì)于X的Bayes估計(jì)的影響也越大。定義
它反映了第i個(gè)觀測(cè)值方差膨脹前后對(duì)于參數(shù)X的Bayes估計(jì)的影響。定義
它反映了第i個(gè)觀測(cè)值均值漂移前后對(duì)于參數(shù)X的Bayes估計(jì)的影響。
定理3 在上述假定下,第i個(gè)觀測(cè)值關(guān)于Bayes估計(jì)的影響度量有:
1)對(duì)于數(shù)據(jù)刪除模型
2)對(duì)于方差膨脹模型
3)對(duì)于均值漂移模型
因此3種擾動(dòng)模型的影響度量在形式上是統(tǒng)一的,都是Cook距離與協(xié)方差統(tǒng)計(jì)量形成的距離的疊加。又因?yàn)?種擾動(dòng)模型的有關(guān)參數(shù)的統(tǒng)計(jì)性質(zhì)相同,所以用它們研究第i個(gè)觀測(cè)值關(guān)于Bayes估計(jì)的影響度量的推斷結(jié)果也相同。
在實(shí)際應(yīng)用中,首先計(jì)算得到每個(gè)觀測(cè)值的Kullback-Leiber距離的大小,然后相互比較各個(gè)觀測(cè)值之間的距離大小,如果一個(gè)觀測(cè)值的Kullback-Leiber距離相對(duì)較大,就認(rèn)為該觀測(cè)值的影響較大。但大到何種程度,該點(diǎn)才能稱為粗差?該方法中沒有一個(gè)客觀而明確的基準(zhǔn)值作為判斷標(biāo)準(zhǔn)。為解決這一問(wèn)題,我們對(duì)Kullback-Leiber距離的基準(zhǔn)值作如下探討。
假定每一觀測(cè)值的Kullback-Leiber距離相同,也即影響相同,那么
如果第i個(gè)觀測(cè)值的Kullback-Leiber距離滿足
算例取自文獻(xiàn)[12]中的邊角網(wǎng)。網(wǎng)中共觀測(cè)了12個(gè)角度和6個(gè)邊長(zhǎng),測(cè)角中誤差為±1.5″,測(cè)邊中誤差為±2.0 cm。為檢驗(yàn)本文提出的Bayes方法的粗差定位性能,我們對(duì)第14個(gè)觀測(cè)值加上-14.0 cm的模擬粗差,并按照文中方法進(jìn)行計(jì)算(表1)。通過(guò)表1我們可以看到,當(dāng)α=0.05,c=1.64時(shí),對(duì)于數(shù)據(jù)刪除模型、方差膨脹模型和均值漂移模型,均可判定第14個(gè)觀測(cè)值為粗差。
表1 按3個(gè)模型進(jìn)行的粗差探測(cè)計(jì)算Tab.1 Computation of gross error detection with the three models
1)本文從影響分析角度,在非等權(quán)獨(dú)立觀測(cè)情形及正態(tài)-伽瑪先驗(yàn)分布下,給出了基于Kullback-Leiber距離的粗差探測(cè)的Bayes方法;
2)對(duì)基于Kullback-Leiber距離的影響度量給出了一種確定粗差的方法;
3)根據(jù)3種擾動(dòng)模型的影響度量的計(jì)算公式及有關(guān)參數(shù)的統(tǒng)計(jì)性質(zhì),得出它們研究第個(gè)觀測(cè)值關(guān)于Bayes估計(jì)的影響度量相同。
1 韋博成,魯國(guó)斌,史建清.統(tǒng)計(jì)診斷引論[M].南京:東南大學(xué)出版社,1991.(Wei Bocheng,Lu Guobin and Shi Jianqing.Introduction to statistical diagnostics[M].Nanjing:Publishing House of Dongnan University,1991)
2 歸慶明,等.粗差探測(cè)的Bayes方法[J].測(cè)繪學(xué)報(bào),2006,35(4):303-307.(Gui Qingming,et al.Bayesian method for detection of gross errors[J].Acta Geodaetica et Cartographic Sinica,2006,35(4):303-307)
3 歸慶明,等.基于觀測(cè)誤差后驗(yàn)分布的粗差探測(cè)的Bayes方法[J].測(cè)繪科學(xué)技術(shù)學(xué)報(bào),2007,24(2):87-89.(Gui Qingming,et al.Bayesian approach to detection of gross errors based on posterior distribution of observation error[J].Journal of Zhengzhou Institude of Surveying and Mapping,2007,24(2):87-89)
4 李新娜,歸慶明,許阿裴.基于識(shí)別變量的粗差探測(cè)的Bayes方法[J].測(cè)繪學(xué)報(bào),2008,37(3):355-360.(Li Xinna,Gui Qingming and Xu Apei.Bayesian method for detection of gross errors based on classification variable[J].Acta Geodaetica et Cartographic Sinica,2008,37(3):355 -360)
5 衡廣輝.相關(guān)觀測(cè)粗差探測(cè)的Bayes方法及其在GPS網(wǎng)平差中的應(yīng)用[D].解放軍信息工程大學(xué),2009.(Heng guanghui.Bayesian methods for gross errors detection of correlated observations and its application in GPS network adjustment[D].Information Engineering University,2009)
6 Abraham B and Box G E P.Linear models and spurious observations[J].Appl Statist.,1978:131-138.
7 Ethrog U.Statistical test of significance for testing outlying observations[J].Survey Review,1991,31(240):62-70.
8 Baarda W A.Test procedure for use in geodetic networks[J].Neth Geod Comm Publ Geod,New Ser.,1968,2 (5):27-55.
9 Box G E P and Tiao G C.A Bayesian approach to some outlier problems[J].Biometrika,1968,55:119-129.
10 Cox D R and Weisberg S.Diagnostics for heteroscedasticity in regression[J].Biome-trika,1983,70:1-10.
11 茆詩(shī)松.貝葉斯統(tǒng)計(jì)[M].北京:中國(guó)統(tǒng)計(jì)出版社,1999.(Mao Shisong.Bayesian statistics[M].Beijing:Publishing House of Chinese Statistics,1999)
12 崔希璋,於宗儔,陶本藻.廣義測(cè)量平差(新版)[M].武漢:武漢測(cè)繪科技大學(xué)出版社,2001.(Cui Xizhang,Yu Zhougchou and Tao benzao.Generalized surveying adjustment(new edition)[M].Wuhan:Publishing House of Wuhan Technical University of Surveying and Mapping,2001)
BAYESIAN APPROACH TO DETECTION OF GROSS ERRORS BASED ON DIVERGENCE OF KULLBACK-LEIBER
Wang Yanting1),Gui Qingming1,2)and Zhang Qianqian1)
With the view of influence analysis,a new Bayesian method for gross errors detection based on divergence of Kullback-Leiber is proposed.Under the condition of unequal weight and independent observations,a comparison among the data deletion model,the variance inflation model and the mean shift model based on certain prior distribution is made,and the computational formula of divergence of Kullback-Leiber about the three models is given and a judge rule of gross error detection is established.Finally,the method is used for gross error detection in triangulateration network and a good result is obtained.
Bayesian method;influence analysis;Kullback-Leiber divergence;gross errors detection;variance inflation model
1671-5942(2012)02-0051-05
2011-11-24
國(guó)家自然科學(xué)基金(40974009);鄭州市科技計(jì)劃攻關(guān)項(xiàng)目(0910SGYG21198)
王延停,男,1986年生,碩士研究生,主要從事誤差理論和測(cè)量數(shù)據(jù)處理等方面的研究.E-mail:wangyanting454799@163.com
P227;P207
A
(1)Institute of Science,Information Engineering University,Zhengzhou 450001 2)Institute of Surveying and Mapping,Information Engineering University,Zhengzhou 450052)