盧宗益
一、試驗(yàn)數(shù)據(jù)進(jìn)行取舍的必要性
在公路工程試驗(yàn)檢測(cè)過程中采集的各種樣本數(shù)據(jù)往往或多或少存在異常值或錯(cuò)誤值。這些異常值或錯(cuò)誤值主要來源于人為和非人為的因素,包括檢測(cè)人員的誤操作、儀器設(shè)備的偶然故障以及其他偶然的因素。由于這些異常值或錯(cuò)誤值的存在,使得我們所采集的數(shù)據(jù)不能夠客觀反映檢測(cè)路段的質(zhì)量,特別是采用評(píng)定值進(jìn)行判定時(shí)尤其突出。筆者通過長(zhǎng)期的檢測(cè)工作發(fā)現(xiàn)在檢測(cè)路段進(jìn)行評(píng)定時(shí)某一個(gè)單值的取舍往往影響到整個(gè)評(píng)定路段的結(jié)果,從而影響到對(duì)整個(gè)工程質(zhì)量的判斷。因此有必要對(duì)所采集的數(shù)據(jù)進(jìn)行判別采取科學(xué)的方法進(jìn)行合理的取舍。
二、試驗(yàn)數(shù)據(jù)的取舍方法
對(duì)試驗(yàn)數(shù)據(jù)的取舍可以采用數(shù)理統(tǒng)計(jì)的方法,按一定的保證率對(duì)數(shù)據(jù)進(jìn)行取舍,一般有拉依達(dá)法、肖維納特法和格拉布斯法,再次對(duì)三種方法介紹如下:
1) 拉依達(dá)法。當(dāng)試驗(yàn)次數(shù)較多時(shí),可簡(jiǎn)單的用3倍標(biāo)準(zhǔn)差作為可疑數(shù)據(jù)取舍的標(biāo)準(zhǔn),即:
——某一試驗(yàn)數(shù)據(jù)
——試驗(yàn)數(shù)據(jù)算術(shù)平均值
S——試驗(yàn)數(shù)據(jù)標(biāo)準(zhǔn)差
根據(jù)隨機(jī)變量的正態(tài)分布, 的概率為99.73%,在此范圍之外的概率為0.27%這種小概率事件出現(xiàn)的可能性極小。因此在試驗(yàn)數(shù)據(jù)中一旦出現(xiàn)就認(rèn)為是不可靠的,應(yīng)當(dāng)舍棄。
2) 肖維納特法。進(jìn)行n次試驗(yàn),其測(cè)量值服從正態(tài)分布,以概率 設(shè)定一判定范圍 ,當(dāng)偏差( )超出該范圍則意味著 是可疑的應(yīng)當(dāng)舍棄。
——概率為 系數(shù)
——某一試驗(yàn)數(shù)據(jù)
——試驗(yàn)數(shù)據(jù)算術(shù)平均值
S——試驗(yàn)數(shù)據(jù)標(biāo)準(zhǔn)差
3) 格拉布斯法。假設(shè)試驗(yàn)數(shù)據(jù)按正態(tài)分布,根據(jù)順序統(tǒng)計(jì)量來確定可疑數(shù)據(jù)的取舍。將n個(gè)試驗(yàn)數(shù)據(jù) , ,…, 按從小到大順序重新排列,根據(jù)順序統(tǒng)計(jì)原則給出標(biāo)準(zhǔn)化順序統(tǒng)計(jì)量g:
當(dāng) 可疑時(shí):
當(dāng) 可疑時(shí):
根據(jù)格拉布斯統(tǒng)計(jì)量的分部,在指定的顯著性水平β(一般為0.05)下,求得可疑值的臨界值 ,格拉布斯法判別標(biāo)準(zhǔn)為:
——試驗(yàn)數(shù)據(jù)算術(shù)平均值
——參與計(jì)算數(shù)據(jù)的最小值
——參與計(jì)算數(shù)據(jù)的最大值
S——試驗(yàn)數(shù)據(jù)標(biāo)準(zhǔn)差
β——指定的顯著性水平
n?——參與計(jì)算的數(shù)據(jù)數(shù)量
g——標(biāo)準(zhǔn)化順序統(tǒng)計(jì)量
——標(biāo)準(zhǔn)化順序統(tǒng)計(jì)量在一定顯著性水平下的臨界值可查表求得
利用格拉布斯法每次只能舍去一個(gè)可疑值,有多個(gè)可疑值時(shí)應(yīng)一個(gè)一個(gè)舍去,每舍去一個(gè)n=n-1,以此為基礎(chǔ)判別下一個(gè)可疑數(shù)據(jù)。
三、試驗(yàn)數(shù)據(jù)取舍的工程應(yīng)用
上述三種進(jìn)行可疑值取舍的方法舍棄范圍均可以寫成 范圍以外的測(cè)定值,只是在系數(shù)k的取值上有所不同,這與《公路路基路面現(xiàn)場(chǎng)測(cè)試規(guī)程》(JTG E40-2007)附錄B 檢測(cè)路段數(shù)據(jù)整理方法 是一致的,該規(guī)程規(guī)定當(dāng)無特殊規(guī)定時(shí),可疑數(shù)據(jù)的舍棄宜按照 K倍標(biāo)準(zhǔn)差作為舍棄標(biāo)準(zhǔn),即在資料分析當(dāng)中,舍棄那些在 范圍以外的測(cè)定值,然后再重新計(jì)算整理。當(dāng)試驗(yàn)數(shù)據(jù)N為3、4、5、6個(gè)時(shí),k值分別為1.15、1.46、1.67、1.82,N 7時(shí),k值宜采用3。K值采用3即拉依達(dá)法。因肖維納特法判定范圍僅與數(shù)據(jù)數(shù)量n有關(guān)與保證率無關(guān)工程實(shí)際應(yīng)用效果不好,在此僅以工程實(shí)例對(duì)拉依達(dá)法和格拉布斯法進(jìn)行討論。
該工程為尚未通車的新建I級(jí)公路采用瀝青混凝土面層,按照世界幾個(gè)權(quán)威機(jī)構(gòu)的研究結(jié)果(見表2),及對(duì)路面平整度檢測(cè)的經(jīng)驗(yàn),并結(jié)合工程實(shí)際情況,可判斷表1-1至表1-6中加粗的數(shù)據(jù)為明顯的異常數(shù)據(jù)。
IRI與路面服務(wù)性能的關(guān)系
由表3-1可以看出,在異常值不剔除的情況下進(jìn)行計(jì)算,計(jì)算結(jié)果受異常值的影響,各評(píng)定單元的計(jì)算結(jié)果標(biāo)準(zhǔn)差及變異系數(shù)均較大,試驗(yàn)結(jié)果的離散性大變異性高,與實(shí)際情況不符,容易造成對(duì)工程質(zhì)量的誤判。表3-2的計(jì)算采用了拉依達(dá)法按3倍標(biāo)準(zhǔn)差進(jìn)行了剔除,試驗(yàn)結(jié)果的離散性減小變異性降低,與實(shí)際情況較符合,但由于拉依達(dá)法自身的缺點(diǎn)某些異常數(shù)據(jù)(如10.04等數(shù)據(jù))不能被剔除,不能達(dá)到較理想的狀態(tài),因此該方法適合于要求不太嚴(yán)格的場(chǎng)合。表3-3的計(jì)算采用格拉布斯法對(duì)可疑值進(jìn)行舍棄,該方法能夠較好的對(duì)異常值進(jìn)行剔除從而更加減小異常值的影響,從計(jì)算結(jié)果可以看出各評(píng)定路段標(biāo)準(zhǔn)差、變異系數(shù)均較小,最符合實(shí)際情況。再結(jié)合表4的計(jì)算結(jié)果,采用格拉布斯法剔除異常數(shù)據(jù)后整條路的變異性均降到最低,與實(shí)際情況相符合,能客觀反映該路面的平整度。
四、結(jié)論
在試驗(yàn)檢測(cè)過程中所產(chǎn)生的異常數(shù)據(jù)如果不剔除會(huì)產(chǎn)生錯(cuò)誤的結(jié)果,從而造成對(duì)工程質(zhì)量的誤判。有必要采取科學(xué)的手段對(duì)異常數(shù)據(jù)進(jìn)行舍棄。運(yùn)用拉依達(dá)法與格拉布斯法對(duì)異常數(shù)據(jù)進(jìn)行舍棄均有較好的效果,尤其以格拉布斯法最佳,但數(shù)據(jù)的舍棄均有一定概率的風(fēng)險(xiǎn),所以對(duì)舍棄的數(shù)據(jù)要分析原因并加以驗(yàn)證,這樣才能夠確保試驗(yàn)檢測(cè)數(shù)據(jù)能夠客觀地反映工程質(zhì)量。