郭新俊,朱永忠,張 艷
控制圖作為一種重要的統(tǒng)計(jì)過程控制工具,被廣泛應(yīng)用于實(shí)施過程控制,以改進(jìn)產(chǎn)品質(zhì)量。但常規(guī)控制圖的一個(gè)基本假設(shè)前提是觀測(cè)值彼此獨(dú)立,而往往在現(xiàn)實(shí)中所采集的數(shù)據(jù)會(huì)存在自相關(guān)現(xiàn)象很難滿足獨(dú)立性假設(shè)。為了處理自相關(guān)數(shù)據(jù),我們采用取整的自回歸滑動(dòng)平均過程模型。早在1985年,Mckenzie[1]提出了一個(gè)取非整的ARMA模型(INARMA)。因?yàn)閷?duì)于標(biāo)準(zhǔn)的一階自回歸模型AR(1),一個(gè)取非整的INAR(1)模型是很接近它的,所以在2007年,Weib[2]提出了一個(gè)c-chart,一個(gè)滑動(dòng)平均控制圖和帶著兩個(gè)特殊條件的控制圖去監(jiān)測(cè)這樣的過程。但是,幾種相似的結(jié)果顯示它們都沒有表現(xiàn)出較好的監(jiān)測(cè)效果。直到2009年,Weiss和Testik[3]研究了一個(gè)全新的累積和控制圖Poisson INAR(1)CUSUM,完全基于Poisson INAR(1)模型,能夠很好地監(jiān)測(cè)來自INAR(1)過程的數(shù)據(jù)。而這類常規(guī)的控制圖都是假定抽樣區(qū)間和樣本容量都固定不變,它不利于及時(shí)發(fā)現(xiàn)過程的變化,特別是過程較小的變化,于是Reynolds et al[4]提出了具有變化抽樣區(qū)間的Shewhart控制圖,并由此形成了動(dòng)態(tài)控制圖這一新的領(lǐng)域,之后很多學(xué)者研究了動(dòng)態(tài)的累積和控制圖[5],指數(shù)加權(quán)滑動(dòng)平均控制圖[6]等。本文擬在Weiss和Testik[3]的累積和控制圖Poisson INAR(1)CUSUM的基礎(chǔ)上進(jìn)行變化的樣本區(qū)間設(shè)計(jì),即不再假定樣本區(qū)間固定而是根據(jù)當(dāng)前樣本點(diǎn)落入的區(qū)域從而決定采用相應(yīng)的變化的樣本區(qū)間[7][8]。利用馬爾科夫鏈方法計(jì)算的數(shù)據(jù)判斷,與FSI圖相比是否減少了過程的平均報(bào)警時(shí)間,從而有效地提高生產(chǎn)效率。
McKenzie[1]早在1985年就給出了第一個(gè)INARMA和INAR(1)模型
其中,Nt為離散型隨機(jī)變量,α∈(0,1),°為減弱算子,εt是獨(dú)立同分布的隨機(jī)變量,減弱算子與εt都是相互獨(dú)立的,并且εt在每個(gè)t時(shí)刻與Nt-1,Nt-2,...都是獨(dú)立的。方程(1)中的INAR(1)模型在現(xiàn)實(shí)中有著廣泛的應(yīng)用[2]。
方程(1)中的INAR(1)過程模型是一個(gè)齊次馬爾科夫鏈。顯然,零初值是固定的。再者,此模型可適用于幾種邊緣分布,包括二項(xiàng)分布和泊松分布等。下面,我們只考慮泊松分布的情形——設(shè)定Nt是帶有參數(shù)λ>0的泊松分布且 P(Nt=k)=e-λ(λkk!);k=0,1,...。
在方程(1)中,若εt是獨(dú)立同分布的隨機(jī)變量且服從參數(shù)為λ(1-α)的泊松分布,Nt為服從參數(shù)λ>0的泊松分布的離散型隨機(jī)變量即 P(Nt=k)=e-λ(λkk!),k=0,1,...。那么方程(1)被稱作Poisson INAR(1)模型。
在實(shí)際應(yīng)用中可能會(huì)有很多原因使統(tǒng)計(jì)過程失控。比如Nt和εt的均值或方差可能會(huì)從受控狀態(tài)中的某個(gè)值變成失控狀態(tài)的另一個(gè)值。很多控制圖都能用來監(jiān)測(cè)Nt在過程中均值的改變,由于多樣累積和控制圖在較小和中等參數(shù)漂移監(jiān)測(cè)中的優(yōu)越性[9],在此選用多樣累積和控制圖。Christian H Weib和Murat Caner Testik[3]在2009年提出了一個(gè)單邊的Poisson INAR(1)累計(jì)和控制圖(受控時(shí)μ=λ0):
這里,c0≥0是初值,k≥λ0是信念值。過程被認(rèn)為是受控的,只有當(dāng)Ct≥h時(shí)過程發(fā)出警報(bào)進(jìn)入失控階段,其中h>0為控制線。盡管通常情況下取初值c0=0,但是當(dāng)取c0≥0時(shí),在監(jiān)測(cè)過程失控時(shí)更加靈敏。而k的作用是在受控階段阻止控制圖向控制線靠近,能夠及時(shí)地調(diào)整自身的取值使之對(duì)控制過程中均值漂移更加敏感
動(dòng)態(tài)控制圖[10]是指下一個(gè)樣本的抽樣區(qū)間或樣本容量依賴于現(xiàn)實(shí)樣本點(diǎn)統(tǒng)計(jì)量的控制圖??刂茍D的動(dòng)態(tài)設(shè)計(jì)一般有可變抽樣區(qū)間(Variable Sampling Interval,VSI),可變樣本容量(Variable Sample Size,VSS)及可變樣本容量和抽樣區(qū)間(VSSI)這三種情況。其主要思想為:在控制圖的中心限和控制限之間加上警戒限,將中心限與警戒限之間的區(qū)域稱為中心域,警戒限與控制限之間的區(qū)域稱為警戒域。如果現(xiàn)時(shí)樣本點(diǎn)統(tǒng)計(jì)量位于中心域,則表明其后的點(diǎn)超出控制限的可能性較小,這時(shí)可等待較長的時(shí)間再去抽取下一個(gè)樣本,且下一個(gè)樣本的樣本容量可以較??;反之,若現(xiàn)實(shí)樣本點(diǎn)統(tǒng)計(jì)量位于警戒域內(nèi),這表明其后的點(diǎn)很有可能超出控制限,為了能盡快的發(fā)現(xiàn)過程的偏移,應(yīng)等待較短的時(shí)間去抽取下一個(gè)樣本,且其樣本容量應(yīng)該較大,也就是說下一個(gè)樣本的抽樣區(qū)間和樣本容量的大小取決于現(xiàn)實(shí)樣本點(diǎn)統(tǒng)計(jì)量的大小。一般只取兩個(gè)抽樣區(qū)間長度 d1,d2,和兩個(gè)樣本容量 n1,n2,其中 d1>d2,n1<n2。當(dāng)現(xiàn)時(shí)樣本點(diǎn)統(tǒng)計(jì)量位于中心域時(shí),選取樣本容量n1和抽樣區(qū)間d1;當(dāng)其位于警戒域時(shí),選用樣本容量n2和抽樣區(qū)間d2;若其超出警戒限,則發(fā)出報(bào)警信號(hào),過程失控。
早在上個(gè)世紀(jì)80年代,Reynolds[5]就一直在專注研究關(guān)于帶有變化的樣本容量或抽樣區(qū)間的控制圖,其中對(duì)累積和控制圖的研究占有很大比重。Reynolds和Arnold[5]在1990年給出了一個(gè)單邊的(正向的)VSICUSUM控制圖。
這個(gè)控制圖有效地克服了以往的抽樣區(qū)間是固定的情況下會(huì)出現(xiàn)不能及時(shí)發(fā)現(xiàn)過程較小的變化這一缺點(diǎn),但是這里的隨機(jī)變量Xj一般默認(rèn)為是相互獨(dú)立的,也就是說,在實(shí)際中所觀測(cè)的數(shù)值存在自相關(guān)現(xiàn)象時(shí),(3)式還是可能會(huì)出現(xiàn)虛報(bào)或是漏報(bào)的情況。所以我們用(2)式中定義的特殊的隨機(jī)變量Nt來替換Xj再結(jié)合Poisson INAR(1)CUSUM控制圖的優(yōu)點(diǎn)所得到的新的控制圖如下:
這兒,c0仍然是一個(gè)常數(shù)。而(2)中的Ct與(4)中的不同處在于Ct是將控制圖所有取負(fù)值的統(tǒng)計(jì)量全部歸零,首先會(huì)記錄那些取負(fù)值的統(tǒng)計(jì)量,然后當(dāng)代入下一組樣本計(jì)算時(shí)又將那些負(fù)值重新置為零。除去記錄取負(fù)值的統(tǒng)計(jì)量這一點(diǎn)以外這兩者是相同的。之所以選擇控制圖是因?yàn)槟切┴?fù)的統(tǒng)計(jì)量的取值很可能被用作去判別樣本區(qū)間。同樣,過程被認(rèn)為是受控的,只有當(dāng)Ct≥h時(shí)會(huì)發(fā)出警報(bào)進(jìn)入失控階段,其中h>0為控制線。k為信念值通常由控制圖的漂移率來定,如果讓來表示μ0變到μ的幅度,那么k的最佳取值為,h的選擇則是在受控階段時(shí)使報(bào)警前的樣本數(shù)量的期望達(dá)到某個(gè)特定的值而設(shè)定。
如果使用兩個(gè)樣本區(qū)間d1和d2,用ψi表示報(bào)警前使用抽樣區(qū)間di的樣本數(shù)量,其中i=1,2。d0為第一個(gè)樣本之前的抽樣區(qū)間,也就是說d0是指從過程開始的0時(shí)刻到取第一個(gè)樣本這段時(shí)間。在許多應(yīng)用中,通常取d0=d1,其表示過程開始之后迅速地取第一個(gè)樣本。根據(jù)ATS,ANSS的定義不難得出下列等式:
定義
其中ρ1為樣本區(qū)間是d1的樣本數(shù)量占報(bào)警前所有樣本數(shù)量的比例。進(jìn)一步有 ATS=d?ANSS,這里d=d1ρ1+d2(1-ρ1)。
對(duì)一個(gè)可變抽樣區(qū)間控制圖來說,d可看作是平均樣本區(qū)間的長度,而在接下來討論到的固定樣本區(qū)間圖時(shí),d就代表固定樣本區(qū)間的長度。這都是在討論單邊的情況,雙邊的控制圖統(tǒng)計(jì)量情況類似,只是要復(fù)雜一些,這里就不再說明了。
在運(yùn)用馬爾科夫鏈方法去近似計(jì)算控制圖效能值的時(shí)候,常常是將控制圖的連續(xù)區(qū)域分成若干個(gè)小區(qū)域,每個(gè)小區(qū)域都對(duì)應(yīng)著一個(gè)馬爾科夫鏈,其中有個(gè)區(qū)域稱為吸收態(tài),表示過程失控。現(xiàn)假設(shè)將某個(gè)控制圖的連續(xù)區(qū)域C分成r個(gè)區(qū)域E1,E2,...,Er。并且每個(gè)狀態(tài)Ei相應(yīng)的去使用一個(gè)樣本區(qū)間長度。記bi表示當(dāng)控制圖的統(tǒng)計(jì)量落在區(qū)域Ei時(shí)的樣本區(qū)間,b={b1,b2,...,br}'。馬爾科夫鏈的轉(zhuǎn)移矩陣P為,這兒Q是P的子矩陣對(duì)應(yīng)于r個(gè)轉(zhuǎn)移狀態(tài),0'是由零組成的r×1維零矩陣,1是由1組成的r×1維矩陣。
定義基礎(chǔ)矩陣M=[mij]=(I-Q)-1,這里矩陣P,Q和M都依賴于均值μ的取值。mij是轉(zhuǎn)移狀態(tài)Ej在進(jìn)入吸收態(tài)之前的過程次數(shù)的期望值。用ANSSi表示在狀態(tài)Ei時(shí)的統(tǒng)計(jì)量ANSS,且 ANSS=(ANSS1,ANSS2,...,ANSSr)'。因?yàn)樵隈R爾科夫鏈的一個(gè)狀態(tài)轉(zhuǎn)移發(fā)生時(shí)只取一個(gè)樣本,所以有一個(gè)多樣累積和控制圖的ANSS的取值完全依賴于參數(shù)k和h,所以無論是可變樣本區(qū)間的累積和控制圖還是固定樣本區(qū)間的累積和控制圖,如果它們有相同的k值和h值,那么這兩個(gè)控制圖有相同的ANSS值。同樣,用ATSi表示在狀態(tài)Ei時(shí)的統(tǒng)計(jì)量ATS,d0=bi,并且過程的均值是常數(shù),則有若 d0≠bi時(shí),有 ATS=ATSi+d0-bi。
衡量控制圖性能的指標(biāo)是過程運(yùn)行到出現(xiàn)錯(cuò)誤信號(hào)報(bào)警所用的時(shí)間,如果N代表報(bào)警時(shí)所運(yùn)行的樣本數(shù)量,那么固定樣本區(qū)間控制圖的報(bào)警時(shí)間則是由N和固定的樣本區(qū)間長度共同決定。所以對(duì)固定樣本區(qū)間控制圖來說,刻畫報(bào)警時(shí)間的大小就可以簡(jiǎn)單的去刻畫N的大小。在質(zhì)量控制學(xué)中,N被稱作運(yùn)行長度。所以它的期望值平均運(yùn)行長度ARL通常被用來衡量固定樣本區(qū)間控制圖的性能。然而在變化的樣本區(qū)間控制圖中,由于抽樣區(qū)間不固定所以報(bào)警時(shí)間不能單一的由N去描述,那么只能去直接計(jì)算報(bào)警時(shí)間。同樣它的期望值定義為ATS,由于ARL關(guān)系到兩個(gè)量所以在可變的抽樣區(qū)間控制圖中我們定義報(bào)警時(shí)的樣本數(shù)量的期望值為ANSS,它代替了固定抽樣區(qū)間控制圖的ARL。例如,定義受控階段時(shí)的ANSS為500或者ATS為250小時(shí),則意味著在受控狀態(tài)下平均運(yùn)行每500個(gè)樣本就會(huì)出現(xiàn)一次錯(cuò)誤警報(bào)或者平均運(yùn)行每250小時(shí)就會(huì)出現(xiàn)一次錯(cuò)誤警報(bào)。
控制圖應(yīng)在同一條件下進(jìn)行比較,換言之,當(dāng)過程處于受控狀態(tài)時(shí),它們應(yīng)有相同的平均報(bào)警時(shí)間ATS。只要VSI控制圖和FSI控制圖有相同的n,h和k值,它們就具有相同的ANSS;也就是說,改變控制圖的抽樣區(qū)間并不改變它的ANSS。當(dāng) μ=μ0時(shí),固定k和h。
選擇合適的警戒限和可變抽樣區(qū)間d1和d2,使得VSI控制圖和FSI控制圖有相同的平均抽樣區(qū)間,此時(shí)它們具有相同的平均報(bào)警時(shí)間ATS。分別計(jì)算當(dāng)μ≠μ0時(shí)兩個(gè)控制圖的ATS,ATS越小,控制圖的效率就越高。
在研究累積和控制圖性能時(shí),我們通常將h和k的值均取整并且讓它們成對(duì)出現(xiàn),如表1所給出的,而當(dāng)k的值接近λ0時(shí)控制圖的效果將更加明顯。不難看出無論是固定區(qū)間的FSIPoisson INAR(1)CUSUM亦或是可變樣本區(qū)間的VSIPoisson INAR(1)CUSUM,它們的ATS取值均受到參數(shù)α的影響。再者,對(duì)于參數(shù)c0來說,當(dāng)c0>0時(shí)二者的統(tǒng)計(jì)量取值總比c0為零時(shí)的取值要小一些。而對(duì)于以上所有參數(shù)恒定的情況下,VSI圖的值比FSI圖的值要小,即可說明可變抽樣區(qū)間控制圖比固定樣本區(qū)間控制圖更加靈敏。
表2 帶有幾組不同區(qū)間的VSI圖和固定區(qū)間的FSI圖的ATS值
對(duì)于表2,我們是將FSIPoisson INAR(1)CUSUM的樣本區(qū)間取為d=1,而對(duì)VSIPoisson INAR(1)CUSUM的兩個(gè)不同的抽樣區(qū)間(d1,d2)分別取不同的組合,其中有兩組是關(guān)于d=1對(duì)稱的,而另外三組關(guān)于d=1不對(duì)稱的。由表可看出,對(duì)VSI無論是否取關(guān)于d=1對(duì)稱的抽樣區(qū)間的ATS值都要比FSI的相應(yīng)的值要小。早在1989年,Reynolds就提出過這樣的理論:d1的取值要盡可能的小,言下可讓d2在一定的范圍內(nèi)盡可能取大一些,但不能無限大,畢竟要受到ρ1等參數(shù)的影響。從表中也可看出,對(duì)于那三組不關(guān)于d=1的抽樣區(qū)間(d1,d2),總是d1與d2相差最大的那組(0.1,1.5)的效果最好。而在多數(shù)情況下,通常取關(guān)于d對(duì)稱的d1與d2的值能使控制圖達(dá)到最優(yōu)效果,正如表中的兩組關(guān)于d=1對(duì)稱的d1與d2的取值,此時(shí)VSIPoisson INAR(1)CUSUM的效果最佳。
表1 帶有不同k和h值的單邊FSI圖和VSI圖在穩(wěn)態(tài)時(shí)的ATS取值
圖1 帶著相同均值漂移率的FSI和VSI的ATS值比較
圖1 中共有四條線段,其中參數(shù)(h,k,c0)為(16,3,0)的FSI圖和VSI圖以及參數(shù)為(17,3,12)的兩種控制圖的比較,很明顯當(dāng)參數(shù)相同時(shí)VSI的線段要比FSI的略低;再者,無論是FSI圖還是VSI圖,c0值較大的控制圖相應(yīng)的ATS值小。
由于在實(shí)踐中所采集的數(shù)據(jù)通常具有自相關(guān)性,而多樣累積和控制圖在較小和中等參數(shù)漂移監(jiān)測(cè)中有優(yōu)越性,所以使用多樣累積和控制圖通過一個(gè)一階泊松取整的自回歸滑動(dòng)平均過程模型(定義為Poisson INAR(1))來監(jiān)測(cè),并且對(duì)其進(jìn)行可變抽樣區(qū)間設(shè)計(jì)。從文中可看出在參數(shù)大小相同的條件下,VSI圖的ATS值總是比FSI圖要小一些,也就是說無論在受控亦或是失控條件下,VSI圖都要比FSI圖靈敏。但就對(duì)VSI圖而言,考慮它的抽樣區(qū)間的組合,一般來說區(qū)間稍長的組合性能將更好一些。所以可變抽樣區(qū)間的累積和控制圖VSIPoisson INAR(1)CUSUM更加容易投入到實(shí)際生產(chǎn)或過程中去。
[1]McKenzie,Ed.A Traditional Interpretation of the Forecasts of Season?ally Differenced ARIMA Processes[Z].North-Holland,Amsterdam,1985.
[2]Weiss,C.H.Controlling Correlated Processes of Poisson Counts[J].Quality Reliability Engineering International,2007,23(6).
[3]Christian HWeib.Murat Caner Testik,CUSUMMonitoringof First-Or?der Integer-Valued Autoregressive Processes of Poisson Counts[J].Journal of Quality Technology,2009,41(4).
[4]Reynolds Jr.,M.R.,Arnold,J.C.X-bar Charts with Variable Sampling Intervals[J].Technometrics,1988,30(2).
[5]Reynolds Jr.,M.R.,Arnold,J.C.CUSUM Charts with Variable Sampling Intervals[J].Technometrics,1990,(32).
[6]Accucci M S,Amin R W,Lucas J M.Exponentially Moving Average Control Schemes with Variable Sampling Intervals[J].Communications in Statiatics-Simulation and Computation,1992,21(3).
[7]Yunzhao Luo,Zhonghua Li,Zhaojun Wang.Adaptive CUSUM Control Chart with Variable Sampling Intervals[J].Computational Statistics and Data Analysis,2009,(53).
[8]張維銘.可變抽樣區(qū)間的單邊控制圖[J].數(shù)理統(tǒng)計(jì)與管理,2002,6(21).
[9]濮曉龍.關(guān)于累積和(CUSUM)檢驗(yàn)的改進(jìn)[J].應(yīng)用數(shù)學(xué)學(xué)報(bào),2003,2(26).
[10]吉明明.具有可變抽樣區(qū)間的二維EWMA控制圖[J].系統(tǒng)工程理論與實(shí)踐,2007,9(9).