方湘豫,雷軼菊,歐祖軍
(1. 吉首大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院, 湖南 吉首 416000; 2. 新鄉(xiāng)學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院, 河南 新鄉(xiāng) 453003)
部分因析設(shè)計(jì)廣泛應(yīng)用在工業(yè)和科學(xué)研究中.兩個(gè)部分因析設(shè)計(jì)稱為是組合同構(gòu)的,如果其中一個(gè)設(shè)計(jì)可由另一個(gè)設(shè)計(jì)通過重新安排試驗(yàn)順序,重新標(biāo)記因子和置換水平得到.由于兩個(gè)組合同構(gòu)設(shè)計(jì)在同一個(gè)經(jīng)典的方差分析模型中有相同的統(tǒng)計(jì)性質(zhì),故被認(rèn)為是等價(jià)的.從統(tǒng)計(jì)學(xué)的角度看,非組合同構(gòu)設(shè)計(jì)的判別不僅擴(kuò)大了隨機(jī)設(shè)計(jì)的種類,而且擴(kuò)大了各種效率準(zhǔn)則的取值范圍,例如文獻(xiàn)[1]中的p-準(zhǔn)則的取值范圍,因此對(duì)組合同構(gòu)設(shè)計(jì)的判別就顯得十分重要.
部分學(xué)者提出了一些設(shè)計(jì)組合同構(gòu)的檢測(cè)方法.兩個(gè)組合同構(gòu)設(shè)計(jì)的對(duì)應(yīng)試驗(yàn)點(diǎn)間的Hamming距離在所有維度上相等.文獻(xiàn)[2]基于該結(jié)論提出了檢測(cè)兩個(gè)設(shè)計(jì)是否同構(gòu)的算法.此外,文獻(xiàn)[3]提出了有效的算法,用來(lái)從若干個(gè)設(shè)計(jì)中判別組合同構(gòu)設(shè)計(jì),并要求在識(shí)別程序之前將這幾個(gè)設(shè)計(jì)中的每個(gè)設(shè)計(jì)排列成具體的形式.但文獻(xiàn)[3]只給出了判別設(shè)計(jì)組合同構(gòu)的充分條件,無(wú)法判別兩個(gè)非組合同構(gòu)設(shè)計(jì).文獻(xiàn)[2]和文獻(xiàn)[3]分別提出了組合同構(gòu)檢測(cè)的方法,除此之外,也有一些學(xué)者提出了非組合同構(gòu)的檢測(cè)方法.文獻(xiàn)[4]基于均勻性測(cè)度提出了一個(gè)用于檢測(cè)非組合同構(gòu)的新的算法,并對(duì)該算法提供了理論證明.文獻(xiàn)[5]提出了最小低階混雜優(yōu)化準(zhǔn)則,并證明了非組合同構(gòu)設(shè)計(jì)在該準(zhǔn)則下是不同的.文獻(xiàn)[6]分別基于投影Hamming距離模式和所有水平置換下設(shè)計(jì)的均勻性測(cè)度分布提出了快速投影Hamming距離模式分布算法和水平置換匹配算法,這兩個(gè)算法能夠快速有效地用于檢測(cè)兩個(gè)設(shè)計(jì)是否為非同構(gòu)設(shè)計(jì),其中水平置換匹配算法依次比較兩個(gè)設(shè)計(jì)在所有水平置換下的均勻性測(cè)度分布的均值、方差、偏度和峰度是否相等,如果在某一步驟上檢測(cè)出指標(biāo)不相等,則終止下一步的比較,且判別這兩個(gè)設(shè)計(jì)為非同構(gòu)設(shè)計(jì).
與文獻(xiàn)[6]不同的是,本文將基于KS檢驗(yàn)方法,KS檢驗(yàn)是常被用來(lái)比較兩個(gè)總體的分布是否相同的非參數(shù)統(tǒng)計(jì)方法[7],從假設(shè)檢驗(yàn)的角度對(duì)兩個(gè)設(shè)計(jì)在所有水平置換下的均勻性測(cè)度的分布是否相等進(jìn)行檢驗(yàn),以判別兩個(gè)設(shè)計(jì)是否組合同構(gòu).本文基于KS檢驗(yàn)討論了兩個(gè)設(shè)計(jì)是否組合同構(gòu).并用該方法對(duì)已有文獻(xiàn)的例子進(jìn)行了驗(yàn)證,得到的結(jié)果與已有文獻(xiàn)中的結(jié)果是一致的.
記d(n;qs)為一具有n次試驗(yàn)、s個(gè)q水平因子的設(shè)計(jì),設(shè)計(jì)d中每個(gè)因子取自集合{0,1,…,q-1}中的元素.
定義1若集合{0,1,…,q-1}中的q個(gè)元素在設(shè)計(jì)d(n;qs)的每個(gè)因子中出現(xiàn)的次數(shù)相同,則稱設(shè)計(jì)d為對(duì)稱U-型設(shè)計(jì).
記D(n;qs)為包含所有對(duì)稱U-型設(shè)計(jì)d(n;qs)的集合.對(duì)任意的設(shè)計(jì)d∈D(n;qs),d中的每個(gè)試驗(yàn)點(diǎn)(vi1,…,vis)可映射為[0,1)s的點(diǎn)(xi1,…,xis),其中xij=(2vij+1)/(2q),i=1,…,n,j=1,…,s.偏差作為U-型設(shè)計(jì)均勻性的評(píng)價(jià)標(biāo)準(zhǔn),用來(lái)刻畫試驗(yàn)點(diǎn)集在試驗(yàn)區(qū)域內(nèi)散布的均勻程度.目前有很多偏差可以用來(lái)衡量設(shè)計(jì)的均勻性,其中中心化L2-偏差和可卷型L2-偏差都是比較常用的偏差,而混合偏差在很大程度上克服了中心化L2-偏差和可卷型L2-偏差的不足之處[8].
定義2設(shè)d∈D(n;qs)為一n次試驗(yàn)、s個(gè)q水平的對(duì)稱U-型設(shè)計(jì),設(shè)計(jì)d的混合偏差可由下面表達(dá)式得到,
兩樣本的KS檢驗(yàn)是用來(lái)比較兩樣本的總體分布最常用的非參數(shù)方法[8].
設(shè)X1,…,Xm和Y1,…,Yn為分別來(lái)自總體F和G的獨(dú)立同分布樣本,即X1,…,Xm~F(x),Y1,…,Yn~G(x).兩樣本的總體分布F和G的假設(shè)檢驗(yàn)問題為
H0:F(x)=G(x)?H1:F(x)≠G(x).
當(dāng)樣本量較大時(shí), Glivenko給出了經(jīng)驗(yàn)分布函數(shù)Fn(x)與理論分布函數(shù)的F(x)接近程度的大樣本度量, 即證明了
由Glivenko定理知, 用經(jīng)驗(yàn)分布函數(shù)Fn(x)近似理論分布函數(shù)的F(x)是可行的.于是Smirnov提出了用下面的檢驗(yàn)統(tǒng)計(jì)量來(lái)檢驗(yàn)上述假設(shè)檢驗(yàn)問題:
式中:Fm(x),Gn(x)分別表示總體F,G基于樣本X1,…,Xm和Y1,…,Yn的經(jīng)驗(yàn)分布函數(shù).因此,Dmn愈小,直觀上看與原假設(shè)H0愈符合;反之,Dmn愈大,則與對(duì)立假設(shè)H1愈符合.由此,上述檢驗(yàn)假設(shè)問題的一個(gè)直觀合理的檢驗(yàn)φ為
φ:當(dāng)Dmn 其中:c(α)與檢驗(yàn)水平α有關(guān). 當(dāng)樣本量較大時(shí), Smirnov證明給出了在原假設(shè)H0成立時(shí), 統(tǒng)計(jì)量Dmn的極限分布 這與Kolmogorov[8]在1933年針對(duì)單樣本的分布擬合問題給出的極限分布只相差一個(gè)倍數(shù),故兩者可合用一個(gè)極限分布表. 對(duì)任意兩個(gè)設(shè)計(jì)d1,d2∈D(n;qs),討論基于KS檢驗(yàn)方法對(duì)設(shè)計(jì)d1,d2是否組合同構(gòu)進(jìn)行判別,該判別方法也適用于任意兩個(gè)具有相同大小的非對(duì)稱設(shè)計(jì)組合同構(gòu)的判別. 由設(shè)計(jì)的組合同構(gòu)定義可知,如果設(shè)計(jì)d1可由設(shè)計(jì)d2通過置換一些列的水平得到,則設(shè)計(jì)d1,d2是組合同構(gòu)的,但它們不一定有相同的幾何結(jié)構(gòu),也就導(dǎo)致了均勻性測(cè)度可能不同,即可能有不同的混合偏差值.另一方面,僅僅通過重新安排試驗(yàn)順序和重新標(biāo)記因子這兩類操作得到的組合同構(gòu)設(shè)計(jì),它們的混合偏差值不變. 對(duì)任意兩個(gè)設(shè)計(jì)d1,d2∈D(n;qs),若分別考慮設(shè)計(jì)d1,d2所有可能的水平置換,則分別可得到設(shè)計(jì)d1,d2的(q!)s個(gè)組合同構(gòu)設(shè)計(jì).記P(d1),P(d2)分別為設(shè)計(jì)d1,d2的l=(q!)s個(gè)組合同構(gòu)設(shè)計(jì)的集合.類似地,組合同構(gòu)的設(shè)計(jì)在幾何結(jié)構(gòu)上可能不同,從而使得組合同構(gòu)設(shè)計(jì)的混合偏差值也可能不同. 下面的定理給出了設(shè)計(jì)d1,d2組合同構(gòu)判別的理論基礎(chǔ). 本文基于KS檢驗(yàn)方法對(duì)X1,…,Xl和Y1,…,Yl的總體分布F和G是否相同來(lái)實(shí)現(xiàn)對(duì)設(shè)計(jì)d1,d2組合同構(gòu)的判別,其判別的具體步驟如下. 第一步 對(duì)任意兩個(gè)設(shè)計(jì)d1,d2∈D(n;qs),分別計(jì)算設(shè)計(jì)d1,d2的所有水平置換設(shè)計(jì)的混合偏差值 第二步 提出假設(shè)H0:F(x)=G(x)?H1:F(x)≠G(x). 第三步 基于KS檢驗(yàn)方法,若拒絕H0,則判別設(shè)計(jì)d1,d2為非組合同構(gòu),否則判別設(shè)計(jì)d1,d2為組合同構(gòu). 基于定理1,下面給出了設(shè)計(jì)d1,d2組合同構(gòu)判別的具體算法. 算法:判別兩個(gè)設(shè)計(jì)d1,d2∈D(n;qs)組合同構(gòu). 輸入:兩個(gè)設(shè)計(jì)d1,d2∈D(n;qs). 輸出:設(shè)計(jì)d1,d2是否組合同構(gòu). 步驟: KS檢驗(yàn): 將兩組樣本合并為一組樣本,記為S. whileS不為空do 從S中選擇一個(gè)樣本X0,計(jì)算|Fl(X0)-Gl(X0)| end if 從S中刪除樣本X0 end while 設(shè)計(jì)d1,d2組合同構(gòu) else 設(shè)計(jì)d1,d2非組合同構(gòu) end if 本節(jié)中提供了兩個(gè)數(shù)值例子來(lái)驗(yàn)證基于KS檢驗(yàn)的組合同構(gòu)設(shè)計(jì)判別方法的有效性.數(shù)值例子表明:基于KS檢驗(yàn)的組合同構(gòu)設(shè)計(jì)判別方法是非??焖儆行У? 例1考慮文獻(xiàn)[9]中的三個(gè)設(shè)計(jì)d1,d2,d3∈D(18;37),具體的設(shè)計(jì)如表1所列.由文獻(xiàn)[9]可知設(shè)計(jì)d1,d2,d3是非組合同構(gòu)設(shè)計(jì).現(xiàn)利用KS檢驗(yàn)來(lái)對(duì)其是否組合同構(gòu)進(jìn)行判別,具體數(shù)值結(jié)果如表2所列. 表1 三個(gè)非組合同構(gòu)設(shè)計(jì)d1,d2,d3∈D(18;37) 由表2可以發(fā)現(xiàn)設(shè)計(jì)d1,d2,d3間是否組合同構(gòu)的KS檢驗(yàn)結(jié)果中的p值全都小于2.2e-16,故原假設(shè)H0不成立,即設(shè)計(jì)d1,d2,d3在所有水平置換下的設(shè)計(jì)的混合偏差的分布兩兩互不相同,因此設(shè)計(jì)d1,d2,d3兩兩非組合同構(gòu),這與文獻(xiàn)[9]中的結(jié)果是一致的. 表2 設(shè)計(jì)d1,d2,d3間是否組合同構(gòu)的KS檢驗(yàn)結(jié)果 本文基于KS檢驗(yàn)給出了一種判別U-型設(shè)計(jì)是否組合同構(gòu)的簡(jiǎn)單的方法,數(shù)值例子表明該方法對(duì)于設(shè)計(jì)的組合同構(gòu)判別非常有效,同時(shí)該方法也可推廣至非對(duì)稱U-型設(shè)計(jì)的組合同構(gòu)的判別,可為一般結(jié)構(gòu)的設(shè)計(jì)組合同構(gòu)研究提供參考. 表3 兩個(gè)組合同構(gòu)設(shè)計(jì)d4,d5∈D(9;33)2 基于KS檢驗(yàn)的組合同構(gòu)設(shè)計(jì) 判別
3 數(shù)值例子
4 結(jié)語(yǔ)