葉永和
(溫州市質(zhì)量技術(shù)檢測科學(xué)研究院/國家鞋類質(zhì)量監(jiān)督檢驗(yàn)中心(溫州),浙江 溫州 325007)
在監(jiān)督抽查過程中,要對核查總體(即監(jiān)督總體、監(jiān)督批產(chǎn)品或產(chǎn)品總體)進(jìn)行監(jiān)督時(shí),往往是采用隨機(jī)抽樣的方法,并通過樣品的檢驗(yàn)來做出判定。因此,一些人很自然地把監(jiān)督抽查判定核查總體正確與否等同于樣品的代表性強(qiáng)弱,認(rèn)為其代表性越強(qiáng),抽查判定結(jié)果的正確性越高、越準(zhǔn)確,反之相反。所以,很多質(zhì)量監(jiān)管部門或人員想方設(shè)法在抽查過程中提高樣品的代表性工作,這種看似合理的做法實(shí)際上是一種變相的刻舟求劍。
根據(jù)我國詞典[1]解釋:代表是指顯示同一類的共同特征的人或事物;性是指物質(zhì)所具有的性能或物質(zhì)因含有某種成分而產(chǎn)生的性質(zhì)。因此,代表性可以解釋為該物質(zhì)能顯示某種同類物質(zhì)所具備的性質(zhì)情況。換言之,某物體能反映該物種的性能,我們視它為該物種的代表,而它的性能或特點(diǎn)越接近該物種的性能與特點(diǎn),其代表性強(qiáng),反之其代表性弱。比如,某批男式皮鞋的幫底剝離強(qiáng)度均值為160 N/cm、割口裂口長度為8.0 mm、鞋跟結(jié)合力為1800 N 等,而某雙男式皮鞋的幫底剝離強(qiáng)度、割口裂口長度以及鞋跟結(jié)合力的特性參數(shù)值越接近160 N/cm、8.0 mm、1800 N,其代表性越強(qiáng),越能代表該批男式皮鞋的質(zhì)量值。又比如,某抽查的樣品合格品率越接近該產(chǎn)品總體的合格品率,我們就稱該樣品的代表性好,否則稱該樣品的代表性差。
在抽查工作中,樣品的代表性主要不是由抽樣工作的正確與否來決定的,也不是看隨機(jī)抽樣方法是否到位去判定的,而是由抽查方案與抽查性質(zhì)以及條件要求所體現(xiàn)出來,這一點(diǎn)大家必須有一個(gè)清晰的認(rèn)識。
抽樣是從產(chǎn)品總體中抽取部分產(chǎn)品的過程,它分為隨機(jī)抽樣與非隨機(jī)抽樣。根據(jù)國家抽樣標(biāo)準(zhǔn)[2]對隨機(jī)抽樣的定義:隨機(jī)抽樣是“從總體中抽取n 個(gè)抽樣單元構(gòu)成樣本,使n 個(gè)抽樣單元每一可能組合都有一個(gè)特定被抽到概率的抽樣”,而非隨機(jī)抽樣是除隨機(jī)抽樣外的其他抽樣總稱。換言之,隨機(jī)抽樣只是一種獲取樣品的方法,它主要是保證樣品抽到有一個(gè)特定的獲取概率,排除人為的主觀因素,為推演計(jì)算提供客觀的概率依據(jù),不存在隨機(jī)抽樣的樣品具備代表性之說。因?yàn)?,在落?shí)隨機(jī)抽樣中,產(chǎn)生隨機(jī)數(shù)的方法有4 種:隨機(jī)數(shù)表法、隨機(jī)數(shù)骰子法、偽隨機(jī)數(shù)發(fā)生器法以及撲克牌法等。但是,無論哪一種方法人們都是無法控制,所以獲得的樣品不可能有代表性,反而非隨機(jī)抽樣可以保證樣品的代表性。比如,判定抽樣、篩選抽樣等等。
同時(shí),在產(chǎn)品總體中不可能每件產(chǎn)品的特性參數(shù)值都一樣,哪怕是同一廠家、同一型號、同一批次、同一材料、按照同一標(biāo)準(zhǔn)生產(chǎn)的產(chǎn)品也不可能完全一樣,它是呈正態(tài)分布,以標(biāo)準(zhǔn)差σ的大小來表示產(chǎn)品特性參數(shù)值的分散程度。標(biāo)準(zhǔn)差σ 越小,表示產(chǎn)品特性參數(shù)值越集中,即相對的具有代表性產(chǎn)品數(shù)越多,反之就少,靠隨機(jī)抽樣是不可能獲得樣品能代表產(chǎn)品總體的質(zhì)量情況[3]。也就是說,抽樣獲取的樣品是否具有代表性不是看它是不是隨機(jī)抽樣,實(shí)際上與該產(chǎn)品總體的標(biāo)準(zhǔn)差σ 有關(guān),標(biāo)準(zhǔn)差σ 越小,隨機(jī)抽樣獲得代表性的樣品可能就越多。比如,某批男式皮鞋的外底耐磨性能均值為6 mm,用隨機(jī)抽樣是很難抽到外底耐磨性能為6 mm 值的皮鞋,尤其是標(biāo)準(zhǔn)差σ 比較大的產(chǎn)品總體,而采用非隨機(jī)抽樣方法——判定抽樣,就比較容易挑選出外底耐磨性能為6 mm 值的皮鞋。
在統(tǒng)計(jì)抽查中人們希望從隨機(jī)抽樣的樣品中能得到產(chǎn)品總體的特性參數(shù)值,而樣品的特性參數(shù)值越接近產(chǎn)品總體值越好,最好是相同,以此來代表產(chǎn)品總體特性參數(shù)值,許多科學(xué)家對此進(jìn)行探討。瑞士科學(xué)家伯努利在研究事件概率的過程中發(fā)現(xiàn),大量隨機(jī)現(xiàn)象的平均結(jié)果會趨向一個(gè)恒定值,因此創(chuàng)立了伯努利大數(shù)定理。
從伯努利大數(shù)定理[4]公式(1)得知,當(dāng)某件發(fā)生的概率p,與該事件發(fā)生次數(shù)γ有密切關(guān)系,隨著次數(shù)n增大,其趨向于該發(fā)生的概率p。
式中:p——發(fā)生概率;
γ——事件發(fā)生次數(shù);
n——發(fā)生次數(shù);
ε——大于零的任意數(shù)。
比如,把以事件次數(shù)n看作是樣品數(shù)量,把樣品出現(xiàn)特性參數(shù)值的次數(shù)視為γ,而抽查產(chǎn)品總體的特性參數(shù)值為概率p,根據(jù)伯努利大數(shù)定理,隨著抽取的樣品數(shù)量的增加,樣品的特性參數(shù)值(或占比)就接近產(chǎn)品總體的特性參數(shù)值(或比例),甚至與產(chǎn)品總體相同。
然而,在一般情況下把樣品的數(shù)量大于50 時(shí),所獲得的樣品統(tǒng)計(jì)特性參數(shù)值就比較接近該產(chǎn)品總體所擁有的特性參數(shù)值,或者說這兩者相差很小,即這些樣品的特性參數(shù)值能代表該產(chǎn)品總體的特性參數(shù)值,其代表性是隨著樣品數(shù)量的增多而加強(qiáng)。因此,在統(tǒng)計(jì)抽查中,可以從該產(chǎn)品總體中隨機(jī)抽樣100 件產(chǎn)品進(jìn)行檢驗(yàn),樣品的特性參數(shù)值或合格品率基本上等同于該產(chǎn)品總體的特性參數(shù)值或合格品率,樣品數(shù)量越多與產(chǎn)品總體值越接近,其代表性越好。換言之,在統(tǒng)計(jì)抽查中隨機(jī)抽樣得到的樣品能代表被抽查產(chǎn)品總體。
監(jiān)督抽查是通過樣品不合格的概率來判定核查總體為不合格總體。也就是說,監(jiān)督抽查是以隨機(jī)抽樣獲得的不合格樣品概率來推算核查總體達(dá)不到監(jiān)督抽查(n;L)對應(yīng)的聲稱質(zhì)量水平(即事先規(guī)定的質(zhì)量水平)值,判定為不合格,而不是以相同于樣品特性參數(shù)值不符合產(chǎn)品標(biāo)準(zhǔn)規(guī)定來證明核查總體該特性參數(shù)值也不符合,來判定核查總體不合格的。因?yàn)椋O(jiān)督抽查的判定方案是根據(jù)概率論的小概率事件原理設(shè)置的,不是以樣品的代表性強(qiáng)弱來判別的。
根據(jù)小概率事件原理[5],在監(jiān)督抽查中把實(shí)際不合格品率(即質(zhì)量水平)不高于規(guī)定不合格品率(即聲稱質(zhì)量水平),發(fā)生的抽查樣本(即樣品的集合)不合格設(shè)置的概率很小,一般為5%。如果在一次監(jiān)督抽查中發(fā)生樣本不合格(樣品不合格數(shù)d 大于不合格品限定數(shù)L,即d>L),說明該核查總體不合格品率大于規(guī)定的不合格品率,判為該核查總體不合格。所以,監(jiān)督抽查判定核查總體不合格不是根據(jù)樣品的代表性強(qiáng)弱做出的,而是以樣本出現(xiàn)不合格的概率來判定的。比如,監(jiān)督抽查2 個(gè)樣品,樣本只有三種可能:100%合格;50%合格與100%不合格,這樣的結(jié)果能代表核查總體也只有三種質(zhì)量水平嗎?或者說這2 個(gè)樣品的特性參數(shù)值能代表核查總體的特性參數(shù)值嗎?這顯然是不可能的,也是不正確的。
目前,國家監(jiān)督抽查標(biāo)準(zhǔn)[6-9]把錯(cuò)判概率設(shè)定為5%(即隨機(jī)小概率事件為5%),來設(shè)置監(jiān)督抽查方案(n;L),根據(jù)概率論的二項(xiàng)分布公式(2)計(jì)算[10]出當(dāng)核查總體的不合格品率為Pa(p)。
式中:L——不合格品限定數(shù);
d——樣本中的不合格品數(shù);
p——核查總體的實(shí)際質(zhì)量水平;
n——樣本量。
根據(jù)公式2,不同監(jiān)督抽查方案(n;L)與核查總體不合格品率之間的關(guān)系,如表1 為L=0 時(shí)、表2 為L=1 時(shí)所示。
表1 L=0 時(shí)樣本數(shù)n 與規(guī)定不合格品率的關(guān)系
表2 L=1 時(shí)樣本數(shù)n 與規(guī)定不合格品率的關(guān)系
從表1 得知,當(dāng)采用監(jiān)督抽查方案(n;0)時(shí),樣本中只要出現(xiàn)有不合格,按照小概率事件原理可以判定核查總體的合格品率達(dá)不到(n;0)對應(yīng)的聲稱質(zhì)量水平值,判為不合格,其置信概率為95%。
比如,監(jiān)督抽查方案(2;0),檢驗(yàn)發(fā)現(xiàn)1 個(gè)樣品不合格不是代表核查總體合格品率為50%,而是指合格品率達(dá)不到97.5%;2 個(gè)都不合格也不能說核查總體合格品率為100%不合格,只是肯定核查總體的不合格品率超過了2.5%。同樣,當(dāng)采用監(jiān)督抽查方案(13;1)時(shí),樣本中有2 個(gè)或3 個(gè)或4 個(gè)及以上樣品不合格,同樣可以肯定核查總體的合格品率達(dá)不到97.5%,判為不合格,但不代表對應(yīng)著核查總體的不合格品率為15.4%或23.1%或30.8%及以上,等等。(2;0)抽查方案沒有發(fā)現(xiàn)不合格品是不能證明該核查總體已達(dá)到97.5%合格品率或100%合格;同理,(13;1)監(jiān)督抽查沒有出現(xiàn)不合格品,或只發(fā)現(xiàn)1 個(gè)不合格品也不能說該核查總體的合格品率已達(dá)到97.5%或92.3%,只能說本次監(jiān)督抽查未發(fā)現(xiàn)該核查總體為不合格總體,或不否定其聲稱質(zhì)量水平值。其他監(jiān)督抽查方案(n;L)也以此類推:樣本不合格就可判定核查總體不合格,這是監(jiān)督抽查的特點(diǎn);而樣本合格是不能肯定核查總體合格,這也是監(jiān)督抽查的特點(diǎn)。
統(tǒng)計(jì)抽查的樣品具有代表性,而監(jiān)督抽查的樣品不具有代表性也并非絕對的。也就是說,隨著樣本數(shù)量增加或減少,以及設(shè)置條件的改變,樣品的代表性強(qiáng)弱也會隨之發(fā)生變化。
比如,在產(chǎn)品總體中隨機(jī)抽取500 個(gè)樣品,檢驗(yàn)后發(fā)現(xiàn)有1個(gè)或2 個(gè)或3 個(gè)樣品不合格,樣本的不合格品率分別為0.2%或0.4%或0.6%,從統(tǒng)計(jì)抽查角度來說檢驗(yàn)樣品具有代表性,它代表著產(chǎn)品總體的不合格品率分別為0.2%或0.4%或0.6%,它與實(shí)際產(chǎn)品總體的不合格品率值非常接近,這種之差是可以接受的。但是,如果在產(chǎn)品總體中隨機(jī)抽樣5 個(gè)樣品,檢驗(yàn)后發(fā)現(xiàn)有1個(gè)或2 個(gè)或3 個(gè)樣品不合格,樣本的不合格品率分別為20%或40%或60%,從統(tǒng)計(jì)抽查的角度來說檢驗(yàn)樣品還具有代表性嗎,肯定與實(shí)際產(chǎn)品總體的不合格品率相差很大,很顯然樣品是不具有代表性。也就是說隨著樣本量的下降,在統(tǒng)計(jì)抽查中其代表性是在逐漸減弱,直至消失。
然而,從監(jiān)督抽查角度來說,在核查總體中隨機(jī)抽樣5 個(gè)樣品,檢驗(yàn)后發(fā)現(xiàn)有1 個(gè)或2 個(gè)或3 個(gè)樣品不合格,它可以肯定核查總體的合格品率達(dá)不到99%,判其為不合格,可不能以樣品具有代表性來說明核查總體的不合格品率分別為20%或40%或60%。但是,如果監(jiān)督抽查500 個(gè)樣品,檢驗(yàn)后發(fā)現(xiàn)有3 個(gè)不合格品,樣本的不合格品率0.6%,這時(shí)既可以樣品具有代表性來判定核查總體的不合格品率為0.6%,也可以從監(jiān)督抽查角度肯定核查總體的合格品率達(dá)不到99.85%,判其為不合格。所以,樣品的代表性問題看似與樣本數(shù)量大小有關(guān),實(shí)際上還與由事先設(shè)置的條件要求有關(guān)。
在隨機(jī)抽樣的樣品是不是具備代表性,不是看抽樣工作的開展是否科學(xué)、合乎程序以及工作人員抽查是否認(rèn)真,而是由抽查方案與抽查性質(zhì)以及條件要求來決定的。在統(tǒng)計(jì)抽查中樣品表現(xiàn)出代表性,它是根據(jù)概率論的伯努利大數(shù)定理來決定樣品代表性的強(qiáng)弱;在監(jiān)督抽查中樣品是不具備代表性,它是根據(jù)概率論的小概率事件原理所設(shè)置判定的結(jié)果,是以樣品出現(xiàn)的不合格概率大小來推算得到。換言之,統(tǒng)計(jì)抽查與監(jiān)督抽查不是一回事,雖然都是采用隨機(jī)抽樣的方式獲取樣品,但是由于其設(shè)計(jì)理論基礎(chǔ)與條件要求的不同,所賦予樣品的性質(zhì)是不一樣的,不能把統(tǒng)計(jì)抽查的概念簡單地套用到監(jiān)督抽查之中,否則會造成監(jiān)督抽查判定方法與工作方向的混亂。這一點(diǎn)各級監(jiān)管部門要引起高度重視,應(yīng)認(rèn)真學(xué)習(xí)與掌握抽查控制理論,弄清抽查的性質(zhì)與目的,充分認(rèn)識在抽查中樣品的特性與作用。