論質(zhì)量技術(shù)檢測中抽查樣品的代表性

2022-08-12 08:40:06葉永和

西部皮革 2022年15期

葉永和

（溫州市質(zhì)量技術(shù)檢測科學(xué)研究院/國家鞋類質(zhì)量監(jiān)督檢驗(yàn)中心（溫州），浙江溫州 325007）

引言

在監(jiān)督抽查過程中，要對核查總體（即監(jiān)督總體、監(jiān)督批產(chǎn)品或產(chǎn)品總體）進(jìn)行監(jiān)督時(shí)，往往是采用隨機(jī)抽樣的方法，并通過樣品的檢驗(yàn)來做出判定。因此，一些人很自然地把監(jiān)督抽查判定核查總體正確與否等同于樣品的代表性強(qiáng)弱，認(rèn)為其代表性越強(qiáng)，抽查判定結(jié)果的正確性越高、越準(zhǔn)確，反之相反。所以，很多質(zhì)量監(jiān)管部門或人員想方設(shè)法在抽查過程中提高樣品的代表性工作，這種看似合理的做法實(shí)際上是一種變相的刻舟求劍。

1 對代表性的認(rèn)識

根據(jù)我國詞典[1]解釋：代表是指顯示同一類的共同特征的人或事物；性是指物質(zhì)所具有的性能或物質(zhì)因含有某種成分而產(chǎn)生的性質(zhì)。因此，代表性可以解釋為該物質(zhì)能顯示某種同類物質(zhì)所具備的性質(zhì)情況。換言之，某物體能反映該物種的性能，我們視它為該物種的代表，而它的性能或特點(diǎn)越接近該物種的性能與特點(diǎn)，其代表性強(qiáng)，反之其代表性弱。比如，某批男式皮鞋的幫底剝離強(qiáng)度均值為160 N/cm、割口裂口長度為8.0 mm、鞋跟結(jié)合力為1800 N 等，而某雙男式皮鞋的幫底剝離強(qiáng)度、割口裂口長度以及鞋跟結(jié)合力的特性參數(shù)值越接近160 N/cm、8.0 mm、1800 N，其代表性越強(qiáng)，越能代表該批男式皮鞋的質(zhì)量值。又比如，某抽查的樣品合格品率越接近該產(chǎn)品總體的合格品率，我們就稱該樣品的代表性好，否則稱該樣品的代表性差。

2 抽查樣品的代表性

在抽查工作中，樣品的代表性主要不是由抽樣工作的正確與否來決定的，也不是看隨機(jī)抽樣方法是否到位去判定的，而是由抽查方案與抽查性質(zhì)以及條件要求所體現(xiàn)出來，這一點(diǎn)大家必須有一個(gè)清晰的認(rèn)識。

2.1 隨機(jī)抽樣獲得樣品的特點(diǎn)

抽樣是從產(chǎn)品總體中抽取部分產(chǎn)品的過程，它分為隨機(jī)抽樣與非隨機(jī)抽樣。根據(jù)國家抽樣標(biāo)準(zhǔn)[2]對隨機(jī)抽樣的定義：隨機(jī)抽樣是“從總體中抽取n 個(gè)抽樣單元構(gòu)成樣本，使n 個(gè)抽樣單元每一可能組合都有一個(gè)特定被抽到概率的抽樣”，而非隨機(jī)抽樣是除隨機(jī)抽樣外的其他抽樣總稱。換言之，隨機(jī)抽樣只是一種獲取樣品的方法，它主要是保證樣品抽到有一個(gè)特定的獲取概率，排除人為的主觀因素，為推演計(jì)算提供客觀的概率依據(jù)，不存在隨機(jī)抽樣的樣品具備代表性之說。因?yàn)?，在落?shí)隨機(jī)抽樣中，產(chǎn)生隨機(jī)數(shù)的方法有4 種：隨機(jī)數(shù)表法、隨機(jī)數(shù)骰子法、偽隨機(jī)數(shù)發(fā)生器法以及撲克牌法等。但是，無論哪一種方法人們都是無法控制，所以獲得的樣品不可能有代表性，反而非隨機(jī)抽樣可以保證樣品的代表性。比如，判定抽樣、篩選抽樣等等。

同時(shí)，在產(chǎn)品總體中不可能每件產(chǎn)品的特性參數(shù)值都一樣，哪怕是同一廠家、同一型號、同一批次、同一材料、按照同一標(biāo)準(zhǔn)生產(chǎn)的產(chǎn)品也不可能完全一樣，它是呈正態(tài)分布，以標(biāo)準(zhǔn)差σ的大小來表示產(chǎn)品特性參數(shù)值的分散程度。標(biāo)準(zhǔn)差σ 越小，表示產(chǎn)品特性參數(shù)值越集中，即相對的具有代表性產(chǎn)品數(shù)越多，反之就少，靠隨機(jī)抽樣是不可能獲得樣品能代表產(chǎn)品總體的質(zhì)量情況[3]。也就是說，抽樣獲取的樣品是否具有代表性不是看它是不是隨機(jī)抽樣，實(shí)際上與該產(chǎn)品總體的標(biāo)準(zhǔn)差σ 有關(guān)，標(biāo)準(zhǔn)差σ 越小，隨機(jī)抽樣獲得代表性的樣品可能就越多。比如，某批男式皮鞋的外底耐磨性能均值為6 mm，用隨機(jī)抽樣是很難抽到外底耐磨性能為6 mm 值的皮鞋，尤其是標(biāo)準(zhǔn)差σ 比較大的產(chǎn)品總體，而采用非隨機(jī)抽樣方法——判定抽樣，就比較容易挑選出外底耐磨性能為6 mm 值的皮鞋。

2.2 統(tǒng)計(jì)抽查的樣品具有代表性

在統(tǒng)計(jì)抽查中人們希望從隨機(jī)抽樣的樣品中能得到產(chǎn)品總體的特性參數(shù)值，而樣品的特性參數(shù)值越接近產(chǎn)品總體值越好，最好是相同，以此來代表產(chǎn)品總體特性參數(shù)值，許多科學(xué)家對此進(jìn)行探討。瑞士科學(xué)家伯努利在研究事件概率的過程中發(fā)現(xiàn)，大量隨機(jī)現(xiàn)象的平均結(jié)果會趨向一個(gè)恒定值，因此創(chuàng)立了伯努利大數(shù)定理。

從伯努利大數(shù)定理[4]公式（1）得知，當(dāng)某件發(fā)生的概率p，與該事件發(fā)生次數(shù)γ有密切關(guān)系，隨著次數(shù)n增大，其趨向于該發(fā)生的概率p。

式中：p——發(fā)生概率；

γ——事件發(fā)生次數(shù)；

n——發(fā)生次數(shù)；

ε——大于零的任意數(shù)。

比如，把以事件次數(shù)n看作是樣品數(shù)量，把樣品出現(xiàn)特性參數(shù)值的次數(shù)視為γ，而抽查產(chǎn)品總體的特性參數(shù)值為概率p，根據(jù)伯努利大數(shù)定理，隨著抽取的樣品數(shù)量的增加，樣品的特性參數(shù)值（或占比）就接近產(chǎn)品總體的特性參數(shù)值（或比例），甚至與產(chǎn)品總體相同。

然而，在一般情況下把樣品的數(shù)量大于50 時(shí)，所獲得的樣品統(tǒng)計(jì)特性參數(shù)值就比較接近該產(chǎn)品總體所擁有的特性參數(shù)值，或者說這兩者相差很小，即這些樣品的特性參數(shù)值能代表該產(chǎn)品總體的特性參數(shù)值，其代表性是隨著樣品數(shù)量的增多而加強(qiáng)。因此，在統(tǒng)計(jì)抽查中，可以從該產(chǎn)品總體中隨機(jī)抽樣100 件產(chǎn)品進(jìn)行檢驗(yàn)，樣品的特性參數(shù)值或合格品率基本上等同于該產(chǎn)品總體的特性參數(shù)值或合格品率，樣品數(shù)量越多與產(chǎn)品總體值越接近，其代表性越好。換言之，在統(tǒng)計(jì)抽查中隨機(jī)抽樣得到的樣品能代表被抽查產(chǎn)品總體。

2.3 監(jiān)督抽查的樣品不具有代表性

監(jiān)督抽查是通過樣品不合格的概率來判定核查總體為不合格總體。也就是說，監(jiān)督抽查是以隨機(jī)抽樣獲得的不合格樣品概率來推算核查總體達(dá)不到監(jiān)督抽查（n；L）對應(yīng)的聲稱質(zhì)量水平（即事先規(guī)定的質(zhì)量水平）值，判定為不合格，而不是以相同于樣品特性參數(shù)值不符合產(chǎn)品標(biāo)準(zhǔn)規(guī)定來證明核查總體該特性參數(shù)值也不符合，來判定核查總體不合格的。因?yàn)椋O(jiān)督抽查的判定方案是根據(jù)概率論的小概率事件原理設(shè)置的，不是以樣品的代表性強(qiáng)弱來判別的。

根據(jù)小概率事件原理[5]，在監(jiān)督抽查中把實(shí)際不合格品率（即質(zhì)量水平）不高于規(guī)定不合格品率（即聲稱質(zhì)量水平），發(fā)生的抽查樣本（即樣品的集合）不合格設(shè)置的概率很小，一般為5%。如果在一次監(jiān)督抽查中發(fā)生樣本不合格（樣品不合格數(shù)d 大于不合格品限定數(shù)L，即d＞L），說明該核查總體不合格品率大于規(guī)定的不合格品率，判為該核查總體不合格。所以，監(jiān)督抽查判定核查總體不合格不是根據(jù)樣品的代表性強(qiáng)弱做出的，而是以樣本出現(xiàn)不合格的概率來判定的。比如，監(jiān)督抽查2 個(gè)樣品，樣本只有三種可能：100%合格；50%合格與100%不合格，這樣的結(jié)果能代表核查總體也只有三種質(zhì)量水平嗎？或者說這2 個(gè)樣品的特性參數(shù)值能代表核查總體的特性參數(shù)值嗎？這顯然是不可能的，也是不正確的。

目前，國家監(jiān)督抽查標(biāo)準(zhǔn)[6-9]把錯(cuò)判概率設(shè)定為5%（即隨機(jī)小概率事件為5%），來設(shè)置監(jiān)督抽查方案（n；L），根據(jù)概率論的二項(xiàng)分布公式（2）計(jì)算[10]出當(dāng)核查總體的不合格品率為Pa(p)。

式中：L——不合格品限定數(shù)；

d——樣本中的不合格品數(shù)；

p——核查總體的實(shí)際質(zhì)量水平；

n——樣本量。

根據(jù)公式2，不同監(jiān)督抽查方案（n；L）與核查總體不合格品率之間的關(guān)系，如表1 為L=0 時(shí)、表2 為L=1 時(shí)所示。

表1 L=0 時(shí)樣本數(shù)n 與規(guī)定不合格品率的關(guān)系

表2 L=1 時(shí)樣本數(shù)n 與規(guī)定不合格品率的關(guān)系

從表1 得知，當(dāng)采用監(jiān)督抽查方案（n；0）時(shí)，樣本中只要出現(xiàn)有不合格，按照小概率事件原理可以判定核查總體的合格品率達(dá)不到（n；0）對應(yīng)的聲稱質(zhì)量水平值，判為不合格，其置信概率為95%。

比如，監(jiān)督抽查方案（2；0），檢驗(yàn)發(fā)現(xiàn)1 個(gè)樣品不合格不是代表核查總體合格品率為50%，而是指合格品率達(dá)不到97.5%；2 個(gè)都不合格也不能說核查總體合格品率為100%不合格，只是肯定核查總體的不合格品率超過了2.5%。同樣，當(dāng)采用監(jiān)督抽查方案（13；1）時(shí)，樣本中有2 個(gè)或3 個(gè)或4 個(gè)及以上樣品不合格，同樣可以肯定核查總體的合格品率達(dá)不到97.5%，判為不合格，但不代表對應(yīng)著核查總體的不合格品率為15.4%或23.1%或30.8%及以上，等等。（2；0）抽查方案沒有發(fā)現(xiàn)不合格品是不能證明該核查總體已達(dá)到97.5%合格品率或100%合格；同理，（13；1）監(jiān)督抽查沒有出現(xiàn)不合格品，或只發(fā)現(xiàn)1 個(gè)不合格品也不能說該核查總體的合格品率已達(dá)到97.5%或92.3%，只能說本次監(jiān)督抽查未發(fā)現(xiàn)該核查總體為不合格總體，或不否定其聲稱質(zhì)量水平值。其他監(jiān)督抽查方案（n；L）也以此類推：樣本不合格就可判定核查總體不合格，這是監(jiān)督抽查的特點(diǎn)；而樣本合格是不能肯定核查總體合格，這也是監(jiān)督抽查的特點(diǎn)。

2.4 樣品代表性的變化情況

統(tǒng)計(jì)抽查的樣品具有代表性，而監(jiān)督抽查的樣品不具有代表性也并非絕對的。也就是說，隨著樣本數(shù)量增加或減少，以及設(shè)置條件的改變，樣品的代表性強(qiáng)弱也會隨之發(fā)生變化。

比如，在產(chǎn)品總體中隨機(jī)抽取500 個(gè)樣品，檢驗(yàn)后發(fā)現(xiàn)有1個(gè)或2 個(gè)或3 個(gè)樣品不合格，樣本的不合格品率分別為0.2%或0.4%或0.6%，從統(tǒng)計(jì)抽查角度來說檢驗(yàn)樣品具有代表性，它代表著產(chǎn)品總體的不合格品率分別為0.2%或0.4%或0.6%，它與實(shí)際產(chǎn)品總體的不合格品率值非常接近，這種之差是可以接受的。但是，如果在產(chǎn)品總體中隨機(jī)抽樣5 個(gè)樣品，檢驗(yàn)后發(fā)現(xiàn)有1個(gè)或2 個(gè)或3 個(gè)樣品不合格，樣本的不合格品率分別為20%或40%或60%，從統(tǒng)計(jì)抽查的角度來說檢驗(yàn)樣品還具有代表性嗎，肯定與實(shí)際產(chǎn)品總體的不合格品率相差很大，很顯然樣品是不具有代表性。也就是說隨著樣本量的下降，在統(tǒng)計(jì)抽查中其代表性是在逐漸減弱，直至消失。

然而，從監(jiān)督抽查角度來說，在核查總體中隨機(jī)抽樣5 個(gè)樣品，檢驗(yàn)后發(fā)現(xiàn)有1 個(gè)或2 個(gè)或3 個(gè)樣品不合格，它可以肯定核查總體的合格品率達(dá)不到99%，判其為不合格，可不能以樣品具有代表性來說明核查總體的不合格品率分別為20%或40%或60%。但是，如果監(jiān)督抽查500 個(gè)樣品，檢驗(yàn)后發(fā)現(xiàn)有3 個(gè)不合格品，樣本的不合格品率0.6%，這時(shí)既可以樣品具有代表性來判定核查總體的不合格品率為0.6%，也可以從監(jiān)督抽查角度肯定核查總體的合格品率達(dá)不到99.85%，判其為不合格。所以，樣品的代表性問題看似與樣本數(shù)量大小有關(guān)，實(shí)際上還與由事先設(shè)置的條件要求有關(guān)。

3 結(jié)束語

在隨機(jī)抽樣的樣品是不是具備代表性，不是看抽樣工作的開展是否科學(xué)、合乎程序以及工作人員抽查是否認(rèn)真，而是由抽查方案與抽查性質(zhì)以及條件要求來決定的。在統(tǒng)計(jì)抽查中樣品表現(xiàn)出代表性，它是根據(jù)概率論的伯努利大數(shù)定理來決定樣品代表性的強(qiáng)弱；在監(jiān)督抽查中樣品是不具備代表性，它是根據(jù)概率論的小概率事件原理所設(shè)置判定的結(jié)果，是以樣品出現(xiàn)的不合格概率大小來推算得到。換言之，統(tǒng)計(jì)抽查與監(jiān)督抽查不是一回事，雖然都是采用隨機(jī)抽樣的方式獲取樣品，但是由于其設(shè)計(jì)理論基礎(chǔ)與條件要求的不同，所賦予樣品的性質(zhì)是不一樣的，不能把統(tǒng)計(jì)抽查的概念簡單地套用到監(jiān)督抽查之中，否則會造成監(jiān)督抽查判定方法與工作方向的混亂。這一點(diǎn)各級監(jiān)管部門要引起高度重視，應(yīng)認(rèn)真學(xué)習(xí)與掌握抽查控制理論，弄清抽查的性質(zhì)與目的，充分認(rèn)識在抽查中樣品的特性與作用。