金勇進(jìn),姜天英
(中國人民大學(xué) a.應(yīng)用統(tǒng)計(jì)科學(xué)研究中心;b.統(tǒng)計(jì)學(xué)院;c.調(diào)查技術(shù)研究所,北京 100872)
工業(yè)發(fā)展事關(guān)國家發(fā)展大計(jì),是衡量國家生產(chǎn)力水平與經(jīng)濟(jì)發(fā)展的重要依據(jù)。為全面科學(xué)掌握中國工業(yè)發(fā)展的基本情況,按照當(dāng)前的統(tǒng)計(jì)制度,以年主營業(yè)務(wù)收入2 000萬元為劃分標(biāo)準(zhǔn),將工業(yè)劃分為規(guī)模以上工業(yè)和規(guī)模以下工業(yè),其中規(guī)模以上工業(yè)是指年主營業(yè)務(wù)收入2 000萬元及以上的工業(yè)法人單位,通過聯(lián)網(wǎng)直報(bào)進(jìn)行全面調(diào)查;規(guī)模以下工業(yè)則為年主營業(yè)務(wù)收入2 000萬元以下的工業(yè)法人單位和全部個(gè)體經(jīng)營工業(yè)單位,采用按企業(yè)名錄庫的一階段分層隨機(jī)抽樣和按行政區(qū)劃的分層隨機(jī)整群抽樣相結(jié)合的方法進(jìn)行抽樣調(diào)查。
但是,隨著經(jīng)濟(jì)的快速發(fā)展,在市場競爭機(jī)制的作用下,工業(yè)企業(yè)新增消亡加快,升規(guī)降規(guī)現(xiàn)象頻繁,工業(yè)調(diào)查制度暴露出了諸多問題。本文將主要討論其中兩個(gè)問題:一是工業(yè)企業(yè)規(guī)模劃分值的合理性問題,即2 000萬元的劃分值與目前的工業(yè)發(fā)展是否匹配。目前所采用的規(guī)模劃分值是2011年制定的2 000萬元,但2011—2017年國內(nèi)生產(chǎn)總值增長約75%,工業(yè)增加值增長約49%,而該劃分標(biāo)準(zhǔn)并未調(diào)整,所以2 000萬元的劃分標(biāo)準(zhǔn)是否合理需進(jìn)一步評估。如果當(dāng)前的標(biāo)準(zhǔn)不合理,則將規(guī)模劃分值調(diào)整為多少才能與當(dāng)前的工業(yè)發(fā)展相適應(yīng)也是急需解決的問題;二是規(guī)模劃分指標(biāo)的科學(xué)性問題,即年主營業(yè)務(wù)收入是否是最合適的劃分指標(biāo)。當(dāng)前所選取的劃分指標(biāo)為年主營業(yè)務(wù)收入,雖然從理論上講,年主營業(yè)務(wù)收入能直接準(zhǔn)確地反映企業(yè)規(guī)模,但在實(shí)際操作中,一方面,由于該指標(biāo)較為敏感,部分企業(yè)本著“報(bào)少不報(bào)多”的思想,為避免“露富”,可能出現(xiàn)瞞報(bào)的現(xiàn)象;也有部分企業(yè)為夸大企業(yè)效益,可能出現(xiàn)虛報(bào)多報(bào)的現(xiàn)象。另一方面,由于部分企業(yè)的財(cái)務(wù)制度不健全等原因,可能出現(xiàn)錯填亂填的現(xiàn)象。這些現(xiàn)象都將導(dǎo)致收集到的數(shù)據(jù)存在偏差,真實(shí)性有待考究,進(jìn)而影響后續(xù)對目標(biāo)量的估計(jì)。因此,通過統(tǒng)計(jì)學(xué)的方法尋找最優(yōu)的工業(yè)企業(yè)規(guī)模劃分標(biāo)準(zhǔn)對工業(yè)統(tǒng)計(jì)具有十分重要的意義。
為更好地解決以上問題,本文以湖北省為例,通過對數(shù)據(jù)的測算,確定最優(yōu)的工業(yè)企業(yè)規(guī)模劃分標(biāo)準(zhǔn),從而合理地展現(xiàn)工業(yè)發(fā)展的實(shí)際情況,為統(tǒng)計(jì)制度提供科學(xué)依據(jù)。
自工業(yè)統(tǒng)計(jì)調(diào)查實(shí)施以來,國家統(tǒng)計(jì)局對工業(yè)規(guī)模劃分的標(biāo)準(zhǔn)有過多次的修改和調(diào)整。1996年按照《工業(yè)統(tǒng)計(jì)定期抽樣調(diào)查試點(diǎn)方案》對全國范圍的工業(yè)統(tǒng)計(jì)進(jìn)行試點(diǎn)調(diào)查,該方案規(guī)定的限額指標(biāo)為工業(yè)總產(chǎn)值,限額值為500萬元;1998—2005年,將限額指標(biāo)調(diào)整為年產(chǎn)品銷售收入,限額值仍為500萬元;2006年將限額指標(biāo)修改為年主營業(yè)務(wù)收入;2011年將500萬元的限額值提高到了2 000萬元。工業(yè)統(tǒng)計(jì)調(diào)查自實(shí)施以來,規(guī)模劃分標(biāo)準(zhǔn)雖然已有過多次調(diào)整,但調(diào)整過程相對緩慢,因此國內(nèi)對于工業(yè)企業(yè)規(guī)模劃分的研究也在不斷進(jìn)行中。從問題研究角度看,《規(guī)模以下工業(yè)抽樣框問題研究》課題組在對規(guī)模以下工業(yè)抽樣框存在的問題研究中,提出了年銷售收入的指標(biāo)是否合適以及500萬元的限額值對各省市來說是否科學(xué)的問題,并提出可以允許各省市按照某一指標(biāo)(GDP、銷售收入等)的累計(jì)比重來確定規(guī)模劃分的界限[1];曾五一等在2011年對工業(yè)統(tǒng)計(jì)調(diào)查制度進(jìn)一步做了研究,通過對福建省規(guī)模以上和規(guī)模以下工業(yè)的產(chǎn)值結(jié)構(gòu)比例測算,指出隨著經(jīng)濟(jì)發(fā)展和價(jià)格變動,500萬元的規(guī)模劃分標(biāo)準(zhǔn)急需修訂[2];許憲春曾在2011年指出,適當(dāng)?shù)靥岣吖I(yè)規(guī)模劃分標(biāo)準(zhǔn)有利于集中力量嚴(yán)審數(shù)據(jù),提高數(shù)據(jù)質(zhì)量[3]??偟膩碚f,從問題研究的角度上看,主要討論的就是劃分指標(biāo)的合理性和劃分值的全國統(tǒng)一標(biāo)準(zhǔn)與提高的問題;從方法研究的角度上看,主要是考慮如何確定規(guī)模劃分標(biāo)準(zhǔn)以及評估方法等[2,4]。
鑒于以上討論,本文的研究將借鑒諸多評價(jià)方法,從問題研究的角度對工業(yè)企業(yè)規(guī)模劃分標(biāo)準(zhǔn)進(jìn)行研究,即選取最優(yōu)劃分指標(biāo)和確定最優(yōu)劃分值。一方面,在最優(yōu)劃分指標(biāo)的選取上,本文預(yù)先選定了兩個(gè)指標(biāo):年主營業(yè)務(wù)收入和從業(yè)人數(shù)。其中,年主營業(yè)務(wù)收入是當(dāng)前的劃分指標(biāo),因此仍將其保留作為一個(gè)備選指標(biāo);而選取從業(yè)人數(shù)作為另一個(gè)備選指標(biāo)是因?yàn)?,該指?biāo)被廣泛地應(yīng)用于國外的諸多調(diào)查中,如英國的年度商業(yè)調(diào)查(劃分值為250人)、奧地利的經(jīng)濟(jì)結(jié)構(gòu)調(diào)查(工業(yè)類劃分值為20人)以及印度的工業(yè)調(diào)查(劃分值為100人)等[5-7]。對于最優(yōu)指標(biāo)的評價(jià)上,本文從離散性和穩(wěn)定性兩個(gè)方面考慮,選取了離散系數(shù)和指標(biāo)增速來判定,從而選取兩個(gè)指標(biāo)中較為穩(wěn)定的一個(gè)。另一方面,即在最優(yōu)劃分值的確定上,我們立足于以下目標(biāo):規(guī)模以上和規(guī)模以下工業(yè)企業(yè)各自占全部工業(yè)的年主營業(yè)務(wù)收入比重恰當(dāng),能有效控制規(guī)模以下工業(yè)企業(yè)調(diào)查的樣本量和抽樣誤差以及不同規(guī)模劃分值下的離散性,運(yùn)用邊際理論、樣本量與抽樣誤差的關(guān)系以及離散系數(shù)來判定。在本文的研究中,為了更全面地展示兩個(gè)指標(biāo)的差異性,首先討論的是兩個(gè)指標(biāo)各自的最優(yōu)劃分值確定,然后研究在兩個(gè)指標(biāo)中選取較優(yōu)的劃分指標(biāo)。
本文研究的是工業(yè)企業(yè)規(guī)模標(biāo)準(zhǔn)劃分問題,故所需數(shù)據(jù)涉及規(guī)模以上工業(yè)企業(yè)和規(guī)模以下工業(yè)企業(yè)。以下所用數(shù)據(jù)均已經(jīng)過脫敏處理。其中,規(guī)模以上工業(yè)企業(yè)依據(jù)2017年《湖北統(tǒng)計(jì)年鑒》和湖北省統(tǒng)計(jì)局的調(diào)查數(shù)據(jù)結(jié)果,指標(biāo)為年主營業(yè)務(wù)收入(單位:千元)和從業(yè)人數(shù)(單位:人)。由于規(guī)模以上工業(yè)企業(yè)調(diào)查的方法是聯(lián)網(wǎng)直報(bào)的全面調(diào)查,剔除數(shù)據(jù)中年主營業(yè)務(wù)收入為0的企業(yè),湖北省2016年規(guī)模以上工業(yè)企業(yè)共計(jì)15 972家。為了與規(guī)模以上工業(yè)數(shù)據(jù)匹配,依據(jù)國家統(tǒng)計(jì)局湖北調(diào)查總隊(duì)的調(diào)查數(shù)據(jù)結(jié)果,規(guī)模以下工業(yè)企業(yè)數(shù)據(jù)的指標(biāo)也選取年主營業(yè)務(wù)收入(單位:千元)和從業(yè)人數(shù)(單位:人)。規(guī)模以下工業(yè)企業(yè)數(shù)據(jù)是由抽樣調(diào)查得來,共有1 166家樣本企業(yè)被抽中,剔除年主營業(yè)務(wù)收入為0的企業(yè),僅有630家有效樣本企業(yè)。
為了更全面科學(xué)地討論工業(yè)企業(yè)規(guī)模標(biāo)準(zhǔn)劃分問題,需要采用規(guī)模以上工業(yè)企業(yè)和規(guī)模以下工業(yè)企業(yè)的總體數(shù)據(jù)來進(jìn)行測算,從總體的角度對離散性、穩(wěn)定性等進(jìn)行評估。規(guī)模以上工業(yè)企業(yè)是通過聯(lián)網(wǎng)直報(bào)的全面調(diào)查獲取數(shù)據(jù),因此有完備的2016年湖北省規(guī)模以上工業(yè)企業(yè)的總體數(shù)據(jù);但規(guī)模以下工業(yè)企業(yè)采用的是抽樣調(diào)查獲取數(shù)據(jù),僅在經(jīng)濟(jì)普查年份有總體數(shù)據(jù),因此需要對規(guī)模以下工業(yè)企業(yè)數(shù)據(jù)進(jìn)行模擬,得到2016年湖北省規(guī)模以下工業(yè)企業(yè)的總體數(shù)據(jù)。由于抽樣調(diào)查年份的規(guī)模以下工業(yè)企業(yè)總數(shù)量未知,且規(guī)模以下工業(yè)調(diào)查的抽樣框是保持5年不變的,因此本文將2016年湖北省規(guī)模以下工業(yè)企業(yè)抽樣總體規(guī)模設(shè)定為34 880家企業(yè)(2013年普查數(shù)據(jù)),樣本量為1 166家企業(yè),由此可得到抽樣比為0.033。需要注意的是,總數(shù)量34 880家企業(yè)的設(shè)定稍有不足,因工業(yè)企業(yè)每年都會有新增和消亡,該總數(shù)量是處在不斷變動中的,但并無官方數(shù)據(jù)的數(shù)量增長情況,因此為簡化計(jì)算,則將2016年規(guī)模以下工業(yè)企業(yè)數(shù)量設(shè)置為34 880家。
在由樣本模擬總體的過程中,考慮計(jì)算樣本的統(tǒng)計(jì)特征,檢驗(yàn)其所屬分布,得到樣本分布的具體信息。用樣本分布模擬出總體分布,可以得到34 880家規(guī)模以下工業(yè)企業(yè)總體數(shù)據(jù)。模擬得到的規(guī)模以下工業(yè)企業(yè)總體信息用于后續(xù)測算離散系數(shù)、樣本量和抽樣誤差以及增速等。
對于年主營業(yè)務(wù)收入這一指標(biāo),運(yùn)用非參數(shù)方法檢驗(yàn)樣本所屬分布,與對數(shù)正態(tài)分布類似,因此考慮將數(shù)據(jù)進(jìn)行對數(shù)變換,直觀上QQ圖呈現(xiàn)一條直線,符合正態(tài)分布,運(yùn)用K-S檢驗(yàn)方法檢驗(yàn)正態(tài)性,得到檢驗(yàn)結(jié)果P值為0.35,大于0.05,不拒絕原假設(shè),可以認(rèn)為對數(shù)變換后的數(shù)據(jù)服從正態(tài)分布,計(jì)算其參數(shù)得到μ=6.6,σ2=2.5,即原分布服從對數(shù)正態(tài)分布Ln(6.6,2.5)。
對于從業(yè)人數(shù)這一指標(biāo),運(yùn)用非參數(shù)方法檢驗(yàn)樣本所屬分布,與對數(shù)正態(tài)分布類似,因此考慮將樣本數(shù)據(jù)進(jìn)行對數(shù)變換,直觀上看QQ圖呈現(xiàn)一條直線,符合正態(tài)分布,運(yùn)用K-S檢驗(yàn)方法檢驗(yàn)正態(tài)性,得到檢驗(yàn)結(jié)果P值為0.42,大于0.05,不拒絕原假設(shè),可以認(rèn)為對數(shù)變換后的樣本服從正態(tài)分布,計(jì)算其參數(shù)得到μ=2.2,σ2=0.9,即原分布服從對數(shù)正態(tài)分布Ln(2.2,0.9)。
根據(jù)樣本分布信息模擬總體,對規(guī)模以下工業(yè)企業(yè)進(jìn)行樣本擴(kuò)充,最終得到34 880家規(guī)模以下工業(yè)企業(yè)。將得到的34 880家規(guī)模以下工業(yè)企業(yè)與15 972家規(guī)模以上工業(yè)企業(yè)結(jié)合,即為2016年湖北省工業(yè)企業(yè)總體數(shù)據(jù),共計(jì)50 852家企業(yè)。為了驗(yàn)證數(shù)據(jù)模擬效果,計(jì)算湖北省規(guī)模以上工業(yè)企業(yè)年主營業(yè)務(wù)收入占所有工業(yè)企業(yè)年主營業(yè)務(wù)收入的比重,由實(shí)地調(diào)研了解到該比重約為93%,由模擬后的工業(yè)企業(yè)總體數(shù)據(jù)計(jì)算得到的湖北省規(guī)模以上工業(yè)企業(yè)年主營業(yè)務(wù)收入占總體年主營業(yè)務(wù)收入的比重為94%,可知模擬效果接近實(shí)際。接下來,將基于這50 852家企業(yè)數(shù)據(jù)進(jìn)行湖北省工業(yè)企業(yè)最優(yōu)規(guī)模劃分指標(biāo)和最優(yōu)規(guī)模劃分值的測算。
為了更全面地展示兩個(gè)指標(biāo)的差異性,本文先討論規(guī)模劃分值,而后再研究規(guī)模劃分指標(biāo)。隨著經(jīng)濟(jì)的發(fā)展,2011年制定的2 000萬元的規(guī)模劃分值與經(jīng)濟(jì)發(fā)展已不相適應(yīng),從實(shí)地調(diào)研來看,湖北省規(guī)模以下工業(yè)企業(yè)的年主營業(yè)務(wù)收入占所有工業(yè)企業(yè)的比例不到8%,規(guī)模以下工業(yè)企業(yè)所占比例過低,將對規(guī)模以下工業(yè)企業(yè)的抽樣調(diào)查造成較大影響。因此,我們認(rèn)為,當(dāng)前的年主營業(yè)務(wù)收入2 000萬元的劃分標(biāo)準(zhǔn)過低,急需對其進(jìn)行重新調(diào)整。對于備選指標(biāo)中的從業(yè)人數(shù)這一指標(biāo),不僅考慮到該指標(biāo)在國外調(diào)查中的廣泛應(yīng)用,也考慮到該指標(biāo)與年主營業(yè)務(wù)收入相比,可能相對穩(wěn)定,能在一定程度上減少地區(qū)差異,避免各地區(qū)因經(jīng)濟(jì)發(fā)展水平不同導(dǎo)致年主營業(yè)務(wù)收入作為劃分指標(biāo)時(shí)各地區(qū)的差異較大的問題。在對最優(yōu)規(guī)模劃分值的測算時(shí),本文采用了三種方法:邊際理論方法、樣本量與抽樣誤差以及離散系數(shù),下面將分別進(jìn)行說明。
1.邊際理論方法。首先研究年主營業(yè)務(wù)收入的劃分值,探究企業(yè)個(gè)數(shù)與工業(yè)企業(yè)年主營業(yè)務(wù)收入之間的關(guān)系。首先按50 852個(gè)樣本企業(yè)的年主營業(yè)務(wù)收入降序排序,以工業(yè)企業(yè)年主營業(yè)務(wù)收入的累計(jì)比重為縱軸,企業(yè)個(gè)數(shù)的累計(jì)比重為橫軸,繪制累計(jì)分布曲線圖,用來展示隨著企業(yè)個(gè)數(shù)的增加,年主營業(yè)務(wù)收入的累計(jì)情況,如圖1所示。因?yàn)閷τ谝?guī)模以上工業(yè)企業(yè),樣本量的成本主要來自于開展定期報(bào)表調(diào)查的成本,此時(shí)假設(shè)每個(gè)樣本單元的調(diào)查成本一致,該成本曲線應(yīng)是一條從原點(diǎn)出發(fā)的45度對角線。這條對角線可以稱為絕對平等線,即是若各工業(yè)企業(yè)的年主營業(yè)務(wù)收入完全一樣,年主營業(yè)務(wù)收入的累計(jì)分布曲線將完全等于這條對角線,那么將工業(yè)企業(yè)按規(guī)模劃分進(jìn)行統(tǒng)計(jì)調(diào)查則沒有實(shí)際的意義和必要。而在實(shí)際中,按照該方式繪制的累計(jì)分布曲線圖是一條上凸的曲線。此時(shí)引用邊際理論,最佳的規(guī)模劃分值是該累計(jì)分布曲線與45度成本曲線平行線的切點(diǎn),也即一階導(dǎo)數(shù)為1的點(diǎn)。在此點(diǎn)左側(cè)的工業(yè)企業(yè),每增加一定比例的企業(yè)個(gè)數(shù),都會帶來超過該比例的年主營業(yè)務(wù)收入信息;而在此點(diǎn)右側(cè)的工業(yè)企業(yè),每增加一定比例的企業(yè)個(gè)數(shù),都會帶來不足該比例的年主營業(yè)務(wù)收入信息。該點(diǎn)即為最佳劃分臨界點(diǎn),從圖1圓圈點(diǎn)左邊曲線可見,企業(yè)個(gè)數(shù)雖不多,但年主營業(yè)務(wù)收入累計(jì)比重大,應(yīng)進(jìn)行全面調(diào)查,同時(shí)對這部分上報(bào)數(shù)據(jù)加強(qiáng)審核檢查,保證原始數(shù)據(jù)質(zhì)量,由此可保證整個(gè)工業(yè)企業(yè)數(shù)據(jù)的絕大部分質(zhì)量;而圖1圓圈點(diǎn)右邊曲線,由于其信息攜帶較少,可采用抽樣調(diào)查的方式,從而減少企業(yè)調(diào)查數(shù)量,降低費(fèi)用和成本,而又不至于損失太多信息。
圖1 2016年湖北省企業(yè)累積分布曲線圖
由圖1可知,一階導(dǎo)數(shù)為1的點(diǎn)由圓圈所示,表示湖北省工業(yè)企業(yè)的最佳規(guī)模劃分值大約在工業(yè)企業(yè)年主營業(yè)務(wù)收入累計(jì)比重為80%~85%處最為適合,此時(shí)規(guī)模以上工業(yè)企業(yè)個(gè)數(shù)占所有工業(yè)企業(yè)個(gè)數(shù)的比重大約為14.0%,通過計(jì)算可得,此時(shí)規(guī)模劃分值為年主營業(yè)務(wù)收入1億元。由表1可知,規(guī)模在1億元以上各組中,企業(yè)個(gè)數(shù)占總體比重均小于工業(yè)企業(yè)年主營業(yè)務(wù)收入占總體的比重;而在8 000萬元至1億元組中,企業(yè)個(gè)數(shù)占總體的比重略大于工業(yè)企業(yè)年主營業(yè)務(wù)收入占總體的比重;在8 000萬元以下的各組中,企業(yè)個(gè)數(shù)占總體的比重都遠(yuǎn)大于工業(yè)企業(yè)年主營業(yè)務(wù)收入占總體的比重。也就是說,當(dāng)企業(yè)規(guī)模在1億元以上時(shí),每增加1%的調(diào)查成本(企業(yè)個(gè)數(shù))都可獲得比1%多的工業(yè)企業(yè)總年主營業(yè)務(wù)收入信息,其成本收益呈遞增趨勢;當(dāng)企業(yè)規(guī)模在1億元以下時(shí),增加1%的調(diào)查成本(企業(yè)個(gè)數(shù))只能獲得不到1%的工業(yè)企業(yè)總年主營業(yè)務(wù)收入信息,因此年主營業(yè)務(wù)收入1億元的劃分值能夠使得規(guī)模以上和規(guī)模以下企業(yè)所占年主營業(yè)務(wù)收入的比重恰當(dāng)。表1所示的分組劃分方法可以研究企業(yè)個(gè)數(shù)和工業(yè)企業(yè)總年主營業(yè)務(wù)收入的關(guān)系,即相當(dāng)于樣本量與調(diào)查效率的關(guān)系,對于最優(yōu)規(guī)模劃分值的確定有十分重要的理論意義。
表1 2016年湖北省全部工業(yè)企業(yè)按年主營業(yè)務(wù)收入分組數(shù)據(jù)分布表
注:分組區(qū)間為前閉后開區(qū)間,例如[0,2 000)。
運(yùn)用從業(yè)人數(shù)這一指標(biāo)可以從另一個(gè)角度劃分企業(yè)規(guī)模,從業(yè)人數(shù)和年主營業(yè)務(wù)收入的相關(guān)程度較高,一般越大型的企業(yè)其從業(yè)人數(shù)就越多。對于從業(yè)人數(shù)這一指標(biāo)的劃分值測算仍按照邊際理論,采用按從業(yè)人數(shù)分組的數(shù)據(jù)分布表,見表2。通過計(jì)算可得,此時(shí)從業(yè)人數(shù)為80人,規(guī)模以上工業(yè)企業(yè)個(gè)數(shù)占所有工業(yè)企業(yè)個(gè)數(shù)的比重大約為18.6%。由表2可知,規(guī)模在80人以上各組中,企業(yè)個(gè)數(shù)占總體比重均小于工業(yè)企業(yè)年主營業(yè)務(wù)收入占總體的比重;在規(guī)模70~80人組中,企業(yè)個(gè)數(shù)占總體的比重略大于工業(yè)企業(yè)年主營業(yè)務(wù)收入占總體的比重;在70人以下的組中,企業(yè)個(gè)數(shù)占總體的比重都遠(yuǎn)大于工業(yè)企業(yè)年主營業(yè)務(wù)收入占總體的比重。也就是說,當(dāng)企業(yè)規(guī)模在80人以上時(shí),每增加1%的調(diào)查成本都可獲得比1%更多的工業(yè)企業(yè)總年主營業(yè)務(wù)收入信息,其成本收益呈遞增趨勢;當(dāng)企業(yè)規(guī)模在80人以下時(shí),增加1%的調(diào)查成本只能獲得不到1%的工業(yè)企業(yè)總年主營業(yè)務(wù)收入信息,因此從業(yè)人數(shù)80人的劃分值能夠使得規(guī)模以上和規(guī)模以下企業(yè)所占年主營業(yè)務(wù)收入的比重恰當(dāng)。
表2 2016年湖北省全部工業(yè)企業(yè)按從業(yè)人數(shù)分組數(shù)據(jù)分布表
注:分組區(qū)間為前閉后開區(qū)間,例如[0,20)。
2.樣本量與抽樣誤差。通常情況下,抽樣誤差是由于抽取樣本的隨機(jī)性造成的,且無法消除,但可對其進(jìn)行計(jì)量并加以控制。最根本的方法是改變樣本量,在其他條件相同的情況下,樣本量越大,抽樣誤差越小。抽樣誤差與樣本量的算術(shù)平方根大致呈反比關(guān)系,抽樣誤差在開始時(shí)隨著樣本量的增加而顯著降低,但經(jīng)過一定階段后便趨于穩(wěn)定,如果繼續(xù)增大樣本量,只會有較小程度的抽樣誤差降低,從成本角度來說是不合算的[8]。該思想與邊際理論思想有一定的相似性,因此我們將最佳的臨界點(diǎn)定為樣本量與抽樣誤差關(guān)系曲線的“拐點(diǎn)”。在該最佳臨界點(diǎn)的左邊,樣本量的增加可很大程度地降低抽樣誤差;在該最佳點(diǎn)的右邊,樣本量的增加對降低抽樣誤差僅有較小的作用。因此,樣本量的適當(dāng)選取,可在一定程度上較為理想地控制抽樣誤差,從而用較低的成本獲得較高的估計(jì)精度。
因此,從成本和估計(jì)精度的角度出發(fā),本文考慮研究工業(yè)企業(yè)的樣本量與抽樣誤差的關(guān)系。在現(xiàn)有的抽樣方案和抽樣比的情況下,選取估計(jì)量的標(biāo)準(zhǔn)差來表示抽樣誤差,分別對不同劃分標(biāo)準(zhǔn)下的規(guī)模以上工業(yè)進(jìn)行全面調(diào)查,對規(guī)模以下工業(yè)企業(yè)進(jìn)行抽樣調(diào)查,計(jì)算總樣本量(規(guī)模以上工業(yè)企業(yè)數(shù)量與規(guī)模以下工業(yè)企業(yè)樣本量之和)與抽樣誤差,并通過總樣本量與抽樣誤差關(guān)系圖中的“拐點(diǎn)”來尋找最優(yōu)劃分值。為保證抽樣結(jié)果的穩(wěn)定性,本文對每一次規(guī)模劃分值調(diào)整后的抽樣都重復(fù)進(jìn)行500次,抽樣誤差則是500次的平均值。由計(jì)算結(jié)果可知,可將規(guī)模劃分值定為年主營業(yè)務(wù)收入1億元或者從業(yè)人數(shù)80人。也就是說,當(dāng)企業(yè)的年主營業(yè)務(wù)收入達(dá)到1億元以上或者從業(yè)人數(shù)超過80人可定義為規(guī)模以上工業(yè)企業(yè)。直觀上講,與年主營業(yè)務(wù)收入2 000萬元相比,年主營業(yè)務(wù)收入1億元的規(guī)模劃分值更加穩(wěn)定,也即在規(guī)模劃分值附近頻繁跳動的企業(yè)數(shù)量要少,升規(guī)降規(guī)現(xiàn)象發(fā)生頻率要低。
3.離散系數(shù)。離散系數(shù)也是一種常見的最優(yōu)劃分值確定的方法,它的基本思想是對于高度傾斜總體,由于“離群值”的存在,其總體離散程度通常會很大,但由于其右偏的性質(zhì),在剔除部分“離群值”后,剩余總體的離散程度會逐漸減少,最終會趨于穩(wěn)定。剔除的“離群值”越大,總體離散系數(shù)減少的幅度就越大,隨著剔除的值越來越“不離群”,離散程度的減少就會越平緩[9]。由該離散系數(shù)確定的最優(yōu)劃分值,一般視情況而定,因此比較主觀,本文將其設(shè)定為0.15~0.2之間。
對于年主營業(yè)務(wù)收入這一指標(biāo)中,首先按總體50 852個(gè)樣本企業(yè)的年主營業(yè)務(wù)收入降序排序,計(jì)算年主營業(yè)務(wù)收入的總體離散系數(shù),然后依次剔除總體中該指標(biāo)數(shù)值最大的樣本企業(yè),重新計(jì)算總體離散系數(shù)。為簡便起見,我們將規(guī)模劃分值以上的數(shù)據(jù)作為“離群值”,例如若年主營業(yè)務(wù)收入劃分值為2 000萬元,則剔除年主營業(yè)務(wù)收入2 000萬元以上的所有樣本企業(yè),對剩余企業(yè)計(jì)算離散系數(shù)得到該劃分值下的總體離散系數(shù)。同樣地,在從業(yè)人數(shù)這一指標(biāo)中,按總體50 852個(gè)樣本企業(yè)的從業(yè)人數(shù)降序排序,計(jì)算從業(yè)人數(shù)的總體離散系數(shù),然后依次剔除總體中該指標(biāo)數(shù)值最大的樣本企業(yè),重新計(jì)算總體離散系數(shù)。不同規(guī)模劃分指標(biāo)的總體離散系數(shù)情況如表3所示,若總體離散系數(shù)值定在0.15,則年主營業(yè)務(wù)收入8 000萬元及從業(yè)人數(shù)60人是最優(yōu)的規(guī)模劃分值;若總體離散系數(shù)定在0.2,則年主營業(yè)務(wù)收入1億元及從業(yè)人數(shù)80人是最優(yōu)的規(guī)模劃分值。因此可知,在離散系數(shù)這一評判標(biāo)準(zhǔn)上,年主營業(yè)務(wù)收入8 000萬~1億元或從業(yè)人數(shù)60~80人作為規(guī)模劃分值具有一定的操作性。
表3 不同規(guī)模劃分指標(biāo)的總體離散系數(shù)
綜合以上三種測算方法來看,結(jié)論基本相同,可將最優(yōu)規(guī)模劃分值定為年主營業(yè)務(wù)收入1億元,或者從業(yè)人數(shù)80人。
上文中討論了年主營業(yè)務(wù)收入和從業(yè)人數(shù)這兩個(gè)指標(biāo)的最優(yōu)劃分值,下面將選取這兩個(gè)指標(biāo)中較優(yōu)的一個(gè),作為最合適的規(guī)模劃分指標(biāo)。為此,本文將采用兩種方法來進(jìn)行評估:離散系數(shù)和指標(biāo)增速,分別從分布的離散性和隨時(shí)間變化的穩(wěn)定性角度進(jìn)行說明。
1.離散系數(shù)。通常情況下,一個(gè)穩(wěn)定的指標(biāo),其分布的方差較小,分布較集中,離散程度也較低。在統(tǒng)計(jì)量中,離散系數(shù)是離散程度的歸一化度量,是一個(gè)無量綱量,可綜合考慮方差和均值,離散系數(shù)越小說明離散程度越低,因此被廣泛地應(yīng)用于測度離散性。本小節(jié)的離散系數(shù)與上一小節(jié)中的離散系數(shù)不同,這里計(jì)算的是樣本離散系數(shù),即按照不同的規(guī)模劃分值,對規(guī)模以上工業(yè)企業(yè)進(jìn)行全面調(diào)查,規(guī)模以下工業(yè)企業(yè)進(jìn)行抽樣調(diào)查(與前文相同,按照每個(gè)不同的規(guī)模劃分值重復(fù)500次,最終的結(jié)果是500次的平均值),對所得的全部企業(yè)計(jì)算離散系數(shù),用來比較兩個(gè)指標(biāo)的離散程度。不同規(guī)模劃分指標(biāo)在不同規(guī)模劃分值下的樣本離散系數(shù)情況,詳見表4。
由表4可知,這兩個(gè)指標(biāo)都隨著規(guī)模劃分值的提高,樣本離散系數(shù)逐漸變小,符合實(shí)際情況;并且,在任一種劃分值下,年主營業(yè)務(wù)收入的離散系數(shù)都大于從業(yè)人數(shù),因此從離散系數(shù)的角度上看,從業(yè)人數(shù)指標(biāo)較為穩(wěn)定,離散程度更小,更適合作為工業(yè)企業(yè)規(guī)模劃分指標(biāo)。
表4 不同規(guī)模劃分指標(biāo)的樣本離散系數(shù)
2.指標(biāo)增速。為了比較兩個(gè)指標(biāo)的穩(wěn)定性,也可以從時(shí)間維度上分析年主營業(yè)務(wù)收入和從業(yè)人數(shù)這兩個(gè)指標(biāo)隨時(shí)間的變化情況。在最優(yōu)指標(biāo)的選取上,穩(wěn)定性十分關(guān)鍵,規(guī)模劃分值在長時(shí)間保持穩(wěn)定變動的指標(biāo)更適合作為規(guī)模劃分指標(biāo)。這里計(jì)算規(guī)模以上工業(yè)企業(yè)的指標(biāo)增速,數(shù)據(jù)來源于2017年《湖北統(tǒng)計(jì)年鑒》。2000—2016年,湖北省企業(yè)個(gè)數(shù)、年主營業(yè)務(wù)收入和從業(yè)人數(shù)總體上顯示為增長趨勢,這也印證了進(jìn)入21世紀(jì)以來中國經(jīng)濟(jì)發(fā)展的現(xiàn)狀;但指標(biāo)增長幅度各不相同,本文計(jì)算工業(yè)企業(yè)的年主營業(yè)務(wù)收入和從業(yè)人數(shù)均值(即分別用兩個(gè)指標(biāo)除以企業(yè)個(gè)數(shù)得到均值),繪制如圖2所示的年主營業(yè)務(wù)收入和從業(yè)人數(shù)均值的同比增長圖,可以看到年主營業(yè)務(wù)收入這一指標(biāo)同比增長率遠(yuǎn)大于從業(yè)人數(shù)。這說明在時(shí)間維度上,年主營業(yè)務(wù)收入隨著時(shí)間的推移變化幅度較大,作為規(guī)模劃分指標(biāo)時(shí)會面臨每隔數(shù)年就必須更新規(guī)模劃分值的問題,而頻繁的更換規(guī)模劃分值,將導(dǎo)致數(shù)據(jù)可比性下降,影響數(shù)據(jù)分析結(jié)果。而從業(yè)人數(shù)這一規(guī)模劃分指標(biāo)則較為穩(wěn)定,通常不易因?yàn)榻?jīng)濟(jì)形勢的改變而發(fā)生巨大變化,因而更適合作為工業(yè)企業(yè)規(guī)模劃分指標(biāo)。
圖2 不同規(guī)模劃分指標(biāo)均值同比增長圖
綜合來說,在對年主營業(yè)務(wù)收入和從業(yè)人數(shù)的穩(wěn)定性比較上,從業(yè)人數(shù)表現(xiàn)較優(yōu),更適合作為工業(yè)企業(yè)規(guī)模劃分的指標(biāo)。
本文研究的是工業(yè)企業(yè)規(guī)模標(biāo)準(zhǔn)的界定問題,以湖北省數(shù)據(jù)為例,通過多種方法的測算,確定最優(yōu)的規(guī)模劃分指標(biāo)和規(guī)模劃分值。一方面,在最優(yōu)劃分值的確定上,分別運(yùn)用邊際理論、樣本量與抽樣誤差的關(guān)系和離散系數(shù)三種方法來確定最優(yōu)劃分值;另一方面,在最優(yōu)劃分指標(biāo)的選取上,對年主營業(yè)務(wù)收入和從業(yè)人數(shù)兩個(gè)指標(biāo)進(jìn)行穩(wěn)定性的對比,以離散系數(shù)和指標(biāo)增速來進(jìn)行評定。通過以上分析,本文得出當(dāng)規(guī)模指標(biāo)為年主營業(yè)務(wù)收入時(shí),規(guī)模值可設(shè)定在1億元左右;當(dāng)規(guī)模指標(biāo)為從業(yè)人數(shù)時(shí),規(guī)模值可設(shè)定在80人左右。這兩個(gè)規(guī)模劃分方案可使得規(guī)模以上工業(yè)企業(yè)和規(guī)模以下工業(yè)企業(yè)各自占所有工業(yè)企業(yè)的比重合理,充分發(fā)揮規(guī)模以上工業(yè)企業(yè)全面調(diào)查的優(yōu)勢,合理降低成本;同時(shí)也保證了規(guī)模以下工業(yè)企業(yè)抽樣調(diào)查方案得以合理實(shí)施。
對于年主營業(yè)務(wù)收入1億元這一劃分標(biāo)準(zhǔn),在實(shí)際操作中具有重要意義。規(guī)模劃分標(biāo)準(zhǔn)的提高使得規(guī)模以上工業(yè)企業(yè)數(shù)量減少,這有利于更好地對數(shù)據(jù)填報(bào)進(jìn)行核實(shí)審查,從而做好質(zhì)量監(jiān)控,提高原始數(shù)據(jù)質(zhì)量。規(guī)模劃分值的提高也會使得企業(yè)在規(guī)模劃分值附近跳動的頻率降低,相比于年主營業(yè)務(wù)收入2 000萬元,年主營業(yè)務(wù)收入1億元附近的企業(yè),其經(jīng)營狀況也更為穩(wěn)定,有助于減少因企業(yè)頻繁跳動造成的誤差。同時(shí),規(guī)模以下工業(yè)企業(yè)數(shù)量增多,依據(jù)抽樣原理,在保持相同精度的條件下,樣本量只需少量的增加,這在一定程度上提高了抽樣效率;同時(shí),規(guī)模以下工業(yè)企業(yè)所占年主營業(yè)務(wù)收入的比重提升至15%左右,抽樣調(diào)查能涵蓋更多的企業(yè),使得規(guī)模以下工業(yè)企業(yè)抽樣調(diào)查變得更有意義。對于從業(yè)人數(shù)這一指標(biāo),可以有效解決使用主營業(yè)務(wù)收入這一指標(biāo)存在的數(shù)據(jù)偏差問題。相較于年主營業(yè)務(wù)收入,企業(yè)從業(yè)人數(shù)這個(gè)指標(biāo)的敏感度更低,有助于獲取更真實(shí)的數(shù)據(jù);而且該指標(biāo)也更為穩(wěn)定,可在一定程度上減少因經(jīng)濟(jì)發(fā)展需不斷調(diào)整規(guī)模劃分值的可能性;同時(shí)該指標(biāo)在一定程度上可消除地域影響,避免因各地區(qū)企業(yè)產(chǎn)值差異較大導(dǎo)致的地域差異性問題。
2018年是第四次全國經(jīng)濟(jì)普查年,本文討論的內(nèi)容對于經(jīng)濟(jì)普查后的數(shù)據(jù)分析,以及更進(jìn)一步為建立科學(xué)、合理的工業(yè)企業(yè)劃分標(biāo)準(zhǔn)具有重要的現(xiàn)實(shí)意義。