裴 玲
(西北師范大學(xué),甘肅 蘭州 730070)
近些年來隨著社會主義經(jīng)濟的蓬勃發(fā)展,水產(chǎn)品的產(chǎn)量以及地區(qū)的分布不再僅僅局限于江南地區(qū),更多的像北方的一些內(nèi)陸城市采取池塘養(yǎng)殖的方法來就近獲得新鮮的水產(chǎn)品。根據(jù)本文搜集的數(shù)據(jù)顯示,當(dāng)前中國對水產(chǎn)品的需求量不小,不論是高級餐廳還是小家飯館,都呈現(xiàn)出了一種供不應(yīng)求的狀態(tài),可見應(yīng)重視對該領(lǐng)域的研究。本文就在于觀察到這一經(jīng)濟現(xiàn)象,所以采取較為合理的抽樣估計辦法對2015年各省市的水產(chǎn)品產(chǎn)量均值進行簡單估計。這在一定程度上不僅僅是研究全國各省市水產(chǎn)品產(chǎn)量的狀況,更是為研究這一領(lǐng)域提供一個較為適合的辦法。抽樣估計方法多種多樣,選擇一個良好的估計方法就意味著這一領(lǐng)域的研究精度在一定程度上得到了提高。
本文主要研究的內(nèi)容是在Excel軟件的基礎(chǔ)上,應(yīng)用經(jīng)濟統(tǒng)計的抽樣調(diào)查理論方法,從橫向的角度分析不同抽樣估計方法在2015年全國各省水產(chǎn)品產(chǎn)量上的應(yīng)用??傮w抽樣思路為:第一,抽樣所選的抽樣框為中國統(tǒng)計年鑒各省的排序編碼,初級抽樣單元為單個?。坏诙?,考慮到數(shù)據(jù)特點,為便于說明問題,PPS抽樣選擇規(guī)模累積等距抽樣;第三,分層抽樣共分為兩層:第一抽樣層和第二抽樣層。
本文采用2015年全國30個省(除過西藏)的水產(chǎn)品產(chǎn)量作為主變量,水產(chǎn)養(yǎng)殖面積為輔變量進行分析。數(shù)據(jù)來源于《中國統(tǒng)計年鑒—2016》。
在簡單隨機抽樣的具體實施過程中,首先對已經(jīng)選擇的30個省市進行編號,以01~30為編號,編好的編碼,就是所謂的抽樣框,如表1。 用隨機數(shù)生成器在01~30中產(chǎn)生9個隨機數(shù)為:03、09、02、27、24、26、11、22、25即河北、上海、天津、甘肅、貴州、陜西、浙江、重慶、云南九個省被抽選為樣本,抽取結(jié)果如表2所示。
表1 所選省市簡單隨機抽樣抽樣框
表2 所選省市簡單隨機抽樣結(jié)果
(1)總體均值估計量為:
(2)總體均值方差估計量為:
(3)以95%的置信條件可以得到總體均值的區(qū)間估計為:
106.65±1.96x52.41,即[3.93 ,209.3]
PPS估計本身就包含很多種不同類型的抽樣方法,其中,規(guī)模累積等距抽樣屬于較為常用的方法,也是很多學(xué)者較為推崇的方法,所以在本文的寫作過程中就選擇規(guī)模累積等距抽樣作為pps估計的主要方法。在這個選擇的基礎(chǔ)上,對全社會水產(chǎn)養(yǎng)殖面積計算累計規(guī)模、規(guī)模代碼區(qū)間及規(guī)模比重,如表3所示。
從表3得知,30個省市水產(chǎn)品產(chǎn)量累積和為8465,這里抽取30%的樣本,經(jīng)計算選取9個樣本較為合適,等距抽樣的間隔為K=M0n=8465/9≈940,借助隨機數(shù)生成器在1~940中產(chǎn)生一個隨機代碼,作為第一個抽樣代碼,抽選結(jié)果為197,相應(yīng)的樣本單位為陜西,經(jīng)查閱對應(yīng)Y值為15.52。按照規(guī)模等距抽樣方法給各初始代碼分別加K、2K……8K得到抽樣單位的所有代碼、相應(yīng)的抽樣單位及樣本單位的Y值如表4所示。
表3 各省市全社會水產(chǎn)養(yǎng)殖面積規(guī)模及起止代碼區(qū)間及規(guī)模比重
表4 抽樣代碼和抽樣結(jié)果
經(jīng)計算漢森—赫維茨總體總量估計量為:
(1)總體均值估計量為:
(2)總體均值方差估計量為:
(3)以95%的置信條件可以得到總體均值的區(qū)間估計為:
228.5±1.96x40.9,即[148.34,308.66]
本文為一般分層抽樣,一共分為兩層。為了分層抽樣的實施,先對我國30個省市進行聚類分層,如表5。
表5 各省市分層表
由表5可知,第一層為規(guī)模明顯較大的層,因此該層為第一抽樣調(diào)查層;第二層為剩余省份組成的層,因此該層為第二抽樣調(diào)查層。一共抽取9個樣本,即n=9。為了估計的準(zhǔn)確度,這里采用耐曼分配方法確定各層的樣本個數(shù)ni。
表6 關(guān)于樣本量分配的計算
由表6中的數(shù)據(jù)可得耐曼分配如下:
用隨機數(shù)生成器在第一層的編碼中產(chǎn)生4個隨機數(shù)為:15、11、13、06,即山東、浙江、福建、遼寧四個省被抽選為樣本;第二層的編碼中產(chǎn)生5個隨機數(shù)為:16、23、22、25、08,即河南、四川、重慶、云南、黑龍江五個省被抽選為樣本,抽取結(jié)果如表7所示。
(1)總體均值估計量為:
(2)總體均值方差估計量為:
(3)以95%的置信條件可以得到總體均值的區(qū)間估計為:
224.29±1.96x16.2,即[192.54,256.04]
表7 中國30個分層抽樣結(jié)果
表8 關(guān)于樣本統(tǒng)計量的計算
(1)首先對簡單隨機抽樣、PPS抽樣簡單比較,可以看出在均值估計中,PPS估計的效果明顯優(yōu)于簡單隨機抽樣。具體來講,PPS抽樣均值的估計值為228.5和真實值僅僅相差6.1,均值抽樣方差為1676.4;而簡單隨機抽樣均值為106.65與真實值相差115.75,抽樣方差達到2474。因此,在簡單隨機抽樣和分層抽樣計算結(jié)果的基礎(chǔ)上,PPS估計的效率要高于簡單隨機抽樣。在實際調(diào)研分析過程中,根據(jù)自身需要和限制,選用抽樣效率相對較高的辦法。
(2)在利用分層抽樣的方法進行估計時,可以明顯看到,均值估計精度被提高了不少。均值估計量與真實值僅僅相差1.89,抽樣方差也僅有262.7,相比簡單隨機抽樣和PPS抽樣降低了很多,這說明在本文中分層抽樣的抽樣效率高于簡單隨機抽樣和PPS抽樣。從差異的角度講,分層抽樣和PPS抽樣的效率無較大的差異,在實際研究中,根據(jù)費用等限制條件綜合選取最優(yōu)的抽樣方法。
綜上所述,簡單隨機抽樣、PPS抽樣、分層抽樣對于本文研究命題估計最好的為分層抽樣。
[1] 倪家勛.抽樣調(diào)查[M].桂林:廣西師范大學(xué)出版社,2002.
[2] 陶瑞妮,張忱.PPS抽樣方法在固定資產(chǎn)投資估計中的應(yīng)用[J].現(xiàn)代商貿(mào)工業(yè),2014,(9):125-126.
[3] 張玉. PPS抽樣方法在我國出口貿(mào)易預(yù)測中的應(yīng)用[J].經(jīng)濟研究導(dǎo)刊,2011,(2):156-157.
[4] 李睆玲,雷恒,陳偉偉. PPS 抽樣方法在我國農(nóng)村居民生活消費支出估計中的應(yīng)用[J]. 長春金融高等??茖W(xué)校學(xué)報,2009,(3):49-51.