摘要:抽樣調(diào)查是“市場調(diào)查”課程的主要實(shí)踐教學(xué)環(huán)節(jié),目前所使用的軟件對抽樣模擬的支持相對不足,很多抽樣及估計(jì)過程仍不能在軟件菜單中得以實(shí)現(xiàn),尤其是不等概抽樣大多需要編程。軟件編程對工商管理類的學(xué)生并非易事,R軟件的sampling等軟件包提供了大量現(xiàn)成的不等概程序,可以方便地進(jìn)行抽樣及模擬教學(xué)。探討以調(diào)查某品牌商品的消費(fèi)者總量為例,模擬不等概率抽樣的過程,為“市場調(diào)查”課程實(shí)踐教學(xué)提供了一種實(shí)用的方法。
關(guān)鍵詞:市場調(diào)查;實(shí)踐教學(xué);抽樣調(diào)查;R軟件
作者簡介:葛瑩玉,女,江蘇理工學(xué)院商學(xué)院講師,河海大學(xué)在讀博士,主要研究方向?yàn)榧夹g(shù)經(jīng)濟(jì)與管理。
中圖分類號:G642文獻(xiàn)標(biāo)識碼:A文章編號:1674-7747(2014)30-0068-03
“市場調(diào)查”課程是工商管理類專業(yè)的核心課程之一,該課程的實(shí)踐操作性很強(qiáng),教學(xué)內(nèi)容主要圍繞市場調(diào)查方案制定、市場調(diào)查問卷設(shè)計(jì)、市場調(diào)查數(shù)據(jù)搜集、整理和分析等內(nèi)容展開。通過“市場調(diào)查”課程教學(xué),不僅使學(xué)生學(xué)會(huì)如何制定調(diào)查方案、設(shè)計(jì)調(diào)查問卷、處理和分析數(shù)據(jù)等,而且,其核心過程是讓學(xué)生掌握和運(yùn)用抽樣調(diào)查方法。由于“市場調(diào)查”課程具有較強(qiáng)的實(shí)踐操作性,在本科階段僅僅講授抽樣原理的效果不佳,學(xué)生實(shí)踐能力也無法得到培養(yǎng)。因而,使用R軟件進(jìn)行抽樣過程實(shí)踐,能夠讓學(xué)生直觀地了解抽樣過程及結(jié)果,培養(yǎng)其動(dòng)手能力,提高他們解決企業(yè)市場調(diào)查中實(shí)際問題的能力。
一、“市場調(diào)查”課程的抽樣方法
目前,常用的抽樣方法有概率抽樣和非概率抽樣,其中,概率抽樣又包含等概率和不等概率兩大類別。等概率抽樣由于實(shí)施方便,且具有較高的精度,在實(shí)際抽樣中使用廣泛。[1]然而,等概率抽樣在實(shí)際使用時(shí)的限制也最多,它假定總體中每個(gè)個(gè)體具有相同的規(guī)模大小或重要程度,當(dāng)總體中每個(gè)個(gè)體的規(guī)?;蛑匾潭却嬖陲@著差異時(shí),會(huì)影響等概率抽樣的估計(jì)精度。[2]此時(shí),若能找到說明個(gè)體規(guī)?;蛑匾潭鹊妮o助變量,則可采用不等概抽樣方法。不等概抽樣雖然是有偏估計(jì),但可大幅提高估計(jì)精度,在偏度不大的情況下,不等概抽樣結(jié)果仍比概率抽樣更可靠。在現(xiàn)有的軟件中,SAS和SPSS軟件都有復(fù)雜抽樣的模塊,但不放回不等概抽樣的模塊和程序較少,具體使用時(shí)需要自己編程。而R軟件提供了多種不等概抽樣的程序,方便進(jìn)行模擬及結(jié)果可視化,且R是開源軟件,無需為軟件或某個(gè)軟件包支付任何費(fèi)用。因此,R軟件已成為工商管理類專業(yè)學(xué)生和實(shí)證研究人員的主要分析工具。
二、“市場調(diào)查”課程的抽樣模擬具體實(shí)例
本文以調(diào)查某品牌商品消費(fèi)者總量為例。消費(fèi)者總量的調(diào)查若以家庭或個(gè)體為單位,會(huì)大大增加抽樣框編制的難度,增加調(diào)查實(shí)施的困難。因此,本文以街道居委會(huì)或村民小組為最小單位,由于不同的街道居委會(huì)或村民小組居民數(shù)量不同,故擬采用不等概率抽樣方法。不等概抽樣的實(shí)施方法有很多,但由于實(shí)際操作困難,限制了不等概抽樣方法在實(shí)踐中的使用。[3]本文運(yùn)用R軟件編程模擬幾種常用的不等概抽樣方法,運(yùn)用Horvitz-Thompson估計(jì)量模擬調(diào)查精度,并與多階段抽樣和簡單隨機(jī)抽樣進(jìn)行比較,從中選出滿意的抽樣方法。
(一)抽樣總體的描述
選取某品牌商品消費(fèi)人口較多的某省某縣為總體,該縣有19個(gè)鄉(xiāng)鎮(zhèn),125個(gè)村,最大的鄉(xiāng)鎮(zhèn)擁有171個(gè)街道或村民小組,最小的鄉(xiāng)鎮(zhèn)只有43個(gè)街道或村民小組;平均每個(gè)鄉(xiāng)鎮(zhèn)擁有94個(gè)街道或村民小組,19個(gè)鄉(xiāng)鎮(zhèn)共計(jì)有1 791個(gè)街道或村民小組???cè)丝诠?105萬人。其中,某品牌商品的消費(fèi)者人數(shù)有746萬人,占總?cè)丝诘?401%。在所有街道或村民小組中,消費(fèi)某品牌商品的人數(shù)比率最低為0,最高為7674%,可見,消費(fèi)某品牌商品的人數(shù)比率在各街道或村民小組中差異較大,且呈明顯右偏;消費(fèi)某品牌商品的人數(shù)比率在50%以上的街道或村民小組很少,峰值在30%左右,如圖1所示。用Shapiro-Wilk正態(tài)性檢驗(yàn)伴隨概率小于001,說明各街道或村民小組的某品牌商品消費(fèi)人口數(shù)并不服從正態(tài)分布。但某品牌商品消費(fèi)人口或村鎮(zhèn)總?cè)丝诘南嚓P(guān)系數(shù)達(dá)072,spearman相關(guān)系數(shù)檢驗(yàn)的伴隨概率小于001,說明各街道或村民小組的某品牌商品消費(fèi)人口與總?cè)丝跀?shù)成高度相關(guān),可將總?cè)丝跀?shù)作為輔助變量進(jìn)行抽樣。
(二)抽樣方法的選擇
常用的不等概抽樣有放回的不等概抽樣(pps)和不放回的不等概抽樣(πps)兩種,相比較而言,πps抽樣雖然抽取方法和方差估計(jì)比較困難,但精度上有所提高,且隨著計(jì)算機(jī)技術(shù)和統(tǒng)計(jì)軟件的發(fā)展,πps抽樣及估計(jì)的程序和軟件將越來越成熟,πps抽樣的使用也將逐漸廣泛起來。
設(shè)有限總體U={1,…,k,…N},本例中N=1 791,抽樣單元為街道或村民小組,調(diào)查變量yk為某品牌商品消費(fèi)人口數(shù),調(diào)查目的是估計(jì)地區(qū)的某商品消費(fèi)總?cè)藬?shù)ty=∑kUyk,設(shè)對于總體中的每一個(gè)個(gè)體都存在xk>0,xk與yk近似成比例或存在一定相關(guān)性,則以xk為輔助變量的不等概抽樣可以減小抽樣誤差。
每個(gè)個(gè)體被包含到樣本中的概率為:
(三)抽樣過程的模擬仿真
1.抽樣程序采用R軟件以及sampling包進(jìn)行編程抽取,為了比較各抽樣方法的差異及抽樣精度的穩(wěn)定性,本文將樣本量設(shè)定為25、50和100三組,每組樣本都模擬抽樣100次。在sampling包中提供了brewer和midzuno等17種不等概抽樣方法,其用法基本一致,首先計(jì)算包含概率,計(jì)算程序?yàn)椋?/p>
inclusionprobabilities(a,n),
其中,a為說明規(guī)模大小的輔助變量,a>0;n為樣本量。
為方便起見,令pik=inclusionprobabilities(a,n)。
2.按不等概方式抽取樣本,即生成變量s,s=1表示抽中,s=0表示沒有抽中,以brewer抽樣為例:
s=UPbrewer(pik),
其余不等概抽樣程序類似,詳見sampling包。
3.計(jì)算Horvitz-Thompson估計(jì)量。
HTestimator(y,pik),
其中,y為需估計(jì)的變量。
運(yùn)用上述函數(shù)的三種樣本量模擬結(jié)果如圖2所示。
當(dāng)樣本量為25個(gè)街道或村民小組時(shí),抽樣比為140%,平均抽到的某品牌商品消費(fèi)人數(shù)約為4 334人。此時(shí),各種抽樣方法的精度不高,相較而言,poisson抽樣和多階段抽樣的估計(jì)量方差較大,多階段抽樣和pivotal的偏差較大(圖2中虛線為消費(fèi)某品牌商品的總?cè)藬?shù)),而systematic抽樣和brewer抽樣效果相對較好。
當(dāng)樣本量為50和100,抽樣比為279%和558%時(shí),抽樣的偏差和估計(jì)量方差都有改善。其中,多階段抽樣和poisson抽樣的估計(jì)量方差仍較大,且偏差明顯不為0,故這兩種抽樣方法并不適用本例。相較而言,brewer、midzuno和systematic抽樣相對比較穩(wěn)定,簡單隨機(jī)抽樣(srswor)在樣本量較小時(shí)估計(jì)誤差較大,而在樣本量大于50后也具有較好的估計(jì)精度。綜合考慮穩(wěn)定性、偏差和估計(jì)量方差,本文認(rèn)為,不等概系統(tǒng)抽樣(systematic)最適于用來估計(jì)該地區(qū)某品牌商品消費(fèi)者總量。
三、結(jié)論
本文運(yùn)用目前流行的統(tǒng)計(jì)開源軟件R軟件及sampling軟件包,方便實(shí)現(xiàn)了不等概抽樣及結(jié)果模擬,并用圖表直觀輸出,比較抽樣過程中的方法、樣本量等因素對抽樣精度的影響。模擬仿真結(jié)果表明,R軟件豐富的程序包,可方便進(jìn)行抽樣設(shè)計(jì)及模擬,且使用方便,操作簡單,可擴(kuò)展性強(qiáng)??梢姡鄬τ趥鹘y(tǒng)理論教學(xué),使用R軟件進(jìn)行實(shí)踐教學(xué),可以加深學(xué)生對不等概率抽樣的理解,使其更好地掌握和運(yùn)用市場調(diào)查中的抽樣方法。[4-5]
參考文獻(xiàn):
[1]龐智強(qiáng).《抽樣調(diào)查》課程建設(shè)與教學(xué)改革[J].蘭州商學(xué)院學(xué)報(bào),2001(6):148-149.
[2]馬嵐.對《抽樣調(diào)查》課程教學(xué)改革的思考[J].統(tǒng)計(jì)教育,2007(8):29-30.
[3]周妮笛.論《市場調(diào)查與預(yù)測》課程教學(xué)的改進(jìn)[J].當(dāng)代教育理論與實(shí)踐,2011(11):74-76.
[4]陳成棟,劉曉云.“市場調(diào)查與預(yù)測”課程教學(xué)改革實(shí)證研究[J].中國市場,2012(35):26-28.
[5]杜亞芳.市場調(diào)查課程教學(xué)改革與實(shí)踐[J].高等教育,2013(6):133-134.
[責(zé)任編輯盛艷]