胡雪梅 李文博
(東北財(cái)經(jīng)大學(xué)研究生學(xué)院,遼寧大連116025)
隨著各種掃描設(shè)備在商貿(mào)場所的普及使用,許多國家的統(tǒng)計(jì)部門開始著手考察掃描數(shù)據(jù)在指數(shù)編制中的有效性,以食物或日常消費(fèi)類項(xiàng)目入手,大量資源被投入到銷售網(wǎng)點(diǎn)的價格采集上。
2009年,瑞典統(tǒng)計(jì)局發(fā)現(xiàn)在整理掃描數(shù)據(jù)的過程中,價格采集的失誤以及貨架、包裝中頻繁變化的價格信息會致使測量偏差頻發(fā)。因此,如何有效使用掃描數(shù)據(jù)并降低待估價格的標(biāo)準(zhǔn)誤、提高統(tǒng)計(jì)質(zhì)量并符合歐盟和國內(nèi)的統(tǒng)計(jì)制度,是當(dāng)今掃描數(shù)據(jù)有效性研究的重點(diǎn)。
掃描設(shè)備輸出的數(shù)據(jù)通常用EAN碼系統(tǒng)表示,EAN碼是一種用于給銷售網(wǎng)點(diǎn)中賣出商品標(biāo)號的國際編碼系統(tǒng)。開始的2~3位數(shù)字確定了生產(chǎn)商注冊的國家,接下來的4~5個數(shù)字指明該公司編號,末位數(shù)字則用于說明該產(chǎn)品的類別。但是EAN碼并不包含產(chǎn)品本身的信息,像品牌、重量、標(biāo)簽等信息是由銷售的收銀系統(tǒng)存儲的。每個掃描出售并貼有EAN條碼的商品,都會在此銷售網(wǎng)點(diǎn)的收銀系統(tǒng)儲存其全部信息。然后這些數(shù)據(jù)(掃描數(shù)據(jù))就會定期地傳送給該銷售連鎖機(jī)構(gòu)的總公司,并作為原始數(shù)據(jù)匯報給國家統(tǒng)計(jì)研究所(NSI),滿足統(tǒng)計(jì)需要。
瑞典統(tǒng)計(jì)局研究發(fā)現(xiàn),每個商業(yè)連鎖都有特定的數(shù)據(jù)格式,也即每個連鎖商店都需要根據(jù)自己編輯的程序量體裁衣。如與EAN碼不同,打折優(yōu)惠券擁有一套獨(dú)特的條形碼,當(dāng)顧客給出優(yōu)惠券時,條形碼作為獨(dú)立項(xiàng)目會在收銀系統(tǒng)中登記,而價格的優(yōu)惠部分會在收據(jù)上單獨(dú)打印。
調(diào)查結(jié)果表明,若一種商品永久退出生產(chǎn)線,其EAN碼可以在一段時期后再次利用在其他商品上。這個過程需要一年以上的時間,所以理論上不會引起混淆。
瑞典統(tǒng)計(jì)局的Dalén在1997年一次實(shí)驗(yàn)中率先研究了掃描數(shù)據(jù)。該研究設(shè)計(jì)了4×4的實(shí)驗(yàn),分別將固定權(quán)數(shù)與單位值進(jìn)行比較,單元值與月度單位值進(jìn)行比較,直接指數(shù)與月度鏈?zhǔn)街笖?shù)進(jìn)行比較,拉氏指數(shù)與費(fèi)希爾指數(shù)進(jìn)行比較。比較四個條目組(油脂、洗滌劑、早餐麥片和速凍魚)時使用的是尼爾森公司瑞典數(shù)據(jù)庫的掃描數(shù)據(jù)。盡管瑞典第一份關(guān)于“用于CPI計(jì)算的掃描數(shù)據(jù)使用”的報告描繪了進(jìn)一步工作和拓寬實(shí)驗(yàn)的前景,但是卻沒有后期跟進(jìn)。Donmyer等(1991)指出,與此類似的是1972年俄亥俄州辛辛那提市的一家克羅格商店首次把掃描生成的銷售記錄與人工審計(jì)數(shù)據(jù)作出的比較,結(jié)果表明對于諸多條目和商品來說,掃描出的銷售業(yè)績相比之下更勝一籌。
Leaver、Larson(2001)發(fā)現(xiàn),在使用尼爾森價格信息的紐約大都會區(qū),美國勞工統(tǒng)計(jì)局給每個單獨(dú)的項(xiàng)目計(jì)算了一個以掃描數(shù)據(jù)為基礎(chǔ)的幾何價格指數(shù)作為實(shí)驗(yàn)用檢驗(yàn)指標(biāo)。Richardson(2003)認(rèn)為,這種檢驗(yàn)指標(biāo)“把初級掃描指標(biāo)(只用掃描數(shù)據(jù))和CPI數(shù)據(jù)中非掃描總體構(gòu)建的指標(biāo)聯(lián)系在了一起”。這種實(shí)驗(yàn)用途的CPI是一種額外的指數(shù),并且不會代替官方的CPI。
追求指標(biāo)編制領(lǐng)先水平的荷蘭統(tǒng)計(jì)局在2002年直接使用通過匹配項(xiàng)目得到掃描數(shù)據(jù)的方法來計(jì)算指標(biāo);2010年后,其CPI系統(tǒng)大規(guī)模并定期地推廣這種理論。
澳大利亞統(tǒng)計(jì)局(ABS)為改善官方統(tǒng)計(jì),一直致力于研究掃描數(shù)據(jù),尤其是CPI體系,他們使用來自A.C尼爾森數(shù)據(jù)庫的信息來構(gòu)建掃描指標(biāo)(Alcausin等,2002)。
Rodriguez、Haraldsen(2006)的研究表明,為了計(jì)算出CPI中食物和軟飲料分類指數(shù),自2005年8月起,挪威統(tǒng)計(jì)局開始使用全面的掃描數(shù)據(jù)信息。計(jì)算過程涵蓋14000多個條目的價格信息,相比之下早年的非掃描數(shù)據(jù)系統(tǒng)只有250個項(xiàng)目。每月價格浮動在新系統(tǒng)中表現(xiàn)更明顯,尤其是對那些隨著季節(jié)變化營業(yè)額和價格波動很大的商品。
英國國家統(tǒng)計(jì)局(ONS,2006)申明其“一直以來都在探索電子掃描數(shù)據(jù)采集價格的可能性”。然而使用從商店直接得到的掃描數(shù)據(jù)已讓其意識到按月凈化這種數(shù)據(jù)會成為一項(xiàng)巨大而耗資的工程,而且問題數(shù)據(jù)極可能存在風(fēng)險。因此該局正在調(diào)查其他方法,如價格指標(biāo)的計(jì)算以及從大量家庭中收集的掃描數(shù)據(jù)的權(quán)重。
Muller等(2006)研究發(fā)現(xiàn),在市場研究機(jī)構(gòu)獲得各種條目的價格信息后,瑞士聯(lián)邦統(tǒng)計(jì)局也在力求研究直接應(yīng)用掃描數(shù)據(jù)計(jì)算指數(shù)。2008年該局首次推廣CPI編制中應(yīng)用掃描數(shù)據(jù),2010年則將該方法繼續(xù)推薦給更多零售商。問題可能影響指標(biāo)計(jì)算中掃描數(shù)據(jù)的應(yīng)用,即:(1)超市連鎖規(guī)模的大小會影響掃描數(shù)據(jù)的質(zhì)量并且統(tǒng)計(jì)局不得不依賴于超市每月回饋數(shù)據(jù)的意愿;(2)對數(shù)據(jù)結(jié)構(gòu)以及超市網(wǎng)絡(luò)IT系統(tǒng)具體特點(diǎn)的了解不夠充分;(3)盡管備有軟件,但需及時更新與超市網(wǎng)絡(luò)連接的補(bǔ)丁程序。
計(jì)算該指標(biāo)等同于將此法用于全國CPI的計(jì)算過程,即原集中的杰文斯指數(shù)(Jevons index)。采集零售商店的普通樣本時,零售商店和產(chǎn)品的樣本可以遠(yuǎn)大于目前的實(shí)際容量(瑞典統(tǒng)計(jì)局擁有50個采價網(wǎng)點(diǎn)和3×400個采價產(chǎn)品),較大標(biāo)準(zhǔn)差可在小成本的條件下降低(如果掃描數(shù)據(jù)是免費(fèi)得到的)。
人工收集的小樣本會產(chǎn)生待估價格標(biāo)準(zhǔn)誤波動過大,對大樣本或者總體來說,將掃描數(shù)據(jù)作為輔助信息可以減少這個標(biāo)準(zhǔn)誤。步驟如下:
1.使用掃描數(shù)據(jù)計(jì)算出一個價格指數(shù);
2.在有高品質(zhì)測量方法的零售網(wǎng)點(diǎn)的一個小樣本中手工收集價格;
3.使用手工收集的價格和掃描數(shù)據(jù)價格的平均比率來調(diào)整掃描數(shù)據(jù)價格指數(shù)。
瑞典統(tǒng)計(jì)局承認(rèn)通過產(chǎn)品普查的掃描數(shù)據(jù)記錄計(jì)算指標(biāo)也許會存在一些問題。首先該局并不確定NSI工作人員是否擁有足夠的知識,將超過一萬種產(chǎn)品按其消耗用途正確分類。其次是瓶裝水的儲備、軟飲料和啤酒并沒有從價格體系中撤出,也即存款成本在指數(shù)計(jì)算上的估算發(fā)生變化,這與法規(guī)不符。第三,代替品不能被自動處理,比如說,一整包餐巾紙的數(shù)量減少而價格維持不變時,必須做出數(shù)量上的調(diào)整。
NSI可以使用掃描數(shù)審查手工價格采集。手動采集價格過程存在測量誤差,其出現(xiàn)的頻率與教育、人工操作、測量儀器、監(jiān)督等因素的運(yùn)作有關(guān)。
從2008年開始,作為研究對象的瑞典零售連鎖商店約提供了49600個產(chǎn)品樣本,這些連鎖商店是通過掃描數(shù)據(jù)中的EAN碼來識別的。這意味著手工價格采集的目標(biāo)樣本中的39%是為食品設(shè)計(jì)的,其他的日用品樣本則要根據(jù)特定的總體來確定。
表1顯示了掃描數(shù)據(jù)與普通價格采集數(shù)據(jù)中匹配成套項(xiàng)目的最終結(jié)果。不等的價格類別(10.7%)包含著不同程度的差異。
表12009 年1月—11月掃描數(shù)據(jù)(SD)與手工采集價格(MCP)的對比 %
手工采集中有10%的產(chǎn)品不包含在掃描數(shù)據(jù)中。這個類別至少由因兩個原因不出售的產(chǎn)品組成。其一,如果條目描述是模糊的,一些價格采集者就會決定收集那種他們無意中得到而其他人卻熱衷收集的產(chǎn)品的價格。其二,即使商店中還有存貨,商品在一周的銷量也為零。當(dāng)產(chǎn)品銷量較小并且產(chǎn)品供給價格顯著提升時,后一種情況可能發(fā)生。
現(xiàn)存問題是一些零售商店中手工收集時沒有出現(xiàn)卻在掃描數(shù)據(jù)中出現(xiàn)的產(chǎn)品的大部分信息在整個月份當(dāng)中是“缺失”的,而這些信息在其他商店中卻唾手可得。沒有及時更新產(chǎn)品的EAN碼是對這種差異的一個合理解釋。瑞典統(tǒng)計(jì)局使用兩年期樣本來生成產(chǎn)品樣本并在當(dāng)年使用的做法會導(dǎo)致一部分EAN條形碼滯后。NSI若想得到較準(zhǔn)確的對比結(jié)果,就要定期更新EAN碼。
食品和日常消費(fèi)品價格指數(shù)是在每年1—11月計(jì)算出來的。一個指數(shù)可以根據(jù)手工收集的126300種產(chǎn)品組成的體系計(jì)算而成,也可以通過使用掃描數(shù)據(jù)代替49600個產(chǎn)品的方法來計(jì)算這個指數(shù)。
表2 2009年大部分日常用品的每月價格指數(shù) %
注:基期為2008年12月
掃描數(shù)據(jù)指標(biāo)與普通CPI之間的不同顯示出了一個非常重要的差異:在0.1~0.2之間的掃描數(shù)據(jù)比普通指數(shù)要低一些。必須強(qiáng)調(diào),掃描指數(shù)基礎(chǔ)僅來自一個連鎖商店,這意味著當(dāng)掃描數(shù)據(jù)代替人工價格采集的數(shù)據(jù)時,其他銷售網(wǎng)點(diǎn)的這個差異也許會更大。2010年3月,瑞典統(tǒng)計(jì)局對選定的采價網(wǎng)點(diǎn)進(jìn)行了審計(jì)考核,通過把手工價格采集數(shù)據(jù)與掃描數(shù)據(jù)進(jìn)行對比發(fā)現(xiàn)這個網(wǎng)點(diǎn)中有20種產(chǎn)品存在價格差異。
歐盟內(nèi)部的CPI計(jì)算指南是從理事會條例(EC)中總結(jié)出來的。委員會條例(EC)No 2602/2000第三段規(guī)定:“用于HICP的價格必須是在貨幣交易中由家庭實(shí)際支付的、用于購買個人商品和服務(wù)用途的購買價格,在標(biāo)準(zhǔn)價格和收費(fèi)的折扣或非購買高峰期減少之后,包括產(chǎn)品的稅費(fèi)及補(bǔ)貼,并且在信貸合約及非購買行為發(fā)生期限內(nèi)付款的情況下,扣除利息和附加服務(wù)費(fèi)?!睂τ谌鸬涫止げ杉改蟻碚f,價格采集者必須檢查那些排除了任何制造商或支持優(yōu)惠的零售商、折扣、會員優(yōu)惠、攻擊者或者退款的價格。
文件No 2602/2000的一個基本要點(diǎn)就是:統(tǒng)計(jì)局可以把掃描數(shù)據(jù)的使用作為一種采集方法,并進(jìn)行下一步研究。對于其在國民賬戶中的使用來說,交易價格必須是注冊過的;對提供的產(chǎn)品而言,掃描數(shù)據(jù)衡量了交易價格,這說明其比手工價格采集更有優(yōu)勢。
日常消費(fèi)品價格浮動的統(tǒng)計(jì)質(zhì)量是根據(jù)抽樣框的缺陷性、產(chǎn)品與商店類型的權(quán)重、抽樣誤差、測量誤差等因素進(jìn)行評價的。瑞典統(tǒng)計(jì)局使用的是商店和產(chǎn)品的抽樣概率。因?yàn)樵诖蠖鄶?shù)統(tǒng)計(jì)中,抽樣誤差可以估計(jì),其他來源的誤差則不能,并且不能把它們簡單地假設(shè)為隨機(jī)生成的誤差。如果目標(biāo)參數(shù)是每月平均價格,那么為期一周或三周的平均價格優(yōu)于每月價格,因?yàn)槌闃訒r間點(diǎn)不同而產(chǎn)生的誤差減小了。
來自連鎖零售商店的數(shù)據(jù)并不包括會員優(yōu)惠或者組合優(yōu)惠,掃描數(shù)據(jù)也要刨除上述項(xiàng)目。我們必須假設(shè)手工采集的價格中存在測量誤差。為了減少誤差,瑞典統(tǒng)計(jì)局在價格采集者的教育、指導(dǎo)手冊、測量儀器以及審計(jì)上投入更多的精力。
兩個原因造成了手工價格采集中出現(xiàn)的產(chǎn)品中的10%沒有在掃描數(shù)據(jù)中出現(xiàn):其一,出售量較小的產(chǎn)品在一周內(nèi)可能“隨機(jī)地”滯留了;其二,一種產(chǎn)品的價格明顯上漲使得消費(fèi)者選擇了另外的代替品或者另一家商店。這樣從掃描數(shù)據(jù)中得出的價格觀測值可能與指標(biāo)的參數(shù)相關(guān)。這種缺失值不可忽視并具有一定風(fēng)險,可能與一些統(tǒng)計(jì)推論相違背。沒有證據(jù)表明掃描數(shù)據(jù)存在這樣的影響。但假設(shè)這種影響存在,它在基期和報告期很有可能具有相同的規(guī)模,并且二者在一定程度上可能抵消。
作為質(zhì)量保證的一部分,瑞典統(tǒng)計(jì)局將一直致力于發(fā)展將價格采集誤差最小化的工作,因?yàn)镃PI是一個重要的經(jīng)濟(jì)指標(biāo),必須在準(zhǔn)確而可靠的價格基礎(chǔ)上計(jì)算得出。
[1]Alcausin,G.,Anderson,M.,Khoo,J.a(chǎn)nd Tallis,K.(2002).Scanner Data in CPI Research and Compilation.Australian Bureau of Statistics.International Association of Official Statistics.Official Statistics and the New Economy.London.
[2]Dalén,J.(1997).Experiments with Swedish Scanner Data.International Working Group on Price Indices.Voorburg.
[3]ONS,Office for National Statistics.(2006).The consumer prices methodological programme:progress in 2005 and prospects for 2006.Economic Trends 627.
[4]Rodriguez,J.a(chǎn)nd Haraldsen,F(xiàn).(2006).The use of scanner data in the Norwegian CPI:The”new”index for food and non - alcoholic beverages.Economic Survey,4/2006