陳雪如 鄖陽中學(xué)
統(tǒng)計工作其實就是搜集數(shù)據(jù)、整理數(shù)據(jù)、分析數(shù)據(jù)和解釋數(shù)據(jù)的系統(tǒng)性過程,統(tǒng)計學(xué)離開數(shù)據(jù)就失去了研究的價值;同理,數(shù)據(jù)離開統(tǒng)計學(xué)就只是簡單的數(shù)字,失去價值。只有利用統(tǒng)計學(xué)的原理與方法對數(shù)據(jù)加以整理、分析,才能提高數(shù)據(jù)精確度、適用度,發(fā)揮數(shù)據(jù)的價值。但在大數(shù)據(jù)時代,統(tǒng)計學(xué)迎來機(jī)遇與挑戰(zhàn),必須加強(qiáng)分析和探究。
在大數(shù)據(jù)時代要用辯證的、發(fā)展的眼光看待統(tǒng)計學(xué),在大數(shù)據(jù)思想框架下建立新的統(tǒng)計學(xué)科體系。大數(shù)據(jù)時代的總體統(tǒng)計思想與方法延伸統(tǒng)計學(xué)科體系,如統(tǒng)計學(xué)結(jié)合樣本統(tǒng)計與總體統(tǒng)計,樣本統(tǒng)計要求樣本正確代表總體,因而總體必須觀察同質(zhì)單位,這種理想情況在現(xiàn)實中很難達(dá)到,以大數(shù)據(jù)為基礎(chǔ)的總體統(tǒng)計正好彌補(bǔ)樣本統(tǒng)計的不足。
大數(shù)據(jù)時代代表傳統(tǒng)分析、核算單個計算機(jī)所存儲數(shù)據(jù)的統(tǒng)計方法,突破單個計算機(jī)數(shù)據(jù)限制,基于移動硬盤匯聚整理眾多計算機(jī)中存儲的數(shù)據(jù),形成新的數(shù)據(jù)流環(huán)境,實現(xiàn)對冗雜分散數(shù)據(jù)的集中分析與處理,提高數(shù)據(jù)統(tǒng)計效率。隨著數(shù)據(jù)類型的持續(xù)增多,適用的統(tǒng)計方法也越來越多,統(tǒng)計學(xué)在大數(shù)據(jù)技術(shù)的支持下逐漸走上分類、高效的數(shù)據(jù)分析處理道路[1]。
大數(shù)據(jù)時代促進(jìn)各行各業(yè)的信息數(shù)據(jù)化變革與更新,影響人們學(xué)習(xí)、工作與生活的方方面面,報表與數(shù)據(jù)的網(wǎng)絡(luò)搜索查詢技術(shù)能提高人們采集數(shù)據(jù)、利用數(shù)據(jù)的效率,拓寬有效的統(tǒng)計數(shù)據(jù)獲取渠道,使人們享受極大的便利。預(yù)處理則體現(xiàn)出統(tǒng)計學(xué)隨機(jī)抽樣調(diào)查和沉淀處理冗雜非標(biāo)準(zhǔn)數(shù)據(jù),主要分為清洗、矯正和填補(bǔ)這三個階段,保證在存儲數(shù)據(jù)的過程中將無效數(shù)據(jù)篩選出來,同時增強(qiáng)統(tǒng)計數(shù)據(jù)庫的相互聯(lián)系,大大提高數(shù)據(jù)的傳遞與共享效率。
在觀念、成本等的傳統(tǒng)因素的影響下,統(tǒng)計學(xué)主要在行業(yè)統(tǒng)計、部門統(tǒng)計中發(fā)揮作用,服務(wù)于政策的制定、服務(wù)的完善。但統(tǒng)計學(xué)在大數(shù)據(jù)時代不僅有助于快速拓展統(tǒng)計領(lǐng)域,還在醫(yī)學(xué)、金融、計算機(jī)等學(xué)科發(fā)揮作用。如數(shù)據(jù)分析,數(shù)學(xué)和計算機(jī)一樣,都是統(tǒng)計分析工具,數(shù)學(xué)夯實統(tǒng)計學(xué)的理論基礎(chǔ),計算機(jī)使統(tǒng)計分析更便捷,復(fù)雜的數(shù)據(jù)處理問題得到解決,在豐富統(tǒng)計學(xué)發(fā)展內(nèi)涵的同時擴(kuò)大統(tǒng)計學(xué)的作用范圍。
在過去,統(tǒng)計學(xué)大多停留在應(yīng)用抽樣技術(shù)、建模和模式分析等層面,這樣的方式在大數(shù)據(jù)時代不再適用于統(tǒng)計需求,信息量龐大和數(shù)據(jù)的多元化發(fā)展導(dǎo)致統(tǒng)計方法被限制在范圍內(nèi)的數(shù)據(jù)掃描分析當(dāng)中。與此同時,樣本統(tǒng)計依舊占據(jù)重要地位,在大數(shù)據(jù)時代難以提高統(tǒng)計數(shù)據(jù)的精確度。統(tǒng)計學(xué)主要是基于篩選的數(shù)據(jù)研究數(shù)量間以及數(shù)量特征的關(guān)系,考察樣本統(tǒng)計數(shù)據(jù)的價值決定著樣本的選取性、標(biāo)準(zhǔn)性,然而大數(shù)據(jù)增加確定樣本標(biāo)準(zhǔn)性和選取樣本的難度,統(tǒng)計學(xué)也因此迎來巨大挑戰(zhàn)。
在大數(shù)據(jù)時代,人們面對繁多的、冗雜的數(shù)據(jù),需要了解數(shù)據(jù)的表面意思,注重分析產(chǎn)生數(shù)據(jù)的原因和數(shù)據(jù)的特征,這就使傳統(tǒng)統(tǒng)計學(xué)遇到難題,必須創(chuàng)新原有統(tǒng)計方法,滿足人們的需求。龐大的數(shù)據(jù)量超乎人們想象,其分散性、多樣性的特征給選取數(shù)據(jù)造成巨大困難,在收集樣本數(shù)據(jù)時遇到選取范圍廣、難度系數(shù)高、標(biāo)準(zhǔn)界定不清等問題[2]。另外,隨著電子信息產(chǎn)生越來越多的數(shù)據(jù),網(wǎng)絡(luò)數(shù)據(jù)沒有可以遵循的規(guī)律,統(tǒng)計學(xué)的數(shù)據(jù)卻具備結(jié)構(gòu)性、邏輯性,在樣本選取中很容易丟失有價值的數(shù)據(jù),樣本存在偏頗,造成損失。
在大數(shù)據(jù)時代,數(shù)據(jù)信息是核心,統(tǒng)計學(xué)的發(fā)展要從中汲取動力,產(chǎn)生大量統(tǒng)計數(shù)據(jù)分析需求。傳統(tǒng)統(tǒng)計方法無法繼續(xù)適應(yīng)大數(shù)據(jù)時代的數(shù)據(jù)特點(diǎn),要求統(tǒng)計學(xué)要基于大數(shù)據(jù)的特點(diǎn),從滿足及服務(wù)于各領(lǐng)域的需求出發(fā),推進(jìn)數(shù)據(jù)分析理論和方法的創(chuàng)新發(fā)展。如在大數(shù)據(jù)時代要注意結(jié)合統(tǒng)計思維和信息技術(shù),因為統(tǒng)計技術(shù)對龐大的數(shù)據(jù)量特別是囊括諸多非結(jié)構(gòu)化數(shù)據(jù)而言是遠(yuǎn)遠(yuǎn)不夠的,首要問題就是計算,只有密切結(jié)合統(tǒng)計技術(shù)和信息技術(shù),才能提高計算效率,促進(jìn)統(tǒng)計學(xué)和大數(shù)據(jù)的融合。
統(tǒng)計學(xué)是一門注重實踐操作的學(xué)科,在學(xué)習(xí)統(tǒng)計學(xué)的知識時必須夯實基礎(chǔ),掌握好基礎(chǔ)知識,更要形成良好思維,掌握的數(shù)據(jù)的收集、統(tǒng)計和整理方法、技巧,培養(yǎng)專業(yè)統(tǒng)計思維,以便在大數(shù)據(jù)時代正確分辨所需數(shù)據(jù),分析數(shù)據(jù)的關(guān)聯(lián)性及相關(guān)數(shù)據(jù)??傊?,大數(shù)據(jù)時代穩(wěn)步推進(jìn)統(tǒng)計學(xué)的改革和發(fā)展,人們面臨更高的要求,提高統(tǒng)計思維、整合統(tǒng)計學(xué)與先進(jìn)的網(wǎng)絡(luò)信息技術(shù)、智能技術(shù)勢在必行,從容應(yīng)對挑戰(zhàn),提高樣本選取與數(shù)據(jù)分析的精確度,抓住機(jī)遇大力發(fā)展統(tǒng)計學(xué)。