郭海兵
[摘 要] 大數(shù)據(jù)的時代背景下,統(tǒng)計學(xué)專業(yè)迎來了機(jī)遇,同時也面臨著巨大的挑戰(zhàn)。結(jié)合大數(shù)據(jù)分析的特點,分別從培養(yǎng)目標(biāo)的定位、信息技術(shù)教育的提升以及實踐教育的增強(qiáng)這三個角度,探討統(tǒng)計學(xué)專業(yè)教學(xué)改革的方向。
[關(guān) 鍵 詞] 大數(shù)據(jù);統(tǒng)計學(xué);全數(shù)據(jù)模式;樣本數(shù)據(jù)
[中圖分類號] G642 [文獻(xiàn)標(biāo)志碼] A [文章編號] 2096-0603(2016)31-0184-02
目前,“大數(shù)據(jù)”已經(jīng)逐漸成為了婦孺皆知的熱詞。雖然大數(shù)據(jù)的精確概念是在2009年前后提出來,并于2012年開始流行,然而對于大數(shù)據(jù)技術(shù)的應(yīng)用早已開展。例如,沃爾瑪公司通過銷售數(shù)據(jù)分析,對關(guān)聯(lián)商品組合促銷,提升銷售量;谷歌公司通過用戶的搜索關(guān)鍵詞,能夠快速地定位流行疾病的病源地。并且隨著互聯(lián)網(wǎng)技術(shù)的進(jìn)步,各種大數(shù)據(jù)技術(shù)的成功案例層出不窮。美國政府在2012年3月發(fā)布的《大數(shù)據(jù)研究和發(fā)展倡議》,把大數(shù)據(jù)稱作“未來社會發(fā)展的新石油”,把發(fā)展大數(shù)據(jù)研究提到國家戰(zhàn)略的高度上來。2015年,《中國大數(shù)據(jù)發(fā)展調(diào)查報告》表明近幾年來我國大數(shù)據(jù)市場價值接近40%的速度在增長,2015年達(dá)到了115.4億元。全球化的背景下,大數(shù)據(jù)已經(jīng)走進(jìn)了每一個角落,正在給我們的政府管理、企業(yè)運(yùn)行和信息獲取創(chuàng)造價值和機(jī)遇;與此同時,也對我們的生活、學(xué)習(xí)和工作提出了變革要求。
作為一門收集整理數(shù)據(jù),并結(jié)合數(shù)學(xué)模型進(jìn)行量化分析,進(jìn)而作出推斷預(yù)測的學(xué)科,統(tǒng)計學(xué)是一門綜合性和應(yīng)用性比較強(qiáng)的學(xué)科。這一屬性十分契合大數(shù)據(jù)分析的要求,因此大數(shù)據(jù)時代的到來,推動了統(tǒng)計專業(yè)的快速發(fā)展。近年來,很多的新興院校都相繼開設(shè)了統(tǒng)計專業(yè),統(tǒng)計學(xué)專業(yè)正在面臨一個繁榮期。然而,就像一把雙刃劍,大數(shù)據(jù)給統(tǒng)計學(xué)專業(yè)騰飛和發(fā)展榮幸了機(jī)遇,與此同時,也對傳統(tǒng)的統(tǒng)計學(xué)的教育和教學(xué)提出了迫切的變革需求。
一、大數(shù)據(jù)在統(tǒng)計分析中的新特點
(一)數(shù)據(jù)收集方式的改變
在傳統(tǒng)的統(tǒng)計中,數(shù)據(jù)的收集是通過人為對樣本的屬性進(jìn)行逐一采集、整理,形成一系列橫平豎直的結(jié)構(gòu)化數(shù)據(jù),然后利用這些樣本信息,進(jìn)行描述分析、統(tǒng)計推斷。然而,現(xiàn)代的信息技術(shù)使得樣本數(shù)據(jù)的收集實現(xiàn)了信息化和自動化。例如,通過爬蟲程序直接抓取互聯(lián)網(wǎng)數(shù)據(jù),工業(yè)生產(chǎn)中的傳感器獲取的數(shù)據(jù)等等。另外,數(shù)據(jù)的形式呈現(xiàn)出多樣化,除了傳統(tǒng)的表格數(shù)據(jù),還有諸如文本數(shù)據(jù)、音頻數(shù)據(jù)和視頻數(shù)據(jù)等。這就需要在統(tǒng)計專業(yè)學(xué)生培養(yǎng)過程中,一方面重視信息收集方式的教學(xué);另一方面做好多維數(shù)據(jù)處理技術(shù)的傳授工作。
(二)樣本數(shù)據(jù)模式和全數(shù)據(jù)模式
傳統(tǒng)統(tǒng)計中,由于數(shù)據(jù)收集能力的限制,很多時候我們無法獲取全數(shù)據(jù),只能通過隨機(jī)樣本,利用少數(shù)的特征對總體的屬性進(jìn)行統(tǒng)計推斷。在大數(shù)據(jù)時代,數(shù)據(jù)獲取的方式和技術(shù)發(fā)生了巨大的變化,人們可以通過互聯(lián)網(wǎng)、即時通訊工具以及數(shù)據(jù)庫,獲取各種海量數(shù)據(jù)。面對這樣的海量數(shù)據(jù),隨機(jī)抽樣不再有太大的意義了。因此,大數(shù)據(jù)背景下,全數(shù)據(jù)就是樣本數(shù)據(jù),即樣本就是總體。傳統(tǒng)的統(tǒng)計分析重點是,通過樣本信息預(yù)測總體的特征屬性,大數(shù)據(jù)分析更加側(cè)重于發(fā)現(xiàn)海量數(shù)據(jù)下的各種關(guān)聯(lián)細(xì)節(jié)。
(三)模型分析的弱化
傳統(tǒng)的統(tǒng)計中,側(cè)重在變量之間建立模型,刻畫出變量之間的因果關(guān)系,而相關(guān)分析只是作為進(jìn)行模型分析之前,進(jìn)行數(shù)據(jù)探索的一個小小的手段而已。然而,在大數(shù)據(jù)中,數(shù)據(jù)的結(jié)構(gòu)復(fù)雜,變量眾多,體量較大,有時候很難用一個“普世”函數(shù)描述出變量之間的準(zhǔn)確關(guān)系。無法綜合評價出變量之間關(guān)系的情況下,我們可以部分揭示出變量之間的關(guān)系。事實上,由于相關(guān)分析無需太多的模型假設(shè),運(yùn)算成本較低等眾多原因,使得相關(guān)關(guān)系的分析成為大數(shù)據(jù)分析的基礎(chǔ)。
(四)模型的復(fù)雜性和精確性難以量化平衡
傳統(tǒng)的統(tǒng)計學(xué)處理的數(shù)據(jù),都是在時間和空間設(shè)定的情況下結(jié)構(gòu)化的數(shù)據(jù)。在數(shù)據(jù)的處理上遵循數(shù)據(jù)清洗整理,利用經(jīng)典統(tǒng)計模型,在設(shè)定的精度范圍里對總體的特征進(jìn)行推斷和分析。這樣的過程中,模型的復(fù)雜度和精確度,都可以在我們事先設(shè)定的情況下進(jìn)行。然而,在大數(shù)據(jù)背景下,一方面,數(shù)據(jù)的收集過分依賴技術(shù)手段,很難進(jìn)行人為的精度控制。另一方面,數(shù)據(jù)的來源無論是空間上還是時間上都更加復(fù)雜,格式多樣,這就使得數(shù)據(jù)前期的清洗處理變得非常困難,由于存在系統(tǒng)性的偏差,很難將全部的雜質(zhì)項從數(shù)據(jù)中萃取掉。在秉持“數(shù)據(jù)多比少好”的情況下,就得接受數(shù)據(jù)混亂和不確定性的代價。在大數(shù)據(jù)中忽略一部分模型的精確性,并不是說不要模型的精確性,而是指我們對于模型的精確性的可控性在減弱。
二、統(tǒng)計專業(yè)教學(xué)改革的方向
時代的發(fā)展、技術(shù)的進(jìn)步對于統(tǒng)計學(xué)專業(yè)提出更高的期望和要求,結(jié)合統(tǒng)計學(xué)專業(yè)現(xiàn)有教學(xué)體系中存在的問題,給出了統(tǒng)計學(xué)專業(yè)教學(xué)改革的方向。
(一)培養(yǎng)目標(biāo)的定位
過去國內(nèi)對于統(tǒng)計專業(yè)定位是分割成諸如經(jīng)濟(jì)統(tǒng)計、數(shù)理統(tǒng)和其他的統(tǒng)計幾個類別。學(xué)校的招生過程也是按照這樣的幾個類別進(jìn)行招生。這就使得學(xué)生的培養(yǎng)被固定在幾個人為設(shè)定的格子里,湮滅了各個知識之間的交叉結(jié)構(gòu)。自從統(tǒng)計學(xué)專業(yè)被升格為一級學(xué)科之后,這種狀況有所改善。隨著大數(shù)據(jù)的出現(xiàn),統(tǒng)計分析技術(shù)的服務(wù)范圍已經(jīng)不再局限于諸如學(xué)術(shù)廟堂、政府部門以及高端公司等這樣的精英圈子;普通的社會機(jī)構(gòu)、企業(yè)和工廠等各行各業(yè)對統(tǒng)計專業(yè)產(chǎn)生了迫切需求。
因此,在統(tǒng)計學(xué)專業(yè)的定位上,應(yīng)該摒棄傳統(tǒng)的簡單分割成經(jīng)濟(jì)統(tǒng)計和數(shù)理統(tǒng)計的理念。大數(shù)據(jù)背景下,統(tǒng)計學(xué)作為一項分析工具,需要與其他專業(yè)做好銜接和服務(wù)工作,培養(yǎng)多元化的分析人才。在統(tǒng)計學(xué)專業(yè)培養(yǎng)目標(biāo)的定位上,應(yīng)該充分考慮統(tǒng)計分析的工具性,促進(jìn)統(tǒng)計專業(yè)與各自優(yōu)勢學(xué)科的交叉和融合,形成“多元化”的培養(yǎng)目標(biāo)。既能培養(yǎng)出理論分析的精英人才,也能培養(yǎng)出簡單數(shù)據(jù)管理者。
(二)統(tǒng)計理論和信息技術(shù)的平衡
傳統(tǒng)的統(tǒng)計學(xué)專業(yè)的課程體系中,專業(yè)主干課程圍繞數(shù)理基礎(chǔ)、統(tǒng)計分析以及信息技術(shù)這樣的幾塊。通常偏重的統(tǒng)計理論側(cè)重于數(shù)理邏輯課程的教學(xué);而側(cè)重與統(tǒng)計應(yīng)用相關(guān)的內(nèi)容(如經(jīng)濟(jì)統(tǒng)計)側(cè)重于統(tǒng)計分析的課程教學(xué)。這樣的安排都忽略了對統(tǒng)計專業(yè)學(xué)生進(jìn)行信息技術(shù)的培養(yǎng)。縱觀整個數(shù)據(jù)分析的流程,從最初的數(shù)據(jù)收集,數(shù)據(jù)的分析和結(jié)論,都是離不開信息技術(shù)的支持。特別是大數(shù)據(jù)分析,無論是硬件上面還是軟件上面,都對數(shù)據(jù)分析的參與者提出了很高的要求。
因此無論是傳統(tǒng)的經(jīng)濟(jì)統(tǒng)計,還是數(shù)理統(tǒng)計,掌握一定的信息技術(shù)是一個必要的條件。這需要在課程設(shè)置上,既要引入適當(dāng)?shù)挠布矫?,也要加?qiáng)軟件的教育。以往統(tǒng)計學(xué)專業(yè)的軟件教學(xué)主要以SPSS、Eview等這類封裝好了,以體驗式為主的統(tǒng)計軟件。對于這類軟件無論是在處理數(shù)據(jù)的體量上,還是處理數(shù)據(jù)方式的靈活度上,都無法適應(yīng)大數(shù)據(jù)分析的需求。在軟件教學(xué)方面,培養(yǎng)學(xué)生一定的編程能力是非常必要的,相比于機(jī)械的拖拽軟件分析數(shù)據(jù),編程分析更加靈活,能夠激活數(shù)據(jù)分析者的主動性和創(chuàng)造性。
(三)實踐教學(xué)模式的創(chuàng)新
近年來,隨著對統(tǒng)計專業(yè)應(yīng)用性認(rèn)識的不斷加深,很多學(xué)校對實踐教學(xué)環(huán)節(jié)也是越來越重視,在課程的設(shè)計上增加了實踐環(huán)節(jié)的比重。但是相比于數(shù)量上的提升,實踐環(huán)節(jié)的質(zhì)量依然還有很大的提升空間。尤其是在大數(shù)據(jù)的背景下,很多實踐環(huán)節(jié)過分側(cè)重人工數(shù)據(jù)采集和局部樣本信息的分析。主要表現(xiàn)在這些方面:(1)數(shù)據(jù)的收集手段上,沒有充分使用現(xiàn)代信息技術(shù)方法。例如,有些學(xué)校的教學(xué)實踐中,還是停留在讓學(xué)生上街發(fā)放問卷的階段;稍好一點的學(xué)校運(yùn)用了諸如問卷星這樣網(wǎng)上問卷的形式。而大數(shù)據(jù)背景下,這種獲取的數(shù)據(jù)有方式,無論是在數(shù)量還是質(zhì)量方面都是相對不足。我們需要讓學(xué)生在數(shù)據(jù)獲取能力方面適當(dāng)進(jìn)行提升,例如,加以適當(dāng)?shù)呐嘤?xùn),讓學(xué)生掌握一些網(wǎng)絡(luò)上爬取數(shù)據(jù)的技術(shù)。(2)傳統(tǒng)的模型驅(qū)動的實踐內(nèi)容,在一定程度上不適應(yīng)大數(shù)據(jù)分析原則。傳統(tǒng)的實踐課程中,側(cè)重運(yùn)用模型去揭示數(shù)據(jù)之間的關(guān)系,并且相應(yīng)的表現(xiàn)在我們的評價體系上,過分強(qiáng)調(diào)了模型的合理性和正確性。大數(shù)據(jù)分析應(yīng)該基于數(shù)據(jù)出發(fā),通過一些技術(shù)手段來揭示數(shù)據(jù)之間的關(guān)系;有的時候很難在大數(shù)據(jù)之間建立模型,或者很難建立一個現(xiàn)有的模型。實踐教學(xué)過程中,讓學(xué)生形成數(shù)據(jù)至上的理念,也就是在分析過程中盡量讓模型去適應(yīng)數(shù)據(jù),而不是基于一些改造手段,讓數(shù)據(jù)去適應(yīng)模型。(3)除了學(xué)校的項目實習(xí),積極鼓勵學(xué)生走出學(xué)校,獲取實習(xí)機(jī)會。校外實習(xí)接觸的問題更實際,既能檢驗學(xué)生的學(xué)習(xí)效果,也能激發(fā)學(xué)生的學(xué)習(xí)興趣,從而實現(xiàn)教學(xué)相長。
大數(shù)據(jù)時代的到來,成就了統(tǒng)計學(xué)專業(yè)的繁華,統(tǒng)計專業(yè)的發(fā)展也必將會推動大數(shù)據(jù)輝煌?!胺比A落盡處,互為渡舟人?!备鞣N現(xiàn)象的隨機(jī)性、不確定性,掩蓋了萬物之間錯綜復(fù)雜的關(guān)系,統(tǒng)計方法能夠幫我們撥云見日。科學(xué)在發(fā)展,技術(shù)在進(jìn)步,一成不變的東西終將會走出歷史的舞臺,統(tǒng)計學(xué)專業(yè)也不例外,培養(yǎng)方式的改革迫在眉睫。
參考文獻(xiàn):
[1]王忠.美國推動大數(shù)據(jù)技術(shù)發(fā)展的戰(zhàn)略價值及啟示[J].中國發(fā)展觀察,2012(6).
[2]中國大數(shù)據(jù)發(fā)展調(diào)查報告[R].北京:中國信息通信研究院,2015.
[3]耿直.大數(shù)據(jù)時代統(tǒng)計學(xué)面臨的機(jī)遇與挑戰(zhàn)[J].統(tǒng)計研究,2014(11).
[4]劉春杰.大數(shù)據(jù)時代對當(dāng)代統(tǒng)計學(xué)教育的挑戰(zhàn)[J].統(tǒng)計與決策,2015(8).
[5]邱東,李子奈,肖紅葉.經(jīng)濟(jì)學(xué)類專業(yè)統(tǒng)計學(xué)、計量經(jīng)濟(jì)學(xué)課程教學(xué)現(xiàn)狀調(diào)研報告[J].中國大學(xué)教學(xué),2007(11).