方江林
【摘要】文章首先探討了大數(shù)據(jù)時(shí)代來(lái)臨對(duì)統(tǒng)計(jì)學(xué)帶來(lái)的機(jī)遇和挑戰(zhàn),然后分析了大數(shù)據(jù)背景下目前本科統(tǒng)計(jì)教育普遍存在的問題,并針對(duì)其存在的問題提出了相應(yīng)的本科統(tǒng)計(jì)教育改革建議。
【關(guān)鍵詞】大數(shù)據(jù);統(tǒng)計(jì)教育;樣本;統(tǒng)計(jì)學(xué)
大數(shù)據(jù)是社會(huì)發(fā)展和技術(shù)進(jìn)步的必然產(chǎn)物。最早提出大數(shù)據(jù)時(shí)代到來(lái)的是世界知名的麥肯錫咨詢公司,大數(shù)據(jù)在金融、生物信息、通訊等行業(yè)早已存在,但因近年來(lái)互聯(lián)網(wǎng)和信息行業(yè)的發(fā)展而引起人們的廣泛關(guān)注。隨著大數(shù)據(jù)時(shí)代的來(lái)臨,統(tǒng)計(jì)學(xué)作為對(duì)數(shù)據(jù)進(jìn)行處理分析的方法論學(xué)科,必然會(huì)受到大數(shù)據(jù)的影響。近年來(lái),統(tǒng)計(jì)學(xué)專業(yè)被拆分成統(tǒng)計(jì)學(xué)、應(yīng)用統(tǒng)計(jì)學(xué)和經(jīng)濟(jì)統(tǒng)計(jì)學(xué)三個(gè)本科專業(yè),目前全國(guó)已有近兩百所高校開設(shè)了統(tǒng)計(jì)學(xué)專業(yè)。顯然,統(tǒng)計(jì)類專業(yè)快速發(fā)展與當(dāng)前大數(shù)據(jù)時(shí)代背景有著密切的聯(lián)系,大數(shù)據(jù)時(shí)代給統(tǒng)計(jì)學(xué)帶來(lái)了機(jī)遇的同時(shí)也帶來(lái)了更大的挑戰(zhàn)。
大數(shù)據(jù)時(shí)代使得統(tǒng)計(jì)學(xué)的應(yīng)用范疇進(jìn)一步擴(kuò)大。傳統(tǒng)的統(tǒng)計(jì)學(xué)一般都是根據(jù)有限樣本信息去了解某一現(xiàn)象的結(jié)果或者原因,但基于包含海量樣本信息的大數(shù)據(jù)的統(tǒng)計(jì)學(xué)科將向大家展示的是一個(gè)更為具體和完整的過(guò)程。以前,在應(yīng)用統(tǒng)計(jì)分析方法時(shí),往往習(xí)慣于根據(jù)“研究目的”來(lái)驅(qū)動(dòng)“收集數(shù)據(jù)”。往后,由于包含有效樣本信息的大數(shù)據(jù)隨處可得,人們將會(huì)反過(guò)來(lái)用“數(shù)據(jù)”驅(qū)動(dòng)“研究目的”,這種功能性的改變將會(huì)促進(jìn)統(tǒng)計(jì)學(xué)應(yīng)用范圍的進(jìn)一步擴(kuò)大。例如:傳統(tǒng)的統(tǒng)計(jì)學(xué)方法往往被用來(lái)作為一個(gè)數(shù)學(xué)形式的參考信息,例如生物統(tǒng)計(jì)、經(jīng)濟(jì)應(yīng)用統(tǒng)計(jì)等,但在大數(shù)據(jù)背景下,數(shù)據(jù)本身所含有的信息更加豐富化和多元化,包含海量有效信息的樣本數(shù)據(jù)唾手可得,而這些信息涉及我們生活中的各個(gè)方面,這些信息一旦被挖掘出來(lái),將會(huì)促進(jìn)許多產(chǎn)業(yè)的快速發(fā)展。另外,在大數(shù)據(jù)背景下,傳統(tǒng)統(tǒng)計(jì)學(xué)方法的結(jié)構(gòu)化數(shù)據(jù)局限會(huì)進(jìn)一步放大,我們需要在非結(jié)構(gòu)數(shù)據(jù)條件下進(jìn)行有效統(tǒng)計(jì)分析,這將促使統(tǒng)計(jì)學(xué)方法應(yīng)用到許多傳統(tǒng)意義上無(wú)法數(shù)據(jù)化的領(lǐng)域中。
大數(shù)據(jù)時(shí)代背景下,統(tǒng)計(jì)學(xué)學(xué)科科體系將會(huì)得到新的延伸。統(tǒng)計(jì)學(xué)方法在面對(duì)包含海量有效樣本信息的大數(shù)據(jù)時(shí),龐大的數(shù)據(jù)使得樣本的選取、標(biāo)準(zhǔn)劃分都產(chǎn)生了新的變化,傳統(tǒng)統(tǒng)計(jì)中的有限樣本將會(huì)進(jìn)一步向趨于總體大樣本的方向發(fā)展,這將促使包括“總體統(tǒng)計(jì)”和“樣本統(tǒng)計(jì)”的新的統(tǒng)計(jì)學(xué)學(xué)科體系的形成,能夠有效消除“總體統(tǒng)計(jì)”的數(shù)據(jù)采集難度,彌補(bǔ)“樣本統(tǒng)計(jì)”的數(shù)據(jù)采集不足,達(dá)到有效延伸統(tǒng)計(jì)學(xué)學(xué)科體系的目的。
新生事物的出現(xiàn)定會(huì)導(dǎo)致傳統(tǒng)觀念和技術(shù)的變革。例如,數(shù)碼相機(jī)的出現(xiàn)導(dǎo)致了傳統(tǒng)相片膠卷照相行業(yè)的幾近蕭條和衰退,如果大數(shù)據(jù)能夠包含所有父親和兒子的身高數(shù)據(jù)的話,我們只要通過(guò)計(jì)算給定父親身高條件下其所有兒子平均身高就能夠比較準(zhǔn)確地預(yù)測(cè)出其兒子身高了,這樣的話在預(yù)測(cè)過(guò)程中模型選擇不再重要,傳統(tǒng)統(tǒng)計(jì)學(xué)方法中“神奇”的回歸預(yù)測(cè)方法也將不再“神奇”。大數(shù)據(jù)的到來(lái)將對(duì)傳統(tǒng)的統(tǒng)計(jì)方法進(jìn)行考驗(yàn),云計(jì)算機(jī)平臺(tái)的建立、社會(huì)網(wǎng)絡(luò)的形成以及企業(yè)逐利與公共管理的需求均給統(tǒng)計(jì)分析方法和技術(shù)帶來(lái)了發(fā)展機(jī)遇的同時(shí),也給統(tǒng)計(jì)學(xué)以及統(tǒng)計(jì)教育帶來(lái)了更大的挑戰(zhàn)。在當(dāng)今大數(shù)據(jù)時(shí)代,其他學(xué)科和行業(yè)紛紛涌入大數(shù)據(jù)的熱潮,如果統(tǒng)計(jì)學(xué)不抓緊跟隨步伐加入大數(shù)據(jù)歷史潮流的話,那么將會(huì)面臨著被邊緣化的危險(xiǎn)。目前統(tǒng)計(jì)學(xué)的主要目標(biāo)還是通過(guò)收集、整理和分析數(shù)據(jù),從而發(fā)現(xiàn)數(shù)據(jù)背后隱含的真理,這樣的統(tǒng)計(jì)方法和理論對(duì)數(shù)據(jù)的要求比較高,而大數(shù)據(jù)充滿了各種隨機(jī)的和非隨機(jī)的誤差和偏倚,很難滿足這些苛刻的要求。其實(shí),只要我們能從大數(shù)據(jù)中得出具有可證真?zhèn)蔚慕Y(jié)論,那么這個(gè)結(jié)論就應(yīng)該算是科學(xué)的,應(yīng)該可以用于知識(shí)積累。
統(tǒng)計(jì)學(xué)作為一門傳統(tǒng)的方法論學(xué)科,其發(fā)展歷史悠久,特別是近一個(gè)世紀(jì)以來(lái)取得了空前的發(fā)展成果,無(wú)論是從學(xué)科理論領(lǐng)域還是從生產(chǎn)實(shí)踐過(guò)程來(lái)看,統(tǒng)計(jì)學(xué)的發(fā)展已經(jīng)相對(duì)較為成熟,其研究成果非常豐富,統(tǒng)計(jì)學(xué)的不斷發(fā)展為人類社會(huì)的發(fā)展和技術(shù)進(jìn)步帶來(lái)了極大的影響。隨著大數(shù)據(jù)時(shí)代數(shù)據(jù)的到來(lái),呈現(xiàn)出大量的數(shù)據(jù),而且其數(shù)據(jù)的分布狀態(tài)更為廣泛,這對(duì)統(tǒng)計(jì)學(xué)的影響是特別明顯的。首先,大數(shù)據(jù)時(shí)代的數(shù)據(jù)之“大”主要體現(xiàn)在維數(shù)高和容量大,有時(shí)候這種“大”已經(jīng)超出了我們的想象。當(dāng)然,海量的數(shù)據(jù)能讓我們對(duì)于事情的認(rèn)知程度更加全面,因此,大數(shù)據(jù)改變了數(shù)據(jù)樣本與總體之間的關(guān)系。其次,大數(shù)據(jù)時(shí)代其數(shù)據(jù)具有多樣性的特點(diǎn),改變了傳統(tǒng)統(tǒng)計(jì)學(xué)方法對(duì)數(shù)據(jù)統(tǒng)計(jì)分析的主觀要求,過(guò)去我們進(jìn)行統(tǒng)計(jì)分析的目的更偏向于追求“為什么”,而現(xiàn)在的統(tǒng)計(jì)分析的目的更傾向于探索“是什么”。
大數(shù)據(jù)時(shí)代對(duì)統(tǒng)計(jì)軟件以及統(tǒng)計(jì)方法提出了更高的要求。隨著計(jì)算機(jī)科學(xué)技術(shù)的快速發(fā)展,能夠用于解決統(tǒng)計(jì)計(jì)算問題的統(tǒng)計(jì)學(xué)軟件應(yīng)運(yùn)而生,統(tǒng)計(jì)學(xué)軟件的使用大大提升了統(tǒng)計(jì)學(xué)中對(duì)數(shù)據(jù)分析和處理的效率和精準(zhǔn)率,使得很多復(fù)雜的統(tǒng)計(jì)方法得以實(shí)現(xiàn)。大數(shù)據(jù)背景下,傳統(tǒng)的統(tǒng)計(jì)軟件如SPSS等,已經(jīng)不能夠?qū)崿F(xiàn)大數(shù)據(jù)的高速傳輸、存儲(chǔ)功能。因此,軟件功能還需要一定的開發(fā)和升級(jí),使其滿足大數(shù)據(jù)時(shí)代對(duì)統(tǒng)計(jì)軟件的要求。
(一)對(duì)統(tǒng)計(jì)學(xué)作為一門學(xué)科的理解有偏差
目前仍有許多人將統(tǒng)計(jì)學(xué)視為數(shù)學(xué)的一部分。當(dāng)然,如果考慮到數(shù)理統(tǒng)計(jì)是如何發(fā)展的話,他們這樣理解也不是完全錯(cuò)誤。然而,必須要強(qiáng)調(diào)的是,統(tǒng)計(jì)數(shù)據(jù)不應(yīng)該純粹作為數(shù)學(xué)科目來(lái)教授。統(tǒng)計(jì)學(xué)方法的教學(xué)過(guò)程需要利用數(shù)學(xué)知識(shí),但其方法的基本目標(biāo)是用來(lái)分析數(shù)據(jù),解決實(shí)際問題,即使在統(tǒng)計(jì)理論研究中也是如此。在沒有應(yīng)用的情況下教授純理論是不科學(xué)的。目前,統(tǒng)計(jì)學(xué)教育過(guò)程中對(duì)實(shí)例數(shù)據(jù)建模和分析技能的培養(yǎng)不夠重視。而與不重視應(yīng)用相反的另一個(gè)極端是,有一些人支持這樣一種觀點(diǎn),即統(tǒng)計(jì)學(xué)可以完全脫離數(shù)學(xué)。隨著計(jì)算機(jī)科學(xué)技術(shù)的快速發(fā)展,各種統(tǒng)計(jì)軟件涌現(xiàn)出來(lái),如SAS、SPSS、MINITAB、R和s-plus等。在分析數(shù)據(jù)的時(shí)候,他們可以通過(guò)一個(gè)流行的軟件包輕松獲得結(jié)果。在整個(gè)過(guò)程中,他們可能不需要處理任何數(shù)學(xué)公式,這導(dǎo)致一些人認(rèn)為不需要數(shù)學(xué)理論基礎(chǔ)。例如:有一位生物學(xué)家到某個(gè)學(xué)校的統(tǒng)計(jì)學(xué)實(shí)驗(yàn)室交流,她致力于尋找新的蝙蝠種類,為此她找到了兩組體形不同的蝙蝠,其中一組4只,另一組9只,通過(guò)計(jì)算基于正態(tài)分布的假設(shè)檢驗(yàn)統(tǒng)計(jì)量后,得出的結(jié)論是兩組樣本有顯著性差異,于是她聲稱自己找到了一種新的蝙蝠物種,她的結(jié)論顯然是不科學(xué)的。
(二)本科統(tǒng)計(jì)學(xué)教學(xué)課程設(shè)置不夠科學(xué)
合理的課程體系應(yīng)該是與實(shí)現(xiàn)培養(yǎng)方案所制定的學(xué)習(xí)目標(biāo)一致的一系列課程,體系中的課程之間應(yīng)該相互協(xié)調(diào),應(yīng)該避免內(nèi)容上的重復(fù)和遺漏,同時(shí)還應(yīng)該比較靈活,為學(xué)生的自身發(fā)展留下較為寬松的空間。目前國(guó)內(nèi)多數(shù)高校統(tǒng)計(jì)類專業(yè)的培養(yǎng)方案學(xué)習(xí)目標(biāo)不夠明確,從而導(dǎo)致課程設(shè)置時(shí)對(duì)學(xué)習(xí)目標(biāo)考慮不夠充分,這種課程設(shè)置存在一定的隨意性。目前多數(shù)學(xué)校的課程體系主要強(qiáng)調(diào)各門課程在教學(xué)內(nèi)容上的系統(tǒng)性和完整性。這種課程設(shè)置方式有其優(yōu)點(diǎn),但也難免存在一些不足,不同課程之間的教學(xué)內(nèi)容容易出現(xiàn)交叉和重復(fù),各門課程的教學(xué)內(nèi)容與培養(yǎng)方案制定的學(xué)習(xí)目標(biāo)難以完全對(duì)接。例如:《應(yīng)用回歸分析》和《計(jì)量經(jīng)濟(jì)學(xué)》中的單方程計(jì)量經(jīng)濟(jì)學(xué)模型部分很多內(nèi)容是交叉和重復(fù)的,在課程教學(xué)內(nèi)容設(shè)置上要考慮怎么解決好這種教學(xué)內(nèi)容交叉和重復(fù)的問題。
(三)就業(yè)前景令人擔(dān)憂
目前統(tǒng)計(jì)教育和就業(yè)前景都令人擔(dān)憂,統(tǒng)計(jì)教育應(yīng)該適應(yīng)行業(yè)和社會(huì)需要,如果統(tǒng)計(jì)教育脫離行業(yè)和社會(huì)需求,那么將導(dǎo)致統(tǒng)計(jì)畢業(yè)生的就業(yè)問題,就業(yè)問題反過(guò)來(lái)會(huì)導(dǎo)致統(tǒng)計(jì)學(xué)專業(yè)招生的困難。例如:某高校2012年招收了60名統(tǒng)計(jì)學(xué)專業(yè)學(xué)生,后來(lái)對(duì)這批學(xué)生進(jìn)行了一項(xiàng)跟蹤調(diào)查,結(jié)果顯示大多數(shù)人對(duì)統(tǒng)計(jì)學(xué)缺乏基本了解,學(xué)生們不知道統(tǒng)計(jì)學(xué)意味著什么和以后能做些什么,他們不知道統(tǒng)計(jì)學(xué)本科畢業(yè)后是否能在中國(guó)的中小城市找到工作以及做什么。在這種情形下,大多數(shù)畢業(yè)生被鼓勵(lì)去讀研究生,但讀研后最終還是要走向工作崗位的。后期跟蹤調(diào)查結(jié)果顯示,這批學(xué)生中只有少數(shù)人在畢業(yè)后找到了令人滿意的且專業(yè)對(duì)口的工作。這種就業(yè)前景的不確定性將影響到中國(guó)未來(lái)統(tǒng)計(jì)學(xué)專業(yè)的發(fā)展。
數(shù)據(jù)是統(tǒng)計(jì)學(xué)的基礎(chǔ)和核心,大數(shù)據(jù)來(lái)臨之后,傳統(tǒng)數(shù)據(jù)的意義發(fā)生了改變,這將使得以此為基礎(chǔ)的統(tǒng)計(jì)學(xué)學(xué)科及其統(tǒng)計(jì)教育也必然會(huì)隨之做出改變。
首先,需要構(gòu)建適應(yīng)大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)學(xué)教學(xué)體系。學(xué)好和用好統(tǒng)計(jì)學(xué)方法并不是一件簡(jiǎn)單的事,它需要學(xué)生有良好的數(shù)理基礎(chǔ),掌握好從數(shù)據(jù)的收集到數(shù)據(jù)整理、分析各個(gè)環(huán)節(jié)的技能。因此,我們需要建立課堂、實(shí)驗(yàn)室和社會(huì)實(shí)踐相結(jié)合的教學(xué)體系,使學(xué)生在掌握統(tǒng)計(jì)學(xué)方法理論基礎(chǔ)知識(shí)的同時(shí),還能夠熟練運(yùn)用統(tǒng)計(jì)方法解決實(shí)際問題。
其次,重視數(shù)學(xué)基礎(chǔ)類課程的教學(xué)。統(tǒng)計(jì)專業(yè)的本科生應(yīng)該對(duì)統(tǒng)計(jì)方法的統(tǒng)計(jì)思想有深刻理解,能用數(shù)學(xué)語(yǔ)言來(lái)表達(dá)統(tǒng)計(jì)思想。本科生要達(dá)到這些要求首先要有良好的數(shù)理基礎(chǔ)。
再次,本科統(tǒng)計(jì)教育要重視統(tǒng)計(jì)計(jì)算。傳統(tǒng)的數(shù)理統(tǒng)計(jì)教育偏向于統(tǒng)計(jì)思想和統(tǒng)計(jì)理論和數(shù)學(xué)推導(dǎo)過(guò)程,而對(duì)統(tǒng)計(jì)計(jì)算的重要性認(rèn)識(shí)不足。在許多情況下,用數(shù)值模擬代替復(fù)雜的數(shù)學(xué)推導(dǎo),會(huì)使得結(jié)論更加容易理解,這對(duì)統(tǒng)計(jì)專業(yè)的本科生而言是非常有效的學(xué)習(xí)方法。因此,在大數(shù)據(jù)時(shí)代,本科統(tǒng)計(jì)教育應(yīng)重視統(tǒng)計(jì)計(jì)算。
最后,重視專業(yè)統(tǒng)計(jì)軟件的使用。在大數(shù)據(jù)背景下,統(tǒng)計(jì)方法的實(shí)現(xiàn)和模擬都離不開軟件。專業(yè)統(tǒng)計(jì)軟件很多,譬如SPSS、SAS和R等等??傊?,教學(xué)中可以使用的專業(yè)統(tǒng)計(jì)軟件很多,但基于EXCEL的統(tǒng)計(jì)本科教學(xué)時(shí)代應(yīng)該盡快結(jié)束。
[1]孟生旺,袁衛(wèi).大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)教育[J].統(tǒng)計(jì)研究,2015(04):3-7.
[2]耿直.大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)面臨的機(jī)遇與挑戰(zhàn)[J].統(tǒng)計(jì)研究,2014(01):5-9.