李智明
摘要:文章主要討論大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)的建設(shè)發(fā)展問題。根據(jù)大數(shù)據(jù)對統(tǒng)計(jì)學(xué)的影響,分析我國統(tǒng)計(jì)學(xué)的發(fā)展現(xiàn)狀,提出健全和完善統(tǒng)計(jì)學(xué)科的新思路,積極應(yīng)對大數(shù)據(jù)時(shí)代對統(tǒng)計(jì)學(xué)科建設(shè)面臨的新挑戰(zhàn)與新機(jī)遇。
關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計(jì)學(xué);學(xué)科建設(shè)
中圖分類號:C829.23? ? ?文獻(xiàn)標(biāo)志碼:C? ? ?文章編號:1674-9324(2020)13-0095-02
近年來大數(shù)據(jù)蘊(yùn)藏的價(jià)值已經(jīng)得到普遍認(rèn)可[1-3],其意義在于通過數(shù)據(jù)采集、導(dǎo)入與預(yù)處理、統(tǒng)計(jì)分析、數(shù)據(jù)挖掘,發(fā)現(xiàn)其內(nèi)在規(guī)律,創(chuàng)造新價(jià)值。統(tǒng)計(jì)學(xué)是搜集、分析及解釋大數(shù)據(jù)的方法論[5]。大數(shù)據(jù)作為統(tǒng)計(jì)學(xué)研究重點(diǎn)對象,為統(tǒng)計(jì)學(xué)科提供了發(fā)展平臺,促進(jìn)統(tǒng)計(jì)理論、思想及方法不斷完善,并對數(shù)據(jù)采集、處理和分析等問題帶來了新挑戰(zhàn)和新機(jī)遇。
一、大數(shù)據(jù)對統(tǒng)計(jì)學(xué)的影響
1.處理大數(shù)據(jù)發(fā)展創(chuàng)新的技術(shù)手段。大數(shù)據(jù)的海量化導(dǎo)致數(shù)據(jù)存儲和處理分析的危機(jī),它的多樣性使得研究的數(shù)據(jù)類型發(fā)生了改變。有些行業(yè)的數(shù)據(jù)涉及上百個(gè)參數(shù),其復(fù)雜性不僅體現(xiàn)在數(shù)據(jù)樣本本身,更體現(xiàn)在多源異構(gòu)、多實(shí)體和多空間之間的交互動(dòng)態(tài)性,難以用傳統(tǒng)的方法描述與度量。缺乏先進(jìn)的統(tǒng)計(jì)分析方法是從大數(shù)據(jù)中獲得最大價(jià)值的主要障礙。因此,如何發(fā)展統(tǒng)計(jì)理論和方法,迅速有效地處理海量數(shù)據(jù),是解決挖掘大數(shù)據(jù)價(jià)值的關(guān)鍵技術(shù)。
2.揭示大數(shù)據(jù)蘊(yùn)藏價(jià)值的思想方法。迄今為止,人們對事物的研究主要依賴抽樣數(shù)據(jù)、局部數(shù)據(jù)和片面數(shù)據(jù),產(chǎn)生的結(jié)果可能是片面或者膚淺的,甚至是錯(cuò)誤的。文獻(xiàn)[1]指出了大數(shù)據(jù)時(shí)代的三個(gè)重要思維方式:①從樣本數(shù)據(jù)到全體數(shù)據(jù);②從數(shù)據(jù)結(jié)構(gòu)精確性到其混雜性;③從變量因果關(guān)系到相關(guān)關(guān)系。傳統(tǒng)的統(tǒng)計(jì)理論及方法很難用來描述巨大的全體數(shù)據(jù)、復(fù)雜的數(shù)據(jù)結(jié)構(gòu)及高維變量之間的關(guān)系等,有時(shí)其計(jì)算過程及存儲量很難實(shí)現(xiàn)。對非結(jié)構(gòu)化數(shù)據(jù),有效的統(tǒng)計(jì)模型也需要新的探索和嘗試。
3.運(yùn)用大數(shù)據(jù)精確管理的思維習(xí)慣。大數(shù)據(jù)除了容量大以外,其整合與分析可以讓我們發(fā)現(xiàn)新的知識和價(jià)值。通過大數(shù)據(jù)獲得知識、商機(jī)和社會(huì)服務(wù)的能力不僅可以應(yīng)用于學(xué)術(shù)研究,也可以應(yīng)用于普通的機(jī)構(gòu)、企業(yè)和政府部門等,使得更多人參與社會(huì)管理。目前,我們尚缺乏收集、整理、運(yùn)用數(shù)據(jù)精確管理事物的意識,對“大概”“差不多”模棱兩可的思維習(xí)慣提出嚴(yán)峻挑戰(zhàn)[2]。
大數(shù)據(jù)的影響,不僅可以改變我們對事物的思維方式,還可以增加探求知識的方式方法。在大數(shù)據(jù)時(shí)代背景下,我們可以用更寬泛的統(tǒng)計(jì)思維方式,分析挖掘數(shù)據(jù)中隱含的知識,揭示事物的眾多層面。
二、我國統(tǒng)計(jì)學(xué)發(fā)展現(xiàn)狀
目前,我國統(tǒng)計(jì)學(xué)科建設(shè)的發(fā)展與大數(shù)據(jù)時(shí)代的需要還存在許多不相適應(yīng)的地方:
1.統(tǒng)計(jì)學(xué)體系不夠完善。1992年統(tǒng)計(jì)學(xué)首次從經(jīng)濟(jì)學(xué)中獨(dú)立成為一級學(xué)科。1998年統(tǒng)計(jì)學(xué)納入理學(xué),成為與數(shù)、理、化、生、經(jīng)等并列的學(xué)科類。2010年成為一級學(xué)科,授理學(xué)學(xué)位或經(jīng)濟(jì)學(xué)學(xué)位[5,6]。這樣,統(tǒng)計(jì)學(xué)就完全從數(shù)學(xué)和經(jīng)濟(jì)學(xué)中獨(dú)立出來,成了名副其實(shí)的一級學(xué)科。統(tǒng)計(jì)學(xué)上升為一級學(xué)科,有利于統(tǒng)計(jì)學(xué)科的發(fā)展,更有利于我國經(jīng)濟(jì)與社會(huì)的發(fā)展。但統(tǒng)計(jì)一級學(xué)科確立后,大部分掛靠在高校的數(shù)學(xué)學(xué)院或經(jīng)濟(jì)學(xué)院之下,作為一般學(xué)科建設(shè)發(fā)展,使得統(tǒng)計(jì)學(xué)發(fā)展受到一定的限制。
2.學(xué)科建設(shè)滯后于時(shí)代發(fā)展。從我國統(tǒng)計(jì)學(xué)發(fā)展歷史來看,經(jīng)歷了兩門統(tǒng)計(jì)學(xué)的特殊時(shí)期:數(shù)理統(tǒng)計(jì)與經(jīng)濟(jì)統(tǒng)計(jì)。在數(shù)理統(tǒng)計(jì)教學(xué)中,注重理論上的學(xué)習(xí)和推導(dǎo),與實(shí)際運(yùn)用脫離較遠(yuǎn);在社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)教學(xué)中,注重實(shí)踐運(yùn)用與分析,但缺乏精確推導(dǎo)與理論支撐,導(dǎo)致數(shù)理統(tǒng)計(jì)越來越理論化,社會(huì)統(tǒng)計(jì)越來越指標(biāo)化。更有人主張經(jīng)濟(jì)統(tǒng)計(jì)屬于經(jīng)濟(jì)學(xué)分支,數(shù)理統(tǒng)計(jì)屬于數(shù)學(xué)分支,導(dǎo)致統(tǒng)計(jì)理論與應(yīng)用被人為割裂開來,嚴(yán)重阻礙統(tǒng)計(jì)學(xué)的發(fā)展,使得我國統(tǒng)計(jì)學(xué)發(fā)展遠(yuǎn)遠(yuǎn)落后于發(fā)達(dá)國家。
3.統(tǒng)計(jì)人才培養(yǎng)質(zhì)量亟待提高。目前,統(tǒng)計(jì)人才隊(duì)伍和科研成果還較弱。尤其西部地區(qū)各高校,統(tǒng)計(jì)學(xué)科的師資力量和人才培養(yǎng)環(huán)節(jié)非常薄弱,科研成果較少,有些科研團(tuán)隊(duì)的建設(shè)尚處于籌備中,導(dǎo)致能申請上國家自然科學(xué)基金面上項(xiàng)目或重點(diǎn)項(xiàng)目的教師不多。另外,有些高校只有統(tǒng)計(jì)學(xué)碩士點(diǎn)而無統(tǒng)計(jì)學(xué)博士點(diǎn),不利于統(tǒng)計(jì)人才的培養(yǎng)??梢哉f,統(tǒng)計(jì)人才隊(duì)伍是制約和影響統(tǒng)計(jì)學(xué)發(fā)展的關(guān)鍵因素。
三、健全完善大數(shù)據(jù)下統(tǒng)計(jì)學(xué)體系的幾點(diǎn)思考
1.研究對象。統(tǒng)計(jì)學(xué)研究對象主要是數(shù)據(jù),其來源分成兩大類:一類是物理世界,大都是實(shí)驗(yàn)和傳感數(shù)據(jù),采集和處理數(shù)據(jù)均事先設(shè)計(jì)好。另一類是與人類活動(dòng)密切相關(guān)的數(shù)據(jù)如互聯(lián)網(wǎng)大數(shù)據(jù),該數(shù)據(jù)大都隨機(jī)產(chǎn)生,具有多源異構(gòu)、交互、時(shí)效、突發(fā)和噪聲等特性,并且許多數(shù)據(jù)是重復(fù)的或者沒有價(jià)值,比科學(xué)實(shí)驗(yàn)數(shù)據(jù)分析更困難,這是統(tǒng)計(jì)研究的重難點(diǎn)。
2.培養(yǎng)目標(biāo)。統(tǒng)計(jì)學(xué)建設(shè)既需要培養(yǎng)理論功底扎實(shí)的統(tǒng)計(jì)“理論家”,又需要培養(yǎng)靈活運(yùn)用統(tǒng)計(jì)的“實(shí)踐家”,推動(dòng)統(tǒng)計(jì)學(xué)在大數(shù)據(jù)時(shí)代中的發(fā)展[7]。大數(shù)據(jù)時(shí)代下對統(tǒng)計(jì)人才有以下要求:(1)具有扎實(shí)的數(shù)學(xué)、經(jīng)濟(jì)學(xué)以及統(tǒng)計(jì)學(xué)基礎(chǔ);(2)具有數(shù)據(jù)采集與處理和計(jì)算機(jī)應(yīng)用的基本能力;(3)具有創(chuàng)新、分析和解決問題的能力;(4)具有大數(shù)據(jù)智慧應(yīng)用的意識和能力[8]。2019年3月28日,教育部公布了477所本科院校批準(zhǔn)開設(shè)“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”專業(yè),405所高職院所設(shè)立“大數(shù)據(jù)技術(shù)與應(yīng)用”專業(yè),這意味著統(tǒng)計(jì)學(xué)作為支撐學(xué)科培養(yǎng)任務(wù)更繁重、目標(biāo)對象更廣泛。
3.內(nèi)容體系。大數(shù)據(jù)時(shí)代統(tǒng)計(jì)不僅要成為一級學(xué)科,而且要有完善的學(xué)科體系。統(tǒng)計(jì)學(xué)科內(nèi)容體系可分為理論、應(yīng)用及技術(shù)工具三大部分。理論內(nèi)容主要涉及各種統(tǒng)計(jì)方法的數(shù)學(xué)論證及推導(dǎo),可以讓學(xué)生對各種統(tǒng)計(jì)模型和理論有較深刻的認(rèn)識。統(tǒng)計(jì)應(yīng)用實(shí)踐主要是針對不同專業(yè)的特征,旨在讓學(xué)生將統(tǒng)計(jì)模型運(yùn)用到該研究領(lǐng)域[6,7]。統(tǒng)計(jì)分析技術(shù)工具主要包括SAS、SPSS、MINTAB、MATHCAD等高性能統(tǒng)計(jì)分析軟件,目的讓學(xué)生能夠進(jìn)行數(shù)據(jù)處理、分析及建模,準(zhǔn)確得出決策依據(jù)。
4.評價(jià)標(biāo)準(zhǔn)。由于理論和應(yīng)用統(tǒng)計(jì)學(xué)的研究對象不同,評價(jià)標(biāo)準(zhǔn)也應(yīng)不同。統(tǒng)計(jì)學(xué)理論家應(yīng)重點(diǎn)關(guān)注統(tǒng)計(jì)方法原理研究的深入程度。應(yīng)用統(tǒng)計(jì)學(xué)家應(yīng)考查數(shù)據(jù)抽樣方式與處理是否符合該領(lǐng)域的特點(diǎn)和規(guī)律、所選數(shù)據(jù)指標(biāo)體系的合理性以及推斷方法的準(zhǔn)確性等[8,9]。
在大數(shù)據(jù)時(shí)代,統(tǒng)計(jì)學(xué)仍然是數(shù)據(jù)分析的靈魂[10]。統(tǒng)計(jì)學(xué)是數(shù)據(jù)的科學(xué),其生命力在于政治、經(jīng)濟(jì)、文化、科學(xué)等各個(gè)領(lǐng)域的應(yīng)用。為此,各高校有責(zé)任和義務(wù)使收集、處理、運(yùn)用統(tǒng)計(jì)知識成為學(xué)生的一種意識、一種習(xí)慣、一種文化,這是大數(shù)據(jù)時(shí)代的必然選擇。
參考文獻(xiàn):
[1][美]維克托·邁爾·舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革[M].盛楊燕,周濤譯.杭州:浙江人民出版社.2012.
[2]涂子沛.大數(shù)據(jù):正在到來的數(shù)據(jù)革命[M].南寧:廣西師范大學(xué)出版社.2012.
[3]陳天鵬.數(shù)據(jù)庫營銷在零售行業(yè)的應(yīng)用[D].學(xué)位論文,東南大學(xué).2016.
[4]馮蕊.探究統(tǒng)計(jì)學(xué)在當(dāng)代經(jīng)濟(jì)管理中的影響[J].經(jīng)濟(jì)研究導(dǎo)刊.2017.
[5]袁衛(wèi).機(jī)遇與挑戰(zhàn)-寫在統(tǒng)計(jì)學(xué)成為一級學(xué)科之際[J].統(tǒng)計(jì)研究.2011,28(11)::3-10.
[6]張澤厚.我國統(tǒng)計(jì)學(xué)科建設(shè)史上的一次重大變革[J].統(tǒng)計(jì)研究.2012,29(8):24-26.
[7]雷欽禮.統(tǒng)計(jì)學(xué)科發(fā)展:危機(jī)與突破[J].中國統(tǒng)計(jì).2007,10:51-52.
[8]孫蕾.透析我國高校統(tǒng)計(jì)學(xué)科建設(shè)問題[J].統(tǒng)計(jì)研究.2004,4:36-37.
[9]薛薇.從統(tǒng)計(jì)應(yīng)用框架探討統(tǒng)計(jì)學(xué)科的發(fā)展[J].統(tǒng)計(jì)研究.2005,8:69-71.
[10]劉軍.大數(shù)據(jù)時(shí)代,傳統(tǒng)統(tǒng)計(jì)學(xué)依然是數(shù)據(jù)分析的靈魂[D].人民日報(bào),2015-7-20.
Discussion about Effects and Opportunities of Big Data on Statistics
LI Zhi-ming
(College of Mathematics and System Science,Xinjiang University,Urumqi,Xinjiang 830046,China)
Abstract:This paper mainly discusses the development of statistics in a big-data era.According to the effects of big data,we analyze practical process of statistics in China.Then,we propose some new ideas how to construct and develop statistics.Finally,we should actively cope with the new challenge and opportunities of discipline construction on statistics in the coming era of big data.
Key words:big data;statistics;discipline construction.