王子鑒
摘 要:通過(guò)探討大數(shù)據(jù)時(shí)代背景下大數(shù)據(jù)與統(tǒng)計(jì)學(xué)之間的關(guān)系,并分別從概念與應(yīng)用角度選取不同的案例對(duì)兩者進(jìn)行對(duì)比,發(fā)現(xiàn)大數(shù)據(jù)時(shí)代給統(tǒng)計(jì)學(xué)帶來(lái)了發(fā)展空間的同時(shí),也使得統(tǒng)計(jì)學(xué)受到了不小的挑戰(zhàn)。如何把握這一發(fā)展契機(jī)以及如何應(yīng)對(duì)這一挑戰(zhàn)在當(dāng)今已變得十分重要。在大數(shù)據(jù)時(shí)代下,統(tǒng)計(jì)學(xué)究竟有什么意義與價(jià)值是一個(gè)很值得思考的問(wèn)題。
關(guān)鍵詞:統(tǒng)計(jì)學(xué);大數(shù)據(jù)時(shí)代;數(shù)據(jù)分析
中圖分類號(hào):F202? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ? 文章編號(hào):1673-291X(2020)08-0155-03
引言
“大數(shù)據(jù)”這個(gè)詞想必大家都很熟悉,因?yàn)樗呀?jīng)成為當(dāng)代的最熱門(mén)的詞匯之一。我們身邊許許多多發(fā)生著的事情被記錄著,這些都成為了“大數(shù)據(jù)”的一部分;我們自身也被“大數(shù)據(jù)”所包圍著。那么說(shuō)到“大數(shù)據(jù)”,我們首先需要探討一下什么是數(shù)據(jù)。我們常見(jiàn)的阿拉伯?dāng)?shù)字是數(shù)據(jù)嗎?我們所看到的圖片、聲音是數(shù)據(jù)嗎?大數(shù)據(jù)也是數(shù)據(jù)嗎?其實(shí)這些都屬于數(shù)據(jù),而數(shù)據(jù)真正的含義遠(yuǎn)不止這些,各種數(shù)字符號(hào)、字母的組合、語(yǔ)音、圖像、圖形等都可以稱為數(shù)據(jù)。數(shù)據(jù)可以分為連續(xù)型數(shù)據(jù)以及離散數(shù)據(jù)。而在計(jì)算機(jī)系統(tǒng)中,數(shù)據(jù)是以0,1這種二進(jìn)制進(jìn)行表示與儲(chǔ)存的。我們也可以將數(shù)據(jù)理解為一種信息載體,記錄著某種信息,可以利用它們進(jìn)行分析,得出有用的結(jié)論。
在了解完“數(shù)據(jù)”的概念后,對(duì)于“大數(shù)據(jù)”這一概念應(yīng)該就不難理解了?!按髷?shù)據(jù)”的出現(xiàn)可以追溯到Apache的一個(gè)開(kāi)源項(xiàng)目Nutch。那時(shí)大數(shù)據(jù)僅僅是用來(lái)描述海量的數(shù)據(jù),隨著谷歌MapReduce的發(fā)布,大數(shù)據(jù)不僅僅用來(lái)描述數(shù)據(jù)的量,還涵蓋了處理數(shù)據(jù)的速度。隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,世界上各種工業(yè)電子設(shè)備都被裝載了數(shù)碼傳感器,可以記錄各式各樣的時(shí)空信息,產(chǎn)生了大量的數(shù)據(jù)信息,“大數(shù)據(jù)時(shí)代”也因此而到來(lái)。據(jù)統(tǒng)計(jì),互聯(lián)網(wǎng)上每年的數(shù)據(jù)增長(zhǎng)率都呈指數(shù)上升的,每?jī)赡陻?shù)據(jù)量便可翻一番,世界上90%以上的數(shù)據(jù)都是近幾年所產(chǎn)生出來(lái)的?!按髷?shù)據(jù)”也可被定義為承載了巨大的信息量數(shù)據(jù),在一定時(shí)間內(nèi)其很難被常規(guī)軟件所獲取與處理的數(shù)據(jù)集合。其具有五大特點(diǎn):大量、高速、多樣、真實(shí)、低價(jià)值密度?!按髷?shù)據(jù)”真正的意義并不是我們掌握了多么龐大的數(shù)據(jù)體量,而是在于我們?nèi)绾瓮ㄟ^(guò)處理這些數(shù)據(jù)得出有價(jià)值的結(jié)論,通過(guò)對(duì)數(shù)據(jù)的加工處理實(shí)現(xiàn)數(shù)據(jù)自身的“增值”。
一、統(tǒng)計(jì)學(xué)的意義
“統(tǒng)計(jì)”可以追溯到人類早期的計(jì)數(shù)活動(dòng),雖然其起源很早,但一直停留在統(tǒng)計(jì)實(shí)驗(yàn)階段,并沒(méi)有人將其科學(xué)地進(jìn)行定義,上升至理論科學(xué)層面。直到概率論的出現(xiàn),統(tǒng)計(jì)研究才因此變得更加深入。法國(guó)數(shù)學(xué)家拉普拉斯最早將古典概率論與統(tǒng)計(jì)進(jìn)行了融合,因此才有了“統(tǒng)計(jì)學(xué)”這一概念的產(chǎn)生。
隨著統(tǒng)計(jì)學(xué)的不斷發(fā)展,這一學(xué)科的科學(xué)性得到充分體現(xiàn),應(yīng)用也已變得越來(lái)越廣泛。理解并掌握一些常用的統(tǒng)計(jì)學(xué)知識(shí)對(duì)于大眾來(lái)說(shuō)已變得十分必要。其實(shí)我們身邊遇到的很多事情多多少少都可以統(tǒng)計(jì)學(xué)的方法和思維進(jìn)行解決,比如預(yù)測(cè)天氣、選擇股票等等。從科學(xué)的角度,統(tǒng)計(jì)學(xué)目前已經(jīng)被列為了一級(jí)學(xué)科,這一點(diǎn)足以看出其對(duì)當(dāng)代社會(huì)的重要程度。
了解完統(tǒng)計(jì)學(xué)的發(fā)展史,接下來(lái)我們可以給統(tǒng)計(jì)學(xué)下個(gè)定義了。統(tǒng)計(jì)學(xué)可以被認(rèn)為是處理數(shù)據(jù)的一門(mén)科學(xué),具體來(lái)說(shuō)是收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)。統(tǒng)計(jì)研究的對(duì)象就是來(lái)自各個(gè)領(lǐng)域的數(shù)據(jù),而數(shù)據(jù)分析就是利用合適的統(tǒng)計(jì)方法對(duì)數(shù)據(jù)進(jìn)行研究,從數(shù)據(jù)中挖掘出有用的信息。統(tǒng)計(jì)學(xué)的方法主要可以分為描述統(tǒng)計(jì)和推斷統(tǒng)計(jì)。描述統(tǒng)計(jì)是將數(shù)據(jù)進(jìn)行匯總,利用圖表進(jìn)行概括分析;推斷統(tǒng)計(jì)則是利用樣本數(shù)據(jù)推斷總體特征。
二、統(tǒng)計(jì)數(shù)據(jù)不僅僅是大數(shù)據(jù)
統(tǒng)計(jì)學(xué)是一門(mén)古老的學(xué)科,至今已經(jīng)有300多年的歷史了,無(wú)論在政府決策還是經(jīng)濟(jì)預(yù)測(cè)都起到了舉足輕重的作用,在社會(huì)科學(xué)與自然科學(xué)中都保有較高的地位。但隨著“大數(shù)據(jù)”的產(chǎn)生以及“大數(shù)據(jù)時(shí)代”的到來(lái),統(tǒng)計(jì)學(xué)面臨著嚴(yán)重的挑戰(zhàn)。有些人已經(jīng)懷疑,在大數(shù)據(jù)時(shí)代是否還需要基于抽樣設(shè)計(jì)的統(tǒng)計(jì)學(xué)?他們認(rèn)為,現(xiàn)在的計(jì)算機(jī)科學(xué)已經(jīng)足夠發(fā)達(dá),可以借助各種渠道與媒介收集大量的數(shù)據(jù)信息,如果我們可以將全部數(shù)據(jù)收集到,那么統(tǒng)計(jì)學(xué)是否已變得不再重要了呢?事實(shí)確實(shí)如此嗎?的確,大數(shù)據(jù)時(shí)代的到來(lái)給統(tǒng)計(jì)學(xué)帶來(lái)發(fā)展機(jī)遇的同時(shí)也帶來(lái)了不小的挑戰(zhàn),但其實(shí)這兩種科學(xué)是相輔相成的,統(tǒng)計(jì)學(xué)在當(dāng)今這個(gè)大數(shù)據(jù)時(shí)代仍起到了極為重要的作用。
(一)統(tǒng)計(jì)學(xué)是收集數(shù)據(jù)的藝術(shù)
我們說(shuō)統(tǒng)計(jì)學(xué)是一門(mén)收集數(shù)據(jù)的藝術(shù),那么藝術(shù)性究竟體現(xiàn)在哪里呢?讓我們利用一個(gè)實(shí)驗(yàn)來(lái)進(jìn)行分析。
早在17世紀(jì)初,英國(guó)海軍由于長(zhǎng)時(shí)間在海上作業(yè),經(jīng)常會(huì)患有壞血病。這種病的癥狀是皮膚上出現(xiàn)灰色的斑點(diǎn),以及牙齦大量出血。他們?cè)噲D找出患病原因,發(fā)現(xiàn)可能是由于缺乏柑橘類水果所引發(fā)的。為了驗(yàn)證這一想法,英國(guó)海軍做了一個(gè)實(shí)驗(yàn)。恰好那時(shí)有四艘海軍軍艦要離開(kāi)英國(guó)在海上做長(zhǎng)期航行,海軍部的實(shí)驗(yàn)人員安排其中一艘軍艦上的海軍每天喝柑橘汁,而其他三艘軍艦則未供應(yīng)柑橘汁。還未等到航行結(jié)束,三艘沒(méi)有喝柑橘汁船上的海軍就成批的出現(xiàn)壞血病,而每天喝柑橘汁的海軍們則幾乎沒(méi)有患病。
在這項(xiàng)實(shí)驗(yàn)中我們不難發(fā)現(xiàn),實(shí)驗(yàn)人員利用了統(tǒng)計(jì)學(xué)收集數(shù)據(jù)的方法設(shè)置了實(shí)驗(yàn)組和對(duì)照組,每天喝柑橘汁的海軍與未喝柑橘汁的海軍被分別定義為實(shí)驗(yàn)組和對(duì)照組,進(jìn)而形成對(duì)比。如果在實(shí)驗(yàn)中未安排對(duì)照組,則無(wú)法斷定柑橘汁這一因素對(duì)壞血病發(fā)病的影響。設(shè)計(jì)一個(gè)好的實(shí)驗(yàn)都需要安排一個(gè)實(shí)驗(yàn)組以及多個(gè)對(duì)照組。
但若仔細(xì)分析上述實(shí)驗(yàn)設(shè)計(jì),仍存在一些不足之處。主要體現(xiàn)在以下兩點(diǎn):(1)由于四艘軍艦航行路線并不相同,導(dǎo)致實(shí)驗(yàn)組和對(duì)照組所處的外部環(huán)境有差異,應(yīng)該在每一艘軍艦上都安排每天喝柑橘汁和不喝柑橘汁的海員,這樣就排除了軍艦與外部環(huán)境的影響。(2)各個(gè)海員的身體條件不一定相同,所以實(shí)驗(yàn)者應(yīng)該隨機(jī)的安排在各艘軍艦上,這樣同一艘軍艦上健康與不健康的海員數(shù)量相差不大,可以排除海員身體情況的差異,使得實(shí)驗(yàn)結(jié)果更加令人信服。
想要設(shè)計(jì)一個(gè)好的實(shí)驗(yàn)并不是件容易的事情,特別在搜集數(shù)據(jù)方面。實(shí)驗(yàn)組和對(duì)照組的產(chǎn)生要是完全隨機(jī)的,并在相同的條件背景下進(jìn)行實(shí)驗(yàn)。例如,在收集一種新藥或者新療法是否有效的數(shù)據(jù)過(guò)程中,可以先將實(shí)驗(yàn)對(duì)象按照年齡、性別、身體條件等因素進(jìn)行相應(yīng)的分組,并將分組結(jié)果分別對(duì)患者與醫(yī)生保密,構(gòu)成一種雙盲法實(shí)驗(yàn)。這樣才會(huì)使得收集數(shù)據(jù)的結(jié)果更加準(zhǔn)確與可信。由此不難看出統(tǒng)計(jì)學(xué)是一門(mén)收集數(shù)據(jù)的藝術(shù)。
(二)統(tǒng)計(jì)學(xué)是分析數(shù)據(jù)的藝術(shù)
通過(guò)設(shè)計(jì)嚴(yán)謹(jǐn)科學(xué)的數(shù)據(jù)收集方案并實(shí)施后,我們獲得了為研究某一問(wèn)題所需的數(shù)據(jù)。但僅僅擁有這些數(shù)據(jù)是遠(yuǎn)遠(yuǎn)不夠的,我們很難從紛繁復(fù)雜的數(shù)據(jù)中直接找到有價(jià)值的信息,所以還需要對(duì)收集上來(lái)的數(shù)據(jù)進(jìn)行數(shù)據(jù)分析以獲得有用的信息。
在數(shù)據(jù)分析中,我們首先需要明確兩個(gè)概念:相關(guān)與因果。之所以說(shuō)到這兩個(gè)概念,是因?yàn)槿藗兂3?huì)混淆這兩個(gè)概念。尤其在當(dāng)今這個(gè)大數(shù)據(jù)時(shí)代,我們可以收集到海量的數(shù)據(jù),相關(guān)關(guān)系似乎已經(jīng)代替了因果關(guān)系,但對(duì)于絕大多數(shù)科學(xué)研究與政策制定,往往人們更加依靠因果關(guān)系。但當(dāng)兩個(gè)事物呈現(xiàn)相關(guān)關(guān)系時(shí),我們可能誤將這種關(guān)系理解為因果關(guān)系。下面通過(guò)一個(gè)例子來(lái)理解這一點(diǎn)。
利用統(tǒng)計(jì)數(shù)據(jù),我們發(fā)現(xiàn)每年短褲、短裙銷量增加的同時(shí),各地區(qū)溺水身亡的人數(shù)也在不斷增加,那么我們可以說(shuō)這是一種因果關(guān)系嗎?仔細(xì)分析一下,就能發(fā)現(xiàn)其中的緣由。每年短褲、短裙銷量增加的季節(jié)都為夏天,夏天由于天氣炎熱,有更多的人會(huì)選擇去戶外游泳,不幸溺水身亡的人數(shù)自然就會(huì)增加。這兩個(gè)事件其實(shí)都是受到季節(jié)影響,呈現(xiàn)出一種相關(guān)關(guān)系,而并不是我們想要追求的因果關(guān)系。
相關(guān)關(guān)系可以被定義為:如果有兩個(gè)事物,當(dāng)一個(gè)事物發(fā)生變化時(shí),另一個(gè)事物也會(huì)隨著發(fā)生規(guī)律變化,我們就說(shuō)這兩個(gè)事物存在相關(guān)性。而因果關(guān)系則是:一個(gè)事物的發(fā)生會(huì)直接影響另一個(gè)事物的發(fā)生。比如,商品價(jià)格上升會(huì)導(dǎo)致銷量的下降,則可以認(rèn)為價(jià)格和銷量之間存在著一種因果關(guān)系。若兩件事物存在著因果關(guān)系,那么它們之間也一定存在著相關(guān)關(guān)系,而反之則不一定成立。
下面再來(lái)看一個(gè)案例。康奈爾大學(xué)曾經(jīng)做過(guò)一個(gè)有關(guān)上大學(xué)對(duì)保持獨(dú)身有什么影響的調(diào)查,調(diào)查了1 500名中年畢業(yè)生,發(fā)現(xiàn)其中男性93%已經(jīng)結(jié)婚,而同年齡段的已婚比例為83%。但是女性只有65%已經(jīng)結(jié)婚,未婚女性是同年齡段女性的3倍之多。當(dāng)我們看到這段文字的時(shí)候,特別對(duì)于女性來(lái)說(shuō),她們會(huì)認(rèn)為上大學(xué)會(huì)減少未來(lái)獲得丈夫的概率,而文章也的確是這么說(shuō)的。更何況這項(xiàng)統(tǒng)計(jì)數(shù)據(jù)是來(lái)自于世界知名學(xué)府,其真實(shí)性是毋庸置疑的。但需要我們注意的是,上述結(jié)論并不是康奈爾大學(xué)得出的,一些不了解統(tǒng)計(jì)學(xué)的粗心讀者往往會(huì)這么認(rèn)為。這同樣是利用一個(gè)真實(shí)的相關(guān)關(guān)系以得到未經(jīng)證實(shí)的因果關(guān)系,而這種因果關(guān)系有可能還是恰恰相反的,被調(diào)查的女性如果不上大學(xué)可能依舊保持單身,說(shuō)不定單身數(shù)目還會(huì)更多。所以上述所得出的“結(jié)論”未必是真實(shí)的。
事實(shí)上,上面那個(gè)案例可以用金西博士發(fā)現(xiàn)的性欲與教育之間的相關(guān)關(guān)系進(jìn)行解釋。想要保持單身這一想法會(huì)促使他們上大學(xué),而這種想法在他們上大學(xué)之前就已定型。若這一論斷為真,那么上大學(xué)會(huì)阻礙女性結(jié)婚的觀點(diǎn)就更缺乏依據(jù)。
由此我們可以發(fā)現(xiàn),即使擁有了多方面的數(shù)據(jù),如果缺少統(tǒng)計(jì)知識(shí)的話,依舊有可能掉入統(tǒng)計(jì)陷阱。目前許多科學(xué)研究以及政策制定幾乎都是依賴于因果關(guān)系,而不是相關(guān)關(guān)系,而真正的因果關(guān)系又大多是建立在統(tǒng)計(jì)學(xué)基礎(chǔ)上的,這也是統(tǒng)計(jì)學(xué)分析藝術(shù)性的體現(xiàn)。
三、大數(shù)據(jù)時(shí)代下統(tǒng)計(jì)學(xué)的價(jià)值
人們常說(shuō),一種新生事物的誕生必將導(dǎo)致舊事物的滅亡或革命。而大數(shù)據(jù)時(shí)代的到來(lái)對(duì)傳統(tǒng)統(tǒng)計(jì)學(xué)會(huì)帶來(lái)何種影響呢?如果大數(shù)據(jù)時(shí)代真的可以將各式各樣的數(shù)據(jù)全部收集到,那么還需要基于抽樣的統(tǒng)計(jì)學(xué)嗎?
首先,我們需要明確,大數(shù)據(jù)不可能將所有數(shù)據(jù)全部進(jìn)行采集;或許隨著科技的提升,我們真的有能力收集到全部的數(shù)據(jù),但其實(shí)這些數(shù)據(jù)也是一種被選擇的數(shù)據(jù),并不一定揭露本質(zhì)。而在這些數(shù)據(jù)中存在著各種隨機(jī)的與非隨機(jī)的誤差,很難進(jìn)行衡量;采集這些數(shù)據(jù)也需要大量的人力、物力、財(cái)力。而數(shù)據(jù)也不是越多越好,數(shù)據(jù)的量越大其所含的信息量就越大,反而會(huì)增加在數(shù)據(jù)中尋找規(guī)律的難度。與之相比,統(tǒng)計(jì)學(xué)是基于合理概率抽樣的科學(xué),有著較深的理論基礎(chǔ)與科學(xué)性,可以通過(guò)抽樣設(shè)計(jì)搜集到為了某一特定研究目所需要的優(yōu)質(zhì)數(shù)據(jù),從而實(shí)現(xiàn)數(shù)據(jù)的化繁為簡(jiǎn)。歷史上也存在著這樣的案例。羅斯福是美國(guó)歷史上唯一一位連任四屆的總統(tǒng),而在他第二次參與競(jìng)選前,美國(guó)遭到了嚴(yán)重的經(jīng)濟(jì)危機(jī),羅斯福也面臨著極大的壓力。與他競(jìng)爭(zhēng)的候選人是蘭登,也是位很有聲譽(yù)的政治家。當(dāng)時(shí)美國(guó)本土有兩家機(jī)構(gòu)都對(duì)這次大選的結(jié)果進(jìn)行了預(yù)測(cè)。其中一家是《文學(xué)文摘》雜志,這家雜志的影響力與聲譽(yù)都很高,因?yàn)樵谝酝拇筮x中它都可以準(zhǔn)確預(yù)測(cè)到大選結(jié)果。這一次該雜志在大選前又做了一次統(tǒng)計(jì)調(diào)查,調(diào)查方式是通過(guò)雜志上的調(diào)查問(wèn)卷,最后收集到了240萬(wàn)份問(wèn)卷反饋。通過(guò)對(duì)這240萬(wàn)份問(wèn)卷進(jìn)行分析,文學(xué)文摘宣布蘭登將會(huì)贏得此次大選。而還有一個(gè)人名叫蓋洛普的年輕人也在一家機(jī)構(gòu)中對(duì)這次大選結(jié)果進(jìn)行了預(yù)測(cè)。相比文學(xué)文摘的財(cái)大氣粗,蓋洛普通過(guò)實(shí)驗(yàn)設(shè)計(jì)僅僅調(diào)查了5 000人,最終發(fā)現(xiàn)羅斯福會(huì)在大選中繼續(xù)連任。最后的結(jié)果想必大家都清楚,羅斯福再次贏得了大選,而文學(xué)文摘由于在此次預(yù)測(cè)中失敗,名譽(yù)受損,最終關(guān)門(mén)倒閉。那么,為什么5 000條數(shù)據(jù)會(huì)比240萬(wàn)條數(shù)據(jù)得到的結(jié)論更加準(zhǔn)確呢?其實(shí)文學(xué)文摘在調(diào)查方式上已經(jīng)為自己的失敗埋下了伏筆,它調(diào)查的群眾都是訂閱期刊的讀者,而訂閱這份期刊的讀者都是當(dāng)時(shí)家境較為富裕的群體,那么調(diào)查結(jié)果想必會(huì)有偏頗。雖然搜集到的數(shù)據(jù)量足夠海量,但缺少了嚴(yán)謹(jǐn)?shù)膶?shí)驗(yàn)設(shè)計(jì),最終還是會(huì)造成調(diào)查的失敗。有時(shí)數(shù)據(jù)數(shù)量并不是越多越好,數(shù)據(jù)搜集的質(zhì)量其實(shí)更為重要,利用有代表性的數(shù)據(jù)進(jìn)行分析才能得到準(zhǔn)確的結(jié)論。
但是不得不說(shuō),在大數(shù)據(jù)時(shí)代可獲得的數(shù)據(jù)量確實(shí)是巨大的,可以說(shuō)樣本即總體,具有一定的數(shù)據(jù)搜集優(yōu)勢(shì)。在這種情況下,一些傳統(tǒng)的小樣本統(tǒng)計(jì)學(xué)方法可能不再適用了。我們也需要適應(yīng)這種潮流,改變傳統(tǒng)的統(tǒng)計(jì)學(xué)思維,使其可以找到可以有效獲取、處理、分析大數(shù)據(jù),獲得更為準(zhǔn)確可靠的結(jié)論。可以說(shuō),大數(shù)據(jù)時(shí)代給統(tǒng)計(jì)學(xué)帶來(lái)了發(fā)展機(jī)遇,統(tǒng)計(jì)學(xué)的地位仍然是不可撼動(dòng)的,其依舊是處理分析數(shù)據(jù)的有效方法。與此同時(shí),大數(shù)據(jù)也給統(tǒng)計(jì)學(xué)帶來(lái)了一定的挑戰(zhàn),如何轉(zhuǎn)換傳統(tǒng)統(tǒng)計(jì)學(xué)思維,使之可以更好地適應(yīng)與解決大數(shù)據(jù)問(wèn)題并不是件易事,需要統(tǒng)計(jì)學(xué)家與社會(huì)各界人士的不斷努力。但無(wú)論如何,統(tǒng)計(jì)學(xué)都在當(dāng)今這個(gè)大數(shù)據(jù)時(shí)代仍具有極強(qiáng)的價(jià)值與意義。
參考文獻(xiàn):
[1]? Patricia L. Mabry. Making Sense of the Data Explosion[J].American Journal of Preventive Medicine,2011,40(5).
[2]? 姜奇平.大數(shù)據(jù)時(shí)代到來(lái)[J].互聯(lián)網(wǎng)周刊,2012,(1):6.
[3]? 耿直.大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)面臨的機(jī)遇與挑戰(zhàn)[J].統(tǒng)計(jì)研究,2014,31(1):5-9.
[4]? 冷加起.大數(shù)據(jù)帶來(lái)哪些大變革[J].中國(guó)統(tǒng)計(jì),2014,(12):19-20.
[5]? 張海健.大數(shù)據(jù)時(shí)代下數(shù)據(jù)分析理論探討[J].文理導(dǎo)航(中旬),2016,(8):8-74.