• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    大數(shù)據(jù)與統(tǒng)計(jì)學(xué)分析方法比較

    2015-06-17 14:29:08李薇
    現(xiàn)代商貿(mào)工業(yè) 2015年11期
    關(guān)鍵詞:分析方法事物傳統(tǒng)

    李薇

    摘要:

    基于理念分析和比較研究方法,對(duì)大數(shù)據(jù)的分析方法和傳統(tǒng)統(tǒng)計(jì)學(xué)分析方法的關(guān)聯(lián)性和差異進(jìn)行了對(duì)比分析,從方法的基本思想、量化形式、數(shù)據(jù)來源、分析范式、分析方法、分析視角等角度揭示了兩種社會(huì)科學(xué)分析方法存在的聯(lián)系與差異。

    關(guān)鍵詞:

    大數(shù)據(jù);統(tǒng)計(jì)學(xué);研究方法

    中圖分類號(hào):

    F27

    文獻(xiàn)標(biāo)識(shí)碼:A

    文章編號(hào):16723198(2015)11005201

    隨著信息技術(shù)的日益發(fā)展與普及,信息以及數(shù)據(jù)在社會(huì)經(jīng)濟(jì)發(fā)展過程中發(fā)揮的作用越來越重要。現(xiàn)如今,“大數(shù)據(jù)”時(shí)代已經(jīng)來臨,于是如何更有效地利用數(shù)據(jù)快速做出科學(xué)決策也已成為眾多企業(yè)甚至是國家所共同關(guān)注的焦點(diǎn)問題。在數(shù)據(jù)處理和分析方法方面,《統(tǒng)計(jì)學(xué)》以及在其基礎(chǔ)上發(fā)展而來的實(shí)證統(tǒng)計(jì)方法是當(dāng)前的主流,這些方法可以幫助數(shù)據(jù)持有者從大量的數(shù)據(jù)中挖掘有價(jià)值的信息,并為其相關(guān)決策提供理論支撐和方法支持。然而,傳統(tǒng)的實(shí)證統(tǒng)計(jì)方法在最新出現(xiàn)的大數(shù)據(jù)情境下,卻呈現(xiàn)出了諸多缺陷,例如傳統(tǒng)數(shù)據(jù)收集方法無法實(shí)現(xiàn)大規(guī)模(甚至是總體)數(shù)據(jù)的收集,傳統(tǒng)統(tǒng)計(jì)方法和分析軟件無法處理大規(guī)模數(shù)據(jù),等等。于是,在將傳統(tǒng)統(tǒng)計(jì)學(xué)方法應(yīng)用于最新的大數(shù)據(jù)情境和問題之前,需要首先明確大數(shù)據(jù)所要求的處理方法與傳統(tǒng)的統(tǒng)計(jì)學(xué)處理方法存在哪些關(guān)聯(lián)和區(qū)別,然后才能夠決定是否可以應(yīng)用既有統(tǒng)計(jì)學(xué)理論和方法來處理某些大數(shù)據(jù)問題。

    1大數(shù)據(jù)的界定

    根據(jù)一位美國學(xué)者的研究,大數(shù)據(jù)可以被定義為:it means data thats too big, too fast, or too hard for existing tools to process。也就是說,該學(xué)者認(rèn)為:在關(guān)于大數(shù)據(jù)的所有定義中,他傾向于將之定義為那類“太大”、“太快”,或現(xiàn)存工具“太難”處理的數(shù)據(jù)。一般而言,大數(shù)據(jù)的特征可以概括為四個(gè)V:一是量大(Volume);二是流動(dòng)性大(Velocity),典型的如微博;三是種類多(Variety),多樣性,有結(jié)構(gòu)化數(shù)據(jù),也有半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù);四是價(jià)值大(Value),這些大規(guī)模數(shù)據(jù)可以為持有企業(yè)或者組織創(chuàng)造出巨大的商業(yè)或社會(huì)價(jià)值。

    Victor在其最新著作《大數(shù)據(jù)時(shí)代——生活、工作與思維的大變革》中指出,大數(shù)據(jù)時(shí)代,思維方式要發(fā)生3個(gè)變革:第一,要分析與事物相關(guān)的所有數(shù)據(jù),而不是依靠分析少量數(shù)據(jù)樣本;要總體,不要樣本。第二,要樂于接受數(shù)據(jù)的紛繁復(fù)雜,而不再追求精確性。第三,不再探求難以捉摸的因果關(guān)系,應(yīng)該更加注重相關(guān)關(guān)系。這些變革反映出了大數(shù)據(jù)處理方式與傳統(tǒng)統(tǒng)計(jì)學(xué)分析方法的很多關(guān)聯(lián)以及主要不同。因此,下面我們分別針對(duì)兩者的聯(lián)系和區(qū)別進(jìn)行討論。

    2大數(shù)據(jù)與統(tǒng)計(jì)學(xué)分析方法的聯(lián)系

    從18世紀(jì)中葉至今,統(tǒng)計(jì)學(xué)已經(jīng)經(jīng)歷了兩百多年的發(fā)展歷程,不論是基礎(chǔ)理論還是社會(huì)應(yīng)用都極其堅(jiān)實(shí)而豐富。大數(shù)據(jù)作為一種新興的事物規(guī)律認(rèn)知和挖掘思維,也將會(huì)對(duì)人類的價(jià)值體系、知識(shí)體系和生活方式產(chǎn)生重要影響,甚至引發(fā)重大改變。作為兩種認(rèn)知世界和事物規(guī)律的基本方法,它們?cè)谝韵聝蓚€(gè)方面存在緊密關(guān)聯(lián)。

    (1)挖掘事物規(guī)律的基本思想一致。統(tǒng)計(jì)學(xué)(statistics)探索事物規(guī)律的基本方法是:通過利用概率論建立數(shù)學(xué)模型,收集所觀察系統(tǒng)的數(shù)據(jù),進(jìn)行量化分析和總結(jié),做出推斷和預(yù)測,為相關(guān)決策提供依據(jù)和參考。對(duì)于大數(shù)據(jù),維克托指出,大數(shù)據(jù)思維的來臨使人類第一次有機(jī)會(huì)和條件,在非常多的領(lǐng)域和非常深入的層次獲得和使用全面數(shù)據(jù)、完整數(shù)據(jù)和系統(tǒng)數(shù)據(jù),深入探索現(xiàn)實(shí)世界的規(guī)律,獲取過去不可能獲取的知識(shí)。通過這兩個(gè)定義可以看出,不論是傳統(tǒng)的統(tǒng)計(jì)學(xué)方法還是新興的大數(shù)據(jù)分析方法,都是以數(shù)據(jù)為基礎(chǔ)來揭示事物特征以及發(fā)展趨勢的。

    (2)均采用量化分析方式。大數(shù)據(jù)分析的基礎(chǔ)是數(shù)據(jù)化,也就是一種把各種各樣現(xiàn)象轉(zhuǎn)變?yōu)榭芍票矸治龅牧炕问降倪^程。不論是傳統(tǒng)統(tǒng)計(jì)學(xué)中所應(yīng)用的數(shù)據(jù)(定性和定量數(shù)據(jù)),還是大數(shù)據(jù)時(shí)代即將被轉(zhuǎn)化和采用其他形式數(shù)據(jù)(如文字、圖像等),最終都是通過量化分析方法來揭示數(shù)據(jù)中所蘊(yùn)含的事物特征與發(fā)展趨勢。

    3大數(shù)據(jù)與統(tǒng)計(jì)學(xué)分析方法的區(qū)別

    (1)基礎(chǔ)數(shù)據(jù)不同。在大數(shù)據(jù)時(shí)代,我們可以獲得和分析更多的數(shù)據(jù),有時(shí)候甚至可以處理和某個(gè)特別現(xiàn)象相關(guān)的所有數(shù)據(jù),而不再依賴于隨機(jī)抽樣。這意味著,與傳統(tǒng)統(tǒng)計(jì)學(xué)數(shù)據(jù)相比,大數(shù)據(jù)不僅規(guī)模大,變化速度快,而且數(shù)據(jù)來源、類型、收集方法都有根本性變化。

    ①在數(shù)據(jù)來源方面,在大數(shù)據(jù)背景下,我們需要的紛繁多樣的數(shù)據(jù)可以分布于全球多個(gè)服務(wù)器上,因此我們可以獲得體量巨大的數(shù)據(jù),甚至是關(guān)于總體的所有數(shù)據(jù)。而統(tǒng)計(jì)學(xué)中的數(shù)據(jù)多是經(jīng)由抽樣調(diào)查而獲得的局部數(shù)據(jù),因此我們能夠掌握的事“小數(shù)據(jù)量”。這種情況下,因?yàn)樾枰治龅臄?shù)據(jù)很少,所以必須盡可能精確的量化我們的數(shù)據(jù)。綜上,大數(shù)據(jù)情況下,分析人員可以擁有大量數(shù)據(jù),因而不需要對(duì)一個(gè)現(xiàn)象刨根問底,只需要掌握事物大體的發(fā)展方向即可;然而傳統(tǒng)的小數(shù)據(jù)情況下則需要十分注意所獲得數(shù)據(jù)的精確度。

    ②在數(shù)據(jù)類型與收集方面,在既往模式下,數(shù)據(jù)的收集是耗時(shí)且耗力的,大數(shù)據(jù)時(shí)代所提出的“數(shù)據(jù)化”方式,將使得對(duì)所需數(shù)據(jù)的收集變得更加容易和高效。除了傳統(tǒng)的數(shù)字化數(shù)據(jù),就連圖像、方位、文本的字、詞、句、段落等等,世間萬物都可以成為大數(shù)據(jù)范疇下的數(shù)據(jù)。屆時(shí),一切自然或者社會(huì)現(xiàn)象的事件都可以被轉(zhuǎn)化為數(shù)據(jù),我們會(huì)意識(shí)到本質(zhì)上整個(gè)世界都是由信息構(gòu)成的。

    (2)分析范式不同。在小數(shù)據(jù)時(shí)代,我們往往是假想世界是如何運(yùn)行的,然后通過收集和分析數(shù)據(jù)來驗(yàn)證這種假想。也就是說,傳統(tǒng)統(tǒng)計(jì)實(shí)證分析的基本范式為:(基于文獻(xiàn))提出理論假設(shè)-收集相關(guān)數(shù)據(jù)并進(jìn)行統(tǒng)計(jì)分析-驗(yàn)證理論假設(shè)的真?zhèn)?。然而,在不久的將來,我們將?huì)在大數(shù)據(jù)背景下探索世界,不再受限制于傳統(tǒng)的思維模式和特定領(lǐng)域里隱含的固有偏見,我們對(duì)事物的研究始于數(shù)據(jù),并可以發(fā)現(xiàn)以前不曾發(fā)現(xiàn)的聯(lián)系。換言之,大數(shù)據(jù)背景下,探索事物規(guī)律的范式可以概括為:數(shù)據(jù)觀察與收集——數(shù)據(jù)分析——描述事物特征/關(guān)系。

    (3)數(shù)據(jù)分析方法不同。傳統(tǒng)統(tǒng)計(jì)學(xué)主要是基于樣本的“推斷分析”,而大數(shù)據(jù)情境下則是基于總體數(shù)據(jù)的“實(shí)際分析”,即直接得出總體特征,并可以分析出這些特征出現(xiàn)的概率。

    (4)分析視角不同。傳統(tǒng)的實(shí)證統(tǒng)計(jì)意在弄清事物之間的內(nèi)在聯(lián)系和作用機(jī)制,但大數(shù)據(jù)思維模式認(rèn)為因果關(guān)系是沒有辦法驗(yàn)證的,因此需要關(guān)注的是事物之間的相關(guān)關(guān)系。大數(shù)據(jù)并沒有改變因果關(guān)系,但使因果關(guān)系變得意義不大,因而大數(shù)據(jù)的思維是告訴我們“是什么”而不是“為什么”。換言之,大數(shù)據(jù)思維認(rèn)為相關(guān)關(guān)系盡管不能準(zhǔn)確地告知我們某事件為何會(huì)發(fā)生,但是它會(huì)提醒我們這件事情正在發(fā)生,因此相關(guān)關(guān)系的發(fā)現(xiàn)就可以產(chǎn)生經(jīng)濟(jì)和社會(huì)價(jià)值了。

    4結(jié)語

    綜上,相對(duì)于傳統(tǒng)而言,大數(shù)據(jù)思維主要包括三個(gè)重大轉(zhuǎn)變。首先,要分析與某事物相關(guān)的所有數(shù)據(jù),而不是依靠分析捎來能夠的數(shù)據(jù)樣本;其次,研究人員應(yīng)樂于接受數(shù)據(jù)的紛繁復(fù)雜,而不再追求精確性;最后,認(rèn)知世界的思想發(fā)生了轉(zhuǎn)變,不再探求難以捉摸的因果關(guān)系,轉(zhuǎn)而關(guān)注事物的相關(guān)關(guān)系。以上三個(gè)轉(zhuǎn)變構(gòu)成了大數(shù)據(jù)思維的核心。在統(tǒng)計(jì)學(xué)的進(jìn)一步應(yīng)用和發(fā)展完善過程中,需要結(jié)合以上轉(zhuǎn)變所產(chǎn)生的挑戰(zhàn),思考有效的統(tǒng)計(jì)學(xué)發(fā)展對(duì)策。

    參考文獻(xiàn)

    [1]孟小峰,慈祥.大數(shù)據(jù)管理:概念,技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013,50(1):146169.

    [2]俞立平.大數(shù)據(jù)與大數(shù)據(jù)經(jīng)濟(jì)學(xué)[J].中國軟科學(xué),2013,(7):177183.

    [3]維克托·邁爾·舍恩伯格,肯尼斯·庫克耶.大數(shù)據(jù)時(shí)代—生活、工作與思維的大變革[M].盛楊燕,周濤譯.杭州:浙江人民出版社,2012.endprint

    猜你喜歡
    分析方法事物傳統(tǒng)
    基于EMD的MEMS陀螺儀隨機(jī)漂移分析方法
    飯后“老傳統(tǒng)”該改了
    中老年保健(2021年3期)2021-08-22 06:52:22
    美好的事物
    文苑(2020年8期)2020-11-22 08:18:12
    一種角接觸球軸承靜特性分析方法
    同樣的新年,不同的傳統(tǒng)
    中國設(shè)立PSSA的可行性及其分析方法
    中國航海(2019年2期)2019-07-24 08:26:40
    老傳統(tǒng)當(dāng)傳承
    口耳相傳的直苴賽裝傳統(tǒng)
    中國三峽(2017年9期)2017-12-19 13:27:25
    奇妙事物用心看
    快樂語文(2017年12期)2017-05-09 22:07:40
    TINY TIMES 3: A REAL HIT
    烟台市| 招远市| 新泰市| 蕲春县| 张北县| 巢湖市| 岑溪市| 历史| 佛山市| 都兰县| 博乐市| 昌都县| 房产| 宣武区| 灌南县| 福海县| 辽宁省| 河北省| 溧水县| 潜山县| 塔城市| 马边| 鹤山市| 宁安市| 信阳市| 上虞市| 宜川县| 斗六市| 辽中县| 彭阳县| 北京市| 阳东县| 铁岭市| 监利县| 正安县| 永顺县| 沂南县| 抚州市| 宁城县| 厦门市| 莱西市|