如果你某天正好跟大數(shù)據(jù)學(xué)領(lǐng)域的數(shù)據(jù)分析師們交談,你問他們:大數(shù)據(jù)可以用來干什么?可能你問10個(gè)分析師就會得到十種不同的答案。分析師所服務(wù)的行業(yè)不一樣或是解釋的角度不同,都可能導(dǎo)致不同答案的出現(xiàn)。不過,這些答案并非雜亂無章沒有規(guī)律,這里就給大家總結(jié)一下吧。
描述型:發(fā)生了什么?
這種數(shù)據(jù)類型是最為常見的一種,每位數(shù)據(jù)分析師在使用大數(shù)據(jù)時(shí)都得通過這一類型的數(shù)據(jù)來了解企業(yè)機(jī)構(gòu)的情況,進(jìn)而衡量出初步的概況,以提供更精細(xì)的服務(wù)做好準(zhǔn)備。
比如,一家商場每月的利潤和損失賬單,分析師從這一類的賬單中可以分析出大部分客戶的基本數(shù)據(jù),對客戶進(jìn)行初步的評判衡量:45%的超市客戶是自雇型;80%的游戲玩家不愿意在游戲裝備上直接付費(fèi);65%的VR體驗(yàn)客戶年齡低于14……
值得注意的是,通常這類描述型的數(shù)據(jù)會被分析師們利用一些可視化的工具進(jìn)行更加形象生動的描述,一來可增強(qiáng)分析師們對數(shù)據(jù)特性的敏感,二來也能更形象的將數(shù)據(jù)展示給其他人。
診斷型:為什么會發(fā)生?
在通過描述型的數(shù)據(jù)了解了大致狀況后,想要解決問題就得搞清楚為什么會有這些問題,大數(shù)據(jù)里同樣藏著這個(gè)秘密。通過評估描述型數(shù)據(jù),診斷分析工具使得分析師們能夠深入分析問題的核心原因。
這樣的數(shù)據(jù)類型一般更多維,一種類型是按照時(shí)間序列整合數(shù)據(jù),在多個(gè)聯(lián)系時(shí)間點(diǎn)上同時(shí)導(dǎo)入數(shù)據(jù)進(jìn)行分析。比如企業(yè)通過客戶在不同時(shí)間里對網(wǎng)購物品的需求傾向。一家招聘網(wǎng)站發(fā)現(xiàn)在半年里發(fā)布過的某一職位有下降趨勢,如果要求一個(gè)比較完整的診斷結(jié)果,需要的大數(shù)據(jù)就應(yīng)該包括市場競爭對手近期行為、用戶使用習(xí)慣的變化、招聘需求隨時(shí)間的變化等等。這樣多維度的研究大數(shù)據(jù)所得出來的“原因”才更加準(zhǔn)確。
預(yù)測型:可能發(fā)生什么?
在消費(fèi)品市場里有這樣一個(gè)被業(yè)界默認(rèn)的規(guī)律,品牌的持續(xù)發(fā)展需要產(chǎn)品不斷迭代來支撐,否則容易走向衰敗。哇哈哈、可口可樂公司就是最好的正面例子。當(dāng)然這是因?yàn)楫a(chǎn)業(yè)的長期發(fā)展,業(yè)界人士才能總結(jié)出來這樣具有預(yù)測性參考價(jià)值的規(guī)律,但對于那些新興產(chǎn)業(yè)未來會發(fā)生什么呢?換做以前可能需要大量的實(shí)踐經(jīng)驗(yàn),但有了大數(shù)據(jù)以后就不同了。我們可以通過大數(shù)據(jù)去分析未來會發(fā)生什么!
想要預(yù)知某事件在將來發(fā)生的可能性,預(yù)測一個(gè)可量化的值,或者是估計(jì)事情可能發(fā)生的某個(gè)時(shí)間點(diǎn),這些都可以通過預(yù)測模型完成。預(yù)測模型通常運(yùn)用各種可變數(shù)據(jù)來作出預(yù)測。數(shù)據(jù)成員的多樣化與可能預(yù)測的目標(biāo)是相關(guān)聯(lián)的(如,人的年齡越大,越可能發(fā)生心臟病,我們可以說年齡與心臟病風(fēng)險(xiǎn)是線性相關(guān)的)。隨后,這些數(shù)據(jù)被放在一起,產(chǎn)生分?jǐn)?shù)或預(yù)測。
在一個(gè)充滿不確定性因素的世界里,能夠預(yù)測允許人們作出更好的決定。預(yù)測模型在很多領(lǐng)域都被用到。比如說從QQ預(yù)測演化出微信,從《英雄聯(lián)盟》預(yù)測演化出《王者榮耀》,從線上打車工具的流行到共享單車的走紅,這些都是可以通過大數(shù)據(jù)來預(yù)測的。
指導(dǎo)型:我需要做什么?
從價(jià)值和復(fù)雜度的角度而言,指導(dǎo)性模型是最直接作用于企業(yè)的數(shù)據(jù)模型。指導(dǎo)性模型基于發(fā)生了什么、為什么會發(fā)生以及一系列“可能發(fā)生什么”的分析,幫助用戶確定要采取的最好的措施。很顯然,指導(dǎo)性分析不是一個(gè)單獨(dú)的行為,實(shí)際上它是其他很多行為的主導(dǎo)。
交通應(yīng)用是一個(gè)很好的例子,當(dāng)你下班準(zhǔn)備回家的時(shí)候,一些定位導(dǎo)航軟件就會根據(jù)種種因素,包括了實(shí)時(shí)的交通狀況,天氣等各種因素,為你找到最優(yōu)的回家路線,這就是指導(dǎo)型大數(shù)據(jù)的直接應(yīng)用。(編輯/有慶)