大數(shù)據(jù)是什么?其實(shí)很簡單,大數(shù)據(jù)其實(shí)就是海量資料巨量資料,這些巨量資料來源于世界各地隨時(shí)產(chǎn)生的數(shù)據(jù),在大數(shù)據(jù)時(shí)代,任何微小的數(shù)據(jù)都可能產(chǎn)生不可思議的價(jià)值。大數(shù)據(jù)有4個(gè)特點(diǎn),分別為:大量(Volume)、多樣(Variety)、高速(Velocity)、價(jià)值(Value),一般我們稱之為4V。
1.大量。大數(shù)據(jù)的特征首先就體現(xiàn)為“大”,從先Map3時(shí)代,一個(gè)小小的MB級(jí)別的Map3就可以滿足很多人的需求,然而隨著時(shí)間的推移,存儲(chǔ)單位從過去的GB到TB,乃至現(xiàn)在的PB、EB級(jí)別。隨著信息技術(shù)的高速發(fā)展,數(shù)據(jù)開始爆發(fā)性增長。社交網(wǎng)絡(luò)(微博、推特、臉書)、移動(dòng)網(wǎng)絡(luò)、各種智能工具,服務(wù)工具等,都成為數(shù)據(jù)的來源。
2.多樣。廣泛的數(shù)據(jù)來源,決定了大數(shù)據(jù)形式的多樣性。任何形式的數(shù)據(jù)都可以產(chǎn)生作用,目前應(yīng)用最廣泛的就是推薦系統(tǒng),如淘寶,網(wǎng)易云音樂、今日頭條等,這些平臺(tái)都會(huì)通過對(duì)用戶的日志數(shù)據(jù)進(jìn)行分析,從而進(jìn)一步推薦用戶喜歡的東西。
3.高速。大數(shù)據(jù)的產(chǎn)生非常迅速,主要通過互聯(lián)網(wǎng)傳輸。大數(shù)據(jù)對(duì)處理速度有非常嚴(yán)格的要求,服務(wù)器中大量的資源都用于處理和計(jì)算數(shù)據(jù),很多平臺(tái)都需要做到實(shí)時(shí)分析。數(shù)據(jù)無時(shí)無刻不在產(chǎn)生,誰的速度更快,誰就有優(yōu)勢。
4.價(jià)值。這也是大數(shù)據(jù)的核心特征。大數(shù)據(jù)最大的價(jià)值在于通過從大量不相關(guān)的各種類型的數(shù)據(jù)中,挖掘出對(duì)未來趨勢與模式預(yù)測分析有價(jià)值的數(shù)據(jù),并通過機(jī)器學(xué)習(xí)方法、人工智能方法或數(shù)據(jù)挖掘方法深度分析,發(fā)現(xiàn)新規(guī)律和新知識(shí),并運(yùn)用于農(nóng)業(yè)、金融、醫(yī)療等各個(gè)領(lǐng)域。