• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      大數(shù)據(jù)應(yīng)用實踐給我們的啟示(上)

      2015-12-15 12:10:23張放
      鐘表 2015年2期
      關(guān)鍵詞:數(shù)據(jù)量數(shù)據(jù)挖掘分布式

      卷首語

      大數(shù)據(jù)應(yīng)用實踐給我們的啟示(上)

      “大數(shù)據(jù)”成為互聯(lián)網(wǎng)信息技術(shù)行業(yè)的流行詞匯大約始于2009年。大數(shù)據(jù)可分成大數(shù)據(jù)技術(shù)、大數(shù)據(jù)工程、大數(shù)據(jù)科學(xué)和大數(shù)據(jù)應(yīng)用等領(lǐng)域。目前人們談?wù)撟疃嗟氖谴髷?shù)據(jù)技術(shù)和大數(shù)據(jù)應(yīng)用。三年多前,從一個在英國的親戚那里聽說他正在用大數(shù)據(jù)技術(shù)從事智能交通、智慧城市方面的應(yīng)用研究,才第一次感受到大數(shù)據(jù)被廣泛應(yīng)用時代的來臨。

      大數(shù)據(jù)(Big data),或稱巨量資料,是個比較抽象的概念。隨著科學(xué)技術(shù)及互聯(lián)網(wǎng)的發(fā)展,推動著大數(shù)據(jù)時代的來臨,各行各業(yè)每天都在產(chǎn)生數(shù)量巨大的數(shù)據(jù)碎片,數(shù)據(jù)計量單位已從Byte(簡稱“B”,1Byte = 8 bit)、KB(千103)、MB(兆106B)、GB(吉109B)、TB(太1012B)發(fā)展到PB(拍1015B)、EB(艾1018B)、ZB(澤1021B)、YB(堯1024B )甚至BB(1027B)、NB(1030B)、DB(1033B)來衡量?!按髷?shù)據(jù)”的起始計量單位至少應(yīng)是P(100萬個G)、E(10億個G)或Z(1萬億個G)。國際數(shù)據(jù)公司(IDC)的研究結(jié)果表明,2008年全球產(chǎn)生的數(shù)據(jù)量為0.49ZB,2009年的數(shù)據(jù)量為0.8ZB,2010年增長為1.2ZB,2011年的數(shù)量更是高達(dá)1.82ZB,相當(dāng)于全球每人產(chǎn)生200GB以上的數(shù)據(jù)。而到2012年為止,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB,全人類歷史上說過的所有話的數(shù)據(jù)量大約是5EB。IBM的研究稱,整個人類文明所獲得的全部數(shù)據(jù)中,有90%是過去兩年內(nèi)產(chǎn)生的。而到了2020年,全世界所產(chǎn)生的數(shù)據(jù)規(guī)模將達(dá)到今天的44倍。科技的進(jìn)步已經(jīng)使創(chuàng)造、捕捉和管理信息的成本降至2005年的六分之一,而從2005年起,用在硬件、軟件、人才及服務(wù)上的商業(yè)投資也增長了整整50%,達(dá)到了4000億美元。事實上,當(dāng)你仍然在把微博等社交平臺當(dāng)作抒情或者發(fā)議論的工具時,華爾街的斂財高手們卻正在挖掘這些互聯(lián)網(wǎng)的“數(shù)據(jù)財富”,先人一步用其預(yù)判市場走勢,而且取得了不俗的收益。這么大的數(shù)據(jù)量是無法用人腦來推算、估測,或者用單臺的計算機(jī)進(jìn)行處理,必須采用分布式計算架構(gòu),依托云計算的分布式處理、分布式數(shù)據(jù)庫、云存儲和虛擬化技術(shù),因此,大數(shù)據(jù)的挖掘和處理必須用到云技術(shù)。

      大數(shù)據(jù)的特點通常可用4V來表示:Volume(大量)、Velocity(高速)、Variety(多樣)、Veracity(真實性)。

      從“大數(shù)據(jù)”的特征看,它首先必須永遠(yuǎn)是在線的,而且在線的還得是熱備份的,不是冷備份的,不是放在磁帶里的,是隨時能調(diào)用的;其次,“大數(shù)據(jù)”必須實時反應(yīng)。我們上淘寶輸入一個商品,后臺必須在10億件商品當(dāng)中,瞬間進(jìn)行呈現(xiàn)。如果要等一個小時才呈現(xiàn)話,我相信沒有人再上淘寶。十億件商品、幾百萬個賣家、一億的消費者,瞬間完成匹配呈現(xiàn),這才叫大數(shù)據(jù);最后,大數(shù)據(jù)還有一個最大的特征,它不再是樣本思維,它是一個全體思維。以前一提到數(shù)據(jù),人們第一個反應(yīng)是樣本、抽樣,但是大數(shù)據(jù)不再抽樣,不再調(diào)用部分,我們要的是所有可能的數(shù)據(jù),它是一個全貌。其實叫“全數(shù)據(jù)”比叫“大數(shù)據(jù)”更準(zhǔn)確。

      大數(shù)據(jù)最核心的價值就是在于對海量數(shù)據(jù)進(jìn)行存儲和分析。相比起現(xiàn)有的其他技術(shù)而言,大數(shù)據(jù)的“廉價、迅速、優(yōu)化”這三方面的綜合成本是最優(yōu)的。所以大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進(jìn)行專業(yè)化處理。換言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實現(xiàn)盈利的關(guān)鍵,在于提高對數(shù)據(jù)的“加工能力”,通過“加工”實現(xiàn)數(shù)據(jù)的“增值”。

      大數(shù)據(jù)未來的方向不在于數(shù)據(jù)挖掘技術(shù)本身,而在于數(shù)據(jù)應(yīng)用的商業(yè)化,從數(shù)據(jù)背后挖掘盈利模式、嫁接整合數(shù)據(jù)和商業(yè)資源成為關(guān)鍵。對于企業(yè)而言,如何趕在競爭對手之前掌握和正確運用大數(shù)據(jù)是一項挑戰(zhàn)。所以“大數(shù)據(jù)”是需要特殊的技術(shù)來支持的,包括大規(guī)模并行處理(MPP)數(shù)據(jù)庫、數(shù)據(jù)挖掘電網(wǎng)、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫、云計算平臺、互聯(lián)網(wǎng)和可擴(kuò)展的存儲系統(tǒng)等。

      猜你喜歡
      數(shù)據(jù)量數(shù)據(jù)挖掘分布式
      基于大數(shù)據(jù)量的初至層析成像算法優(yōu)化
      計算Lyapunov指數(shù)的模糊C均值聚類小數(shù)據(jù)量法
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      高刷新率不容易顯示器需求與接口標(biāo)準(zhǔn)帶寬
      寬帶信號采集與大數(shù)據(jù)量傳輸系統(tǒng)設(shè)計與研究
      電子制作(2019年13期)2020-01-14 03:15:18
      分布式光伏熱錢洶涌
      能源(2017年10期)2017-12-20 05:54:07
      分布式光伏:爆發(fā)還是徘徊
      能源(2017年5期)2017-07-06 09:25:54
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      基于DDS的分布式三維協(xié)同仿真研究
      海盐县| 农安县| 赣州市| 龙里县| 信丰县| 浙江省| 双桥区| 贞丰县| 宁河县| 宝鸡市| 宁乡县| 忻州市| 雷波县| 乌兰县| 聊城市| 南川市| 灌云县| 泸定县| 金坛市| 乌海市| 揭阳市| 盈江县| 太仆寺旗| 通渭县| 北海市| 庄浪县| 栖霞市| 藁城市| 高淳县| 临颍县| 淮北市| 长子县| 紫阳县| 璧山县| 稷山县| 平陆县| 出国| 晋中市| 怀仁县| 龙州县| 民和|