• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      大數(shù)據(jù)發(fā)展到了什么階段

      2019-09-10 02:20:30李榮
      計算機(jī)與網(wǎng)絡(luò) 2019年10期
      關(guān)鍵詞:基礎(chǔ)設(shè)施企業(yè)

      李榮

      大數(shù)據(jù)時代,大數(shù)據(jù)分析與應(yīng)用大肆盛行。越來越多的大公司大企業(yè)大集團(tuán),都越來越重視大數(shù)據(jù)的影響和作用。可以說,誰搶得大數(shù)據(jù)的一手可靠資料,誰就能在未來的業(yè)務(wù)發(fā)展和拓寬中占據(jù)優(yōu)勢,就能在相關(guān)領(lǐng)域首先拔得頭籌。但是,大數(shù)據(jù)發(fā)展前景現(xiàn)在到底如何,大數(shù)據(jù)的可靠性由誰說了算,大數(shù)據(jù)的真實性有誰可以保證,甚至還可以再倒退一點點來問問,如今的大數(shù)據(jù)究竟發(fā)展到了什么階段?

      很少人能夠清楚地知道這一點吧!畢竟在大數(shù)據(jù)分析與應(yīng)用火爆的年代,一般人都只是了解大數(shù)據(jù)的皮毛和表面,而對于大數(shù)據(jù)發(fā)展前景、大數(shù)據(jù)背后的來源及處理分析等精密的工作程序肯定不了解,也不會感興趣。而且對于一般人,也不可能會去真正弄明白大數(shù)據(jù)分析與應(yīng)用背后蘊(yùn)藏的種種可靠性、客觀性、真實性的來源支撐與科學(xué)手段處理。

      在日新月異且喜新厭舊的技術(shù)初創(chuàng)企業(yè)界,已有3年歷史的“大數(shù)據(jù)”聽起來似乎已經(jīng)有點過氣。雖然Hadoop在2006年已經(jīng)出來,但“大數(shù)據(jù)”這個概念大概是在2012 - 2015年左右才真正火起來的。也就是在這段時間里,至少是在媒體或者專家眼里,“大數(shù)據(jù)”才開始慢慢成為了新的“金子”或者“石油”。然而,在跟業(yè)界人士交談中,大家越來越感覺到這項技術(shù)已經(jīng)在某種程度上陷入了停滯或迷惑期。2017年可能是數(shù)據(jù)領(lǐng)域的那些一些人轉(zhuǎn)移興趣,開始沉迷于AI以及機(jī)器智能、深度學(xué)習(xí)等許多相關(guān)概念的年份。

      拋開不可避免的炒作周期曲線態(tài)勢不管,我們的“大數(shù)據(jù)版圖”已經(jīng)進(jìn)入第4個年頭了,趁這個時候退一步來反思一下去年發(fā)生了什么,思考一下這個行業(yè)的未來會怎樣是很有意義的,看看如今的大數(shù)據(jù)到底發(fā)展到了什么階段。那么2019年大數(shù)據(jù)到底還有多大的發(fā)展和進(jìn)步空間呢?我們不妨探討一下。

      企業(yè)技術(shù)=艱苦工作

      大數(shù)據(jù)有趣的一點在于,它不再像當(dāng)初經(jīng)歷過那樣有可能成為炒作的題材了。

      經(jīng)過炒作周期后仍能引起廣泛興趣的產(chǎn)品和服務(wù)往往是那些大家能夠接觸、可以感知的,或者與大眾相關(guān)聯(lián)的:比如移動應(yīng)用、社交網(wǎng)絡(luò)、可穿戴和虛擬現(xiàn)實等。

      但大數(shù)據(jù)基本上就是管道設(shè)施的一種。當(dāng)然,大數(shù)據(jù)為許多消費者或商業(yè)用戶體驗提供了動力,但它的核心是企業(yè)技術(shù)、數(shù)據(jù)庫和分析等,這些東西都是在后端運(yùn)行的,沒幾個人能看得見。就像工作在這一領(lǐng)域的人都知道,用一個晚上的時間就想適應(yīng)企業(yè)端的新技術(shù)是不可能的。

      大數(shù)據(jù)現(xiàn)象在早期主要是受到了與一批骨干互聯(lián)網(wǎng)公司(尤其是Google,F(xiàn)acebook,Twitter等)的共生關(guān)系的推動,這些公司既是核心大數(shù)據(jù)技術(shù)的重度用戶,同時也是這些技術(shù)的創(chuàng)造者。這些公司突然間面對著規(guī)模前所未有的龐大數(shù)據(jù)時,由于本身缺乏傳統(tǒng)的(昂貴的)基礎(chǔ)設(shè)施,也沒有辦法招募到一些最好的工程師,所以只好自己動手來開發(fā)所需的技術(shù),后來隨著開源運(yùn)動的迅速發(fā)展,一大批此類新技術(shù)開始共享到更廣的范圍。然后,一些互聯(lián)網(wǎng)大公司的工程師離職去創(chuàng)辦自己的大數(shù)據(jù)初創(chuàng)企業(yè)。其他的一些“數(shù)字原生”公司,包括嶄露頭角的獨角獸公司,也開始面臨著互聯(lián)網(wǎng)大公司的類似需求,由于它們自身也沒有傳統(tǒng)的基礎(chǔ)設(shè)施,所以自然就成為了那些大數(shù)據(jù)技術(shù)的早期采用者。而早期的成功又導(dǎo)致了更多的創(chuàng)業(yè)活動發(fā)生,并獲得了更多的VC資助,從而帶動了大數(shù)據(jù)的起勢。

      快速發(fā)展了幾年之后,現(xiàn)在我們面臨的是更加廣闊但也更加棘手的機(jī)遇:讓中等規(guī)模到跨國公司級別的更大一批企業(yè)采用大數(shù)據(jù)技術(shù)。這些公司跟“數(shù)字原生”公司不一樣的是,他們沒有從零開始的有利條件,而且他們失去的會更多:這些公司絕大部分的現(xiàn)有技術(shù)基礎(chǔ)設(shè)施都是成功的。當(dāng)然那些基礎(chǔ)設(shè)施未必是功能完備的,組織內(nèi)部許多人也意識到對自己的遺留基礎(chǔ)設(shè)施進(jìn)行現(xiàn)代化改良應(yīng)該是早點好過晚點,但他們不會一夜間就把自己的關(guān)鍵業(yè)務(wù)取代掉。任何革命都需要過程、預(yù)算、項目管理、試點、局部部署以及完備的安全審計等。大企業(yè)對由年輕的初創(chuàng)企業(yè)來處理自己基礎(chǔ)設(shè)施的關(guān)鍵部分的謹(jǐn)慎是可以理解的。還有,令創(chuàng)業(yè)者感到絕望的是,許多(還是大多數(shù)?)企業(yè)仍頑固地拒絕把數(shù)據(jù)遷移到云端(至少不愿遷移到公有云)。

      還需要理解的另一個關(guān)鍵是:大數(shù)據(jù)的成功不在于實現(xiàn)技術(shù)的某一方面(像Hadoop什么的),而是需要把一連串的技術(shù)、人和流程糅合到一起。你得捕捉數(shù)據(jù)、存儲數(shù)據(jù)、清洗數(shù)據(jù)、查詢數(shù)據(jù)、分析數(shù)據(jù)并對數(shù)據(jù)進(jìn)行可視化。這些工作一部分可以由產(chǎn)品來完成,而有的則需要人來做,一切都需要無縫集成起來。最后,要想讓所有這一切發(fā)揮作用,整個公司從上到下都需要樹立數(shù)據(jù)驅(qū)動的文化,這樣大數(shù)據(jù)才不僅僅是個“東西”,而且還是那關(guān)鍵的“東西”。

      部署階段

      所以,這就是在經(jīng)過幾年引人矚目的初創(chuàng)企業(yè)如雨后春筍冒頭,VC投資頻登頭條后,我們開始步入大數(shù)據(jù)的部署期和早期成熟期的原因。

      更有前瞻性的大公司(姑且稱之為傳統(tǒng)技術(shù)采用周期的“早期采用者”)在2011-2013年間就開始實驗大數(shù)據(jù)技術(shù),推出了若干的Hadoop試點計劃(往往是因為趕時髦)或者嘗試一些點方案。他們招募了各種各樣此前并不存在的崗位(如“數(shù)據(jù)科學(xué)家”或“首席數(shù)據(jù)官”);他們進(jìn)行了各種努力,包括把全部數(shù)據(jù)都堆到一個數(shù)據(jù)容器(“data lake”),然后希望緊跟著就會發(fā)生奇跡(往往不會);他們逐步擴(kuò)大自己的內(nèi)部能力,試驗了各種供應(yīng)商,從試點計劃到生產(chǎn)中的局部部署,然后到現(xiàn)在爭論要不要全企業(yè)鋪開(全范圍鋪開實施的情況還很罕見)。許多情況下,他們正處在這樣一個重要的拐點上,即經(jīng)過大數(shù)據(jù)基礎(chǔ)設(shè)施的數(shù)年建設(shè)后,能夠展示的成果還不多,至少在公司內(nèi)部的商業(yè)用戶看來是這樣的,但是大量吃力不討好的工作已經(jīng)做完了,現(xiàn)在開始進(jìn)入到有影響力的應(yīng)用部署階段了。只是從目前來看,這種建構(gòu)在核心架構(gòu)之上的應(yīng)用數(shù)量還不成比例。

      接下來的一波大公司(稱之為傳統(tǒng)技術(shù)采用周期的“早期多數(shù)使用者”)大多數(shù)時候?qū)Υ髷?shù)據(jù)技術(shù)是持觀望態(tài)度的,對于整個大數(shù)據(jù)方面的東西,他們還在心存一定程度的困惑中觀望。直到最近,他們還在指望某個大型供應(yīng)商(比如IBM)會提供一個一站式的解決方案,不過現(xiàn)在看來這種情況近期內(nèi)并不會出現(xiàn)。他們看待這個大數(shù)據(jù)版圖的態(tài)度是心懷恐懼,在想自己是不是真的需要跟這一堆看起來并沒有什么不同的初創(chuàng)企業(yè)合作,然后修補(bǔ)出各種解決方案。

      生態(tài)體系正在成熟

      與此同時,在初創(chuàng)企業(yè)、供應(yīng)商這一塊,整個第一波的大數(shù)據(jù)公司(2009 - 2013年間成立的那批)現(xiàn)在已經(jīng)融了數(shù)輪的資金,企業(yè)規(guī)模已經(jīng)得到了擴(kuò)大,并且從早期部署的成功或失敗中學(xué)到了東西,現(xiàn)在他們已經(jīng)能夠提供更成熟的、經(jīng)受過考驗的產(chǎn)品了。少數(shù)一些已經(jīng)成為了上市公司(包括2015年上市的HortonWorks和New Relic),而有的(比如Cloudera,MongoDB等)融資已經(jīng)達(dá)上億美元了。

      這個領(lǐng)域的VC融資活動仍然很有生氣,2016年的前幾周我們見證好幾輪相當(dāng)可觀的后期階段大數(shù)據(jù)融資事件:Data Dog(9400萬美元)、BloomReach(5600萬美元)、Qubole(3000萬美元)和PlaceIQ(2 500萬美元)等。2015年大數(shù)據(jù)初創(chuàng)企業(yè)拿到的融資額達(dá)到了66.4億美元,占整個技術(shù)VC總?cè)谫Y額11%。

      隨著該領(lǐng)域的創(chuàng)業(yè)活動持續(xù)進(jìn)行以及資金的不斷流入,加上適度的少量退出,以及越來越活躍的技術(shù)巨頭(尤其是Amazon,Google,IBM),使得這個領(lǐng)域的公司日益增多。

      在基本趨勢方面,行動開始慢慢從左轉(zhuǎn)到右(即創(chuàng)新、推出新產(chǎn)品和新公司),從基礎(chǔ)設(shè)施層(開發(fā)者、工程師)轉(zhuǎn)移到分析層(數(shù)據(jù)科學(xué)家和分析師)乃至應(yīng)用層(商業(yè)用戶和消費者),“大數(shù)據(jù)原生應(yīng)用”已經(jīng)在迅速冒頭———這多少符合了我們原先的一些預(yù)期。

      1.大數(shù)據(jù)基礎(chǔ)設(shè)施:仍有大量創(chuàng)新

      Google關(guān)于MapReduce和BigTable的論文(Cutting和MikeCafarella因為這個而做出了Hadoop)的誕生問世已有10年了,在這段時間里,大數(shù)據(jù)的基礎(chǔ)設(shè)施層已經(jīng)逐漸成熟,一些關(guān)鍵問題也得到了解決。

      但是,基礎(chǔ)設(shè)施領(lǐng)域的創(chuàng)新仍然富有活力,這很大程度上是得益于可觀的開源活動規(guī)模。

      2016年無疑是Apache Spark之年。自我們發(fā)布上一版大數(shù)據(jù)版圖以來,這個利用了內(nèi)存處理的開源框架就引發(fā)眾多討論。自那以后,Spark受到了從IBM到Cloudera的各式玩家的擁護(hù),讓它獲得了可觀的信任度。Spark的出現(xiàn)是很有意義的,因為它解決了一些導(dǎo)致Hadoop采用放緩的關(guān)鍵問題:Spark速度變快了很多(基準(zhǔn)測試表明Spark比Hadoop的MapReduce快10 ~ 100倍),更容易編程,并且跟機(jī)器學(xué)習(xí)能夠很好地搭配。

      除了Spark以外,還出現(xiàn)了其他的一些令人興奮的框架,比如Flink,Ignite,Samza,Kudu等,這些框架的發(fā)展勢頭也很好。一些思想領(lǐng)袖認(rèn)為,Mesos(數(shù)據(jù)中心資源管理系統(tǒng),把數(shù)據(jù)中心當(dāng)作一臺大計算資源池進(jìn)行編程)的出現(xiàn)也刺激了對Hadoop的需求。

      即便在數(shù)據(jù)庫的世界里,新興的玩家似乎也越來越多,多到市場已經(jīng)難以承受的地步,這里發(fā)生了很多令人興奮的事情,從圖形數(shù)據(jù)庫(如Neo4j)的成熟,到專門數(shù)據(jù)庫的推出(如統(tǒng)計時序數(shù)據(jù)庫InfluxDB),乃至于CockroachDB的出現(xiàn)(受Google Spanner靈感啟發(fā)誕生的融合了SQL與NoSQL長處的新型數(shù)據(jù)庫),數(shù)據(jù)倉庫也在演變(如云數(shù)據(jù)倉庫Snowflake)。

      2.大數(shù)據(jù)分析:現(xiàn)在跟AI結(jié)合了

      大數(shù)據(jù)分析過去幾個月出現(xiàn)的一股趨勢是,越來越關(guān)注利用人工智能(形式和風(fēng)格各異)來幫助分析大規(guī)模的數(shù)據(jù),從而獲得預(yù)測性的洞察。

      其實最近出現(xiàn)復(fù)興的AI很大程度上算是大數(shù)據(jù)的產(chǎn)物。深度學(xué)習(xí)(最近受到關(guān)注最多的AI領(lǐng)域)背后的算法基本上是幾十年前就誕生了的,但直到最近能夠以足夠便宜、足夠快速地應(yīng)用到大規(guī)模數(shù)據(jù)之后才發(fā)揮出了它的最大潛能。AI與大數(shù)據(jù)之間的關(guān)系如此緊密,以至于業(yè)界專家現(xiàn)在認(rèn)為AI已經(jīng)令人懊惱地“與大數(shù)據(jù)陷入了熱戀當(dāng)中”。

      不過反過來,AI現(xiàn)在也在幫助大數(shù)據(jù)實現(xiàn)后者的承諾。分析對AI、機(jī)器學(xué)習(xí)越來越多的關(guān)注也符合大數(shù)據(jù)下一步演進(jìn)的趨勢:現(xiàn)在數(shù)據(jù)我都有了,但究竟從中能得到什么樣的洞察呢?當(dāng)然,這件事情可以讓數(shù)據(jù)科學(xué)家來解決,從一開始他們的角色就是實現(xiàn)機(jī)器學(xué)習(xí),否則的話就得想出模型來發(fā)現(xiàn)數(shù)據(jù)的意義。但是機(jī)器智能現(xiàn)在正在逐漸發(fā)揮輔助數(shù)據(jù)科學(xué)家的作用———只需要倒騰數(shù)據(jù),新興的產(chǎn)品就能從中提煉出數(shù)學(xué)公式(如Context Relevant)或者自動建立和推薦最有可能返回最佳結(jié)果的數(shù)據(jù)科學(xué)模型(如DataRobot)。一批新的AI公司提供的產(chǎn)品能夠自動識別像圖像這樣的復(fù)雜實體(如Clarifai,Dextro)或者提供強(qiáng)大的預(yù)測性分析(如HyperScience)。

      同時,隨著基于無監(jiān)督學(xué)習(xí)的產(chǎn)品的傳播和改善,看看它們與數(shù)據(jù)科學(xué)家之間的關(guān)系如何演變將非常有趣———將來這二者是敵還是友呢?AI當(dāng)然不會很快取代數(shù)據(jù)科學(xué)家的位置,但預(yù)計會看到數(shù)據(jù)科學(xué)家通常執(zhí)行的更簡單一點的工作越來越多的自動化,從而可以極大提高生產(chǎn)力。

      但不管怎樣,AI、機(jī)器學(xué)習(xí)絕不是大數(shù)據(jù)分析唯一值得關(guān)注的趨勢。大數(shù)據(jù)BI平臺的普遍成熟及其日益增強(qiáng)的實時能力也是一個令人興奮的趨勢(如SiSense、Arcadia Data等)。

      3.大數(shù)據(jù)應(yīng)用:真正的加速

      隨著一些核心基礎(chǔ)設(shè)施的挑戰(zhàn)得到解決,大數(shù)據(jù)應(yīng)用層正在快速構(gòu)建。

      在企業(yè)內(nèi)部,已經(jīng)出現(xiàn)了各種工具來幫助跨多個核心職能的企業(yè)用戶。比方說,銷售和營銷的大數(shù)據(jù)應(yīng)用通過處理大規(guī)模的內(nèi)外部數(shù)據(jù)來幫助找出哪位客戶可能會購買、續(xù)約或者流失,且速度越來越實時化;客服應(yīng)用幫助個性化服務(wù);人力應(yīng)用幫助找出如何吸引和挽留最好的員工等。

      專門的大數(shù)據(jù)應(yīng)用幾乎在任何一個垂直行業(yè)都有出現(xiàn),從醫(yī)療保?。ㄓ绕涫腔蚪M學(xué)和藥物研究)到金融、時尚乃至于執(zhí)法(如Mark43)。

      有兩個趨勢值得強(qiáng)調(diào)一下:

      首先,這些應(yīng)用很多都是“大數(shù)據(jù)原生”的,本身都是依托在最新的大數(shù)據(jù)技術(shù)基礎(chǔ)上開發(fā)的,代表了一種客戶無須部署底層大數(shù)據(jù)技術(shù)即可利用大數(shù)據(jù)的有趣方式———因為那些底層技術(shù)已經(jīng)是打包的,至少對于特定功能來說是這樣的。比方說,ActionIQ就是在Spark基礎(chǔ)上開發(fā)的(或者說是Spark的一個派生),所以它的客戶能夠在營銷部門利用Spark而不需要自己部署Spark,這種情況下是沒有“裝配線”的。

      其次,AI在應(yīng)用層也有很強(qiáng)大的存在。比方說,在貓捉老鼠的安全領(lǐng)域中,AI被廣泛用來對付黑客、實時識別和對抗網(wǎng)絡(luò)攻擊。去年已經(jīng)出現(xiàn)了一個AI驅(qū)動的數(shù)字助手行業(yè),支持從任務(wù)自動化到會議安排以及購物等幾乎一切事情。這些解決方案對AI的依賴程度不一,從幾乎100%自動化到“有人參與”等情況各不相同,但是可以明確的是,人的能力在AI的幫助下得到了增強(qiáng)。

      從很多方面來看,我們?nèi)匀惶幵诖髷?shù)據(jù)現(xiàn)象的早期發(fā)展階段,盡管已經(jīng)花費了數(shù)年時間,但減少基礎(chǔ)設(shè)施來存儲和處理大規(guī)模數(shù)據(jù)還只是第一階段。AI、機(jī)器學(xué)習(xí)已經(jīng)成為大數(shù)據(jù)應(yīng)用層的一股迅猛趨勢。大數(shù)據(jù)與AI的結(jié)合將會推動很多行業(yè)的驚人創(chuàng)新,從這個角度來說,大數(shù)據(jù)的機(jī)會也許要比大家想象的還要大。

      然而,隨著大數(shù)據(jù)繼續(xù)走向成熟,這個術(shù)語本身可能會消失,或者變得太過時以至于沒有人會再使用這個詞,這就是成功賦能技術(shù)令人諷刺的命運(yùn)歸宿———由于技術(shù)的廣泛傳播,然后到達(dá)無所不在的地步,最后被人熟視無睹。

      猜你喜歡
      基礎(chǔ)設(shè)施企業(yè)
      企業(yè)
      農(nóng)業(yè)基礎(chǔ)設(shè)施建設(shè)有望加速
      企業(yè)
      企業(yè)
      企業(yè)
      企業(yè)
      公募基礎(chǔ)設(shè)施REITs與股票的比較
      敢為人先的企業(yè)——超惠投不動產(chǎn)
      云南畫報(2020年9期)2020-10-27 02:03:26
      振動攪拌,基礎(chǔ)設(shè)施耐久性的保障
      中國公路(2017年14期)2017-09-26 11:51:43
      論P(yáng)PP模式在基礎(chǔ)設(shè)施建設(shè)項目中的應(yīng)用
      武威市| 宜昌市| 广元市| 永济市| 太白县| 华蓥市| 辽宁省| 阿拉善右旗| 刚察县| 尼勒克县| 淳化县| 浙江省| 黑河市| 甘孜县| 辽阳市| 临夏市| 辽宁省| 建阳市| 漠河县| 常宁市| 长沙县| 宜黄县| 迁西县| 巩留县| 盘山县| 噶尔县| 偃师市| 阿鲁科尔沁旗| 沾化县| 广丰县| 米林县| 亳州市| 万载县| 普格县| 蓬安县| 宁陵县| 白玉县| 太湖县| 高青县| 太白县| 汾阳市|