郭濤
挖掘大數(shù)據(jù)的行業(yè)應(yīng)用價(jià)值,提升獲取信息的能力,注重大數(shù)據(jù)人才的培養(yǎng),這樣才能將大數(shù)據(jù)應(yīng)用的比例從5%提升到更高。
2013年,惠普發(fā)布了大數(shù)據(jù)解決方案平臺HAVEn,這是一個(gè)能夠處理所有數(shù)據(jù)類型,能夠?qū)崟r(shí)分析且安全的開放架構(gòu)。目前,該平臺在國內(nèi)外的金融、電信、能源、互聯(lián)網(wǎng)等行業(yè)中已經(jīng)擁有了許多成功應(yīng)用?;萜罩袊鴧^(qū)副總裁、軟件集團(tuán)大中華區(qū)總經(jīng)理于志偉表示,HAVEn的推出標(biāo)志著惠普已經(jīng)脫離了初始的數(shù)據(jù)匯集的階段,步入了大數(shù)據(jù)應(yīng)用的新階段。
行業(yè)、能力、人才
于志偉認(rèn)為,目前中國的大數(shù)據(jù)應(yīng)用還處于起步階段,而且由于行業(yè)需求、區(qū)域和人才儲備等情況的差異,造成了大數(shù)據(jù)應(yīng)用水平參差不齊的現(xiàn)象。在某些行業(yè),用戶對大數(shù)據(jù)的需求是十分迫切的,但是相當(dāng)多的用戶仍糾結(jié)于數(shù)據(jù)量“大”這個(gè)問題,還沒有考慮結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化等不同類型的數(shù)據(jù)應(yīng)該如何處理。
國外的大數(shù)據(jù)應(yīng)用水平已經(jīng)達(dá)到很高的程度。舉例來說,在美國,一個(gè)區(qū)域內(nèi)的所有醫(yī)院的信息都會被搜集起來用于分析,據(jù)此可預(yù)測某種疾病的死亡率。“國外的大數(shù)據(jù)應(yīng)用已經(jīng)走入行業(yè),可以挖掘出行業(yè)中真正有價(jià)值的東西。雖然國內(nèi)的大數(shù)據(jù)應(yīng)用還停留在初始階段,但在某些行業(yè),比如互聯(lián)網(wǎng),其大數(shù)據(jù)應(yīng)用的復(fù)雜程度比國外更甚,發(fā)展水平也較高?!庇谥緜ハ蛴浾弑硎尽?/p>
大數(shù)據(jù)的應(yīng)用要經(jīng)歷一個(gè)過程,不同的行業(yè)對大數(shù)據(jù)應(yīng)用的需求是不同的。于志偉表示,企業(yè)在實(shí)施大數(shù)據(jù)應(yīng)用時(shí)應(yīng)注意以下幾個(gè)問題:第一,注重大數(shù)據(jù)的行業(yè)應(yīng)用價(jià)值;第二,企業(yè)要不斷提升自身的能力去獲得想要的信息;第三,大數(shù)據(jù)人才非常重要?!澳壳?,我國大數(shù)據(jù)行業(yè)面臨著人才嚴(yán)重匱乏的局面,從數(shù)據(jù)模型專家到通曉行業(yè)應(yīng)用的復(fù)合型大數(shù)據(jù)人才都十分短缺,這會影響大數(shù)據(jù)應(yīng)用的發(fā)展速度?!庇谥緜ケ硎尽?/p>
HAVEn是一種方向
今天,產(chǎn)品集成并不是難事,那么HAVEn是不是簡單地將相關(guān)產(chǎn)品攢到了一起呢?于志偉澄清說,從HAVEn本身的標(biāo)準(zhǔn)架構(gòu)來看,H代表Hadoop,表明HAVEn是一種分布式的架構(gòu),能夠支持各種類型的數(shù)據(jù),而且存儲成本非常低廉;A代表Autonomy,表明HAVEn可以高效地處理非結(jié)構(gòu)化信息,特別是機(jī)器語言;V代表Vertica,表明HAVEn可以實(shí)時(shí)處理和分析大量信息;E代表Enterprise Security,主要針對半結(jié)構(gòu)化數(shù)據(jù)的處理;n代表的是各種在大數(shù)據(jù)平臺上開發(fā)的應(yīng)用。
HAVEn是一個(gè)平臺,它可以處理所有類型的信息,而且能做到實(shí)時(shí)分析,同時(shí)具有安全性。那么,HAVEn能不能代表未來大數(shù)據(jù)方案的發(fā)展方向?于志偉并沒有正面回答記者的問題,而是舉了一個(gè)例子,全球最大的社交媒體公司,之前采用Hadoop架構(gòu)對信息進(jìn)行處理。但是在半年前,它們采購了Vertica。很多人認(rèn)為,Hadoop代表了大數(shù)據(jù)主流的發(fā)展方向,那么這家企業(yè)為什么會轉(zhuǎn)而選擇Vertica呢?最主要的原因是,Vertica可以實(shí)現(xiàn)實(shí)時(shí)分析。對于以廣告收入為主要來源的這家企業(yè)來說,實(shí)時(shí)推送精準(zhǔn)的廣告是至關(guān)重要的,而Vertica可以實(shí)現(xiàn)。這家企業(yè)用Hadoop處理非實(shí)時(shí)的數(shù)據(jù)業(yè)務(wù),而用Vertica進(jìn)行實(shí)時(shí)的業(yè)務(wù)分析。雖然相比Hadoop,Vertica的采購價(jià)格略貴,但這家企業(yè)還是一次性采購了20PB。還有一家美國的知名電信公司,一次性采購了25PB的 Vertica解決方案,用于4G業(yè)務(wù)。
“我們不去爭論HAVEn是不是業(yè)界最先進(jìn)的產(chǎn)品,但是綜合上述這些已經(jīng)使用了HAVEn的代表性企業(yè)的實(shí)踐,HAVEn代表了一種發(fā)展方向?!庇谥緜シ治稣f,“Hadoop將來會不會更全面,也能實(shí)時(shí)處理信息?有這種可能性,但需要時(shí)間。三年或五年以后,什么都可能發(fā)生,一種新技術(shù)甚至?xí)?。事?shí)證明,我們的大數(shù)據(jù)平臺能夠解決用戶的問題,而且很多用戶都在使用。”
在中國,也有用戶在使用HAVEn,比如一個(gè)運(yùn)營商使用HAVEn中的Vertica,分析用戶的上網(wǎng)行為,每天分析的記錄達(dá)到幾十億條。以前,這樣的分析工作很難在一天之內(nèi)完成,而使用Vertica,分析速度提高了60倍。另外,國內(nèi)某知名能源公司采用HAVEn中的Autonomy,支持其信息共享平臺。
于志偉認(rèn)為,HAVEn還只是一個(gè)大數(shù)據(jù)平臺,而用戶購買的是應(yīng)用。因此從這個(gè)角度說,惠普提供的解決方案還不夠全面。HAVEn中為什么會有一個(gè)“n”,就是表明惠普要在大數(shù)據(jù)領(lǐng)域開發(fā)更多的應(yīng)用。惠普與全球最大的幾家咨詢公司合作,并在亞太和中國市場上尋找類似的合作伙伴。“行業(yè)解決方案是有區(qū)域性特征的,不可能直接照搬國外的。在一些垂直細(xì)分領(lǐng)域,我們一方面自己開發(fā),另一方面也和合作伙伴共同開發(fā)解決方案?!庇谥緜パa(bǔ)充說,“我們與政府合辦的IT培訓(xùn)基地也把大數(shù)據(jù)當(dāng)作一個(gè)重點(diǎn)。中國極缺大數(shù)據(jù)人才,我們從現(xiàn)在開始就要培養(yǎng)。這些人才今后可以為我們的合作伙伴所用,有利于我們共同構(gòu)建一個(gè)良好的大數(shù)據(jù)生態(tài)體系?!?/p>
樹立行業(yè)樣板
記者在采訪很多用戶時(shí),他們都表示已經(jīng)認(rèn)識到了大數(shù)據(jù)、云計(jì)算的重要性和可能給企業(yè)帶來的收益。但是認(rèn)識與接受是兩回事,目前真正將大數(shù)據(jù)、云計(jì)算用于業(yè)務(wù)并取得顯著經(jīng)濟(jì)利益的用戶畢竟是少數(shù)。大數(shù)據(jù)是當(dāng)前用戶最迫切需要的、關(guān)系企業(yè)成敗的技術(shù),還是只是起到了錦上添花的作用?
于志偉對于大數(shù)據(jù)的前景十分樂觀:“目前在客戶中,真正使用大數(shù)據(jù)的比例可能低于5%,但即使是這5%已經(jīng)是巨大的客戶量,而且這5%的企業(yè)都是超大型的企業(yè)和最需要大數(shù)據(jù)的企業(yè)。惠普一定是先與這些企業(yè)合作,樹立大數(shù)據(jù)的應(yīng)用標(biāo)桿,然后再引導(dǎo)更多的企業(yè)加入?;萜漳壳霸谧龅娜瞬沤逃团囵B(yǎng)工作,也是為了更好地普及大數(shù)據(jù)應(yīng)用。我們不確定大數(shù)據(jù)市場何時(shí)會井噴,但我們會一直持續(xù)地給用戶和市場更多方案、經(jīng)驗(yàn)和信心?!?/p>
大數(shù)據(jù)的一個(gè)典型特征就是實(shí)時(shí)處理和分析,能夠?qū)崿F(xiàn)實(shí)時(shí)處理的解決方案價(jià)格相對昂貴,而客戶往往追求的是高性比的解決方案。那么,價(jià)格會不會是阻礙大數(shù)據(jù)普及的一個(gè)因素呢?Vertica是實(shí)時(shí)分析工具的一個(gè)代表,它的價(jià)格是普通企業(yè)用戶能接受的嗎?“相對于Hadoop大數(shù)據(jù)方案來說,Vertica的成本高相對高一些?!庇谥緜ゲ⒉恢M言,“Vertica運(yùn)行于開放的硬件平臺架構(gòu)之上,不管是惠普自己的硬件還是第三方的硬件,即使在低端的x86平臺上也可以良好運(yùn)行。我們可以為用戶提供靈活的選擇,既能提供Vertica軟件,也可以提供軟件與硬件組成的整體解決方案,包括一體機(jī)。無論從整體擁有成本,還是靈活性的角度來分析,相比市場上的其他一體機(jī)或大數(shù)據(jù)解決方案,Vertica大數(shù)據(jù)解決方案還是非常有競爭力的?!?/p>
鏈接
惠普中國軟件集團(tuán)的四件大事
2014年,惠普軟件的整體戰(zhàn)略相較去年不會有太大變化。于志偉表示,惠普軟件在今年將主要做好以下四件事。
第一,在大數(shù)據(jù)、云計(jì)算方面繼續(xù)加強(qiáng)與政府的合作,同時(shí)抓好人才培養(yǎng)工作。
第二,在大數(shù)據(jù)、云計(jì)算、移動應(yīng)用等領(lǐng)域,尋找并樹立更多的成功用戶樣板,吸引更多新客戶。
第三,關(guān)注中小企業(yè)市場。中小企業(yè)市場的一個(gè)特點(diǎn)是“東方不亮西方亮”,總能找到突破口。于志偉也坦承,針對中小企業(yè)用戶的大數(shù)據(jù)解決方案肯定不同于大企業(yè),但是建立一個(gè)公共服務(wù)平臺提供大數(shù)據(jù)或云計(jì)算服務(wù)是有可能的。
第四,密切合作伙伴關(guān)系。“未來,我們業(yè)務(wù)的一半與合作伙伴相關(guān)。因此,我們要與合作伙伴共同設(shè)計(jì)、推廣大數(shù)據(jù)解決方案?!庇谥緜ケ硎?。endprint