胡亮 張小桃
暢銷書《大數(shù)據(jù)圖景》和《大數(shù)據(jù)潮流》作者大衛(wèi)·芬雷布(David Feinleib),是Big Data Group 公司創(chuàng)始人之一。有別于關(guān)注大數(shù)據(jù)的技術(shù)和理論,大衛(wèi)·芬雷布更注重大數(shù)據(jù)的實際應(yīng)用,它如何改變我們的生活,如何幫助我們更快、更準確地做出決定。大衛(wèi)·芬雷布制作并不斷更新的大數(shù)據(jù)產(chǎn)業(yè)全景圖在業(yè)界頗受關(guān)注,在他的新書《Big Data Demystified: How Big Data Is Changing The Way We Live, Love And Learn》中文版面世之際,他接受了本刊記者的專訪。
《大學生》:看到“大數(shù)據(jù)”,有的人會聯(lián)想到“數(shù)字”。大數(shù)據(jù)僅僅關(guān)乎數(shù)字嗎?
大衛(wèi)·芬雷布:有的人看到“大數(shù)據(jù)”,可能會聯(lián)想計算機、數(shù)字。但是,大數(shù)據(jù)首先指的是應(yīng)用,其次才是“0”或“1”。要是僅僅從“0”或“1”出發(fā),那么,大數(shù)據(jù)非常無聊。換個角度,利用大數(shù)據(jù)創(chuàng)建應(yīng)用程序、改善生活,大數(shù)據(jù)就非常有趣。
大學生思考大數(shù)據(jù)時,也不要把它僅局限于計算機科學、數(shù)學等專業(yè)。比如,現(xiàn)代建筑設(shè)計也會運用大數(shù)據(jù)。建筑師要建一個綠色建筑音樂廳,那就得利用大數(shù)據(jù)分析——如何讓材料更好地傳遞音樂效果。醫(yī)學專業(yè),將來也會運用大量的數(shù)據(jù)。
講一個我自己的故事。
我熱愛鐵人三項賽——3公里游泳、180公里自行車騎行和42公里馬拉松。在訓(xùn)練和比賽中,記錄身體各項指標非常重要。為了在比賽中發(fā)揮良好,我需要收集自己的身體數(shù)據(jù)。比如,食物、呼吸、體溫和卡路里消耗。每次比賽的參賽選手眾多,幾乎每個人的手腕上都佩戴一款價格便宜的GPS手表(與十幾年前的手表相比,手表一旦與新技術(shù)結(jié)合,不但仍保留著計時功能,還能感知信息等),以便獲得各種數(shù)據(jù)。比如,心率、騎自行車時背部所承受的壓力。這些信息將自動傳至互聯(lián)網(wǎng)上,選手們至今已積累了41億英里的體能數(shù)據(jù)。收集了數(shù)據(jù),更重要的是分析數(shù)據(jù)。如何讓騎車時間縮短的同時騎行距離更長?為什么自己速度快而其他人的速度更快?這些都激發(fā)了選手們的積極性和競爭力。我還與朋友們圍繞這些數(shù)據(jù)進行討論……這些都讓鐵人三項賽越來越有趣。
《大學生》:未來幾年,大數(shù)據(jù)應(yīng)用如何改變世界的?
大衛(wèi)·芬雷布:在美國,大量新公司正受到投資者們的青睞,它們將資金投入大數(shù)據(jù)領(lǐng)域。大數(shù)據(jù)對世界的改變始于金融服務(wù)業(yè),因為金融服務(wù)行需要依靠大數(shù)據(jù)技術(shù)提高競爭力。其次是消費型網(wǎng)站,比如Facebook、亞馬遜和阿里巴巴,它們利用大數(shù)據(jù)預(yù)測消費者的購買力。第三是教育和醫(yī)療等相關(guān)領(lǐng)域。接下來,零售業(yè)也將受到影響。
大數(shù)據(jù),就是如何創(chuàng)造新型應(yīng)用程序。不同的行業(yè)在大數(shù)據(jù)運用中處于不同的階段。亞馬遜、阿里巴巴和谷歌等,是技術(shù)領(lǐng)導(dǎo)者。
《大學生》:大數(shù)據(jù)應(yīng)用對中國的影響?
大衛(wèi)·芬雷布:如何影響中國?我無法預(yù)測未來。在美國,電子商務(wù)等領(lǐng)域受大數(shù)據(jù)的影響,發(fā)生了很大變化。中國的情況不一樣,其特點是規(guī)模。擁有13多億人口的巨大市場,與隨之而來的購買、交流數(shù)據(jù)相結(jié)合,一定會發(fā)生非常有意思的事情,一定會開發(fā)出全新、有意思的應(yīng)用程序。
《大學生》:請談一談大數(shù)據(jù)對大學生的影響。
大衛(wèi)·芬雷布:首先,我講一講大數(shù)據(jù)如何影響美國大學生,挺有意思的。亞利桑那州州立大學是美國的公立大學,擁有72000名學生,學校開發(fā)Knewton系統(tǒng),通過觀察大學生們上課、做作業(yè)和考試等大數(shù)據(jù)情況,能判斷出大學生是否選對了專業(yè)。當發(fā)現(xiàn)選錯專業(yè)的情況時,Knewton系統(tǒng)會建議導(dǎo)師:這名學生可能無法完成本專業(yè)的學習,您應(yīng)與其交流。軟件還能向授課老師發(fā)出警報,及時向有可能完不成學業(yè)的學生伸出援手,給予他們額外的幫助和鼓勵。
此外,大數(shù)據(jù)將改變線性學習,使教育個性化?,F(xiàn)在,我們上學打開課本,每個人手中的教材都一模一樣,這是線性學習。然而,當我們登陸亞馬遜網(wǎng)絡(luò),它給會大家提供個性化的書目、電影等建議。其實,教育也應(yīng)如此。雖然這樣的個性化教育不會馬上實現(xiàn),但是,它肯定是未來的教育方式之一。
大數(shù)據(jù)不僅運用于教育,在線約會網(wǎng)站OkCupid 就是成功的大數(shù)據(jù)應(yīng)用之一。它做過一系列的研究,探索什么樣的個人資料可以促成在線約會成功。在題為“個人照片創(chuàng)出的4 大神話”(The 4 Big Myths of Profile Pictures)的文章中,OkCupid 通過分析7000 多人的照片信息,指出什么樣的照片可以成功吸引約會人士。OkCupid的一個有趣發(fā)現(xiàn)是:臉是否入鏡對于收到約會信息的數(shù)量不會有太大影響。無論身穿潛水裝備,還是穿越沙漠,甚至完全不顯示臉部,都會與露臉照片一樣引起瀏覽者的關(guān)注。所以,長相并不重要!能引起瀏覽者興趣的是:照片中“真正的你”——愛好和興趣。
所以,無論是學習,還是約會,大數(shù)據(jù)都將有所作為。
《大學生》:每一個科技潮流都會誕生億萬富翁大學生,比如比爾·蓋茨、Facebook創(chuàng)始人扎克伯格。大數(shù)據(jù)是新的潮流,大學生應(yīng)如何抓住機遇?
大衛(wèi)·芬雷布:對,下一個億萬富翁可能就來自應(yīng)用大數(shù)據(jù)的大學生。大數(shù)據(jù)可以被運用于各個方面,比如食物送遞。大學生都要吃東西,如何方便地取得食物,這就是大數(shù)據(jù)應(yīng)用。所以,一定會有大學生利用大數(shù)據(jù)創(chuàng)業(yè),成為億萬富翁。對于成不了億萬富翁的,大數(shù)據(jù)也會提供成千上萬的崗位,比如數(shù)據(jù)分析。
是創(chuàng)業(yè)?還是求職于大數(shù)據(jù)公司?我建議認清自己。希望自己是未來的比爾·蓋茨或扎克伯格,不妨創(chuàng)建大數(shù)據(jù)公司,創(chuàng)建一個全新的大數(shù)據(jù)應(yīng)用。不想成為企業(yè)家,或不愿意冒險,不妨嘗試數(shù)據(jù)分析或數(shù)據(jù)科學研究,做得好也可以創(chuàng)造新東西,比如,新藥品。
《大學生》:請談一談大數(shù)據(jù)產(chǎn)業(yè)全景圖(the Big Data Landscape),據(jù)報道它已成為Twitter上的一個熱門話題。
大衛(wèi)·芬雷布:目前,大數(shù)據(jù)產(chǎn)業(yè)全景圖上共有120家大數(shù)據(jù)公司,每3個月會更新一次。在這張全景圖上,每一個Logo代表一家大數(shù)據(jù)公司。有些公司的名字耳熟能詳,比如IBM、Microsoft(微軟),但絕大部分的公司都是剛創(chuàng)立的,這代表了大數(shù)據(jù)領(lǐng)域的創(chuàng)新速度。
我剛創(chuàng)建大數(shù)據(jù)產(chǎn)業(yè)全景圖時,有一個有趣的故事。當時,大數(shù)據(jù)產(chǎn)業(yè)全景圖上只有25家公司的名稱。那些沒有出現(xiàn)在全景圖上的公司有些失望,紛紛給我打電話問原因。在這里,我傳授一條市場營銷經(jīng)驗——希望某個公司主動找上門,請把它的名稱從“全景圖”上刪去即可。因為,很多公司都在這張“全景圖”,它的“不存在”會促使其主動聯(lián)系你。前提是你的研究令人害怕。
120家大數(shù)據(jù)公司絕大多數(shù)都在美國,當然,我也列舉了少數(shù)歐洲的大數(shù)據(jù)公司。在全景圖上,我把公司分為“應(yīng)用程序類(Apps)”和“基礎(chǔ)設(shè)計類(Infrastructure)”,而它們又被分成不同的小類,這樣就更加清晰明了。比如“應(yīng)用程序類”包括Vertical Apps(垂直應(yīng)用程序),Ad/Media Apps(廣告/傳媒應(yīng)用程序),Business Intelligence(商業(yè)智能),Analytics and Visualization(分析和可視化),Operational Intelligence(運營智能)和Data As A Service(數(shù)據(jù)服務(wù))。
責任編輯:尹穎堯