宋之杰, 杜亞莉
(燕山大學(xué)經(jīng)濟(jì)管理學(xué)院,河北 秦皇島 066004)
阿里巴巴前CEO馬云在卸任時(shí)提到:“大家還沒(méi)有搞清楚pc時(shí)代的時(shí)候,移動(dòng)互聯(lián)網(wǎng)來(lái)了,還沒(méi)搞清楚移動(dòng)互聯(lián)網(wǎng)的時(shí)候,大數(shù)據(jù)時(shí)代又來(lái)了。”那么到底什么是大數(shù)據(jù)?當(dāng)我們還對(duì)大數(shù)據(jù)概念產(chǎn)生疑惑的同時(shí),其實(shí)已經(jīng)處在了大數(shù)據(jù)的環(huán)境中。不同領(lǐng)域都在時(shí)刻產(chǎn)生著大量數(shù)據(jù),數(shù)據(jù)產(chǎn)生的越多,為我們環(huán)境、金融、醫(yī)療交通等各方面帶來(lái)價(jià)值的機(jī)率就越大。[1]目前交通運(yùn)輸中已經(jīng)應(yīng)用了大數(shù)據(jù)的技術(shù)。公交車(chē)上安裝的各種傳感器,通過(guò)搜集數(shù)據(jù)來(lái)告知站牌車(chē)的運(yùn)行速度,車(chē)的實(shí)時(shí)位置,以及距離進(jìn)站的時(shí)間,使人們及時(shí)了解公交信息,避免了等車(chē)過(guò)程中不必要的時(shí)間浪費(fèi),為人們的出行提供了極大的便利。
現(xiàn)在為止仍沒(méi)有關(guān)于大數(shù)據(jù)準(zhǔn)確的統(tǒng)一定義,本文通過(guò)歸納不同學(xué)者關(guān)于大數(shù)據(jù)的定義做了如下總結(jié)。大數(shù)據(jù)就是指其數(shù)據(jù)量規(guī)模大到用目前的數(shù)據(jù)處理工具無(wú)法處理的程度,使得沒(méi)有辦法對(duì)其采集,存儲(chǔ),管理和分析的數(shù)據(jù)的集合。[2]以下四點(diǎn)分別為大數(shù)據(jù)的基本特征:一是龐大的數(shù)據(jù)量(Volume Big),早些年用的“海量數(shù)據(jù)”已經(jīng)不足以來(lái)描述大數(shù)據(jù)時(shí)代產(chǎn)生的數(shù)據(jù),大數(shù)據(jù)言外之意數(shù)據(jù)量非常之龐大;二是流動(dòng)性較強(qiáng)(Velocity Fast),不論是數(shù)據(jù)的產(chǎn)生還是交換。隨著信息產(chǎn)品的不斷更新?lián)Q代,信息的傳播速度也變得讓人無(wú)法想象;三是數(shù)據(jù)類(lèi)型的多樣性(VariableType),目前接觸到的數(shù)據(jù)已經(jīng)不是簡(jiǎn)單的數(shù)字或者文字,大量的信息是隱藏在圖像、音頻或者是視頻里的;四是價(jià)值大但是價(jià)值密度低(Value high and Low density)。[3]
2008年秦皇島開(kāi)發(fā)區(qū)確定把大數(shù)據(jù)產(chǎn)業(yè)作為龍頭產(chǎn)業(yè)發(fā)展,提出建設(shè)“中國(guó)數(shù)谷”的目標(biāo),并在全國(guó)范圍內(nèi)率先提出大數(shù)據(jù)產(chǎn)業(yè)的概念。大數(shù)據(jù)產(chǎn)業(yè)是指關(guān)于數(shù)據(jù)一系列服務(wù)的產(chǎn)業(yè)的總稱(chēng)。分為兩個(gè)層次,一層是數(shù)據(jù)的采集、加工、存儲(chǔ)、傳播等相關(guān)的數(shù)據(jù)服務(wù),另一層是進(jìn)行這些數(shù)據(jù)服務(wù)的軟、硬件研發(fā)部門(mén)和制造業(yè)。大數(shù)據(jù)產(chǎn)業(yè)是一種新型的現(xiàn)代服務(wù)業(yè),主要內(nèi)容有以下三個(gè)方面:
(1)數(shù)據(jù)內(nèi)容業(yè):以信息為主要產(chǎn)品,可以關(guān)聯(lián)到社會(huì)的各個(gè)領(lǐng)域,指從事數(shù)據(jù)的存儲(chǔ)、采集、加工、傳播等基本數(shù)據(jù)服務(wù)的產(chǎn)業(yè)群體,如數(shù)據(jù)存儲(chǔ)部門(mén)(各檔案室、情報(bào)部門(mén)、各大數(shù)據(jù)中心等)。
(2)數(shù)據(jù)服務(wù)業(yè):指用專(zhuān)業(yè)的知識(shí)和技能給顧客提供策略解決問(wèn)題的服務(wù)。例如數(shù)據(jù)以及數(shù)據(jù)庫(kù)的咨詢、數(shù)據(jù)庫(kù)建立以及升級(jí)、系統(tǒng)的創(chuàng)建和升級(jí)、增值網(wǎng)絡(luò)服務(wù)等。數(shù)據(jù)服務(wù)業(yè)是專(zhuān)門(mén)以數(shù)據(jù)產(chǎn)品為社會(huì)服務(wù)的行業(yè)總稱(chēng),是開(kāi)發(fā)利用大數(shù)據(jù)資源并且實(shí)現(xiàn)其商業(yè)化、市場(chǎng)化、社會(huì)化的基礎(chǔ)。
(3)數(shù)據(jù)軟、硬件制造業(yè):指從事數(shù)據(jù)相關(guān)的基礎(chǔ)設(shè)備和軟件的研發(fā)和制造的行業(yè)。[4]
大數(shù)據(jù)產(chǎn)業(yè)的概念從國(guó)際視角來(lái)看有狹義和廣義之分。廣義的大數(shù)據(jù)產(chǎn)業(yè)即信息產(chǎn)業(yè),其主要是與數(shù)據(jù)相關(guān)的服務(wù)的硬件制造、軟件研發(fā)、軟硬件相結(jié)合的網(wǎng)絡(luò)工程建設(shè)、數(shù)據(jù)采集加工和相關(guān)數(shù)據(jù)服務(wù),即包括了從數(shù)據(jù)相關(guān)軟硬件的制造到數(shù)據(jù)服務(wù)的總過(guò)程所涉及到的一切業(yè)務(wù)。狹義的大數(shù)據(jù)產(chǎn)業(yè)指數(shù)據(jù)采集、加工與相關(guān)服務(wù)業(yè),即對(duì)大量數(shù)據(jù)進(jìn)行采集加工處理轉(zhuǎn)化為顧客需要的數(shù)據(jù)產(chǎn)品的產(chǎn)業(yè)。一般情況下的大數(shù)據(jù)產(chǎn)業(yè)指狹義的數(shù)據(jù)產(chǎn)業(yè)。[5]
(1)大數(shù)據(jù)產(chǎn)業(yè)相對(duì)工業(yè)產(chǎn)業(yè)來(lái)講,占地面積小而且環(huán)保,不會(huì)產(chǎn)生空氣以及液體污染物,造成環(huán)境污染。例如鋼鐵、化工行業(yè),生產(chǎn)過(guò)程中涉及到的原料輔料眾多,且各個(gè)生產(chǎn)環(huán)節(jié)都可能會(huì)對(duì)環(huán)境造成或大或小的污染,其本身就是一個(gè)巨大的污染源,同時(shí)占地面積較大。顯然大數(shù)據(jù)產(chǎn)業(yè)在積極響應(yīng)節(jié)能綠色環(huán)保的國(guó)際新形勢(shì)上更具優(yōu)勢(shì)。
(2)大數(shù)據(jù)產(chǎn)業(yè)需要大量的專(zhuān)業(yè)數(shù)據(jù)人才。據(jù)相關(guān)統(tǒng)計(jì),在全球以40%的數(shù)據(jù)增長(zhǎng)速度和每?jī)赡陻?shù)據(jù)總量就翻一倍的大數(shù)據(jù)時(shí)代形勢(shì)下,新數(shù)據(jù)的加工利用能力的增長(zhǎng)率卻不到5%。同時(shí)新產(chǎn)生的大量非結(jié)構(gòu)化的數(shù)據(jù)對(duì)技術(shù)水平和人才提出了更高的要求,需要不斷的研究和創(chuàng)新技術(shù)來(lái)迎合大數(shù)據(jù)時(shí)代的需求。
(3)大數(shù)據(jù)產(chǎn)業(yè)幾乎可以為各行業(yè)產(chǎn)生巨大的經(jīng)濟(jì)效益。據(jù)統(tǒng)計(jì),歐洲零售商利用數(shù)據(jù)產(chǎn)品(消費(fèi)者喜好、消費(fèi)者購(gòu)買(mǎi)欲望的具體時(shí)間等信息)使利潤(rùn)得到60%的增幅;制造業(yè)的裝配成本在數(shù)據(jù)產(chǎn)業(yè)的服務(wù)下將會(huì)降低一半等等。目前利用大數(shù)據(jù)產(chǎn)業(yè)的相關(guān)服務(wù)為自己謀利的企業(yè)有很多,比如現(xiàn)行的網(wǎng)上購(gòu)物平臺(tái),通過(guò)利用新老顧客或者潛在顧客對(duì)商品的點(diǎn)擊率、評(píng)價(jià)、交易量等數(shù)據(jù)做分析,掌握消費(fèi)者的消費(fèi)心理和趨向,來(lái)提高交易總量。由此可見(jiàn)大數(shù)據(jù)將會(huì)給產(chǎn)生它的個(gè)體和組織帶來(lái)價(jià)值。[6]
美國(guó)是世界上第一個(gè)發(fā)展大數(shù)據(jù)產(chǎn)業(yè)的國(guó)家,也是目前為止發(fā)展大數(shù)據(jù)產(chǎn)業(yè)比較成功的國(guó)家,現(xiàn)在美國(guó)的大數(shù)據(jù)產(chǎn)業(yè)鏈已經(jīng)基本完整。美國(guó)的大數(shù)據(jù)產(chǎn)業(yè)的基本格局是縱向三個(gè)層次,橫向兩個(gè)層次。縱向即處于底層的一些開(kāi)源項(xiàng)目以及基于這些開(kāi)源項(xiàng)目的基礎(chǔ)架構(gòu)、分析和應(yīng)用。橫向就是基礎(chǔ)架構(gòu)、分析和應(yīng)用。美國(guó)安全局和聯(lián)邦調(diào)查局早在2007年秘密開(kāi)啟名叫“棱鏡”的監(jiān)控項(xiàng)目,其主要是用于數(shù)據(jù)收集、存儲(chǔ)、分析,破解密碼和打擊恐怖分子。[7]2012年3月,奧巴馬當(dāng)局宣布“大數(shù)據(jù)發(fā)展戰(zhàn)略”。2013年5月,為提高大數(shù)據(jù)獲取知識(shí)的能力,加強(qiáng)國(guó)家安全,奧巴馬又宣布了“大數(shù)據(jù)的研究和發(fā)展計(jì)劃”。2013年11月,美國(guó)政府發(fā)布涉及科研部門(mén)、企業(yè)部門(mén)、各級(jí)政府部門(mén)等多個(gè)大數(shù)據(jù)研究項(xiàng)目。美國(guó)國(guó)家衛(wèi)生研究院、國(guó)家科學(xué)基金會(huì)等研究機(jī)構(gòu)都參與其中,有人稱(chēng)這是美國(guó)大數(shù)據(jù)戰(zhàn)略的升級(jí)版。
英國(guó)最近雖然經(jīng)濟(jì)不景氣,但是大數(shù)據(jù)產(chǎn)業(yè)也是其政府重點(diǎn)發(fā)展的科技領(lǐng)域。英國(guó)政府為了提高數(shù)據(jù)采集、存儲(chǔ)、分析等能力并且吸引企業(yè)在數(shù)據(jù)產(chǎn)業(yè)方面的投資在基礎(chǔ)設(shè)施方面投入大量資金,促進(jìn)大數(shù)據(jù)產(chǎn)業(yè)鏈的形成和發(fā)展以在數(shù)據(jù)革命中搶占先機(jī)。2013年,英國(guó)牛津大學(xué)成立首個(gè)應(yīng)用大數(shù)據(jù)技術(shù)的醫(yī)療衛(wèi)生研究中心。該研究中心通過(guò)搜集數(shù)據(jù),對(duì)大量的醫(yī)療信息分析整合,準(zhǔn)確地了解病人病患處,為新的治療方法提供靈感,精準(zhǔn)定位新藥品的研制導(dǎo)向,大大區(qū)別于之前的摸索實(shí)驗(yàn)階段,節(jié)約了藥物研發(fā)成本。英國(guó)的醫(yī)學(xué)研究和治療由于大數(shù)據(jù)的應(yīng)用迎來(lái)革命性的改變。
日本政府為了擺脫經(jīng)濟(jì)低迷的現(xiàn)狀決定大力發(fā)展 IT產(chǎn)業(yè),尤其是大數(shù)據(jù)產(chǎn)業(yè)。近幾年不斷推出《IT新改革戰(zhàn)略》、《新信息通信技術(shù)戰(zhàn)略》等信息戰(zhàn)略并且持續(xù)完善和升級(jí)。2012年7月,日本政府發(fā)布關(guān)于信息行業(yè)的“活躍ICT日本”綜合戰(zhàn)略,重點(diǎn)旨在利用大數(shù)據(jù)產(chǎn)業(yè)的數(shù)據(jù)以及電子服務(wù)建立政府信息公共網(wǎng)站,提供各系統(tǒng)之間的信息交流平臺(tái),最終建立全國(guó)統(tǒng)一的政府信息服務(wù)系統(tǒng);2013年繼續(xù)推出了新 ICT戰(zhàn)略,實(shí)現(xiàn)了在網(wǎng)絡(luò)上可以查看和重復(fù)使用行政信息,進(jìn)一步保證政府信息的開(kāi)放性。2013年6月,日本政府又發(fā)布了以大力發(fā)展大數(shù)據(jù)產(chǎn)業(yè)為核心的“創(chuàng)建最頂尖IT國(guó)家”的宣言,并聲稱(chēng)要將其發(fā)展成果延伸到國(guó)際。
在學(xué)術(shù)界,關(guān)于大數(shù)據(jù)的相關(guān)委員會(huì)相繼成立——大數(shù)據(jù)專(zhuān)家委員會(huì)、中國(guó)通信學(xué)會(huì)大數(shù)據(jù)專(zhuān)家委員會(huì)(專(zhuān)門(mén)研究大數(shù)據(jù)應(yīng)用和發(fā)展的學(xué)術(shù)咨詢中心)。2012年11月30日以“大數(shù)據(jù)共享與開(kāi)發(fā)”為主題的“Hadhoop與大數(shù)據(jù)技術(shù)大會(huì)”在北京舉行,對(duì) Hadhoop和大數(shù)據(jù)的關(guān)鍵技術(shù)進(jìn)行了深入交流,就大數(shù)據(jù)產(chǎn)業(yè)的相關(guān)軟硬件技術(shù)、發(fā)展現(xiàn)狀以及未來(lái)的發(fā)展方向進(jìn)行了探索。2013年12月5日,中國(guó)大數(shù)據(jù)技術(shù)大會(huì) (Big Data Technology Conference2013)在北京召開(kāi),大會(huì)內(nèi)容貫穿了數(shù)據(jù)的全生命周期,從數(shù)據(jù)收集、存儲(chǔ)、分析、處理到數(shù)據(jù)的開(kāi)發(fā)與應(yīng)用。
在企業(yè)界,發(fā)展大數(shù)據(jù)產(chǎn)業(yè)最有利的地理位置——北京中關(guān)村的大數(shù)據(jù)產(chǎn)業(yè)已現(xiàn)雛形。由寬帶資本、用友軟件、云基地、百度在線、阿里巴巴等與大數(shù)據(jù)密切相關(guān)的企業(yè)共同發(fā)起的中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟宣布成立,促進(jìn)大數(shù)據(jù)產(chǎn)業(yè)生態(tài)環(huán)境的形成。在我國(guó)最先開(kāi)始發(fā)展大數(shù)據(jù)產(chǎn)業(yè)的秦皇島大數(shù)據(jù)產(chǎn)業(yè)基地于2008年動(dòng)工。2012年8月,智慧城市北方基地落戶秦皇島數(shù)據(jù)產(chǎn)業(yè)基地。2013年11月3日武漢高科集團(tuán)在“大數(shù)據(jù)產(chǎn)業(yè)研討會(huì)”中表示將發(fā)揮大數(shù)據(jù)產(chǎn)業(yè)主力軍和領(lǐng)導(dǎo)者的作用。2013年,中國(guó)三大移動(dòng)運(yùn)營(yíng)商(中國(guó)移動(dòng)、中國(guó)電信、中國(guó)聯(lián)通)的南方數(shù)據(jù)中心在貴州省落戶,為貴州省進(jìn)行產(chǎn)業(yè)變革和升級(jí)打下了基礎(chǔ)。2014年3月1日,在北京中關(guān)村召開(kāi)“貴州-北京大數(shù)據(jù)產(chǎn)業(yè)發(fā)展推介會(huì)”,貴州成為中國(guó)西部首個(gè)發(fā)展大數(shù)據(jù)產(chǎn)業(yè)的省份。
在國(guó)家政府部門(mén),大數(shù)據(jù)及大數(shù)據(jù)產(chǎn)業(yè)越來(lái)越受到重視,在3月份召開(kāi)的中國(guó)兩會(huì)上,以百度CEO李彥宏為首的大數(shù)據(jù)產(chǎn)業(yè)領(lǐng)頭企業(yè)的企業(yè)家們作為人大代表就大數(shù)據(jù)產(chǎn)業(yè)提出了諸多相關(guān)建議,最讓人興奮且最接近民心的是要利用大數(shù)據(jù)分析方法治理大氣污染PM2.5。同時(shí)在兩會(huì)期間,李克強(qiáng)總理也明確提出要為新興產(chǎn)業(yè)建立良好的創(chuàng)新平臺(tái),在大數(shù)據(jù)方面要抓住機(jī)遇,搶占先機(jī),從而帶動(dòng)其他產(chǎn)業(yè)發(fā)展和產(chǎn)業(yè)轉(zhuǎn)型升級(jí)。
市場(chǎng)來(lái)源于需求,正是由于人們對(duì)大數(shù)據(jù)的旺盛需求,有了良好的市場(chǎng)氛圍,才推動(dòng)了大數(shù)據(jù)產(chǎn)業(yè)發(fā)展。市場(chǎng)需求主要來(lái)自以下幾個(gè)方面:
(1)信息技術(shù)企業(yè):先前被動(dòng)的接受信息的信息技術(shù)企業(yè)現(xiàn)在轉(zhuǎn)變?yōu)橹鲃?dòng)挖掘數(shù)據(jù)、獲得信息,為自己謀取更大利益。例如在線購(gòu)物企業(yè)亞馬遜、淘寶,通過(guò)數(shù)據(jù)分析得出顧客的喜好來(lái)決定商品的價(jià)格、類(lèi)型以及適宜的促銷(xiāo)時(shí)間,增加交易記錄。電子商務(wù)平臺(tái)eBay通過(guò)對(duì)在線廣告的分析,提供顧客喜好品牌的廣告,提高廣告的效率和顧客的購(gòu)買(mǎi)率。同時(shí)以指數(shù)增長(zhǎng)的大數(shù)據(jù)為信息行業(yè)的軟硬件提出了更高的要求,信息行業(yè)必須加快發(fā)展速度,加強(qiáng)技術(shù)創(chuàng)新,為大數(shù)據(jù)時(shí)代所需要的各種數(shù)據(jù)分析軟硬件的研發(fā)和創(chuàng)造做出努力,這是信息行業(yè)又一個(gè)大的發(fā)展機(jī)遇。
(2)對(duì)數(shù)據(jù)依賴性較強(qiáng)的企業(yè):例如金融業(yè)(證券交易所、銀行)等。它們需要數(shù)據(jù)的實(shí)時(shí)變更和儲(chǔ)備。再例如企業(yè)營(yíng)銷(xiāo)業(yè)務(wù),不少企業(yè)的營(yíng)銷(xiāo)業(yè)務(wù)已經(jīng)全部實(shí)現(xiàn)電子化,其電子運(yùn)營(yíng)系統(tǒng)一經(jīng)癱瘓,公司業(yè)務(wù)將會(huì)全部停止,損失將是以千萬(wàn)/秒計(jì)算甚至是更大的單位來(lái)計(jì)算。對(duì)數(shù)據(jù)依賴極大的企業(yè)要求他們必須建立自己的數(shù)據(jù)存儲(chǔ)中心,但僅僅這些并不足以滿足它們快速增長(zhǎng)的數(shù)據(jù)存儲(chǔ)需求,所以能夠提供數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)災(zāi)備等數(shù)據(jù)服務(wù)的大數(shù)據(jù)產(chǎn)業(yè)顯得迫切需要。
(3)潛在的大數(shù)據(jù)應(yīng)用用戶:比如醫(yī)療業(yè)、政府機(jī)構(gòu)部門(mén)。目前部分醫(yī)療機(jī)構(gòu)已經(jīng)利用大數(shù)據(jù)的業(yè)務(wù),比如遠(yuǎn)程醫(yī)療服務(wù)——根據(jù)對(duì)平日患者的病例數(shù)據(jù)進(jìn)行分析挖掘得出診斷方案,實(shí)現(xiàn)遠(yuǎn)程醫(yī)療服務(wù)。許多國(guó)家的政府部門(mén)已經(jīng)加入了大數(shù)據(jù)產(chǎn)業(yè)的行列,實(shí)現(xiàn)政府信息公開(kāi)化、政務(wù)電子化,為政府官員和普通大眾帶來(lái)極大的便利,省去了之前繁冗復(fù)雜的程序。
(4)數(shù)據(jù)驅(qū)動(dòng)型企業(yè):大數(shù)據(jù)時(shí)代的來(lái)臨使得企業(yè)的決策方法有了新的思路,他們不再希望通過(guò)經(jīng)驗(yàn)或者自我判斷,或者是老套的樣本收集分析得出的商業(yè)信息而做出決策,他們更希望運(yùn)用相關(guān)的大數(shù)據(jù)技術(shù)做出更為科學(xué)準(zhǔn)確的分析,加大決策的精準(zhǔn)性。美國(guó)相關(guān)研究機(jī)構(gòu)調(diào)研多家公司之后分析指出,采用“數(shù)據(jù)驅(qū)動(dòng)型決策”的企業(yè)可以帶來(lái)顯著的生產(chǎn)力提高(比其他因素帶來(lái)的增長(zhǎng)多提高5%-6%)?!皵?shù)據(jù)驅(qū)動(dòng)型”的新管理模式正在他們的企業(yè)中推廣。[7]
(1)大數(shù)據(jù)本身所具有的價(jià)值
大數(shù)據(jù)產(chǎn)業(yè)可以帶來(lái)實(shí)實(shí)在在的效益。2013年美國(guó)總統(tǒng)選舉,奧巴馬通過(guò)依靠其數(shù)據(jù)分析團(tuán)隊(duì)分析群眾對(duì)他的輿論和期望,由此做出符合民意的演講和宣言,并且用比對(duì)手更少的錢(qián)為他贏得這次選舉;美國(guó)的警察可以通過(guò)對(duì)以往犯罪記錄的分析,預(yù)測(cè)哪條街在哪個(gè)階段容易發(fā)生什么樣的犯罪行為從而提前部署警力做好準(zhǔn)備;醫(yī)院通過(guò)對(duì)網(wǎng)上搜索信息的頻率預(yù)測(cè)流感的到來(lái)等等。大數(shù)據(jù)可以為各個(gè)領(lǐng)域帶來(lái)價(jià)值——醫(yī)療業(yè)、農(nóng)業(yè)、金融業(yè)、制造業(yè)、媒體界、政治界等等。大數(shù)據(jù)所具有的價(jià)值是與生俱來(lái)的,但是我們得挖掘數(shù)據(jù)才能有效利用其中的價(jià)值,所以大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展是科技發(fā)展社會(huì)的必然趨勢(shì)。
(2)人類(lèi)對(duì)世界認(rèn)知的渴望
在人類(lèi)社會(huì)發(fā)展的歷程中,一般地人們主要靠搜集樣本(只涉及到局部或者片面的數(shù)據(jù))通過(guò)假設(shè)推理去發(fā)現(xiàn)事物中存在的規(guī)律,有時(shí)甚至無(wú)法得到數(shù)據(jù)而純屬根據(jù)經(jīng)驗(yàn)而去進(jìn)行研究。[8]通過(guò)這種方法得到的結(jié)論往往不準(zhǔn)確,甚至與真相完全背離。大數(shù)據(jù)時(shí)代的到來(lái)使人們有機(jī)會(huì)通過(guò)獲取全面大量系統(tǒng)的數(shù)據(jù),去尋找知識(shí)或者規(guī)律,可以使人們更加現(xiàn)實(shí)地靠近現(xiàn)象背后的真相。也可以說(shuō),人類(lèi)對(duì)世界認(rèn)知的渴望是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的本質(zhì)原因。
(1)國(guó)家級(jí)別的戰(zhàn)略產(chǎn)業(yè)
美國(guó)政府認(rèn)為數(shù)據(jù)資源是繼陸空海三大資源外的另一種重要的國(guó)家戰(zhàn)略資源,已將大數(shù)據(jù)戰(zhàn)略上升到國(guó)家層面,從2012年到現(xiàn)在為止提出了諸多促進(jìn)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的宣言和計(jì)劃。英國(guó)在頂著經(jīng)濟(jì)低迷的巨大壓力下還將大數(shù)據(jù)作為重點(diǎn)發(fā)展的科技領(lǐng)域,2013年投資1.89億英鎊用來(lái)加強(qiáng)數(shù)據(jù)采集和分析,以求在數(shù)據(jù)革命中搶占先機(jī)。同樣日本政府也提出了大力發(fā)展 IT業(yè)的發(fā)展計(jì)劃,不斷地對(duì)信息產(chǎn)業(yè)提出戰(zhàn)略規(guī)劃。世界各國(guó)也逐漸意識(shí)到大數(shù)據(jù)時(shí)代的到來(lái),紛紛建立大數(shù)據(jù)產(chǎn)業(yè)。大數(shù)據(jù)產(chǎn)業(yè)已經(jīng)發(fā)展成為了國(guó)家級(jí)別的戰(zhàn)略產(chǎn)業(yè)。[9]
(2)推動(dòng)技術(shù)和知識(shí)創(chuàng)新模式的變革
大數(shù)據(jù)時(shí)代的到來(lái)引發(fā)了探索知識(shí)模式的改變。大數(shù)據(jù)時(shí)代的海量數(shù)據(jù)給科研模式帶來(lái)了一種新的發(fā)展方向,存在于事物之間的因果關(guān)系已經(jīng)不再是科研人員進(jìn)行深度研究的必要步驟和關(guān)鍵,現(xiàn)在只需從大數(shù)據(jù)中得出有意義的相互關(guān)系,也許我們從這些相互關(guān)系中不能準(zhǔn)確知曉事物發(fā)生的原因,但是我們可以預(yù)測(cè)這件事將會(huì)發(fā)生,這個(gè)價(jià)值已經(jīng)足夠大。在企業(yè)界,一些精明的領(lǐng)導(dǎo)者們可以洞察出對(duì)大數(shù)據(jù)的應(yīng)用其實(shí)就是為了管理方式的變革。[10]在學(xué)術(shù)界,著名的第四范式的科學(xué)研究階段提出,即在人類(lèi)經(jīng)歷了經(jīng)驗(yàn)、理論、計(jì)算三個(gè)科學(xué)研究范式后進(jìn)入第四范式——數(shù)據(jù)探索。[11]
(3)推動(dòng)經(jīng)濟(jì)結(jié)構(gòu)轉(zhuǎn)型
大數(shù)據(jù)產(chǎn)業(yè)的興起加快了產(chǎn)業(yè)升級(jí)和經(jīng)濟(jì)結(jié)構(gòu)轉(zhuǎn)型的進(jìn)程。隨著大數(shù)據(jù)時(shí)代的到來(lái),部分產(chǎn)業(yè)界已經(jīng)逐漸把重點(diǎn)轉(zhuǎn)向把傳統(tǒng)產(chǎn)業(yè)和大數(shù)據(jù)產(chǎn)業(yè)相結(jié)合的發(fā)展模式。對(duì)于傳統(tǒng)工業(yè),采用大數(shù)據(jù)處理方法進(jìn)行新需求的探索和新材料的研發(fā),既可降低研發(fā)成本,又能提高新產(chǎn)品研發(fā)的準(zhǔn)確性;對(duì)于傳統(tǒng)農(nóng)業(yè),利用大數(shù)據(jù)處理方法,可以培育新品種。大數(shù)據(jù)將會(huì)帶來(lái)新一浪潮的生產(chǎn)力增長(zhǎng)和消費(fèi)者需求。[12]計(jì)算機(jī)行業(yè)也從開(kāi)始只關(guān)注運(yùn)算速度轉(zhuǎn)移到提高大數(shù)據(jù)的處理分析能力上來(lái),變成真正的信息行業(yè)。大數(shù)據(jù)時(shí)代的發(fā)展迫使軟硬件的不斷更新從而能夠推進(jìn)信息行業(yè)不斷發(fā)展,這為信息產(chǎn)業(yè)提供了又一大的發(fā)展機(jī)遇。
大數(shù)據(jù)產(chǎn)業(yè)可以為各個(gè)領(lǐng)域進(jìn)行服務(wù)。
在農(nóng)業(yè)中應(yīng)用。通過(guò)連接多個(gè)農(nóng)業(yè)數(shù)據(jù)集網(wǎng)站進(jìn)行數(shù)據(jù)搜集和專(zhuān)業(yè)的數(shù)據(jù)分析,美國(guó)農(nóng)業(yè)部可以確定農(nóng)作物最適宜的濕度、溫度、土壤、光照時(shí)間來(lái)準(zhǔn)確判斷它們是否需要澆水、打藥或者施肥。
在軍事領(lǐng)域中應(yīng)用。據(jù)調(diào)查,美國(guó)反恐組織會(huì)對(duì)打網(wǎng)游的大數(shù)據(jù)進(jìn)行分析獲得情報(bào),由于恐怖分子之間不能通過(guò)正常的手段進(jìn)行溝通,網(wǎng)游中存在另一個(gè)世界,有真實(shí)的場(chǎng)景,所以恐怖分子可以利用虛擬的網(wǎng)游世界來(lái)傳遞信息和情報(bào)。
在電視播放領(lǐng)域的應(yīng)用。通過(guò)分析每天觀眾的播放行為(前進(jìn)、暫停、播放)和評(píng)論,來(lái)預(yù)測(cè)觀眾對(duì)下期節(jié)目的期待,從而獲得高收視率。其中2013年2月份的美劇《紙牌屋》就是利用網(wǎng)友評(píng)論的大數(shù)據(jù)分析最終取得了9.9的好評(píng),在繼第一季利用大數(shù)據(jù)取得較大利益之后,《紙牌屋》第二季在2014年2月14號(hào)開(kāi)播,迅速吸引了來(lái)自世界各地的觀眾的點(diǎn)播,《紙牌屋》其制作商N(yùn)etflix的股票更是一路飆升,創(chuàng)造了巨大的利益。
在政治領(lǐng)域的應(yīng)用。我們根據(jù)大數(shù)據(jù)繪制出對(duì)中國(guó)兩會(huì)的關(guān)注程度圖,其中分析結(jié)果表明對(duì)中國(guó)兩會(huì)關(guān)注程度最大的地區(qū)是亞洲。
“智慧城市”已經(jīng)成為現(xiàn)代城市發(fā)展的方向,智慧城市的建設(shè)離不開(kāi)大數(shù)據(jù)產(chǎn)業(yè)中強(qiáng)大的技術(shù)支撐。近些年日本政府推出了以醫(yī)療衛(wèi)生電子化、教育人才電子化、各級(jí)政府政務(wù)電子化為核心的“i-japan(智慧日本)戰(zhàn)略2015”。廣東省2013年發(fā)布的城市建設(shè)規(guī)劃中也提到在2020年基本建成智慧廣東的目標(biāo)。2014年3月6日,杭州召開(kāi)“智慧城市建設(shè)”座談會(huì),提出發(fā)展智慧城市的目標(biāo)。智慧城市不僅是云計(jì)算的深度應(yīng)用,而且是大數(shù)據(jù)的綜合應(yīng)用,更是大數(shù)據(jù)產(chǎn)業(yè)的重點(diǎn)發(fā)展項(xiàng)目。
從大數(shù)據(jù)產(chǎn)業(yè)的技術(shù)層面上來(lái)講主要有以下幾個(gè)發(fā)展趨勢(shì):(1)以Hadoop MapReduce為主的處理方式將與現(xiàn)有的批處理、流處理、圖處理等其他數(shù)據(jù)處理方式并存,混合數(shù)據(jù)計(jì)算模式將成為主要處理手段。目前Hadoop已經(jīng)成為一種比較流行的數(shù)據(jù)處理方式,[13]要將Hadoop MapReduce不斷改進(jìn),增強(qiáng)其數(shù)據(jù)處理功能和兼容性;(2)更大規(guī)模的數(shù)據(jù)處理與分析,對(duì)數(shù)據(jù)實(shí)時(shí)分析的需求越來(lái)越大;(3)基于數(shù)據(jù)分析的方法多種多樣,數(shù)據(jù)分析檢測(cè)系統(tǒng)將極大地被需要;(4)數(shù)據(jù)保密技術(shù)和方法越來(lái)越完善。大數(shù)據(jù)時(shí)代,數(shù)據(jù)以驚人的速度傳播,數(shù)據(jù)泄露的幾率也在不斷增大,數(shù)據(jù)安全問(wèn)題越來(lái)越被關(guān)注。
從大數(shù)據(jù)產(chǎn)業(yè)生態(tài)系統(tǒng)來(lái)看,目前我國(guó)大數(shù)據(jù)產(chǎn)業(yè)主要是處于基礎(chǔ)設(shè)備服務(wù)階段,主要是進(jìn)行數(shù)據(jù)存儲(chǔ)和災(zāi)備的簡(jiǎn)單數(shù)據(jù)業(yè)務(wù),未來(lái)大數(shù)據(jù)產(chǎn)業(yè)將會(huì)向以數(shù)據(jù)分析產(chǎn)品和規(guī)模數(shù)據(jù)服務(wù)系統(tǒng)的方向發(fā)展。在大數(shù)據(jù)產(chǎn)業(yè)發(fā)展到一定規(guī)模,數(shù)據(jù)分析能力有極大提高時(shí),將會(huì)為企業(yè)界、政府提供規(guī)模系統(tǒng)數(shù)據(jù)服務(wù)平臺(tái),最終形成完整的大數(shù)據(jù)產(chǎn)業(yè)鏈。
(1)技術(shù)人才方面的挑戰(zhàn)
大數(shù)據(jù)時(shí)代的數(shù)據(jù)不僅僅是多,而且數(shù)據(jù)類(lèi)型多種多樣,大都是非結(jié)構(gòu)或半結(jié)構(gòu)化的數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)處理技術(shù)及設(shè)備已經(jīng)不能滿足大數(shù)據(jù)發(fā)展的要求。[14]對(duì)數(shù)據(jù)分析能力提出了挑戰(zhàn)。而且數(shù)據(jù)的實(shí)時(shí)變化,要保證數(shù)據(jù)的有效性就必須加快數(shù)據(jù)分析和應(yīng)用的能力。大數(shù)據(jù)時(shí)代,數(shù)據(jù)數(shù)量大但價(jià)值密度小。同時(shí),大數(shù)據(jù)所體現(xiàn)出來(lái)的信息不一定是真實(shí)可靠的,人為因素的故意干涉會(huì)導(dǎo)致數(shù)據(jù)失真。大數(shù)據(jù)的發(fā)展使得數(shù)據(jù)的獲取變得越來(lái)越容易,個(gè)人隱私以及安全問(wèn)題變得日益棘手。面對(duì)大數(shù)據(jù)產(chǎn)生的各種問(wèn)題,關(guān)鍵在于技術(shù)。這對(duì)技術(shù)提出了更高的要求,其根本是對(duì)人才的需求。目前號(hào)稱(chēng)21世紀(jì)最性感的職業(yè)的“數(shù)據(jù)科學(xué)家”在此之前還沒(méi)有成為一種真正的職業(yè),由此可見(jiàn)需求之急、量之大。
(2)信息壁壘的挑戰(zhàn)
大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展要依托海量的數(shù)據(jù),這些數(shù)據(jù)不僅需要自己搜集,同時(shí)要從別處獲取。各個(gè)行業(yè)的企業(yè)之間的部分信息也應(yīng)該共享,提高資源利用率。尤其要打破政府部門(mén)的信息壁壘,政府部門(mén)是大數(shù)據(jù)應(yīng)用的潛力較大的部門(mén),掌握著大量的數(shù)據(jù)。美國(guó)日本等國(guó)政府在政府信息公開(kāi)方面已經(jīng)做出了表率,2009年至今美國(guó)政府承諾的開(kāi)放政府?dāng)?shù)據(jù)庫(kù) Data.gov全面開(kāi)放了涵蓋農(nóng)業(yè)、醫(yī)療、交通、教育、金融等50個(gè)門(mén)類(lèi)的388529項(xiàng)原始數(shù)據(jù)。日本政府2013年的新ICT戰(zhàn)略實(shí)現(xiàn)行政信息全部公開(kāi)化。在數(shù)據(jù)開(kāi)放方面,中國(guó)顯然比其他國(guó)家落后很多。從企業(yè)來(lái)講,主要是沒(méi)有大數(shù)據(jù)的意識(shí),認(rèn)為數(shù)據(jù)是屬于自己的,不愿意共享,徒有數(shù)據(jù)卻不知如何把數(shù)據(jù)變成財(cái)富。在政府層面,我國(guó)政府大部分機(jī)關(guān)仍對(duì)數(shù)據(jù)封鎖不放,外界看不到更利用不了有用信息。所以打破信息壁壘是數(shù)據(jù)產(chǎn)業(yè)發(fā)展的必要過(guò)程。[15]
(1)加強(qiáng)企校研三者之間的合作
大學(xué)是人才的搖籃,大數(shù)據(jù)產(chǎn)業(yè)不僅需要專(zhuān)業(yè)的技術(shù)人才,而且需要具有經(jīng)濟(jì)分析能力和管理能力的人才??梢栽诖髮W(xué)建立大數(shù)據(jù)研究院,將大數(shù)據(jù)技術(shù)直接引入到大學(xué)的科學(xué)研究當(dāng)中。加強(qiáng)學(xué)校、企業(yè)和各研究院之間的合作,充分利用三者的資源達(dá)到共贏最終促進(jìn)大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展。比如吸引企業(yè)對(duì)學(xué)校和研究院大數(shù)據(jù)相關(guān)專(zhuān)業(yè)的投資、助學(xué);安排學(xué)生到企業(yè)進(jìn)行實(shí)地考察和研究;聘請(qǐng)企業(yè)或研究院的專(zhuān)家到學(xué)校兼職,傳授最新的科研成果和知識(shí)給學(xué)生,培養(yǎng)出與社會(huì)和企業(yè)對(duì)口的專(zhuān)業(yè)人才。
(2)配套發(fā)展相關(guān)教育培訓(xùn)產(chǎn)業(yè)
除了與高校合作獲取人才,也可以直接建立與大數(shù)據(jù)產(chǎn)業(yè)相關(guān)的教育培訓(xùn)產(chǎn)業(yè),所謂“對(duì)癥下藥”。這樣便于對(duì)企業(yè)現(xiàn)有員工知識(shí)和技能的不斷更新和提升,以順應(yīng)時(shí)代和科技的快速發(fā)展。也可以直接從外部招生,針對(duì)大數(shù)據(jù)產(chǎn)業(yè)相關(guān)技能進(jìn)行專(zhuān)業(yè)培訓(xùn),縮短大學(xué)培養(yǎng)人才的周期來(lái)滿足數(shù)據(jù)產(chǎn)業(yè)對(duì)人才的需求。
(3)加強(qiáng)國(guó)際學(xué)術(shù)交流
加強(qiáng)國(guó)際間的學(xué)術(shù)交流與溝通是加快數(shù)據(jù)產(chǎn)業(yè)技術(shù)創(chuàng)新和發(fā)展的基礎(chǔ)。通過(guò)舉辦國(guó)際學(xué)術(shù)交流活動(dòng),加強(qiáng)技術(shù)交流。在學(xué)術(shù)論文方面,各國(guó)關(guān)于大數(shù)據(jù)的最新研究和發(fā)現(xiàn)應(yīng)該進(jìn)行共享和交流。2008年,由美國(guó)雜志Nature提供的專(zhuān)刊提供了很好的交流平臺(tái),隨后在2011年 Science推出專(zhuān)刊,不斷加強(qiáng)大數(shù)據(jù)國(guó)際學(xué)術(shù)交流的機(jī)會(huì)和力度。
(4)出臺(tái)扶持政策
發(fā)展大數(shù)據(jù)產(chǎn)業(yè)最關(guān)鍵且有效的途徑是政府在大數(shù)據(jù)的應(yīng)用方面應(yīng)率先做出行動(dòng),將政府信息公開(kāi)化。以美國(guó)為首的西方發(fā)達(dá)國(guó)家已經(jīng)將數(shù)據(jù)產(chǎn)業(yè)的戰(zhàn)略上升到了國(guó)家的高度,作為一種戰(zhàn)略產(chǎn)業(yè)來(lái)發(fā)展,并且頒布了一系列關(guān)于數(shù)據(jù)產(chǎn)業(yè)發(fā)展的幫扶政策。我國(guó)目前還沒(méi)有出臺(tái)專(zhuān)門(mén)針對(duì)大數(shù)據(jù)產(chǎn)業(yè)的相關(guān)政策,缺乏大數(shù)據(jù)國(guó)家戰(zhàn)略。同時(shí)政府應(yīng)該打破信息壁壘,為大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展做出表率。例如我國(guó)測(cè)繪地理信息部門(mén)所掌握的地理信息,可以將關(guān)乎國(guó)家安全利益的一部分信息做保密處理,其他地理信息可以公布以增強(qiáng)數(shù)據(jù)資源的利用率。[16]政府不僅應(yīng)該加強(qiáng)在政策上的引導(dǎo)和支持,為這一新興產(chǎn)業(yè)提供良好的外部發(fā)展環(huán)境,同時(shí)也要加強(qiáng)資金扶持力度,為大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展提供必要的物質(zhì)保障。
[1]Jonathan Stuart Ward,Adam Barker.Undefined By Data:A Survey of Big Data Definitions[EB/OL].[2013-09-20]http://arxiv.org/abs/1309.5821.
[2]Richard L V,Carl W O,Matthew Eastwood.Big Data:What It Is and Why You Should Care[J].IDC Analyze the Future,2011(6).
[3]陶雪嬌,胡曉峰,劉洋.大數(shù)據(jù)研究綜述 [J].系統(tǒng)仿真學(xué)報(bào),2013(8):142-146.
[4]中國(guó)首個(gè)數(shù)據(jù)產(chǎn)業(yè)園區(qū)在秦皇島開(kāi)發(fā)區(qū)開(kāi)工 [J].硅谷,2010(9):18.
[5]呂愛(ài)國(guó),趙曉冬,郄少健.河北省沿海地區(qū)數(shù)據(jù)產(chǎn)業(yè)發(fā)展可行性分析 [J].中國(guó)行政管理,2012(11):115-117.
[6]Big Data,Big Impact:New Possibilities for International Devel opment[C/OL].[2012-01-24]http://www3.weforum.org/docs/WEF_TC_MFS_BigDataBigImpact_Briefing_2012.pdf.
[7]Steve Lohr.The Age Of BigData[N].The New York Times,2012-02-11.
[8]錢(qián)小聰.大數(shù)據(jù)的發(fā)展和產(chǎn)業(yè)機(jī)遇 [J].物聯(lián)網(wǎng)技術(shù),2013(10):84-86.
[9]劉小剛.國(guó)外大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展及啟示 [J].金融經(jīng)濟(jì),2013(9):224-226.
[10]AndrewMcAfee , Erik Brynjolfsson. Big data: The ManagementRevolution [J]. Harvard Business Review, 2012 (10): 60-6,68,128.
[11]羅濤.大數(shù)據(jù)產(chǎn)業(yè)的美國(guó)經(jīng)驗(yàn)與中國(guó)對(duì)策 [J].高科技與產(chǎn)業(yè)化,2013(5):54-57.
[12]James Manyika,Michael Chui,Brad Brown,et al.Big data:The next frontier for innovation,competition,and productivity[R/OL].[2011-05-20]http://www.mckinsey.com/Insights/MGI/Research/Technology_and_Innovation/Big_data_The_next_frontier_for_innovation.
[13]Herodotos Herodotou,Harold Lim,GangLuo,et al.Star fish:Aself-tuning System for Big Data Analytics[C/OL].[2011-01-09]http://x86.cs.duke.edu/~gang/documents/CIDR11_Paper36.pdf.
[14]Adam Jacobs.The pathologies of big data[J].Communications of the Acm,2009(8):36-44.
[15]高會(huì)聰,戴峰.我國(guó)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展面臨的挑戰(zhàn)及對(duì)策 [J].電子商務(wù),2013(10):19-31.
[16]牛祿青.構(gòu)建大數(shù)據(jù)產(chǎn)業(yè)環(huán)境——專(zhuān)訪中國(guó)工程院院士、中科院計(jì)算所首席科學(xué)家李國(guó)杰 [J].新經(jīng)濟(jì)導(dǎo)刊,2012(12):37-42.