袁紀輝
摘 ? 要:大數(shù)據(jù)的發(fā)展歷程可劃分為萌芽階段、發(fā)展階段、爆發(fā)階段和成熟階段四個階段。因依賴于堅持尊重學(xué)科發(fā)展規(guī)律、科學(xué)需求雙輪驅(qū)動、學(xué)科交叉、寬容失敗、安全保障等原則,大數(shù)據(jù)在技術(shù)維度和產(chǎn)業(yè)維度都獲得茁壯發(fā)展,后期持續(xù)在自身定位、應(yīng)用方向、數(shù)據(jù)安全、社會保障等方面深入探索。面對我國“政策支持、環(huán)境改善,應(yīng)用領(lǐng)跑、前景看好”的大數(shù)據(jù)發(fā)展現(xiàn)狀,我國應(yīng)樹立理性務(wù)實可持續(xù)的發(fā)展理念,加強基礎(chǔ)扎實創(chuàng)新多維的原創(chuàng)研究,探索網(wǎng)絡(luò)主權(quán)為綱的數(shù)據(jù)跨境模式,打造供需對接的數(shù)據(jù)共享格局,建立協(xié)同高效的數(shù)據(jù)安全保障體系,建立他律輔助自律的產(chǎn)業(yè)監(jiān)管生態(tài)。
關(guān)鍵詞:大數(shù)據(jù);網(wǎng)絡(luò)主權(quán);數(shù)據(jù)跨境
中圖分類號:D90 ? ? ? ? ?文獻標識碼:A
Abstract: The development process of big data can be divided into four stages: budding stage, developing stage, exploding stage and mature stage. Due to reliance on adherence to the principles of respect for development laws of discipline, two-wheel drive of scientific needs, interdisciplinary nature, tolerance for failure, and guarantee safety, big data has developed vigorously in both technical and industrial dimensions, and continues to explore self-position, application direction, data security, and social security in the future. Facing the status quo of big data development in China, “policy support, environmental improvement, application leadership, and promising prospects”, China should establish a rational, pragmatic and sustainable development concept, strengthen the innovative multidimensional original research with solid foundation, explore data sovereignty as the key link of cross-border data model, create a data sharing pattern of supply and demand docking, establish a coordinated and efficient data security system, and build an industrial supervision ecology with self-discipline assisting by external disciplines.
Key words: big data;internet sovereignty; data cross-border
1 引言
黨的十八大以來,習(xí)近平總書記把創(chuàng)新擺在國家發(fā)展全局的核心位置,把推進經(jīng)濟數(shù)字化作為實現(xiàn)創(chuàng)新發(fā)展的重要動能。習(xí)近平總書記強調(diào),當(dāng)前以互聯(lián)網(wǎng)、大數(shù)據(jù)、區(qū)塊鏈、人工智能為代表的新一代信息技術(shù)日新月異,給各國經(jīng)濟社會發(fā)展、國家管理、社會治理、人民生活帶來重大而深遠的影響,中國要高度重視大數(shù)據(jù)發(fā)展,要通過大數(shù)據(jù)進行產(chǎn)業(yè)創(chuàng)新、打造數(shù)字經(jīng)濟、提升國家治理水平、改善民生以及保障國家數(shù)據(jù)安全[1]。
1980年,阿爾文·托夫勒正式提出“大數(shù)據(jù)”一詞,標志著大數(shù)據(jù)學(xué)科的誕生。但是,像以往的用語創(chuàng)造者一樣,托夫勒并沒有賦予“大數(shù)據(jù)”一詞如今的豐富內(nèi)涵。20世紀90年代,大數(shù)據(jù)概念由SGI公司首席科學(xué)家John Mashey進行明確。2008年,《nature》雜志就推出了名為“大數(shù)據(jù)”的封面專欄,開始討論數(shù)據(jù)前所未有的增長速度帶來的影響這一話題。隨后,國內(nèi)外學(xué)術(shù)界展開了對大數(shù)據(jù)的研究,認為大數(shù)據(jù)是利用傳統(tǒng)數(shù)據(jù)處理應(yīng)用捕獲、管理和處理數(shù)據(jù)所耗時間超過可容忍時間的巨量數(shù)據(jù)集,對其主要討論涉及對于日益增長的數(shù)據(jù)的處理需求、科學(xué)研究中的大數(shù)據(jù)利用、利用大數(shù)據(jù)產(chǎn)生社會效益以及大數(shù)據(jù)帶來的社會影響等話題。時至今日,對大數(shù)據(jù)的討論方興未艾。
盡管對大數(shù)據(jù)的概念還未達成共識[2],但是學(xué)術(shù)界、產(chǎn)業(yè)界和政府部門已經(jīng)對大數(shù)據(jù)已經(jīng)有了基本認識,認為大數(shù)據(jù)具有規(guī)模性(volume)、多樣性(variety)、高速性(velocity)和價值性(value)等特征,具有極高的社會價值。人們對于數(shù)據(jù)本身的認知,也從簡單的處理對象開始轉(zhuǎn)變認為是一種基礎(chǔ)性資源[3]。信息傳感設(shè)備的成本降低與大規(guī)模運用促使數(shù)據(jù)集迅速增長[4],通過對數(shù)據(jù)集的分析,能夠發(fā)現(xiàn)事物之間新的關(guān)聯(lián)性,揭示公眾喜好、商業(yè)趨勢、隱藏疾病以及犯罪事實,依此可開發(fā)出滿足商業(yè)需求和社會控制需求的產(chǎn)品,改變原有社會經(jīng)濟形態(tài)。美國經(jīng)濟學(xué)家Auther 曾于 2011年預(yù)測,以大數(shù)據(jù)為核心內(nèi)涵和關(guān)鍵支撐的數(shù)字經(jīng)濟形態(tài)將有望超過人們熟知的物理經(jīng)濟[5]。
自2012年起,美、英、德、日等發(fā)達國政府紛紛發(fā)布大數(shù)據(jù)相關(guān)的綱領(lǐng)性文件,意圖通過實施大數(shù)據(jù)戰(zhàn)略改善社會生產(chǎn)力、創(chuàng)造新的經(jīng)濟社會價值,進而提升國家核心競爭力。2015年9月,我國國務(wù)院發(fā)布了《促進大數(shù)據(jù)發(fā)展行動綱要》,將發(fā)展大數(shù)據(jù)產(chǎn)業(yè)上升到我國的國家戰(zhàn)略。為了客觀認識大數(shù)據(jù)的本質(zhì)內(nèi)涵和創(chuàng)新發(fā)展,本文在簡要介紹大數(shù)據(jù)基本概念與發(fā)展歷程的基礎(chǔ)上,著重分析探討大數(shù)據(jù)的發(fā)展現(xiàn)狀和未來趨勢,試圖揭示大數(shù)據(jù)的真實面貌。很顯然,在當(dāng)下大數(shù)據(jù)蓬勃發(fā)展的歷史浪潮中如何選擇中國路徑是值得深入思考和探討。因此,本文最后就我國大數(shù)據(jù)發(fā)展態(tài)勢、存在問題和對策建議也進行了闡述。
2 大數(shù)據(jù)發(fā)展的歷程和啟示
17世紀40年代,“data(數(shù)據(jù))”一詞便在英文用語中出現(xiàn)。1946年,“data(數(shù)據(jù))”一詞首次用于表示“可傳輸和可存儲的計算機信息”。1954年,“data processing(數(shù)據(jù)處理)”這一表達方式開始使用。盡管,數(shù)據(jù)處理這一術(shù)語從20世紀50年代才開始廣泛應(yīng)用,但是人工數(shù)據(jù)處理已經(jīng)存在數(shù)千年。自從數(shù)據(jù)處理從手工處理過渡到機械自動化處理,再過渡到電子化處理時,人們普遍發(fā)現(xiàn),通過改進數(shù)據(jù)處理設(shè)備可提高數(shù)據(jù)處理效率。然而,既有數(shù)據(jù)處理設(shè)備無法滿足數(shù)據(jù)處理需求的這一事實是一種常態(tài)化現(xiàn)象,又有信息處理設(shè)別的處理和計算能力無法負荷現(xiàn)有的數(shù)據(jù)類型和數(shù)據(jù)規(guī)模這一情況也是一種普遍事實。隨著1980年以來,互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計算、三網(wǎng)融合等IT與通信技術(shù)的迅猛發(fā)展,數(shù)據(jù)處理在社會生活中變得越來越重要,無法滿足需求的數(shù)據(jù)處理能力制約著社會發(fā)展這一問題越發(fā)嚴峻,典型表現(xiàn)為數(shù)據(jù)計算需求的硬件能力超出了硬件能力增長的摩爾定律[6],這一問題受到人們的廣泛關(guān)注,人們開始逐漸將“海量的數(shù)據(jù)生產(chǎn)倒逼數(shù)據(jù)處理系統(tǒng)變革”這一現(xiàn)象稱之為大數(shù)據(jù)問題。相應(yīng)的,人們也在提升數(shù)據(jù)處理能力的過程中獲得了技術(shù)外部性帶來的收益,享受到了因處理大數(shù)據(jù)帶來的生產(chǎn)力提升和生活便捷。回顧1980年以來,近40年的大數(shù)據(jù)發(fā)展歷程,學(xué)術(shù)界、產(chǎn)業(yè)界和政府機構(gòu)可謂仁者見仁、智者見智。通常將大數(shù)據(jù)的發(fā)展歷程劃分為四個階段。
(1)大數(shù)據(jù)萌芽階段:從1980到2008年。1980年,美國著名未來學(xué)家阿爾文·托夫勒著的《第三次浪潮》書中將“大數(shù)據(jù)”稱為“第三次浪潮的華彩樂章”,正式提出“大數(shù)據(jù)”一詞的用語。在這一階段,各行各業(yè)已經(jīng)意識到,行業(yè)服務(wù)的提升需要更大量的數(shù)據(jù)處理,而且這種處理的數(shù)據(jù)量超出了當(dāng)時主存儲器、本地磁盤,甚至遠程磁盤的承載能力,呈現(xiàn)出“海量數(shù)據(jù)問題”的特征,但是由于缺少基礎(chǔ)理論研究和技術(shù)變革能力,對大數(shù)據(jù)的討論只是曇花一現(xiàn)。
(2)大數(shù)據(jù)發(fā)展階段:從2009年到2011年。在這一階段,對海量數(shù)據(jù)處理已經(jīng)成為整個社會迫在眉睫的事情,全球范圍內(nèi)開始進行大數(shù)據(jù)的研究探索和實際運用。2009年,聯(lián)合國全球脈沖項目開始利用大數(shù)據(jù)開始預(yù)測疾病爆發(fā);2009年,美國政府開始通Data.gov網(wǎng)站進行大規(guī)模的數(shù)據(jù)公開,希望以此促進數(shù)據(jù)發(fā)展;2010年,肯尼斯庫克爾發(fā)表了長達14頁的大數(shù)據(jù)專題報告,系統(tǒng)分析了當(dāng)前社會中的數(shù)據(jù)問題;2011年,麥肯錫發(fā)布了關(guān)于“大數(shù)據(jù)”的報告,正式定義了大數(shù)據(jù)的概念,引發(fā)各行各業(yè)對大數(shù)據(jù)的重新討論;2011年12月,工信部發(fā)布的物聯(lián)網(wǎng)十二五規(guī)劃將海量數(shù)據(jù)存儲、數(shù)據(jù)挖掘、圖像視頻智能分析等大數(shù)據(jù)技術(shù)正式提出。這一階段,技術(shù)進步的巨大鼓舞重新喚起了人們對于大數(shù)據(jù)的熱情,人們開始對大數(shù)據(jù)及其相應(yīng)的產(chǎn)業(yè)形態(tài)進行新一輪的探索創(chuàng)新,推動大數(shù)據(jù)走向應(yīng)用發(fā)展的新高潮。
(3)大數(shù)據(jù)爆發(fā)階段:2012年到2016年。這一階段以2012年奧巴馬政府公開發(fā)布了《大數(shù)據(jù)研究和發(fā)展倡議》為標志,大數(shù)據(jù)成為了各行各業(yè)討論的時代主題,對數(shù)據(jù)的認知更新引領(lǐng)著思維變革、商業(yè)變革和管理變革,大數(shù)據(jù)應(yīng)用規(guī)模不斷擴大。以英國發(fā)布的《英國數(shù)據(jù)能力發(fā)展戰(zhàn)略規(guī)劃》、日本發(fā)布的《創(chuàng)建最尖端IT國家宣言》、韓國提出的“大數(shù)據(jù)中心戰(zhàn)略”為代表,世界范圍內(nèi)開始針對大數(shù)據(jù)制定了相應(yīng)的戰(zhàn)略和規(guī)劃。2013年是我國大數(shù)據(jù)元年,此后以大數(shù)據(jù)為核心的產(chǎn)業(yè)形態(tài)在我國逐漸展開,并嘗試社會的各個領(lǐng)域探索與落地實踐。但是,在這一階段大數(shù)據(jù)產(chǎn)業(yè)發(fā)展良莠不齊,一些地方政府、社會企業(yè)、風(fēng)險資金,因此不切實際一窩蜂發(fā)展大數(shù)據(jù)產(chǎn)業(yè),一些別有用心的機構(gòu)則有意炒作并通過包裝大數(shù)據(jù)概念來謀取不當(dāng)利益。在此過程中,獲取數(shù)據(jù)能力薄弱、處理非結(jié)構(gòu)化數(shù)據(jù)準確率低、數(shù)據(jù)共享存在障礙等缺陷逐漸暴漏,人們開始對大數(shù)據(jù)進行質(zhì)疑。
(4)大數(shù)據(jù)成熟階段:從2017年至今。這一階段,與大數(shù)據(jù)相關(guān)的政策、法規(guī)、技術(shù)、教育、應(yīng)用等發(fā)展因素開始走向成熟,計算機視覺、語音識別、自然語言理解等技術(shù)的成熟消除了數(shù)據(jù)采集障礙,政府和行業(yè)推動的數(shù)據(jù)標準化進程逐漸展開減少了跨數(shù)據(jù)庫數(shù)據(jù)處理的阻礙,以數(shù)據(jù)共享、數(shù)據(jù)聯(lián)動、數(shù)據(jù)分析為基本形式的數(shù)字經(jīng)濟和數(shù)據(jù)產(chǎn)業(yè)蓬勃興起,市場上逐漸形成了涵蓋數(shù)據(jù)采集、數(shù)據(jù)分析、數(shù)據(jù)集成、數(shù)據(jù)應(yīng)用的完整成熟的大數(shù)據(jù)產(chǎn)業(yè)鏈,以數(shù)據(jù)利用的服務(wù)形式貫穿到生活的方方面面,有力提高了經(jīng)濟社會發(fā)展智能化水平,有效地增強了公共服務(wù)和城市管理能力。
通過總結(jié)大數(shù)據(jù)發(fā)展歷程中的經(jīng)驗和教訓(xùn),可以得到的啟示為:
(1)尊重學(xué)科發(fā)展規(guī)律是推動學(xué)科健康發(fā)展的前提??茖W(xué)技術(shù)的發(fā)展有其自身的規(guī)律,大數(shù)據(jù)學(xué)科的發(fā)展需要理論積累、技術(shù)創(chuàng)新、政策指導(dǎo)、需求指引的協(xié)同驅(qū)動。基礎(chǔ)研究的理論積累是學(xué)科可持續(xù)發(fā)展的基石,技術(shù)創(chuàng)新是大數(shù)據(jù)學(xué)科發(fā)展的驅(qū)動力,政策指導(dǎo)是大數(shù)據(jù)學(xué)科指導(dǎo)實踐的外部條件,應(yīng)用需求指引是大數(shù)據(jù)學(xué)科發(fā)展和研究創(chuàng)新的指示方向。
(2)引領(lǐng)大數(shù)據(jù)發(fā)展需要來自于科學(xué)和需求的雙輪驅(qū)動。大數(shù)據(jù)技術(shù)發(fā)展的驅(qū)動力除了知識與技術(shù)體系內(nèi)在的矛盾外,解決處理大數(shù)據(jù)難題的需求是創(chuàng)新的最大源泉與動力。比如1997年美航局就提出“模擬飛機周圍的氣流需要被處理和可視化”這樣一種數(shù)據(jù)處理需求,驅(qū)動了對于提升數(shù)據(jù)采集能力、數(shù)據(jù)存儲能力、數(shù)據(jù)處理速度的解決方案出現(xiàn)。此后,在安防監(jiān)控、身份識別、無人駕駛、互聯(lián)網(wǎng)和物聯(lián)網(wǎng)等實際應(yīng)用對數(shù)據(jù)分析需求更是帶動了大數(shù)據(jù)的技術(shù)突破。
(3)學(xué)科交叉是創(chuàng)新突破的“捷徑”。大數(shù)據(jù)研究涉及信息科學(xué)、工程科學(xué)、統(tǒng)計科學(xué)、應(yīng)用科學(xué)等,其學(xué)科產(chǎn)生本身就是不同領(lǐng)域?qū)W科交匯的結(jié)果,更在科學(xué)研究方法論上引起了學(xué)術(shù)界的重新審視。以大數(shù)據(jù)犯罪偵查、大數(shù)據(jù)產(chǎn)品銷售、大數(shù)據(jù)理財投資為代表的傳統(tǒng)行業(yè)的大數(shù)據(jù)應(yīng)用,不僅為自身行業(yè)帶來新生活力,還為大數(shù)據(jù)學(xué)科發(fā)展創(chuàng)新帶來豐富樣本和創(chuàng)新經(jīng)驗。
(4)寬容失敗應(yīng)是支持創(chuàng)新的題中應(yīng)有之義。任何學(xué)科的發(fā)展都不可能一帆風(fēng)順,任何創(chuàng)新目標的實現(xiàn)都不會一蹴而就。大數(shù)據(jù)的學(xué)科發(fā)展和產(chǎn)業(yè)應(yīng)用要求理清數(shù)據(jù)交互連接產(chǎn)生的復(fù)雜性,掌握數(shù)據(jù)冗余與缺失雙重特征引起的不確定性,駕馭數(shù)據(jù)的高速增長與交叉互連引起的涌現(xiàn)性(Emergence)[7],在這一面對復(fù)雜狀況的不確定探索進程中,創(chuàng)新失敗本是常態(tài)。
(5)安全保障是信息化產(chǎn)業(yè)發(fā)展的根基。從以數(shù)據(jù)為核心要素的信息化產(chǎn)業(yè)的發(fā)展歷程發(fā)現(xiàn),現(xiàn)階段的數(shù)據(jù)安全保障能力是拓展下一階段數(shù)據(jù)業(yè)務(wù)的基礎(chǔ)和前提。習(xí)總書記也曾在中央網(wǎng)絡(luò)安全和信息化領(lǐng)導(dǎo)小組第一次會議上指出,網(wǎng)絡(luò)安全和信息化是一體之兩翼、驅(qū)動之雙輪,沒有網(wǎng)絡(luò)安全就沒有國家安全,沒有信息化就沒有現(xiàn)代化。因此,加強基礎(chǔ)設(shè)施防護、嚴守數(shù)據(jù)安全是促進下一階段技術(shù)發(fā)展與保護國家安全的重要方面。
3 大數(shù)據(jù)的發(fā)展現(xiàn)狀與影響
自從1946年,世界上第一臺進行數(shù)據(jù)處理的計算機“ENIAC”在美國賓夕法尼亞大學(xué)誕生后,數(shù)據(jù)技術(shù)已經(jīng)經(jīng)過了70余年的發(fā)展,對于大數(shù)據(jù)的研究也接近40年。數(shù)據(jù)技術(shù),尤其是大數(shù)據(jù)技術(shù),其理論、技術(shù)和應(yīng)用都取得了重要突破,已成為推動新一輪科技和產(chǎn)業(yè)革命的驅(qū)動力,深刻影響世界經(jīng)濟、政治、軍事和社會發(fā)展,日益得到各國政府、產(chǎn)業(yè)界和學(xué)術(shù)界的高度關(guān)注。從技術(shù)維度來看,大數(shù)據(jù)技術(shù)在復(fù)雜環(huán)境數(shù)據(jù)采集、高效率低成本的大數(shù)據(jù)分布式存儲、索引查詢、數(shù)據(jù)挖掘、數(shù)據(jù)清洗、異構(gòu)數(shù)據(jù)集成以及數(shù)據(jù)可視化、社會計算以及數(shù)據(jù)平臺系統(tǒng)與應(yīng)用等方面取得突破。但是,在跨領(lǐng)域數(shù)據(jù)共享、多業(yè)務(wù)部門數(shù)據(jù)聯(lián)動以及有效地多源異構(gòu)數(shù)據(jù)分析模型建造等方面仍處于起步階段;從產(chǎn)業(yè)維度來看,大數(shù)據(jù)創(chuàng)新創(chuàng)業(yè)如火如荼,個性化服務(wù)和智能化決策產(chǎn)品層出不窮,技術(shù)和商業(yè)生態(tài)已見雛形;從社會維度來看,世界主要國家紛紛將大數(shù)據(jù)上升為國家戰(zhàn)略,相關(guān)推動大數(shù)據(jù)發(fā)展的法律法規(guī)和行業(yè)政策逐步出臺,大數(shù)據(jù)社會影響日益凸顯。
大數(shù)據(jù)技術(shù)在數(shù)據(jù)收集、存儲、分析與應(yīng)用等科學(xué)研究諸多方面取得重要進展。在數(shù)據(jù)收集上,利用爬蟲技術(shù)可以有效地提取目標網(wǎng)頁中的相關(guān)數(shù)據(jù);利用數(shù)據(jù)抽取、轉(zhuǎn)換和加載技術(shù)對不同數(shù)據(jù)源中的異構(gòu)數(shù)據(jù)抽取到臨時中間層進行清洗、轉(zhuǎn)換、集成;利用物聯(lián)網(wǎng)技術(shù)可以對結(jié)構(gòu)形態(tài)各異的海量數(shù)據(jù)進行識別、分類、管理。在數(shù)據(jù)存儲上,利用鍵值數(shù)據(jù)庫可以快速的對數(shù)據(jù)進行索引查詢;利用可擴展式數(shù)據(jù)庫可以兼容多類型數(shù)據(jù),實現(xiàn)數(shù)據(jù)的擴展;利用區(qū)塊鏈式數(shù)據(jù)庫可以有效地對數(shù)據(jù)真實性提供保障。在數(shù)據(jù)分析計算上,利用批處理框架、流處理框架、交互式計算框架和圖處理框架等計算范式挖掘潛藏在數(shù)據(jù)中的深度信息。在數(shù)據(jù)應(yīng)用上,利用文本可視化技術(shù)將數(shù)據(jù)之間的潛在模式關(guān)系形象的表示出來,更便捷的被人所認知;利用聚類分析、模型構(gòu)建、模擬實驗等應(yīng)用手段可進行科學(xué)研究、資源配置和決策評估。
大數(shù)據(jù)技術(shù)在產(chǎn)業(yè)應(yīng)用方面取得令人矚目的成績,數(shù)據(jù)滲透到社會的方方面面,逐漸成為各組織的核心資產(chǎn)。以谷歌、蘋果、臉書、亞馬遜、阿里巴巴、騰訊、京東、百度為代表的數(shù)據(jù)企業(yè)蓬勃發(fā)展,以數(shù)據(jù)為生產(chǎn)原料的圖像識別、語音識別、自動駕駛等專用人工智能領(lǐng)域也取得突破性進展。發(fā)展至今,大數(shù)據(jù)已成為諸多行業(yè)領(lǐng)域的基礎(chǔ)設(shè)施,在金融理財、輿情分析、電子政務(wù)、電子商務(wù)、支付結(jié)算、銀行保險、智慧城市建設(shè)、健康醫(yī)療、教育養(yǎng)老扶貧、市場產(chǎn)品銷售、農(nóng)業(yè)精準管理等領(lǐng)域的應(yīng)用不斷深化,成為行業(yè)發(fā)展的重要支撐。大數(shù)據(jù)產(chǎn)業(yè)已成為創(chuàng)新生態(tài)布局戰(zhàn)略高地,數(shù)據(jù)領(lǐng)域的國際競爭將日趨激烈,誰掌握數(shù)據(jù)誰掌握世界的生產(chǎn)資源,大數(shù)據(jù)上升為世界主要國家的重大戰(zhàn)略資源。
隨著大數(shù)據(jù)的深入發(fā)展和應(yīng)用的不斷普及,其社會影響日益明顯,也存在發(fā)展格局失調(diào)、產(chǎn)業(yè)分布失衡的現(xiàn)象。大數(shù)據(jù)多與金融、通信、社會管理等產(chǎn)業(yè)融合較好,有待在實體經(jīng)濟領(lǐng)域進一步深化;大數(shù)據(jù)多集中于市場分析、內(nèi)部運營等業(yè)務(wù)類型,與產(chǎn)品制造、供應(yīng)鏈管理等業(yè)務(wù)結(jié)合方式有待進一步深挖[8];產(chǎn)業(yè)地域分布與經(jīng)濟格局相近,呈現(xiàn)地域發(fā)展階段不均衡、區(qū)域分布明顯的特點。在北京、上海、廣州、深圳、杭州等數(shù)據(jù)產(chǎn)業(yè)集聚城市,產(chǎn)業(yè)鏈條已初步健全,在行業(yè)發(fā)展中占據(jù)了有利競爭點。二三線城市開始發(fā)展智慧城市工程,依托大數(shù)據(jù)、云計算技術(shù)為重要支撐,成為了上游企業(yè)的主要技術(shù)消費區(qū)。四五線城鎮(zhèn)及農(nóng)村地區(qū)還尚未具備數(shù)據(jù)企業(yè)發(fā)展的環(huán)境,目前尚為大數(shù)據(jù)企業(yè)希望開墾的沃土??傮w來講,絕大多數(shù)西部及內(nèi)陸地區(qū)與東部經(jīng)濟發(fā)達地區(qū)信息鴻溝逐漸加大,這一形式在經(jīng)濟發(fā)展表現(xiàn)上或?qū)⒊尸F(xiàn)“強者更強”的馬太效應(yīng)。
4 大數(shù)據(jù)的發(fā)展趨勢與展望
大數(shù)據(jù)經(jīng)過近40年的理論積淀、技術(shù)創(chuàng)新和應(yīng)用嘗試,突破了數(shù)據(jù)來源、處理技術(shù)、應(yīng)用條件、法律環(huán)境等制約因素,伴隨著政府和產(chǎn)業(yè)界投入的日益增長,大數(shù)據(jù)技術(shù)與實體產(chǎn)業(yè)融合將不斷加速,全球以大數(shù)據(jù)為核心支撐的數(shù)字經(jīng)濟產(chǎn)業(yè)規(guī)模在未來十年將進入蓬勃發(fā)展的黃金時期。
在自身定位上,數(shù)據(jù)技術(shù)尤其是大數(shù)據(jù)技術(shù),其理論、技術(shù)和應(yīng)用都取得了重要突破,已成為推動新一輪科技和產(chǎn)業(yè)革命的驅(qū)動力,深刻影響世界的經(jīng)濟、政治、軍事和社會發(fā)展,塑造著國際產(chǎn)業(yè)競爭格局和一個國家的國際競爭力,日益得到各國政府、產(chǎn)業(yè)界和學(xué)術(shù)界的高度關(guān)注。大數(shù)據(jù)領(lǐng)域的國際競爭將日趨激烈,世界主要發(fā)達國家紛紛把發(fā)展大數(shù)據(jù)技術(shù)作為提升國際競爭力、維護國家安全的重大戰(zhàn)略,加緊積極謀劃政策,圍繞核心技術(shù)、頂尖人才、標準規(guī)范等強化部署,力圖在新一輪國際科技競爭中掌握主導(dǎo)權(quán)。
在應(yīng)用方向上,除了科學(xué)研究、資源配置和決策評估之外,大數(shù)據(jù)還將推動人工智能的發(fā)展,有助于推動人類進入普惠型智能社會。隨著腦科學(xué)的研究突破,大量腦神經(jīng)活動可以進行感知機器進行捕捉,形成可分析的認知數(shù)據(jù),能夠更精細解析智力的神經(jīng)環(huán)路基礎(chǔ)和機制,利用數(shù)據(jù)可視化將神經(jīng)機理表示出來,形成可計算的數(shù)據(jù)模型,提升人工智能的智力水平。同時,人工智能算法在大數(shù)據(jù)驅(qū)動下對經(jīng)濟和社會各領(lǐng)域進行滲透融合,實現(xiàn)生產(chǎn)力和生產(chǎn)關(guān)系的變革,帶動人類社會邁向新的文明。
在數(shù)據(jù)安全上,各層面的數(shù)據(jù)應(yīng)用場景各異,應(yīng)用方式多元,受侵害角度不同,需進行多元化的治理方式。個人數(shù)據(jù)多與隱私相伴,常帶有個人信息屬性,治理上需側(cè)重促進信息保護,防止隱私失密。企業(yè)數(shù)據(jù)多屬于企業(yè)資產(chǎn),需從數(shù)據(jù)產(chǎn)生、采集、存儲、應(yīng)用等生產(chǎn)鏈條進行資產(chǎn)管理,從技術(shù)安全角度側(cè)重資產(chǎn)保值增值。國家機構(gòu)與社會團體需關(guān)注數(shù)據(jù)應(yīng)用產(chǎn)業(yè)鏈條的安全規(guī)范,聚焦監(jiān)管規(guī)則構(gòu)建,促進行業(yè)穩(wěn)健發(fā)展。數(shù)據(jù)跨境流動治理需從國際共識形成、跨境程序構(gòu)建、數(shù)據(jù)標準化工程建設(shè)、安全評估方案保障等角度努力。
在社會保障上,大數(shù)據(jù)的社會學(xué)研究將被提上議程。為了確保大數(shù)據(jù)的健康可持續(xù)發(fā)展并確保大數(shù)據(jù)的發(fā)展成果造福于民,需要從社會學(xué)的角度系統(tǒng)全面地研究大數(shù)據(jù)對人類社會的影響,深入分析大數(shù)據(jù)對未來經(jīng)濟社會發(fā)展的可能影響;為了促進大數(shù)據(jù)的開發(fā)和合理利用,需要從法學(xué)的角度確定數(shù)據(jù)流轉(zhuǎn)過程中的權(quán)屬關(guān)系,制定完善的數(shù)據(jù)法律法規(guī);為了保護大數(shù)據(jù)的訪問和共享對于隱私的侵害,應(yīng)當(dāng)以建設(shè)性的方式,圍繞數(shù)據(jù)隱私方面的爭議,制定強有力的原則和嚴格的規(guī)則,提供足夠的工具和系統(tǒng)支撐,規(guī)避可能風(fēng)險,確保大數(shù)據(jù)的正面效應(yīng)。
5 我國大數(shù)據(jù)的發(fā)展態(tài)勢與思考
我國當(dāng)前大數(shù)據(jù)發(fā)展的總體態(tài)勢良好,據(jù)中國信息通信研究院《大數(shù)據(jù)白皮書(2018)》公布,截至2018年2月,我國大數(shù)據(jù)產(chǎn)業(yè)規(guī)模達到4700億,核心產(chǎn)業(yè)規(guī)模達到234億,同比增長規(guī)模均超過30%。在大數(shù)據(jù)的總體水平和應(yīng)用方面,我國也處于國際前列,發(fā)展?jié)摿薮?,有望率先突破成為全球領(lǐng)跑者。但是,也需要清醒地看到,我國大數(shù)據(jù)發(fā)展存在過熱和泡沫化風(fēng)險,特別在基礎(chǔ)研究、技術(shù)體系、創(chuàng)新人才、法律規(guī)范等方面仍然存在不少問題??傮w而言,我國大數(shù)據(jù)發(fā)展現(xiàn)狀可以用“政策支持、環(huán)境改善,應(yīng)用領(lǐng)跑、前景看好”來概括。
一是政策支持。黨和國家高度重視并大力發(fā)展大數(shù)據(jù)。2014年3月,大數(shù)據(jù)首次被寫入政府工作報告,次年國務(wù)院正式發(fā)布《促進大數(shù)據(jù)發(fā)展的行動綱要》。2016年,十三五規(guī)劃綱要正式提出實施“國家大數(shù)據(jù)戰(zhàn)略”,同年12月工信部發(fā)布《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016-2020年)》,次年十九大正式提出推動大數(shù)據(jù)與實體經(jīng)濟深度融合。2017年12月8日,十九屆中共中央政治局就實施國家大數(shù)據(jù)戰(zhàn)略進行了集體學(xué)習(xí),各級國家機關(guān)與地方各級政府積極相應(yīng),我國各地已對外公布超過110份大數(shù)據(jù)相關(guān)政策文件,覆蓋31個省級行政區(qū)劃,結(jié)合自身優(yōu)勢做出相應(yīng)部署,推動自身相關(guān)大數(shù)據(jù)產(chǎn)業(yè)蓬勃發(fā)展。
二是環(huán)境改善。目前,我國大數(shù)據(jù)發(fā)展的社會環(huán)境、經(jīng)濟環(huán)境、產(chǎn)業(yè)環(huán)境逐漸契合。目前,我國數(shù)據(jù)開放制度逐漸完善,已有十余個省市依托各自的數(shù)據(jù)開放平臺公開了部分數(shù)據(jù)。截止到2018年1月,北京市開放數(shù)據(jù)平臺已開放42個政務(wù)部門18個領(lǐng)域的748個數(shù)據(jù)集,上海市也已開放12個領(lǐng)域的1564個數(shù)據(jù)集,涉及司法、信用、氣象、林業(yè)等諸多領(lǐng)域。據(jù)不完全統(tǒng)計,目前我國已有20余個省級或者地市級政府明確提出大數(shù)據(jù)產(chǎn)業(yè)發(fā)展定位,涉及多個層次,包括人才、創(chuàng)業(yè)創(chuàng)新、數(shù)據(jù)資源聚集、應(yīng)用、產(chǎn)業(yè)等多種類型。
三是應(yīng)用領(lǐng)跑。大數(shù)據(jù)技術(shù)已深入滲透到各行各業(yè),與行業(yè)的融合應(yīng)用日趨深化,驅(qū)動以數(shù)據(jù)為核心的數(shù)字經(jīng)濟蓬勃發(fā)展。根據(jù)騰訊研究院發(fā)布的《中國“互聯(lián)網(wǎng)+”指數(shù)報告(2018)》顯示,“2017年全國數(shù)字經(jīng)濟體量為26.70萬億元人民幣,較去年同期的22.77萬億元增長17.24%,數(shù)字經(jīng)濟占國內(nèi)生產(chǎn)總值(GDP)的比重由30.61%上升至32.28%”[9]。在世界上大數(shù)據(jù)技術(shù)比拼知名的Sort Benchmark大賽上,百度、阿里、騰訊先后在2014年、2015年、2016年拿下冠軍,打破了之前谷歌、雅虎、亞馬遜等國際數(shù)據(jù)企業(yè)的壟斷。2018年5月,“互聯(lián)網(wǎng)女皇”瑪麗·米克爾公開發(fā)布了2018年《互聯(lián)網(wǎng)趨勢》報告指出,世界互聯(lián)網(wǎng)排名前20的數(shù)據(jù)企業(yè)均來自于中、美兩國,其中美國有蘋果、微軟、谷歌、亞馬遜、Facebook、Netflix、eBay、Uber、Airbnb等11家公司,中國有阿里巴巴、騰訊、螞蟻金服、百度、小米、滴滴、京東、美團點評、今日頭條等9家公司,這表明我國在數(shù)據(jù)服務(wù)應(yīng)用領(lǐng)域處于領(lǐng)跑態(tài)勢。
四是前景看好。我國發(fā)展大數(shù)據(jù)具有市場規(guī)模、應(yīng)用場景、技術(shù)能力、資金投入、國家政策支持等多方面的綜合優(yōu)勢,大數(shù)據(jù)發(fā)展前景看好。隨著傳感技術(shù)、5G通訊及物聯(lián)網(wǎng)的到來,作為核心要素的數(shù)據(jù),其規(guī)模將進一步增長,數(shù)據(jù)類型將更加多元,數(shù)據(jù)價值將更加顯著。伴隨著對數(shù)據(jù)生產(chǎn)、傳遞和利用過程的精細化管理,數(shù)據(jù)標準將逐漸統(tǒng)一,數(shù)據(jù)生命周期規(guī)劃將更加科學(xué),數(shù)據(jù)應(yīng)用過程將更加高效,數(shù)據(jù)價值評估將更加準確,數(shù)據(jù)產(chǎn)業(yè)生態(tài)趨于完善。
人類社會已開始邁入數(shù)據(jù)時代,數(shù)據(jù)引領(lǐng)社會發(fā)展是大勢所趨,不可逆轉(zhuǎn)。伴隨著大數(shù)據(jù)自身的創(chuàng)新發(fā)展和向經(jīng)濟社會的全面滲透,大數(shù)據(jù)發(fā)展開始進入爆發(fā)式增長的紅利期?,F(xiàn)在是我國加強布局、收獲紅利、引領(lǐng)數(shù)據(jù)時代的重大歷史機遇期,如何在大數(shù)據(jù)蓬勃發(fā)展的浪潮中選擇好中國路徑、搶抓中國機遇、展現(xiàn)中國智慧需要深入思考。
5.1 樹立理性務(wù)實可持續(xù)的發(fā)展理念
隨著數(shù)據(jù)是新一代石油的言論興起,社會大眾陷入了對大數(shù)據(jù)的狂熱,一些地方政府、社會企業(yè)、風(fēng)險資金因此不切實際一窩蜂發(fā)展大數(shù)據(jù)產(chǎn)業(yè),一些別有用心的機構(gòu)則有意炒作并通過包裝大數(shù)據(jù)概念來謀取不當(dāng)利益。實現(xiàn)大數(shù)據(jù)在所有領(lǐng)域的滲透融合需要長期理論和技術(shù)積累,并非是一蹴而就的事情。發(fā)展大數(shù)據(jù)不能以短期牟利為目的,要充分考慮到大數(shù)據(jù)產(chǎn)業(yè)回報的周期性,充分認識到大數(shù)據(jù)滲透到傳統(tǒng)產(chǎn)業(yè)的長期性和艱巨性,理性分析行業(yè)對大數(shù)據(jù)技術(shù)的需求,審慎選擇大數(shù)據(jù)發(fā)展路徑,著重考慮“可持續(xù)發(fā)展”“透明開放”“代價可控”三原則基礎(chǔ)上,務(wù)實推進大數(shù)據(jù)發(fā)展舉措,確保大數(shù)據(jù)健康可持續(xù)發(fā)展。
5.2 加強基礎(chǔ)扎實創(chuàng)新多維的原創(chuàng)研究
大數(shù)據(jù)的社會影響將是深遠的、全方位的。工作者應(yīng)當(dāng)未雨綢繆,加強基礎(chǔ)扎實的原創(chuàng)研究,追求研究質(zhì)量而非數(shù)量,從國家安全、社會治理、就業(yè)結(jié)構(gòu)、倫理道德、隱私保護等多個維度系統(tǒng)深入研究大數(shù)據(jù)技術(shù)可能的影響,制定合理可行的應(yīng)對措施,確保大數(shù)據(jù)的正面效應(yīng)。應(yīng)大力加強大數(shù)據(jù)領(lǐng)域的科普工作,打造科技與應(yīng)用的高效對話機制和溝通平臺,為大數(shù)據(jù)的發(fā)展營造理性務(wù)實、積極健康的社會氛圍。同時,應(yīng)對標國際最高水平,建設(shè)面向未來的大數(shù)據(jù)基礎(chǔ)科學(xué)研究中心,重點發(fā)展原創(chuàng)性、基礎(chǔ)性、前瞻性、突破性的大數(shù)據(jù)科學(xué),形成具有國際影響力的大數(shù)據(jù)原創(chuàng)理論體系和應(yīng)用基地,為構(gòu)建我國自主可控的大數(shù)據(jù)技術(shù)創(chuàng)新生態(tài)提供領(lǐng)先扎實的理論支撐。
5.3 探索網(wǎng)絡(luò)主權(quán)為綱的數(shù)據(jù)跨境模式
我國是發(fā)展中國家陣容中唯一有望成為全球數(shù)據(jù)競爭中的領(lǐng)跑者,在大數(shù)據(jù)技術(shù)應(yīng)用方面走在世界前列,應(yīng)采取不同于一些國家的“經(jīng)濟壟斷主義、技術(shù)保護主義、貿(mào)易霸凌主義”路線,在尊重對方網(wǎng)絡(luò)主權(quán)的基礎(chǔ)上,盡快探索平等互利的數(shù)據(jù)跨境模式,打破數(shù)據(jù)孤島,布局構(gòu)建開放共享、普惠全球的大數(shù)據(jù)技術(shù)和應(yīng)用平臺,向數(shù)據(jù)技術(shù)落后地區(qū)輸出中國智慧,提供大數(shù)據(jù)時代的中國方案,為普惠人類命運共同體做出中國貢獻。
5.4 打造供需對接的數(shù)據(jù)共享格局
目前,我國學(xué)術(shù)界、產(chǎn)業(yè)界、行業(yè)部門在大數(shù)據(jù)發(fā)展方面各自為政的傾向比較明顯,數(shù)據(jù)資源開放共享不夠,缺少對行業(yè)資源的有效整合。麥肯錫2016年12月的一份名為《分析的時代:在大數(shù)據(jù)的世界競爭》顯示,數(shù)據(jù)割裂是大數(shù)據(jù)在很多領(lǐng)域沒有達到預(yù)期效果的重要原因。要想實實在在收獲大數(shù)據(jù)帶來的紅利,首先應(yīng)當(dāng)打破數(shù)據(jù)孤島,打造風(fēng)險共擔(dān)利益共享的數(shù)據(jù)開放體系,促進數(shù)據(jù)資源的流動性和可獲取性,推動供需對接,多頭并進深化數(shù)據(jù)應(yīng)用。在面對數(shù)據(jù)冗余、數(shù)據(jù)缺值、數(shù)據(jù)沖突等非標準化帶來的共享阻礙而尋求大數(shù)據(jù)國際標準制定時,我國應(yīng)努力掌握話語權(quán),并通過標準實施加速數(shù)據(jù)驅(qū)動經(jīng)濟社會轉(zhuǎn)型升級的進程。
5.5 建立協(xié)同高效的數(shù)據(jù)安全保障體系
數(shù)據(jù)安全保障需要技術(shù)與制度雙重發(fā)力。在技術(shù)上,加快研發(fā)感知網(wǎng)絡(luò)安全態(tài)勢技術(shù),綜合應(yīng)用漏洞挖掘技術(shù)、網(wǎng)絡(luò)攻擊技術(shù)、軟件樣本行為分析技術(shù)以及由網(wǎng)絡(luò)地址解析數(shù)據(jù)庫、網(wǎng)絡(luò)訪問日志數(shù)據(jù)庫、文件黑白名單數(shù)據(jù)庫等組成大數(shù)據(jù)系統(tǒng)與分析技術(shù),協(xié)力發(fā)展數(shù)據(jù)安全能力。同時,積極建立政府和企業(yè)網(wǎng)絡(luò)安全信息共享機制,綜合運用各方面掌握的數(shù)據(jù)資源,加強大數(shù)據(jù)挖掘分析,更好感知網(wǎng)絡(luò)安全態(tài)勢,做好風(fēng)險防范。
5.6 建立他律輔助自律的產(chǎn)業(yè)監(jiān)管生態(tài)
歷史經(jīng)驗表明,沒有監(jiān)管的行業(yè)生態(tài)終將走向衰敗。自發(fā)形成的網(wǎng)絡(luò)空間數(shù)據(jù)基礎(chǔ)設(shè)施共建模式,阻礙政府治理深度滲透到企業(yè)控制的數(shù)據(jù)領(lǐng)域,這一現(xiàn)狀促使對數(shù)據(jù)產(chǎn)業(yè)監(jiān)管應(yīng)采取以行業(yè)自律為主、政府他律為輔的監(jiān)管形式。在強調(diào)行業(yè)自律的基礎(chǔ)上,我國應(yīng)努力探求數(shù)據(jù)的權(quán)力屬性,強化數(shù)據(jù)相關(guān)法律建設(shè),吸納歐美等發(fā)達國家地區(qū)在大數(shù)據(jù)領(lǐng)域的立法經(jīng)驗,通過加強對于重要基礎(chǔ)設(shè)施和關(guān)鍵領(lǐng)域的法律監(jiān)管,努力構(gòu)建大數(shù)據(jù)產(chǎn)業(yè)安全、可控、可靠發(fā)展的生態(tài)環(huán)境。
6 結(jié)束語
把握好大數(shù)據(jù)發(fā)展的重要機遇,促進大數(shù)據(jù)產(chǎn)業(yè)健康發(fā)展,處理好數(shù)據(jù)安全、網(wǎng)絡(luò)空間治理等方面的挑戰(zhàn),是中國當(dāng)前面臨的時代課題。習(xí)總書記時常強調(diào),在保證國家數(shù)據(jù)安全的基礎(chǔ)上,努力推動以大數(shù)據(jù)為驅(qū)動的產(chǎn)業(yè)創(chuàng)新,構(gòu)建以數(shù)據(jù)為關(guān)鍵要素的數(shù)字經(jīng)濟體系,努力運用大數(shù)據(jù)提升國家治理水平,以促進保障和改善民生。大數(shù)據(jù)經(jīng)過近40年的發(fā)展,進入了創(chuàng)新突破的戰(zhàn)略機遇期和產(chǎn)業(yè)應(yīng)用的紅利收獲期,已經(jīng)對生產(chǎn)力和產(chǎn)業(yè)結(jié)構(gòu)以及經(jīng)濟形態(tài)產(chǎn)生革命性影響。但是,工作者需要看到中國與國外發(fā)達國家在大數(shù)據(jù)領(lǐng)域的差距與不足,應(yīng)當(dāng)采取理性務(wù)實的發(fā)展路徑,扎實推進基礎(chǔ)研究、技術(shù)生態(tài)、人才培養(yǎng)、規(guī)則構(gòu)建、法律規(guī)范等方面的工作,圍繞建設(shè)網(wǎng)絡(luò)強國、數(shù)字中國、智慧社會,全面實施國家大數(shù)據(jù)戰(zhàn)略,助力中國經(jīng)濟從高速增長轉(zhuǎn)向高質(zhì)量發(fā)展。
參考文獻
[1] 習(xí)近平.網(wǎng)絡(luò)安全的重要性[EB/OL]. http://guoqing.china.com.cn/2019zgxg/2019-09/16/content_75211149.html?f=pad&a=true.
[2] 程學(xué)旗,靳小龍,王元卓,郭嘉豐,張鐵贏,李國杰.大數(shù)據(jù)系統(tǒng)和分析技術(shù)綜述[J].軟件學(xué)報,2014,25(09):1889-1908.
[3] 孟小峰,慈祥.大數(shù)據(jù)管理.概念、技術(shù)與挑戰(zhàn)[J].計算機研究與發(fā)展,2013,50(01):146-169.
[4] Segaran, Toby,Hammerbacher, Jeff. Beautiful Data: The Stories Behind Elegant Data Solutions[J]. O'Reilly Media. p. 257.
[5] See Arthur WB. The second economy. 2011[EB/OL]. http://tuvalu.santafe.edu/~wbarthur/Papers/SecondEconomy.pdf.
[6] 王元卓,靳小龍,程學(xué)旗.網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望[J].計算機學(xué)報,2013,36(06):1125-1138.
[7] See Holland J.Emergence-From Chaos to Order.1998 [EB/OL]. https://www.newscientist.com/article/mg15821315-400-emergence-from-chaos-to-order-by-john-holland/ .
[8] 中國信息通信研究院.《大數(shù)據(jù)白皮書(2018)》在京發(fā)布[EB/OL].http://www.caict.ac.cn/kxyj/qwfb/bps/201804/t20180426_158555.htm.
[9] 騰訊研究院.《中國“互聯(lián)網(wǎng)+”指數(shù)報告(2018)》在京發(fā)布[EB/OL].https://www.tisi.org/5025.