●山西省標(biāo)準(zhǔn)化研究院 趙紅梅
2014,大數(shù)據(jù)開啟了重大的時(shí)代轉(zhuǎn)型,“大數(shù)據(jù)”時(shí)代已然走進(jìn)了人們生活的方方面面。利用互聯(lián)網(wǎng)搜索信息,用微信、QQ維護(hù)社交關(guān)系,上網(wǎng)購(gòu)物,商業(yè)、經(jīng)濟(jì)等等產(chǎn)生的海量數(shù)據(jù)目前正在以每18個(gè)月全球信息總量翻一番的速度膨脹。預(yù)計(jì)到2020年,中國(guó)一個(gè)普通家庭一年產(chǎn)生的數(shù)據(jù)相當(dāng)于半個(gè)國(guó)家圖書館的信息儲(chǔ)量。同時(shí),隨著移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等采集數(shù)據(jù)的工具越來越多樣化,對(duì)物質(zhì)世界的描述越來越精確,擁有的數(shù)據(jù)量也越來越大,大數(shù)據(jù)的應(yīng)用正逐步滲透到各個(gè)行業(yè)和領(lǐng)域,逐漸成為重要的生產(chǎn)要素和戰(zhàn)略資源,深刻改變著人們的生產(chǎn)生活方式,在經(jīng)濟(jì)發(fā)展中發(fā)揮著重要作用。
標(biāo)準(zhǔn)是大數(shù)據(jù)時(shí)代的重要技術(shù)支撐,標(biāo)準(zhǔn)化工作是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展和應(yīng)用的重要基礎(chǔ)。運(yùn)用標(biāo)準(zhǔn)保障數(shù)據(jù)安全、推動(dòng)技術(shù)創(chuàng)新、支撐大數(shù)據(jù)領(lǐng)域產(chǎn)業(yè)、應(yīng)用和服務(wù)等有序、規(guī)?;l(fā)展是大數(shù)據(jù)時(shí)代的必然要求。
從廣義上講,大數(shù)據(jù)即海量數(shù)據(jù),是由數(shù)量巨大、結(jié)構(gòu)復(fù)雜、類型眾多的數(shù)據(jù)構(gòu)成的數(shù)據(jù)集合,是基于云計(jì)算的數(shù)據(jù)處理與應(yīng)用模式,通過數(shù)據(jù)的集成共享,交叉復(fù)用形成的智力資源和知識(shí)服務(wù)能力。
從狹義上講,“大數(shù)據(jù)”是具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn),是數(shù)據(jù)分析的前沿技術(shù)。
大數(shù)據(jù)是科技發(fā)展的產(chǎn)物,隨著金融、商業(yè)、電信、貿(mào)易、期貨等領(lǐng)域的網(wǎng)絡(luò)電子化,互聯(lián)網(wǎng)終端、移動(dòng)電話、銀行信用卡等海量數(shù)據(jù)信息出現(xiàn),各種數(shù)據(jù)庫(kù)的存儲(chǔ)出現(xiàn)了幾何級(jí)數(shù)增長(zhǎng)。按照墨菲定律,在大數(shù)據(jù)時(shí)代,每隔半年,人類積累的數(shù)據(jù)就會(huì)翻一番。我們現(xiàn)在每年生產(chǎn)的數(shù)據(jù)幾乎是人類以往五千年生產(chǎn)的數(shù)據(jù)的一倍還多。
一組名為“互聯(lián)網(wǎng)上一天”的數(shù)據(jù)告訴我們,一天之中,互聯(lián)網(wǎng)產(chǎn)生的全部數(shù)據(jù)可以刻滿1.68億張DVD;發(fā)出的郵件有2 940億封之多(相當(dāng)于美國(guó)兩年的紙質(zhì)信件數(shù)量);發(fā)出的社區(qū)帖子達(dá)200萬個(gè)(相當(dāng)于《時(shí)代》雜志770年的文字量);賣出的手機(jī)為37.8萬臺(tái),高于全球每天出生的嬰兒數(shù)量37.1萬……
截至2012年,數(shù)據(jù)量已經(jīng)從TB(1024GB=1TB)級(jí)別躍升到PB(1 024TB=1PB)、EB(1 024PB=1EB)乃至ZB(1024EB=1ZB)級(jí)別。國(guó)際數(shù)據(jù)公司(IDC)的研究結(jié)果表明,2008年全球產(chǎn)生的數(shù)據(jù)量為0.49ZB,2009年的數(shù)據(jù)量為0.8ZB,2010年增長(zhǎng)為1.2ZB,2011年的數(shù)據(jù)量更是高達(dá)1.82ZB,相當(dāng)于全球每人產(chǎn)生200GB以上的數(shù)據(jù)。而截止到2012年,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB,全人類歷史上說過的所有話的數(shù)據(jù)量大約為5EB。IBM的研究稱,整個(gè)人類文明所獲得的全部數(shù)據(jù)中,有90%是過去兩年內(nèi)產(chǎn)生的。而到了2020年,全世界所產(chǎn)生的數(shù)據(jù)規(guī)模將達(dá)到今天的44倍。
(1)數(shù)據(jù)量大。大數(shù)據(jù)的起始計(jì)量單位至少是P(1 000個(gè)T)、E(100萬個(gè)T)或Z(10億個(gè)T)。
(2)類型繁多。大數(shù)據(jù)包括網(wǎng)絡(luò)日志、音頻、視頻、圖片、地理位置信息等,多類型的數(shù)據(jù)對(duì)數(shù)據(jù)的處理能力提出了更高的要求。
(3)價(jià)值密度相對(duì)較低。隨著物聯(lián)網(wǎng)的廣泛應(yīng)用,信息感知無處不在,信息海量,但價(jià)值密度較低,如何通過強(qiáng)大的機(jī)器算法更迅速地完成數(shù)據(jù)的價(jià)值“提純”,是大數(shù)據(jù)時(shí)代亟待解決的難題。
(4)處理速度快,時(shí)效性要求高。這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘最顯著的特征。
當(dāng)前,在經(jīng)濟(jì)全球一體化的形勢(shì)下,標(biāo)準(zhǔn)作為貿(mào)易的技術(shù)基礎(chǔ)和產(chǎn)業(yè)發(fā)展的關(guān)鍵要素,對(duì)于經(jīng)濟(jì)社會(huì)發(fā)展的支撐作用日益凸顯,加強(qiáng)技術(shù)標(biāo)準(zhǔn)化研究,幫助企業(yè)共同推進(jìn)全球技術(shù)數(shù)據(jù)化標(biāo)準(zhǔn)應(yīng)用,對(duì)于大數(shù)據(jù)時(shí)代轉(zhuǎn)型具有關(guān)鍵作用。建立大數(shù)據(jù)標(biāo)準(zhǔn)體系,推進(jìn)大數(shù)據(jù)時(shí)代轉(zhuǎn)型發(fā)展勢(shì)在必行。
首先,要從數(shù)據(jù)的源頭開展標(biāo)準(zhǔn)化研究,確保數(shù)據(jù)質(zhì)量,推動(dòng)行業(yè)進(jìn)步。比如工業(yè)化大生產(chǎn)下的產(chǎn)品設(shè)計(jì),應(yīng)首要建立產(chǎn)品設(shè)計(jì)要素標(biāo)準(zhǔn)化,形成清單,并且明確使用、檢驗(yàn)的標(biāo)準(zhǔn),這樣對(duì)后期采購(gòu)、驗(yàn)收等流程都有重要意義。此外,對(duì)設(shè)計(jì)要素形成統(tǒng)一稱謂,使用標(biāo)準(zhǔn)名詞;依據(jù)不同行業(yè)的特點(diǎn)將數(shù)據(jù)按照一定的規(guī)則進(jìn)行排列管理,以方便今后的工作使用等等,通過這些對(duì)產(chǎn)品設(shè)計(jì)等數(shù)據(jù)源頭標(biāo)準(zhǔn)化的管理,實(shí)現(xiàn)產(chǎn)品的標(biāo)準(zhǔn)化生產(chǎn)制作,進(jìn)而促進(jìn)行業(yè)發(fā)展。
當(dāng)今時(shí)代,雖然網(wǎng)絡(luò)信息技術(shù)飛速發(fā)展,但零售業(yè)依然面臨各種商品、信息、格式和協(xié)議標(biāo)準(zhǔn)不統(tǒng)一的問題,由于企業(yè)在采購(gòu)、運(yùn)輸、消費(fèi)等各個(gè)環(huán)節(jié)過程中需要處理大量不同的信息,商品從生產(chǎn)出來到消費(fèi)者使用需要很長(zhǎng)的時(shí)間等待,因此,只有把相關(guān)商品數(shù)據(jù)信息標(biāo)準(zhǔn)化,統(tǒng)一數(shù)據(jù)格式和交換協(xié)議才能有效解決當(dāng)前零售業(yè)面臨的根本問題,這就更加凸顯了標(biāo)準(zhǔn)在信息化大數(shù)據(jù)時(shí)代的重要作用。建立完善商品數(shù)據(jù)信息標(biāo)準(zhǔn),對(duì)于零售業(yè)發(fā)展繁榮以及經(jīng)濟(jì)發(fā)展有著不容低估的重要意義。
應(yīng)堅(jiān)持開放原則,匯聚各方力量(包括互聯(lián)網(wǎng)企業(yè)、數(shù)據(jù)服務(wù)企業(yè)、教育、醫(yī)療等各領(lǐng)域企業(yè))參與開展大數(shù)據(jù)標(biāo)準(zhǔn)化工作。在大數(shù)據(jù)標(biāo)準(zhǔn)研制的過程中,要注重結(jié)合行業(yè)應(yīng)用、地方實(shí)際應(yīng)用和企業(yè)應(yīng)用,加強(qiáng)標(biāo)準(zhǔn)工作的試點(diǎn)、驗(yàn)證和逐步完善,提高標(biāo)準(zhǔn)的可用性。
同時(shí),在標(biāo)準(zhǔn)研制的基礎(chǔ)上,合作開展法規(guī)工作,為政府決策提供參考,做好公共技術(shù)平臺(tái)搭建,使大數(shù)據(jù)真正走向?qū)嵱?,為?shù)據(jù)“孤島”的解決提供具體方案,開展數(shù)據(jù)服務(wù)、數(shù)據(jù)評(píng)價(jià)和研究,并為數(shù)據(jù)服務(wù)方、提供方、適用方和政府監(jiān)管提供科學(xué)依據(jù)。
大數(shù)據(jù)時(shí)代是科學(xué)技術(shù)高度發(fā)展的必經(jīng)階段,同時(shí)也對(duì)人類的數(shù)據(jù)駕馭能力提出了新的挑戰(zhàn),為人們獲得更為深刻、全面的洞察能力提供了前所未有的空間與潛力。開展大數(shù)據(jù)相關(guān)技術(shù)和標(biāo)準(zhǔn)研究,更新完善數(shù)據(jù)技術(shù)架構(gòu)和路線,及時(shí)、高效地處理、反饋海量的有效數(shù)據(jù)信息,對(duì)于大數(shù)據(jù)時(shí)代轉(zhuǎn)型發(fā)展有著不可替代的重要作用。