崔曉君
(中國信息通信研究院華東分院 上海市 200000)
大數(shù)據(jù)產(chǎn)業(yè)是新興產(chǎn)業(yè),尚無明確的統(tǒng)計口徑,大數(shù)據(jù)產(chǎn)業(yè)統(tǒng)計工作更是沒有經(jīng)驗可循[1]。為支撐大數(shù)據(jù)產(chǎn)業(yè)發(fā)展,探索建立一套科學(xué)高效的大數(shù)據(jù)產(chǎn)業(yè)統(tǒng)計系統(tǒng)尤為重要。本文著力于支撐政府決策,推動上海市大數(shù)據(jù)產(chǎn)業(yè)發(fā)展,創(chuàng)新性探索大數(shù)據(jù)產(chǎn)業(yè)統(tǒng)計制度方法,率先進行大數(shù)據(jù)產(chǎn)業(yè)統(tǒng)計系統(tǒng)的研究與設(shè)計,一方面提高產(chǎn)業(yè)主管部門統(tǒng)計工作工作效率,方便企業(yè)填報,另一方面獲得大數(shù)據(jù)產(chǎn)業(yè)基礎(chǔ)數(shù)據(jù),為決策提供數(shù)據(jù)支撐[2]。
調(diào)查上海市大數(shù)據(jù)重點企業(yè)的發(fā)展規(guī)模、關(guān)鍵技術(shù)、收益和支出等內(nèi)容,實現(xiàn)上海市大數(shù)據(jù)產(chǎn)業(yè)的數(shù)據(jù)采集、統(tǒng)計分析,支撐上海市大數(shù)據(jù)產(chǎn)業(yè)發(fā)展。
不同出發(fā)點對大數(shù)據(jù)產(chǎn)業(yè)范圍的界定結(jié)論有所不同[3],本次統(tǒng)計系統(tǒng)建設(shè)以工信部發(fā)布的《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016-2020)》中對大數(shù)據(jù)產(chǎn)業(yè)的界定為基礎(chǔ),同時結(jié)合上海市大數(shù)據(jù)產(chǎn)業(yè)的實際情況,采用重點調(diào)查的方式加以實施[4]。開展大數(shù)據(jù)企業(yè)分類模型研究(如圖1:大數(shù)據(jù)企業(yè)分類示意圖),通過企業(yè)國民經(jīng)濟分類、專利、軟著、招聘信息、經(jīng)營范圍、企業(yè)基本情況、工商數(shù)據(jù)等開展數(shù)據(jù)分析,形成大數(shù)據(jù)重點企業(yè)名錄庫,作為統(tǒng)計對象。
目前沒有專門的針對大數(shù)據(jù)產(chǎn)業(yè)的統(tǒng)計分類,而是包含在軟件與信息服務(wù)業(yè)中統(tǒng)計,本次系統(tǒng)設(shè)計需要首先進行大數(shù)據(jù)產(chǎn)業(yè)統(tǒng)計制度研究。
本次統(tǒng)計的目的是滿足政府宏觀管理決策的信息需求。統(tǒng)計指標體系的設(shè)計以此為基礎(chǔ),通過全國各地發(fā)布相關(guān)大數(shù)據(jù)政策文件視角開展研究,梳理全國各地政府宏觀決策對大數(shù)據(jù)產(chǎn)業(yè)的主要信息需求??偨Y(jié)全國各地各項大數(shù)據(jù)政策指標,同時結(jié)合上海市對于大數(shù)據(jù)產(chǎn)業(yè)發(fā)展特定的信息需求指標,對于大數(shù)據(jù)產(chǎn)業(yè)整體發(fā)展的主要衡量指標主要包括大數(shù)據(jù)產(chǎn)業(yè)總產(chǎn)值、增加值、大數(shù)據(jù)核心企業(yè)數(shù)、經(jīng)費投入、核心人才。
綜上,本次設(shè)計大數(shù)據(jù)產(chǎn)業(yè)統(tǒng)計指標共28 項,包括:
(1)期末資產(chǎn)負債(數(shù)據(jù)資產(chǎn)相關(guān)硬件原值、數(shù)據(jù)資產(chǎn)相關(guān)硬件凈值、數(shù)據(jù)資產(chǎn)相關(guān)軟件原值、數(shù)據(jù)資產(chǎn)相關(guān)軟件凈值);
(2)損益及分配(營業(yè)收入、其中:大數(shù)據(jù)業(yè)務(wù)收入、營業(yè)成本、營業(yè)利潤、所得稅費用、研發(fā)費用);
(3)人工成本及增值稅;
(4)從業(yè)人員(從業(yè)人員期末人數(shù)、從業(yè)人員平均人數(shù));
圖1:大數(shù)據(jù)企業(yè)分類模型結(jié)構(gòu)示意圖
圖2:上海市大數(shù)據(jù)產(chǎn)業(yè)統(tǒng)計工作流程圖
圖3:大數(shù)據(jù)產(chǎn)業(yè)統(tǒng)計系統(tǒng)功能模塊結(jié)構(gòu)圖
(5)研究開發(fā)人員情況(研究開發(fā)人員合計,其中:碩士及以上人員,本科人員,??萍耙韵氯藛T);
(6)研究開發(fā)產(chǎn)出及相關(guān)情況(當年專利申請數(shù)、其中:發(fā)明專利、期末有效發(fā)明專利數(shù)、發(fā)表科技論文、形成國家或行業(yè)標準);
(7)合同成交情況(大數(shù)據(jù)行業(yè)解決方案合同成交量、大數(shù)據(jù)行業(yè)解決方案合同成交額、大數(shù)據(jù)產(chǎn)品市場合同成交量、大數(shù)據(jù)產(chǎn)品市場合同成交額);
(8)其他(是否上市、是否為高新技術(shù)企業(yè))。
系統(tǒng)設(shè)計的目標是設(shè)計并開發(fā)一套滿足上海市大數(shù)據(jù)產(chǎn)業(yè)統(tǒng)計需求的軟件系統(tǒng),實現(xiàn)上海市大數(shù)據(jù)企事業(yè)(單位)的基本信息及主要財物指標數(shù)據(jù)的錄入、修改、查詢和匯總,通過軟件系統(tǒng)的設(shè)計,減輕企業(yè)和政府部門填報及統(tǒng)計工作量,提升工作效率。
此次通過統(tǒng)計系統(tǒng),開展上海市大數(shù)據(jù)產(chǎn)業(yè)統(tǒng)計工作流程包括四個主要方面(如圖2 為上海市大數(shù)據(jù)產(chǎn)業(yè)統(tǒng)計工作流程圖),即上海市各區(qū)大數(shù)據(jù)重點企業(yè)名錄庫建設(shè)、各區(qū)開展大數(shù)據(jù)重點企業(yè)專項調(diào)查工作、各區(qū)統(tǒng)計數(shù)據(jù)的初審、匯總與上報、全市大數(shù)據(jù)統(tǒng)計數(shù)據(jù)的匯總與分析。
技術(shù)體系上選用J2EE 技術(shù),采用Browser/WebServer/DataBase Server 三層結(jié)構(gòu)進行應(yīng)用系統(tǒng)的開發(fā),B/S/D 三層結(jié)構(gòu)實現(xiàn)數(shù)據(jù)與應(yīng)用邏輯分離,簡化應(yīng)用系統(tǒng)的分發(fā)、配置管理和版本管理工作。
各大數(shù)據(jù)企業(yè)通過系統(tǒng)完成填寫報送;各區(qū)縣用戶在系統(tǒng)內(nèi)及時開展數(shù)據(jù)初審,并將初審結(jié)果在系統(tǒng)內(nèi)完成提交,同時可進行本區(qū)填報數(shù)據(jù)的查詢、匯總、分析;市級用戶對報送信息進行復(fù)核,完成全市大專項統(tǒng)計調(diào)查的數(shù)據(jù)匯總和分析工作。
上海市大數(shù)據(jù)產(chǎn)業(yè)統(tǒng)計系統(tǒng)根據(jù)大數(shù)據(jù)產(chǎn)業(yè)統(tǒng)計特點(采用企業(yè)法進行統(tǒng)計/統(tǒng)計指標體系首次使用),同時滿足常規(guī)產(chǎn)業(yè)統(tǒng)計基本要求,功能設(shè)計包括數(shù)據(jù)采集/數(shù)據(jù)傳輸/綜合查詢與匯總/數(shù)據(jù)質(zhì)量管理/數(shù)據(jù)備份與恢復(fù)/系統(tǒng)管理維護六大功能系統(tǒng)模塊(圖3 為大數(shù)據(jù)產(chǎn)業(yè)統(tǒng)計系統(tǒng)功能模塊結(jié)構(gòu)圖)。
4.3.1 數(shù)據(jù)采集子系統(tǒng)
系統(tǒng)支持在線填報,提供表單式的填報界面。主要實現(xiàn)大數(shù)據(jù)企業(yè)基本信息及其主要財務(wù)指標數(shù)據(jù)、業(yè)務(wù)指標數(shù)據(jù)的錄入/修改和查詢等功能。
4.3.2 數(shù)據(jù)傳輸子系統(tǒng)
該系統(tǒng)主要完成數(shù)據(jù)的上報和接收,以實現(xiàn)數(shù)據(jù)的逐級匯總。其中數(shù)據(jù)上報操作主要用于將企業(yè)填報的數(shù)據(jù)導(dǎo)出,生成匯總數(shù)據(jù),數(shù)據(jù)的導(dǎo)出分為批量導(dǎo)出和逐項導(dǎo)出。導(dǎo)出的數(shù)據(jù)可以保存為PFD、EXCEL 和文本等格式的文件。數(shù)據(jù)接收主要用于主管導(dǎo)入企業(yè)上報上來的數(shù)據(jù),以實現(xiàn)系統(tǒng)數(shù)據(jù)的匯總功能。
4.3.3 綜合查詢與匯總子系統(tǒng)
該系統(tǒng)的功能是對匯總后的統(tǒng)計數(shù)據(jù)進行查詢、分析、匯總統(tǒng)計。系統(tǒng)支持全文檢索,可通過選定的組合條件來精確查詢和模糊查詢,并可對查詢結(jié)果進行二次漸進式查詢,逐步縮小查詢范圍。同時設(shè)計拖拽方式的可視化界面,實現(xiàn)數(shù)據(jù)的統(tǒng)計、匯總,針對數(shù)據(jù)指標展現(xiàn)與分析的要求,提供強大的圖形展現(xiàn)能力,除支持常規(guī)圖形,如:餅圖、柱狀圖、折線圖、散點圖、雷達圖、瀑布圖、玫瑰圖、氣泡圖、分區(qū)面積圖、堆積圖、卡特圖外,還支持三維圖、企業(yè)駕駛艙、交通燈、瀑布圖、工程進度圖、動態(tài)地圖(MAP),等特色圖形展現(xiàn)。同時支持將匯總統(tǒng)計的結(jié)果以文件或圖表等形式導(dǎo)出,以供使用。
4.3.4 數(shù)據(jù)質(zhì)量管理子系統(tǒng)
為了確保高質(zhì)量的統(tǒng)計數(shù)據(jù),系統(tǒng)設(shè)計從采集、上報、審核、分析的各個環(huán)節(jié)入手,建立數(shù)據(jù)質(zhì)量管理機制。首先對系統(tǒng)填報涉及的統(tǒng)計指標從名稱、統(tǒng)計口徑、計算方法進行規(guī)范,鼠標在指標上懸浮時,進行該項指標的解釋及計算方式介紹。對于上報數(shù)據(jù)系統(tǒng)自動按照設(shè)定的核查條件進行校驗,對填報空數(shù)據(jù)、異常值、失真值進行提醒,要求用戶修改或填寫備注說明情況;審核人員審核上報數(shù)據(jù),對所有異常數(shù)據(jù)進行著重排查,核對異常數(shù)據(jù)的情況說明,發(fā)現(xiàn)問題及時通過電話聯(lián)系核實情況或退回并要求填報人員重新上報,確保數(shù)據(jù)的準確性、完整性。
4.3.5 數(shù)據(jù)備份與恢復(fù)子系統(tǒng)
該系統(tǒng)功能是完成統(tǒng)計數(shù)據(jù)的備份與恢復(fù),以使系統(tǒng)的物理故障或其他不安全因素給系統(tǒng)帶來的損失降低到最低程度,保障數(shù)據(jù)的安全性。
4.3.6 系統(tǒng)管理維護子系統(tǒng)
該系統(tǒng)主要包括統(tǒng)計系統(tǒng)用戶管理、權(quán)限管理、系統(tǒng)日志管理等功能。用戶管理實現(xiàn)管理用戶和使用用戶的細度管理,包括對內(nèi)提供系統(tǒng)權(quán)限配置功能,對外提供權(quán)限驗證接口。權(quán)限管理實現(xiàn)對系統(tǒng)、功能、菜單、頁面元素、數(shù)據(jù)等不同粒度的資源的授權(quán)。系統(tǒng)日志管理實現(xiàn)用戶操作跟蹤、功能使用跟蹤。
上海市大數(shù)據(jù)產(chǎn)業(yè)統(tǒng)計系統(tǒng)已經(jīng)在上海市投入使用,2020年已完成上海市1000 余家大數(shù)據(jù)企業(yè)專項填報工作。目前系統(tǒng)運行良好,操作簡單、數(shù)據(jù)有效性檢查嚴格。該系統(tǒng)的建設(shè)和應(yīng)用,一方面為我國探索大數(shù)據(jù)產(chǎn)業(yè)統(tǒng)計方法和途徑提供了有效嘗試。另一方面可滿足上海市大數(shù)據(jù)產(chǎn)業(yè)主管部門利用數(shù)據(jù)的需要。