劉露 楊曉雷
摘要:數據是新基建發(fā)展的“土壤”,共性基礎設施建設促進了產業(yè)間數據的密切交互,也帶來了海量化、耦合化的數據形態(tài),傳統(tǒng)“囚籠式”的數據規(guī)制方式已無法滿足新基建數據動態(tài)發(fā)展的需要。結合對數據治理現狀的多角度分析,本文提出以數據生命周期作為主線的治理框架,通過數據生命周期穿透各個治理環(huán)節(jié),提煉出數據的共性價值,為治理提供合理有效的規(guī)制路徑。還結合法律政策與技術規(guī)范,對數據的來源、傳輸、存儲、加工、應用和清理等六大數據生命周期的環(huán)節(jié)進行具體論述,并針對每一環(huán)節(jié)提出治理重點和治理思路。
關鍵詞:新基建;數據治理;信息基礎設施;人工智能;工業(yè)互聯網
中圖分類號:G311 文獻標志碼:A文章編號:1007-9092(2020)04-0059-008
2020年3月4日,中共中央政治局常務委員會召開的會議強調,要加快推進國家規(guī)劃已明確的重大工程和基礎設施建設。4月20日,國家發(fā)改委在新聞發(fā)布會上對新基建的具體內容作了明確解析,為基礎設施數字化、智能化發(fā)展釋放出巨大的產業(yè)信號,標志著信息互聯網向更深層次的產業(yè)互聯網和價值互聯網轉型。
新型基礎設施建設通過技術驅動數據,將產業(yè)作為技術賦能的對象,形成巨大的社會能力。在數字基建浪潮的推動下,從消費領域到實體經濟都將面臨一次巨大的技術變革,各行業(yè)由過去被動、條塊狀的數據平臺建設模式,升級為主動與業(yè)務結合,共同進化的有機體系化框架。但是海量數據爆發(fā),多樣化的數據形態(tài)和激增的實時處理需求也給數據產業(yè)安全帶來了巨大的挑戰(zhàn)。區(qū)別于傳統(tǒng)互聯網“盡力而為”的網絡服務架構,產業(yè)互聯網需要給予產品服務體系可靠的數據安全保證,并通過對數據的軟治理來提升對整個基礎設施的治理高度。本文從技術、立法、評價與監(jiān)管、倫理等四個角度對當前數據治理體系的現狀進行綜合分析,在此基礎上提出以數據生命周期為總線的新基建數據治理路徑,并對數據的來源、傳輸、存儲、加工、應用、清理等六大生命周期環(huán)節(jié)具體展開論述。
一、新基建背景下的數據特征
強調數據的流動與融合。融合是大數據的價值所在,在新基建數據賦能中,不同行業(yè)數據進行有效聯結,并通過數據利用與挖掘實現數據價值的最大化。多源數據的匯聚,避免了數據割裂帶來的片面決策,不同行業(yè)間的數據互補將更好地提升數據的內在價值,但對技術創(chuàng)新的同步性、產業(yè)配套的系統(tǒng)性也提出了更高的要求。
強調應用能力與平臺能力的結合。新型基礎設施建設通過“數字化”“信息化”“智能化”對傳統(tǒng)行業(yè)進行重塑,呈現數據平臺化和數據產業(yè)鏈分工細化的趨勢。共性數字基礎設施已成為各類工業(yè)數據和資源的重要載體,針對行業(yè)數據差異較大的特點,需要結合產業(yè)環(huán)境搭建產業(yè)互聯網平臺,通過區(qū)分化的數據治理思路實現行業(yè)數據價值升級。
強調數據的安全屬性。隨著信息基礎設施建設和應用的大面積開展,政治、經濟、軍事、文化、科技等活動越來越依賴于信息系統(tǒng)的輔助支撐,潛藏其中的數據危機也不斷衍生出新的安全挑戰(zhàn)。同時,隨著信息基礎設施的大規(guī)模增加,對數據的攻擊將從網絡空間延伸到更加豐富的物理空間,這就需要從終端芯片、服務器、網絡、操作系統(tǒng)和數據庫等方面建立起全方位的保護。
強調數據的社會屬性和價值屬性。數據平臺的廣泛關聯和運行形成了全新的社會運行機制,信息生產和運行模式、信息與行為的關系、社會行為模式、社會關系結構等多方面也在發(fā)生深刻的改變。數據在社會流動中擁有了價值屬性,數據的所有權、知情權、采集權、保存權、使用權以及隱私權等,也成了每個公民在大數據時代的新權益。
結合對數據特點的分析可知,新基建背景下的數據治理要更加強調數據在新時期發(fā)揮的關鍵作用,在保障數據安全的同時還要實現促流動、促融合和促發(fā)展,數據治理所涵蓋的內容已遠超過狹義上的數據安全管理。因此,面向新基建的數據治理體系建設需要實現“從點到面”,進而“從面到體”的立體化的規(guī)制和監(jiān)管。
二、數據治理的現狀與不足
(一)技術角度
技術是數據治理的執(zhí)行層面,治理的落實需要通過標準化組織建立統(tǒng)一的標準體系來進行規(guī)制。以工業(yè)互聯網為例,工信部針對總體框架發(fā)布了《工業(yè)控制系統(tǒng)信息安全防護指南》《工業(yè)控制系統(tǒng)信息安全事件應急管理工作指南》《工業(yè)控制系統(tǒng)信息安全防護能力評估工作管理辦法》和《工業(yè)控制系統(tǒng)信息安全行動計劃(2018-2020)》等指導文件劉廉如、張尼、張忠平:《工業(yè)互聯網安全框架研究》,《郵電設計技術》,2019年第4期。;中國工業(yè)互聯網產業(yè)聯盟(AII)、中國通信標準化協(xié)會(CCSA)隨后也對安全體系、防護需求、接入技術等提出了細化標準??v向上,按照行業(yè)細分電力、煤炭、水利等又有各自的行業(yè)平臺和技術標準。以煤礦業(yè)為例,現有國家標準AQ 6201-2019《煤礦安全監(jiān)控系統(tǒng)通用技術要求》;MT/T 1169-2019《礦井感應通信系統(tǒng)通用技術條件》;同時,在煤礦智能化標準制定體系中又涵蓋了國家能源局、國家煤炭協(xié)會、中國煤炭學會的19項行業(yè)標準立項王國法、杜毅博:《煤礦智能化標準體系框架與建設思路》,《煤炭科學技術》,2020年第1期。。數據治理中標準體系的復雜和龐大可見一斑。
標準體系復雜化帶來的問題具體表現如下:概念混淆,不同層面、不同組織缺乏統(tǒng)一的術語標準;缺乏跨行業(yè)的技術標準和通用的基礎標準,數據流通不暢;行業(yè)智能化水平發(fā)展迅速,行業(yè)標準指導、規(guī)范和安全要求制定流程較長,無法及時跟進;落實到基層,企業(yè)對標準執(zhí)行的能力存在著差別,執(zhí)行效果不佳等諸多問題,迫切需要技術標準層面的進一步加強和改善。
(二)立法角度
法律是根本性的社會治理手段,可為數據治理建立監(jiān)管和問責制度。從《網絡安全法》《電子商務法》《信息安全技術個人信息安全規(guī)范》《關于加強國家網絡安全標準化工作的若干意見》,到立法規(guī)劃中的《個人數據保護法》《數據安全法》《兒童個人信息網絡保護規(guī)定》《個人信息出境安全評估辦法》,再到近期十二個部門聯合發(fā)布的《網絡安全審查辦法》,我國數據立法體系正逐步趨于完善。
新基建場景下,參與到數據處理的社會角色越發(fā)豐富,法律制定需要對不同的數據安全責任主體進行區(qū)分。如信息主體要求加強對個人信息的保護;行業(yè)主體要求對合法搜集、處理信息的法律保障;數據加工主體要求對數據處理能力的保護;平臺要求對網絡交易的規(guī)范等。目前我國對數據方面的法律保護還集中在宏觀層面,面對產業(yè)鏈中越發(fā)具體的數據保護訴求,如人臉識別數據信息保護、數據平臺交易規(guī)范、流程數據保護等依舊缺乏及時的立法保護。
數據立法是數據技術與立法體系的高度融合,法律保護要恰當務實,把握數字經濟發(fā)展與治理之間的平衡,不能一味求全、求嚴,卡住數據脖子,限制社會的數字化改造活力。同時更要注重立法的可執(zhí)行性,避免類似于歐盟GDPR“被遺忘權”規(guī)范與操作脫節(jié)的情況發(fā)生。
(三)評價和監(jiān)管體系
數據治理中法律政策的執(zhí)行需要政府部門、行業(yè)組織和具備認證資質專業(yè)機構的密切配合。以2019年移動互聯網App專項治理為例:2019年1月23日,中央網信辦、工業(yè)和信息化部、公安部、市場監(jiān)管總局聯合發(fā)布《關于開展App違法違規(guī)收集使用個人信息專項治理的公告》相關認證要求中華人民共和國國家互聯網信息辦公室:《關于開展App違法違規(guī)收集使用個人信息專項治理的公告》,2019年1月25日。;同時還委托全國信息標準化技術委員會、中國消費者協(xié)會、中國互聯網協(xié)會、中國網絡空間安全協(xié)會成立“App違法違規(guī)收集使用個人信息專項治理工作組”;2019年3月,第三方認證機構中國網絡安全審查技術與認證中心中國網絡安全審查技術與認證中心(CCRC,原中國信息安全認證中心)是依據國家《網絡安全法》和國家有關強制性產品認證、網絡安全管理法規(guī),負責實施網絡安全審查和認證的專門機構。中國網絡安全審查技術與認證中心為國家市場監(jiān)督管理總局直屬事業(yè)單位,系第三方公正機構和法人實體。在業(yè)務上接受中共中央網絡安全和信息化委員會辦公室指導。為落實“公告”要求編制了《移動互聯網應用程序(App)安全認證實施規(guī)則》,并獲得市場監(jiān)督總局認證監(jiān)管司評審通過。隨后,國家市場監(jiān)督管理總局發(fā)布了該“實施規(guī)則”,規(guī)則技術驗證依據為GB/T 35273《信息安全技術個人信息安全》,認定方法為后發(fā)布的《App違法違規(guī)收集使用個人信息行為認定方法》中華人民共和國國家互聯網信息辦公室:《App違法違規(guī)收集使用個人信息行為認定方法》,2019年12月30日。。從2019年12月開始,在工業(yè)和信息化部網站上可看到由工信部通信管理局對違規(guī)App進行通告整改和下架的工作。
在實際操作中,多部門參與的監(jiān)管和評估會在一定程度上影響執(zhí)法的穩(wěn)定和可預期性。如國家發(fā)改委等十余個部門均具有關于App個人信息收集使用的行政監(jiān)管權與執(zhí)法權,帶來了多頭管理的局面,管轄權限范圍不明確,不利于執(zhí)法尺度和標準統(tǒng)一的問題邰江麗:《關于App收集個人信息實務及規(guī)范研究》,《北京航空航天大學學報(社會科學版)》,2019年第4期。。還需注意的是評價和監(jiān)管并不能僅注重事后管理,還需要通過常態(tài)化的評價與監(jiān)督方式,建立起科學完善的監(jiān)控平臺,實現主動防治。
(四)數據倫理角度
數據治理不能僅靠公權力進行維護,同時也要將治理思維體現在倫理道德監(jiān)管中。新興技術指向未來發(fā)展,技術研發(fā)還處于快速成長期,社會影響的復雜性、長期性、累積性,帶來了信息技術的“科林格里奇困境”。倫理問題將借由新基建的放大效應,給社會帶來多方面的影響。
2019年7月24日,中央全面深化改革委員會第九次會議審議通過了《國家科技倫理委員會組建方案》,開啟了我國科技倫理治理制度化的歷程。有效應對信息技術帶來的社會挑戰(zhàn),需要深入研究思考并樹立正確的道德觀、價值觀和法治觀。習近平總書記在中共中央政治局第九次集體學習時強調:“要整合多學科力量,加強人工智能相關法律、倫理、社會問題研究,建立健全保障人工智能健康發(fā)展的法律法規(guī)、制度體系、倫理道德?!?/p>
然而,近年來隱私泄露、算法歧視、信息繭房等有關數據使用的丑聞使公眾對數據使用和信息技術的信任度降低;數字經濟浪潮下的數字鴻溝導致在不同社會群體之間形成新的“權利溝”和“知識溝”,反而會阻礙社會治理能力的提升。故要正確引導公眾的數據使用方式,提倡數據使用的自由、平等、誠信和自律,積極幫助公眾適應新基建時代帶來的環(huán)境挑戰(zhàn)和勞動力市場結構變化,實現公眾數據和產業(yè)數據的價值共創(chuàng),最大程度地釋放數據紅利。
綜上可見,數字基建帶動了數據的流動和集中,隨著平臺數據價值重要性的體現,數據治理需要從問題導向向價值導向進行轉變。如何在海量數據中穿透各個運行層面,提煉出數據的共性價值,為治理提供合理有效的規(guī)制路徑,成為數據治理體系構建研究的重點。
三、以生命周期為總線的數據治理路徑
新基建數據來源多樣,處理方式多樣,所處行業(yè)和場景不斷變化。數據從其產生的原點出發(fā),會全部或者部分流經信息基礎設施的相關環(huán)節(jié),如下圖(圖1)?;A設施建設環(huán)環(huán)緊扣,傳統(tǒng)對單一行業(yè)數據或某一數據處理環(huán)節(jié)的技術規(guī)范體系或政策法律規(guī)制很難起到綜合治理的作用。
數據貫穿信息流動的生命周期,把握以數據生命周期為總線的數據治理,可以將治理思路貫穿于數據的產生、收集、流轉、加工、使用直至清理的全應用流程,在信息全鏈條中完成數據從端到端的跟蹤與管理服務。故此,有必要對數據治理流程的各個環(huán)節(jié)進行全面深入的梳理。
(一)數據來源:區(qū)分來源的差異化治理
現階段,我國的數據來源形態(tài)處于由單向應用階段向協(xié)同共享階段過渡。不同來源數據具備不同的數據規(guī)模和數據特征,在數據治理的過程中不可一概而論,而是要采用“分而治之”的思路,抓住特點,給出不同的治理思路和路徑措施。
個人數據是大數據最重要的信息來源,也是整個數據產業(yè)鏈中經濟價值最高的數據類型。在我國法律體系中,“公民個人信息”被定義為以電子或者其他方式記錄的能夠單獨或者與其他信息結合識別特定自然人身份或者反映特定自然人活動情況的各種信息,包括姓名、身份證件號碼、通信通訊聯系方式、住址、賬號密碼、財產狀況、行蹤軌跡等《最高人民法院、最高人民檢察院關于辦理侵犯公民個人信息刑事案件適用法律若干問題的解釋》第一條以《中華人民共和國網絡安全法》第七十六條規(guī)定為基礎,明確刑法第二百五十三條之一規(guī)定的“公民個人信息”。。在更廣義的定義中,個人數據可以擴大解釋范圍為個人的自然信息和行為數據的總合。不可否認,目前我國個人數據權層面法律基礎設施與配套建設尚不充分,把握個人數據收集過程中的合法公開原則、目的限制原則、最小數據原則、數據安全原則和限期存儲原則成為進一步個人信息數據收集的關鍵韓新遠:《收集、使用個人數據宜遵循五項原則》,《檢察日報》,2020年3月28日。。
政府數據作為國家基礎性、戰(zhàn)略性的數據資源已成為當代數字創(chuàng)新的重要來源,具體包含城市建設、城市健康管理統(tǒng)計監(jiān)察、服務與民生消費類數據等多方面信息,是串聯產業(yè)數據的關鍵組成部分。但由于缺乏數據開放的相應立法,許多高價值數據處于被鎖定的閑置狀態(tài)杜振華:《政府數據開放與創(chuàng)新驅動經濟增長的關系》,《首都師范大學學報(社會科學版)》,2020年第2期。。雖然廣泛開放政府數據作為重要產業(yè)數據來源、鼓勵政府數據流動已成為新型數字產業(yè)的迫切需求,但只有制定了相應的對策、建議,才可以推進政府數據工作的均衡有序發(fā)展。
行業(yè)數據是一個涵蓋內容更加豐富的數據體量。在新基建政策和技術的驅動下,工業(yè)大數據作為“智能制造”和“工業(yè)互聯網”的關鍵支撐即兩化融合的重要基礎正逐漸受到重視。制造技術和商業(yè)模式的變革將首先帶來工業(yè)大數據市場的繁榮,對于大規(guī)模工業(yè)數據的治理,需要建立分級、分權的治理方式才能對復雜的產業(yè)場景進行規(guī)范性的整合。
(二)數據傳輸:以技術為基礎,以政策為指引
“基礎設施猶如經濟社會發(fā)展的筋骨,節(jié)點布局合理、網絡密度適宜、通道運行高效、傳輸能力符合社會需要,筋骨就強健有力,對經濟社會發(fā)展的支撐就穩(wěn)固有效?!币簌i:《統(tǒng)籌推進傳統(tǒng)基建和新基建》,《人民日報》,2020年4月20日。 網絡基礎設施經常被類比于傳統(tǒng)基建中的鐵路公路建設,伴隨國家信息化建設的推進,數據網絡的信息安全保障已上升至國家網絡空間戰(zhàn)略高度。
在傳統(tǒng)理解中,網絡運營商被認為是保障數據安全傳輸的主體。但隨著信息供應鏈的日趨復雜,產業(yè)鏈也在逐步細化,設備集成商、網絡服務提供商、軟件供應商都在更大程度地參與到數據傳輸的關鍵工作中?!?G”作為新基建中數據傳輸的重頭戲,對5G的投資范圍不僅包括通信設備、網絡建設等基礎設施,還包括智能駕駛、工業(yè)互聯網、人工智能、遠程醫(yī)療、智慧城市等外延產業(yè)鏈群的同步升級。
在網絡基礎設施擴大建設后需要重新評估現有網絡政策和安全治理框架,擴大網絡安全保障范圍和重新評估并建立具備長度、深度、廣度的立體化網絡空間治理體系。網絡空間的治理涵蓋技術和政策兩個角度,行業(yè)規(guī)范組織從技術角度對設備制造商、軟件供應商、互聯網運營商,以及互聯網服務和內容提供商等所提供的服務進行技術安全保護和行為界定;同時,需要國家和政府從政策及法律法規(guī)的角度對網絡空間的生態(tài)系統(tǒng)做一整合和戰(zhàn)略性規(guī)制張彬、理查德·泰勒:《美國網絡空間治理現狀與政策(上篇)》,《通信世界》,2018年第27期。。具體見表2。
(三)數據存儲:新形態(tài)下的數據中心治理
數據存儲主要由大規(guī)模數據中心進行承載。在新基建時代數據中心的組織形態(tài)將發(fā)生巨大變化,成為促進5G、人工智能、工業(yè)互聯網、云計算等新一代信息技術發(fā)展的數據中樞和算力載體王青:《“新基建”浪潮下數據中心應該如何規(guī)劃布局?》,《人民郵電報》,2020年4月9日。。海量數據將推動數據中心向超大規(guī)模發(fā)展,對時延要求敏感的VR/AR、自動駕駛、遠程醫(yī)療等業(yè)務場景,使計算能力逐步向用戶端下沉,邊緣數據中心的需求迅猛增長??紤]自然災害、病毒攻擊等不可控因素影響(如數據的異地災備),分布式云數據中心將進行更大范圍的協(xié)同布局和整體優(yōu)化。經過調整的數據中心組織形態(tài)建設,將更好地面向新基建背景下的多場景業(yè)務需求,但是其多節(jié)點、廣分布、跨地域的形態(tài)特點,也給數據存儲的治理帶來了新的挑戰(zhàn)。
從應用需求角度看,要加強數據中心和網絡建設的協(xié)同布局。構建基于云、網、邊深度融合的算力網絡,滿足在云、網、邊之間按需分配和靈活調度計算資源、存儲資源等的需求。統(tǒng)一數據中心的技術標準,優(yōu)化網絡組織結構,從基礎能力上保障海量、異構和多樣性數據的接入,維護數據中心的物理環(huán)境、數據存儲安全和數據處理能力。由工信部牽頭組織,中國數據中心工作組(CDCC)、中國數據中心產業(yè)發(fā)展聯盟、中國數據中心技術委員會、數據中心聯盟、中國綠色數據中心推進聯盟等均正在致力于推進數據中心基礎設施的技術能力治理提升,并推出相關系列國家和行業(yè)建設標準現行數據中心相關規(guī)范有國家標準:《數據中心基礎設施運行維護標準》(GB/T 51314—2018),《數據中心設計規(guī)范》(GB 50174—2017),《互聯網數據中心工程技術規(guī)范》(GB 51195— 2016),《數據中心基礎設施施工及驗收規(guī)范》(GB 50462—2015),《計算機場地通用規(guī)范》(GB/T 2887—2011)等。。
從立法監(jiān)督角度看,結合當前分布式數據存儲的特點,尤其要加強離岸存儲數據的確權管轄。由于歷史因素和規(guī)制傳統(tǒng)的不同,各國數據規(guī)制制度存在顯著差異,數據業(yè)務的跨國提供和數據的離岸存儲帶來地域管轄上的沖突。我國大數據發(fā)展的國際環(huán)境日趨復雜、治理難度系數逐級攀高,圍繞著數據資源的跨境傳輸與數據主權、開放數據的共享利用與安全保護以及敏感數據的情報萃取與反滲透、反竊密等行為的博弈較量日趨激烈磨惟偉:《新時期我國大數據安全治理工作的“破”與“立”》,《中國信息安全》,2018年第6期。。2016年11月出臺的《網絡安全法》首次以國家法律形式明確了中國數據跨境流動的基本政策,但仍缺少明確的評估方式和評估機構。
從美國、歐盟和俄羅斯這三大數據跨境保護陣營的實施策略中,我們可以清楚地發(fā)現,國家的數據技術能力與立法的限制程度成反比。數據治理能力綜合體現為技術治理能力與政策治理能力的疊加,呈現互補的關系。數據中心的治理以保護國家數據主權作為第一需要,而數據流動價值需求次之。這種規(guī)律也為我國制定數據信息保護和管轄規(guī)范的制定提供了一定的參考價值。
(四)數據加工:對智能算法及產品的規(guī)制
數據加工是對數據價值的深度挖掘,涵蓋人工智能、數據挖掘、智能感知、智能交互等多重技術,是數據成果化實現的關鍵環(huán)節(jié)和信息技術發(fā)展的核心動能。隨著數字基礎設施建設的發(fā)展,數據傳播的內容將更具社會滲透力,數據加工的結果對人的社會化方向、內容將產生更深遠的影響。
從社會治理的維度看,人類行為正通過算法以一種全新的方式產生關聯運行,數據的社會屬性就是人類社會行為及作為行為基礎或者依據信息的表現形式和載體的數據化。人工智能應用下的信息生產和運行模式、行為決策機制、社會關系結構等多方面正在發(fā)生深刻的改變,傳統(tǒng)法律法規(guī)只能通過國家干預進行事后救濟,而技術規(guī)則則可以通過代碼進行事先預防趙蕾、曹建峰:《從“代碼即法律”到“法律即代碼”——以區(qū)塊鏈作為一種互聯網監(jiān)管技術為切入點》,《科技與法律》,2018年第5期。。
首先是對智能算法本身的規(guī)制。智能算法是“以數學形式或計算機代碼表達的意見”,但其內核和運算過程帶有不透明性和不可解釋性。同時大量數據經過算法的循環(huán)推演,又會把這種歧視傾向進一步放大或者固化,從而造成“自我實現的歧視性反饋循環(huán)”。算法歧視和算法黑盒的結果應用在社會價值的判斷中,就會直接影響到相關主體的權益,帶來現實社會中“偏見”和“歧視”的受害者。當前,對人工智能算法和相關業(yè)務規(guī)范已在不同條款中有涉及汪慶華:《怎樣對人工智能進行法律規(guī)制》,《經濟參考報》,2020年3月17日。。
其次是以智能算法為內核的智能產品法律地位,及權利義務關系問題。如人工智能創(chuàng)作成果的知識產權爭議,智能算法致第三方損害的責任承擔問題等等。以無人駕駛汽車交通肇事為例,其在刑事和民事領域的責任主體構成上與有人駕駛的機動車肇事案件需要做明確的區(qū)分。
智能算法仍具有高度的不確定性,相關數據體量龐大,相互依賴性強,影響后果的因素復雜,這種不確定性使得法律制定在事后干預措施的可控性較弱。因此,在立法層面要積極地推動人工智能責任立法以及自動駕駛、醫(yī)療機器人等相關領域的細分,充分考慮特定場合中對相互沖突的利益進行道德判斷和取舍,以及在此基礎上如何調整法律理念、制定法律規(guī)范和分配法律責任等問題。
(五)數據應用:平臺風險的管控
數據應用的治理是面向不同應用場景的數據資源再分配和數據安全管理。目前網絡和數據安全風險不斷向平臺轉移,安全形勢愈加復雜,工業(yè)互聯網正在成為網絡安全的主戰(zhàn)場,且工業(yè)大數據多涉及到民生、軍事等重大方面,工業(yè)互聯網安全已威脅到國計民生和國家發(fā)展的安全蔣融融、翁正秋、陳鐵明:《工業(yè)互聯網平臺及其安全技術發(fā)展》,《電信科學》,2020年第36期。。因此,要結合產業(yè)環(huán)境,針對行業(yè)數據差異性的特點,通過區(qū)分化的數據治理思路實現行業(yè)數據價值的升級。
技術安全保障是工業(yè)互聯網數據平臺治理的基礎,通過技術治理賦能我國工業(yè)互聯網平臺運行的數據采集、監(jiān)測、感知和預警等工作,實現工業(yè)企業(yè)數字化、網絡化、智能化的綜合應用能力提升。強調平臺數據使用安全,在防護維度上加強數據監(jiān)控和數據感知,避免工業(yè)互聯網大規(guī)模安全事件發(fā)生。國內外工業(yè)互聯網技術標準體系正在逐步建立與完善,我國信息安全標準化技術委員會、中國通信標準化協(xié)會(CCSA)等標準組織已分別著手從不同層面定義了安全防護總體要求、接入要求、檢測要求、監(jiān)測管理要求等評估標準張尼、劉廉如、田志宏:《工業(yè)互聯網安全進展與趨勢》,《廣州大學學報(自然科學版)》,2019年第3期。。
同步建立以國家政策性規(guī)章為導向,以地方指導意見為資源保障的工業(yè)互聯網平臺數據治理體系。自2015年5月國務院首次提出《智能制造2025》至2020年初,我國共頒布全國性政策法規(guī)及指導意見21項。其中與數據治理密切相關的有2019年7月26日工信部、教育部等十部委共同印發(fā)的《加強工業(yè)互聯網安全工作的指導意見》,標志著中國工業(yè)互聯網安全體系基本形成工業(yè)和信息化部:《十部門關于印發(fā)加強工業(yè)互聯網安全工作的指導意見的通知》,2019年8月28日。;2020年2月,《工業(yè)數據分類分級指南(試行)》圍繞工業(yè)數據的概念、分類分級方法、差異化管理等方面提出16條指導意見,標志著我國工業(yè)數據治理體系的建立;2020年3月,《關于推動工業(yè)互聯網加快發(fā)展的通知》具體提出工業(yè)互聯網20項舉措,信息通信管理局:《工業(yè)和信息化部辦公廳關于推動工業(yè)互聯網加快發(fā)展的通知》,2020年3月20日。 還印發(fā)了《工業(yè)互聯網企業(yè)網絡安全分類分級指南(試行)》等重要文件。從落實到地方的政策法規(guī)看,29省均具體下發(fā)了結合地域工業(yè)發(fā)展要求的地方性指導政策、實施方案及配套措施等相關意見。
(六)數據清理:不同清理需求的區(qū)分
海量數據涌入信息系統(tǒng),帶來商業(yè)價值的同時也帶來了大量的數據冗余。數據的清理可以發(fā)生在數據處理的各個環(huán)節(jié),是數據生命周期的重要組成部分,也是最容易被忽視的治理環(huán)節(jié)。2018年以后,隨著GDPR數據刪除權的提出和施行,數據清理、數據丟棄問題開始走入數據治理的視野。什么樣的數據可以被清理;哪一個數據主體有決定數據可以被刪除的權利;業(yè)務數據被刪除后,數據副本是否依舊留存;“互聯網的記憶”要維持多久,數據的清理周期是如何規(guī)定的等等,這些都成為在數據清理環(huán)節(jié)中需要解決的治理問題。數據清理按照清理目的的不同可分為下面三大類:
1.數據處理過程中的技術性剔除。數據的采集過程通常有一個或者多個數據源,而這些數據并不是系統(tǒng)可以直接處理的數據,存在噪聲數據、沖突數據以及格式問題數據,需要對臟數據進行清洗剔除、格式梳理,并根據規(guī)則進行數據轉換和數據集成。在這一部分需要結合數據的處理目的,來把握數據的業(yè)務規(guī)則、約束范圍、數據完整程度等具體指標,將不正確的數據刪除,糾正或重新估算。這一數據清理過程保證了數據的合法性、一致性、完整性和準確性,避免了數據系統(tǒng)的“垃圾進、垃圾出”的問題,是數據后續(xù)處理的基礎。
2.數據主體的主觀清理要求。參考GDPR,數據被刪除的情況大體可分為兩種:一種是以信息錯誤或無法按照約定情況處理為前提,如違法收集、利用,與第三方共享、轉讓或公開披露等;另一種是以信息已過時、不相干等有害于數據主體為前提劉學濤、李月:《大數據時代被遺忘權本土化的考量——兼以與個人信息刪除權的比較為視角》,《科技與法律》,2020年第2期。。從治理角度看,GDPR將一部分數據的管控權利交給個人用戶(即數據主體),帶來了數據刪除權利與人格權、隱私權關系的進一步討論,對新時代的個人隱私保護以及電子商務的發(fā)展將產生深遠而重大的影響張建文:《被遺忘權的場域思考及與隱私權、個人信息權的關系》,《重慶郵電大學學報(社會科學版)》,2017年第1期。。
但在具體操作方面,數據刪除權利卻帶來諸多問題。數據處理鏈條的每個步驟都是保存副本的,包括數據處理的第三方。搜索界面取消鏈接,業(yè)務的下架不代表數據的真正消失,GDPR里規(guī)定的數據不能被訪問到不代表數據在系統(tǒng)層面的真正刪除。個體數據進入系統(tǒng)中后會與大量數據進行耦合,對于指定個體數據的刪除或者遷移都給系統(tǒng)的存儲和計算帶來了巨大的技術壓力,給企業(yè)帶來高額的合規(guī)成本。因此迫切需要具體的執(zhí)行規(guī)范來進一步保障操作的合理和合規(guī)性。
3.企業(yè)數據的周期性歸檔與銷毀。該階段數據的銷毀是主動將數據從物理介質上進行徹底轉移或刪除。信息的價值會隨著時間的推移而降低,當數據不再有立即相關性后,數據企業(yè)會從生產系統(tǒng)中清除掉使用率低的數據,降低擁有成本。在企業(yè)要保證數據的銷毀不能與政府條例和法律法規(guī)相違背,且與在訴的爭議性數據無關的前提下,數據的歸檔與銷毀需要企業(yè)或者行業(yè)制度分級分類地對數據保存時間、處理周期、銷毀方式和歸檔封存等情況做統(tǒng)一要求。信息時效性是企業(yè)數據周期性管理的重要指標,企業(yè)或者行業(yè)組織應建立明確、科學的數據回收和銷毀規(guī)則。
四、結論與建議
治理數據如同治水,面對數據的高流動性,要站在新基建打造產業(yè)發(fā)展的視角予以全面的、系統(tǒng)化的考慮,找出數據生命周期的治理總線,突出端到端的流程把控,從傳統(tǒng)“囚籠式管控”轉向伴隨數據流動“主動防治”的動態(tài)思維的方式。
在技術防御上,要建立常態(tài)化的合規(guī)制度,結合數據的生命周期階段,動態(tài)地評估數據的安全問題,建立預警、響應及處理機制。在政策和立法方面,數據治理手段可以具體化,但不能片面化,要遵循數據生命周期發(fā)展的客觀路徑,體現前后的關聯性,保證技術上可以落地執(zhí)行。要以數據價值為導向,以產業(yè)應用場景為抓手,以保障數據安全為目標,實現信息技術與管控流程的深度整合,從而達到數據治理與數字經濟發(fā)展的平衡態(tài)。
(責任編輯:胡曉慧)