申翔宇
很高興有機會給大家分享我們在數(shù)據(jù)連接和數(shù)據(jù)流通方面的思考,在數(shù)據(jù)為我所用的時代,大家開始思考如何把第一方數(shù)據(jù)、第二方數(shù)據(jù)、第三方數(shù)據(jù)同時使用起來。所有的數(shù)據(jù)都有對象,現(xiàn)在我們用得最多的是以人為對象的數(shù)據(jù)。
在使用數(shù)據(jù)的過程中,大家面臨的問題主要有兩點:第一,個人主體權利,防止個人信息未經(jīng)同意的使用;第二,數(shù)據(jù)持有人權利,防止多余信息的傳遞?;诖蠹颐媾R的問題,我們總結了目前可能碰到的三個風險難題:第一,數(shù)據(jù)安全方面,個人數(shù)據(jù)使用明文存儲,業(yè)務人員接觸非必要標識數(shù)據(jù),內部存儲數(shù)據(jù)需確權分級;第二,個人信息方面,與外界進行數(shù)據(jù)交互過程,個人信息存在泄漏風險,外部數(shù)據(jù)流通需保護個人權利;第三,商業(yè)秘密方面,向第三方獲取數(shù)據(jù)需發(fā)送客戶信息,存在商業(yè)秘密泄漏風險,對外請求數(shù)據(jù)需防止泄密。
在當前數(shù)據(jù)流轉或者數(shù)據(jù)相互使用的過程中,越來越多的數(shù)據(jù)供應方和數(shù)據(jù)需求方出現(xiàn),整個數(shù)據(jù)在相互使用的過程中呈網(wǎng)狀結構發(fā)展,網(wǎng)狀結構的數(shù)據(jù)應用的重點有三點:第一,數(shù)據(jù)標準方面,數(shù)據(jù)相互之間有共同語言;第二,安全基礎方面,賣數(shù)據(jù)和買數(shù)據(jù)的一方都有隱藏的風險和隱藏的成本,萬一發(fā)生什么事情會是一個極其嚴重的問題;第三,效率連接方面,相互使用的過程中,需要降低時間成本。
下面為大家詳細分享數(shù)據(jù)標準、安全基礎、效率連接這三方面的內容。
關于數(shù)據(jù)標準,特別是個人信息,我們把個人信息簡單歸納為關于誰的、什么樣的身份、做過什么事這三個關鍵內容。“關于誰的”是一個識別性信息,他是唯一的,比如,身份證號碼?!笆裁礃拥纳矸荨?,比如,男性、女性,北京人、上海人,這個身份是非唯一的,需要結合前面的其他信息才能識別出一個特定的人?!白鲞^什么事”是行為類,也是非唯一的,包括你的行動軌跡、你的訪問記錄、你的消費情況等,所有做過的事情,需要跟識別信息匹配組合以后,才能夠成為個人的信息。把三個內容做一個合并,我們就簡單地回到了現(xiàn)在業(yè)內大家最常用的標識信息與標簽信息結構。大家知道,單獨一份標識信息或單獨一份標簽信息并沒有特別大的危害和風險,但標識信息和標簽信息相關聯(lián),就產生了一個人的完整信息。
關于安全基礎,站在我們上海數(shù)據(jù)交易中心的角度去理解整個業(yè)務,整個數(shù)據(jù)處理的安全合規(guī),標識信息和標簽信息相關聯(lián)非常重要,二者的關聯(lián)應該是有限的、有規(guī)則的、可控的。
目前,我們上海數(shù)據(jù)交易中心在實操過程當中,主要結合了公安部的一個公民網(wǎng)絡身份服務平臺,每個人在虛擬場景下,有一個代表身份的代號。我們把這一套解決方案叫做xID生成標準,我們利用這套解決方案對標識信息和標簽信息進行識別。
xID生成標準在保護下利用個人信息,xID生成標準具有兩個作用:第一,如果相關數(shù)據(jù)進入到一個使用環(huán)節(jié),要用這份數(shù)據(jù)的時候,后面有一個配套的xID轉換算法,幫助A、B之間互相轉換,讓他們指向同一個對象,但是我們不知道這個對象具體是誰,完成這個指向關聯(lián)需要一定約束性條件和一定問責制度。比如,把一個身份證通過xID生成標準轉換機制以后,形成了需方xID、供方1-xID、供方2-xID,三個串碼都代表這個人,這些串碼起什么作用呢?假設我現(xiàn)在有一個身份證A、有一個身份證B,這是兩個對象數(shù)據(jù),如果我想拿到身份證A和身份證B的某一個標簽,這樣一個過程怎么實現(xiàn)呢?我們不能把身份證A和身份證B加上標簽簡單傳遞,這樣做的風險實在太大,相當于把個人信息直接送了過去。我們的做法是什么呢?首先,會有一套生成機制,把身份證A變成101,把B變成102,這個時候我們還不知道想要的標簽是什么,供應側告訴你101等于201,從201把xA拿回到需求方,身份證B也是同樣的道理。在這個過程中,所有關于身份證A和身份證B的身份標識都不做任何移動,身份證A和身份證B是用戶直接身份。
關于效率連接,我們上海數(shù)據(jù)交易中心總結了兩句話,一是需求方基于合法持有標識信息來發(fā)起整個數(shù)據(jù)的獲取過程,二是供應方進行xID生成標準數(shù)據(jù)公開不存在任何問題。
最后,和大家分享一下個體識別方面的法律法規(guī)?!毒W(wǎng)絡安全法》于2017年6月1日起施行,第二十二條:網(wǎng)絡產品、服務具有收集用戶信息功能的,其提供者應當向用戶明示并取得同意。第四十二條:網(wǎng)絡運營者不得泄露、篡改、毀損其收集的個人信息;未經(jīng)被收集者同意,不得向他人提供個人信息。但是,經(jīng)過處理無法識別特定個人且不能復原的除外?!蛾P于辦理侵犯公民個人信息刑事案件適用法律若干問題的解釋》于2017年6月1日起施行,第一條: “公民個人信息”,是指以電子或者其他方式記錄的能夠單獨或者與其他信息結合識別特定自然人身份或者反映特定自然人活動情況的各種信息,包括姓名、身份證件號碼、通信聯(lián)系方式、住址、賬號密碼、財產狀況、行蹤軌跡等。
(根據(jù)演講內容整理,未經(jīng)本人審核)