張貝貝
xID標(biāo)記技術(shù)組合了上海數(shù)據(jù)交易中心的數(shù)據(jù)流通技術(shù)與公安部第三研究所的eID技術(shù)。利用數(shù)據(jù)分類規(guī)則、不可逆匿名化生成與轉(zhuǎn)化、傳輸控制等多項技術(shù),保證了數(shù)據(jù)流通過程中的數(shù)據(jù)標(biāo)識(ID)的安全性。
數(shù)據(jù)已成為國家基礎(chǔ)性戰(zhàn)略資源,大數(shù)據(jù)時代,個人信息的非法收集和利用以及無處不在的數(shù)據(jù)監(jiān)控給公民的信息隱私帶來巨大威脅。在數(shù)據(jù)資源的開發(fā)與利用成為潮流的今天,必須謹(jǐn)慎地設(shè)計信息隱私保護(hù)的路徑,以期達(dá)到信息自由與隱私保護(hù)的平衡。而在不同領(lǐng)域,數(shù)據(jù)流通、隱私保護(hù)等都應(yīng)該通過何種手段進(jìn)行保障呢?
上海數(shù)據(jù)交易中心運營經(jīng)理王潤垠認(rèn)為,自從大數(shù)據(jù)概念誕生以來,數(shù)據(jù)安全和隱私保護(hù)問題一直如影隨形。尤其是在金融風(fēng)控、互聯(lián)網(wǎng)精準(zhǔn)營銷等涉及與“個人信息”相關(guān)數(shù)據(jù)的場景下,人們更加擔(dān)心出現(xiàn)隱私泄露、財產(chǎn)被盜等問題。如果數(shù)據(jù)流通過程中個人信息安全問題得不到解決,必將阻礙大數(shù)據(jù)產(chǎn)業(yè)未來向更廣闊的領(lǐng)域發(fā)展。
xID標(biāo)記技術(shù)應(yīng)運而生
在數(shù)據(jù)流通與隱私安全保護(hù)如此急需的大數(shù)據(jù)時代,xID標(biāo)記技術(shù)應(yīng)運而生。據(jù)介紹,xID標(biāo)記技術(shù)是實現(xiàn)個人信息合規(guī)存儲、合規(guī)流通的底層數(shù)據(jù)安全保護(hù)技術(shù)。該技術(shù)是上海數(shù)據(jù)交易中心與公安部第三研究所聯(lián)合研制,能實現(xiàn)與個人信息相關(guān)數(shù)據(jù)合規(guī)存儲與流通的各類應(yīng)用場景。
具體來看,xID這項技術(shù)是如何來實現(xiàn)數(shù)據(jù)安全保護(hù)的呢?從技術(shù)方面理解,xID標(biāo)記技術(shù)將個人信息分解為“標(biāo)識信息”“特征信息”以及“標(biāo)識關(guān)聯(lián)性”三個基本元素。“標(biāo)識信息”進(jìn)行多方隔離的去身份匿名化處理,“標(biāo)識關(guān)聯(lián)性”進(jìn)行可信第三方控制,并且保留“特征信息”,實現(xiàn)了在保護(hù)中流通個人信息的難點問題。這些達(dá)到了既能保護(hù)個人隱私,又能提供價值信息的數(shù)據(jù)流通目標(biāo)。
從實際的應(yīng)用來看,王潤垠舉例道:“比如我本人有身份證,身份證號碼就是我的數(shù)據(jù)標(biāo)識,我本人的性別、家庭地址、學(xué)歷甚至包括在互聯(lián)網(wǎng)線上的一些消費傾向、興趣愛好等,這些都是我的個人特征信息。
此外,還有一個元素就是關(guān)聯(lián)性。我這個身份證號和這個人具體的特征信息形成關(guān)聯(lián)性。而數(shù)據(jù)保護(hù)要做的是將就身份證號碼的具體信息進(jìn)行加密變成一個代號A,這樣一來,后面的那些特征描述就不會對準(zhǔn)某一個個人,泄露A1這個人的一些行為特征。這里需要強(qiáng)調(diào)的是,A1這個代號不能再還原成具體的身份證號碼。也就是說,這個加密的手段和算法是不可逆的。這樣才能符合數(shù)據(jù)合規(guī)的存儲要求,也對數(shù)據(jù)隱私與保護(hù)提供了有力的保障?!?/p>
據(jù)了解,在數(shù)據(jù)流通領(lǐng)域,對個人信息保護(hù)的技術(shù)處理一般采取“去標(biāo)識化”,但是由于各方普遍使用標(biāo)準(zhǔn)化的統(tǒng)一的“去標(biāo)識化”算法(例如MD5或SM3等算法),使得相同個人標(biāo)識在各個機(jī)構(gòu)的匿名化結(jié)果相同,結(jié)果是匿名化的作用與意義被削弱。并且,目前市場數(shù)據(jù)流通方式是兩方參與(需求方與供應(yīng)方),存在供應(yīng)方知曉需求方商業(yè)秘密的問題。沒有第三方參與的數(shù)據(jù)流通,缺少了判斷數(shù)據(jù)交易主體間的合規(guī)性的獨立中間方,使得數(shù)據(jù)交易合規(guī)流動遇到了較大的障礙。
舉例來說,如果一套算法,可把某身份證號匿名化為A1,因為供需方的生成算法是相同的,參與數(shù)據(jù)流通的各方都會把某個身份證號轉(zhuǎn)換成A1的符號,那么從根本上就沒有起到數(shù)據(jù)保護(hù)和隔離的作用。具體到銀行風(fēng)控業(yè)務(wù)中,銀行需把需查詢的數(shù)據(jù)標(biāo)識發(fā)給征信公司,例如,有A1-A1000這樣1000個數(shù)據(jù)信息,但是征信公司的數(shù)據(jù)量并沒有達(dá)到等量的驗證,可能只有500個,那么這些數(shù)據(jù)供應(yīng)方包括征信公司,通過幫助銀行校驗的過程積累著需求方的數(shù)據(jù),補(bǔ)充自己的數(shù)據(jù)維度。另一方面,這些個人信息有可能會被泄露出去。
對此,王潤垠介紹,xID標(biāo)記技術(shù)組合了數(shù)據(jù)分類規(guī)則、不可逆標(biāo)記生成、傳輸控制等多項技術(shù),使得交易數(shù)據(jù)無法識別個體且不能復(fù)原個人信息,形成的無特定標(biāo)識的個體標(biāo)記數(shù)據(jù),即“去標(biāo)識數(shù)據(jù)”。
同時,基于真實應(yīng)用場景,在數(shù)據(jù)流通規(guī)則控制下,在線實現(xiàn)數(shù)據(jù)的合規(guī)按需獲取。為數(shù)據(jù)流通領(lǐng)域中的個人信息提供完整保護(hù)和安全利用的解決方案,為個人信息安全保駕護(hù)航。
xID助力數(shù)字經(jīng)濟(jì)發(fā)展
綜合來看,上海數(shù)據(jù)交易中心的交易平臺結(jié)合xID標(biāo)記技術(shù)的數(shù)據(jù)流通運營生態(tài)網(wǎng)絡(luò)的出現(xiàn),為個人信息的數(shù)據(jù)合規(guī)治理提供了解決方案。通過xID標(biāo)記技術(shù)的數(shù)據(jù)流通運營生態(tài)網(wǎng)絡(luò),既實現(xiàn)了各方個人相關(guān)標(biāo)識信息的隔離,又可在法律合規(guī)范圍內(nèi)實現(xiàn)數(shù)據(jù)流通,為數(shù)字經(jīng)濟(jì)發(fā)展提供了安全、有序、合規(guī)、可控的底層安全保障技術(shù)。
目前,按照客戶實際的反饋,銀行在業(yè)務(wù)過程中存有海量的針對個人的金融數(shù)據(jù),對數(shù)據(jù)安全管理的要求非常高。
xID標(biāo)記技術(shù)首先可以幫助銀行解決數(shù)據(jù)存儲的安全合規(guī)問題。銀行可利用xID標(biāo)記技術(shù)將個人信息中隱私等級較高的標(biāo)識(姓名、身份證號、銀行卡號、手機(jī)號等)轉(zhuǎn)換,實現(xiàn)內(nèi)部數(shù)據(jù)分級管理的機(jī)制。存有個人隱私信息的數(shù)據(jù)作為機(jī)密數(shù)據(jù)管理。同時,經(jīng)xID處理后,不可識別具體標(biāo)識信息的數(shù)據(jù)作為普通管理等級數(shù)據(jù)處理。
“在金融獲客與風(fēng)險控制等銀行常見的業(yè)務(wù)場景中,需要通過外部數(shù)據(jù)查詢的方式補(bǔ)充數(shù)據(jù),在此過程中,可以通過上海數(shù)據(jù)交易中心數(shù)據(jù)合規(guī)流通網(wǎng)絡(luò)進(jìn)行客戶數(shù)據(jù)維度的補(bǔ)全。在流通過程中,所有與個人隱私相關(guān)的敏感數(shù)據(jù)標(biāo)識均通過xID進(jìn)行流通,確保數(shù)據(jù)獲取的合規(guī)性與合法性?!蓖鯘欅髲?qiáng)調(diào)。
就銀行業(yè)一個應(yīng)用場景來說,中國目前有300多家銀行與保險公司等金融機(jī)構(gòu),相關(guān)數(shù)據(jù)服務(wù)公司數(shù)以千記。金融業(yè)數(shù)據(jù)合規(guī)流通具有巨大的市場規(guī)模與應(yīng)用價值。
那么,除了金融行業(yè)的一些用戶,其他領(lǐng)域的數(shù)據(jù)保護(hù)和流通,xID能否發(fā)揮作用呢?
對此,王潤垠談道,在互聯(lián)網(wǎng)行業(yè),會通過人群畫像進(jìn)行數(shù)據(jù)分析,維度越全越好,但是人群畫像、行為分析也與數(shù)據(jù)標(biāo)識相關(guān),比如運營商內(nèi)部有手機(jī)號相關(guān)聯(lián)的這個人的手機(jī)使用數(shù)據(jù)及信息。
銀行、保險等金融公司有銀行卡下面的刷卡記錄分析出這張卡相關(guān)的信息。但是,要實現(xiàn)手機(jī)號與銀行卡關(guān)聯(lián),需要多個行業(yè)之間關(guān)鍵數(shù)據(jù)的打通,如果采用直接數(shù)據(jù)關(guān)聯(lián),存在法律合規(guī)性與商業(yè)機(jī)密等阻礙,較難實現(xiàn)。如果采用xID技術(shù)的三方數(shù)據(jù)流通,可在不同的數(shù)據(jù)源之間建立既隔離又關(guān)聯(lián)的數(shù)據(jù)服務(wù),多維數(shù)據(jù)融合就有可能實現(xiàn),可以最大范圍的整合數(shù)據(jù)資源。從行業(yè)應(yīng)用層面來說,就能夠更清晰、精準(zhǔn)的實現(xiàn)人群畫像。
總體來看,無論是在哪個行業(yè)的深挖和深耕,xID標(biāo)記技術(shù)從本質(zhì)上可實現(xiàn)以下兩種數(shù)據(jù)安全保護(hù)服務(wù),幫助企業(yè)提升數(shù)據(jù)安全管理能力:
1.合規(guī)存儲。結(jié)合公安部eID(公民網(wǎng)絡(luò)電子身份標(biāo)識)算法與上海數(shù)據(jù)交易中心的成員管理體系,為企業(yè)提供具有唯一性的個人標(biāo)識信息的匿名化處理服務(wù)。
2.合規(guī)流通。利用上海數(shù)據(jù)交易中心的數(shù)據(jù)流通技術(shù),為企業(yè)間需要流通的信息提供數(shù)據(jù)標(biāo)識的關(guān)聯(lián)性服務(wù)。
通過xID標(biāo)記技術(shù)的研發(fā)以及應(yīng)用,實現(xiàn)對個人信息的保護(hù),其核心意義在于個人信息的去標(biāo)識化。
過去由于不同機(jī)構(gòu)去標(biāo)識化的標(biāo)準(zhǔn)不統(tǒng)一,對于數(shù)據(jù)是否符合流通要求的判斷不一致,檢查判斷主體的不明晰等問題,都使得這項工作進(jìn)展緩慢。在結(jié)合xID標(biāo)記技術(shù)形成一套在線/實時/按需的“去標(biāo)識化數(shù)據(jù)”流通網(wǎng)絡(luò)生態(tài),突破了傳統(tǒng)加密網(wǎng)絡(luò)點對點的限制壁壘,為數(shù)據(jù)的流通提供了更便捷、更安全的流動載體,對流通平臺進(jìn)行完善及補(bǔ)全。
xID開出創(chuàng)新之花
從技術(shù)的推廣應(yīng)用來看,上海數(shù)據(jù)交易中心通過現(xiàn)有存量轉(zhuǎn)換首年30%(供需方調(diào)整期)、次年70%(成果推廣期)的推進(jìn)計劃將xID標(biāo)記技術(shù)覆蓋應(yīng)用整個交易平臺,并且在新增的業(yè)務(wù)上率先應(yīng)用xID標(biāo)記技術(shù),一些持有敏感數(shù)據(jù)或是對數(shù)據(jù)需求希望保密的組織或企業(yè),也會因xID標(biāo)記技術(shù)所提供的安全保密機(jī)制,從而打消之前的種種顧慮,進(jìn)入數(shù)據(jù)流通的生態(tài)圈來進(jìn)行業(yè)務(wù)的拓展及創(chuàng)新。鑒于xID標(biāo)記技術(shù)的附加價值提供了更高的安全公信力及業(yè)界認(rèn)可度,后續(xù)平臺交易的活躍度、數(shù)據(jù)交易量都將得到增量效益,預(yù)計三年后每年提升率為30%。
從創(chuàng)新性來看,xID標(biāo)記技術(shù)是結(jié)合“技術(shù)+規(guī)則”綜合性解決方案。該方案的創(chuàng)新性是將數(shù)據(jù)流通過程從兩方參與(數(shù)據(jù)需求方+數(shù)據(jù)供應(yīng)方)轉(zhuǎn)換成了多方參與(標(biāo)識生成服務(wù)+標(biāo)識關(guān)聯(lián)轉(zhuǎn)換服務(wù)+數(shù)據(jù)需求方+數(shù)據(jù)供應(yīng)方)。這種多方參與的模式是個人信息相關(guān)數(shù)據(jù)可以被分解后拆分處理,實現(xiàn)敏感信息有效隔離,最終實現(xiàn)個人信息合規(guī)存儲與流通。在此過程中,“規(guī)則”部分由上海數(shù)據(jù)交易中心研發(fā);數(shù)據(jù)匿名化與關(guān)聯(lián)性匹配的算法技術(shù)由公安部第三研究所在eID技術(shù)基礎(chǔ)上實現(xiàn)并提供技術(shù)服務(wù),從根本上確保了數(shù)據(jù)的安全性與服務(wù)的權(quán)威性。
訪談實錄
Q:中國大數(shù)據(jù)產(chǎn)業(yè)生態(tài)聯(lián)盟、《軟件和集成電路》雜志社
A:上海數(shù)據(jù)交易中心運營經(jīng)理王潤垠
Q:如何從創(chuàng)新性的角度來詮釋和理解上海數(shù)據(jù)交易中心技術(shù)的產(chǎn)業(yè)貢獻(xiàn)?
A:上海數(shù)據(jù)交易中心承建大數(shù)據(jù)流通與交易國家工程實驗室,參與相關(guān)大數(shù)據(jù)方面的國家標(biāo)準(zhǔn)的制定,開展了以數(shù)據(jù)連接為目標(biāo)的標(biāo)準(zhǔn)、規(guī)范、技術(shù)、法律方面的基礎(chǔ)研究。自主創(chuàng)新和研制的“技術(shù)+規(guī)則”雙重架構(gòu)的數(shù)據(jù)互聯(lián)整體解決方案和實時在線的數(shù)據(jù)流通交易平臺,形成了“數(shù)聯(lián)網(wǎng)”數(shù)據(jù)連接的多個標(biāo)準(zhǔn)與專利技術(shù),對應(yīng)五層數(shù)聯(lián)網(wǎng)結(jié)構(gòu),主要為:
1.多維數(shù)據(jù)分類標(biāo)準(zhǔn),控制流通數(shù)據(jù)種類;(數(shù)據(jù)層)
2.“六要素”規(guī)整方法,定義流通數(shù)據(jù)規(guī)格;(數(shù)據(jù)層)
3.xID居間標(biāo)記技術(shù),保護(hù)數(shù)據(jù)主體隱私;(數(shù)據(jù)層)
4.單側(cè)確權(quán)溯責(zé)規(guī)則,隔離責(zé)任連帶路線;(應(yīng)用層)
5.前置緩存配送技術(shù),控制數(shù)據(jù)許可范圍;(接口層)
6.三邊互聯(lián)路由技術(shù),管控數(shù)據(jù)流通方向;(傳輸層)
7.交叉價值質(zhì)量驗證,提升數(shù)據(jù)評估公信。(服務(wù)層)
Q:“六要素”數(shù)據(jù)規(guī)整方法出現(xiàn)的意義是什么?
A: “六要素”數(shù)據(jù)規(guī)整方法是國內(nèi)首創(chuàng)的流通數(shù)據(jù)定義標(biāo)準(zhǔn),已成為大數(shù)據(jù)流通領(lǐng)域行業(yè)認(rèn)可的基礎(chǔ)規(guī)范;與公安部第三研究所聯(lián)合研制的xID居間隔離技術(shù)是國內(nèi)當(dāng)前唯一能實現(xiàn)個人信息保護(hù)且利用的流通解決方案。
Q:當(dāng)前,除了xID方面的技術(shù)研發(fā)和應(yīng)用外,貴公司還有其他哪些業(yè)務(wù)拓展?
A: 依托上海大數(shù)據(jù)資源優(yōu)勢,上海數(shù)據(jù)交易中心已經(jīng)組織了以營銷、征信和建設(shè)物聯(lián)網(wǎng)為目的的合規(guī)高效的數(shù)據(jù)流通網(wǎng)絡(luò),可以快速幫助政府、行業(yè)企業(yè)獲取發(fā)展所需要的其他第三方數(shù)據(jù)資源,為企業(yè)規(guī)劃、精準(zhǔn)營銷、內(nèi)外聯(lián)動、智慧城市建設(shè)等提供有效支撐。
Q:如何通過技術(shù)和科研投入來加快技術(shù)發(fā)展的步伐?
A: 公司針對我國大數(shù)據(jù)共享交換及交易流通不暢、標(biāo)準(zhǔn)不明、數(shù)據(jù)質(zhì)量參差不齊、應(yīng)用需求牽引不足等問題,圍繞創(chuàng)建數(shù)據(jù)流通規(guī)則、加強(qiáng)安全與隱私保護(hù)、突破流通交易關(guān)鍵技術(shù)、拓展數(shù)據(jù)應(yīng)用場景等需求,研究與建設(shè)大數(shù)據(jù)流通與交易技術(shù)創(chuàng)新平臺,支撐開展政企數(shù)據(jù)資源共享交換、公共數(shù)據(jù)開放流通、大數(shù)據(jù)流通的理論方法和技術(shù)驗證、樣本數(shù)據(jù)庫及其服務(wù)支持系統(tǒng)等技術(shù)的研發(fā)和工程化。目前,國家工程實驗室擁有一支專業(yè)知識和實踐經(jīng)驗豐富、知識結(jié)構(gòu)合理、創(chuàng)新突破能力強(qiáng)的科研隊伍,下設(shè)15個研究中心。
行業(yè)應(yīng)用案例
案例名稱:征信行業(yè)數(shù)據(jù)流通案例
核心特點:結(jié)合xID標(biāo)記技術(shù)的流通生態(tài)網(wǎng)絡(luò),對流通的標(biāo)識進(jìn)行不可逆的轉(zhuǎn)換,以確保個人隱私信息的安全。并且在需要時可對不同流通主體轉(zhuǎn)換的標(biāo)識進(jìn)行匹配,避免了之前征信數(shù)據(jù)流通過程中的安全隱患,以標(biāo)識代替信息,打破了惡性循環(huán)。同時,保障了數(shù)據(jù)流通的安全性,完善了流通方式的合規(guī)性。
應(yīng)用解讀:在目前數(shù)據(jù)流通領(lǐng)域,尤其是在征信數(shù)據(jù)流通領(lǐng)域,存在個人隱私信息流通的隱患,對個人隱私保護(hù)存在較大的風(fēng)險。目前銀行、保險等領(lǐng)域因業(yè)務(wù)管理流程控制,需對客戶進(jìn)行個人信息的背景調(diào)查,在此過程中使得大量個人隱私信息流向征信公司。
而個人信息的外流會引起更多維度的個人信息調(diào)查校驗需求,這種惡性循環(huán)將使更多個人隱私信息外流,很多個人信息通過數(shù)據(jù)黑色/灰色產(chǎn)業(yè)鏈被不法人員掌握,為社會安定帶來安全隱患。
應(yīng)用價值:整合xID的標(biāo)識流通解決方案,保證了在法理合規(guī)的前提下,提供了安全數(shù)據(jù)流通的途徑,為征信領(lǐng)域的數(shù)據(jù)流通提供安全保障。完善上海數(shù)據(jù)交易中心的征信類業(yè)務(wù)場景的數(shù)據(jù)流通的安全性及合規(guī)性。