任文璐
隨著信息技術的進步,互聯(lián)網(wǎng)移動端以前所未有的發(fā)展速度產(chǎn)生了種類繁多、數(shù)量龐大的數(shù)據(jù),而云計算又為這些數(shù)據(jù)的存儲提供了技術支持,這一切造就了大數(shù)據(jù)時代的到來。 大數(shù)據(jù)時代不僅帶來了數(shù)據(jù)信息指數(shù)式的增長,而且促進了互聯(lián)網(wǎng)經(jīng)濟的繁榮發(fā)展,被比喻成未來“石油”的大數(shù)據(jù),其價值可見一斑。 巨大的商業(yè)利潤促使擁有數(shù)據(jù)庫的商業(yè)組織源源不斷地將收集到的個人數(shù)據(jù)進行整合、分析和利用。 但與此同時,大數(shù)據(jù)時代的數(shù)據(jù)挖掘、商業(yè)智能、追溯集成等技術給個人信息保護帶來了巨大的挑戰(zhàn),加強個人信息保護、完善相關的法律制度在這個時代顯得尤為迫切。
首先,加強個人信息的保護是對法治社會建設要求的響應,個人信息作為大數(shù)據(jù)時代最為重要的資源,對其的不法利用也日漸猖獗,對法治建設的侵害性極為嚴重,因此完善相關立法顯得意義重大。 其次,完善對個人信息的保護更能平衡信息保護與促進信息合理流動之間的沖突,最終實現(xiàn)信息主體、信息利用者和國家安全之間的利益平衡,公民的個人信息權益既不能無限擴張也不能被肆意侵犯,同樣雖然利用和分析大數(shù)據(jù)、發(fā)展大數(shù)據(jù)產(chǎn)業(yè)能夠給人們的生活帶來便利,但是這并不意味著企業(yè)能夠隨意地使用個人數(shù)據(jù)。 我們需要信息流動所帶來的互聯(lián)網(wǎng)經(jīng)濟,同樣我們也需要給個人信息留一方凈土,而一切的前提是信息的流動不能侵害國家安全的法益。 因此,以法律規(guī)范的形式為公民的個人信息劃定邊界清晰、范圍合適的權限,是在充分保護公民個人信息的同時有效地發(fā)展相關數(shù)據(jù)產(chǎn)業(yè)的良策。
大數(shù)據(jù)是一個較為抽象的概念,學界以及理論界對其尚無確切、統(tǒng)一、公認的定義。 維基百科對大數(shù)據(jù)的定義是:“大數(shù)據(jù)是指所涉及的數(shù)據(jù)量規(guī)模巨大到無法通過目前主流軟件工具,在合理時間內(nèi)達到截取、管理、處理并整理成為幫助企業(yè)經(jīng)營決策更積極目的的信息。”大數(shù)據(jù)先驅(qū)麥肯錫給出這樣的定義:“它是一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了常規(guī)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合。”關于大數(shù)據(jù)各種機構和學者們都給出了不同的定義,但是比較之下,可以發(fā)現(xiàn)其定義中都強調(diào)了大數(shù)據(jù)具有數(shù)據(jù)規(guī)模大、數(shù)據(jù)種類多、處理速度快、價值密度低以及無法通過常規(guī)軟件工具處理等特征。 正是基于此,一個信息海量生成、分享、挖掘、分析、應用的時代正是我們?nèi)缃竦臅r代——大數(shù)據(jù)時代。
首先,大數(shù)據(jù)時代的到來使得采集、記錄個人數(shù)據(jù)變得更加容易、成本更加低廉。 淘寶收集著我們的購物記錄,分析著我們的購物傾向;微博收集著我們的瀏覽記錄,分析并向我們推送著感興趣的內(nèi)容;美團收集著我們的外賣瀏覽與購買記錄,預測著今天中午我們可能會在什么類型的店里下單。 大數(shù)據(jù)的分析預測在使我們的生活變得更加便捷的同時,也像一個藏在屏幕后的攝像頭,拍攝著我們的一舉一動。如果說互聯(lián)網(wǎng)時代我們的隱私受到了威脅,那么在大數(shù)據(jù)時代這些威脅有著愈演愈烈的趨勢,互聯(lián)網(wǎng)技術在進步和普及的同時,被采集和利用的個人信息也無處不在。
其次,個人信息一旦被數(shù)據(jù)化地儲存,便很難察覺并維權。 這些掌握在政府、非政府機構以及商業(yè)組織的數(shù)據(jù)庫中的個人信息,被侵害的自然人實際上是很難察覺的,甚至會麻木地認為自己的合法權益并沒有受到侵害。 然而即使察覺到了個人信息被不正當?shù)厥褂?,也很難尋找到有力的證據(jù)證明侵害行為的存在和損害事實,因此取證困難也將導致最后難以維護自己的合法權益。
最后,個人信息的處理和利用在廣度和深度上有了質(zhì)的飛躍。 如果說網(wǎng)絡時代對個人信息的威脅在于精準收集的話,大數(shù)據(jù)時代則是在大數(shù)據(jù)樣本中基于數(shù)據(jù)挖掘產(chǎn)生相關個人信息的關聯(lián)集成,它能夠?qū)Ψ稚⒌南嚓P個人信息進行“二次開發(fā)利用”。 有的數(shù)據(jù)從表面上看并不是個人數(shù)據(jù),但是經(jīng)由大數(shù)據(jù)處理后就可以追溯到個人了。 而我們的搜索歷史、位置信息、網(wǎng)頁瀏覽習慣、閱讀習慣、休閑愛好、信用信息等無時無刻不在被采集與使用,因此只要信息被采集到足夠的量,通過數(shù)據(jù)的交叉驗證、數(shù)據(jù)匹配、反匿名化操作,就會暴露出個人的生活軌跡、健康狀況、思想印跡、消費習慣、社交關系與財務狀況。
研讀《民法典(草案)》(以下簡稱《草案》)人格權編中關于個人信息保護的規(guī)定,可以發(fā)現(xiàn)立法者已經(jīng)關注到了大數(shù)據(jù)時代個人信息面臨的新挑戰(zhàn),并在最新的草案中修改了部分規(guī)定,使法律制度跟上最新的互聯(lián)網(wǎng)技術和商業(yè)模式、滿足大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展需要,值得肯定。 具體表現(xiàn)為以下三個方面,首先,第一千零三十四條第二款在列舉個人信息的類型中,相比二審稿添加了電子郵箱和行蹤信息,更能適應大數(shù)據(jù)時代的特征。 第二款采用抽象定義和列舉的方式明確個人信息的概念,一方面通過直接或間接的可識別性的認定體現(xiàn)個人信息保護的本質(zhì)特征,另一方面通過列舉典型的方式指導司法適用。 電子郵箱地址,尤其是行蹤信息的加入為個人在使用應用軟件中生成的具有身份識別性的一類信息做出了明確的定性,該類信息數(shù)據(jù)屬于個人信息而非由應用軟件服務商所有。 其次,相比于二審稿,《草案》在第一千零三十五條中將“收集、使用”修改為“收集、處理”。 根據(jù)前文我們已經(jīng)總結(jié)出大數(shù)據(jù)時代區(qū)別于互聯(lián)網(wǎng)時代最為顯著也是最為棘手的問題就是個人信息的處理和利用在廣度和深度上有了質(zhì)的飛躍,因此相較于使用,“處理”一詞更為貼切和精準地表現(xiàn)了《民法典》在大數(shù)據(jù)時代背景下應當要規(guī)制的行為——對大數(shù)據(jù)進行利用的前提處理行為。 最后,相比于二審稿,《草案》在第一千零三十六條中將信息持有者改為信息控制者。 “信息控制者”意指于實際支配和管制個人信息的一方,其概念比“持有者”廣,根據(jù)第一千零三十六條的規(guī)定,自然人可以直接向?qū)嶋H支配和管制的人查閱、抄錄或者復制其個人信息,發(fā)現(xiàn)信息有錯誤的,直接向?qū)嶋H支配和管制的人提出異議并請求及時更正,能更好地維護個人的合法權益。
即使《民法典(草案)》的一些改動能夠顯現(xiàn)出對大數(shù)據(jù)時代的迎合,但是細讀人格權編關于個人信息保護的規(guī)定,仍發(fā)現(xiàn)存在一些不足之處。 首先,在第一千零三十六條中規(guī)定的查閱、抄錄或者復制的對象僅限于自然人本人的信息,范圍過窄,應當擴展到相關數(shù)據(jù)處理的具體情況。 第一,從比較法的立法經(jīng)驗上來看,類似的權利也存在于德國《聯(lián)邦數(shù)據(jù)保護法》第三十四條和歐盟《通用數(shù)據(jù)保護條例》第十五條以及我國臺灣地區(qū)《個人資料保護法》第三條和第十一條等規(guī)范中,這些立法之中都有涵蓋相關數(shù)據(jù)的處理情況,并且歐盟《通用數(shù)據(jù)保護條例》中“可攜帶權”還要求提供將數(shù)據(jù)從一個持有者轉(zhuǎn)移到另一持有者技術上的可行性支持。第二,規(guī)定自然人查閱、抄錄或復制的信息范圍僅限于其個人信息,無法有效遏制信息控制者基于大數(shù)據(jù)樣本整合后的處理、分析的行為,而該行為正是目前現(xiàn)階段暴露個人隱私狀況的主要元兇,因此只有規(guī)定個人有權向信息控制者要求知曉其個人數(shù)據(jù)處理的具體情況,才能真正有效地避免個人信息權益在“二次開發(fā)利用”時被侵犯,也只有如是規(guī)定,才能在自然人的個人信息權益受到侵害時,收集掌握相關證據(jù)以維護自身合法權益。
其次,在第一千零三十六條中規(guī)定的行使刪除權的前提過于狹隘。 第一千零三十六條將信息控制者違反法律、行政法規(guī)的規(guī)定或者雙方的約定作為唯一可請求行使刪除權的條件,無論是對于享有權益的自然人還是信息控制者而言,都存在不妥之處,筆者認為應當增設信息不恰當或者已過時和根據(jù)信息收集目的持有信息已無必要兩種情形。 這兩種要求刪除能夠直接或間接識別身份的數(shù)據(jù)的規(guī)定,從本質(zhì)上來講也就是借鑒歐美法的經(jīng)驗將“被遺忘權”本土化。 被遺忘權最早被公眾所熟知是“谷歌訴岡薩雷斯被遺忘權案”,美國加州通過制定“橡皮擦法案”,也使被遺忘權在美國初露端倪,其在大數(shù)據(jù)時代對于個人信息保護有著十分重要的現(xiàn)實意義,并且在中國本土化具有可行性。 在互聯(lián)網(wǎng)高度普及的大數(shù)據(jù)時代,每天在各類社交媒體平臺上都有大量文章、新聞、圖片、視頻、評論被發(fā)布。 面對互聯(lián)網(wǎng)上的一些從主觀上講是個人不愿意被一直提起、想要被社會遺忘的冒犯性個人信息,從客觀上講是不恰當?shù)幕蛘呤沁^時的數(shù)據(jù),是否應當將其作為刪除權的客體? 筆者認為在對個人信息的保護高度重視的當下,答案是肯定的。 在大數(shù)據(jù)時代,設立被遺忘權,對網(wǎng)絡上已經(jīng)成為“過去式”的內(nèi)容進行刪除,杜絕其對現(xiàn)在生活的侵擾,保障了信息主體私人生活的安寧。 因此《民法典》應當做出相應的規(guī)定,而在第一千零三十六條增設兩種刪除權的行使情形也是合理且有必要的。
最后,在第一千零三十七條中信息處理合法性應當更加多樣化。 《草案》僅規(guī)定當事人的同意為個人信息收集、使用的合法性基礎,在多樣化的社會生活中,個人信息收集使用的合法性基礎也必然多樣化,遠非簡單一種類型可以涵蓋,并且在我國的司法實踐之中,在之前出現(xiàn)的具體的案件裁判上也認可了很多其他的合法性理由。 除了當事人同意之外,還包括個人信息本身缺乏敏感性、信息處理風險較低、信息處理是為了公共利益或者是為了保護他人合法利益所必須等。
首先,根據(jù)投入成本分配信息權益。 大數(shù)據(jù)的結(jié)果是獨立的衍生數(shù)據(jù),其與原始的用戶數(shù)據(jù)并沒有直接聯(lián)系,因此只要數(shù)據(jù)來源無瑕疵,大數(shù)據(jù)企業(yè)因其投入的資本、技術應當獲得對大數(shù)據(jù)的相應權益。 第一,這種“成本—獲益”模式實際上是私法中常見的利益分配模式,例如說股份分紅,因此這種遷移適用并不突兀。 第二,對信息的處理利用是需要投入大量的資本和技術的,因此從鼓勵信息產(chǎn)業(yè)發(fā)展的角度出發(fā),企業(yè)在投入相應的成本后,其所獲得的合理收益應當受到保護。 第三,個人信息本身也具有公共性和社會性,在一定程度上也屬于公共資源,不能絕對的只受個人支配,因此只要數(shù)據(jù)來源無瑕疵,企業(yè)對其處理后的衍生數(shù)據(jù)應當享有相應的權益。
其次,鑒于多數(shù)信息控制者“隱私條款”具有免除其責任和排除信息主體主要權利的情形,建議在第一千零三十五條中增加一款:“信息控制者或處理者提供的隱私格式條款應當接受合法性審查?!蹦壳?,個人信息的采集廣泛存在于移動端的應用程序之中,其也是個人信息泄露的主要元兇,尤其是這些應用的“隱私條款”更是超越了“合法、正當、必要原則”的范圍,但是對于幾乎所有的用戶來說,他們首先不會認真地閱讀隱私條款,就直接點“同意”,其次如果他們仔細閱讀并對此提出異議,不接受隱私條款,應用程序的發(fā)布者就會拒絕用戶安裝或使用該軟件。 因此此處需要法律規(guī)定的介入,增加隱私格式條款的事先合法性審查,無疑能夠加大保護用戶在使用應用軟件時的個人信息安全。
再次,為第一千零三十六條權利人對其個人信息的“更正權”和“刪除權”設置相應的信息控制者的保障義務。 《草案》第一千三十六條只規(guī)定了自然人對個人信息享有“更正權”和“刪除權”,但是并沒有設置信息控制者對應的保障義務。 第一,在之前的立法實踐之中,我國的《網(wǎng)絡安全法》和多數(shù)國家的個人信息保護法中均設置了數(shù)據(jù)控制者的保障義務,如我國《網(wǎng)絡安全法》第四十三條的規(guī)定和歐盟的《通用數(shù)據(jù)保護條例》第十七條的規(guī)定。 第二,權利與義務應當相互對應,不能割裂,尤其是在大數(shù)據(jù)時代在個人信息保護之中,信息控制者處于優(yōu)勢地位,個人處于劣勢地位的狀況下,權益人的權益將更難以實現(xiàn)。
最后,應針對自動化處理與網(wǎng)絡畫像做出規(guī)定。 網(wǎng)絡畫像,歐盟《通用數(shù)據(jù)保護條例》第四條第四款如是給出定義:“系指對個人信息任何形式的自動化處理,通過使用個人信息來評價某一自然人的某些個人特征,尤其是分析或者預測該自然人的工作表現(xiàn)、經(jīng)濟狀況、健康、個人偏好、興趣、可信度、行為、位置或行跡。”實際上,很多互聯(lián)網(wǎng)企業(yè)為增加用戶黏性,讀懂用戶偏好,會建模進行畫像計算,并且其運用領域廣泛,在我們的日常生活中普及程度高,但是這種新的技術在運用的時候,十分容易陷入算法歧視。 以抵押信貸和消費信貸為例,一些大數(shù)據(jù)分析軟件被用來評估特定個人不能償還貸款的風險,但其評估并非是基于其個人情況,而是基于欠款者中居住在同一區(qū)域的、具有相同消費場所等的比例。這些與個人現(xiàn)在或未來違約風險無關的信息,在統(tǒng)計學上卻被賦予相關性,由此推導出其在未來發(fā)生違約的高概率,這顯然是不合理的。 自動化處理與網(wǎng)絡畫像直接涉及個人信息的合法使用與保護的問題,因此需要對算法歧視規(guī)定信息處理的透明度和禁止歧視的原則,特別是規(guī)定基于自動化生成的結(jié)果的司法可訴性。
傳統(tǒng)的個人信息保護模式已經(jīng)無法適應大數(shù)據(jù)時代背景下的個人信息保護,從適應社會發(fā)展的角度考慮,應當盡快完善個人信息保護法律制度。 本文從大數(shù)據(jù)時代背景出發(fā),討論了大數(shù)據(jù)的特征以及大數(shù)據(jù)時代個人信息保護所面臨的嚴峻挑戰(zhàn),并著重分析了《民法典(草案)》中關于個人信息保護的規(guī)定,雖然其中的部分規(guī)定有貼合最新的互聯(lián)網(wǎng)技術和商業(yè)模式的趨勢,但是仍有值得完善之處,目前的相關立法是否能滿足大數(shù)據(jù)時代的需要還有待商榷。 個人信息保護的法律體系建設還需要從多層次入手完善相關的立法,打破我國個人信息保護混亂、不明確,法律規(guī)定分散化和碎片化的現(xiàn)狀并建立綜合性、立體化的保護體系,因此其他部門法的頒布也迫在眉睫,相信只有在完善好個人信息法律保護體系后,公民的個人信息與互聯(lián)網(wǎng)經(jīng)濟才能互相促進、繁榮共生!