秦大強(qiáng)
(上海公安學(xué)院,上海 200137)
數(shù)字時(shí)代,小到在線社交、移動(dòng)支付,大到產(chǎn)業(yè)發(fā)展、城市治理,民眾的一切在線活動(dòng)均被予以即時(shí)性數(shù)字化展現(xiàn),隨之產(chǎn)生海量的以“人”為核心的網(wǎng)絡(luò)信息數(shù)據(jù)。這些數(shù)據(jù)被新興互聯(lián)網(wǎng)企業(yè)視為核心資產(chǎn),并因相互間通過技術(shù)獲取而引發(fā)諸多問題爭議①丁曉東,數(shù)據(jù)到底屬于誰——從網(wǎng)絡(luò)爬蟲看平臺(tái)數(shù)據(jù)權(quán)屬與數(shù)據(jù)保護(hù)[J].華東政法大學(xué)學(xué)報(bào),2019,(5):69-83.第70頁.。作為爭議焦點(diǎn)的爬蟲技術(shù),因其高效、海量、便捷獲取網(wǎng)絡(luò)信息數(shù)據(jù)能力被廣泛應(yīng)用于各類信息數(shù)據(jù)的深度收集,成為大數(shù)據(jù)產(chǎn)業(yè)野蠻擴(kuò)張的主要工具,甚至是被用來大肆抓取網(wǎng)絡(luò)空間的公民個(gè)人信息。當(dāng)前,個(gè)人信息保護(hù)已成為廣大人民群眾最關(guān)心最直接最現(xiàn)實(shí)的利益問題之一②參見:全國人大法工委《關(guān)于〈中華人民共和國個(gè)人信息保護(hù)法(草案)〉的說明》,來源:https://www.thepaper.cn/newsDetail_forward_9665985,最后訪問時(shí)間:2021年6月1日。。依法規(guī)制利用爬蟲技術(shù)抓取公民個(gè)人信息行為,對保護(hù)公民個(gè)人信息、規(guī)范網(wǎng)絡(luò)空間社會(huì)秩序、遏制因個(gè)人信息濫用引發(fā)的新型網(wǎng)絡(luò)違法犯罪具有重要意義。
網(wǎng)絡(luò)爬蟲(Web Crawler),也叫網(wǎng)絡(luò)蜘蛛(Web Spider),是互聯(lián)網(wǎng)時(shí)代一項(xiàng)運(yùn)用非常普遍的網(wǎng)絡(luò)信息搜索技術(shù)。爬蟲技術(shù)的本質(zhì)是自動(dòng)抓取程序,“通過遍歷網(wǎng)絡(luò)內(nèi)容,按照指定規(guī)則提取所需的網(wǎng)頁數(shù)據(jù),并下載到本地形成互聯(lián)網(wǎng)網(wǎng)頁鏡像備份的程序”①李慧敏,孫佳亮.論爬蟲抓取數(shù)據(jù)行為的法律邊界[J]. 電子知識(shí)產(chǎn)權(quán),2018,(12):58-67.。網(wǎng)絡(luò)爬蟲為海量信息的分類獲取提供技術(shù)基礎(chǔ),“某種意義上講,只要涉及信息搜集,就勢必會(huì)運(yùn)用到爬蟲技術(shù)”②林維. 數(shù)據(jù)爬取行為的刑事司法認(rèn)定[J]. 人民檢察,2020,(4):38-40.,而其與智能算法的深度應(yīng)用極大地促進(jìn)了信息數(shù)據(jù)的“挖掘/共享-分析-利用”多維度循環(huán),推動(dòng)了互聯(lián)網(wǎng)生態(tài)的多元繁榮。
但是相對于數(shù)字化采集與存儲(chǔ)的原生態(tài),網(wǎng)絡(luò)爬蟲猶如其名,自始就是一種寄生的姿態(tài),因其鏈接而獲得展示、推廣的數(shù)據(jù)所有者對其并無甚介意,但數(shù)據(jù)產(chǎn)權(quán)和數(shù)據(jù)人格視角下的所有者則通過設(shè)置robots協(xié)議或反爬技術(shù)對其異議不斷,并迅速從主張民事上的不正當(dāng)競爭擴(kuò)展至要求對其進(jìn)行行政、刑事規(guī)制。新浪微博訴鷹擊系統(tǒng)一案③參見北京市知識(shí)產(chǎn)權(quán)法院(2019)京73民終某號民事判決書。中,蟻坊公司使用非搜索引擎類網(wǎng)絡(luò)爬蟲,未經(jīng)授權(quán)大量采集對方網(wǎng)站數(shù)據(jù)并緩存,被法院認(rèn)為屬于“通過不正當(dāng)手段獲取新浪微博數(shù)據(jù)”的違法行為。而伴隨網(wǎng)絡(luò)借貸迅速崛起的某某科技等風(fēng)控?cái)?shù)據(jù)提供商,“通過后臺(tái)‘爬蟲’搜集信息,將通話信息、消費(fèi)數(shù)據(jù)等互聯(lián)網(wǎng)信息整合標(biāo)準(zhǔn)化,最終形成對借款人的綜合評估”④參見:《爬蟲涼涼!摩羯科技被查、聚信立等紛紛停業(yè)》,來源:https://news.p2peye.com/article-550019-1.html,最后訪問時(shí)間:2021年6月1日。,涉嫌過度收集公民個(gè)人信息被警方調(diào)查。
網(wǎng)絡(luò)爬蟲侵權(quán)過程并不止步于數(shù)據(jù)的獲取環(huán)節(jié),抓取數(shù)據(jù)之后的泄露、濫用還會(huì)伴生出下游犯罪、社會(huì)分層、消費(fèi)操控等衍生性、繼發(fā)性新型損害⑤葉名怡. 個(gè)人信息的侵權(quán)法保護(hù)[J]. 法學(xué)研究,2018,(4):90-92.。在當(dāng)前隱私保護(hù)相對薄弱、數(shù)據(jù)安全漏洞頻出的網(wǎng)絡(luò)環(huán)境下,爬蟲技術(shù)因其與信息來源違法、過度爬取、信息濫用以及助長下游犯罪等問題的頻繁交織而占上輿論風(fēng)口,由原本的“中立技術(shù)”逐步向“道德可疑”直至“違法技術(shù)”嬗變⑥劉艷紅. 網(wǎng)絡(luò)爬蟲行為的刑事規(guī)制研究[J]. 政治與法律,2019,(11):16-27.,一度從業(yè)人員談“蟲”色變、人人自危。
當(dāng)前我國法律關(guān)于公民個(gè)人信息定義的規(guī)定主要有《個(gè)人信息保護(hù)法》第4條、《民法典》第1034條以及《網(wǎng)絡(luò)安全法》第76條。綜合來看,三者關(guān)注個(gè)人信息的主要載體都是電子,也即是網(wǎng)絡(luò)空間公民個(gè)人信息,在具體信息類別上強(qiáng)調(diào)“識(shí)別性”,凡是能夠直接或間接識(shí)別特定個(gè)人的信息,均為個(gè)人信息。這一規(guī)定以擴(kuò)張性的態(tài)勢來應(yīng)對未來個(gè)人信息保護(hù)的不確定性,但從法律適用的角度出發(fā),“法律擴(kuò)張公民個(gè)人信息保護(hù)范圍,是對于信息時(shí)代侵犯公民個(gè)人信息犯罪的積極回應(yīng),但沒有框架限制和原則指導(dǎo)的擴(kuò)張亦存在違背罪刑法定原則之嫌?!雹咄跫?,朱佳樂. 厘清公民個(gè)人信息刑法保護(hù)邊界[N]. 檢察日報(bào),2020-10-26.因此,有必要從具體的場景、識(shí)別、權(quán)屬出發(fā),以限縮的視角對網(wǎng)絡(luò)公民個(gè)人信息進(jìn)行評價(jià)。
1. 場景:信息獲取的告知與同意。對于網(wǎng)絡(luò)空間個(gè)人信息,任何第三方作出獲取、更正或刪除等行為,都必須在公平程序下在具體的適合場景(Context Appropriate)中完成①Reardon M. Democrats push for 'Internet Bill of Rights' to protect your privacy[EB/OL]. https://www.cnet.com/news/democrats-push-for-an-internet-bill-of-rights-to-protect-consumer-privacy/,最后訪問時(shí)間:2021年6月2日。。嚴(yán)格地講,在具體的場景之外網(wǎng)絡(luò)空間不應(yīng)有公民個(gè)人信息的存在。而在具體的場景之中,網(wǎng)絡(luò)主體獲取公民個(gè)人信息亦必須進(jìn)行明確的告知并征得該公民的直接同意。因此,網(wǎng)絡(luò)公民個(gè)人信息的合法存在必須是基于一定具體的場景,且同時(shí)具備告知與同意的二維標(biāo)簽。
2. 識(shí)別:法定保護(hù)的范圍與強(qiáng)度。智能算法和大數(shù)據(jù)環(huán)境顛覆了網(wǎng)絡(luò)空間對“人”的識(shí)別邏輯,過去由姓名或身份至個(gè)性標(biāo)簽的識(shí)別過程,轉(zhuǎn)變?yōu)橛扇ψ游幕⑾M(fèi)記錄、軌跡信息、瀏覽痕跡等碎片化個(gè)性特征到具體的姓名或身份?;诉壿嫞W(wǎng)絡(luò)空間的任何信息都可以最終擴(kuò)張到公民個(gè)人信息范疇,但“法律的過度介入也必然壓縮數(shù)據(jù)科技的發(fā)展空間”②楊楠.個(gè)人信息“可識(shí)別性”擴(kuò)張之反思與限縮[J].大連理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2021,42,(2):98-107.,因此在評價(jià)網(wǎng)絡(luò)公民個(gè)人信息的時(shí),有必要以可識(shí)別的程度來限縮保護(hù)的范圍和強(qiáng)度。
3. 權(quán)屬:平臺(tái)共生的焦點(diǎn)與格局。在網(wǎng)絡(luò)化、數(shù)字化、智能化發(fā)展變革的推動(dòng)下,“人類進(jìn)入了‘要么加入平臺(tái),要么被平臺(tái)所消滅’的平臺(tái)經(jīng)濟(jì)時(shí)代”③馬長山. 數(shù)字社會(huì)的治理邏輯及其法治化展開[J]. 法律科學(xué)(西北政法大學(xué)學(xué)報(bào)),2020,(5).。網(wǎng)絡(luò)平臺(tái)是數(shù)據(jù)的收集者、使用者、保存者,以數(shù)據(jù)為自身發(fā)展和財(cái)富積累的根本,而網(wǎng)絡(luò)空間一切數(shù)據(jù)的核心是控制財(cái)富流動(dòng)的具體的人。因此,在具體的環(huán)境場域中評價(jià)網(wǎng)絡(luò)空間公民個(gè)人信息,還必須從各類數(shù)據(jù)深度融合、交織共生背后的具體平臺(tái)從發(fā),以數(shù)據(jù)的權(quán)屬作為最終焦點(diǎn)。
基于前述概念,抓取個(gè)人信息,通常是指利用計(jì)算機(jī)編寫特定的爬蟲程序在網(wǎng)絡(luò)空間收集公民個(gè)人信息的行為。該行為以信息網(wǎng)絡(luò)為依托,以爬蟲技術(shù)為工具,以完整的或碎片化的公民個(gè)人信息為目標(biāo),是基于一定目的自動(dòng)收集行為。鑒于爬蟲技術(shù)的特性,與傳統(tǒng)信息收集行為相比,網(wǎng)絡(luò)抓取公民個(gè)人信息行為呈現(xiàn)出更加復(fù)雜的表征。
1. 目標(biāo)涵攝一切網(wǎng)絡(luò)空間個(gè)人信息?;谥悄芩惴ǖ纳疃葢?yīng)用,“計(jì)算機(jī)科學(xué)正在將你的生活轉(zhuǎn)化成他人的商機(jī)”④馬爾克·杜甘,克里斯托夫·拉貝. 赤裸裸的人:大數(shù)據(jù),隱私與窺視[M]. 上海:上??茖W(xué)技術(shù)出版社,2017:142.,凡是以數(shù)字化記載的個(gè)人生活信息,都悉數(shù)囊卷于當(dāng)下數(shù)字經(jīng)濟(jì)的縱深拓展。也正因此,網(wǎng)絡(luò)抓取公民個(gè)人信息的目標(biāo)并非停留于指向直接可識(shí)別的姓名、電話、住址、工作單位、身份證號碼以及就診記錄、銀行流水、車輛號牌、實(shí)名賬號等公民個(gè)人信息,包括公民的行車軌跡、瀏覽痕跡、消費(fèi)記錄、網(wǎng)站點(diǎn)評等間接可識(shí)別信息也涵攝其中。換言之,網(wǎng)絡(luò)空間一切要素完整的或簡單碎片的、直接顯示的或深度關(guān)聯(lián)的、靜態(tài)表面的或動(dòng)態(tài)深層的個(gè)人信息都無所幸免地成為網(wǎng)絡(luò)抓取的目標(biāo)。
2. 手段表征為窮盡一切的深度收集。從縱深看,在交互性數(shù)據(jù)勾連的虛擬空間內(nèi),“網(wǎng)絡(luò)爬蟲的工作機(jī)制依賴于互聯(lián)網(wǎng)的超級鏈接網(wǎng)絡(luò)”⑤王成軍.“今曰頭條”的技術(shù)邏輯:網(wǎng)絡(luò)爬蟲+矩陣篩選[J]. 傳媒評論,2015,(10):34-37.,無論是廣度優(yōu)先還是深度優(yōu)先,均不受時(shí)間和物理地點(diǎn)的限制。從目的看,每一款爬蟲產(chǎn)品的設(shè)計(jì)均基于一定的目標(biāo),一旦觸發(fā)即自動(dòng)化無限制穿梭于不公開的深層網(wǎng)頁中,都可以實(shí)現(xiàn)對對象空間的無限檢索和目標(biāo)信息的深度收集。從頻次看,自動(dòng)化的抓取目標(biāo)數(shù)據(jù)行為觸發(fā)極其頻繁,與正常的人工網(wǎng)頁搜索存在天壤之別,而且非善意的爬蟲使用者通常會(huì)在目標(biāo)網(wǎng)頁投放大量的爬蟲來獲取多次且大量的數(shù)據(jù)。從技術(shù)看,爬取的對象和目標(biāo)都只是具體設(shè)置中的一個(gè)象征性的“數(shù)值”,而非技術(shù)本身的“能力”極限,基于特定目標(biāo)可以“變態(tài)”爬取一切數(shù)據(jù)。
3. 過程伴生著個(gè)人信息的永續(xù)失控。一切被數(shù)字化記載于網(wǎng)絡(luò)空間的個(gè)人信息都具有商業(yè)價(jià)值,是當(dāng)前市場分析、產(chǎn)品開發(fā)、消費(fèi)畫像、個(gè)性推送和精準(zhǔn)營銷等商業(yè)行為的數(shù)據(jù)基礎(chǔ),而商業(yè)誘惑的背后則是無止境的信息收集與存儲(chǔ)、流轉(zhuǎn)與衍生。“公私機(jī)構(gòu)對個(gè)人信息的廣泛需求還催生了專門的個(gè)人信息服務(wù)提供者,后者通過大量收集個(gè)人信息,形成各種類型的個(gè)人信息庫,對外提供查詢或租賃乃至銷售等信息服務(wù)”①張新寶. 從隱私到個(gè)人信息:利益再衡量的理論與制度安排[J]. 中國法學(xué),2015,(3):38-59.。“為精準(zhǔn)對接用戶需求而衍生的網(wǎng)絡(luò)黑灰產(chǎn)上游犯罪本質(zhì)上是對個(gè)人信息的侵害”②劉憲權(quán). 網(wǎng)絡(luò)黑灰產(chǎn)上游犯罪的刑法規(guī)制[J]. 國家檢察官學(xué)院學(xué)報(bào),2021,(1):3-17.,在網(wǎng)絡(luò)瞬時(shí)性傳播環(huán)境下,這些信息數(shù)據(jù)一旦被抓取脫離最初的場域,便會(huì)有違最初收集目的而伴生著非法存儲(chǔ)、使用、流轉(zhuǎn)等,完全進(jìn)入一種不可逆的失控狀態(tài),對公民的人格尊嚴(yán)和個(gè)人自由造成無限次侵害,甚至將流轉(zhuǎn)于網(wǎng)絡(luò)詐騙、暴力催債等嚴(yán)重侵害了公民人身財(cái)產(chǎn)安全的刑事違法犯罪。
數(shù)字時(shí)代,“數(shù)據(jù)和信息變成了基本的生產(chǎn)要素、新興的財(cái)富源泉甚至重要的控制力量”③馬長山. 數(shù)字時(shí)代的人權(quán)保護(hù)境遇及其應(yīng)對[J]. 求是學(xué)刊,2020,(4):103-111.,網(wǎng)絡(luò)空間的公民個(gè)人信息呈現(xiàn)出多元交織、利益消長、秩序多維的共生格局:自然人視角下是人格權(quán)和財(cái)產(chǎn)權(quán)等私權(quán)益的限縮保護(hù),企業(yè)等營利法人則積極謀求智能算法下的數(shù)據(jù)財(cái)產(chǎn)權(quán)以及拓展商品和服務(wù)提供個(gè)性化、精準(zhǔn)度的運(yùn)維自由,而公共管理部門則基于個(gè)人信息的收集分析來防范和化解管理風(fēng)險(xiǎn)、提升社會(huì)治理能力。因此,解析網(wǎng)絡(luò)抓取公民個(gè)人信息行為的法律性質(zhì),必須從網(wǎng)絡(luò)空間公民個(gè)人信息背后的主體授權(quán)、權(quán)益保護(hù)出發(fā),在具體的環(huán)境場域中展開。
個(gè)人信息保護(hù)的實(shí)質(zhì)是對信息主體的權(quán)益加以保護(hù),是“保護(hù)個(gè)人信息主體不因信息處理而受到侵害,是針對個(gè)人信息處理行為可能對主體帶來的侵害進(jìn)行的保護(hù)”④高富平,李群濤. 個(gè)人信息主體權(quán)利的性質(zhì)和行使規(guī)范[J]. 上海政法學(xué)院學(xué)報(bào)(法治論叢),2020,(6):40-51.,主體及其權(quán)益是涉?zhèn)€人信息保護(hù)的要義所在。而主體的授權(quán)同意是網(wǎng)絡(luò)空間個(gè)人信息存在及流轉(zhuǎn)的基礎(chǔ),是一切基于個(gè)人信息實(shí)現(xiàn)權(quán)益讓渡、衍生或再生的根本。依據(jù)《個(gè)人信息保護(hù)法》《民法典》,當(dāng)前個(gè)人信息保護(hù)規(guī)范的要旨是個(gè)人信息收集和使用應(yīng)遵循合法、正當(dāng)、必要等原則,經(jīng)被收集者同意收集和保存后應(yīng)當(dāng)依法處理或使用。因此,網(wǎng)絡(luò)抓取公民個(gè)人信息行為是否合法的根本在于是否獲得了信息主體的真正授權(quán)同意。
1. 公開系征得授權(quán)同意的例外。網(wǎng)絡(luò)的意義在于信息的聚集鏈接與開放共享,數(shù)據(jù)控制者可以和個(gè)人明確約定無需征得同意即將其公開的個(gè)人信息作為商業(yè)使用并向第三方披露。最基本的網(wǎng)絡(luò)爬蟲只能以這部分由個(gè)人主動(dòng)公開的信息為獲取對象,這是由其本身的代碼方式所決定,若要進(jìn)入封閉系統(tǒng)則必須獲得相關(guān)數(shù)據(jù)源或數(shù)據(jù)主體的授權(quán)。在檢索信息主體自行公開或合法公開披露的信息時(shí),爬蟲在不侵害計(jì)算機(jī)系統(tǒng)運(yùn)行安全的情況下與普通人的訪問并無實(shí)質(zhì)區(qū)別。《個(gè)人信息保護(hù)法》第13條第六項(xiàng)規(guī)定:“依照本法規(guī)定在合理的范圍內(nèi)處理個(gè)人自行公開或者其他已經(jīng)合法公開的個(gè)人信息”無需征得個(gè)人同意①參見:《中華人民共和國個(gè)人信息保護(hù)法》,來源:http://www.npc.gov.cn/npc/c30834/202108/a8c4e3672c74491a80b53a172bb753fe.shtml,最后訪問時(shí)間:2021年9月24日。。2020年10月1日實(shí)施的《個(gè)人信息安全規(guī)范》(GB/T 35273-2020)第五條第六款也規(guī)定了多種不必征得信息主體授權(quán)同意也可以收集的情形,其中包括個(gè)人信息主體自行向社會(huì)公開的、根據(jù)要求簽訂和履行合同所必需的以及從合法公開披露的信息中收集個(gè)人信息。因此,以主體自行公開或平臺(tái)合法公開的個(gè)人信息為對象的爬取行為并不違法。
2. 個(gè)人同意并不完全等于授權(quán)。《個(gè)人信息保護(hù)法》第13-16條、第31條和《民法典》第1035條,都將“征得該自然人或者其監(jiān)護(hù)人同意”視為個(gè)人信息處理行為合法的條件之一;則兩者都處理個(gè)人信息免責(zé)的條件之一是既要征得主體“同意”又要在同意的范圍內(nèi)“合理實(shí)施”。可見,主體同意并沒有為信息處理者創(chuàng)設(shè)自由,不產(chǎn)生“授權(quán)”的法律效果,概括同意或推定同意的授權(quán)模式已明確為法律所禁止。因此,抓取公民個(gè)人信息行為作為對已沉淀于特定網(wǎng)絡(luò)數(shù)據(jù)控制者的信息次收集,其合法的基礎(chǔ)是“一個(gè)原則、三個(gè)條件”:抓取行為是否遵循合法、正當(dāng)、必要原則,是否征得個(gè)人的同意,抓取的范圍是否合理,數(shù)據(jù)控制者提供或公開的被爬數(shù)據(jù)是否屬于依法被授權(quán)。換言之,除已獲得個(gè)人對數(shù)據(jù)控制者允許數(shù)據(jù)被處理的明確授權(quán)或?qū)儆凇秱€(gè)人信息保護(hù)法》第13條第七款、《民法典》第1035條第一款“法律、行政法規(guī)另有規(guī)定”的情形,以公民個(gè)人信息為對象的網(wǎng)絡(luò)抓取行為均不具有合法性的基礎(chǔ)。
3. 個(gè)人授權(quán)無需再經(jīng)平臺(tái)同意。形式上看,網(wǎng)絡(luò)平臺(tái)上的沉淀的一切個(gè)人信息均已被該具體的予以平臺(tái)個(gè)性化加持,形成了個(gè)人及網(wǎng)絡(luò)平臺(tái)雙重共有的財(cái)產(chǎn)權(quán)益,抓取方獲取數(shù)據(jù)需滿足個(gè)人信息主體和網(wǎng)絡(luò)平臺(tái)的“雙重授權(quán)”原則。但實(shí)質(zhì)上,個(gè)人信息沉淀于網(wǎng)絡(luò)平臺(tái)前提是信息主體的授權(quán)許可,平臺(tái)是否享有財(cái)產(chǎn)利益“取決于數(shù)據(jù)主體對自身的財(cái)產(chǎn)利益是否進(jìn)行了處分”②任丹麗. 民法典框架下個(gè)人數(shù)據(jù)財(cái)產(chǎn)法益的體系構(gòu)建[J]. 法學(xué)論壇. 2021,36(02):89-98.,且平臺(tái)的財(cái)產(chǎn)利益無法對抗信息主體。個(gè)人有權(quán)通過一定的方式訪問、查詢、下載或復(fù)制網(wǎng)絡(luò)平臺(tái)上的數(shù)據(jù)信息,若抓取數(shù)據(jù)方基于合同關(guān)系獲得個(gè)人授權(quán),以特定賬戶加密碼等方式訪問、查詢、復(fù)制這些信息,等同于該網(wǎng)絡(luò)平臺(tái)用戶自己在登錄、訪問、查詢和下載復(fù)制,自然無需再經(jīng)平臺(tái)同意。但是所抓取數(shù)據(jù)的范圍應(yīng)當(dāng)限定于用戶授權(quán)的范圍,且不得抓取平臺(tái)經(jīng)過加工整理后個(gè)性化展示的內(nèi)容用于不正當(dāng)競爭等非法目的。
4. 平臺(tái)授權(quán)并非個(gè)人授權(quán)同意。平臺(tái)經(jīng)濟(jì)下個(gè)人完全處于被動(dòng)依賴地位,其對平臺(tái)的授權(quán)以及平臺(tái)對其他合作主體或平臺(tái)的授權(quán)之間均存在不真實(shí)、不明確、不具體等情況。主體視角下,平臺(tái)在提供應(yīng)用或服務(wù)前通常以獲得用戶對其一定范圍內(nèi)個(gè)人信息收集或使用的授權(quán)為前提,但是該“授權(quán)”存在捆綁交易或服務(wù)違反真實(shí)意識(shí)表示、復(fù)雜格式條款未遵循公平原則而無效、基于脅迫的概括式同意范圍可隨意擴(kuò)展等諸多問題①程明皓.網(wǎng)貸領(lǐng)域爬蟲:既非原罪者也非無辜者[EB/OL]. https://m.mpaypass.com.cn/news/202003/30103442.html.最后訪問時(shí)間:2021年5月8日。。平臺(tái)視角下,基于收集獲得原生數(shù)據(jù)的平臺(tái)在對其他合作主體或平臺(tái)進(jìn)行信息數(shù)據(jù)的二次獲取或使用授權(quán)時(shí),往往已經(jīng)是以一種次生模式對信息數(shù)據(jù)進(jìn)行了差別化、碎片化、模型化的展示,其后還可能衍生無限次的數(shù)據(jù)流轉(zhuǎn),早已脫離了信息主體最初的授權(quán)同意場景。可見,抓取公民個(gè)人信息若是基于原生或次生平臺(tái)的授權(quán),無疑脫離了信息主體的真正授權(quán)同意。
基于前述分析,以公民個(gè)人信息為對象的網(wǎng)絡(luò)抓取行為合法的場景僅限于合法公開或主體的賬號加密碼方式授權(quán),但鑒于公民個(gè)人信息的特殊屬性,場景合法情況下爬取公民個(gè)人信息行為還可能因違反協(xié)議而涉嫌民事侵權(quán),包括無數(shù)據(jù)處理協(xié)議情況下違反合理的爬蟲協(xié)議、有數(shù)據(jù)處理協(xié)議情況下的超出協(xié)議范圍或約定方式以及“爬蟲+”情境下偽造主體身份模擬登陸后的數(shù)據(jù)抓取。
1. 爬蟲協(xié)議及其合理限制。爬蟲協(xié)議又稱為機(jī)器人協(xié)議(robots協(xié)議),是互聯(lián)網(wǎng)站所有者基于商業(yè)競爭、數(shù)據(jù)安全或用戶隱私,利用robots.txt文件向網(wǎng)絡(luò)機(jī)器人(Web robots)給出網(wǎng)站指令的協(xié)議。作為一種“代碼規(guī)制”,爬蟲協(xié)議從技術(shù)上并不能阻止目標(biāo)數(shù)據(jù)被爬,但目前已得到互聯(lián)網(wǎng)搜索行業(yè)的普遍遵循,一些法院判決也認(rèn)可其效力②參見北京市知識(shí)產(chǎn)權(quán)法院(2017)京民終某號判決書。。國內(nèi)多家互聯(lián)網(wǎng)搜索引擎服務(wù)公司還通過行業(yè)協(xié)會(huì)約定,開展搜索引擎服務(wù)要“遵循國際通行的行業(yè)慣例與商業(yè)規(guī)則,遵守機(jī)器人協(xié)議”、限制搜索應(yīng)當(dāng)具有“行業(yè)公認(rèn)合理的正當(dāng)理由”、不得利用協(xié)議“進(jìn)行不正當(dāng)競爭行為”③中國互聯(lián)網(wǎng)協(xié)會(huì):《互聯(lián)網(wǎng)搜索引擎服務(wù)自律公約》[EB/OL].https://www.isc.org.cn/hyzl/hyzl/listinfo-25501.html.最后訪問時(shí)間:2021年5月10日。。因此,在確保數(shù)據(jù)不用于進(jìn)行不正當(dāng)競爭前提下,基于主體授權(quán)后對平臺(tái)上的個(gè)人信息進(jìn)行抓取是否涉嫌民事侵權(quán),還要審視該平臺(tái)爬蟲協(xié)議所保護(hù)內(nèi)容是否具有明確排他性私權(quán)和有無以針對性、歧視性的方式限制公平競爭,否則該爬蟲協(xié)議可能因?qū)ψト⌒袨榈南拗迫鄙俸侠硇远猾@法院支持。
2. 數(shù)據(jù)合作協(xié)議及其效力。從技術(shù)上講,網(wǎng)絡(luò)數(shù)據(jù)獲取的方式可分為抓取和獲取兩種。前者是搜索引擎未經(jīng)數(shù)據(jù)控制方授權(quán),通過爬蟲程序自行分析網(wǎng)頁上的非結(jié)構(gòu)化數(shù)據(jù);而后者是經(jīng)過數(shù)據(jù)控制方授權(quán)后,根據(jù)協(xié)議的數(shù)據(jù)需求,通過數(shù)據(jù)控制方提供的不同開放平臺(tái)接口(OpenAPI)獲取結(jié)構(gòu)化數(shù)據(jù)。數(shù)據(jù)合作協(xié)議看似與普通的民事合作協(xié)議無異,基于合作協(xié)議,數(shù)據(jù)的獲取無需借助爬蟲,數(shù)據(jù)的提供方也可以通過技術(shù)手段設(shè)置相應(yīng)的權(quán)限級別來對其獲取用戶相關(guān)信息的權(quán)限進(jìn)行嚴(yán)格控制。但公民個(gè)人信息是特殊的數(shù)據(jù)信息資源,平臺(tái)之間通過OpenAPI可協(xié)議獲取的范圍必須以明確獲得主體的授權(quán)為前置條件,且第三方平臺(tái)在后續(xù)使用時(shí),還應(yīng)當(dāng)明確告知用戶其使用的目的、方式和范圍并再次取得用戶的同意。從其他平臺(tái)協(xié)議獲取數(shù)據(jù)并使用不符合“用戶授權(quán)”+“平臺(tái)授權(quán)”+“用戶授權(quán)”的三重授權(quán)原則,或者在數(shù)據(jù)合作協(xié)議范圍之外抓取數(shù)據(jù)的行為,無異也是涉嫌民事侵權(quán)。
3. 偽造主體身份的數(shù)據(jù)抓取。自爬蟲技術(shù)誕生以來,網(wǎng)絡(luò)空間爬蟲與反爬蟲的爭議和斗爭就從未停止。數(shù)據(jù)權(quán)益語境下,以特定數(shù)據(jù)為目標(biāo),無視平臺(tái)的多重反爬技術(shù)設(shè)置,利用爬蟲技術(shù)與模擬登陸、秒撥動(dòng)態(tài)IP等技術(shù)的組合升級來強(qiáng)行抓取數(shù)據(jù)的行為具有明顯的非法性①蘇青.網(wǎng)絡(luò)爬蟲的演變及其合法性限定[J]. 比較法研究,2021,(3):89-104.。以基于robots協(xié)議禁止網(wǎng)絡(luò)爬蟲抓取信息的新浪微博為例,雖然定期升級自身的反爬措施,但還是會(huì)經(jīng)常會(huì)面臨一些數(shù)據(jù)收集者,通過建立大量微博賬戶來模擬正常用戶行為,或者購買大量IP來偽造調(diào)用IP來源,通過偽造為正常用戶的請求在互聯(lián)網(wǎng)主頁、移動(dòng)客戶端等進(jìn)行數(shù)據(jù)抓取。對于此類行為,數(shù)據(jù)控制方只能記錄到大量的非正常訪問相關(guān)印記,卻無法識(shí)別出具體的爬取方也無法區(qū)分相關(guān)數(shù)據(jù)是如何被爬取的。這種行為既非法收集了控制方的數(shù)據(jù)信息又?jǐn)_亂了正常用戶的訪問秩序,無異是侵犯了數(shù)據(jù)控制方的合法權(quán)益。
任何信息的獲取都是為了利用或變相利用,爬取公民個(gè)人信息行為除其本身涉嫌對信息的不正當(dāng)獲取外,其與不正當(dāng)利用雖有表象的區(qū)別但又有著實(shí)質(zhì)的關(guān)聯(lián),還體現(xiàn)為對相關(guān)法益的侵害或威脅。而作為代碼化的技術(shù),爬蟲對目標(biāo)個(gè)人信息數(shù)據(jù)的收集必然伴隨著對計(jì)算機(jī)系統(tǒng)的侵入,甚至指向特定的技術(shù)領(lǐng)域。判斷以公民個(gè)人信息為對象的網(wǎng)絡(luò)抓取行為是否入罪,關(guān)鍵要從整體上考量其對具體法益實(shí)質(zhì)的侵害與威脅,以具體的法益保護(hù)導(dǎo)向來類化其入罪路徑、界定其入罪標(biāo)準(zhǔn)。
1. 侵犯網(wǎng)絡(luò)安全和數(shù)據(jù)安全。我國《刑法》第285條至第287條有關(guān)網(wǎng)絡(luò)犯罪立法的主要目的是維護(hù)網(wǎng)絡(luò)安全和數(shù)據(jù)安全,前者以網(wǎng)絡(luò)訪問控制、防網(wǎng)絡(luò)攻擊等為手段來維護(hù)網(wǎng)絡(luò)邊界和安全域、網(wǎng)絡(luò)通信系統(tǒng)或傳輸安全、網(wǎng)絡(luò)空間主權(quán)等,后者以加密、脫敏等手段來實(shí)現(xiàn)數(shù)據(jù)保護(hù)、數(shù)據(jù)主權(quán)、隱私保護(hù)等②鄭云文:數(shù)據(jù)安全——架構(gòu)設(shè)計(jì)與實(shí)戰(zhàn)[M].北京:機(jī)械工業(yè)出版社,2019:8-10.。實(shí)踐中,互聯(lián)網(wǎng)平臺(tái)根據(jù)《網(wǎng)絡(luò)安全法》關(guān)于維護(hù)系統(tǒng)和數(shù)據(jù)安全的相關(guān)要求,均采取了一定的安全策略和安全防護(hù)措施。為抓取目標(biāo)數(shù)據(jù),本身不具有攻擊性的爬蟲技術(shù),必須加持一定的模擬登陸、偽造IP等破解技術(shù)進(jìn)而演變?yōu)椤芭老x+”,來突破計(jì)算機(jī)信息系統(tǒng)有關(guān)反“爬蟲”的安防措施。上海某某網(wǎng)絡(luò)科技有限公司、侯某強(qiáng)等非法獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)罪一案③參見北京市海淀區(qū)人民法院(2017)京0108刑初某號刑事判決書。,被告方為破解北京某某網(wǎng)絡(luò)技術(shù)有限公司的防抓取措施,使用特殊的數(shù)據(jù)抓取工具,通過偽造用戶身份(ID)、用戶代理(UA)及偽裝IP來源方式繞過服務(wù)器的身份校驗(yàn)和訪問頻率限制,最終被法院認(rèn)定為非法獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)罪。此案中,被告方為強(qiáng)行抓取通過反爬措施明確限制訪問、獲取的目標(biāo)數(shù)據(jù),行為上采取故意避開或強(qiáng)行破解網(wǎng)站的技術(shù)措施,且抓取的數(shù)據(jù)用于不正當(dāng)競爭,造成了被抓取方的實(shí)際損失,侵犯了刑法所保護(hù)的網(wǎng)絡(luò)安全和數(shù)據(jù)安全法益。
2. 抓取可識(shí)別性的個(gè)人信息。我國《刑法》第253條有關(guān)侵犯公民個(gè)人信息罪的立法目的是要規(guī)范三種行為:一是違反國家有關(guān)規(guī)定向他人出售或者提供,二是違反國家有關(guān)規(guī)定將在履行職責(zé)或者提供服務(wù)過程中獲得的公民個(gè)人信息出售或者提供給他人,三是竊取或者以其他方法非法獲取,爬蟲抓取公民個(gè)人信息顯然不屬于“違反國家有關(guān)規(guī)定”的出售或提供,也不可能存在于履行職責(zé)或提供服務(wù)過程中。因此,判斷抓取可識(shí)別個(gè)人信息行為是否入罪,關(guān)鍵在于其是否屬于“竊取”或以其他方式“非法獲取”。突破了合理限制且未經(jīng)授權(quán)或個(gè)人同意的抓取可識(shí)別個(gè)人信息行為,經(jīng)前述分析可見不具有合法性基礎(chǔ)且有侵犯個(gè)人或數(shù)據(jù)平臺(tái)權(quán)益的可能,顯然屬于此處的“竊取”或“非法獲取”,情節(jié)嚴(yán)重的侵犯了刑法所保護(hù)的個(gè)人信息安全法益。當(dāng)然,行為人使用爬蟲或“爬蟲+”軟件程序,避開或者突破計(jì)算機(jī)信息系統(tǒng)安全保護(hù)措施,未經(jīng)授權(quán)或者超越授權(quán)獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)中公民個(gè)人信息的行為,同時(shí)觸犯非法獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)罪、破壞計(jì)算機(jī)信息系統(tǒng)罪與侵犯公民個(gè)人信息罪,屬于一行為觸犯數(shù)罪名的想象競合犯。
個(gè)人信息是數(shù)字時(shí)代一切財(cái)富與經(jīng)濟(jì)的根本出發(fā)點(diǎn),相關(guān)的法律制度也在動(dòng)態(tài)契合中努力探尋著合理使用與充分保護(hù)之間的權(quán)益平衡?!皬谋Wo(hù)個(gè)人信賴或交易安全的角度,一個(gè)社會(huì)不應(yīng)當(dāng)賦予個(gè)人控制自己的個(gè)人信息的絕對權(quán),或者說法律不應(yīng)當(dāng)作出非經(jīng)本人同意就不能獲取其個(gè)人信息的規(guī)定”①高富平. 個(gè)人信息保護(hù):從個(gè)人控制到社會(huì)控制[J]. 法學(xué)研究,2018,(3):84-101.。對抓取個(gè)人信息行為,也應(yīng)該基于其大數(shù)據(jù)時(shí)代社會(huì)性取代個(gè)人性成為主要屬性這一理念嬗變②王懷勇,常宇豪. 個(gè)人信息保護(hù)的理念嬗變與制度變革[J]. 法制與社會(huì)發(fā)展,2020,(6):140-159.,在法律的框架內(nèi)對其持謹(jǐn)慎開放的態(tài)度。況且當(dāng)前網(wǎng)絡(luò)空間個(gè)人信息的非法獲取、流轉(zhuǎn)、利用等諸多亂象源于各種風(fēng)險(xiǎn)因素集合疊加,并非爬蟲“一蟲之力”,需要多視角探尋依法規(guī)制的具體路徑。
侵犯公民個(gè)人信息具有“非接觸式”和“非即時(shí)性”特征,受害人普遍無法第一時(shí)間產(chǎn)生“被害感知”③汪明亮. 治理侵犯公民個(gè)人信息犯罪之刑罰替代措施[J]. 東方法學(xué),2019,(2):16-28.,對個(gè)人信息被非法獲取的發(fā)覺能力和警覺程度遠(yuǎn)低于被非法利用場景。而且鑒于個(gè)人信息在網(wǎng)絡(luò)空間數(shù)字化、代碼式的獨(dú)立存在,受害人甚至是數(shù)據(jù)平臺(tái)均無法從技術(shù)上實(shí)現(xiàn)“實(shí)時(shí)標(biāo)識(shí)跟蹤”。雖然《個(gè)人信息保護(hù)法》規(guī)定了個(gè)人信息主體的查詢、復(fù)制、撤回同意、請求刪除等權(quán)利,以及承擔(dān)損害賠償?shù)惹謾?quán)責(zé)任等責(zé)任形式,《民法典》還規(guī)定了停止侵害、消除影響等責(zé)任形式,但因缺少“及時(shí)發(fā)現(xiàn)”這一前置條件,且舉證能力受限,個(gè)人基于民法條款對非法抓取個(gè)人信息行為進(jìn)行救濟(jì)很難實(shí)現(xiàn)。因此,民事視角保護(hù)個(gè)人信息免被抓取,有賴于個(gè)人視角的主張侵權(quán)和數(shù)據(jù)平臺(tái)基于不正當(dāng)競爭的倒查。
1. 個(gè)人視角主張侵權(quán)。前述可知,抓取行為合法的必要前提限于個(gè)人信息的合法存在且已公開或獲得授權(quán),而個(gè)人信息的合法存在依賴于具體的場景,雖然用戶已將個(gè)人信息發(fā)布于具體的平臺(tái)上,但第三方平臺(tái)仍不得基于未經(jīng)授權(quán)的爬取而隨意使用,否則將構(gòu)成對公民個(gè)人信息的侵權(quán)。在孫某某訴北京某科技一案中,某公司通過搜索引擎爬蟲技術(shù)從校友錄網(wǎng)站上抓取原告孫某寶帶有其面目特征信息的頭像照片,并通過關(guān)鍵詞搜索加結(jié)果展示的形式將“孫某某”這一自然人姓名和照片進(jìn)行關(guān)聯(lián),使得個(gè)人信息脫離了“校友錄網(wǎng)站上傳的個(gè)人證件照和真實(shí)姓名僅限班級同學(xué)可見”的具體場景,且在孫某某兩次通知后仍未采取措施消除不良影響,被法院認(rèn)定為侵犯了孫某某的個(gè)人信息權(quán)益①參見北京互聯(lián)網(wǎng)法院(2019)京0491民初某號民事判決書。。
2. 平臺(tái)視角主張不正當(dāng)競爭。數(shù)字時(shí)代持續(xù)激發(fā)商業(yè)新模式、不斷催生市場新業(yè)態(tài),消費(fèi)畫像、精準(zhǔn)營銷、個(gè)性推送理念下,微博上的“轉(zhuǎn)”“評”“贊”“刪”記錄,美團(tuán)、淘寶、京東等互聯(lián)網(wǎng)平臺(tái)上的交易記錄、消費(fèi)評價(jià)、行為軌跡,甚至前程無憂職介網(wǎng)所記載的職業(yè)信息、珍愛婚介網(wǎng)所記載的教育履歷等個(gè)人信息,都已經(jīng)成為競相爭奪的數(shù)據(jù)“礦產(chǎn)”。當(dāng)前流量紅利漸失,單純依靠平臺(tái)用戶活躍生產(chǎn)內(nèi)容需要漫長時(shí)間積累且難以觸頂規(guī)模量級,不少平臺(tái)都選擇“爬蟲”抓取、抄襲同業(yè)競爭數(shù)據(jù)的“捷徑”來拓展影響力、吸引新用戶,某互聯(lián)網(wǎng)平臺(tái)最為核心的2100萬“真實(shí)點(diǎn)評”里面有1800萬條是通過機(jī)器人從點(diǎn)評和某互聯(lián)網(wǎng)公司等競爭對手那里抄襲過來的”②參見《馬蜂窩被曝點(diǎn)評造假,是行業(yè)原罪還是企業(yè)弊端》,來源:http://www.guigu.org/content/20181022125873.html,最后訪問時(shí)間:2021年6月21日。。公民個(gè)人在網(wǎng)絡(luò)平臺(tái)的個(gè)性化推薦和點(diǎn)評內(nèi)容等信息數(shù)據(jù),具有平臺(tái)加持和個(gè)人痕跡雙重屬性,競爭公司以“機(jī)器抓取+人工編輯”方式獲取此類數(shù)據(jù)用于商業(yè)活動(dòng)明顯屬于不正當(dāng)競爭。在A公司訴B公司不正當(dāng)競爭一案中,B公司在其檢索結(jié)果界面直接全部呈現(xiàn)A公司用戶的點(diǎn)評信息,被法院認(rèn)定為B方“超出必要限度使用涉案信息”,損害了數(shù)據(jù)采集方的利益,該行為“破壞正常的產(chǎn)業(yè)生態(tài),并對競爭秩序產(chǎn)生一定的負(fù)面影響”③參見上海知識(shí)產(chǎn)權(quán)法院(2016)滬73民終某號民事判決書。。同樣,C公司訴D軟件公司一案中,法院也認(rèn)為“任由技術(shù)抓取能力獲取信息的方式如果不加規(guī)范必將引發(fā)技術(shù)的惡性競爭”,脈脈未經(jīng)同意和授權(quán),“獲取、使用脈脈用戶手機(jī)通訊錄中非脈脈用戶聯(lián)系人與新浪微博用戶對應(yīng)關(guān)系的行為”④參見北京知識(shí)產(chǎn)權(quán)法院(2016)京73民終某號民事判決書。,有損互聯(lián)網(wǎng)行業(yè)有序公平的市場競爭秩序、構(gòu)成不正當(dāng)競爭。
作為普適性的信息檢索收集技術(shù),爬蟲本身不具有規(guī)范違反的特征。從刑法謙抑性視角出發(fā),有觀點(diǎn)認(rèn)為“基于非法目的的出售或提供行為才具有刑法意義上的實(shí)質(zhì)違法性,也只有基于非法目的的出售或提供行為才有必要?jiǎng)佑眯谭ㄟM(jìn)行規(guī)制”⑤高富平,王文祥. 出售或提供公民個(gè)人信息入罪的邊界——以侵犯公民個(gè)人信息罪所保護(hù)的法益為視角[J]. 政治與法律,2017,(2):46-55.。但我們應(yīng)當(dāng)看到,信息的獲取是出售或提供行為的基礎(chǔ),當(dāng)前刑法選擇性打擊的傾向,在一定程度上也喪失了對形式多變的各類涉公民個(gè)人信息犯罪打擊的精準(zhǔn)性,需要從多維的視角對網(wǎng)絡(luò)抓取公民個(gè)人信息行為進(jìn)行考量,立體化其刑事規(guī)制路徑。
1. 對信息系統(tǒng)非法侵入的考量。未經(jīng)授權(quán)利用爬蟲技術(shù)非法進(jìn)入計(jì)算機(jī)信息系統(tǒng)內(nèi)部,如果有故意避開或突破技術(shù)防護(hù)措施的行為,體現(xiàn)出明顯的“采用侵入或其他技術(shù)手段”,則其侵入行為本身可能構(gòu)成犯罪。對于侵入非特殊領(lǐng)域計(jì)算機(jī)信息系統(tǒng),若爬取數(shù)據(jù)時(shí)使用技術(shù)暴力破解系統(tǒng)安全防護(hù)或輔以進(jìn)行多線程提交、批量刷單、驗(yàn)證碼自動(dòng)識(shí)別等非正常訪問的方式,造成網(wǎng)站訪問擁堵、系統(tǒng)運(yùn)行崩潰,甚至將爬蟲技術(shù)濫用為網(wǎng)絡(luò)攻擊方式①劉艷紅,楊志瓊. 網(wǎng)絡(luò)爬蟲的入罪標(biāo)準(zhǔn)與路徑研究[J]. 人民檢察,2020,(15):26-31.,后果嚴(yán)重的可能構(gòu)成破壞計(jì)算機(jī)信息系統(tǒng)罪。若是侵入的對象為涉及國家安全和國家秘密的政府內(nèi)網(wǎng)、國防建設(shè)、尖端科學(xué)技術(shù)領(lǐng)域的計(jì)算機(jī)信息系統(tǒng),只要實(shí)施了侵入行為即構(gòu)成非法侵入計(jì)算機(jī)信息系統(tǒng)罪。當(dāng)然,如果非法侵入后獲取了該計(jì)算機(jī)信息系統(tǒng)內(nèi)部存儲(chǔ)、處理或者傳輸?shù)臄?shù)據(jù),或者對該計(jì)算機(jī)信息系統(tǒng)實(shí)施非法控制,將爬蟲用作“專門用于侵入、非法控制計(jì)算機(jī)信息系統(tǒng)的程序、工具”,則可能會(huì)構(gòu)成非法獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)、非法控制計(jì)算機(jī)信息系統(tǒng)罪。而對于爬蟲或變異爬蟲技術(shù)的提供行為,明知該技術(shù)專門用于侵入、非法控制計(jì)算機(jī)信息系統(tǒng),或者明知他人為實(shí)施侵入、非法控制計(jì)算機(jī)信息系統(tǒng)的違法犯罪行為而提供,情節(jié)嚴(yán)重的則可能構(gòu)成提供侵入、非法控制計(jì)算機(jī)系統(tǒng)程序、工具罪。
2. 對個(gè)人信息非法獲取的考量。前述論述可見,在未獲信息主體的明確同意或授權(quán)情境下,抓取非依法公開的公民個(gè)人信息顯然屬于“非法獲取”的范疇。根據(jù)現(xiàn)行刑法規(guī)定,竊取或者以其他方法非法獲取公民個(gè)人信息,情節(jié)嚴(yán)重的構(gòu)成侵犯公民個(gè)人信息罪。從行為表征來看,利用爬蟲技術(shù)非法獲取行為,與“購買、收受、交換”等非法手段獲取行為,以及與網(wǎng)絡(luò)運(yùn)營者未經(jīng)被收集者同意或超出必要范圍收集行為,三者都違反了法律、行政法規(guī)、部門規(guī)章有關(guān)公民個(gè)人信息保護(hù)的具體規(guī)定,無論是所侵犯的個(gè)人信息權(quán)法益②楊志瓊. 數(shù)據(jù)時(shí)代網(wǎng)絡(luò)爬蟲的刑法規(guī)制[J]. 比較法研究,2020,(4):185-200.,還是行為所造成的個(gè)人信息失控客觀后果,均無實(shí)質(zhì)的區(qū)別。根據(jù)相關(guān)司法解釋③參見《最高人民法院、最高人民檢察院關(guān)于辦理侵犯公民個(gè)人信息刑事案件適用法律若干問題的解釋》,來源:https://mp.weixin.qq.com/s/YzKveektM2IwKbjCY3w5uw,最后訪問時(shí)間:2021年6月21日。,若非法爬取的公民個(gè)人信息系行蹤軌跡等四類關(guān)鍵信息五十條以上,系住宿信息、等其他可能影響人身、財(cái)產(chǎn)安全的公民個(gè)人信息五百條以上,系一般公民個(gè)人信息達(dá)五千條以上的,構(gòu)成侵犯公民個(gè)人信息罪。
3. 對幫助犯罪主觀故意的考量。剝離前述涉嫌非法收集公民個(gè)人信息的對象特殊性和以爬蟲技術(shù)作為入侵計(jì)算機(jī)系統(tǒng)的手段特殊性,單純的爬取公民個(gè)人信息的行為還可能因其牽連于網(wǎng)絡(luò)犯罪的幫助行為,獨(dú)立構(gòu)成幫助信息網(wǎng)絡(luò)犯罪活動(dòng)罪,這與網(wǎng)絡(luò)空間涉公民個(gè)人信息犯罪無限衍生化有關(guān)。根據(jù)相關(guān)司法解釋④同上。,行為人實(shí)施信息獲取行為時(shí),主觀上有或被推定明知他人有利用信息網(wǎng)絡(luò)實(shí)施犯罪的故意,仍為犯罪提供技術(shù)支持,并符合司法解釋中關(guān)于情節(jié)嚴(yán)重的要求,可構(gòu)成幫助信息網(wǎng)絡(luò)犯罪活動(dòng)罪?;谶@一幫助犯正犯化和幫助犯獨(dú)立性司法態(tài)度,考量以公民個(gè)人信息為對象的爬取行為,還必須同時(shí)辨析其信息獲取后如何利用的主觀故意。當(dāng)然,如果在提供爬蟲技術(shù)支持時(shí)主觀上不明知或根據(jù)現(xiàn)有證據(jù)無法推定其技術(shù)支持、幫助的行為被犯罪活動(dòng)所利用, 則不能構(gòu)成幫助信息網(wǎng)絡(luò)犯罪活動(dòng)罪。
4. 對整合目的抓取公開信息的考量。當(dāng)前,結(jié)合“撞庫”分析、算法匹配等人工智能技術(shù)手段,利用爬蟲或“爬蟲+”海量抓取網(wǎng)絡(luò)上與公民個(gè)人信息有關(guān)的已公開信息資料,繼而進(jìn)行全面整合以獲取有利用價(jià)值的公民個(gè)人信息,已成為新型網(wǎng)絡(luò)黑灰產(chǎn)業(yè)的主要內(nèi)容。此處的抓取公開信息雖將對象限定于“已公開”,但經(jīng)過整合后的“已公開”顯然突破了最初的公開目的和場景,具有侵犯公民隱私權(quán)的蓋然化和實(shí)質(zhì)性。有些情境下,經(jīng)授權(quán)被抓取的個(gè)人信息并未即時(shí)流轉(zhuǎn)于網(wǎng)絡(luò)空間,而是緩存于一定數(shù)據(jù)庫中等待被整合后“再利用”。在某科技侵犯公民個(gè)人信息一案中,法院認(rèn)定某科技利用各類爬蟲技術(shù)爬取“貸款用戶本人賬戶內(nèi)的通話記錄、社保、公積金等各類數(shù)據(jù)”,未經(jīng)許可“以明文形式非法保存的個(gè)人貸款用戶各類賬號和密碼條數(shù)多達(dá)21241504條”①參見杭州市西湖區(qū)人民法院(2020)浙0106刑初某號刑事判決書。。雖然抓取已公開信息、經(jīng)授權(quán)抓取個(gè)人信息以及利用人工智能技術(shù)對所收集的信息進(jìn)行整合三種行為本身均不違反國家的法律規(guī)定,但基于個(gè)人信息整合目的作出類似于“電子人肉”行為,仍會(huì)帶來公民個(gè)人信息的永續(xù)濫用,有必要從侵犯公民個(gè)人信息罪視角予以規(guī)制。
相對與技術(shù)的飛躍,個(gè)人及數(shù)據(jù)平臺(tái)對信息數(shù)據(jù)的保護(hù)具有后覺性,加之法律體系的不完善,當(dāng)前我國對于公民個(gè)人信息的保護(hù)具有典型的“先刑后民”特色,而以專項(xiàng)整治方式為主的行政規(guī)制更是體現(xiàn)出明顯的階段性和運(yùn)動(dòng)式。但是從長遠(yuǎn)看,我國應(yīng)該逐漸完善形成以行政手段保護(hù)為主、以消費(fèi)者和數(shù)據(jù)平臺(tái)保護(hù)為雙核心、以刑事規(guī)制為輔的個(gè)人信息保護(hù)格局。當(dāng)前,行政監(jiān)管部門應(yīng)該積極變消極守門人為積極執(zhí)法者,針對非法抓取公民個(gè)人信息可能違反法律規(guī)定尚不構(gòu)成犯罪的行為,主動(dòng)加強(qiáng)執(zhí)法監(jiān)管。
1. 對信息獲取者違反規(guī)定行為的規(guī)制。綜合我國《個(gè)人信息保護(hù)法》、《網(wǎng)絡(luò)安全法》、《數(shù)據(jù)安全法》、《治安管理處罰法》等有關(guān)法律法規(guī),從目標(biāo)指向看爬蟲非法抓取公民個(gè)人信息涉嫌“竊取或者以其他非法方式獲取”數(shù)據(jù)信息。我國網(wǎng)絡(luò)安全法和數(shù)據(jù)安全法都明確規(guī)定,對于個(gè)人信息和數(shù)據(jù)不得有“竊取或者以其他非法方式獲取”行為,但對相應(yīng)法律責(zé)任的規(guī)定則不盡相同?!秱€(gè)人信息保護(hù)法》對違反“本法”規(guī)定,構(gòu)成違反治安管理行為的,依法給予治安管理處罰;《網(wǎng)絡(luò)安全法》對違反“本法”規(guī)定尚不構(gòu)成犯罪的,賦予公安機(jī)關(guān)“沒收違法所得,并處違法所得一倍以上十倍以下罰款,沒有違法所得的,處一百萬元以下罰款”的處罰權(quán)限;而《數(shù)據(jù)安全法》則規(guī)定:“違反本法規(guī)定,構(gòu)成違反治安管理行為的,依法給予治安管理處罰”。
從具體過程看,強(qiáng)行抓取或以變異爬蟲技術(shù)抓取個(gè)人信息涉嫌危害網(wǎng)絡(luò)安全或計(jì)算機(jī)系統(tǒng)。抓取行為未經(jīng)授權(quán)或超出權(quán)限,或者所使用的爬蟲及“爬蟲+”技術(shù)突破合理限制體現(xiàn)出明顯侵入性,可以相應(yīng)認(rèn)定為侵入計(jì)算機(jī)信息系統(tǒng)造成危害,同時(shí)該行為也可能違反網(wǎng)絡(luò)安全法涉嫌從事非法侵入他人網(wǎng)絡(luò)活動(dòng);使用自動(dòng)抓取程序,加重被抓網(wǎng)站運(yùn)維負(fù)荷甚至造成癱瘓,則可以認(rèn)定為對計(jì)算機(jī)信息系統(tǒng)功能進(jìn)行干擾造成計(jì)算機(jī)信息系統(tǒng)不能正常運(yùn)行,同時(shí)該行為也可能違反網(wǎng)絡(luò)安全法涉嫌干擾他人網(wǎng)絡(luò)正常功能。依據(jù)《數(shù)據(jù)安全法》和《治安管理處罰法》,前述行為不構(gòu)成犯罪的,“處5日以下拘留;情節(jié)較重的,處5日以上10日以下拘留”。依據(jù)網(wǎng)絡(luò)安全法,前述行為尚不構(gòu)成犯罪的,“由公安機(jī)關(guān)沒收違法所得,處五日以下拘留,可以并處五萬元以上五十萬元以下罰款;情節(jié)較重的,處五日以上十五日以下拘留,可以并處十萬元以上一百萬元以下罰款?!笨梢?,對于非法抓取公民個(gè)人信息行為,公安機(jī)關(guān)有責(zé)任和義務(wù)在職責(zé)范圍內(nèi)主動(dòng)發(fā)現(xiàn)、調(diào)查、處理,并可以根據(jù)具體的行為實(shí)事和違法情節(jié)給予沒有違法所得、罰款、行政拘留的行政處罰。
從技術(shù)規(guī)制看,開發(fā)變異爬蟲技術(shù)向他人提供,可能構(gòu)成“為危害網(wǎng)絡(luò)安全行為提供專門程序、工具”,或者明知他人從事危害網(wǎng)絡(luò)安全的活動(dòng)的提供技術(shù)支持,同樣違反《網(wǎng)絡(luò)安全法》給予沒收違法所得、罰款、拘留的處罰。若爬蟲技術(shù)同時(shí)結(jié)合破壞性程序,暴力抓取目標(biāo)數(shù)據(jù),則可以相應(yīng)認(rèn)定故意制作、傳播計(jì)算機(jī)病毒等破壞性程序影響計(jì)算機(jī)信息系統(tǒng)正常運(yùn)行,則同樣違反《治安管理處罰法》第29條之規(guī)定給予行政拘留的處罰。
2. 對數(shù)據(jù)平臺(tái)未盡安全保護(hù)義務(wù)的規(guī)制。網(wǎng)絡(luò)平臺(tái)作為網(wǎng)絡(luò)運(yùn)營者和數(shù)據(jù)處理者,對其受收集的個(gè)人信息應(yīng)當(dāng)采取必要的安全保護(hù)措施,防止被爬取致泄露?!秱€(gè)人信息保護(hù)法》規(guī)定:個(gè)人信息處理者應(yīng)當(dāng)根據(jù)需要對個(gè)人信息實(shí)行分類管理、采取加密或去標(biāo)識(shí)化等安全技術(shù)措施等一系列保護(hù)措施,并指定個(gè)人信息保護(hù)負(fù)責(zé)人、定期開展個(gè)人信息保護(hù)影響評估,對發(fā)生或者可能發(fā)生個(gè)人信息泄露、篡改、丟失的應(yīng)當(dāng)采取必要補(bǔ)救措施并履行通知義務(wù);第58條還特別規(guī)定:“提供重要互聯(lián)網(wǎng)平臺(tái)服務(wù)、用戶數(shù)量巨大、業(yè)務(wù)類型復(fù)雜的個(gè)人信息處理者”應(yīng)當(dāng)建立健全個(gè)人信息保護(hù)合規(guī)制度體系、明確平臺(tái)內(nèi)產(chǎn)品或者服務(wù)提供者處理個(gè)人信息的規(guī)范和保護(hù)個(gè)人信息的義務(wù)、對違反個(gè)人信息保護(hù)規(guī)定的平臺(tái)內(nèi)產(chǎn)品或者服務(wù)提供者停止服務(wù)等。違反《個(gè)人信息保護(hù)法》可以由履行個(gè)人信息保護(hù)職責(zé)的部門責(zé)令改正,以及給予警告、沒收違法所得、責(zé)令暫停或者終止應(yīng)用程序提供服務(wù);對拒不改正的,可以對平臺(tái)及其直接負(fù)責(zé)的主管人員和其他直接責(zé)任人員處以罰款;對情節(jié)嚴(yán)重的,還可由省級以上履行個(gè)人信息保護(hù)職責(zé)的部門處以較大數(shù)額罰款以及“責(zé)令暫停相關(guān)業(yè)務(wù)或者停業(yè)整頓、通報(bào)有關(guān)主管部門吊銷相關(guān)業(yè)務(wù)許可或者吊銷營業(yè)執(zhí)照”等較為嚴(yán)厲的處罰。依據(jù)《網(wǎng)絡(luò)安全法》規(guī)定未采取必要安全保護(hù)措施,或者依據(jù)《數(shù)據(jù)安全法》規(guī)定未盡數(shù)據(jù)安全保護(hù)義務(wù),可由有關(guān)主管部門責(zé)令改正,并可以根據(jù)情節(jié)依法依次對數(shù)據(jù)平臺(tái)及其直接負(fù)責(zé)的主管人員和其他直接責(zé)任人員給予一定數(shù)額的罰款,對情節(jié)嚴(yán)重或造成嚴(yán)重后果的,還可以相應(yīng)給予網(wǎng)絡(luò)平臺(tái)“責(zé)令暫停相關(guān)業(yè)務(wù)、停業(yè)整頓、吊銷相關(guān)業(yè)務(wù)許可證或者吊銷營業(yè)執(zhí)照”的處罰。同時(shí),依據(jù)《網(wǎng)絡(luò)安全法》還可以給予關(guān)閉網(wǎng)站的處罰措施。
數(shù)字化不僅是當(dāng)前這個(gè)時(shí)代的標(biāo)簽,它所引導(dǎo)的產(chǎn)業(yè)變革更是在深刻重塑這個(gè)時(shí)代。數(shù)據(jù)的擴(kuò)張必然結(jié)果是數(shù)據(jù)權(quán)益的占有、分配以及動(dòng)態(tài)抗?fàn)?,“大?shù)據(jù)技術(shù)擴(kuò)充的邏輯終點(diǎn)在于窮盡公民的個(gè)人信息,而公民在貢獻(xiàn)個(gè)人信息充實(shí)大數(shù)據(jù)時(shí)渴望個(gè)人信息被有限化利用”①許桂敏,張轉(zhuǎn). 非法獲取公民個(gè)人信息行為的智化、解讀與規(guī)制[J].中國人民公安大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2020,(6):130-142.。隨著爬蟲技術(shù)及其變異程序產(chǎn)品的工具屬性被無限放大,網(wǎng)絡(luò)空間公民個(gè)人信息必將面臨越來越突出的隱私、安全、異化、污染、鴻溝等信息倫理問題,以及公民個(gè)人被數(shù)據(jù)畫像、精準(zhǔn)營銷、信息敲詐、電信詐騙、網(wǎng)絡(luò)暴力等衍生社會(huì)問題。
爬蟲技術(shù)的不可或缺并非其無序?yàn)E用的有效抗辯,其存在本身以及持續(xù)的衍生、異化終究是加持了人為的設(shè)計(jì)、使用和導(dǎo)向,技術(shù)的無序性和明確的目的性又反向推動(dòng)爬蟲技術(shù)逐步脫離工具范疇,演變?yōu)椴辉倏陀^中立的各色載體,猶如刀和剪已不能再一概稱為鐵。因此,必須細(xì)化爬蟲技術(shù)所寄附的具體行為背后的目的,在具體的場景中類化其載體表現(xiàn)、構(gòu)建其依法治理的法理依據(jù)和規(guī)制路徑。特別是在當(dāng)前個(gè)人信息保護(hù)整體缺位環(huán)境下,截?cái)嘈畔⒎欠ㄊ占搭^,以法治的視角將網(wǎng)絡(luò)抓取公民個(gè)人信息行為納入具體的規(guī)制路徑情勢緊迫,急待理論和實(shí)務(wù)視角進(jìn)一步縱深探索。