徐孝娟 趙澤瑞 賈海洋 史如菊
(安徽大學(xué)管理學(xué)院,安徽 合肥 230039)
數(shù)字人文作為近幾年興起的交叉研究領(lǐng)域,因其研究工作量巨大、涉及內(nèi)容較為分散、經(jīng)費(fèi)支持有限及要求研究人員學(xué)科背景多元等特點(diǎn),結(jié)合眾包所具有的開(kāi)放式創(chuàng)新和群體智慧理念,可有效幫助項(xiàng)目管理者從外部獲取更有效、更經(jīng)濟(jì)、更優(yōu)質(zhì)的問(wèn)題解決方案,使得眾包在數(shù)字人文環(huán)境下迅速發(fā)展,不斷涌現(xiàn)理論及實(shí)踐研究成果,主題已延伸到美術(shù)、圖書(shū)館、檔案、博物館和教育機(jī)構(gòu)等領(lǐng)域[1-3]。如美國(guó)國(guó)會(huì)圖書(shū)館利用Flickr,邀請(qǐng)用戶對(duì)照片進(jìn)行標(biāo)簽和評(píng)論等;英國(guó)維多利亞和阿爾伯特博物館要求公眾評(píng)選最優(yōu)照片;國(guó)內(nèi)CADAL利用用戶定位描述不佳的圖書(shū)、修訂圖書(shū)的描述信息以及修訂期刊目次頁(yè)等;上海圖書(shū)館歷史文獻(xiàn)眾包平臺(tái)作為文本抄錄及元數(shù)據(jù)深度標(biāo)引的平臺(tái)。然而,眾包用戶在參與過(guò)程中會(huì)留下大量的個(gè)人信息被眾包項(xiàng)目平臺(tái)及第三方采集等,尤其是數(shù)字人文眾包這一非商業(yè)情境下,存在諸如密碼泄露、位置跟蹤、會(huì)話竊取、用戶權(quán)利不明確等隱私侵權(quán)問(wèn)題[4-5];同時(shí),我國(guó)學(xué)者也指出,志愿者隱私泄露是數(shù)字人文眾包中個(gè)人信息風(fēng)險(xiǎn)的重要問(wèn)題[6],且公眾隱私保障會(huì)顯著正向影響志愿者對(duì)公眾科學(xué)項(xiàng)目的信任[7]。
目前,有關(guān)眾包個(gè)人信息保護(hù)研究主要集中在個(gè)人數(shù)據(jù)保護(hù)、個(gè)人隱私和信息安全等主題[8-9],例如學(xué)者Yr A等和Meftah L等分別基于強(qiáng)化學(xué)習(xí)(PICRL)和軟件庫(kù),在不影響數(shù)據(jù)集質(zhì)量的情況下加強(qiáng)移動(dòng)眾包應(yīng)用程序?qū)τ脩粜畔⒌谋Wo(hù)力度[10-11];Xia H等基于索洛夫的隱私分類(lèi)法,對(duì)眾包中個(gè)人隱私的保護(hù)策略加以探討[12];Xiong P等和Lan Z等分別基于優(yōu)化獎(jiǎng)勵(lì)分配策略框架和購(gòu)買(mǎi)數(shù)據(jù)集框架來(lái)保護(hù)用戶隱私[13-14]。不難看出,上述研究多側(cè)重于從計(jì)算機(jī)方法技術(shù)的角度對(duì)眾包用戶個(gè)人信息的保護(hù)進(jìn)行探索。然而,對(duì)于眾包中隱私政策內(nèi)容設(shè)置的規(guī)范性及系統(tǒng)性等方面的研究尚需要進(jìn)一步完善。此外,隱私政策作為保障用戶個(gè)人信息權(quán)益和法律權(quán)益的重要一環(huán)[15-16],可以有效緩解用戶個(gè)人信息擔(dān)憂,優(yōu)化隱私保護(hù)框架[17-18]。目前國(guó)內(nèi)外學(xué)者已基于隱私政策在圖書(shū)館[19-21]、社交媒體APP[22-24]及移動(dòng)健康[25-26]等領(lǐng)域?qū)€(gè)人信息保護(hù)展開(kāi)探索,結(jié)果發(fā)現(xiàn),從隱私政策的角度可以幫助推進(jìn)個(gè)人信息保護(hù)政策的研究及實(shí)踐開(kāi)展。與此同時(shí),從數(shù)字人文眾包情境開(kāi)展個(gè)人信息保護(hù)方面的探索,可有效彌補(bǔ)非商業(yè)情境眾包理論及實(shí)踐應(yīng)用的不足,增加用戶對(duì)數(shù)字人文眾包項(xiàng)目的信任度,進(jìn)而提高參與度及忠誠(chéng)度。綜上所述,本研究將以“隱私政策”為視角,對(duì)數(shù)字人文眾包平臺(tái)中個(gè)人信息保護(hù)展開(kāi)探索。
美國(guó)是最早開(kāi)展眾包項(xiàng)目的國(guó)家并取得了階段成果,自此澳大利亞、英國(guó)、新西蘭等國(guó)都相繼開(kāi)展了數(shù)字人文眾包工作,并積累了豐富的理論及實(shí)踐經(jīng)驗(yàn)。與國(guó)外相比,國(guó)內(nèi)數(shù)字人文眾包平臺(tái)的數(shù)量和質(zhì)量仍存差距[27]。基于此,本研究將聚焦于國(guó)外代表性的數(shù)字人文眾包平臺(tái),對(duì)各平臺(tái)中隱私政策文本內(nèi)容進(jìn)行深入剖析,歸納總結(jié)其可供借鑒的相關(guān)研究成果,以期為我國(guó)數(shù)字人文眾包個(gè)人信息保護(hù)相關(guān)實(shí)踐的發(fā)展提供借鑒。
筆者利用網(wǎng)絡(luò)調(diào)查法并結(jié)合數(shù)據(jù)的可獲得性,依據(jù)各國(guó)(地區(qū))數(shù)字人文眾包項(xiàng)目的充實(shí)度和豐富性,從眾包項(xiàng)目影響力、資源類(lèi)型的多樣性、地域分布的均衡性及公眾的完成度等層面進(jìn)行比較和篩選,最終選取美國(guó)、英國(guó)、澳大利亞、新西蘭4個(gè)國(guó)家的典型性數(shù)字人文眾包項(xiàng)目共47個(gè),按照?qǐng)D書(shū)館、博物館、檔案館、第三方及其他類(lèi)別進(jìn)行分類(lèi)[28],其中圖書(shū)館平臺(tái)發(fā)起的項(xiàng)目共計(jì)14項(xiàng),博物館12項(xiàng),檔案館10項(xiàng),第三方及其他(如維基百科、麻省理工學(xué)院、書(shū)目研究中心及盈利性公司組織等)共計(jì)11項(xiàng),具體如表1所示。數(shù)據(jù)收集截止時(shí)間為2021年10月15日,資料均來(lái)源于其官方網(wǎng)頁(yè)。與此同時(shí),數(shù)字人文眾包因不同的項(xiàng)目類(lèi)型的信息需求不同,在特定的任務(wù)信息需求下,對(duì)參與者個(gè)人隱私內(nèi)容的要求存在差異。為此,本研究基于Oomen和Aroyo的數(shù)字人文類(lèi)眾包分類(lèi)體系,按照轉(zhuǎn)錄型、修訂型、分類(lèi)型及補(bǔ)充收集型進(jìn)行分類(lèi)[29-30]。其中,轉(zhuǎn)錄型共計(jì)20項(xiàng)(圖書(shū)館4項(xiàng)、博物館5項(xiàng)、檔案館2項(xiàng)、第三方及其他9項(xiàng));修訂型共計(jì)6項(xiàng)(圖書(shū)館4項(xiàng)、博物館1項(xiàng)、檔案館1項(xiàng));分類(lèi)型1項(xiàng)(檔案館1項(xiàng));補(bǔ)充收集型20項(xiàng)(圖書(shū)館6項(xiàng)、博物館6項(xiàng)、檔案館6項(xiàng)、第三方及其他2項(xiàng))。
表1 國(guó)外數(shù)字人文眾包項(xiàng)目概況
為了更好地探索國(guó)外數(shù)字人文眾包項(xiàng)目中隱私政策文本的內(nèi)容及規(guī)律,提煉分析個(gè)人信息隱私政策的特征指標(biāo),從而指導(dǎo)個(gè)人信息保護(hù)的開(kāi)展。本研究主要從以下4個(gè)方面開(kāi)展:
1)首先對(duì)原始隱私政策資料進(jìn)行可視化主題詞聚類(lèi)分析,生成高頻詞云圖;其次采用LDA算法挖掘相關(guān)主題,一方面有助于快速了解隱私政策文本背后隱藏的主題思想;另一方面可為步驟2中主范疇的凝練、命名等提供客觀證據(jù)指導(dǎo)。
2)為保證研究的精準(zhǔn)度和深度,采用扎根理論這一探索性研究方法,借助Nvivo12文本分析工具,對(duì)數(shù)字人文眾包項(xiàng)目中隱私保護(hù)政策的具體內(nèi)容進(jìn)行提煉和編碼,對(duì)關(guān)鍵節(jié)點(diǎn)進(jìn)行梳理和總結(jié),最終形成個(gè)人信息隱私政策的類(lèi)目體系。
3)在計(jì)量統(tǒng)計(jì)和分析的基礎(chǔ)上,挖掘不同國(guó)家、不同項(xiàng)目平臺(tái)及不同項(xiàng)目類(lèi)型對(duì)各特征維度的關(guān)注程度,比較分析其個(gè)人隱私政策建設(shè)狀況的共性建設(shè)經(jīng)驗(yàn)及個(gè)性差異化特征。
4)結(jié)合我國(guó)當(dāng)前數(shù)字人文眾包項(xiàng)目隱私政策的制定現(xiàn)狀,為我國(guó)數(shù)字人文眾包個(gè)人信息保護(hù)提出意見(jiàn)與建議。
2.1.1 主題可視化
為探究國(guó)外數(shù)字人文眾包項(xiàng)目隱私政策的主題特征,本研究利用高頻關(guān)鍵詞云圖挖掘文本數(shù)據(jù)內(nèi)容,并基于LDA算法中文本困惑度進(jìn)行主題鑒別和主題詞抽取,其中困惑度越小則其泛化能力越強(qiáng)[31]。其中高頻關(guān)鍵詞字體越大、越靠近中心位置的詞匯被提及的頻率越高,且本研究主題數(shù)目為3時(shí)困惑度最低,因此最終抽取的主題數(shù)目為3,具體主題可視化分布如圖1所示。
主題主題詞特征Topic1信息 數(shù)據(jù) 提供 服務(wù) 個(gè)人信息 網(wǎng)站 收集 隱私 訪問(wèn) 政策 第三方 電子郵件 用戶媒體 地址 共享圖書(shū)館 CookieTopic2個(gè)人信息 國(guó)家檔案館 信息 隱私 網(wǎng)站 記錄 訪問(wèn) 收集 提供 圖書(shū)館 披露 投訴 政策 目的 用于 澳大利亞 App 數(shù)據(jù)Topic3網(wǎng)站 數(shù)據(jù) 信息 Cookie 研究 電子郵件 收集 訪問(wèn) 頁(yè)面 用戶 選擇 隱私 注冊(cè) 地址 功能 項(xiàng)目 瀏覽器 政策主題—詞匯分布
由高頻關(guān)鍵詞和主題—詞匯分布可知:Topic 1的關(guān)鍵詞可將其歸納為“信息收集”,如收集渠道、機(jī)構(gòu)等;Topic 2的關(guān)鍵詞可將其歸納為“信息安全”,如隱私、法律、保護(hù)及披露等;Topic 3的關(guān)鍵詞可將其歸納為用戶個(gè)人“信息內(nèi)容”,如個(gè)人信息、身份、地址、國(guó)家(地區(qū))及瀏覽器等。
2.1.2 國(guó)外數(shù)字人文眾包項(xiàng)目隱私政策框架
為進(jìn)一步構(gòu)建國(guó)外數(shù)字人文眾包項(xiàng)目個(gè)人信息隱私政策的范疇并形成類(lèi)目體系,本文借助Nvivo12質(zhì)性分析軟件對(duì)47個(gè)數(shù)字人文眾包項(xiàng)目網(wǎng)站所對(duì)應(yīng)的隱私政策文本,按照扎根理論的流程,首先將初始資料標(biāo)簽化、概念化,并將類(lèi)似的概念聚類(lèi)分析形成初始范疇;其次,對(duì)編碼所形成的初始范疇歸納分析,梳理隱私政策文本內(nèi)容初始范疇之間的關(guān)系,形成主范疇[32]。為了確保研究結(jié)果的可信度,生成更多的新概念和范疇,本文邀請(qǐng)兩位研究者分別對(duì)文本內(nèi)容進(jìn)行獨(dú)立編碼,并對(duì)兩位工作人員的編碼結(jié)果進(jìn)行一致性信度分析,其中相互度K=2M/(N1+N2)、信度R=n*K/(1+(n-1)*K),抽取結(jié)果一致性為0.89,大于0.8則說(shuō)明研究可信[33],信度檢驗(yàn)通過(guò)。與此同時(shí),結(jié)合2.1.1得到的關(guān)鍵詞云圖和主題分布客觀證據(jù),最終提煉出84個(gè)初始范疇,經(jīng)過(guò)進(jìn)一步的整合和凝練,本文將其歸納為7個(gè)主要類(lèi)別,分別是:信息內(nèi)容、信息安全、信息存儲(chǔ)、信息共享、信息使用、信息收集、用戶權(quán)利。基于此,國(guó)外數(shù)字人文眾包項(xiàng)目隱私政策框架具體如表2所示。
表2 國(guó)外數(shù)字人文眾包項(xiàng)目類(lèi)目體系及其范疇
1)信息內(nèi)容層面,主要指隱私政策中明確向參與者收集的信息。主要包括用戶姓名、出生日期、地址、電子郵件地址、電話號(hào)碼和性別等個(gè)人數(shù)據(jù)信息;使用項(xiàng)目服務(wù)或設(shè)施過(guò)程中以及與項(xiàng)目通信過(guò)程中提供的信息。
2)信息安全層面,主要指隱私政策中規(guī)定的對(duì)參與者個(gè)人信息的保護(hù)措施或手段以及對(duì)數(shù)字人文眾包項(xiàng)目中未成年參與者個(gè)人信息的處理規(guī)范。主要分為信息使用與披露和保護(hù)措施兩方面。信息使用與披露即如何采取合理措施保護(hù)個(gè)人信息免遭濫用、干擾、丟失、未經(jīng)授權(quán)的訪問(wèn)、修改或披露,以及對(duì)于未成年訪問(wèn)措施等特殊信息的處理;保護(hù)措施即以實(shí)現(xiàn)信息安全為目的,具體使用某種特殊的軟件程序和技術(shù)去識(shí)別未經(jīng)授權(quán)的上傳或更改信息的嘗試,以及對(duì)工作人員的培訓(xùn)和相關(guān)工作準(zhǔn)則的制定。
3)信息存儲(chǔ)層面,主要指隱私政策中明確對(duì)參與者的個(gè)人信息存儲(chǔ)保留,主要包括存儲(chǔ)方式、存儲(chǔ)時(shí)長(zhǎng)及存儲(chǔ)位置。具體為:根據(jù)保留時(shí)間表對(duì)用戶的個(gè)人數(shù)據(jù)進(jìn)行保留,規(guī)定個(gè)人信息按照物理格式保存在紙質(zhì)文件中或是以電子形式保存在電子數(shù)據(jù)庫(kù)中,以及對(duì)無(wú)須再予以保留的個(gè)人信息數(shù)據(jù)將以何種方式安全刪除做出解釋。
4)信息共享層面,主要指隱私政策中明確參與者的個(gè)人信息在何種情況下會(huì)對(duì)外或?qū)Φ谌睫D(zhuǎn)讓、共享、公開(kāi)披露、提供或傳輸。規(guī)定用戶共享信息的范圍、具體內(nèi)容,依據(jù)法律要求或用戶授權(quán)所規(guī)定的共享?xiàng)l件,選擇內(nèi)部團(tuán)隊(duì)、外部合作伙伴或政府部門(mén)等具體的共享對(duì)象,以及共享個(gè)人信息時(shí)所采用的具體方式。
5)信息使用層面,主要指隱私政策中明確對(duì)參與者信息進(jìn)行使用或加工的目的或方式。明確所處理收集的個(gè)人信息是何種用途,以及對(duì)為了達(dá)到某種目的所需的具體信息做出說(shuō)明,同時(shí)闡明所收集的某項(xiàng)具體信息的合法依據(jù)。
6)信息收集層面,主要指隱私政策中明確信息收集的渠道、條件以及所采用的收集方式。具體包含收集方式、收集渠道、收集技術(shù),即平臺(tái)通過(guò)何種方式來(lái)達(dá)到收集個(gè)人信息的目的。如平臺(tái)通過(guò)Cookie交互功能等技術(shù)或在用戶自動(dòng)提供相關(guān)數(shù)據(jù)、記錄個(gè)人信息時(shí)收集。
7)用戶權(quán)利層面,主要指隱私政策中參與者對(duì)自己信息處置的權(quán)利。明確用戶在參與數(shù)字人文眾包項(xiàng)目過(guò)程中所享有的具體合法權(quán)益。筆者通過(guò)對(duì)上述47個(gè)眾包項(xiàng)目的分析,共提取出享受服務(wù)權(quán)、更正權(quán)、限制權(quán)、建議權(quán)、投訴權(quán)、知情權(quán)、咨詢權(quán)、訪問(wèn)權(quán)、使用權(quán)、撤回同意權(quán)、反對(duì)權(quán)、刪除權(quán)及數(shù)據(jù)轉(zhuǎn)移權(quán)13個(gè)權(quán)利。
為了更好地探究不同發(fā)起平臺(tái)、國(guó)家(地區(qū))、項(xiàng)目類(lèi)型在數(shù)字人文眾包個(gè)人信息保護(hù)方面的差異,筆者基于所提取的7個(gè)指標(biāo),對(duì)47個(gè)數(shù)字人文眾包項(xiàng)目網(wǎng)站對(duì)應(yīng)的隱私政策文本進(jìn)行統(tǒng)計(jì),如圖2所示。
2.2.1 整體性差異
指標(biāo)上,“信息收集”“信息安全”“信息內(nèi)容”3個(gè)指標(biāo)的關(guān)注度都比較高,相對(duì)來(lái)說(shuō)內(nèi)容完備性較好,再次驗(yàn)證了基本概況中主題可視化的“宏觀”結(jié)果。無(wú)論是不同發(fā)起平臺(tái)、不同國(guó)家(地區(qū))還是不同項(xiàng)目類(lèi)型,上述3個(gè)指標(biāo)占比均達(dá)100%,其次分別為“信息共享”“信息使用”和“信息存儲(chǔ)”,在不同發(fā)起平臺(tái)層面平均占比分別為96.13%、93.18%和91.40%,國(guó)家(地區(qū))層面平均占比分別為93.25%、93%和89.25%,不同項(xiàng)目類(lèi)型平均占比分別為93.33%、96.25%和95%,分別有44、44和43個(gè)項(xiàng)目提及;對(duì)用戶權(quán)利的整體關(guān)注度較低,不同發(fā)起平臺(tái)對(duì)“用戶權(quán)利”的平均關(guān)注度僅有67.85%,不同國(guó)家的平均關(guān)注度為69.5%,不同項(xiàng)目類(lèi)型的平均關(guān)注度為81.25%,僅有32個(gè)數(shù)字人文眾包項(xiàng)目提及,可以看出各國(guó)隱私政策對(duì)于“用戶權(quán)利”這一維度的關(guān)注度相對(duì)較低。
2.2.2 發(fā)起平臺(tái)的政策內(nèi)容差異
不同發(fā)起平臺(tái)上,由檔案館、博物館所發(fā)起的指標(biāo)完整度相對(duì)較高。檔案館除“用戶權(quán)利”,其他指標(biāo)較為完備;圖書(shū)館更為關(guān)注“信息存儲(chǔ)”“信息共享”;博物館的“信息存儲(chǔ)”“信息共享”“用戶權(quán)利”3個(gè)指標(biāo)關(guān)注度高于平均水平;第三方及其他發(fā)起的項(xiàng)目中,僅有“信息使用”占比高于平均水平。
進(jìn)一步結(jié)合隱私政策文本,不同發(fā)起平臺(tái)所屬維度內(nèi)容上的特征:①信息內(nèi)容維度,各發(fā)起方均對(duì)所需收集的“個(gè)人信息數(shù)據(jù)”進(jìn)行說(shuō)明。此外,“訪問(wèn)鏈接”“訪問(wèn)日期”也是各發(fā)起方關(guān)注的重點(diǎn)。但檔案館與“第三方及其他”機(jī)構(gòu)較重視對(duì)參與者“設(shè)備信息”的搜集,而圖書(shū)館、博物館更多提及參與者的“敏感信息”及“位置”,檔案館則關(guān)注參與者的“隸屬組織”;②信息存儲(chǔ)維度,博物館更側(cè)重于強(qiáng)調(diào)“存儲(chǔ)時(shí)長(zhǎng)”,檔案館、圖書(shū)館則強(qiáng)調(diào)“存儲(chǔ)位置”;③信息共享維度,博物館側(cè)重說(shuō)明“所需共享的內(nèi)容”,圖書(shū)館、檔案館側(cè)重說(shuō)明“共享對(duì)象”,第三方及其他更側(cè)重于說(shuō)明“共享?xiàng)l件”;④信息使用維度,圖書(shū)館、檔案館及“第三方及其他”機(jī)構(gòu)側(cè)重于網(wǎng)站內(nèi)部的優(yōu)化,如“產(chǎn)品與服務(wù)的改善”和“數(shù)據(jù)分析”。博物館則更側(cè)重于業(yè)務(wù)的拓展,如“營(yíng)銷(xiāo)推廣”;⑤信息收集維度,各發(fā)起方均對(duì)所采用的“收集技術(shù)”進(jìn)行說(shuō)明,此外博物館的“收集方式”更具多樣性;⑥用戶權(quán)利維度,各發(fā)起平臺(tái)均較為關(guān)注“更正權(quán)”與“刪除權(quán)”,此外,圖書(shū)館會(huì)進(jìn)一步關(guān)注“撤銷(xiāo)權(quán)”,檔案館進(jìn)一步關(guān)注“知情權(quán)”;⑦信息安全維度,各發(fā)起平臺(tái)均對(duì)其平臺(tái)所采取的安全保護(hù)措施進(jìn)行說(shuō)明,圖書(shū)館和博物館開(kāi)始關(guān)注未成年人信息安全。此外,僅有少部分博物館對(duì)信息安全用戶自身責(zé)任做出說(shuō)明。
2.2.3 發(fā)起國(guó)家的政策內(nèi)容差異
不同發(fā)起國(guó)家中,英國(guó)和新西蘭指標(biāo)完整度較高,英國(guó)平均占比高達(dá)97.71%,新西蘭高達(dá)94.86%,澳大利亞和美國(guó)相對(duì)較低。除去“信息收集”“信息安全”和“信息內(nèi)容”3個(gè)關(guān)注度較高的指標(biāo),新西蘭對(duì)于其余4個(gè)指標(biāo)的關(guān)注程度均高于平均水平,英國(guó)對(duì)于“信息存儲(chǔ)”“信息共享”“用戶權(quán)利”3個(gè)指標(biāo)的關(guān)注度較高,美國(guó)更側(cè)重于“信息使用”這一指標(biāo),澳大利亞僅有“用戶權(quán)利”這一指標(biāo)高于平均水平。
基于隱私政策文本,所屬維度內(nèi)容上特征:①信息內(nèi)容維度,各發(fā)起國(guó)家均重視對(duì)“個(gè)人信息數(shù)據(jù)”的收集。此外,“瀏覽信息”也是美國(guó)關(guān)注的重點(diǎn);②信息存儲(chǔ)維度,美國(guó)和英國(guó)較為關(guān)注“存儲(chǔ)時(shí)長(zhǎng)”,澳大利亞和新西蘭更關(guān)注“存儲(chǔ)位置”;③信息共享維度,各國(guó)對(duì)“共享對(duì)象”的關(guān)注程度都比較高,然而對(duì)“共享?xiàng)l件”的關(guān)注程度比較低,值得注意的是,英國(guó)隱私政策還單獨(dú)提到了“疫情追蹤”,將共享?xiàng)l件與疫情防控聯(lián)系起來(lái);④信息使用維度,各國(guó)均側(cè)重于網(wǎng)站內(nèi)部的優(yōu)化,其中英國(guó)這一指標(biāo)的整體完整度較高?!熬W(wǎng)站數(shù)據(jù)統(tǒng)計(jì)”“記錄保存”“提供服務(wù)”這3項(xiàng)指標(biāo)的提及次數(shù)較高;⑤信息收集維度,4個(gè)國(guó)家項(xiàng)目除了采用“Cookies”對(duì)用戶信息進(jìn)行收集外,還會(huì)采用“Google Analytics”技術(shù)進(jìn)行輔助收集。在“收集方式”這一維度,美國(guó)與英國(guó)占比較高,澳大利亞的收集方式更豐富多樣;⑥用戶權(quán)利維度,英國(guó)對(duì)用戶權(quán)利的重視程度較高,還單獨(dú)提出了“數(shù)據(jù)轉(zhuǎn)移權(quán)”。美國(guó)和英國(guó)所提及的用戶權(quán)利較為多樣;⑦信息安全維度,美國(guó)的指標(biāo)完整度較高,各國(guó)均提及“訪問(wèn)權(quán)限”和“安全措施審查”,說(shuō)明這兩項(xiàng)措施更受隱私政策制定者青睞。
2.2.4 項(xiàng)目類(lèi)型的政策內(nèi)容差異
不同項(xiàng)目類(lèi)型中,修訂型、補(bǔ)充收集型、分類(lèi)型項(xiàng)目完整度較高,平均占比分別為97.62%、94.29%以及100%;轉(zhuǎn)錄型指標(biāo)完整度相對(duì)較低,為88.57%。除去“信息收集”“信息安全”和“信息內(nèi)容”3個(gè)關(guān)注度較高的指標(biāo),分類(lèi)型指標(biāo)覆蓋率均為100%;修訂型除“信息共享”這一指標(biāo),其余指標(biāo)覆蓋率均為100%;補(bǔ)充收集型更關(guān)注“信息共享”;轉(zhuǎn)錄型其余4個(gè)指標(biāo)均低于平均水平。
內(nèi)容進(jìn)一步細(xì)粒度挖掘如下:①信息內(nèi)容維度,轉(zhuǎn)錄型側(cè)重于對(duì)“設(shè)備信息”的收集,修訂型、補(bǔ)充收集型更側(cè)重于對(duì)“個(gè)人信息數(shù)據(jù)”的收集;②信息存儲(chǔ)維度,轉(zhuǎn)錄型和修訂型更側(cè)重于強(qiáng)調(diào)“存儲(chǔ)位置”,補(bǔ)充收集型更側(cè)重于強(qiáng)調(diào)“存儲(chǔ)時(shí)長(zhǎng)”;③信息共享維度,“共享對(duì)象”是各類(lèi)型項(xiàng)目隱私政策關(guān)注的重點(diǎn),補(bǔ)充收集型還進(jìn)一步強(qiáng)調(diào)“共享內(nèi)容”;④信息使用維度,各類(lèi)型項(xiàng)目主要用于網(wǎng)站內(nèi)部的優(yōu)化,其中修訂型項(xiàng)目這一指標(biāo)的整體完善度更高;⑤信息收集維度,“收集技術(shù)”是各個(gè)項(xiàng)目關(guān)注的重點(diǎn),此外,轉(zhuǎn)錄型、補(bǔ)充收集型、分類(lèi)型還側(cè)重于強(qiáng)調(diào)“收集時(shí)間”,修訂型還側(cè)重于強(qiáng)調(diào)“收集方式”;⑥用戶權(quán)利維度,修訂型與分類(lèi)型所有項(xiàng)目隱私政策均對(duì)用戶權(quán)利進(jìn)行說(shuō)明。然而,轉(zhuǎn)錄型的20項(xiàng)中僅有11項(xiàng)對(duì)用戶權(quán)利進(jìn)行說(shuō)明。除關(guān)注度較高的“更正權(quán)”和“刪除權(quán)”,修訂型還進(jìn)一步關(guān)注“訪問(wèn)權(quán)”和“知情權(quán)”;⑦信息安全維度,各類(lèi)型項(xiàng)目多聚焦于說(shuō)明平臺(tái)所采取的保護(hù)措施。此外,對(duì)14歲以下青少年群體以及用戶自身責(zé)任的關(guān)注度提升。
3.1.1 國(guó)內(nèi)數(shù)字人文眾包項(xiàng)目
目前,我國(guó)積極開(kāi)展數(shù)字人文眾包項(xiàng)目,并取得了探索性的實(shí)踐成果,如上海數(shù)字人文眾包系列、Cadal眾包項(xiàng)目及北京記憶項(xiàng)目等,主要開(kāi)設(shè)平臺(tái)聚焦為圖書(shū)館、博物館、檔案館以及其他第三方平臺(tái)(如高校、人文研究中心等聯(lián)合)。本文基于數(shù)據(jù)可獲得性選取代表性項(xiàng)目,具體發(fā)起方及工作內(nèi)容如表3所示。截至2021年10月7日,“盛宣懷檔案抄錄項(xiàng)目”已發(fā)布75項(xiàng)共計(jì)656個(gè)任務(wù),已完成431個(gè)[34];“古籍整理工作平臺(tái)”目前主要參與者有3 389位,整理成果4本,整理任務(wù)5 090個(gè)[35];“北京記憶項(xiàng)目”目前已添加2 271條記錄,1 041篇文集,8 683張圖片,444個(gè)視頻[36];“社會(huì)檔案人項(xiàng)目”目前已完成詞條編輯10個(gè)[37]。
表3 國(guó)內(nèi)代表性數(shù)字人文眾包項(xiàng)目
3.1.2 國(guó)內(nèi)數(shù)字人文眾包項(xiàng)目隱私政策
目前,我國(guó)所開(kāi)展的數(shù)字人文眾包項(xiàng)目隱私政策如下:“北京記憶項(xiàng)目”在互動(dòng)網(wǎng)站“我的北京記憶”中設(shè)置了隱私聲明[38];“盛宣懷檔案抄錄項(xiàng)目”在《上海圖書(shū)館網(wǎng)上注冊(cè)服務(wù)協(xié)議》中提到了隱私制度及保護(hù)措施[39];“古籍整理工作平臺(tái)”在《用戶注冊(cè)協(xié)議》中設(shè)置了隱私保護(hù)內(nèi)容[40]?!笆⑿麘褭n案抄錄”“古籍整理工作平臺(tái)”與“社會(huì)檔案人”目前還沒(méi)有制訂具體的隱私政策。筆者借助Nvivo12質(zhì)性分析軟件對(duì)國(guó)內(nèi)數(shù)字人文眾包項(xiàng)目隱私政策的具體內(nèi)容進(jìn)行提煉和編碼研究,共得到“信息收集”“信息共享”和“信息安全”3個(gè)主范疇。具體內(nèi)容如表4所示。
表4 我國(guó)數(shù)字人文眾包項(xiàng)目隱私文本內(nèi)容
筆者通過(guò)對(duì)我國(guó)數(shù)字人文眾包項(xiàng)目指標(biāo)體系的比較分析可知:第一,目前我國(guó)數(shù)字人文眾包項(xiàng)目平臺(tái)隱私政策在形式上仍處于摸索階段,具體表現(xiàn)為制訂缺失、無(wú)統(tǒng)一標(biāo)準(zhǔn)且尚未形成完整的政策體系。如“北京記憶項(xiàng)目”平臺(tái)制定了特定的《隱私聲明》,而“盛宣懷檔案抄錄”與“古籍整理工作平臺(tái)”兩者隱私保護(hù)內(nèi)容位于“注冊(cè)協(xié)議”中。第二,文本內(nèi)容覆蓋面相對(duì)較窄。隱私文本僅涉及“信息收集”“信息共享”“信息安全”3個(gè)指標(biāo)。相較于國(guó)外形成的“信息內(nèi)容”“信息安全”“信息存儲(chǔ)”“信息共享”“信息使用”“信息收集”“用戶權(quán)利”7個(gè)指標(biāo)體系尚有不足之處。因此,研究國(guó)外數(shù)字人文眾包項(xiàng)目隱私政策的成功經(jīng)驗(yàn),對(duì)我國(guó)探索與制定隱私政策具有較高的參考價(jià)值。
本研究以47個(gè)國(guó)外數(shù)字人文眾包項(xiàng)目為研究對(duì)象,整體上挖掘了隱私政策高頻關(guān)鍵詞圖譜、主題分布以及個(gè)人信息隱私保護(hù)政策的類(lèi)目體系,并進(jìn)一步剖析了發(fā)起平臺(tái)、國(guó)家(地區(qū))及眾包項(xiàng)目類(lèi)型間的差異,本研究在具有理論價(jià)值的同時(shí),也具有較強(qiáng)的針對(duì)性和現(xiàn)實(shí)意義。
第一,本研究構(gòu)建了國(guó)外數(shù)字人文眾包項(xiàng)目隱私政策框架,涉及信息內(nèi)容、信息安全、信息存儲(chǔ)、信息共享、信息使用、信息收集及用戶權(quán)利7個(gè)維度,并明確了各指標(biāo)具體內(nèi)容,可以為我國(guó)個(gè)人信息保護(hù)隱私政策的設(shè)置提供框架及內(nèi)容上的理論指導(dǎo)。雖然我國(guó)已從國(guó)家層面制定了《個(gè)人信息保護(hù)法》《網(wǎng)絡(luò)安全法》等保護(hù)個(gè)人信息的法律法規(guī),但目前數(shù)字人文眾包類(lèi)項(xiàng)目尚未制定統(tǒng)一的行業(yè)標(biāo)準(zhǔn),因此,應(yīng)在國(guó)家相關(guān)個(gè)人信息政策法規(guī)的基礎(chǔ)上,結(jié)合我國(guó)數(shù)字人文眾包項(xiàng)目個(gè)人信息的特點(diǎn)以及國(guó)外現(xiàn)有成果,明確眾包項(xiàng)目隱私政策中應(yīng)包含的基本內(nèi)容和關(guān)鍵條款,制定統(tǒng)一的、有實(shí)際執(zhí)行意義的行業(yè)標(biāo)準(zhǔn),加強(qiáng)行業(yè)自律。
第二,剖析發(fā)現(xiàn)不同發(fā)起平臺(tái)、不同國(guó)家(地區(qū))及不同項(xiàng)目類(lèi)型隱私政策文本側(cè)重點(diǎn)存在差異,如在信息存儲(chǔ)這一維度,博物館、美國(guó)和英國(guó)、補(bǔ)充收集型更側(cè)重于強(qiáng)調(diào)“存儲(chǔ)時(shí)長(zhǎng)”,檔案館、澳大利亞和新西蘭、圖書(shū)館以及轉(zhuǎn)錄型、修訂型則強(qiáng)調(diào)“存儲(chǔ)位置”。由此,我國(guó)數(shù)字人文眾包項(xiàng)目應(yīng)在充分結(jié)合我國(guó)個(gè)人信息保護(hù)法規(guī)的基礎(chǔ)上,有針對(duì)性地制定條款細(xì)則,可以根據(jù)發(fā)起平臺(tái)、任務(wù)類(lèi)型的差異,“有的放矢”地參鑒上述研究成果。
第三,各機(jī)構(gòu)、各國(guó)(地區(qū))在“用戶權(quán)利”這一維度的關(guān)注度均相對(duì)較低,隨著我國(guó)網(wǎng)民對(duì)用戶權(quán)利的重視增加,特別是《個(gè)人信息保護(hù)法》中明確規(guī)定了個(gè)人信息權(quán)利包括知情權(quán)、決定權(quán)、查閱權(quán)、更正權(quán)、刪除權(quán)等,可見(jiàn)未來(lái)強(qiáng)化數(shù)字人文眾包項(xiàng)目中個(gè)人信息主體權(quán)利變得尤為重要。國(guó)外數(shù)字人文眾包隱私政策在更正權(quán)、刪除權(quán)、撤銷(xiāo)權(quán)、知情權(quán)、訪問(wèn)權(quán)和知情權(quán)等進(jìn)行的探索,可供我國(guó)參考。
第四,對(duì)于青少年群體的關(guān)注,已得到了國(guó)外的重視,應(yīng)優(yōu)化與完善我國(guó)數(shù)字人文眾包項(xiàng)目未成年人隱私保護(hù)政策。隱私政策的制定須權(quán)衡青少年個(gè)人信息保護(hù),提升隱私政策的針對(duì)性,對(duì)未滿18周歲,特別是14周歲這個(gè)界定,重點(diǎn)突出對(duì)其個(gè)人信息的個(gè)性化保護(hù)條款,并采取有針對(duì)性的具體保護(hù)措施:如對(duì)所有14周歲以下青少年采用更低的同意年齡閾值;提供“家長(zhǎng)控制”功能,在收集和利用未成年人個(gè)人信息時(shí)應(yīng)做出明確的提示或征詢其父母(監(jiān)護(hù)人)的同意等。