鮮英+于炯+楊興耀+薛朋強
摘 要: 現(xiàn)有的k?匿名隱私保護是一種安全有效的隱私保護算法,針對其對背景知識攻擊和同質(zhì)性攻擊防范的不足,提出一種基于敏感屬性多樣性的微聚集隱私保護的協(xié)同過濾算法。算法在滿足k?匿名的前提下,融入敏感屬性的多樣性,在微聚集算法中通過設(shè)置同一等價類中敏感屬性的差異值,來避免敏感屬性值過于接近而造成隱私泄露,從而達到保護隱私數(shù)據(jù)的目的,同時保證推薦的準(zhǔn)確性。實驗結(jié)果表明,該算法既能保證為用戶提供高效的個性化推薦,又能夠產(chǎn)生安全的信息表。
關(guān)鍵詞: 推薦系統(tǒng); 微聚集; 協(xié)同過濾; k?匿名化; 隱私泄露; 隱私保護
中圖分類號: TN919.1?34; TP391 文獻標(biāo)識碼: A 文章編號: 1004?373X(2018)06?0005?06
Abstract: As a safe and effective privacy protection algorithm, the existing k?anonymous privacy protection still has some insufficiency caused by background knowledge attack and homogeneity attack. Therefore, a sensitive attribute diversity based microaggregation collaborative filtering algorithm for privacy protection is proposed. On the premise of meeting the k?anonymity requirement, the sensitive attribute diversity is fused into the algorithm. The difference values of sensitive attributes in the same equivalence class are set in the microaggregation algorithm to avoid too close sensitive attribute values which can cause privacy disclosure, so as to achieve the purpose of protecting the privacy data and ensure the accuracy of recommendation. The experimental results show that the algorithm can not only guarantee to provide users with efficient personalized recommendation, but also generate safe information tables.
Keywords: recommendation system; microaggregation; collaborative filtering; k?anonymity; privacy disclosure; privacy protection
0 引 言
隨著電子商務(wù)的發(fā)展,用戶很難從網(wǎng)站上提供的海量物品(產(chǎn)品)或者服務(wù)中做出最佳的選擇。在這些需求的推動下推薦系統(tǒng)應(yīng)運而生,推薦系統(tǒng)也可以認(rèn)為是信息過濾系統(tǒng)的一個子集。如今,推薦系統(tǒng)在商業(yè)網(wǎng)站中占有重要的位置,比如在在國內(nèi)有豆瓣、天貓商城、京東商城和當(dāng)當(dāng)網(wǎng)等。在這些系統(tǒng)中為了計算商品和個人興趣之間的匹配程度,服務(wù)商需要收集大量的用戶信息用于提供服務(wù),比如:評分記錄,交易歷史記錄,簽到位置信息等。數(shù)據(jù)的各處使用導(dǎo)致了推薦系統(tǒng)具有雙面性:一方面,獲取用戶越多的信息就可獲得更準(zhǔn)確且更合適的推薦;另一方面,收集大量的用戶信息數(shù)據(jù)對用戶信息濫用后可能會暴露用戶的個人隱私,產(chǎn)生一些隱私安全方面的問題。服務(wù)提供商搜集大量的和用戶個體相關(guān)的數(shù)據(jù)即微數(shù)據(jù)[1],比如:醫(yī)療機構(gòu)中的患者數(shù)據(jù),商業(yè)場所的客戶購買數(shù)據(jù)、互聯(lián)網(wǎng)購物數(shù)據(jù)信息、銀行認(rèn)證的個人身份數(shù)據(jù)信息等。這些數(shù)據(jù)中包含著各種個體信息,若在沒有考慮到用戶隱私保護的前提下,泄露這些信息后被個人或者機構(gòu)的不合理利用可能會暴露個人隱私,造成大量的經(jīng)濟或精神損失。所以對這些個人信息的隱私保護已經(jīng)成為互聯(lián)網(wǎng)隱私安全的重中之重。在推薦系統(tǒng)中常用的k?匿名隱私保護算法沒有考慮敏感屬性的多樣性問題,針對一些同質(zhì)性和背景知識性攻擊不能很好抵御。本文融合敏感屬性多樣性的微聚集推薦算法,在進行協(xié)調(diào)過濾推薦的過程中,對數(shù)據(jù)集的處理避免在同一個等價類中因敏感屬性值過于接近從而造成隱私泄露。本文旨在將敏感屬性多樣性的微聚集算法應(yīng)用于協(xié)同過濾推薦系統(tǒng)中,滿足k?匿名隱私保護的條件,在一定程度上達到隱私保護的目的,并通過在真實數(shù)據(jù)集上進行驗證。實驗最終證明本文提出的推薦算法在保證良好推薦的前提下可以有效地保護用戶隱私。
1 相關(guān)工作
1.1 相關(guān)知識
概念1(敏感屬性的多樣性)[1]。為了彌補等價類中敏感屬性過于相似而提出,將等價類中敏感屬性值的差異限制在一定范圍內(nèi),從而在某種程度上避免隱私泄露。若設(shè)置值的差異范圍越大,將會得到越好的保護,當(dāng)然也會造成一定程度的信息損失。
概念2(SDC)[2]。最早提出信息發(fā)布過程中的隱私保護研究的課題,其采用微聚集、樣本化、隨機化、添加噪音等隱私保護的方法研究避免隱私泄漏的前提下保留更多的有用信息[3],對數(shù)據(jù)集的可用性以及保密性進行均衡,微聚集是SDC系列算法之一,用于去抵制重定向識別用戶。
概念3(L?關(guān)聯(lián)覆蓋)。ID為每個個體的顯式標(biāo)識符,例如身份證號等,S表示敏感屬性的值。每一個(ID,S)被稱為一個關(guān)聯(lián),在同一個ID下的所有(ID,S)關(guān)聯(lián)關(guān)系的集合,稱為一個關(guān)聯(lián)覆蓋。如果被關(guān)聯(lián)覆蓋的數(shù)量為L,就稱為L?關(guān)聯(lián)覆蓋。endprint
1.2 相關(guān)研究
協(xié)同過濾隱私保護[4]中常用的方法有密碼算法、擾亂數(shù)據(jù)、模糊方法。第一種加密方法適用于多方交互中隱私數(shù)據(jù)的保護,如Jeckmans,Peter和Hartel(JPH)協(xié)議[5]分為線上協(xié)議和線下協(xié)議,分別對數(shù)據(jù)進行加密再做推薦,但仍然存在一些威脅,如來自于不可信RS服務(wù)器,不可信Friend和Strangers等方面的威脅。在加密方法中Qiang Tang和Jun Wang等人提出隨機選取策略加密[5],通過隨機選取Strangers,并給Friend賦予不同的權(quán)值,減少上述威脅。綜上所述,加密方法沒有擾亂原始數(shù)據(jù),有很高的性能,但是巨大的計算量和復(fù)雜的安全協(xié)議導(dǎo)致它很難廣泛使用。第二種數(shù)據(jù)擾亂(Perturbation)方法[4],在提交到推薦系統(tǒng)之前通過系統(tǒng)化的增加一些噪音來擾亂敏感數(shù)據(jù),達到一定的隱私保護程度。第三種模糊數(shù)據(jù)(Obfuscation)方法[4],是在提交到推薦系統(tǒng)之前用戶的評分用其他的一些數(shù)據(jù)來代替,比如平均值,質(zhì)心的值等來代替,隱私保護算法中泛化和隱匿技術(shù)來模糊數(shù)據(jù)較為常用,其中最早、最經(jīng)典為k?匿名算法。但是以上的擾亂和模糊數(shù)據(jù)都存在缺點。擾亂數(shù)據(jù)中加入噪音的多少很難把握,模糊數(shù)據(jù)中代替的百分比不好控制。差分隱私[4]的提出可以在一定程度上避免以上問題,在針對有關(guān)于KNN(K?Nearest Neighborhood)攻擊問題上也得到較好處理。
統(tǒng)計泄密控制(Statistical Disclosure Control, SDC)[2]最早提出信息發(fā)布過程中的隱私保護研究的課題,其采用微聚集、樣本化、隨機化、添加噪音等隱私保護的方法實現(xiàn)在保護隱私的同時盡量保留數(shù)據(jù)的可用性和統(tǒng)計特性,微聚集是SDC系列算法之一,可以用于在一定程度上抵制重新定向和識別用戶。匿名方法是一種安全有效的隱私保護方法,本文提出一種基于微聚集協(xié)同過濾用戶隱私的保護算法。該算法是一種高效的微聚集隱私保護算法,既保持了高效性,又增加了等價類中敏感屬性值取值差異的約束,在融入了敏感屬性值中多樣性的情況下,可抵制同質(zhì)性和背景知識攻擊。因此該算法所產(chǎn)生的匿名表的安全性更強,既滿足了k?匿名隱私保護而且比一般隱私保護方法更有效。
2 敏感屬性多樣性微聚集隱私保護算法設(shè)計
微聚集算法[1]是由啟發(fā)式算法將數(shù)據(jù)集劃分為若干個等價類,要求每個等價類包括不少于k個不同元組,并且不同等價類中數(shù)據(jù)盡可能的相異,同一等價類內(nèi)數(shù)據(jù)盡可能的相似,利用等價類質(zhì)心來代替等價類中元組最終來實現(xiàn)k?匿名隱私保護的算法。如圖1算法流程圖所示。具體算法流程如下:若數(shù)據(jù)集存在未評分的數(shù)據(jù),首先需要對數(shù)據(jù)集的數(shù)據(jù)進行預(yù)處理操作,填充數(shù)據(jù)集;然后,將數(shù)據(jù)集中的每一列數(shù)據(jù)標(biāo)準(zhǔn)化,得到標(biāo)準(zhǔn)化矩陣;再使用(k,e)?MDAV算法得到聚類關(guān)系;在前三步驟結(jié)束之后會形成一個新的數(shù)據(jù)集,該數(shù)據(jù)集滿足k?匿名,即可達到隱私保護的目的;最后針對匿名后的數(shù)據(jù)即可在推薦系統(tǒng)中做數(shù)據(jù)預(yù)測,為用戶做個性化的推薦。
2.1 數(shù)據(jù)集預(yù)處理
為了計算歐幾里得距離,若原數(shù)據(jù)集有空值,則需要填滿數(shù)據(jù)集。要保證數(shù)據(jù)集任意屬性值中沒有丟失值,一般可使用以下方法[6]:
1) 使用行、列數(shù)據(jù)的加權(quán)平均值來填充;
2) 使用行、列數(shù)據(jù)的眾數(shù)平均值來填充;
3) 使用行、列數(shù)據(jù)的中位數(shù)平均值來填充[6]。
當(dāng)前實驗中使用方法1)加權(quán)平均值填充方法,輸入的數(shù)據(jù)集中可能包含未評分的屬性,經(jīng)過填充預(yù)處理后的數(shù)據(jù)集矩陣為滿矩陣。
2.2 標(biāo)準(zhǔn)化數(shù)據(jù)集
一旦數(shù)據(jù)集矩陣填滿,則需要計算數(shù)據(jù)集中每一列的標(biāo)準(zhǔn)Z分?jǐn)?shù),其目的是標(biāo)準(zhǔn)化數(shù)據(jù)集[7],使用以下計算方式:
[標(biāo)準(zhǔn)Z分?jǐn)?shù)=xi-μσ]
式中:xi是第i個物品x的值;μ是x的平均值;σ是x的標(biāo)準(zhǔn)偏差。用這種方法轉(zhuǎn)換后的數(shù)據(jù)符合標(biāo)準(zhǔn)正態(tài)分布,均值為0,標(biāo)準(zhǔn)差為1,即物品的均值和標(biāo)準(zhǔn)差分別是0和1。
2.3 (k,e)?MDAV聚類算法
算法輸入?yún)?shù)說明:匿名化參數(shù)個數(shù)k和敏感屬性差異參數(shù)e,可改變它們的大小使得最終達到一個較理想的狀態(tài),S為含有n個評分?jǐn)?shù)據(jù)集,具體算法描述如下:
輸入:S,k,e
輸出:k?匿名化的數(shù)據(jù)集S′
1) 計算出數(shù)據(jù)集S的中心點[x],再找到距離[x]最遠距離記錄S,再得到離S最遠距離的記錄[r];
2) 用S作為中心,選出離S最近距離的k個分?jǐn)?shù)記錄,若滿足敏感屬性取值差異大于等于e,就形成一個聚類,否則繼續(xù)取入數(shù)據(jù),直到滿足敏感屬性取值的差異大于等于e;
3) 用記錄r作為中心,選出離r最近距離的k個分?jǐn)?shù)記錄,若選取的數(shù)據(jù)滿足敏感屬性取值差異大于等于e,則形成一個聚類,否則繼續(xù)取入數(shù)據(jù),直到滿足敏感屬性取值的差異大于等于e;
4) 如果余下的數(shù)據(jù)個數(shù)大于等于2k且滿足敏感屬性取值差異大于等于e,則對余下的數(shù)據(jù)重復(fù)運行步驟1)~步驟3);
5) 如果余下的數(shù)據(jù)個數(shù)在k~2k-1之間,且滿足敏感值差異大于等于e,則將這些記錄自成一類,否則將剩余記錄加入到離它最近的類中,那么這些數(shù)據(jù)自成為一個類,記為Cf。
2.4 數(shù)據(jù)預(yù)測
數(shù)據(jù)預(yù)測方法分類[5]如下:
1) 平均值預(yù)測方法。在用戶的分類和物品的分類中,算出用戶對某一類物品的平均評分,若有新的用戶和物品加入時,就將其分別對應(yīng)到相應(yīng)的用戶類和物品類,然后將該評分設(shè)為已算出好的平均評分。endprint
2) 鄰域的預(yù)測方法。其中包括基于用戶鄰域的預(yù)測和基于物品鄰域的預(yù)測兩類,使用相似的用戶評分或相似的物品評分來預(yù)測。
3) 隱語義的預(yù)測方法與矩陣分解模型的預(yù)測方法,其本質(zhì)上都是很相似的,也可以認(rèn)為是一種比較特殊的降維預(yù)測方法,若將用戶評分和物品對應(yīng)的評分建立相應(yīng)的評分矩陣后,預(yù)測問題就是補全其中的缺失值。補全的基本要求即為補全后的矩陣的特征值和之前的特征值不能相差太大,其中基礎(chǔ)的解法就是奇異值分解(Singular Value Decomposition,SVD)。此方法首先需要簡單地將矩陣補全,如可用平均值方法補全,補全后矩陣為滿矩陣。數(shù)據(jù)經(jīng)過以上處理后會產(chǎn)生一個標(biāo)準(zhǔn)化的模糊數(shù)據(jù)集,在推薦系統(tǒng)中為了取得更好的推薦效果,需要對數(shù)據(jù)進行預(yù)測,然后推薦給用戶[8]。
3 質(zhì)量評估標(biāo)準(zhǔn)
3.1 隱私保護性能評測標(biāo)準(zhǔn)
為了測量隱私保護的質(zhì)量,可用信息丟失量(Information Loss,IL)和泄密風(fēng)險(Disclosure Risk,DR)這兩個因素來考慮[9]。信息丟失通常和偏差平方和(the Sum of Squared Errors,SSE)有關(guān),SSE一般用來測量原始數(shù)據(jù)被模糊的程度。在微聚集中,SSE的計算公式如下:
[SSE=i=1nj=1m(oij-pij)2]
式中:o代表[m×n]個元素的原始數(shù)據(jù)集矩陣,oij是屬于原始數(shù)據(jù)集o;p代表[m×n]個元素的模糊矩陣,pij是屬于模糊數(shù)據(jù)集p。
DR[1]為假設(shè)攻擊者,有原數(shù)據(jù)集o和模糊數(shù)據(jù)集p。使用模糊數(shù)據(jù)集p中的數(shù)據(jù)pij去鏈接原數(shù)據(jù)集o中的對應(yīng)數(shù)據(jù)oij,若攻擊者成功重新識別出原始數(shù)據(jù)則稱為該數(shù)據(jù)被泄露[10],DR的測量是從模糊后的數(shù)據(jù)表中推測出原數(shù)據(jù)表中的數(shù)據(jù)的可能性,DR定義為:
[DR=linked_successtotal_numbers]
式中:分子linked_success表示模糊后的數(shù)據(jù)表中能鏈接成功的個數(shù);分母total_numbers表示數(shù)據(jù)集中總共的個數(shù)。由以上分析可知,在隱私保護和數(shù)據(jù)的使用方面要SSE和DR越低越好[2]。
3.2 評分預(yù)測分析
在前面部分,分析了有關(guān)于(k,e)?MDAV和MDAV的SSE和DR,然而信息丟失并不是完全能被SSE捕獲到。在推薦系統(tǒng)中保護過的數(shù)據(jù)將會用于去預(yù)測用戶最感興趣的item,因此對保護后的數(shù)據(jù)監(jiān)測其預(yù)測的準(zhǔn)確性是非常重要的,設(shè)定80%的item值為訓(xùn)練值,20%為測試集合[2]。訓(xùn)練集合是保護后的記錄,測試集合是原始記錄也就是沒有被保護的數(shù)據(jù)集,使用以下方法進行預(yù)測:首先,找到最近鄰,在測試數(shù)據(jù)集中給定用戶uj,在訓(xùn)練集合中找的最近用戶uj;然后,分配預(yù)測值,對于用戶ui的預(yù)測值是對應(yīng)于uj。
一旦如以上方法對測試集合中的所有用戶預(yù)測完成后,計算測試集的原始值和通過以上方法得到的分配值之間的誤差[10],在推薦系統(tǒng)中對推薦質(zhì)量的評測主要有統(tǒng)計精度度量方法以及決策支持精度度量方法兩種方法[11]。其中統(tǒng)計精度度量方法中的平均絕對誤差(Mean Absolute Error,MAE)是一種較為常用的度量推薦質(zhì)量高低的方法,以對推薦質(zhì)量進行直觀的度量。
本實驗使用MAE 作為評價標(biāo)準(zhǔn),其是通過計算預(yù)測值和實際值之間的偏差來用于預(yù)測它們推薦的準(zhǔn)確性。其中MAE越小,得到的推薦質(zhì)量就越高。設(shè)預(yù)測值的集合可以表示為[p1,p2,…,pn],則相應(yīng)的實際值的集合可表示為[r1,r2,…,rn],則MAE可以定義為:
[MAE=i=1npi-rin]
式中:[n]是預(yù)測元素的個數(shù);[pi]是元素[i]的預(yù)測值;[ri]是測試集合中的真實值[3]。
4 實 驗
本節(jié)主要內(nèi)容包括使用以上方法得到實驗結(jié)果,將和之前的(MDAV)算法以及傳統(tǒng)的k?匿名隱私保護算法做比較。在本實驗中e的取值為0.3,和文獻[1]相同,e值越大,信息損失量隨之增大。
4.1 數(shù)據(jù)集及其預(yù)處理
數(shù)據(jù)集選擇Jester Joke,其中包括73 496個用戶的410萬次評分對100個笑話做出不同的評分。評分范圍是從-10~10的連續(xù)實數(shù)。用zscore來標(biāo)準(zhǔn)化數(shù)據(jù)集,得到一個符合標(biāo)準(zhǔn)正態(tài)分布,即均值為0,標(biāo)準(zhǔn)差為1的數(shù)據(jù)集,再進行本文實驗操作。
4.2 結(jié)果分析
圖2顯示了在不同k下的基于MDAV算法的隱私保護協(xié)同過濾下的SSE比較結(jié)果,可以看出,在k取不同的值時基于(k,e)?MDAV算法下且e的取值為0.3時SSE的變化趨勢。還可以看出當(dāng)引入屬性多樣性以后(k,e)?MDAV算法的SSE的值比MDAV算法略高,原因是(k,e)?MDAV算法增加了對類的約束,最終產(chǎn)生的類的大小比MDAV產(chǎn)生的類要大,故而SSE也相對來說會變大。但兩條曲線總體靠得很近,信息損失量并不大,增加了敏感屬性的差異后抗攻擊能力更強,相比較而言,k?匿名隱私保護算法SSE普遍偏高,數(shù)據(jù)被模糊的程度遠不及MDAV系列算法。
圖3顯示了在不同k下的基于MDAV算法的隱私保護協(xié)同過濾下的DR和在k取不同的值時且e的取值為0.3時基于(k,e)?MDAV算法的DR的值的比較??梢钥闯?,隨著k的增大泄密風(fēng)險的值在減小,原因是分組個數(shù)k增大,數(shù)據(jù)分組中的失真度也會增大,被成功鏈接的概率就會變小。k?匿名算法也隨著分組數(shù)的增多泄密風(fēng)險逐漸降低,但總體趨勢高于以下兩種,從圖3也可以看出(k,e)?MDAV算法的泄密風(fēng)險的值比原MDAV算法的DR值要低,由此產(chǎn)生的匿名信息表比原算法產(chǎn)生的表更加安全。endprint
使用以上方法對處理后的數(shù)據(jù)做預(yù)測,通過MAE值比較三種方法的推薦準(zhǔn)確性。如圖4所示,可以看出k?匿名算法在DR較大時平均絕對誤差很大,隨著泄密風(fēng)險的降低其誤差將會越來越低,但其MAE一直高于MDAV,(k,e)?MDAV的MAE值低于原MDAV算法。原因在于MAE是通過計算預(yù)測值和實際值之間的偏差來用于預(yù)測它們推薦的準(zhǔn)確性,其中MAE越小,得到的推薦質(zhì)量就越高。由此可得出(k,e)?MDAV在加入敏感屬性多樣性后其推薦準(zhǔn)確性并沒有丟失。
圖5顯示了在不同DR下的基于MDAV算法的隱私保護協(xié)同過濾下的信息丟失程度和在不同DR下時且e的取值為0.3時基于(k,e)?MDAV算法的SSE的值的比較??梢钥闯觯╧,e)?MDAV算法的SSE的取值低于原MDAV算法,結(jié)果表明(k,e)?MDAV算法可以更有效地模糊數(shù)據(jù)。在k?匿名算法中SSE的值較高,原始數(shù)據(jù)被模糊的程度較低, 由此可以得出結(jié)論:相比于MDAV算法和k?匿名算法?;冢╧,e)?MDAV算法其預(yù)測質(zhì)量和隱私保護的質(zhì)量較好。
5 結(jié) 語
協(xié)同過濾是用于上下文中的一種用戶推薦系統(tǒng)[12],盡管協(xié)同過濾有許多好處,且有大量的相關(guān)方法被提出,但是在這些研究中仍然面臨著許多挑戰(zhàn),其中最重要的是合理保護用戶隱私相關(guān)問題[13],包括對用戶偏好方面的隱私保護和推薦質(zhì)量高低的權(quán)衡。k?匿名隱私保護方法是一種高效的隱私保護方法[14],但仍然存在一些不足,使得攻擊者有機可乘,如同質(zhì)性攻擊和背景知識攻擊。因此,本文融入(k,e)?MDAV的協(xié)同過濾推薦算法是基于微聚集的且考慮到敏感屬性的多樣性的隱私保護算法。該算法既能有效地實現(xiàn)個性化的推薦,又可以安全地保護用戶隱私信息。使用jester真實數(shù)據(jù)集,利用不同的指標(biāo)建立模型,實驗結(jié)果表明,用該方法比原MDAV算法在模糊數(shù)據(jù)上更有效,本文所提出的算法既保持原推薦算法的高效性同時在隱私保護方面獲得了很大改進。在未來的研究中,需要針對多敏感信息的多樣性進行研究,保證有較高的效率和推薦質(zhì)量。并且,對信息暴露多少和推薦質(zhì)量高低以及隱私保護程度三者之間比重的權(quán)衡也是很重要的研究范圍。
參考文獻
[1] 夏贊珠.微數(shù)據(jù)發(fā)布中的隱私保護匿名化算法研究[D].金華:浙江師范大學(xué),2011.
XIA Zanzhu. Research on microdata anonymity algorithms for privacy?preservation data publishing [D]. Jinhua: Zhejiang Normal University, 2011.
[2] CASINO F, DOMINGO?FERRER J, PATSAKIS C, et al. A k?anonymous approach to privacy preserving collaborative filtering [J]. Journal of computer & system sciences, 2015, 81(6): 1000?1011.
[3] CASINO F, DOMINGO?FERRER J, PATSAKIS C, et al. Privacy preserving collaborative filtering with k?anonymity through microaggregation [C]// Proceedings of the 2013 IEEE 10th International Conference on E?Business Engineering. Washington: IEEE Computer Society, 2013: 490?497.
[4] ZHU T, REN Y, ZHOU W, et al. An effective privacy preserving algorithm for neighborhood?based collaborative filtering [J]. Future generation computer systems, 2014, 36(36): 142?155.
[5] TANG Q, WANG J. Privacy?preserving context?aware recommender systems: analysis and new solutions [C]// Proceedings of European Symposium on Research in Computer Security. Berlin: Springer, 2015: 101?119.
[6] 夏建勛,吳非,謝長生.應(yīng)用數(shù)據(jù)填充緩解稀疏問題實現(xiàn)個性化推薦[J].計算機工程與科學(xué),2013,35(5):15?19.
XIA Jianxun, WU Fei, XIE Changsheng. Applying data filling to alleviate the sparsity problem for personalized recommendation [J]. Computer engineering and science, 2013, 35(5): 15?19.
[7] 楊興耀,于炯,吐爾根·依布拉音,等.融合奇異性和擴散過程的協(xié)同過濾模型[J].軟件學(xué)報,2013,24(8):1868?1884.
YANG Xingyao, YU Jiong, IBRAHIM Turgun, et al. Collaborative filtering model fusing singularity and diffusion process [J]. Journal of software, 2013, 24(8): 1868?1884.endprint
[8] LIU B, HENGARTNER U. Privacy?preserving social recommendations in geosocial networks [C]// Proceedings of 2013 Eleventh Annual International Conference on Privacy, Security and Trust. Tarragona: IEEE, 2013: 69?76.
[9] CLEMENTE F J G. A privacy?preserving recommender system for mobile commerce [C]// Proceedings of 2015 IEEE Conference on Communications and Network Security. Florence: IEEE, 2015: 725?726.
[10] 周長利,馬春光,楊松濤.路網(wǎng)環(huán)境下保護LBS位置隱私的連續(xù)KNN查詢方法[J].計算機研究與發(fā)展,2015,52(11):2628?2644.
ZHOU Changli, MA Chunguang, YANG Songtao. Location privacy?preserving method for LBS continuous KNN query in road networks [J]. Journal of computer research and development, 2015, 52(11): 2628?2644.
[11] 王國霞,王麗君,劉賀平.個性化推薦系統(tǒng)隱私保護策略研究進展[J].計算機應(yīng)用研究,2012,29(6):2001?2008.
WANG Guoxia, WANG Lijun, LIU Heping. Study progress of privacy protection techniques used in personalized recommendation system [J]. Application research of computers, 2012, 29(6): 2001?2008.
[12] 張小波,付達杰.網(wǎng)絡(luò)信息資源個性化推薦中隱私保護的研究[J].軟件,2015,36(4):62?66.
ZHANG Xiaobo, FU Dajie. Research on privacy protection in the personalized recommendation of network information resources [J]. Software, 2015, 36(4): 62?66.
[13] 孫廣中,魏燊,謝幸.大數(shù)據(jù)時代中的去匿名化技術(shù)及應(yīng)用[J].信息通信技術(shù),2013,7(6):52?57.
SUN Guangzhong, WEI Shen, XIE Xing. De?anonymization technology and applications in the age of big data [J]. Information and communications technologies, 2013, 7(6): 52?57.
[14] 張學(xué)軍,桂小林,伍忠東.位置服務(wù)隱私保護研究綜述[J].軟件學(xué)報,2015,26(9):2373?2395.
ZHANG Xuejun, GUI Xiaolin, WU Zhongdong. Privacy preservation for location?based services: a survey [J]. Journal of software, 2015, 26(9): 2373?2395.
[15] 葉阿勇,李亞成,馬建峰,等.基于服務(wù)相似性的k?匿名位置隱私保護方法[J].通信學(xué)報,2014,35(11):162?169.
YE Ayong, LI Yacheng, MA Jianfeng, et al. Location privacy?preserving method of k?anonymous based?on service similarity [J]. Journal on communications, 2014, 35(11): 162?169.endprint