• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      利用貝葉斯原理在隱私保護(hù)數(shù)據(jù)上進(jìn)行分類的方法

      2015-12-26 09:18:16楊攀桂小林安健田豐王剛
      關(guān)鍵詞:概率分布原始數(shù)據(jù)貝葉斯

      楊攀,桂小林,安健,田豐,王剛

      (1.西安交通大學(xué)電子與信息工程學(xué)院,710049,西安;2.西安交通大學(xué)陜西省計(jì)算機(jī)網(wǎng)絡(luò) 重點(diǎn)實(shí)驗(yàn)室,710049,西安;3.西安財(cái)經(jīng)學(xué)院信息學(xué)院,710049,西安)

      ?

      利用貝葉斯原理在隱私保護(hù)數(shù)據(jù)上進(jìn)行分類的方法

      楊攀1,2,桂小林1,2,安健1,2,田豐1,2,王剛3

      (1.西安交通大學(xué)電子與信息工程學(xué)院,710049,西安;2.西安交通大學(xué)陜西省計(jì)算機(jī)網(wǎng)絡(luò) 重點(diǎn)實(shí)驗(yàn)室,710049,西安;3.西安財(cái)經(jīng)學(xué)院信息學(xué)院,710049,西安)

      針對可還原數(shù)據(jù)擾動(retrievable general additive data perturbation, RGADP)算法在保護(hù)數(shù)據(jù)庫隱私時會影響數(shù)據(jù)挖掘結(jié)果的問題,提出一種利用貝葉斯原理在擾動數(shù)據(jù)上進(jìn)行分類的方法。該方法分析RGADP算法過程,利用貝葉斯原理,根據(jù)擾動數(shù)據(jù)推算原始數(shù)據(jù)的概率分布,用估算的概率分布重構(gòu)數(shù)據(jù),并對重構(gòu)數(shù)據(jù)進(jìn)行分類以提高分類的正確性。實(shí)驗(yàn)結(jié)果表明:該方法估算出的概率分布與原始數(shù)據(jù)概率分布接近,且重構(gòu)數(shù)據(jù)的分類正確率相比擾動數(shù)據(jù)而言平均可提高4%以上,其更接近原始數(shù)據(jù)的分類正確率,從而有效地降低了擾動算法對數(shù)據(jù)分類的影響;該方法的運(yùn)行時間與數(shù)據(jù)量和數(shù)據(jù)分組數(shù)成正比,重構(gòu)10 000條數(shù)據(jù)的運(yùn)行時間在200 ms以內(nèi),因此該方法也具有較高的效率。

      隱私保護(hù);數(shù)據(jù)擾動;貝葉斯原理;分類

      一直以來,數(shù)據(jù)發(fā)布共享與挖掘都是數(shù)據(jù)庫的重要應(yīng)用[1],它為科學(xué)研究、企業(yè)發(fā)展及人們生活均帶來了諸多便利。近年來,諸如云計(jì)算等數(shù)據(jù)外包服務(wù)模式的迅猛發(fā)展,也為數(shù)據(jù)的發(fā)布和共享提供了更好的平臺,但是數(shù)據(jù)發(fā)布后可能造成其中的敏感信息泄露,從而損害數(shù)據(jù)所有者的利益,因此隱私泄露問題已成為阻礙數(shù)據(jù)發(fā)布共享的主要因素。如何保護(hù)發(fā)布數(shù)據(jù)的隱私,并對其進(jìn)行有效地挖掘成為學(xué)術(shù)界的研究熱點(diǎn)。

      數(shù)據(jù)匿名[2-3]是一種容易實(shí)現(xiàn)的抵抗身份泄露的隱私保護(hù)措施。通過將數(shù)據(jù)所有者的身份信息匿名化,可以防止攻擊者將數(shù)據(jù)與個體直接對應(yīng),但是由于其他信息并沒有隱藏,當(dāng)攻擊者獲得足夠多的背景知識后,仍可能識別出數(shù)據(jù)的所有者。密文檢索[4]利用通常的加密策略來保護(hù)數(shù)據(jù)隱私,同時通過建立特殊的密文索引來支持對密文數(shù)據(jù)的檢索,但是無法對密文數(shù)據(jù)做進(jìn)一步分析。在對數(shù)據(jù)進(jìn)行挖掘時,Kantarcioglu等提出針對關(guān)聯(lián)規(guī)則的數(shù)據(jù)隱私保護(hù)方法[5],Vaidya等則在垂直分區(qū)的數(shù)據(jù)上提出針對K-means聚類算法的隱私保護(hù)方法[6]。此外,也有學(xué)者提出針對分類的隱私保護(hù)方法[7-8]。Muralidhar等則通過添加滿足特定條件的噪聲,提出能夠保持原始數(shù)據(jù)統(tǒng)計(jì)特征不變的數(shù)據(jù)擾動算法(general additive data perturbation,GADP)[9-10]。

      以上方法均以保護(hù)數(shù)據(jù)隱私為目的,分別適用于不同的數(shù)據(jù)處理應(yīng)用。Yang等則考慮在云計(jì)算場景中授權(quán)用戶對原始數(shù)據(jù)的訪問需求[11],對GADP算法進(jìn)行改進(jìn),提出可還原的GADP算法(RGADP),它具有更高的安全性,并支持?jǐn)?shù)據(jù)所有者或授權(quán)用戶利用密鑰獲取原始數(shù)據(jù)。RGADP算法能更好地適應(yīng)云計(jì)算服務(wù)對數(shù)據(jù)隱私保護(hù)的需求,但擾動后的數(shù)據(jù)仍然只保證了數(shù)據(jù)的期望及協(xié)方差不變,并沒有提供對數(shù)據(jù)挖掘的有效支持,限制了它在數(shù)據(jù)隱私保護(hù)中的應(yīng)用。

      針對擾動數(shù)據(jù)的挖掘問題,Ge等利用轉(zhuǎn)移概率矩陣對擾動數(shù)據(jù)進(jìn)行有效的決策樹分類[12]。Li等提出一種改進(jìn)的基于奇異值分解的擾動算法[13],并針對此算法提出相應(yīng)的分類挖掘算法。Agrawal等利用貝葉斯原理估算原始數(shù)據(jù)概率分布[14],進(jìn)而進(jìn)行數(shù)據(jù)挖掘,可有效提高擾動數(shù)據(jù)的分類效果,但是只能處理簡單的線性擾動數(shù)據(jù),且每次只能估算一個屬性。

      本文采用與文獻(xiàn)[14]相同的思路,針對RGADP算法擾動數(shù)據(jù)較大影響分類效果的問題,用擾動數(shù)據(jù)估算原始數(shù)據(jù)的概率分布,并基于此概率分布重構(gòu)數(shù)據(jù)以進(jìn)行分類,從而提高分類的正確性。通過分析RGADP算法的數(shù)據(jù)變換公式,結(jié)合貝葉斯原理,推導(dǎo)出從RGADP擾動數(shù)據(jù)估算原始數(shù)據(jù)概率分布的公式;RGADP擾動算法可對多個屬性的數(shù)據(jù)同時進(jìn)行變換,由此推導(dǎo)出的估算公式也可同時估算多個屬性數(shù)據(jù)的概率分布;概率分布揭示了各屬性值在各區(qū)間的分布情況,利用此分布重構(gòu)數(shù)據(jù),在重構(gòu)數(shù)據(jù)上進(jìn)行分類的準(zhǔn)確率高于在擾動數(shù)據(jù)上進(jìn)行分類,從而有效提高擾動數(shù)據(jù)的分類效果。

      1 RGADP算法簡介

      RGADP算法將數(shù)據(jù)庫U的屬性分為隱私屬性X及可公開屬性S。S不包含隱私信息,無需變化。X是需要保護(hù)的信息,為表述方便,本文用到的符號及解釋如表1所示。

      表1 符號表

      RGADP算法通過對X進(jìn)行擾動變換得到Y(jié)來隱藏隱私信息,并使擾動后的數(shù)據(jù)U′保持期望及協(xié)方差不變,即

      μU=μU′且ΣU=ΣU′

      (1)

      在RGADP算法中,對于給定的X和S,利用下式可生成滿足式(1)的Y

      Y=β0+Uβ1+ε

      (2)

      此外,ε為依照特定算法隨機(jī)生成的噪聲,滿足

      με=0且Σε=ΣX-ΣYUβ1

      (3)

      由上述步驟生成的Y滿足

      μY=β0+μUβ1+με=μX

      (4)

      (5)

      這就保證了擾動后的數(shù)據(jù)期望和協(xié)方差與原始數(shù)據(jù)一致,即滿足式(1)。

      2 基于貝葉斯原理重構(gòu)原始分布

      在諸如貝葉斯及決策樹等分類算法中,需要計(jì)算屬性的概率,擾動后的數(shù)據(jù)已經(jīng)破壞了原有的概率分布。文獻(xiàn)[14]指出,利用貝葉斯原理,可以推導(dǎo)原始數(shù)據(jù)的近似概率分布,從而提高在擾動后數(shù)據(jù)上的分類效果。需要注意的是,這里只是估算原始數(shù)據(jù)的概率分布,而非原始值。因此,隱私信息仍然不會泄露。

      文獻(xiàn)[14]給出了一個在簡單擾動數(shù)據(jù)上推導(dǎo)原始概率分布的過程,但由于其擾動算法只是獨(dú)立地為每個屬性添加噪聲,與RGADP算法有較大不同,并不適用于本文。因此,本文分析RGADP算法中Y的生成過程,借鑒文獻(xiàn)[14]的思想,計(jì)算在Y出現(xiàn)的情況下X的后驗(yàn)概率,以此作為原始數(shù)據(jù)X的概率分布。

      (6)

      上式中Y的密度函數(shù)沒有規(guī)律,無法有效表達(dá),因此考慮更加規(guī)律的噪聲數(shù)據(jù)的密度函數(shù)。首先需要分析噪聲數(shù)據(jù)ε與X及Y的關(guān)系。

      (7)

      由此可知,該條記錄添加的噪聲為

      εk=yk-β0-skβ11k-xkβ10k

      (8)

      將式(8)代入式(6)中,可得

      (9)

      (10)

      式(10)是本文估算X概率分布的主要依據(jù),但為了真正實(shí)現(xiàn)對X概率分布的估算,還需做一些假設(shè)和改進(jìn)。

      2.1 噪聲ε的概率密度

      (11)

      2.2 原始數(shù)據(jù)的離散化

      (12)

      2.3 迭代法估算X的密度函數(shù)

      (13)

      (14)

      (15)

      重構(gòu)的復(fù)雜度主要取決于式(13)的計(jì)算復(fù)雜度以及迭代次數(shù)。在一次迭代中,對于每個Ii,式(13)的分母不變,只需計(jì)算一次,因此其實(shí)際計(jì)算復(fù)雜度為O(nr),而迭代次數(shù)則與具體數(shù)據(jù)集相關(guān),可由實(shí)驗(yàn)進(jìn)行觀察,見4.3節(jié)。

      3 基于重構(gòu)的擾動數(shù)據(jù)分類

      利用重構(gòu)算法,可以通過擾動數(shù)據(jù)Y估算原始數(shù)據(jù)X在各個區(qū)域的概率分布,然后依照此分布重新生成數(shù)據(jù)X′,則X′與X具有相似的概率分布。X′與可公開的數(shù)據(jù)S構(gòu)成新的用于分類的數(shù)據(jù)集Uc=[X′S]。至此,可以在Uc上進(jìn)行分類處理。

      在貝葉斯分類中需要計(jì)算后驗(yàn)概率,在決策樹分類中需要使用諸如信息熵或Gini指標(biāo)等來度量分裂點(diǎn),這些操作都需要對訓(xùn)練集進(jìn)行概率統(tǒng)計(jì)。由于Uc與U的概率分布相似,因此在Uc上進(jìn)行的統(tǒng)計(jì)也比U′更接近原始值,從而可以提高分類效果。

      需要注意的是,Uc與U只是整體概率分布相似,并不完全一致,而且以Uc為訓(xùn)練集,各個屬性在各個類別上的概率值也會與U有差別,因此該方案可以提高在擾動數(shù)據(jù)上的分類效果,但是正確率一般不會超過原始數(shù)據(jù)。

      對Uc分類得到的分類結(jié)果,可以作為原始數(shù)據(jù)的分析結(jié)果,供相關(guān)人員參考。此外,也可將分類器返回給數(shù)據(jù)所有者,以供其對其他未知類別的明文數(shù)據(jù)進(jìn)行預(yù)測。

      4 實(shí)驗(yàn)結(jié)果及分析

      本節(jié)將通過實(shí)驗(yàn)測試重構(gòu)算法,并利用UCI的數(shù)據(jù)集“Adult”[16]測試在重構(gòu)數(shù)據(jù)集上的分類效果。實(shí)驗(yàn)主機(jī)配置為雙核3.0 GHz主頻的CPU及4 GB內(nèi)存。

      4.1 重構(gòu)算法的效果

      為檢測重構(gòu)的效果,首先利用RGADP算法對原始數(shù)據(jù)進(jìn)行擾動變換,然后基于擾動后的數(shù)據(jù)估算原始數(shù)據(jù)的概率分布,對比原始數(shù)據(jù)、擾動數(shù)據(jù)與重構(gòu)數(shù)據(jù)的概率分布。

      (a)梯形分布

      (b)雙三角形分布圖1 在模擬數(shù)據(jù)集上重構(gòu)概率分布

      如圖1所示,首先模擬兩種特殊的概率分布,圖1a中原始數(shù)據(jù)的概率分布類似梯形,兩頭概率遞增(減),中間概率均勻;圖1b中則類似兩個并列的三角形,有兩次高峰。由圖1可見,經(jīng)RGADP算法擾動后的數(shù)據(jù)分布與原始數(shù)據(jù)有較大區(qū)別,而在該擾動數(shù)據(jù)上進(jìn)行重構(gòu)后,得到的概率分布則比較接近原始分布。

      圖2是在真實(shí)數(shù)據(jù)集Adult上進(jìn)行的重構(gòu)實(shí)驗(yàn)。首先,對屬性age及fnlwgt利用RGADP算法進(jìn)行擾動變換,然后基于擾動數(shù)據(jù)進(jìn)行重構(gòu),對比原始數(shù)據(jù)、擾動數(shù)據(jù)與重構(gòu)數(shù)據(jù)的概率分布。

      (a)age屬性值的分布

      (b)fnlwgt屬性值的分布圖2 在真實(shí)數(shù)據(jù)集Adult上重構(gòu)概率分布

      由圖2可見,原始數(shù)據(jù)和重構(gòu)數(shù)據(jù)的概率分布十分相似。此外,在圖2b中,由于RGADP算法保持?jǐn)?shù)據(jù)的期望及協(xié)方差不變,而fnlwgt屬性值相對集中在4×105范圍內(nèi),因此擾動后數(shù)據(jù)的分布也與原始分布相似,但是重構(gòu)的數(shù)據(jù)仍然更接近原始分布??梢?重構(gòu)算法可以有效地估算原始數(shù)據(jù)的概率分布。

      4.2 分類效果

      以重構(gòu)的數(shù)據(jù)為依據(jù)進(jìn)行分類,以提高分類正確率是本文的最終目的,因此本節(jié)驗(yàn)證重構(gòu)數(shù)據(jù)對分類效果的影響。

      選擇不同的分類算法及不同的分類屬性,分別對原始數(shù)據(jù)、擾動數(shù)據(jù)及重構(gòu)數(shù)據(jù)進(jìn)行分類,并測試其分類的正確率,見表2。其中,DT、NB分別表示決策樹和樸素貝葉斯分類算法,編號1表示所有屬性參與分類,2表示去掉了小部分屬性,3表示去掉了大部分屬性。在上述各種分類策略中,始終保留age和fnlwgt屬性。

      同時,以文獻(xiàn)[14]的算法作為參照。由于兩種算法分別針對不同的擾動數(shù)據(jù)(生成擾動數(shù)據(jù)的擾動算法不同),因此我們只對比兩種算法對擾動數(shù)據(jù)分類正確率的提高量,即重構(gòu)數(shù)據(jù)正確率與擾動數(shù)據(jù)正確率之差,記為A。差值越大,說明算法能更好地減少擾動對分類的影響。表2中參照值是利用文獻(xiàn)[14]的算法重構(gòu)其所對應(yīng)的擾動數(shù)據(jù)后,再計(jì)算分類正確率的提高量,記為R。

      表2 分類的正確率及與參照算法的對比 %

      由表2可知,當(dāng)屬性較多時,age與fnlwgt對分類結(jié)果的影響較小,因此變換(擾動或重構(gòu))后數(shù)據(jù)與原始數(shù)據(jù)的分類正確率接近。隨著屬性數(shù)量減少,age及fnlwgt對分類的影響開始變大,因而變換后數(shù)據(jù)對分類結(jié)果的影響也變大,導(dǎo)致正確率低于原始數(shù)據(jù)。

      此外,在表2中,擾動數(shù)據(jù)的分類正確率在屬性減少時大幅下降,而重構(gòu)數(shù)據(jù)的正確率則明顯高于擾動數(shù)據(jù),因而重構(gòu)數(shù)據(jù)可以有效降低擾動對分類的影響。由于本文算法是對多個屬性統(tǒng)一進(jìn)行估算,在一定程度上保留了不同屬性間的相關(guān)性,因此與由文獻(xiàn)[14]算法得出的參照值比較,本文算法能更有效地降低擾動對分類的影響。

      4.3 重構(gòu)的效率

      雖然通過重構(gòu)可以在擾動數(shù)據(jù)上分類,但重構(gòu)本身也需要消耗時間,由2.3節(jié)分析可知,重構(gòu)算法效率與數(shù)據(jù)量n及分組數(shù)r有關(guān)。本節(jié)中,分別對n與r設(shè)定不同的值,記錄在不同的n或r值下,重構(gòu)算法運(yùn)行的時間。同樣以文獻(xiàn)[14]的算法作為參照。實(shí)驗(yàn)中有兩個屬性參與重構(gòu),文獻(xiàn)[14]的算法需要分別對每個屬性進(jìn)行估算。其中,對于給定的分組數(shù)r,參照算法實(shí)際將兩個屬性分別分為r0、r1組,滿足r=r0r1。實(shí)驗(yàn)結(jié)果如圖3所示。

      (a)r=200

      (b)n=15 000圖3 n及r對算法效率的影響

      可見,隨著n或r的增加,重構(gòu)的時間也在增加。由于文獻(xiàn)[14]的算法需要分別對每個屬性進(jìn)行估算,因此本文算法在r較少時效率更高,但是當(dāng)r增加時,參照算法由于實(shí)際分組數(shù)較少,因而效率下降緩慢。相比而言,本文算法則隨著r的增加,耗時也有明顯增加。

      圖4 數(shù)據(jù)量與迭代次數(shù)的關(guān)系

      由實(shí)驗(yàn)可知,迭代次數(shù)會隨著數(shù)據(jù)量的增加而緩慢增加,但是總體來講,只需少量的迭代即可得到滿足條件的概率分布。因此,可以認(rèn)為我們的重構(gòu)算法復(fù)雜度近似為O(nr)。

      5 結(jié) 論

      本文針對RGADP擾動數(shù)據(jù)影響分類效果的問題,利用貝葉斯原理重構(gòu)原始數(shù)據(jù)的概率分布,并在重構(gòu)數(shù)據(jù)上進(jìn)行分類,以降低擾動對分類效果的影響,從而支持在擾動數(shù)據(jù)上的分類。為了提高重構(gòu)效率,可以對擾動數(shù)據(jù)預(yù)先進(jìn)行分組,以減少數(shù)據(jù)量,但卻可能降低重構(gòu)的效果,今后我們將進(jìn)一步研究有效的分組策略。此外,如何根據(jù)擾動數(shù)據(jù)劃分原始數(shù)據(jù)的各個區(qū)域也將是今后重點(diǎn)優(yōu)化的內(nèi)容。

      [1]周水庚, 李豐, 陶宇飛, 等.面向數(shù)據(jù)庫應(yīng)用的隱私保護(hù)研究綜述 [J].計(jì)算機(jī)學(xué)報(bào), 2009, 32(5):847-861.ZHOU Shuigeng, LI Feng, TAO Yufei, et al.Privacy preservation in database applications:a survey [J].Chinese Journal of Computers, 2009, 32(5):847-861.

      [2]SWEENEY L.K-anonymity:a model for protecting privacy [J].International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, 2002, 10(5):557-570.

      [3]WANG S L, TSAI Z Z, TING I H, et al.K-anonymous path privacy on social graphs [J].Journal of Intelligent and Fuzzy Systems, 2014, 26(3):1191-1199.

      [4]LI Jin, WANG Qian, WANG Cong, et al.Fuzzy keyword search over encrypted data in cloud computing [C]∥Proceedings of the 2010 IEEE International Conference on Computer Communications.Piscataway, NJ, USA:IEEE, 2010:1-5.

      [5]KANTARCIOGLU M, CLIFTON C.Privacy-preserving distributed mining of association rules on horizontally partitioned data [J].IEEE Transactions on Knowledge and Data Engineering, 2004, 16(9):1026-1037.

      [6]VAIDYA J, CLIFTON C.Privacy preserving k-means clustering over vertically partitioned data [C]∥Proceedings of the 9th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.New York, USA:ACM, 2003:206-215.

      [7]張鵬, 唐世渭.樸素貝葉斯分類中的隱私保護(hù)方法研究 [J].計(jì)算機(jī)學(xué)報(bào), 2007, 30(8):1267-1276.ZHANG Peng, TANG Shiwei.Privacy preserving naive Bayes classification [J].Chinese Journal of Computers, 2007, 30(8):1267-1276.

      [8]BAGHEL R, DUTTA M.Privacy preserving classification by using modified C4.5 [C]∥Proceedings of the IEEE International Conference on Contemporary Computing.Piscataway, NJ, USA:IEEE, 2013:124-129.

      [9]MURALIDHAR K, PARSA R, SARATHY R.A general additive data perturbation method for database security [J].Management Science, 1999, 45(10):1399-1415.

      [10]MURALIDHAR K, SARATHY R.An enhanced data perturbation approach for small data sets [J].Decision Sciences, 2005, 36(3):513-529.

      [11]YANG Pan, GUI Xiaolin, AN Jian, et al.A retrievable data perturbation method used in privacy-preserving in cloud computing [J].China Communications, 2014, 11(8):73-84.

      [12]GE Weiping, WANG Wei, LI Xiaorong, et al.A privacy-preserving classification mining algorithm [C]∥Proceedings of the 9th Pacific-Asia Conference on Advances in Knowledge Discovery and Data Mining.Berlin, Germany:Springer, 2005:256-261.

      [13]LI Guang, WANG Yadong.A privacy-preserving classification method based on singular value decomposition [J].International Arab Journal of Information Technology, 2012, 9(6):529-534.

      [14]AGRAWAL R, SRIKANT R.Privacy-preserving data mining [J].ACM Sigmod Record, 2000, 29(2):439-450.

      [15]LI Deyi, LIU Changyu, GAN Wenyan.A new cognitive model:cloud model [J].International Journal of Intelligent Systems, 2009, 24(3):357-375.

      [16]KOHAVI R, BECKER B.UCI machine learning repository:adult data set [DB/OL].(1996-05-01) [2014-10-01].http:∥archive.ics.uci.edu/ml/datasets/Adult.

      (編輯 武紅江)

      A Classification Method for Privacy-Preserved Data Using Bayesian Rule

      YANG Pan1,2,GUI Xiaolin1,2,AN Jian1,2,TIAN Feng1,2,WANG Gang3

      (1.School of Electronics and Information Engineering, Xi’an Jiaotong University, Xi’an 710049, China; 2.Shaanxi Province Key Laboratory of Computer Network, Xi’an Jiaotong University, Xi’an 710049, China; 3.School of Information, Xi’an University of Finance and Economics, Xi’an 710049, China)

      A classification method for perturbed data using the Bayesian rule is presented to solve the problem that the result of data mining is affected when the retrievable general additive data perturbation (RGADP) algorithm is used to preserve privacy in database.The process of RGADP algorithm is analyzed, and the Bayesian rule is used to estimate the probability distribution of original data from the perturbed data.Then, new data are reconstructed from the estimated probability distribution and are classified to increase the accuracy of classification.Experimental results show that the probability distribution estimated by the proposed method is close to the original probability distribution.Comparison with the classification accuracy of perturbed data shows that the classification accuracy of the reconstructed data increases by more than 4% in average, and is closer to the original classification accuracy.Thus, the method can effectively reduce the effect of the perturbation algorithm on classification.Moreover, the running time of the method is proportional to the amount of data and the number of groups.The method costs less than 200 ms to reconstruct 10 thousands data, and has a high efficiency.

      privacy-preservation; data perturbation; Bayesian rule; classification

      2014-11-08。 作者簡介:楊攀(1987—),男,博士生;桂小林(通信作者),男,教授,博士生導(dǎo)師。 基金項(xiàng)目:高等學(xué)校博士學(xué)科點(diǎn)專項(xiàng)科研基金資助項(xiàng)目(20120201110013);國家自然科學(xué)基金資助項(xiàng)目(61172090,61472316);中央高校基本科研業(yè)務(wù)費(fèi)資助項(xiàng)目(XKJC2014008);陜西省科技統(tǒng)籌創(chuàng)新工程資助項(xiàng)目(2013SZS16)。

      10.7652/xjtuxb201504008

      TP301

      A

      0253-987X(2015)04-0046-07

      猜你喜歡
      概率分布原始數(shù)據(jù)貝葉斯
      GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
      受特定變化趨勢限制的傳感器數(shù)據(jù)處理方法研究
      離散型概率分布的ORB圖像特征點(diǎn)誤匹配剔除算法
      全新Mentor DRS360 平臺借助集中式原始數(shù)據(jù)融合及直接實(shí)時傳感技術(shù)實(shí)現(xiàn)5 級自動駕駛
      汽車零部件(2017年4期)2017-07-12 17:05:53
      關(guān)于概率分布函數(shù)定義的辨析
      科技視界(2016年19期)2017-05-18 10:18:46
      貝葉斯公式及其應(yīng)用
      基于概率分布的PPP項(xiàng)目風(fēng)險(xiǎn)承擔(dān)支出測算
      基于貝葉斯估計(jì)的軌道占用識別方法
      一種基于貝葉斯壓縮感知的說話人識別方法
      電子器件(2015年5期)2015-12-29 08:43:15
      IIRCT下負(fù)二項(xiàng)分布參數(shù)多變點(diǎn)的貝葉斯估計(jì)
      申扎县| 许昌县| 肇源县| 疏附县| 金坛市| 清苑县| 上高县| 庆阳市| 那曲县| 汝州市| 伊宁市| 大兴区| 崇信县| 彭泽县| 合川市| 乌兰察布市| 涡阳县| 双辽市| 石首市| 南郑县| 凯里市| 五常市| 义乌市| 施秉县| 泽普县| 蒙山县| 晋城| 沂水县| 黔西| 凤庆县| 古交市| 法库县| 印江| 江阴市| 泉州市| 涞水县| 清远市| 仁怀市| 凌云县| 嘉鱼县| 迁安市|