• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    面向大數(shù)據(jù)的數(shù)據(jù)庫(kù)劃分FP-Growth改進(jìn)算法

    2022-11-18 02:40:02魏昕怡林兩位
    關(guān)鍵詞:子樹(shù)項(xiàng)集事務(wù)

    張 樂(lè),魏昕怡,徐 蘇,林兩位

    (1.南昌大學(xué)數(shù)學(xué)與計(jì)算機(jī)學(xué)院,江西 南昌 330031;2.南昌大學(xué)際鑾書(shū)院,江西 南昌 330031;3.數(shù)字福建氣象大數(shù)據(jù)研究所(閩南師范大學(xué)),福建 漳州 363000)

    在傳統(tǒng)的數(shù)據(jù)挖掘領(lǐng)域,對(duì)數(shù)據(jù)集進(jìn)行頻繁項(xiàng)集挖掘,可以采用經(jīng)典的Apriori算法[1]和FP-growth算法[2]及一些改進(jìn)算法。其中,Apriori算法需要多次掃描事務(wù)數(shù)據(jù)庫(kù),一來(lái)產(chǎn)生很大的I/O負(fù)載,二來(lái)會(huì)產(chǎn)生龐大的候選集,從而占用大量?jī)?nèi)存空間;FP-growth算法雖然只需兩次掃描事務(wù)數(shù)據(jù)庫(kù),大大降低了I/O負(fù)載,且不產(chǎn)生候選集,從而使算法效率更高[3],但其算法的基礎(chǔ)是需要生成FP樹(shù),所生成的FP樹(shù)同樣占用了大量?jī)?nèi)存空間。

    在大數(shù)據(jù)時(shí)代,面對(duì)大規(guī)模海量數(shù)據(jù),單機(jī)環(huán)境下的存儲(chǔ)和計(jì)算能力將成為數(shù)據(jù)挖掘的瓶頸[4],因此,對(duì)傳統(tǒng)算法進(jìn)行改進(jìn),利用大數(shù)據(jù)、并行計(jì)算技術(shù)等進(jìn)行頻繁項(xiàng)集挖掘成為人們研究的重點(diǎn)。

    文獻(xiàn)[5-12]都是基于FP-growth算法的采用不同并行處理技術(shù)進(jìn)行頻繁項(xiàng)集挖掘的改進(jìn)的算法,算法效率有所提升。但它們都面臨著同一個(gè)問(wèn)題,即在大數(shù)據(jù)環(huán)境下,面對(duì)海量事務(wù)數(shù)據(jù)庫(kù),在單機(jī)中無(wú)法存儲(chǔ)所生成的FP樹(shù),從而導(dǎo)致算法失效。文獻(xiàn)[13]采用了投影數(shù)據(jù)庫(kù)技術(shù),并通過(guò)MapReduce編程模型和并行處理技術(shù)實(shí)現(xiàn),在一定程度上解決了以上問(wèn)題。但在實(shí)際應(yīng)用中,常常會(huì)遇到實(shí)際可用節(jié)點(diǎn)機(jī)資源有限及單個(gè)節(jié)點(diǎn)機(jī)內(nèi)存不足的情況,使該算法的應(yīng)用有一定局限性;在某些極端情況下還有可能出現(xiàn)某個(gè)投影數(shù)據(jù)庫(kù)的規(guī)模同樣很大,甚至接近原始事務(wù)數(shù)據(jù)庫(kù)的規(guī)模,從而同樣會(huì)導(dǎo)致算法失效的問(wèn)題。為此,本文提出一種劃分?jǐn)?shù)據(jù)庫(kù)的方法,允許用戶自行設(shè)置所劃分的子數(shù)據(jù)庫(kù)的規(guī)模,從而有效解決實(shí)際應(yīng)用環(huán)境中因受單機(jī)內(nèi)存資源的限制而算法失效的問(wèn)題。

    1 傳統(tǒng)的FP-growth算法

    FP-growth算法使用了一種稱為頻繁模式樹(shù)(FP樹(shù))的數(shù)據(jù)結(jié)構(gòu),F(xiàn)P樹(shù)是一種特殊的前綴樹(shù),由頻繁項(xiàng)頭表和項(xiàng)前綴樹(shù)構(gòu)成。算法分兩個(gè)階段進(jìn)行,第一個(gè)階段是將整個(gè)事務(wù)數(shù)據(jù)庫(kù)壓縮到一顆頻繁模式樹(shù)上,第二個(gè)階段是通過(guò)對(duì)頻繁模式樹(shù)進(jìn)行挖掘,生成所有的頻繁項(xiàng)集。

    我們通過(guò)一個(gè)例子來(lái)說(shuō)明FP-growth算法的過(guò)程。假設(shè)事務(wù)數(shù)據(jù)庫(kù)如表1所示,該事務(wù)數(shù)據(jù)庫(kù)共有10個(gè)事務(wù),其中包含a,b,c,d,e,f,g,h共8個(gè)項(xiàng),設(shè)定最小支持度計(jì)數(shù)為min-support=2。

    表1 事務(wù)數(shù)據(jù)庫(kù)DTable 1 Transaction database D

    其算法的主要步驟如下:

    (1)第一次掃描事務(wù)數(shù)據(jù)庫(kù)D,得到所有頻繁1項(xiàng)集,并對(duì)頻繁1項(xiàng)按支持度計(jì)數(shù)的降序排序,得到頻繁1項(xiàng)頭表L(如表2所示)。其中,f,g和h支持度計(jì)數(shù)為1,小于最小支持度計(jì)數(shù),屬于非頻繁項(xiàng),因此它們不會(huì)出現(xiàn)在頻繁1項(xiàng)集頭表L中。

    表2 頻繁1項(xiàng)集頭表LTable 2 Frequent 1-item set

    (2)FP樹(shù)構(gòu)造:首先創(chuàng)建樹(shù)的根節(jié)點(diǎn),用“null”標(biāo)記。第二次掃描數(shù)據(jù)庫(kù)D,在FP樹(shù)中為每個(gè)事務(wù)創(chuàng)建一個(gè)分枝,分枝中的每個(gè)節(jié)點(diǎn)對(duì)應(yīng)該事務(wù)的每一個(gè)項(xiàng)(刪除非頻繁項(xiàng)),且按表L中的順序鏈接,同時(shí)分枝中的每個(gè)項(xiàng)計(jì)數(shù)加1。最后,建立頻繁1項(xiàng)頭表與FP樹(shù)的關(guān)聯(lián),得到如下圖1所示的FP樹(shù)。

    圖1 FP樹(shù)Fig.1 FP Tree

    (3)對(duì)以上生成的FP樹(shù)進(jìn)行挖掘,得到全部頻繁項(xiàng)集。挖掘的過(guò)程是通過(guò)調(diào)用以下過(guò)程遞歸實(shí)現(xiàn)的:

    Procedure FP-growth(tree,α)

    IF tree含單個(gè)路徑P THEN

    FOR each路徑P中節(jié)點(diǎn)的每個(gè)組合(記作β)

    產(chǎn)生模式β∪α,其支持度等于β中節(jié)點(diǎn)的

    最小支持度計(jì)數(shù);

    ELSE

    FOR tree的頭表中的每個(gè)αi

    {產(chǎn)生模式β=αi∪α,其支持度等于αi;

    構(gòu)造β的條件模式基,然后構(gòu)造β的條件FP樹(shù)treeβ;

    IF treeβ≠Φ THEN

    調(diào)用FP-growth(treeβ,β);

    }

    2 FP-growth算法的改進(jìn)

    FP-growth算法在事務(wù)數(shù)據(jù)庫(kù)規(guī)模不是很大,F(xiàn)P樹(shù)能夠在單機(jī)內(nèi)存中存儲(chǔ)下的情況下是有效的。但在大數(shù)據(jù)環(huán)境下,面對(duì)海量數(shù)據(jù)庫(kù),所構(gòu)建的FP樹(shù)根本無(wú)法在單機(jī)內(nèi)存中存儲(chǔ),這種方法也就失效了。為此,我們對(duì)傳統(tǒng)的FP-growth算法進(jìn)行改進(jìn)。我們?nèi)匀灰郧懊娴氖聞?wù)數(shù)據(jù)庫(kù)D為例,說(shuō)明具體的改進(jìn)方法。本算法的運(yùn)行環(huán)境是一個(gè)由一臺(tái)mater主機(jī)和多臺(tái)slave節(jié)點(diǎn)機(jī)組成的并行計(jì)算環(huán)境。在這種運(yùn)行環(huán)境下,改進(jìn)后的算法的實(shí)現(xiàn)過(guò)程如下:

    (1)第一次掃描事務(wù)數(shù)據(jù)庫(kù)D,得到所有頻繁1項(xiàng)集,并對(duì)頻繁1項(xiàng)按支持度計(jì)數(shù)的降序排序,得到頻繁1項(xiàng)頭表L(如表2所示)。這一步跟傳統(tǒng)FP-growth算法相同。

    (2)對(duì)事務(wù)數(shù)據(jù)庫(kù)D進(jìn)行數(shù)據(jù)清理,將D中的所有非頻繁1項(xiàng)刪除。然后對(duì)D按每個(gè)頻繁1項(xiàng)(表L中第一個(gè)項(xiàng)b除外)進(jìn)行抽取,為每個(gè)頻繁1項(xiàng)建立一個(gè)所有事務(wù)均含該項(xiàng)的投影數(shù)據(jù)庫(kù)。a,c,d,e對(duì)應(yīng)的投影數(shù)據(jù)庫(kù)分別如表3~表6所示。

    (3)由投影數(shù)據(jù)庫(kù)去直接生成的FP樹(shù)仍然有可能規(guī)模龐大,在單機(jī)內(nèi)存中無(wú)法存放。為此,我們對(duì)以上投影數(shù)據(jù)庫(kù)進(jìn)行進(jìn)一步的劃分,按預(yù)先設(shè)定所含最大事務(wù)數(shù)的方式,將投影數(shù)據(jù)庫(kù)分成一個(gè)個(gè)投影子數(shù)據(jù)庫(kù)。例如,上例中我們?cè)O(shè)定所有劃分后的投影子數(shù)據(jù)庫(kù)中包含的事務(wù)數(shù)最大為4,則a和c的投影數(shù)據(jù)庫(kù)各被進(jìn)一步劃分成兩個(gè)投影子數(shù)據(jù)庫(kù)Da:1,Da:2和Dc:1,Dc:2,如表7~表10所示。

    表3 a對(duì)應(yīng)的投影數(shù)據(jù)庫(kù)DaTable 3 The corresponding projection database Da with a

    表4 c對(duì)應(yīng)的投影數(shù)據(jù)庫(kù)DcTable 4 The corresponding projection database Dc with c

    表5 d對(duì)應(yīng)的投影數(shù)據(jù)庫(kù)DdTable 5 The corresponding projection database Dd with d

    表6 e對(duì)應(yīng)的投影數(shù)據(jù)庫(kù)DeTable 6 The corresponding projection database De with e

    表7 a對(duì)應(yīng)的投影子數(shù)據(jù)庫(kù)Da:1Table 7 The corresponding projection sub-database Da:1 with a

    這些投影子數(shù)據(jù)庫(kù)被分發(fā)在一個(gè)個(gè)節(jié)點(diǎn)機(jī)上。

    (4)每個(gè)節(jié)點(diǎn)機(jī)對(duì)投影子數(shù)據(jù)庫(kù)進(jìn)行掃描,構(gòu)造對(duì)應(yīng)項(xiàng)的投影FP子樹(shù)。在這里我們需要對(duì)傳統(tǒng)FP-growth構(gòu)造FP樹(shù)的算法加以改進(jìn)。設(shè)第k個(gè)節(jié)點(diǎn)機(jī)處理的是頻繁1項(xiàng)m對(duì)應(yīng)的投影子數(shù)據(jù)庫(kù)Dm:i。在對(duì)Dm:i中的每個(gè)事務(wù)處理時(shí),首先將每個(gè)事務(wù)中的項(xiàng)按表L的次序排序,并將m以及其后的所有項(xiàng)全部刪除,只將剩余的項(xiàng)在擬構(gòu)造的FP子樹(shù)中生成分枝。具體算法如下:

    ① 創(chuàng)建FP子樹(shù)的根節(jié)點(diǎn),以“null”標(biāo)記。

    ② 遍歷數(shù)據(jù)庫(kù)Dm:i,對(duì)Dm:i中的每個(gè)事務(wù)執(zhí)行:

    a.將事務(wù)中的項(xiàng)按L中的次序排序,并將m以及其后的所有項(xiàng)全部刪除,形成事務(wù)項(xiàng)列表記為[p│P],其中p為第一個(gè)項(xiàng)元素,而P為剩余項(xiàng)元素的列表。

    b.調(diào)用insert_tree([p│P],T)。insert_tree([p│P],T)執(zhí)行過(guò)程如下:如果T有一個(gè)子女N使得N.item-name=p.item-name,則N的計(jì)數(shù)增1,同時(shí)頭表中其對(duì)應(yīng)項(xiàng)支持度計(jì)數(shù)增1;否則創(chuàng)建一個(gè)新節(jié)點(diǎn)N,將其計(jì)數(shù)設(shè)置為1,鏈接到它的父節(jié)點(diǎn)T,同時(shí)頭表中添加一項(xiàng),支持度計(jì)數(shù)設(shè)置為1。如果P非空,遞歸地調(diào)用insert_tree([p│P],T)。

    表8 a對(duì)應(yīng)的投影子數(shù)據(jù)庫(kù)Da:2Table 8 The corresponding projection sub-database Da:2 with a

    表9 c對(duì)應(yīng)的投影數(shù)據(jù)庫(kù)Dc:1Table 9 The corresponding projection sub-database Dc:1 with c

    表10 c對(duì)應(yīng)的投影數(shù)據(jù)庫(kù)Dc:2Table 10 The corresponding projection sub-database Dc:1 with c

    由此改進(jìn)算法生成的FP樹(shù)稱為頻繁1項(xiàng)m所對(duì)應(yīng)的投影子數(shù)據(jù)庫(kù)的FP子樹(shù)Tm:i,為a,c,d,e構(gòu)建的投影FP子樹(shù)分別如圖2~圖7所示。

    (5)每個(gè)節(jié)點(diǎn)機(jī)對(duì)所構(gòu)建的FP子樹(shù)進(jìn)行挖掘,產(chǎn)生局部頻繁項(xiàng)集。設(shè)某節(jié)點(diǎn)機(jī)處理生成的m的FP子樹(shù)為Tm:i,則由條件FP子樹(shù)挖掘頻繁項(xiàng)集的算法如下:

    圖2 a的投影FP子樹(shù)Ta:1Fig.2 Projection FP subtree Ta:1 with a

    圖3 a的投影FP子樹(shù)Ta:2Fig.3 Projection FP subtree Ta:2 with a

    圖4 c的投影FP子樹(shù)Tc:1Fig.4 Projection FP subtree Tc:1 with c

    圖5 c的投影FP子樹(shù)Tc:2Fig.5 Projection FP subtree Tc:2 with c

    圖6 d的投影FP子樹(shù)Td:1Fig.6 Projection FP subtree Td:1 with d

    FOR從樹(shù)Tm:i根節(jié)點(diǎn)null開(kāi)始的每一條路徑R

    FOR路徑R中的每個(gè)節(jié)點(diǎn)p

    產(chǎn)生模式C=p∪m,其支持度計(jì)數(shù)等于C中各節(jié)點(diǎn)支持度計(jì)數(shù)的最小值

    FOR路徑R中的每個(gè)節(jié)點(diǎn)組合P

    局部頻繁模式=P∪m,其支持度計(jì)數(shù)等于C的支持度計(jì)數(shù)

    (6)將同一個(gè)頻繁1項(xiàng)的投影子數(shù)據(jù)庫(kù)生成的局部頻繁項(xiàng)集匯聚到同一個(gè)節(jié)點(diǎn)機(jī)進(jìn)行歸并,產(chǎn)生該頻繁1項(xiàng)的頻繁項(xiàng)集。

    (7)最后匯總所有節(jié)點(diǎn)機(jī)生成的頻繁1項(xiàng)對(duì)應(yīng)的頻繁項(xiàng)集,從而得到全部的頻繁項(xiàng)集。

    圖7 e的投影FP子樹(shù)Te:1Fig.7 Projection FP subtree Te:1 with e

    3 并行頻繁項(xiàng)集挖掘?qū)崿F(xiàn)

    改進(jìn)后的頻繁項(xiàng)集挖掘分為兩個(gè)階段:第一階段生成全部的頻繁1項(xiàng)集,并構(gòu)建頻繁1項(xiàng)頭表L,我們可以使用MapReduce編程模型并行實(shí)現(xiàn)[14,15];第二階段由多個(gè)節(jié)點(diǎn)機(jī)并行挖掘頻繁項(xiàng)集,最后匯總得到全部的頻繁項(xiàng)集。

    第一階段實(shí)現(xiàn)過(guò)程如下:

    (1)在master主機(jī)上將事務(wù)數(shù)據(jù)庫(kù)中的事務(wù)分成相同的n個(gè)數(shù)據(jù)塊,然后把n個(gè)數(shù)據(jù)塊發(fā)送到n個(gè)slave節(jié)點(diǎn)機(jī)。

    (2)每個(gè)slave節(jié)點(diǎn)機(jī)進(jìn)行并行Map處理,計(jì)算出局部的1項(xiàng)集及其支持度計(jì)數(shù);然后通過(guò)Combiner函數(shù)合并相同項(xiàng),并把結(jié)果發(fā)送給master主機(jī)。

    (3)master主機(jī)進(jìn)行Reduce處理,將所有slave節(jié)點(diǎn)發(fā)送來(lái)的結(jié)果進(jìn)行匯總,計(jì)算出全局頻繁1項(xiàng)集及其支持度計(jì)數(shù),然后按支持度計(jì)數(shù)值對(duì)頻繁1項(xiàng)集降序排序,最終得到排序后的結(jié)果頭表L(如表2所示)。

    由于采用MapReduce模式并行實(shí)現(xiàn),這一過(guò)程所花費(fèi)的時(shí)間將比傳統(tǒng)FP-growth算法更少。

    第二階段實(shí)現(xiàn)過(guò)程如下:

    (1)首先每個(gè)節(jié)點(diǎn)機(jī)對(duì)此前master分發(fā)來(lái)的數(shù)據(jù)塊進(jìn)行數(shù)據(jù)清理,將數(shù)據(jù)塊中的所有非頻繁1項(xiàng)刪除。然后對(duì)數(shù)據(jù)塊進(jìn)行頻繁1項(xiàng)抽取,為每個(gè)頻繁1項(xiàng)生成部分投影數(shù)據(jù)庫(kù),同一頻繁1項(xiàng)的所有部分投影數(shù)據(jù)庫(kù)被匯聚到同一節(jié)點(diǎn)機(jī),生成所有記錄都包含該頻繁1項(xiàng)的投影數(shù)據(jù)庫(kù)。

    (2)由slave節(jié)點(diǎn)機(jī)對(duì)每個(gè)投影數(shù)據(jù)庫(kù)進(jìn)行進(jìn)一步的劃分,按預(yù)先設(shè)定所含最大事務(wù)記錄數(shù)的方式,將投影數(shù)據(jù)庫(kù)分成一個(gè)個(gè)投影子數(shù)據(jù)庫(kù)。

    (3)每個(gè)slave節(jié)點(diǎn)機(jī)為投影子數(shù)據(jù)庫(kù)生成對(duì)應(yīng)的FP子樹(shù),并對(duì)這些FP子樹(shù)進(jìn)行挖掘生成局部頻繁項(xiàng)集。

    (4)同一投影數(shù)據(jù)庫(kù)對(duì)應(yīng)的所有子數(shù)據(jù)庫(kù)生成的局部頻繁項(xiàng)匯聚到同一節(jié)點(diǎn)機(jī)上,生成該投影數(shù)據(jù)庫(kù)對(duì)應(yīng)的頻繁項(xiàng)集,然后將結(jié)果發(fā)送給master主機(jī)。

    (5)master主機(jī)將所有結(jié)果匯總后得到的就是全部的頻繁項(xiàng)集。

    4 算法實(shí)驗(yàn)分析

    傳統(tǒng)的FP-Growth算法在面對(duì)海量事務(wù)數(shù)據(jù)庫(kù)時(shí)將會(huì)遇到因所生成的FP樹(shù)規(guī)模龐大而無(wú)法在單機(jī)內(nèi)存中存儲(chǔ)從而導(dǎo)致算法失效這一問(wèn)題已在文獻(xiàn)[12]中進(jìn)行了驗(yàn)證。本文所提出的算法因?yàn)椴捎昧藬?shù)據(jù)庫(kù)劃分的方法,不會(huì)存在這一問(wèn)題。因此,本實(shí)驗(yàn)主要針對(duì)本文所提出的劃分?jǐn)?shù)據(jù)庫(kù)算法(記為DPFP算法)在并行計(jì)算環(huán)境下的運(yùn)行效率進(jìn)行分析。實(shí)驗(yàn)方法主要是將DPFP算法在Hadoop集群環(huán)境下的運(yùn)行時(shí)間與傳統(tǒng)的FP-growth算法在單機(jī)環(huán)境下的運(yùn)行時(shí)間進(jìn)行比對(duì)。Hadoop集群環(huán)境采用主從式架構(gòu),包括1個(gè)master主機(jī)(配置為Intel i7-9700 CPU,16GB內(nèi)存)和最多10個(gè)slave節(jié)點(diǎn)機(jī)(配置為Intel i5-2450 CPU,4GB內(nèi)存)。

    實(shí)驗(yàn)一:DPFP算法分別在由1臺(tái)master主機(jī)加5臺(tái)slave節(jié)點(diǎn)機(jī)和1臺(tái)master主機(jī)加10臺(tái)slave節(jié)點(diǎn)機(jī)組成的集群環(huán)境上運(yùn)行,F(xiàn)P-growth算法在單臺(tái)節(jié)點(diǎn)機(jī)上運(yùn)行。實(shí)驗(yàn)數(shù)據(jù)集選取Frequent Itemset Mining Data Repository[16]里的T1014D100K.dat,該數(shù)據(jù)集包含10萬(wàn)條記錄。其中設(shè)定的最小支持度分別為2%,4%,6%,8%和10%。實(shí)驗(yàn)結(jié)果分別如圖8,9所示。

    從運(yùn)行結(jié)果看:

    (1)DPFP算法在執(zhí)行效率上比傳統(tǒng)的FP-growth算法更高,且節(jié)點(diǎn)機(jī)數(shù)量越多,DPFP算法所需的時(shí)間越少,這也體現(xiàn)了并行處理的優(yōu)勢(shì)。

    (2)隨著最小支持度數(shù)值的增加,兩種算法的挖掘時(shí)間都逐漸減少。這是因?yàn)樽钚≈С侄葦?shù)值越大,頻繁項(xiàng)越少。對(duì)FP-growth算法來(lái)說(shuō),最小支持度數(shù)值越大,生成的FP樹(shù)越小,對(duì)FP樹(shù)遞歸挖掘的時(shí)間也就越少;對(duì)DPFP算法來(lái)說(shuō),最小支持度數(shù)值越大,生成的頻繁1項(xiàng)投影數(shù)據(jù)庫(kù)越少,分發(fā)數(shù)據(jù)的時(shí)間就越少,對(duì)投影子數(shù)據(jù)庫(kù)進(jìn)行挖掘的時(shí)間也就越少。

    (3)DPFP算法相比FP-growth算法的加速比并不會(huì)隨著最小支持度數(shù)值的增加而成線性增長(zhǎng)[17],這是因?yàn)樽钚≈С侄仍酱?,DPFP算法中所進(jìn)行的投影數(shù)據(jù)庫(kù)生成和分發(fā)所占的時(shí)間比值越大,而這些操作在FP-growth算法中是沒(méi)有的。因此,當(dāng)最小支持度逐漸增大后,F(xiàn)P-growth算法所生成的FP樹(shù)越來(lái)越小,遞歸挖掘的時(shí)間會(huì)越來(lái)越呈線性遞減的趨勢(shì)。

    最小支持度圖8 實(shí)驗(yàn)一5臺(tái)節(jié)點(diǎn)機(jī)Fig.8 Experiment 1:5-Node machines

    最小支持度圖9 實(shí)驗(yàn)一10臺(tái)節(jié)點(diǎn)機(jī)Fig.9 Experiment 1:10-Node machines

    實(shí)驗(yàn)二:DPFP算法在由1臺(tái)master主機(jī)加10臺(tái)slave節(jié)點(diǎn)機(jī)組成的集群環(huán)境上運(yùn)行,F(xiàn)P-growth算法仍然在單臺(tái)節(jié)點(diǎn)機(jī)上運(yùn)行。實(shí)驗(yàn)數(shù)據(jù)由IBM QUEST Market-Basket Synthetic Data Generator產(chǎn)生,選取包含100萬(wàn)條記錄的事務(wù)數(shù)據(jù)庫(kù)。設(shè)定的最小支持度同樣分別為2%,4%,6%,8%和10%。實(shí)驗(yàn)結(jié)果如圖10所示。

    從運(yùn)行結(jié)果看,隨著事務(wù)數(shù)據(jù)庫(kù)規(guī)模的增大,DPFP算法的效率更加明顯。這是因?yàn)閿?shù)據(jù)庫(kù)規(guī)模越大,F(xiàn)P-growth算法生成的FP樹(shù)就越大,遞歸挖掘龐大的FP樹(shù)將非常耗時(shí)。而對(duì)DPFP算法來(lái)說(shuō),投影數(shù)據(jù)庫(kù)生成和分發(fā)所占的時(shí)間比值變得更小,且因?yàn)镈PFP算法劃分的子數(shù)據(jù)庫(kù)規(guī)模接近,分配到各節(jié)點(diǎn)機(jī)的負(fù)載更均衡,由多個(gè)節(jié)點(diǎn)機(jī)并行處理的效率更加顯現(xiàn)出來(lái)。

    最小支持度圖10 實(shí)驗(yàn)二10臺(tái)節(jié)點(diǎn)機(jī)Fig.10 Experiment 2:10-Node machines

    5 總結(jié)

    本文所提出的算法基于傳統(tǒng)的FP-growth算法進(jìn)行改進(jìn),并通過(guò)Hadoop架構(gòu)和MapReduce編程模型實(shí)現(xiàn)。在該算法中,首先對(duì)所有頻繁1項(xiàng)生成投影數(shù)據(jù)庫(kù),再對(duì)投影數(shù)據(jù)庫(kù)進(jìn)行劃分。由于用戶可以靈活設(shè)置所劃分的子數(shù)據(jù)庫(kù)中事務(wù)記錄的數(shù)量,因此可以有效控制由這些子數(shù)據(jù)庫(kù)生成的FP子樹(shù)的規(guī)模,從而有效解決因FP樹(shù)在單機(jī)內(nèi)存中存儲(chǔ)不下導(dǎo)致算法失效的問(wèn)題。同時(shí)由于采用MapReduce編程模型實(shí)現(xiàn)并行FP子樹(shù)的生成和挖掘,且分發(fā)到各節(jié)點(diǎn)機(jī)的用于生成FP子樹(shù)的子數(shù)據(jù)庫(kù)規(guī)模接近,使得各節(jié)點(diǎn)機(jī)上的負(fù)載更均衡。在大規(guī)模集群環(huán)境下使用該算法可以很好地解決對(duì)大數(shù)據(jù)的挖掘。

    猜你喜歡
    子樹(shù)項(xiàng)集事務(wù)
    黑莓子樹(shù)與烏鶇鳥(niǎo)
    “事物”與“事務(wù)”
    基于分布式事務(wù)的門架數(shù)據(jù)處理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
    一種新的快速挖掘頻繁子樹(shù)算法
    河湖事務(wù)
    書(shū)本圖的BC-子樹(shù)計(jì)數(shù)及漸進(jìn)密度特性分析?
    基于覆蓋模式的頻繁子樹(shù)挖掘方法
    關(guān)聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
    卷宗(2014年5期)2014-07-15 07:47:08
    一種頻繁核心項(xiàng)集的快速挖掘算法
    SQLServer自治事務(wù)實(shí)現(xiàn)方案探析
    国产成人免费观看mmmm| 性色avwww在线观看| 又爽又黄无遮挡网站| 秋霞伦理黄片| 国产精品一区二区性色av| 欧美bdsm另类| 午夜免费鲁丝| 成年免费大片在线观看| 麻豆成人av视频| av在线观看视频网站免费| 精品久久久久久久久av| 成人无遮挡网站| 狠狠精品人妻久久久久久综合| 赤兔流量卡办理| 亚洲第一区二区三区不卡| 国产伦精品一区二区三区视频9| 国产精品精品国产色婷婷| 国产 精品1| 国产成人a区在线观看| 九九在线视频观看精品| 777米奇影视久久| 插阴视频在线观看视频| 亚洲人成网站高清观看| 中文天堂在线官网| 狂野欧美激情性xxxx在线观看| 人妻少妇偷人精品九色| 可以在线观看毛片的网站| 大话2 男鬼变身卡| 国产成人福利小说| 97精品久久久久久久久久精品| 成人一区二区视频在线观看| 日韩av在线免费看完整版不卡| 国产成人精品婷婷| 欧美xxxx性猛交bbbb| 一级毛片aaaaaa免费看小| 欧美xxⅹ黑人| 少妇人妻 视频| 国精品久久久久久国模美| 成人二区视频| 五月开心婷婷网| 日本色播在线视频| 亚洲欧美日韩卡通动漫| 日日啪夜夜爽| 制服丝袜香蕉在线| 色哟哟·www| 国产片特级美女逼逼视频| 又黄又爽又刺激的免费视频.| 人体艺术视频欧美日本| 免费电影在线观看免费观看| 日韩欧美精品免费久久| 观看免费一级毛片| 亚洲第一区二区三区不卡| 色吧在线观看| 亚洲国产精品成人久久小说| 国产精品人妻久久久久久| 亚洲精品亚洲一区二区| 视频中文字幕在线观看| 日韩亚洲欧美综合| 国产爽快片一区二区三区| 亚洲欧美清纯卡通| 久久精品国产自在天天线| 亚洲欧美成人综合另类久久久| 亚洲国产av新网站| av免费在线看不卡| 国国产精品蜜臀av免费| 嫩草影院新地址| 99久久精品国产国产毛片| 建设人人有责人人尽责人人享有的 | 欧美成人午夜免费资源| 内地一区二区视频在线| 久热这里只有精品99| 久久久久久久久久成人| 免费观看在线日韩| 国产精品福利在线免费观看| 国产精品人妻久久久影院| 免费观看性生交大片5| 麻豆成人午夜福利视频| 亚洲精华国产精华液的使用体验| 亚洲成人中文字幕在线播放| 亚洲色图综合在线观看| av在线老鸭窝| 天堂中文最新版在线下载 | 欧美日韩亚洲高清精品| 成人亚洲欧美一区二区av| 国产成人免费观看mmmm| 最近的中文字幕免费完整| 免费看不卡的av| 日韩一本色道免费dvd| 亚洲精品国产成人久久av| 韩国av在线不卡| 日日摸夜夜添夜夜添av毛片| 精品国产三级普通话版| 国产老妇伦熟女老妇高清| 亚洲丝袜综合中文字幕| 成人黄色视频免费在线看| 91在线精品国自产拍蜜月| 成人亚洲精品av一区二区| 成年版毛片免费区| 狂野欧美激情性bbbbbb| 日韩,欧美,国产一区二区三区| 美女主播在线视频| 最后的刺客免费高清国语| 国产 一区 欧美 日韩| 欧美三级亚洲精品| 一级二级三级毛片免费看| 美女高潮的动态| 天天一区二区日本电影三级| 日韩大片免费观看网站| 欧美xxxx性猛交bbbb| 亚洲国产精品999| 少妇人妻一区二区三区视频| 久久久久九九精品影院| 免费看不卡的av| 精华霜和精华液先用哪个| 一二三四中文在线观看免费高清| 成人综合一区亚洲| 亚洲欧美日韩无卡精品| 好男人视频免费观看在线| 老师上课跳d突然被开到最大视频| 亚洲第一区二区三区不卡| 国产一区二区亚洲精品在线观看| 国产精品蜜桃在线观看| 亚洲欧美一区二区三区黑人 | av免费在线看不卡| a级毛色黄片| 国产一区二区三区综合在线观看 | 一级毛片我不卡| 男女那种视频在线观看| 日韩av在线免费看完整版不卡| 亚洲av一区综合| 亚洲精品国产av蜜桃| 老司机影院毛片| 大码成人一级视频| 91精品国产九色| 在线a可以看的网站| 亚洲av福利一区| 午夜激情福利司机影院| 成人亚洲欧美一区二区av| 欧美精品国产亚洲| 女的被弄到高潮叫床怎么办| av在线蜜桃| 噜噜噜噜噜久久久久久91| 如何舔出高潮| 日韩欧美 国产精品| 男女边吃奶边做爰视频| 欧美 日韩 精品 国产| 在线a可以看的网站| 国产国拍精品亚洲av在线观看| 99热6这里只有精品| 伊人久久精品亚洲午夜| 高清日韩中文字幕在线| 天堂俺去俺来也www色官网| 岛国毛片在线播放| a级毛片免费高清观看在线播放| 欧美3d第一页| 亚洲欧美精品自产自拍| 青春草亚洲视频在线观看| 久久久久久久国产电影| 22中文网久久字幕| 一区二区三区四区激情视频| 老师上课跳d突然被开到最大视频| 国产爱豆传媒在线观看| 黄色怎么调成土黄色| 亚洲精品一区蜜桃| 国产精品国产三级专区第一集| 亚洲色图综合在线观看| 99久久精品一区二区三区| 精品人妻视频免费看| 午夜老司机福利剧场| 国产在线男女| 国内揄拍国产精品人妻在线| 秋霞在线观看毛片| 一级毛片黄色毛片免费观看视频| 免费观看性生交大片5| av在线老鸭窝| 看非洲黑人一级黄片| 久久久久九九精品影院| 欧美高清成人免费视频www| 亚洲欧洲国产日韩| 日韩一区二区三区影片| 国产精品人妻久久久久久| 国产爱豆传媒在线观看| 最新中文字幕久久久久| 国产亚洲91精品色在线| 91久久精品国产一区二区三区| 亚洲精品色激情综合| 国产亚洲最大av| 啦啦啦中文免费视频观看日本| 日韩免费高清中文字幕av| 免费黄网站久久成人精品| 精品酒店卫生间| 久久精品国产自在天天线| 久久久久久久精品精品| 免费看av在线观看网站| 国产探花极品一区二区| 亚洲熟女精品中文字幕| 中国国产av一级| 一本一本综合久久| av黄色大香蕉| 老司机影院毛片| 99热网站在线观看| 精品久久久精品久久久| 麻豆成人av视频| 亚洲av免费在线观看| 青春草国产在线视频| 人体艺术视频欧美日本| 免费观看性生交大片5| 天堂网av新在线| 中文欧美无线码| 高清欧美精品videossex| 欧美老熟妇乱子伦牲交| 少妇的逼好多水| 亚洲国产成人一精品久久久| 亚洲av中文av极速乱| 欧美成人一区二区免费高清观看| 伦精品一区二区三区| 国产精品国产三级国产av玫瑰| 日本黄色片子视频| 国产乱人视频| 久久国内精品自在自线图片| 白带黄色成豆腐渣| 一级二级三级毛片免费看| tube8黄色片| 国产精品无大码| 美女cb高潮喷水在线观看| av在线亚洲专区| 色吧在线观看| 亚洲美女搞黄在线观看| 天堂中文最新版在线下载 | 人妻系列 视频| 国产视频内射| 午夜亚洲福利在线播放| 国产精品国产三级国产专区5o| 成人午夜精彩视频在线观看| 国产精品一区二区性色av| 亚洲精品国产成人久久av| 18禁动态无遮挡网站| 熟女电影av网| 色吧在线观看| 大片免费播放器 马上看| 涩涩av久久男人的天堂| 老司机影院毛片| 看非洲黑人一级黄片| 天美传媒精品一区二区| 蜜桃亚洲精品一区二区三区| 黄色配什么色好看| 日韩不卡一区二区三区视频在线| 王馨瑶露胸无遮挡在线观看| 免费黄频网站在线观看国产| 夜夜看夜夜爽夜夜摸| 国产av不卡久久| 狂野欧美白嫩少妇大欣赏| 亚洲欧美成人精品一区二区| 亚洲欧美日韩无卡精品| 久久韩国三级中文字幕| 亚洲天堂国产精品一区在线| 日本免费在线观看一区| 又粗又硬又长又爽又黄的视频| 亚洲国产色片| 久热这里只有精品99| 久久99精品国语久久久| 国产黄片视频在线免费观看| 久久久久久久国产电影| 国产免费一级a男人的天堂| 一个人观看的视频www高清免费观看| 久久久精品免费免费高清| 亚洲av男天堂| 久久精品国产a三级三级三级| 日产精品乱码卡一卡2卡三| 日本一二三区视频观看| 男人添女人高潮全过程视频| 日韩制服骚丝袜av| 午夜精品国产一区二区电影 | 一级二级三级毛片免费看| 国产免费又黄又爽又色| 免费不卡的大黄色大毛片视频在线观看| 一级av片app| 国产爱豆传媒在线观看| 男人爽女人下面视频在线观看| 欧美最新免费一区二区三区| 国产精品久久久久久av不卡| 少妇高潮的动态图| 校园人妻丝袜中文字幕| 欧美+日韩+精品| 国产精品三级大全| 久久精品熟女亚洲av麻豆精品| 亚洲av成人精品一二三区| 亚洲精品第二区| 欧美三级亚洲精品| 国产在视频线精品| 欧美区成人在线视频| 精品少妇久久久久久888优播| av专区在线播放| 各种免费的搞黄视频| 亚洲国产成人一精品久久久| av国产免费在线观看| 免费黄色在线免费观看| 人妻夜夜爽99麻豆av| 日韩欧美精品免费久久| 国产老妇女一区| 亚洲国产精品成人综合色| 国产精品不卡视频一区二区| 激情五月婷婷亚洲| 午夜免费观看性视频| 黑人高潮一二区| 尤物成人国产欧美一区二区三区| 亚洲欧洲国产日韩| 欧美成人午夜免费资源| 男女下面进入的视频免费午夜| 99热这里只有是精品在线观看| 中文天堂在线官网| 在线 av 中文字幕| 三级国产精品欧美在线观看| 中文乱码字字幕精品一区二区三区| 欧美日韩综合久久久久久| 亚洲,一卡二卡三卡| 91狼人影院| 国产一区二区亚洲精品在线观看| 久热这里只有精品99| 中文精品一卡2卡3卡4更新| 亚洲天堂国产精品一区在线| 色吧在线观看| 国产一区有黄有色的免费视频| 国产成人91sexporn| 99热这里只有精品一区| 少妇人妻 视频| 女的被弄到高潮叫床怎么办| 在线观看一区二区三区| 女的被弄到高潮叫床怎么办| 精品国产乱码久久久久久小说| 天堂俺去俺来也www色官网| 久久久亚洲精品成人影院| 国产精品嫩草影院av在线观看| 人体艺术视频欧美日本| 日本一二三区视频观看| 伦理电影大哥的女人| 自拍欧美九色日韩亚洲蝌蚪91 | videossex国产| 亚洲精品一区蜜桃| av在线蜜桃| 亚洲精品久久午夜乱码| 国产在线一区二区三区精| 1000部很黄的大片| 观看美女的网站| 又爽又黄a免费视频| 国产欧美亚洲国产| 五月伊人婷婷丁香| 亚洲av一区综合| 在线 av 中文字幕| 亚洲国产日韩一区二区| 18禁裸乳无遮挡动漫免费视频 | 亚洲精品乱码久久久久久按摩| 国产高清有码在线观看视频| 国产色婷婷99| 99热国产这里只有精品6| 国产老妇伦熟女老妇高清| 日韩成人伦理影院| 国产高清国产精品国产三级 | 一区二区三区精品91| 少妇 在线观看| 国内少妇人妻偷人精品xxx网站| 在线免费十八禁| 纵有疾风起免费观看全集完整版| 国产美女午夜福利| 国产极品天堂在线| 性色av一级| 黄片无遮挡物在线观看| 色视频www国产| 蜜臀久久99精品久久宅男| 少妇人妻精品综合一区二区| 国内少妇人妻偷人精品xxx网站| 久久久久精品性色| 日日啪夜夜撸| 美女视频免费永久观看网站| 久久精品国产自在天天线| 欧美极品一区二区三区四区| www.色视频.com| 伊人久久国产一区二区| 国产欧美另类精品又又久久亚洲欧美| 国产淫语在线视频| 搡老乐熟女国产| 亚洲国产精品999| 久久人人爽av亚洲精品天堂 | 欧美激情国产日韩精品一区| 国产在线男女| 国产 一区精品| 国产亚洲av嫩草精品影院| 天天一区二区日本电影三级| 国产精品人妻久久久影院| 国产69精品久久久久777片| 天堂中文最新版在线下载 | 亚洲成人久久爱视频| 国产精品.久久久| 2018国产大陆天天弄谢| 亚洲精品一区蜜桃| 国产精品偷伦视频观看了| 国内精品宾馆在线| 久久久久国产网址| 精品久久国产蜜桃| 久久精品国产a三级三级三级| 亚洲av中文av极速乱| 午夜老司机福利剧场| 特级一级黄色大片| 国产男女内射视频| 伊人久久国产一区二区| 自拍偷自拍亚洲精品老妇| 黄色视频在线播放观看不卡| 久久久久久久久久久免费av| av国产久精品久网站免费入址| 国产av码专区亚洲av| 亚洲精品国产av成人精品| 大话2 男鬼变身卡| 少妇熟女欧美另类| 国产 一区精品| 99热这里只有精品一区| 免费不卡的大黄色大毛片视频在线观看| 黄色欧美视频在线观看| 狂野欧美激情性xxxx在线观看| 麻豆成人av视频| 久久6这里有精品| .国产精品久久| 男插女下体视频免费在线播放| av在线蜜桃| 午夜激情福利司机影院| 五月伊人婷婷丁香| 中文在线观看免费www的网站| 五月玫瑰六月丁香| kizo精华| 在线观看免费高清a一片| av福利片在线观看| 成年人午夜在线观看视频| 亚洲一区二区三区欧美精品 | 色吧在线观看| a级一级毛片免费在线观看| 亚洲最大成人av| 不卡视频在线观看欧美| 最后的刺客免费高清国语| 我的老师免费观看完整版| 亚洲欧美日韩另类电影网站 | 国产精品国产三级国产av玫瑰| 日韩电影二区| 少妇裸体淫交视频免费看高清| 99久久九九国产精品国产免费| 日韩欧美精品免费久久| 纵有疾风起免费观看全集完整版| 最近的中文字幕免费完整| 国产真实伦视频高清在线观看| 精品99又大又爽又粗少妇毛片| 亚洲综合色惰| 人妻 亚洲 视频| 国产精品女同一区二区软件| 国产黄片美女视频| 亚洲精品日本国产第一区| freevideosex欧美| 熟妇人妻不卡中文字幕| xxx大片免费视频| 人人妻人人看人人澡| 免费观看性生交大片5| 99精国产麻豆久久婷婷| 乱系列少妇在线播放| 亚洲真实伦在线观看| 亚洲精品国产av蜜桃| 可以在线观看毛片的网站| 国产亚洲最大av| 成人高潮视频无遮挡免费网站| 久久午夜福利片| 制服丝袜香蕉在线| 成年免费大片在线观看| 亚洲综合色惰| 少妇的逼水好多| 一级二级三级毛片免费看| 亚洲色图av天堂| 在现免费观看毛片| 国产午夜精品久久久久久一区二区三区| 亚洲人成网站在线播| av又黄又爽大尺度在线免费看| 18+在线观看网站| 一区二区三区四区激情视频| av.在线天堂| 亚洲精品成人av观看孕妇| 26uuu在线亚洲综合色| 国产亚洲av片在线观看秒播厂| 夫妻午夜视频| 精品酒店卫生间| 男人和女人高潮做爰伦理| 国产亚洲5aaaaa淫片| 高清毛片免费看| 国产一区亚洲一区在线观看| 中文资源天堂在线| 性插视频无遮挡在线免费观看| 三级国产精品欧美在线观看| 婷婷色av中文字幕| 久久久久久久久大av| 成人午夜精彩视频在线观看| 亚洲国产精品成人综合色| 国产免费福利视频在线观看| 成人鲁丝片一二三区免费| 国产成人免费观看mmmm| 亚洲精华国产精华液的使用体验| 大片免费播放器 马上看| 成人毛片a级毛片在线播放| 91精品国产九色| 免费不卡的大黄色大毛片视频在线观看| 国产探花在线观看一区二区| 国产成人精品婷婷| 高清毛片免费看| 久久亚洲国产成人精品v| 国产精品人妻久久久影院| 丝袜喷水一区| 九九久久精品国产亚洲av麻豆| 午夜精品国产一区二区电影 | 国语对白做爰xxxⅹ性视频网站| 久久精品人妻少妇| 亚洲不卡免费看| 一边亲一边摸免费视频| 国产毛片a区久久久久| 精品一区二区三区视频在线| 欧美日韩精品成人综合77777| 真实男女啪啪啪动态图| 欧美性猛交╳xxx乱大交人| 色网站视频免费| 久久人人爽人人片av| 亚洲av成人精品一二三区| 久热这里只有精品99| 91久久精品国产一区二区成人| 交换朋友夫妻互换小说| 国产爽快片一区二区三区| 国产黄a三级三级三级人| www.av在线官网国产| 男人爽女人下面视频在线观看| 精华霜和精华液先用哪个| 国产免费又黄又爽又色| 国产av国产精品国产| av在线蜜桃| 久久久久久久大尺度免费视频| 国产av不卡久久| 免费大片黄手机在线观看| 好男人在线观看高清免费视频| 哪个播放器可以免费观看大片| 日本一本二区三区精品| 亚洲精品久久午夜乱码| 亚洲精品aⅴ在线观看| 亚洲av不卡在线观看| 精品久久久久久久久av| 国产黄片美女视频| 少妇熟女欧美另类| 最近最新中文字幕免费大全7| 日韩一区二区视频免费看| 一二三四中文在线观看免费高清| 天天躁夜夜躁狠狠久久av| av线在线观看网站| 激情五月婷婷亚洲| 最近中文字幕2019免费版| 亚洲欧美日韩另类电影网站 | 国产精品爽爽va在线观看网站| 人人妻人人澡人人爽人人夜夜| 99热6这里只有精品| av免费在线看不卡| 欧美激情国产日韩精品一区| 久久久久网色| 少妇人妻 视频| 欧美高清成人免费视频www| 国产在视频线精品| 久久国产乱子免费精品| 可以在线观看毛片的网站| 欧美成人a在线观看| 亚洲av国产av综合av卡| 新久久久久国产一级毛片| 深爱激情五月婷婷| 日本-黄色视频高清免费观看| 又爽又黄无遮挡网站| 午夜激情久久久久久久| 成人亚洲精品一区在线观看 | 97在线人人人人妻| 日韩av免费高清视频| 亚洲精品一二三| 精品少妇久久久久久888优播| 2021少妇久久久久久久久久久| av福利片在线观看| 日本一二三区视频观看| 天天躁夜夜躁狠狠久久av| 国产视频内射| 中文欧美无线码| 亚洲人成网站在线播| 国产亚洲最大av| 精品熟女少妇av免费看| 欧美极品一区二区三区四区| 国产亚洲最大av| 成年女人看的毛片在线观看| 久久久久久久国产电影| 激情 狠狠 欧美| 国产午夜福利久久久久久| 中文字幕免费在线视频6| 亚洲精品国产色婷婷电影| 日本免费在线观看一区| 成人亚洲精品av一区二区| 狂野欧美激情性xxxx在线观看| 欧美三级亚洲精品| 狠狠精品人妻久久久久久综合| 国产高清国产精品国产三级 | 亚洲精品成人久久久久久| 波多野结衣巨乳人妻| 禁无遮挡网站| 国产一区二区在线观看日韩| 青春草视频在线免费观看| 国产精品精品国产色婷婷| 精品酒店卫生间| 少妇猛男粗大的猛烈进出视频 | 国产精品偷伦视频观看了| 国产在线一区二区三区精| 国产精品三级大全| 精品酒店卫生间| 久久国内精品自在自线图片| 欧美亚洲 丝袜 人妻 在线| 97在线人人人人妻|