• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于中智模糊關(guān)聯(lián)規(guī)則生成的大數(shù)據(jù)挖掘分析算法

      2019-10-21 01:09:32
      計算機(jī)應(yīng)用與軟件 2019年10期
      關(guān)鍵詞:中智模糊化項集

      梁 凡 趙 麗

      1(南寧職業(yè)技術(shù)學(xué)院信息工程學(xué)院 廣西 南寧 530008)2(山西大學(xué)軟件學(xué)院 山西 太原 030013)

      0 引 言

      隨著數(shù)據(jù)庫系統(tǒng)的大量建設(shè)與互聯(lián)網(wǎng)技術(shù)的廣泛應(yīng)用,采用大數(shù)據(jù)挖掘技術(shù)對海量數(shù)據(jù)中蘊含的潛在價值進(jìn)行分析逐步受到世界各國的高度重視,如商業(yè)、科技、健康、智能電網(wǎng)等[1]。大數(shù)據(jù)分析技術(shù)作為有效手段之一,可發(fā)現(xiàn)不同項目間潛在的未觀察到的關(guān)聯(lián)。關(guān)聯(lián)規(guī)則挖掘[2]作為大數(shù)據(jù)分析中的一類技術(shù),指采用某種算法發(fā)現(xiàn)不同項目間可能存在的關(guān)聯(lián)或聯(lián)系[3]。例如,文獻(xiàn)[4]提出一種多尺度關(guān)聯(lián)規(guī)則挖掘算法,實現(xiàn)了多尺度數(shù)據(jù)集之間知識的跨尺度推導(dǎo),算法具有較高的覆蓋率、精確度和較低的支持度估計誤差。文獻(xiàn)[5]針對動車組運維數(shù)據(jù)的數(shù)據(jù)量巨大、價值密度低的特點,提出了基于近似最小完美Hash函數(shù)的關(guān)聯(lián)規(guī)則挖掘算法,算例結(jié)果表明,挖掘出的規(guī)則可以有效地指導(dǎo)動車組修程修制優(yōu)化,從而達(dá)到提高動車組運維效率的目的。類似研究見文獻(xiàn)[6-8]。但上述文獻(xiàn)均建立在經(jīng)典的布爾型關(guān)聯(lián)規(guī)則基礎(chǔ)上,即輸出結(jié)果是0-1型的二進(jìn)制數(shù)據(jù)。當(dāng)應(yīng)用經(jīng)典的布爾型關(guān)聯(lián)規(guī)則進(jìn)行數(shù)據(jù)庫定量分析時,會引入硬化數(shù)據(jù)“尖銳邊界”問題。換言之,經(jīng)典布爾型關(guān)聯(lián)規(guī)則僅通過硬性的離散化劃分策略可能破壞了不同項數(shù)據(jù)間存在的內(nèi)在聯(lián)系。針對傳統(tǒng)布爾型關(guān)聯(lián)規(guī)則挖掘算法存在的這一缺點,文獻(xiàn)[9]提出一種顧及模糊屬性的空間關(guān)聯(lián)規(guī)則挖掘方法,結(jié)合模糊集理論,采用隸屬度函數(shù)將模糊空間數(shù)據(jù)轉(zhuǎn)化為由隸屬度表征的模糊數(shù)值,進(jìn)而將模糊空間屬性化為模糊集合,最終提取出模糊關(guān)聯(lián)規(guī)則。類似地,文獻(xiàn)[10]提出一種基于時間衰減模型的模糊會話關(guān)聯(lián)規(guī)則挖掘算法,同樣基于模糊理論進(jìn)行關(guān)聯(lián)規(guī)則的模糊化挖掘。然而,現(xiàn)有的模糊關(guān)聯(lián)規(guī)則挖掘方法在量化語言學(xué)術(shù)語時過多依賴于人工或?qū)<医?jīng)驗進(jìn)行劃分,很少考慮到規(guī)則本身存在的不確定性,故導(dǎo)致很難以最優(yōu)方式生成關(guān)聯(lián)規(guī)則。

      為解決現(xiàn)有關(guān)聯(lián)規(guī)則挖掘方法中存在的缺點,提出了一種新型的中智關(guān)聯(lián)規(guī)則挖掘算法,主要創(chuàng)新點為:

      1) 針對傳統(tǒng)布爾型挖掘算法硬性關(guān)聯(lián)規(guī)則處理導(dǎo)致數(shù)據(jù)間聯(lián)系被破壞的風(fēng)險,將模糊理論引入關(guān)聯(lián)規(guī)則挖掘模型中,從而提升數(shù)據(jù)間潛在聯(lián)系的挖掘成功率。

      2) 針對傳統(tǒng)模糊關(guān)聯(lián)規(guī)則挖掘算法存在的語言學(xué)術(shù)語量化預(yù)處理過度依賴人工經(jīng)驗的缺點,基于中智集合理論對傳統(tǒng)模糊關(guān)聯(lián)規(guī)則挖掘算法進(jìn)行改進(jìn)。不僅考慮了不同項間的隸屬度函數(shù),并且綜合考慮關(guān)聯(lián)規(guī)則自身不確定性以及項間的非隸屬度函數(shù),可更有效地實現(xiàn)關(guān)聯(lián)規(guī)則的模糊化處理并發(fā)現(xiàn)所有可能存在的關(guān)聯(lián)規(guī)則,有助于提升數(shù)據(jù)挖掘準(zhǔn)確性。

      1 關(guān)聯(lián)規(guī)則挖掘模型相關(guān)知識

      為便于后續(xù)分析,首先給出關(guān)于關(guān)聯(lián)規(guī)則挖掘模型的基本術(shù)語與相關(guān)定義,隨后建立基于模糊化的關(guān)聯(lián)規(guī)則挖掘模型。

      1.1 關(guān)聯(lián)規(guī)則挖掘模型

      令集合|D|為從一個給定數(shù)據(jù)集中挖掘得到的關(guān)聯(lián)規(guī)則集合,相關(guān)定義如下:

      1)I={i1,i2, …,im}表示所有可能的數(shù)據(jù)集合,其中元素稱為項目(item)。

      2) 資料庫T表示來源于數(shù)據(jù)集I中進(jìn)一步挖掘分析的數(shù)據(jù)集,滿足T?I。

      3) 對于給定的項目集X?I以及一個給定的資料庫T,則T包含X當(dāng)且僅當(dāng)X?T。

      4) 定義表示σX項集X的支持度(support frequency),其含義為項集X在整個數(shù)據(jù)集中出現(xiàn)的頻率,公式如下:

      (1)

      5) 對于項集X、Y,X∩Y的可信度定義為同時包含X、Y的支持度與包含X的支持度之比:

      (2)

      6) 關(guān)聯(lián)規(guī)則:一個形如X?Y的蘊含式,其中X?I、Y?I且X∩Y=φ。關(guān)聯(lián)規(guī)則成立的條件是:① 資料庫T中至少有s%的項包含X∪Y,即具有最小支持度s;② 在資料庫T中包含X的項中最少有c%同時也包含Y,即具有最小可信度c。

      關(guān)聯(lián)規(guī)則挖掘問題本質(zhì)上就是確定不同項集見支持度和可信度分別大于用戶給定的最小支持度和最小可信度的關(guān)聯(lián)規(guī)則(即強(qiáng)規(guī)則),具體包含以下兩個子問題:

      子問題1:找出資料庫T中具有用戶定義的最小支持度的項目集,并將其定義為頻繁項目集,反之則成為非頻繁項目集。

      子問題2:利用頻繁項目集生成關(guān)聯(lián)規(guī)則。

      1.2 模糊關(guān)聯(lián)規(guī)則

      關(guān)聯(lián)規(guī)則挖掘作為數(shù)據(jù)挖掘的主要任務(wù),其生成的關(guān)聯(lián)規(guī)則表征了不同屬性的項集間的聯(lián)系。對于傳統(tǒng)布爾型關(guān)聯(lián)規(guī)則挖掘而言,其項目集的劃分往往采用精確截斷區(qū)間劃分的方式。但此種方法存在過于硬化處理的弊端,如10.1和9.9在事實上是兩個非常接近的數(shù)值,但在[1, 10)、[10, 20)的劃分方式下則會分屬于兩個不同的項目集合,顯然會導(dǎo)致與實際結(jié)果不符的情況。因此,模糊關(guān)聯(lián)規(guī)則進(jìn)一步地運用模糊理論對關(guān)聯(lián)規(guī)則進(jìn)行了改進(jìn),從而克服了傳統(tǒng)布爾型關(guān)聯(lián)規(guī)則生成算法對數(shù)據(jù)過于硬化的處理缺陷。

      模糊關(guān)聯(lián)規(guī)則挖掘的基本原理為:設(shè)資料庫T={ti|i=1, 2, …,n},項目集合I={i1,i2, …,im},項目集合的每個元素ii對應(yīng)一個模糊集合Lj={l1,l2, …,l|Lf|}(j=1, 2, …,m)。定義模糊項目集合為項目集合I中所有項目對應(yīng)的模糊集所有成的集合,而模糊集的隸屬度函數(shù)可由專家進(jìn)行人為定義,記為fjk,下標(biāo)滿足:1≤j≤m,1≤k≤|Lf|,其實際意義為表征了項目元素ij隸屬于資料庫T的程度。例如,f12為項目i1所對應(yīng)的模糊集合中第2個模糊項目的隸屬度函數(shù)。故根據(jù)給出的模糊集隸屬度函數(shù),可將原資料庫集合轉(zhuǎn)換為模糊資料庫T={t′1,t′2,…,t′n},且t′i= (f11,…,f1|L1|,…,fm1, …,fm|Lm|),i={1, 2, …,n}。與傳統(tǒng)布爾型關(guān)聯(lián)規(guī)則相比,模糊關(guān)聯(lián)規(guī)則通過引入對數(shù)據(jù)的模糊化處理實現(xiàn)了劃分邊界的柔性過渡。

      為更清晰地說明本文所提模糊關(guān)聯(lián)規(guī)則生成方法,本文以溫度相關(guān)的數(shù)據(jù)挖掘為例進(jìn)行說明。在進(jìn)行數(shù)據(jù)挖掘過程前,本文需對數(shù)據(jù)項進(jìn)行預(yù)處理。其主要內(nèi)容記為將語言學(xué)術(shù)語轉(zhuǎn)換為具有量化的數(shù)值,并定義每個語言學(xué)術(shù)語對應(yīng)的量化數(shù)值范圍,此過程可基于專家知識進(jìn)行。例如,表征溫度的語言學(xué)術(shù)語{very cold,cold,cool,warm,hot}。進(jìn)一步地,不同的表征溫度的語言學(xué)術(shù)語的模糊化隸屬度函數(shù)可按如表1所示的數(shù)據(jù)資料庫進(jìn)行計算,圖1為響應(yīng)的隸屬度函數(shù)曲線。

      表1 數(shù)據(jù)庫事務(wù)的隸屬度函數(shù)

      圖1 表征溫度的語言術(shù)語

      將語言學(xué)術(shù)語{very cold,cold,cool,warm,hot}添加到候選集中,并計算這些項集的支持度,從而實現(xiàn)每個語言學(xué)術(shù)語的量化特征值,從而生成模糊候選集。依據(jù)2.1節(jié)中支持度的定義,本文可計算出單項集和多項集的支持度。同樣以溫度的單一指標(biāo)和雙重指標(biāo)為例,支持度如表2和表3所示。后續(xù)內(nèi)容中,將包含k個項目的項集表示為k-項集,并記集合L中的k-項集為Lk。

      表2 單一項集的支持度

      表3 兩項集的支持度

      2 中智模糊化關(guān)聯(lián)規(guī)則挖掘模型

      在經(jīng)典的模糊關(guān)聯(lián)規(guī)則模型中,隸屬度函數(shù)的選擇仍存在過于依賴人工經(jīng)驗的缺陷,即隸屬度函數(shù)同樣存在“硬化”的不足。此外,經(jīng)典的模糊關(guān)聯(lián)規(guī)則模型并未考慮到數(shù)據(jù)集自身存在的不確定性。上述兩點將導(dǎo)致最后的挖掘結(jié)果可能因模糊隸屬度函數(shù)的選擇不同而出現(xiàn)偏差。中智學(xué)作為模糊理論的進(jìn)一步發(fā)展,是模糊結(jié)合論、并行相容性集合論和直覺集合論的概括總結(jié)。因此,基于中智集合理論提出針對經(jīng)典模糊關(guān)聯(lián)規(guī)則挖掘的改進(jìn)算法,其進(jìn)一步將數(shù)據(jù)元素的不確定性考慮在內(nèi),有效克服了傳統(tǒng)模糊理論的缺點。為此,首先給出中智集合的基本定理和運算規(guī)則,隨后進(jìn)一步建立基于中智模糊的關(guān)聯(lián)規(guī)則挖掘模型[12-13]。

      2.1 中智集合理論基本概念

      中智集合理論中,設(shè)集合X為空間上的全集,而集合A是集合X的一個子集。而元素x∈X進(jìn)一步表示為x(t,i,f),其中t、i、f分別表示元素x的真實性、不確定性和非真實性概率,且有t=T(x)、i=I(x)、f=F(x)成立。T、I、F分別為元素x的真隸屬度、不確定性隸屬度和非隸屬度集合。根據(jù)文獻(xiàn)[11]定義,其為|-0, 1+|的標(biāo)準(zhǔn)和非標(biāo)準(zhǔn)實數(shù)子集,其中|-0, 1+|表示非標(biāo)準(zhǔn)單位區(qū)間,-0=0-ε,1+=1+ε,其中“0”、“1”表示集合邊界的標(biāo)準(zhǔn)值,而“ε”則表示不確定度(即非標(biāo)準(zhǔn)部分)且為無窮小正數(shù)。故T、I、F的上確界和下確界以及對應(yīng)的模糊集合的上確界和下確界分別表示為:

      SupT=tsupInfT=tinf

      (3)

      SupI=isupInfI=Iinf

      (4)

      SupF=fsupInfF=finf

      (5)

      nsup=tsup+isup+fsup

      (6)

      ninf=tinf+iinf+finf

      (7)

      -0≤SupT+SupI+SupF≤3+

      (8)

      進(jìn)一步,文獻(xiàn)[14]定義了單值中智集合的概念,以克服經(jīng)典中智集合理論中對真隸屬度、不確定性隸屬度和非隸屬度集合定義過于抽象不適合應(yīng)用于實際工程中的缺陷。設(shè)X為論域,而集合X上的單值中智集合A具有如下形式:

      A={:x∈X}

      (9)

      式中:TA(x):X→[0,1],IA(x):X→[0,1],F(xiàn)A(x):X→[0,1],從而對于所有x∈X,都有0≤TA(x)+IA(x)+FA(x)≤3 。區(qū)間TA(x)、IA(x)和FA(x)分別表示單值真隸屬度、不確定隸屬度和假隸屬度函數(shù)。進(jìn)一步將式(9)簡記為A=(a,b,c),其中a,b,c∈[0, 1],且有a+b+c≤3。

      2.2 中智集合的基本運算

      1) 交集運算:對兩個單值中智集合A=和B=,其并集操作定義為C=A∩B,C的真隸屬度函數(shù)、不確定隸屬度函數(shù)和假隸屬度函數(shù)分別定義為TC(x)=min(TA(x),TB(x))、IC(x)=min(IA(x),IB(x))和FC(x)=max(FA(x),FB(x))。

      2) 并集運算:對兩個單值中智集合A=和B=,其并集操作定義為C=A∪B,C的真隸屬度函數(shù)、不確定隸屬度函數(shù)和假隸屬度函數(shù)分別定義為TC(x)=max(TA(x),TB(x))、IC(x)=max(IA(x),IB(x))和FC(x)=min(FA(x),FB(x))。

      3) 包含運算:中智集合A包含于另一個中智集合B,可表示為A?B,當(dāng)且僅當(dāng)對于所有x∈X,有TA(x)≤TB(x) 、IA(x)≤IB(x)且FA(x)≥FB(x)。

      2.3 中智模糊化關(guān)聯(lián)規(guī)則模型

      提出的基于中智模糊化關(guān)聯(lián)規(guī)則生成模型為:X→Y,其中X∩Y=?,X、Y均為中智集合。本文目標(biāo)為找到頻繁集和相應(yīng)的支持度,以及其相應(yīng)的關(guān)聯(lián)規(guī)則生成準(zhǔn)則。結(jié)合2.2節(jié)中的模糊化關(guān)聯(lián)規(guī)則定義,本文將中智集合添加到集合I中,集合I為所有可能的數(shù)據(jù)集(即項集)。具體操作為I=N∪M,其中N是中智集,M是經(jīng)典項集。關(guān)聯(lián)規(guī)則的一般形式為:

      X→YX?I,Y?I,X∩Y=?

      上述中智模糊關(guān)聯(lián)規(guī)則生成流程如圖2所示。

      圖2 中智模糊關(guān)聯(lián)規(guī)則生成流程

      同樣以溫度相關(guān)的關(guān)聯(lián)規(guī)則挖掘為例說明本文的中智模糊關(guān)聯(lián)規(guī)則建模流程。

      Step1設(shè)置溫度相關(guān)的語言學(xué)術(shù)語{very cold,cold,cool,warm,hot}的量化數(shù)值范圍如表4所示。

      表4 語言術(shù)語的量化數(shù)值范圍

      Step2基于表4中量化的語言術(shù)語范圍,定義溫度的真隸屬度、不確定隸屬度和非隸屬度函數(shù)。式(10)-式(14)為真隸屬度函數(shù),式(15)-式(19)為不確定隸屬度函數(shù),式(20)-式(24)為非隸屬度函數(shù)。

      (10)

      (11)

      (12)

      (13)

      (14)

      (15)

      (16)

      (17)

      (18)

      (19)

      (20)

      (21)

      (22)

      (23)

      (24)

      圖3為這些變量的真隸屬度、不確定隸屬度、非隸屬度函數(shù)以及中智模糊化隸屬度函數(shù)。

      (a) 真隸屬度函數(shù)

      (b) 不確定隸屬度函數(shù)

      (c) 非隸屬度函數(shù)

      (d) 中智模糊化隸屬度函數(shù)圖3 隸屬度函數(shù)波形

      Step3基于隸屬度函數(shù)數(shù)值,不同的項集被劃分至不同的溫度集合中,如表5所示。

      表5 不同數(shù)據(jù)庫事務(wù)的隸屬度函數(shù)

      續(xù)表5

      Step4計算資料庫中每個元素的語言學(xué)術(shù)語集合{very cold, cold, cool, warm, hot}。由于真隸屬度、假隸屬度和不確定隸屬度是獨立的函數(shù),所以語言學(xué)術(shù)語的集合可以擴(kuò)展到{Tvery-cold,Tcold,Tcool,Twarm,Thot,Fvery-cold,Fcold,Fcool,Fwarm,Fhot,Ivery-cold,Icold,Icool,Iwarm,Ihot}。其中,F(xiàn)warm表示不溫暖,而Iwarm表示不確定是否溫暖。

      Step5使用表5中給出的隸屬度函數(shù),分別計算單項集和兩項集的頻數(shù)和支持度,如表6、表7所示。

      表6 單項集中智集的支持度

      續(xù)表7

      3 實 驗

      為說明所提方法的實際運行效果,在同樣的實驗條件下(計算機(jī)配置為Intel Core i5 CPU, 10 GB RAM, Windows 10 64位 旗艦版),并將其與文獻(xiàn)[15]所提布爾型關(guān)聯(lián)規(guī)則挖掘算法以及文獻(xiàn)[16]所提傳統(tǒng)模糊關(guān)聯(lián)規(guī)則挖掘算法進(jìn)行對比。實驗程序統(tǒng)一采用VB.net進(jìn)行編程。

      3.1 實驗數(shù)據(jù)預(yù)處理

      股票交易市場的歷史數(shù)據(jù)來源于2012年9月至2017年9月期間埃及股票市場。數(shù)據(jù)包含每只股票的開盤價、收盤價、最高價、最低價和成交量。本文以開盤價(openprice)與收盤價(closeprice)的差值比率定義股票的變化率(pricechangerate):

      (25)

      并定義股票成交比例如下:

      (26)

      此外,數(shù)據(jù)屬性項包含季度、月度、股票變化率、成交率、指標(biāo)變化率,表8表示了預(yù)處理后的部分?jǐn)?shù)據(jù)。

      表8 預(yù)處理后部分?jǐn)?shù)據(jù)

      根據(jù)上述語言學(xué)術(shù)語,基于單值中智集合定義對上述數(shù)據(jù)進(jìn)行模糊化處理。本文將變化率模糊化處理為{“high up”,“high low”,“no change”,“l(fā)ow down”,“high down “},而對于成交量,模糊化處理為{“l(fā)ow”, “medium”, “high”},其對應(yīng)的隸屬度函數(shù)波形分別如圖3、圖4所示。

      圖3 變化率真隸屬度函數(shù)

      圖4 成交量的真隸屬度函數(shù)

      3.2 實驗結(jié)果

      3.2.1生成關(guān)聯(lián)項數(shù)量分析

      基準(zhǔn)實驗中,設(shè)最小支持度為0.02,對比分析不同關(guān)聯(lián)規(guī)則挖掘方法下生成的關(guān)聯(lián)項數(shù)量。如表9所示,由于所提中智模糊化算法考慮了不確定性和非隸屬度函數(shù),故在關(guān)聯(lián)項的數(shù)量上,應(yīng)用所提中智模糊關(guān)聯(lián)規(guī)則生成的關(guān)聯(lián)項較布爾型算法布爾型算法提升了270%,而較文獻(xiàn)[16]提出的傳統(tǒng)模糊算法提升了142.9%。由此可見,本文方法能夠顯著挖掘出更多的潛在關(guān)聯(lián)規(guī)則。

      表9 關(guān)聯(lián)項生成數(shù)量

      3.2.2最小支持度對關(guān)聯(lián)規(guī)則生成數(shù)量的影響

      本節(jié)研究了最小支持度對不同挖掘算法所生成的關(guān)聯(lián)規(guī)則的影響。圖5、圖6和圖7分別為文獻(xiàn)[15]提出的布爾型關(guān)聯(lián)挖掘算法、文獻(xiàn)[16]提出的模糊關(guān)聯(lián)挖掘算法和本文所提中智模糊關(guān)聯(lián)規(guī)則挖掘算法所生成的關(guān)聯(lián)規(guī)則數(shù)量隨項集數(shù)量的變化趨勢。橫向比較圖5-圖7,可發(fā)現(xiàn)隨著最小值尺度閾值的升高,關(guān)聯(lián)規(guī)則生成數(shù)量均處于下降狀態(tài),且隨著項目集合的增多,二者下降速率均逐漸加快。而縱向比較可知,當(dāng)最小支持度閾值設(shè)置較小且項目集合數(shù)量較低時,中智模糊關(guān)聯(lián)規(guī)則挖掘算法的性能與文獻(xiàn)[16]提出的模糊關(guān)聯(lián)規(guī)則生成算法的性能相近,而文獻(xiàn)[15]提出的布爾型挖掘算法由于生成關(guān)聯(lián)數(shù)量較少,性能則較差。但當(dāng)項目集合增多時,由于中智集合考慮了更多的隸屬度函數(shù),使得挖掘到的關(guān)聯(lián)規(guī)則數(shù)量遠(yuǎn)大于文獻(xiàn)[16]提出的模糊關(guān)聯(lián)規(guī)則挖掘算法。

      圖5 文獻(xiàn)[15]提出的布爾型關(guān)聯(lián)規(guī)則生成數(shù)量隨項集數(shù)量變化趨勢

      圖6 文獻(xiàn)[16]提出的模糊關(guān)聯(lián)規(guī)則生成數(shù)量隨項集數(shù)量變化趨勢

      圖7 中智模糊化關(guān)聯(lián)規(guī)則生成數(shù)量隨項集數(shù)量變化趨勢

      然而,中智模糊化方法雖然顯著增大了關(guān)聯(lián)規(guī)則數(shù)量,但過多的關(guān)聯(lián)規(guī)則數(shù)量可能給用戶帶來信息誤導(dǎo)的風(fēng)險。因此,本文進(jìn)一步研究最小支持度對本文所提中智模糊關(guān)聯(lián)規(guī)則挖掘算法的性能算法。圖8為最小支持度閾值從0.5到0.9變化時采用中智模糊關(guān)聯(lián)規(guī)則生成算法所產(chǎn)生的關(guān)聯(lián)規(guī)則數(shù)量與支持度和項集數(shù)量的變化趨勢。

      圖8 中智規(guī)則數(shù)量隨最小支持度變化關(guān)系

      對比圖7和圖8可知,當(dāng)采用本文所提中智模糊關(guān)聯(lián)挖掘算法時,最小支持度大于50%時能夠有效濾除過多生成的關(guān)聯(lián)規(guī)則,得到和傳統(tǒng)模糊關(guān)聯(lián)規(guī)則挖掘算法相近的性能。

      綜上可得:1) 本文算法能夠得到用戶感興趣的強(qiáng)關(guān)聯(lián)、有價值的數(shù)據(jù)信息;2) 本文算法在挖掘得到的關(guān)聯(lián)規(guī)則上的可信度要強(qiáng)于其他兩種對比算法;3) 在算法中考慮更多的隸屬度函數(shù),有助于增加挖掘到的關(guān)聯(lián)規(guī)則數(shù)量。

      4 結(jié) 語

      針對傳統(tǒng)布爾型關(guān)聯(lián)規(guī)則挖掘算法存在的硬化數(shù)據(jù)“尖銳邊界”問題以及傳統(tǒng)模糊關(guān)聯(lián)規(guī)則挖掘算法未考慮關(guān)聯(lián)規(guī)則的不確定性與非真實性問題,提出一種新型中智關(guān)聯(lián)規(guī)則挖掘算法。通過實例分析表明,相比其他兩種對比算法,本文算法在相同支持度時能夠挖掘更多數(shù)量的關(guān)聯(lián)規(guī)則,在多項集關(guān)聯(lián)規(guī)則生成數(shù)量與可信度上具有明顯優(yōu)勢,有助于提高數(shù)據(jù)挖掘的準(zhǔn)確性。此外,算法考慮了更多的隸屬度函數(shù),有助于增加挖掘到的關(guān)聯(lián)規(guī)則數(shù)量。后續(xù)研究工作中,將繼續(xù)深入研究模糊邊界設(shè)定值對生成關(guān)聯(lián)規(guī)則數(shù)量的影響以及算法普適性研究。

      猜你喜歡
      中智模糊化項集
      ([0,1],[0,1])-模糊擬陣的基和秩函數(shù)
      (i,k)-步雙極單值中智競爭圖
      餐飲娛樂空間的“邊界模糊化”態(tài)勢探討——餐飲娛樂空間設(shè)計專輯
      基于包含度的單值中智決策信息系統(tǒng)屬性約簡
      三角模糊數(shù)去模糊化對VIKOR妥協(xié)解的影響研究
      中智公司
      能源(2019年9期)2019-12-06 09:33:02
      中智科技:混合云下的新動能
      中國信息化(2016年4期)2016-12-28 09:16:04
      關(guān)聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
      卷宗(2014年5期)2014-07-15 07:47:08
      一種頻繁核心項集的快速挖掘算法
      一種新的改進(jìn)Apriori算法*
      特克斯县| 新闻| 大余县| 勐海县| 沙雅县| 高平市| 福鼎市| 凭祥市| 年辖:市辖区| 西城区| 尤溪县| 安化县| 东乡族自治县| 灵寿县| 太仆寺旗| 石城县| 汝州市| 聊城市| 灵璧县| 杨浦区| 永新县| 巴楚县| 大荔县| 温宿县| 郑州市| 扎赉特旗| 蓬溪县| 平顶山市| 镇平县| 高邮市| 板桥市| 江安县| 惠安县| 东城区| 潜山县| 阿克| 屯昌县| 仪征市| 栖霞市| 柯坪县| 贺兰县|