• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    拓展差異度的高維數(shù)據(jù)聚類算法

    2020-12-07 08:20:12何慧霞范巖巖
    計算機工程與應(yīng)用 2020年23期
    關(guān)鍵詞:高維個數(shù)聚類

    武 森,何慧霞,范巖巖

    北京科技大學(xué) 經(jīng)濟管理學(xué)院,北京 100083

    1 引言

    高維數(shù)據(jù)聚類是文本挖掘、客戶管理以及圖文聲像等應(yīng)用領(lǐng)域的常見研究課題[1-3]。大部分傳統(tǒng)聚類算法為低維數(shù)據(jù)而設(shè)計,但是當(dāng)數(shù)據(jù)量和數(shù)據(jù)維數(shù)呈指數(shù)增長時,傳統(tǒng)算法的局限就日益顯現(xiàn)[4]。高維數(shù)據(jù)具有稀疏性、維度災(zāi)難等特性,并且噪聲變量降低了在所有維中識別類的可能性[5]。如何在高維數(shù)據(jù)下進行有效的聚類,成為一項有意義且具有挑戰(zhàn)性的課題。

    CABOSFV[6]是一種針對高維數(shù)據(jù)的稀疏特征進行聚類的算法,只需對數(shù)據(jù)進行一次掃描就能生成最終聚類結(jié)果,計算效率大幅提升。CABOSFV算法因其高效性幫助解決了一系列高維數(shù)據(jù)聚類問題,黃月等[7]采用CABOSFV 的思想構(gòu)建了基于“文獻-關(guān)鍵詞”矩陣的知識結(jié)構(gòu)識別方法;Wang 等[8]基于CABOSFV 對肺癌患者的癥候進行聚類,歸納出肺癌的三種中醫(yī)證候分類;劉希宋等[9]將CABOSFV用于客戶知識管理的應(yīng)用場景中,驗證了CABOSFV 相對于傳統(tǒng)聚類算法的優(yōu)越性。然而CABOSFV 由于參數(shù)指定復(fù)雜性和順序敏感性造成了聚類結(jié)果不穩(wěn)定。文獻[10]采用層次聚類的思想,繞過了參數(shù)指定的要求并避免了數(shù)據(jù)對象的輸入順序?qū)垲惤Y(jié)果的影響,但其改變了CABOSFV 的效率優(yōu)勢,增加了算法的計算復(fù)雜度,隨著數(shù)據(jù)數(shù)量和維數(shù)的增加,算法的時間效率明顯降低。

    如何在保證并進一步提高算法效率的同時獲得更高的聚類質(zhì)量成為本文研究的出發(fā)點?;诖?,針對CABOSFV算法數(shù)據(jù)對象分配受類大小影響這一問題,提出拓展差異度的CABOSFV_D 聚類算法。引入調(diào)整指數(shù)p,拓展稀疏差異度度量方式,降低類中對象個數(shù)對對象分配的影響,使聚類過程更加準(zhǔn)確合理。在此基礎(chǔ)上結(jié)合位集(BitSet)運算速度快的優(yōu)點,提出用位集的方式實現(xiàn)CABOSFV_D 算法,提高算法的運行效率?;诹鶄€UCI標(biāo)準(zhǔn)數(shù)據(jù)集進行聚類實驗,分析討論調(diào)整指數(shù)的分布范圍,并給出確定差異度上限的方法。

    2 相關(guān)工作

    2.1 高維數(shù)據(jù)聚類

    目前對高維數(shù)據(jù)的聚類主要包括:基于降維的聚類[11-12]、子空間聚類[13-14]、基于超圖的聚類[15]以及基于稀疏特征聚類[16]。基于降維的聚類,通過特征選擇[17-18]或特征變換[19]對高維數(shù)據(jù)進行降維處理再完成聚類。這類算法應(yīng)用廣泛,但其不足在于:降維后數(shù)據(jù)空間改變,可能損失部分重要聚類信息。由于高維數(shù)據(jù)在全維空間進行聚類比較困難,一些學(xué)者利用子空間思想在相同數(shù)據(jù)集的不同子空間中發(fā)現(xiàn)類。子空間聚類可以從多角度、多屬性綜合考慮來進行聚類,但其缺陷是子空間的劃分和選取標(biāo)準(zhǔn)難以界定?;诔瑘D聚類算法的主要思想是把高維數(shù)據(jù)處理問題轉(zhuǎn)換為圖劃分問題,可以根據(jù)用戶需要靈活調(diào)整聚類效果和質(zhì)量,但相關(guān)參數(shù)的選取將直接影響著聚類質(zhì)量的好壞。還有一類針對高維數(shù)據(jù)的稀疏特征進行聚類的算法,代表算法是CABOSFV算法[6],將在下一部分進行介紹。

    2.2 CABOSFV算法

    CABOSFV算法是針對二態(tài)變量高維稀疏數(shù)據(jù)的高效聚類算法。該算法定義了集合的稀疏差異度(SFD),反映二態(tài)變量高維稀疏數(shù)據(jù)集合中對象的相似性。CABOSFV算法還定義了稀疏特征向量(SFV)及其可加性定理,能夠?qū)崿F(xiàn)只對數(shù)據(jù)進行一次掃描就完成聚類。因此,CABOSFV算法可以節(jié)省大量數(shù)據(jù)掃描和比較的時間,計算效率得到很大的提高[20]。CABOSFV 算法具有高效性,但受參數(shù)指定和輸入順序的影響造成聚類質(zhì)量不穩(wěn)定。現(xiàn)有的相關(guān)改進算法[10]對聚類過程進行調(diào)整和優(yōu)化,以避免上述缺陷,但是增加了算法的復(fù)雜性,聚類效率受到較大影響。如何在保證算法效率的同時提高聚類質(zhì)量是本文要解決的一個問題。

    稀疏差異度是CABOSFV的一個核心概念,其計算公式為SFD(X)=e/(|X| ×a),其中 |X|指集合X中的對象個數(shù),e為該子集中所有對象取值不全相同的屬性個數(shù),a為取值全為1的屬性個數(shù)。閾值b是算法的一個參數(shù),代表一個類內(nèi)對象的差異度上限。稀疏差異度SFD 和閾值b共同決定當(dāng)前對象是否被分配到集合X中。根據(jù)CABOSFV算法步驟,當(dāng)前對象需要從已存在的k個類中尋找與其合并后稀疏差異度最小的類,然后根據(jù)差異度上限b判斷是否加入該類。然而隨著現(xiàn)存集合中的數(shù)據(jù)對象逐漸變多,即 |X|變大,|X|這一項對SFD的影響起到主導(dǎo)作用,使得即使不是十分相似的對象構(gòu)成集合的SFD 也很小,小于等于提前指定好的b,從而把本不太相似的對象分到同一類。即CABOSFV算法更傾向于將對象分配到數(shù)據(jù)對象較多的類中。針對上述問題,提出一種拓展差異度的CABOSFV_D聚類算法。

    3 CABOSFV_D聚類算法

    針對CABOSFV算法稀疏差異度的不足,本文提出拓展的差異度度量方式,同時用位集實現(xiàn)算法,使聚類效果和計算效率都得到提升。

    3.1 拓展的差異度度量方式

    在CABOSFV算法中,集合的稀疏差異度SFD是計算相似度的基礎(chǔ),由于集合內(nèi)的差異度決定了是否將當(dāng)前對象加入到某一集合(類),因此其在算法流程中起到至關(guān)重要的作用。通過分析傳統(tǒng)CABOSFV 中稀疏差異度計算公式的局限性,發(fā)現(xiàn)問題主要在于算法的執(zhí)行過程中稀疏差異度公式中數(shù)據(jù)對象 |X|變化幅度過大,調(diào)節(jié)趨勢過度,而e a這一項的變化趨勢緩慢。因此,提出一種拓展的集合稀疏差異度定義方式。

    定義1(拓展集合差異度)設(shè)具有n個對象的二態(tài)數(shù)據(jù)集合{x1,x2,…,xn} ,X為其中的一個對象子集,其中的對象個數(shù)記為 |X|,在該子集中所有對象稀疏特征取值皆為1的屬性個數(shù)為a,稀疏特征取值不全相同的屬性個數(shù)為e,p為大于等于1 的常整數(shù),則集合X的拓展差異度表示為:

    拓展的稀疏差異度通過給定指數(shù)p,調(diào)整稀疏差異度公式中分母的變化幅度,使不相似的對象不會誤分到同一類,增強算法的合理性。傳統(tǒng)CABOSFV的稀疏差異度是該拓展定義p=1 時的一種特殊情況。

    假設(shè){x1,x2,…,x10} 是由屬性{a1,a2,…,a5} 描述的數(shù)據(jù)對象,每個數(shù)據(jù)對象的各屬性取值以及外部類標(biāo)簽如表1 所示。給定差異度上限b=0.5,分別使用原始差異度計算公式(p=1) 和拓展的差異度計算公式(p≥1)進行聚類。使用原稀疏差異度聚類的對象分配過程為:(1)將每個數(shù)據(jù)對象視作一個集合;(2)計算,將集合和合并到一個新類中,即={x1,x2};(3)計算SFD(?)=5/(3×0)=∞>b,將視作一個新的類,即;(4)計 算,且,因此將集合(5)對于集合,進行類似于(4)的操作,可得{x1,x2,x4,x5,x6} ;(6)對于集合,計算SFD(?)=b,因此將加入類中,={x1,x2,x4,x5,x6,x7,}。此時發(fā)現(xiàn)使用原始差異度聚類,前六個對象分配結(jié)果和實際情況相符,然而隨著類內(nèi)對象個數(shù)的增加,對象x7被誤分到了標(biāo)簽為1的類中,實際上x7和標(biāo)簽為1 的對象(如x6)并不相似。與原差異度公式中p僅能取1 不同,使用拓展的差異度度量方式進行聚類時,指數(shù)p可取大于等于1 的常整數(shù),此處以p=2 為例,前6個數(shù)據(jù)對象的分配結(jié)果和使用原始差異度聚類的結(jié)果是一致的。對于對象x7,計算SFD(X7(0)?X1(1))=,因此將視作一個新的類,即={x7} ,和實際情況相符。通過進一步分析發(fā)現(xiàn)p取3、4等值時也能得到正確的聚類結(jié)果。因此說明和原差異度p僅能取1的計算方式相比,拓展的集合差異度具有調(diào)整分母的變化幅度的能力,從而能夠更加準(zhǔn)確地進行對象的分配。

    表1 十個數(shù)據(jù)對象取值描述

    3.2 位集及位集差異度

    位集是一種特殊的數(shù)據(jù)結(jié)構(gòu)[21],由二進制位構(gòu)成,保存l、0信息。CABOSFV_D算法適用于二態(tài)變量高維稀疏數(shù)據(jù),結(jié)合二態(tài)變量僅有1和0兩種取值的特殊性,以及位集保存l和0信息這種特殊的數(shù)據(jù)結(jié)構(gòu)。本文提出用位集的方式實現(xiàn)CABOSFV_D聚類算法,把對象用位集表示,繼而所有的稀疏差異度的計算也通過位集運算完成,從而保證整個算法用位集實現(xiàn)。另外,由于位集的大小按需增長,數(shù)據(jù)維度的增加對位集的構(gòu)建與運算沒有影響,分類屬性采用獨熱編碼[22]的方式轉(zhuǎn)化為二態(tài)屬性沒有信息的損失,因此基于拓展差異度的CABOSFV_D算法同樣適用于分類屬性聚類問題。

    3.2.1 二態(tài)數(shù)據(jù)對象的位集表示

    為了有效地運用位集運算進行二態(tài)數(shù)據(jù)對象聚類,需要將描述每個對象的所有二態(tài)數(shù)據(jù)全部存入位集中。假設(shè)具有n個對象的二態(tài)數(shù)據(jù)對象集合X={x1,x2,…,xn},描述對象的m個屬性集合為A={a1,a2,…,am} ,屬性aq(q∈{1,2,…,m} )均有兩種取值,即1 或0。對于每一個對象xi,i∈{1,2,…,n} ,將其所有屬性值按位存儲到位集中,記為B(xi),稱為對象xi的位集表示。其中,第1 位存儲屬性a1取值的信息;第2 位存儲屬性a2取值的信息,以此類推。存儲一個對象的位集所需的位數(shù)為m。按照這種方式將描述每個對象的所有二態(tài)屬性數(shù)據(jù)以二進制形式全部存儲到位集中,不同的對象對應(yīng)不同的位集,且不損失任何屬性信息,繼而可以有效地運用位集運算進行二態(tài)變量高維稀疏聚類。

    3.2.2 位集差異度及性質(zhì)

    為將拓展的稀疏差異度計算公式SFD(X)=e/用位集的方式表示,先給出位集差異度的定義。

    定義2(位集差異度)設(shè)二態(tài)數(shù)據(jù)集合表示X={x1,x2,…,xn} ,B(xi)和B(xj)分別為對象xi和xj的位集表示,則這兩個對象之間的位集差異度d(xi,xj)定義為:

    其中,B(xi)ORB(xj)和B(xi)AND(xj)分別表示對應(yīng)的位進行邏輯或(OR)和邏輯與(AND)運算,結(jié)果仍然是位集;| |表示取值為1的位數(shù)。根據(jù)該位集差異度定義,兩對象間取值不同的位數(shù)越多,且取值皆為1 的位數(shù)越少,則兩個對象越具有較大的差異性。根據(jù)邏輯與(AND)和邏輯或(OR)運算滿足冪等率和交換率,位集差異度滿足性質(zhì):(1)d(xi,xi)=0 ;(2)d(xi,xj)=d(xj,xi)。

    定義3(位集差異度推廣)X={x1,x2,…,xn} 為二態(tài)數(shù)據(jù)集合,設(shè)B(xi)為對象xi,i∈{1,2,…,n} 的位集表示,且記BOR(x1,x2,…,xn)和BAND(x1,x2,…,xn)分別為:

    其中BOR(x1,x2,…,xn)和BAND(x1,x2,…,xn)仍然是位集,將兩個對象之間的位集差異度定義推廣到集合X={x1,x2,…,xn} 內(nèi)各對象之間位集差異度的定義為:

    根據(jù)位集差異度推廣的定義,n個對象取值不同的位數(shù)越多,及取值皆為1 的位數(shù)越少,代表這n個對象間的差異越大。其中兩個對象之間的位集差異度是位集差異度推廣的定義在集合中只包含兩個對象時的一種特殊情況。下面給出計算任意兩個非空子集合并后的差異度公式。

    設(shè)二態(tài)數(shù)據(jù)集合表示X={x1,x2,…,xn} ,Y和Z為X的任意兩個非空子集,則Y和Z合并后的差異度表示為:

    式(6)表明,當(dāng)X的任意兩個非空子集Y和Z合并時,可以根據(jù)關(guān)于Y的位集BOR(Y)和BAND(Y)及關(guān)于Z的位集BOR(Z)和BAND(Z)直接計算得到關(guān)于合并后集合的位集BOR(Y?Z)和BAND(Y?Z)及位集差異度d(Y?Z)。特別地,當(dāng)Y=Z時,d(Y?Z)=d(Y)=d(Z)。

    3.3 CABOSFV_D算法步驟

    基于拓展差異度的CABOSFV_D算法步驟如下:

    輸入:對象xi的位集表示B(xi),i=1,2,…,n;閾值b;指數(shù)p。

    輸出:類X1,X2,…,Xc。

    步驟1計算BOR(x1,x2)和BAND(x1,x2),根據(jù)定義2中的公式(2)得到x1和x2的位集差異度,若合并后的位集差異度不大于閾值b,則類為X1={x1,x2} ,類的個數(shù)c=1;否則,將兩個對象分別作為一個初始類,即X1={x1} ,X2={x2} ,類的個數(shù)c=2。

    步驟2對于B(x3),分別計算BOR(Xk?{x3} )和BAND(Xk?{x3} ),k∈{1,2,…,c} ,根據(jù)公式(6)得到集合Xk?{x3} 內(nèi)各對象間的位集差異度d(Xk?{x3} ),尋找使得該位集差異度最小的k0,對應(yīng)的類為Xk0。若求得的最小的位集差異度不大于閾值b,則類Xk0=Xk0?{x3} ,此時類的個數(shù)c不變;否則,新建一個類Xc+1={x3} ,類的個數(shù)更新為c=c+1。

    步驟3對于B(xi),i∈{4,5,…,n} ,重復(fù)進行類似于步驟2的操作。

    步驟4輸出類X1,X2,…,Xc。

    從上述算法步驟可知,CABOSFV_D的算法流程和原CABOSFV 是一致的,因此時間復(fù)雜度沒有變化,兩者的區(qū)別在于CABOSFV 算法在執(zhí)行過程中計算差異度時需要對數(shù)據(jù)對象的所有屬性維分別進行計算,而CABOSFV_D使用位集只需進行一次運算,數(shù)據(jù)維度對位集的構(gòu)建并沒有影響,因此CABOSFV_D能夠提升算法的運算效率。

    CABOSFV_D 聚類算法綜合考慮了算法的聚類準(zhǔn)確性和時間性能,一方面對稀疏差異度計算公式進行拓展,調(diào)整公式中分母的變化幅度,能夠提高聚類過程對象分配的準(zhǔn)確性,另一方面利用位集定義集合差異度并快速實現(xiàn)算法,進一步提高了算法的時間效率。綜合CABOSFV_D的聚類效果和運算效率,其更能有效地解決大規(guī)模高維數(shù)據(jù)聚類問題。

    4 實驗結(jié)果

    4.1 數(shù)據(jù)集選取與處理

    實驗中選取了UCI 機器學(xué)習(xí)庫中的六個真實數(shù)據(jù)集Zoo(ZO)、Soybean-smal(lSS)、Congressional Voting Records(VO)、Lymphography(LYM)、Audiology_Standardized(AS)和Dermatology(DER)進行算法驗證。其中VO數(shù)據(jù)集部分缺失,去除有缺失屬性的對象,最終用于實驗的VO數(shù)據(jù)集的對象個數(shù)是232個。此外CABOSFV_D算法是針對二態(tài)變量高維稀疏數(shù)據(jù)提出的,因此對于非二值的分類屬性,采用獨熱編碼[22]的方式處理成二態(tài)數(shù)據(jù)。實驗數(shù)據(jù)描述如表2所示。

    表2 數(shù)據(jù)集描述

    4.2 評價指標(biāo)

    由于在實驗中使用的數(shù)據(jù)集已經(jīng)有了類別標(biāo)簽,因此選擇外部質(zhì)量評價準(zhǔn)則進行評價,直接將聚類標(biāo)簽與實際標(biāo)簽進行比較。本實驗選擇標(biāo)準(zhǔn)互信息(Normalized Mutual information,NMI)和蘭德指數(shù)(Rand Index,RI)兩個常用聚類評價指標(biāo)對聚類結(jié)果進行評價。

    (1)標(biāo)準(zhǔn)互信息

    其中,X為實際類別信息,Y為聚類結(jié)果信息,MI是互信息,H是信息熵,NMI越大,表明聚類效果與真實情況越吻合。

    (2)蘭德指數(shù)

    其中,X和Y分別是實際類別信息和聚類結(jié)果信息,n1表示在X與Y中均屬于同一類的數(shù)據(jù)對個數(shù),n2表示在X與Y中均不屬于同一類的數(shù)據(jù)對個數(shù)。n為數(shù)據(jù)集中對象個數(shù),表示集合中能夠形成的數(shù)據(jù)對的總個數(shù)。蘭德指數(shù)越大,聚類效果越接近真實結(jié)果。

    4.3 實驗及結(jié)果分析

    4.3.1 實驗設(shè)計

    實驗環(huán)境為Windows 10 操作系統(tǒng),CPU處理器為Intel Core i5 8250U,內(nèi)存8 GB,編程工具為Matlab R2015a。

    為檢驗CABOSFV_D 算法的聚類性能,選取傳統(tǒng)CABOSFV 算法進行對比實驗。實驗中CABOSFV_D和CABOSFV需要預(yù)先設(shè)置差異度閾值,給定閾值范圍b={0.125,0.25,0.375,…,2.875,3} ;CABOSFV_D 需要預(yù)先設(shè)置差異度調(diào)整指數(shù)p,給定范圍p={1,2,…,10} 。對數(shù)據(jù)進行隨機排序,分別使用傳統(tǒng)CABOSFV 算法和CABOSFV_D 算法對數(shù)據(jù)聚類,記為一組實驗。分別在六個數(shù)據(jù)集上進行100 組重復(fù)實驗以消除算法隨機性,每組實驗取參數(shù)b和p最佳情況下的聚類結(jié)果,然后將這100 組最優(yōu)聚類結(jié)果的平均值作為最終聚類結(jié)果。

    4.3.2 結(jié)果分析

    利用Matlab 實現(xiàn)兩種算法在UCI 數(shù)據(jù)集上的聚類實驗,獲得了算法在六個數(shù)據(jù)集上聚類結(jié)果的RI 和NMI評價指標(biāo),如表3和表4所示。圖1和圖2是聚類結(jié)果的評價指標(biāo)對比圖,從中可以看出,當(dāng)算法以拓展的稀疏差異度公式進行聚類時,六個數(shù)據(jù)集的聚類結(jié)果的NMI和RI指標(biāo)值都得到了提高,其中AS數(shù)據(jù)集上聚類評價指標(biāo)值的提升最為明顯。外部評價指標(biāo)NMI和RI代表著聚類結(jié)果和真實結(jié)果的吻合程度,NMI和RI的值越大說明聚類越準(zhǔn)確,因此可以證明CABOSFV_D算法的聚類準(zhǔn)確性要高于CABOSFV算法。鑒于CABOSFV_D的位集實現(xiàn)方式只對算法的運算效率產(chǎn)生影響,因此聚類準(zhǔn)確性的提高主要是由于拓展的稀疏差異度調(diào)整了公式中分母的變化幅度。

    表3 兩種算法聚類結(jié)果的NMI指標(biāo)

    表4 兩種算法聚類結(jié)果的RI指標(biāo)

    圖1 聚類結(jié)果的NMI指標(biāo)對比圖

    圖2 聚類結(jié)果的RI指標(biāo)對比圖

    在實驗中還記錄了各個算法運行所需時間,采用平均運行時間(Average Time,AT)來衡量算法的時間效率。平均運行時間計算方式如公式(9)所示:

    其中,ti表示算法第i次運行所需時間,n表示算法運行的次數(shù)。

    表5顯示了原始CABOSFV算法和CABOSFV_D算法在六個數(shù)據(jù)集上的平均運行時間。其中CABOSFV_D算法使用位集的實現(xiàn)方法進行聚類,在六個數(shù)據(jù)集上的平均運行時間相比原始算法分別減少了80.06%、87.89%、70.02%、90.08%、87.85%、93.70%。

    表5 兩種算法運行時間比較

    綜合以上實驗結(jié)果,CABOSFV_D算法的聚類結(jié)果要優(yōu)于傳統(tǒng)CABOSFV算法,且時間成本遠(yuǎn)遠(yuǎn)低于原始的聚類實現(xiàn)方式。因此可以證明CABOSFV_D 和傳統(tǒng)CABOSFV相比具有更好的聚類性能,在保證且進一步提高算法效率的同時獲得了更高的聚類質(zhì)量。

    4.3.3 差異度調(diào)整指數(shù) p 分析

    CABOSFV_D 算法引入指數(shù)p拓展了集合的稀疏差異度,指數(shù)p影響著稀疏差異度分母的調(diào)整幅度,進而影響算法聚類質(zhì)量,因此選取合適的p對算法至關(guān)重要。不同數(shù)據(jù)集100 組隨機實驗的最優(yōu)指數(shù)p的分布呈現(xiàn)出了不同的規(guī)律。圖3 顯示了在六個數(shù)據(jù)集上最優(yōu)指數(shù)p的分布,其中ZO、SS、LYM、DER 四個數(shù)據(jù)集的分布較為類似,它們的最優(yōu)p值為2的次數(shù)在總實驗次數(shù)中占比最高。LYM 的最優(yōu)p值集中分布在[1,4],在100 次實驗中占比100%。DER 的最優(yōu)p值集中分布在[2,3],在總實驗次數(shù)中占比99%。ZO最優(yōu)p值集中分布在[1,4],在100次實驗中占比97%。SS數(shù)據(jù)集上最優(yōu)p值的分布相對分散,主要集中在[1,4],在實驗中占比74%。AS 數(shù)據(jù)集在p=4 時取得最優(yōu)值的次數(shù)最多,其最優(yōu)p值分布也相對分散,主要集中于[2,4],在實驗中占比57%。對于VO數(shù)據(jù)集,p=1時取得最佳結(jié)果的次數(shù)最多,最優(yōu)p值集中在[1,2],在總實驗次數(shù)中占比97%。

    圖3 六個數(shù)據(jù)集上的最優(yōu)p 值分布

    由上述分析可知,同一數(shù)據(jù)集的最優(yōu)p值分布相對集中,對于不同數(shù)據(jù)集,最優(yōu)p值的分布略有差異,但多集中于[1,4]的范圍內(nèi),在實際應(yīng)用中可在此范圍中選擇合適的p值。

    4.3.4 閾值b 確定方法

    閾值b是集合差異度上限,在本實驗中為了檢驗所提算法的性能采用帶有外部類標(biāo)簽信息的標(biāo)準(zhǔn)數(shù)據(jù)集,通過比較不同參數(shù)下聚類結(jié)果的外部評價指標(biāo)選取合適的b值。然而實際聚類應(yīng)用中的數(shù)據(jù)通常沒有類標(biāo)簽,此時可利用內(nèi)部評價指標(biāo)來確定b。CVTAB[23]是一種二值數(shù)據(jù)內(nèi)部評價指標(biāo),CVTAB取值越大,表明類間差異度越大,聚類效果越好。利用CVTAB 確定閾值b的具體步驟如下:

    輸入:數(shù)據(jù)集data,b可選取值{b1,b2,…,bz} ,其中bi∈[0.125,3],i∈{1,2,…,z},調(diào)整指數(shù)p。

    輸出:最佳b值。

    (1)將 (b1,p,data)輸入CABOSFV_D 中,得到數(shù)據(jù)集data的一個劃分π1。

    (2)計算劃分π1的內(nèi)部有效性評價指標(biāo)CVTAB1。

    (3)對于bi,i∈{2,3,…,z} ,重復(fù)步驟(1)、(2)的操作,得到對應(yīng)的CVTABi。

    (4)尋 找z0使 得CVTABz0=max(CVTABi), i∈{1,2,…,z}。

    (5)輸出最佳b值:bz0。

    5 結(jié)束語

    針對CABOSFV 算法在聚類過程中數(shù)據(jù)對象更易被分配到較大的類中這一問題提出CABOSFV_D 算法。該算法對稀疏差異度度量方式進行了拓展,引入差異度調(diào)整指數(shù)p,從而緩和稀疏差異度公式中對象個數(shù)的影響,使對象分配更加準(zhǔn)確合理。在此基礎(chǔ)上,結(jié)合位集具有運算速度快這一優(yōu)勢,將二態(tài)數(shù)據(jù)對象和稀疏差異度都用位集存儲和表示,提高算法處理大規(guī)模數(shù)據(jù)時的運算效率。在六個UCI 標(biāo)準(zhǔn)數(shù)據(jù)集上進行實驗,結(jié)果表明CABOSFV_D獲得了比CABOSFV更好的聚類結(jié)果,且時間效率明顯提高,更能適用于數(shù)據(jù)規(guī)模較大的實際應(yīng)用場景。最后基于實驗結(jié)果討論了選取調(diào)整指數(shù)p的參考范圍,并給出了確定差異度上限b的方法。

    猜你喜歡
    高維個數(shù)聚類
    怎樣數(shù)出小正方體的個數(shù)
    等腰三角形個數(shù)探索
    怎樣數(shù)出小木塊的個數(shù)
    一種改進的GP-CLIQUE自適應(yīng)高維子空間聚類算法
    怎樣數(shù)出小正方體的個數(shù)
    基于DBSACN聚類算法的XML文檔聚類
    電子測試(2017年15期)2017-12-18 07:19:27
    基于加權(quán)自學(xué)習(xí)散列的高維數(shù)據(jù)最近鄰查詢算法
    基于改進的遺傳算法的模糊聚類算法
    一般非齊次非線性擴散方程的等價變換和高維不變子空間
    一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
    国产精品偷伦视频观看了| 五月天丁香电影| 国产爽快片一区二区三区| 一区福利在线观看| 男女午夜视频在线观看| 亚洲国产av影院在线观看| 国产麻豆69| 一区二区av电影网| 久久久久视频综合| 国产成人啪精品午夜网站| 国产精品成人在线| 一区在线观看完整版| 中文字幕人妻熟女乱码| 街头女战士在线观看网站| 免费高清在线观看视频在线观看| 一级毛片黄色毛片免费观看视频| 99re6热这里在线精品视频| 丝瓜视频免费看黄片| 女人高潮潮喷娇喘18禁视频| 在线观看人妻少妇| 男人添女人高潮全过程视频| 国产亚洲av片在线观看秒播厂| 飞空精品影院首页| 国产精品蜜桃在线观看| 丝袜在线中文字幕| 三上悠亚av全集在线观看| 黑人巨大精品欧美一区二区蜜桃| 欧美亚洲日本最大视频资源| 九九爱精品视频在线观看| 久久精品aⅴ一区二区三区四区| 免费看不卡的av| 两个人免费观看高清视频| 欧美在线黄色| 精品人妻在线不人妻| 久久精品国产亚洲av涩爱| 国产熟女欧美一区二区| 18在线观看网站| 日本爱情动作片www.在线观看| 国产精品女同一区二区软件| 久久久久久久精品精品| 久久精品国产综合久久久| 下体分泌物呈黄色| 婷婷色av中文字幕| 免费黄网站久久成人精品| 精品亚洲成国产av| 久久久精品免费免费高清| 19禁男女啪啪无遮挡网站| 成年美女黄网站色视频大全免费| 国产成人91sexporn| 嫩草影院入口| 黑人巨大精品欧美一区二区蜜桃| 90打野战视频偷拍视频| 操美女的视频在线观看| www日本在线高清视频| 丁香六月天网| 丝袜美腿诱惑在线| 高清av免费在线| 热99国产精品久久久久久7| 丁香六月天网| 永久免费av网站大全| 亚洲精品国产一区二区精华液| 国产精品久久久久久精品电影小说| 国产色婷婷99| 日韩一本色道免费dvd| 国产亚洲最大av| 亚洲一区中文字幕在线| 亚洲精品久久成人aⅴ小说| 亚洲国产精品999| 国产免费福利视频在线观看| 中文字幕人妻熟女乱码| 久久热在线av| 国产爽快片一区二区三区| 欧美激情极品国产一区二区三区| 亚洲天堂av无毛| 久久99热这里只频精品6学生| 蜜桃国产av成人99| 久久国产精品大桥未久av| 亚洲伊人久久精品综合| 老司机影院成人| 亚洲国产看品久久| 久久99精品国语久久久| 久久国产亚洲av麻豆专区| 久久久久久久国产电影| 亚洲人成77777在线视频| 亚洲国产av影院在线观看| netflix在线观看网站| 18禁动态无遮挡网站| 国产精品.久久久| 亚洲国产av影院在线观看| netflix在线观看网站| 十八禁高潮呻吟视频| 国产av精品麻豆| 国产精品亚洲av一区麻豆 | videosex国产| 中文精品一卡2卡3卡4更新| 国产老妇伦熟女老妇高清| 一级爰片在线观看| 久久99精品国语久久久| av国产久精品久网站免费入址| 极品少妇高潮喷水抽搐| 亚洲国产欧美一区二区综合| 亚洲国产精品一区三区| 天天躁夜夜躁狠狠躁躁| 国产成人精品无人区| 一边亲一边摸免费视频| 婷婷成人精品国产| 肉色欧美久久久久久久蜜桃| 亚洲综合色网址| 欧美日韩精品网址| 亚洲精品美女久久久久99蜜臀 | 一区二区三区四区激情视频| 亚洲少妇的诱惑av| 日韩av不卡免费在线播放| av天堂久久9| 国产精品久久久久久精品古装| 在线天堂中文资源库| 亚洲国产av影院在线观看| 无限看片的www在线观看| 久久国产精品男人的天堂亚洲| 老鸭窝网址在线观看| 制服人妻中文乱码| 97在线人人人人妻| 亚洲精品自拍成人| 黑人欧美特级aaaaaa片| 无遮挡黄片免费观看| 永久免费av网站大全| 在线观看国产h片| 悠悠久久av| 看十八女毛片水多多多| 欧美日韩亚洲国产一区二区在线观看 | 久久天躁狠狠躁夜夜2o2o | 另类精品久久| 国产有黄有色有爽视频| 9色porny在线观看| 999久久久国产精品视频| 精品国产露脸久久av麻豆| 色综合欧美亚洲国产小说| 亚洲欧美日韩另类电影网站| 日本黄色日本黄色录像| 777米奇影视久久| 午夜激情av网站| 亚洲久久久国产精品| 国产麻豆69| 中文乱码字字幕精品一区二区三区| 久久毛片免费看一区二区三区| 国产精品成人在线| av不卡在线播放| av视频免费观看在线观看| 国产一区二区三区av在线| 午夜福利视频精品| 日韩视频在线欧美| 最黄视频免费看| 午夜福利影视在线免费观看| 日韩欧美一区视频在线观看| 哪个播放器可以免费观看大片| 国产成人a∨麻豆精品| 天天影视国产精品| av在线观看视频网站免费| 男男h啪啪无遮挡| 精品国产一区二区三区四区第35| 最新的欧美精品一区二区| 亚洲色图综合在线观看| 久久婷婷青草| 亚洲欧洲国产日韩| 五月天丁香电影| 深夜精品福利| 国产精品人妻久久久影院| 免费黄色在线免费观看| 丝袜美腿诱惑在线| www.熟女人妻精品国产| 亚洲成人免费av在线播放| 97精品久久久久久久久久精品| a级片在线免费高清观看视频| 国产极品粉嫩免费观看在线| 老司机影院成人| 亚洲,欧美,日韩| 少妇人妻久久综合中文| 国产精品一二三区在线看| 亚洲中文av在线| 欧美日韩亚洲国产一区二区在线观看 | 女人爽到高潮嗷嗷叫在线视频| 精品国产一区二区三区四区第35| 午夜av观看不卡| 日韩免费高清中文字幕av| 少妇被粗大的猛进出69影院| 人人妻人人澡人人看| 老司机影院成人| 99re6热这里在线精品视频| 亚洲一级一片aⅴ在线观看| 国产日韩欧美视频二区| 亚洲七黄色美女视频| 欧美久久黑人一区二区| 精品一区二区三卡| 又大又黄又爽视频免费| 国产亚洲av高清不卡| 日韩熟女老妇一区二区性免费视频| 成人三级做爰电影| av线在线观看网站| 两性夫妻黄色片| 无限看片的www在线观看| 亚洲第一青青草原| 亚洲综合色网址| 黄色 视频免费看| 中文字幕人妻丝袜制服| xxxhd国产人妻xxx| 赤兔流量卡办理| 亚洲天堂av无毛| 午夜福利视频精品| 欧美日韩av久久| 久久久久久久久久久久大奶| 午夜久久久在线观看| 妹子高潮喷水视频| 久久久久久久久久久免费av| 一本色道久久久久久精品综合| a 毛片基地| 久久av网站| 日本色播在线视频| 亚洲,一卡二卡三卡| 久久久久久久国产电影| 欧美日韩综合久久久久久| 欧美中文综合在线视频| 少妇 在线观看| 成人免费观看视频高清| 18禁裸乳无遮挡动漫免费视频| 9热在线视频观看99| 人妻 亚洲 视频| 亚洲色图 男人天堂 中文字幕| 午夜福利视频精品| 巨乳人妻的诱惑在线观看| 满18在线观看网站| 丰满乱子伦码专区| 日韩中文字幕欧美一区二区 | 黄网站色视频无遮挡免费观看| 久久久欧美国产精品| 免费高清在线观看视频在线观看| 青青草视频在线视频观看| 老汉色∧v一级毛片| 黄色视频不卡| 日本wwww免费看| 高清欧美精品videossex| 免费少妇av软件| 欧美精品一区二区大全| 国产精品免费大片| 国产片特级美女逼逼视频| 精品人妻在线不人妻| av在线观看视频网站免费| 人人妻人人添人人爽欧美一区卜| 国产欧美日韩一区二区三区在线| 久久精品国产亚洲av高清一级| 校园人妻丝袜中文字幕| 亚洲第一青青草原| 丰满乱子伦码专区| 久久狼人影院| av又黄又爽大尺度在线免费看| 中文字幕制服av| 1024视频免费在线观看| 国产片特级美女逼逼视频| 亚洲av日韩精品久久久久久密 | 久久国产亚洲av麻豆专区| 热99久久久久精品小说推荐| 大码成人一级视频| 十八禁高潮呻吟视频| 制服诱惑二区| 亚洲熟女毛片儿| 高清黄色对白视频在线免费看| 卡戴珊不雅视频在线播放| 另类亚洲欧美激情| 男女边吃奶边做爰视频| 青春草视频在线免费观看| 又大又黄又爽视频免费| 女人被躁到高潮嗷嗷叫费观| av在线观看视频网站免费| 亚洲一区中文字幕在线| 亚洲七黄色美女视频| 99久久综合免费| 亚洲,欧美,日韩| 国产男女内射视频| 亚洲国产看品久久| 国产男人的电影天堂91| 国产精品麻豆人妻色哟哟久久| 欧美日韩福利视频一区二区| 亚洲成人一二三区av| a级毛片在线看网站| 欧美人与性动交α欧美软件| 国产免费现黄频在线看| av在线播放精品| a级片在线免费高清观看视频| xxx大片免费视频| av线在线观看网站| 亚洲av成人精品一二三区| 亚洲精品国产区一区二| 91国产中文字幕| 日韩 亚洲 欧美在线| 精品国产露脸久久av麻豆| 啦啦啦视频在线资源免费观看| 尾随美女入室| 欧美日韩亚洲国产一区二区在线观看 | 精品少妇一区二区三区视频日本电影 | 七月丁香在线播放| 老熟女久久久| 亚洲av成人精品一二三区| 亚洲精品中文字幕在线视频| 婷婷色麻豆天堂久久| 五月天丁香电影| 精品国产一区二区三区久久久樱花| 亚洲色图综合在线观看| 成年人免费黄色播放视频| 在线观看国产h片| 午夜福利乱码中文字幕| 久久久久国产一级毛片高清牌| 亚洲美女搞黄在线观看| 操出白浆在线播放| 中文字幕亚洲精品专区| 欧美日韩福利视频一区二区| 国产精品蜜桃在线观看| 久久99精品国语久久久| 丰满饥渴人妻一区二区三| 欧美精品人与动牲交sv欧美| 中文乱码字字幕精品一区二区三区| 国产熟女欧美一区二区| 夜夜骑夜夜射夜夜干| 久久精品久久久久久久性| 最近最新中文字幕大全免费视频 | 极品少妇高潮喷水抽搐| 99久久精品国产亚洲精品| 久久久久久久大尺度免费视频| 在线观看免费日韩欧美大片| 亚洲欧美日韩另类电影网站| 1024视频免费在线观看| 国产亚洲av高清不卡| 电影成人av| 国产老妇伦熟女老妇高清| 精品国产乱码久久久久久男人| 色播在线永久视频| 成人亚洲欧美一区二区av| 91精品伊人久久大香线蕉| 欧美日本中文国产一区发布| 人人澡人人妻人| 久久亚洲国产成人精品v| 久久久精品94久久精品| 蜜桃在线观看..| 丰满乱子伦码专区| 亚洲欧美成人精品一区二区| 亚洲av电影在线观看一区二区三区| 亚洲人成网站在线观看播放| 欧美精品av麻豆av| 午夜福利,免费看| 国产视频首页在线观看| 黄片小视频在线播放| 国产高清国产精品国产三级| 亚洲,欧美精品.| 欧美精品av麻豆av| 国产毛片在线视频| 精品一区二区三区av网在线观看 | www.精华液| 日韩精品免费视频一区二区三区| 国产精品免费大片| 午夜免费男女啪啪视频观看| 成人18禁高潮啪啪吃奶动态图| 欧美变态另类bdsm刘玥| 丰满迷人的少妇在线观看| 蜜桃在线观看..| 国产高清国产精品国产三级| 人人妻人人爽人人添夜夜欢视频| xxxhd国产人妻xxx| 日韩熟女老妇一区二区性免费视频| 日日爽夜夜爽网站| 欧美最新免费一区二区三区| 国产免费一区二区三区四区乱码| 亚洲成人av在线免费| 午夜91福利影院| 夫妻性生交免费视频一级片| 丰满少妇做爰视频| 精品免费久久久久久久清纯 | 久久狼人影院| av一本久久久久| 国产av一区二区精品久久| 黑人猛操日本美女一级片| 日韩一区二区视频免费看| 熟女少妇亚洲综合色aaa.| 国产精品久久久av美女十八| 日本猛色少妇xxxxx猛交久久| h视频一区二区三区| 国产亚洲欧美精品永久| av视频免费观看在线观看| 亚洲欧洲精品一区二区精品久久久 | 亚洲欧美一区二区三区黑人| 女性被躁到高潮视频| 欧美日韩一区二区视频在线观看视频在线| 女人爽到高潮嗷嗷叫在线视频| 在线天堂最新版资源| 欧美人与性动交α欧美软件| 欧美精品人与动牲交sv欧美| 亚洲欧美激情在线| av免费观看日本| 国产欧美日韩一区二区三区在线| 视频区图区小说| 丝瓜视频免费看黄片| 国产成人91sexporn| 日本91视频免费播放| 亚洲精品乱久久久久久| 一区福利在线观看| 精品第一国产精品| 在线天堂中文资源库| 男男h啪啪无遮挡| 99国产综合亚洲精品| 老司机深夜福利视频在线观看 | 精品国产一区二区三区久久久樱花| 国语对白做爰xxxⅹ性视频网站| 国产伦人伦偷精品视频| 国产精品久久久久久精品电影小说| 久久久亚洲精品成人影院| 在线免费观看不下载黄p国产| 超色免费av| 精品国产超薄肉色丝袜足j| 欧美人与性动交α欧美精品济南到| 亚洲成人一二三区av| 看非洲黑人一级黄片| 亚洲精品一区蜜桃| 一本色道久久久久久精品综合| 美女午夜性视频免费| 欧美中文综合在线视频| 人妻一区二区av| 日本爱情动作片www.在线观看| videosex国产| av不卡在线播放| 一级片免费观看大全| 欧美成人午夜精品| 别揉我奶头~嗯~啊~动态视频 | 老司机靠b影院| 一区二区av电影网| 国产xxxxx性猛交| av一本久久久久| 91精品三级在线观看| 久久韩国三级中文字幕| 制服丝袜香蕉在线| 最近的中文字幕免费完整| 91国产中文字幕| 狠狠精品人妻久久久久久综合| 99久久精品国产亚洲精品| 日本欧美视频一区| 国产亚洲最大av| 老汉色av国产亚洲站长工具| 欧美乱码精品一区二区三区| av网站免费在线观看视频| 国产精品一二三区在线看| 欧美日韩一级在线毛片| 欧美av亚洲av综合av国产av | 伦理电影大哥的女人| 丰满少妇做爰视频| 电影成人av| 亚洲成人一二三区av| 午夜老司机福利片| 美女中出高潮动态图| 亚洲国产精品一区三区| 亚洲成色77777| 高清欧美精品videossex| 日韩人妻精品一区2区三区| 啦啦啦啦在线视频资源| 日韩制服骚丝袜av| 午夜激情久久久久久久| 蜜桃在线观看..| 国精品久久久久久国模美| 久久国产精品大桥未久av| 国产老妇伦熟女老妇高清| 亚洲精品久久久久久婷婷小说| 欧美成人精品欧美一级黄| 亚洲av男天堂| 在线观看免费视频网站a站| 国产精品女同一区二区软件| 天天添夜夜摸| 一边摸一边抽搐一进一出视频| 免费人妻精品一区二区三区视频| 18禁观看日本| 啦啦啦在线观看免费高清www| 宅男免费午夜| 王馨瑶露胸无遮挡在线观看| 免费女性裸体啪啪无遮挡网站| 九色亚洲精品在线播放| 又大又爽又粗| 老熟女久久久| 欧美国产精品一级二级三级| 国产一区二区三区综合在线观看| 一本大道久久a久久精品| 亚洲精品视频女| 如何舔出高潮| 精品午夜福利在线看| 欧美激情 高清一区二区三区| 男男h啪啪无遮挡| 成人毛片60女人毛片免费| 妹子高潮喷水视频| 亚洲一级一片aⅴ在线观看| 国产精品久久久人人做人人爽| 久久精品久久精品一区二区三区| 成年美女黄网站色视频大全免费| 韩国高清视频一区二区三区| 操美女的视频在线观看| 国产精品国产av在线观看| 中文字幕av电影在线播放| 肉色欧美久久久久久久蜜桃| 久久久精品区二区三区| 一级毛片 在线播放| avwww免费| 日本爱情动作片www.在线观看| 一级毛片黄色毛片免费观看视频| 麻豆精品久久久久久蜜桃| 亚洲国产av新网站| 久久久精品免费免费高清| 日日摸夜夜添夜夜爱| 亚洲第一区二区三区不卡| 丁香六月天网| 在线观看国产h片| 免费高清在线观看日韩| 9热在线视频观看99| 欧美人与性动交α欧美精品济南到| 少妇精品久久久久久久| 天堂8中文在线网| 国产熟女欧美一区二区| 天堂俺去俺来也www色官网| 久久这里只有精品19| 精品人妻在线不人妻| 国产免费视频播放在线视频| 伊人亚洲综合成人网| 久久久久久久国产电影| 国产成人啪精品午夜网站| 欧美激情极品国产一区二区三区| 一边摸一边抽搐一进一出视频| 免费观看a级毛片全部| 无遮挡黄片免费观看| 国产日韩一区二区三区精品不卡| 99国产综合亚洲精品| 亚洲欧美激情在线| 最新在线观看一区二区三区 | 人体艺术视频欧美日本| 亚洲三区欧美一区| 一本色道久久久久久精品综合| 亚洲国产精品999| 日韩免费高清中文字幕av| 国产黄频视频在线观看| 国产成人系列免费观看| 久久99热这里只频精品6学生| 国产成人精品久久久久久| 亚洲熟女毛片儿| 色吧在线观看| 午夜福利,免费看| 国产精品久久久久成人av| 国产精品无大码| 亚洲第一av免费看| 啦啦啦在线免费观看视频4| 纵有疾风起免费观看全集完整版| 久久久久久久国产电影| 黑人猛操日本美女一级片| 午夜福利在线免费观看网站| 97精品久久久久久久久久精品| 亚洲伊人久久精品综合| 黄片小视频在线播放| 中文字幕精品免费在线观看视频| 国产精品成人在线| 国产色婷婷99| 久久韩国三级中文字幕| 婷婷色麻豆天堂久久| 精品亚洲成a人片在线观看| 久久久久人妻精品一区果冻| 中文字幕另类日韩欧美亚洲嫩草| 999精品在线视频| 日韩av免费高清视频| 90打野战视频偷拍视频| 国产日韩欧美视频二区| 中文字幕色久视频| www.av在线官网国产| 一二三四在线观看免费中文在| 亚洲伊人久久精品综合| 亚洲,欧美,日韩| 亚洲一区中文字幕在线| 少妇被粗大猛烈的视频| 亚洲成人免费av在线播放| 午夜久久久在线观看| 成年人免费黄色播放视频| 国产精品一区二区精品视频观看| 欧美日韩福利视频一区二区| 午夜福利视频在线观看免费| 欧美中文综合在线视频| 精品酒店卫生间| 久久人人爽人人片av| 久久久久视频综合| 国产一区二区三区综合在线观看| 国产精品99久久99久久久不卡 | 久久久精品免费免费高清| 欧美日韩国产mv在线观看视频| 在线观看免费日韩欧美大片| 日韩视频在线欧美| 亚洲成人手机| 欧美精品一区二区免费开放| 美女中出高潮动态图| 好男人视频免费观看在线| 两性夫妻黄色片| 午夜福利乱码中文字幕| 亚洲欧美一区二区三区久久| 国产精品一国产av| 午夜免费观看性视频| 美国免费a级毛片| 亚洲色图 男人天堂 中文字幕| 亚洲精品久久成人aⅴ小说| 日韩欧美精品免费久久| av免费观看日本| 国产成人午夜福利电影在线观看| 免费在线观看视频国产中文字幕亚洲 | 国产探花极品一区二区| 老司机在亚洲福利影院| 国产97色在线日韩免费| 不卡视频在线观看欧美| 最近2019中文字幕mv第一页| 亚洲精品乱久久久久久| 五月开心婷婷网| 麻豆精品久久久久久蜜桃|