• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于云計(jì)算與非負(fù)矩陣分解的數(shù)據(jù)分級(jí)聚類

    2018-03-03 19:32:32趙艷萍徐勝超
    現(xiàn)代電子技術(shù) 2018年5期
    關(guān)鍵詞:聚類算法

    趙艷萍+徐勝超

    摘 要: 為了提高傳統(tǒng)數(shù)據(jù)聚類算法在大數(shù)據(jù)挖掘應(yīng)用中的性能,借助云計(jì)算的相關(guān)技術(shù),并結(jié)合非負(fù)矩陣分解方法設(shè)計(jì)并實(shí)現(xiàn)了一種并行的數(shù)據(jù)層次聚類算法。該算法采用MapReduce編程平臺(tái),利用Hadoop的HDFS存儲(chǔ)大容量的電信運(yùn)營商數(shù)據(jù);描述了MapReduce的數(shù)據(jù)分級(jí)聚類并行處理的工作機(jī)制與流程;通過Map和Reduce這種主?從編程模式很方便地使數(shù)據(jù)分級(jí)聚類的子任務(wù)在Hadoop的PC集群上運(yùn)行。實(shí)驗(yàn)結(jié)果表明,該方法比傳統(tǒng)用于數(shù)據(jù)聚類的非負(fù)矩陣方法具有更好的運(yùn)行時(shí)間與加速比,能夠在可以接受的時(shí)間范圍內(nèi)完成電信運(yùn)營商的大數(shù)據(jù)處理。

    關(guān)鍵詞: 云計(jì)算; 分級(jí)聚類; MapReduce; 非負(fù)矩陣分解; 聚類算法; 并行數(shù)據(jù)

    中圖分類號(hào): TN911.1?34; TP393.03 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2018)05?0056?05

    Abstract: In order to improve the performance of traditional data clustering methods on big data mining application, a parallel data hierarchical clustering algorithm was designed and realized by means of the correlation technologies of cloud computing and non?negative matrix factorization (NMF) method. The MapReduce programming platform is used in the algorithm. The HDFS (Hadoop distributed file system) based on Hadoop is used to store the large?capacity data of telecom operators. The working mechanism and flow of data hierarchical clustering based on MapReduce are described in detail. The master?slave programming mode based on Map and Reduce makes the subtask of data hierarchical clustering operating on PC clusters based on Hadoop easily. The experimental results show that, in comparison with the traditional non?negative matrix method used in data clustering, the proposed method has shorter run time and smaller speedup ratio, and can realize the big data processing of telecom operator within the acceptable time.

    Keywords: cloud computing; hierarchical clustering; MapReduce; non?negative matrix factorization; clustering algorithm; parallel data

    0 引 言

    近年來移動(dòng)互聯(lián)網(wǎng)與物聯(lián)網(wǎng)的急速發(fā)展積累了大量的數(shù)據(jù)資源,這些海量數(shù)據(jù)中蘊(yùn)藏著大量可以應(yīng)用于個(gè)性化商務(wù)的有效信息[1?3],然而傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)是主要應(yīng)用于中小規(guī)模數(shù)據(jù)中的信息挖掘,為了從海量數(shù)據(jù)資源中挖掘出有用信息,必須采用新型的數(shù)據(jù)挖掘技術(shù),其中基于多維數(shù)據(jù)相似性的數(shù)據(jù)聚類作為一種新型數(shù)據(jù)挖掘技術(shù)正好解決上述問題。

    非負(fù)矩陣分解NMF(Non?negative Matrix Factorization)方法在多維數(shù)據(jù)相似性的數(shù)據(jù)聚類、文本聚類、社交網(wǎng)絡(luò)聚類中都得到了廣泛應(yīng)用,但其串行計(jì)算的時(shí)間復(fù)雜度較高,很難勝任大數(shù)據(jù)處理任務(wù)。早期在多維數(shù)據(jù)相似性的數(shù)據(jù)聚類并行處理領(lǐng)域中,有集群計(jì)算機(jī)與共享內(nèi)存計(jì)算的方式,還有網(wǎng)格計(jì)算、對(duì)等計(jì)算、廣域分布式計(jì)算等模式,這些模型都取得了很好的成果。但是在云計(jì)算、大數(shù)據(jù)時(shí)代,前期的分布式計(jì)算模式對(duì)海量的PB級(jí)的數(shù)據(jù)處理往往顯得不足[4?5],所以基于云計(jì)算的數(shù)據(jù)分級(jí)聚類應(yīng)該得到足夠的重視[6]。因此本文試圖探索利用云計(jì)算方式優(yōu)化傳統(tǒng)的基于非負(fù)矩陣分解的數(shù)據(jù)相似性聚類方法。

    云計(jì)算中的MapReduce技術(shù)[7]最早被Google用于大數(shù)據(jù)并行處理,其基本思想是將大數(shù)據(jù)集分解為成百上千的小數(shù)據(jù)集splits,采用Mapper和Reducer形式的類似主?從(Master?Slave)模式的并行處理。這一方法由于可以實(shí)現(xiàn)海量數(shù)據(jù)的并行處理,通過PC機(jī)就可以實(shí)現(xiàn)大型機(jī)才能完成的計(jì)算任務(wù),因此近年來得到了廣泛應(yīng)用。

    本文以基于非負(fù)矩陣分解的高維數(shù)據(jù)相似性聚類算法作為研究對(duì)象,以某電信運(yùn)營商的大容量數(shù)據(jù)作為實(shí)驗(yàn)對(duì)象,設(shè)計(jì)了一種層次聚類方法并實(shí)現(xiàn)了數(shù)據(jù)聚類方法的MapReduce并行化,同時(shí)將該算法在Hadoop平臺(tái)上進(jìn)行實(shí)驗(yàn)和評(píng)估,最后的實(shí)驗(yàn)結(jié)果驗(yàn)證了該算法的高效性與可擴(kuò)展性。

    1 預(yù)備知識(shí)

    1.1 高維數(shù)據(jù)相似性聚類與非負(fù)矩陣分解

    相似性聚類[8]是基于數(shù)據(jù)在不同維度上的相似程度而對(duì)數(shù)據(jù)進(jìn)行分類,兩個(gè)數(shù)據(jù)點(diǎn)是否歸于同一類,判斷它們的相似度如何。當(dāng)它們之間的相似度大于某一值時(shí),則歸于同一聚類;否則,兩個(gè)數(shù)據(jù)點(diǎn)則分屬不同的聚類。endprint

    由于實(shí)際問題中大規(guī)模數(shù)據(jù)的存在,使得存儲(chǔ)這類大數(shù)據(jù)的矩陣非常龐大,且存放的信息分布不均勻,導(dǎo)致現(xiàn)有方法很難高效快速地處理矩陣存放的數(shù)據(jù)。為了更好地處理這類數(shù)據(jù),一類有效的方法是對(duì)矩陣進(jìn)行分解,從而使得描述問題的維度大大消減,同時(shí)也能夠?qū)?shù)據(jù)進(jìn)行壓縮和概括。針對(duì)這一點(diǎn),目前已有很多矩陣分解方法,如奇異值分解、獨(dú)立成分分析、主成分分析等。基于非負(fù)矩陣分解[9]的聚類分析所輸出的分解結(jié)果可以保證其元素非負(fù),代表真實(shí)的物理意義,因此近年來得到特別關(guān)注。

    基于非負(fù)矩陣分解NMF的聚類[10]方法如下:考慮到數(shù)據(jù)集可以表示為一個(gè)向量集而每一個(gè)向量代表維數(shù)據(jù)點(diǎn), NMF方法的目的是將劃分為兩個(gè)非負(fù)低秩矩陣和可通過盡量優(yōu)化如下公式實(shí)現(xiàn):

    根據(jù)文獻(xiàn)[10],可以通過以下的乘法更新規(guī)則得到:

    經(jīng)過迭代處理后,得到大小為的網(wǎng)絡(luò)的分割矩陣,其中第行對(duì)應(yīng)第個(gè)單元在聚類類型中的成員關(guān)系。進(jìn)一步將標(biāo)準(zhǔn)化,使這樣就對(duì)應(yīng)于第個(gè)單元屬于第個(gè)數(shù)據(jù)聚類的后驗(yàn)概率。

    1.2 MapReduce編程模型

    Hadoop是一個(gè)分布式系統(tǒng)基礎(chǔ)框架,它的核心是分布式文件系統(tǒng)機(jī)制HDFS(Hadoop Distributed File System)和MapReduce的主?從模式(Master?Slave)的編程機(jī)制。MapReduce框架由JobTracker和TaskTracker共同組成,它們分別擔(dān)任管理節(jié)點(diǎn)和執(zhí)行任務(wù)節(jié)點(diǎn)的角色,這兩個(gè)有機(jī)結(jié)合,從而實(shí)現(xiàn)MapReduce的正常運(yùn)轉(zhuǎn),保證任務(wù)的執(zhí)行。

    MapReduce數(shù)據(jù)相似性聚類并行處理的工作機(jī)制與流程如圖1所示,具體步驟如下:

    1) 對(duì)輸入的大數(shù)據(jù)文件進(jìn)行設(shè)置與切片;

    2) 主節(jié)點(diǎn)(Master)調(diào)度從屬節(jié)點(diǎn)(Worker)執(zhí)行Map子任務(wù);

    3) 從屬節(jié)點(diǎn)讀取輸入源片段;

    4) 從屬節(jié)點(diǎn)執(zhí)行Map子任務(wù),并將臨時(shí)結(jié)果文件保存在本地;

    5) 主節(jié)點(diǎn)調(diào)度從節(jié)點(diǎn)執(zhí)行Reduce子任務(wù),Reduce階段的從屬節(jié)點(diǎn)讀取Map子任務(wù)的輸出文件;

    6) 執(zhí)行Reduce子任務(wù),將最后的結(jié)果保存到HDFS分布式文件系統(tǒng)中。

    有了這6個(gè)步驟,數(shù)據(jù)分級(jí)聚類的編程人員就可以擺脫本身分布式計(jì)算的編程細(xì)節(jié),可以使用高級(jí)語言在規(guī)定時(shí)間內(nèi)完成大規(guī)模的數(shù)據(jù)分級(jí)聚類。

    另外,要實(shí)現(xiàn)本文的并行數(shù)據(jù)聚類算法,必須用到Hadoop的開源實(shí)現(xiàn),目前比較好的是Apache的Hadoop實(shí)現(xiàn),訪問地址為http://hadoop.apache.org/,Apache的Hadoop基于Java環(huán)境,它實(shí)現(xiàn)了HDFS文件系統(tǒng)和MapReduce。用戶只要繼承MapReduceBase,提供分別實(shí)現(xiàn)Map和Reduce的兩個(gè)類,并注冊Job即可實(shí)現(xiàn)自動(dòng)分布式運(yùn)行。

    2 NMF算法的MapReduce并行化實(shí)現(xiàn)

    2.1 基于非負(fù)矩陣分解的并行式分級(jí)聚類

    現(xiàn)有的基于相似性的數(shù)據(jù)聚類往往根據(jù)任意兩個(gè)高維數(shù)據(jù)在各個(gè)維度上的歐幾里德距離的緊密程度將數(shù)據(jù)劃分為幾個(gè)不同的聚類,屬于同一聚類的數(shù)據(jù)之間的相似度較高,屬于不同聚類的數(shù)據(jù)之間的相似度相對(duì)較低。然而這一方法的局限在于,無法像模塊度算法[11]那樣計(jì)算聚類的模塊度;無法對(duì)聚類內(nèi)部的相似程度進(jìn)行排序。

    因此,提出基于合適的相似性度量指標(biāo)來構(gòu)建高維數(shù)據(jù)的相似性矩陣,通過對(duì)數(shù)據(jù)集的相似性矩陣進(jìn)行非負(fù)矩陣分解來聚類相似程度較高的數(shù)據(jù)集合,將新的聚類視為新的數(shù)據(jù)點(diǎn),從而在縮小數(shù)據(jù)規(guī)模的同時(shí)增加數(shù)據(jù)的維度,然后重新計(jì)算當(dāng)前數(shù)據(jù)的相似性矩陣進(jìn)行非負(fù)矩陣分解,反復(fù)迭代,直至得到一個(gè)較優(yōu)的聚類序列。在這一計(jì)算過程中,計(jì)算量較大的階段是反復(fù)計(jì)算數(shù)據(jù)點(diǎn)彼此之間的相似程度。由于數(shù)據(jù)是多維的,其相似程度往往需要用給定維度數(shù)值的歐幾里德距離或余弦相似性來描述,在重構(gòu)相似性矩陣時(shí)的計(jì)算量非常大,因此,本文在此階段借用MapReduce分布式編程模型的優(yōu)勢,極大地提高了計(jì)算效率。

    2.2 基于MapReduce的并行數(shù)據(jù)處理

    首先是大數(shù)據(jù)存儲(chǔ)的問題,可以參考利用HDFS來管理這些海量數(shù)據(jù)。HDFS的設(shè)計(jì)本質(zhì)上是為了大量的數(shù)據(jù)能橫跨成百上千臺(tái)機(jī)器,但是看到的是一個(gè)文件系統(tǒng)而不是很多文件系統(tǒng),對(duì)用戶透明。例如,MapReduce系統(tǒng)要獲取/hdfs/tmp/file1的數(shù)據(jù),程序設(shè)計(jì)中引用的是一個(gè)文件路徑,但是實(shí)際的數(shù)據(jù)存放在很多不同的機(jī)器上。HDFS為用戶管理這些海量數(shù)據(jù),并通過MapReduce編程模式讓其在Hadoop集群上分布運(yùn)行[12]。

    考慮到影響分級(jí)聚類算法性能的主要因素是如何計(jì)算高維數(shù)據(jù)彼此之間的相似性,由于該相似性需要同時(shí)度量單一數(shù)據(jù)點(diǎn)在多個(gè)數(shù)據(jù)維度上與其他所有數(shù)據(jù)點(diǎn)的差異,因此,很適合使用MapReduce進(jìn)行計(jì)算。給定迭代次數(shù),即分級(jí)次。級(jí)聚類算法表述如下:

    步驟1: 將初始聚類序列分割為給定的個(gè)片段,對(duì)應(yīng)分配到個(gè)Map任務(wù),基于給定指標(biāo)計(jì)算聚類上下文的相似性,利用Reduce框架輸出各聚類對(duì)之間的相似性集合,重構(gòu)當(dāng)前聚類之間的相似性矩陣;

    步驟2:輸入上一級(jí)聚類的相似性矩陣,基于非負(fù)矩陣分解輸出當(dāng)前對(duì)應(yīng)聚類ID的歸屬度。重構(gòu)當(dāng)前級(jí)別下的聚類序列,輸出當(dāng)前級(jí)別下的聚類集合;

    步驟3: 重構(gòu)當(dāng)前聚類的上下文。重復(fù)步驟1, 步驟2共次;

    步驟4:輸出最終分級(jí)聚類結(jié)果。

    整個(gè)算法的框架圖如圖2所示。

    利用本文非負(fù)矩陣分解的并行數(shù)據(jù)處理中Map函數(shù)相應(yīng)的偽代碼如下:

    Input: text key,vector value

    Output:context context

    Begin

    1: for i=0 to n (cluster sequence) do

    2: t=findCatalog(i);

    3: for all k(* textfile) do

    4: distance=cosinedistance(k,ji);

    5: context, write(key, vector(t,Distance));

    6: end for

    7: end for

    End

    Reduce函數(shù)相應(yīng)的偽代碼如下:

    Input: text key, vector value

    Output: text key, vector value, context context

    Begin

    1: for all key and value do

    2: array list (vector(t,value));

    3: sort(array list);

    4: new arraylist result

    5: if k

    6: for i=0 to k do

    7: result, add(key,arraylist.get(i));

    8: else

    9: system.out,println(“no sufficient training smaples”)

    10: context.write(key,tradition KNN(result));

    11: end for

    12: end if

    End

    在MapReduce編程模型中,HDFS將大數(shù)據(jù)分割成若干blocks,然后存儲(chǔ)在不同的節(jié)點(diǎn)上。每個(gè)節(jié)點(diǎn)根據(jù)Map函數(shù)指定的操作在本地完成相應(yīng)的功能。

    3 實(shí)驗(yàn)結(jié)果與討論

    3.1 實(shí)驗(yàn)數(shù)據(jù)的選取

    作為積累大數(shù)據(jù)的典型行業(yè),電信行業(yè)積累了大量的手機(jī)用戶行為數(shù)據(jù),數(shù)據(jù)里包括用戶撥出電話的基站信息、通話時(shí)間、通話時(shí)長等豐富信息。這些數(shù)據(jù)可以用來研究用戶之間形成的社交網(wǎng);另一方面,由于這些行為數(shù)據(jù)具有地理上下文,因此,也可以基于網(wǎng)絡(luò)理論結(jié)合地理屬性研究城市中不同區(qū)域之間的關(guān)系與功能。

    然而,若將區(qū)域視為網(wǎng)絡(luò)中的點(diǎn),則區(qū)域覆蓋的基站的數(shù)據(jù)容量使得該點(diǎn)擁有極高的數(shù)據(jù)維度,具有上十萬用戶、上百萬的通話記錄數(shù),容量都是PB級(jí)的。如果用數(shù)據(jù)庫連接查詢以及普通的計(jì)算平臺(tái)來計(jì)算上述地理空間網(wǎng)絡(luò),效率會(huì)比較低,甚至難以接受超長的時(shí)間,所以本文提取上述電信運(yùn)營商數(shù)據(jù)作為實(shí)驗(yàn)環(huán)境,構(gòu)造空間網(wǎng)絡(luò)關(guān)系的平臺(tái)是Hadoop集群。

    本文搭建的集群中共有8個(gè)節(jié)點(diǎn):1個(gè)Master節(jié)點(diǎn)和7個(gè)Slave節(jié)點(diǎn),所有節(jié)點(diǎn)的硬件配置如下:CPU型號(hào) 為Intel Xeon E5 3.5 GHz; 內(nèi)存設(shè)為 8 GB。硬盤容量設(shè)為1 TB; 這些節(jié)點(diǎn)之間通過局域網(wǎng)內(nèi)的100M網(wǎng)卡連接,具體信息如表1所示。

    8個(gè)節(jié)點(diǎn)上均是RedHat系統(tǒng),其中Master機(jī)器主要配置NameNode和JobTracker,NameNode負(fù)責(zé)對(duì)文件系統(tǒng)的命名空間進(jìn)行管理,JobTracker負(fù)責(zé)任務(wù)的調(diào)度和分發(fā)。7個(gè)Slave機(jī)器主要配置DataNode和TaskTracker,DataNode負(fù)責(zé)對(duì)數(shù)據(jù)進(jìn)行分布式存儲(chǔ),TaskTracker主要負(fù)責(zé)接收J(rèn)obTracker分發(fā)的任務(wù)并執(zhí)行具體的數(shù)據(jù)處理任務(wù)。

    3.2 實(shí)驗(yàn)結(jié)果分析

    利用某電信運(yùn)營商的數(shù)據(jù),表2列出了利用本文的數(shù)據(jù)聚類分析并行處理后的計(jì)算結(jié)果,從實(shí)驗(yàn)結(jié)果可以看出,算法的測試結(jié)果符合預(yù)想的情況,在算法的步驟1階段,需要的時(shí)間比較長,差不多4 h,半個(gè)工作日內(nèi)能夠完成,并行處理基本能滿足實(shí)際大數(shù)據(jù)處理的需求,然而傳統(tǒng)的單機(jī)條件下需要30多個(gè)小時(shí)。在步驟3的階段比較短,雖然并行處理的時(shí)間超過了單機(jī)(因?yàn)橛辛送ㄐ砰_銷),但是相對(duì)于算法的整個(gè)過程是不影響速度的。

    以上是并行處理與串行單機(jī)的比較結(jié)果,步驟1~步驟3一共只要4個(gè)多小時(shí),而串行單機(jī)(一個(gè)節(jié)點(diǎn))要30多個(gè)小時(shí)。但是結(jié)果是與串行的比較,而不是并行單節(jié)點(diǎn)的比較(接下來看到一個(gè)Master,一個(gè)Slave共需要的時(shí)間是50 h左右)。

    接著同時(shí)測試了集群配置不同節(jié)點(diǎn)數(shù)量(2~8個(gè),都只有1個(gè)Master,1~7個(gè)Slave)條件下算法的處理性能。圖3表明整個(gè)算法(步驟1~步驟3)隨著節(jié)點(diǎn)數(shù)的增加而運(yùn)行時(shí)間相應(yīng)減少。

    加速比是衡量一個(gè)系統(tǒng)擴(kuò)展性優(yōu)劣的主要指標(biāo),其表達(dá)式為:

    從圖3中可看出,整個(gè)數(shù)據(jù)聚類算法的時(shí)間隨著節(jié)點(diǎn)的增加而急劇減少。

    圖4為聚類算法的可擴(kuò)展性測試結(jié)果。

    從圖4中可看出,多臺(tái)計(jì)算機(jī)能夠很好地縮短所需時(shí)間,這說明MapReduce在處理數(shù)據(jù)聚類分析算法上具有較好的加速比,當(dāng)節(jié)點(diǎn)數(shù)更多時(shí),這種性能優(yōu)勢將更加明顯。在一定的規(guī)模范圍內(nèi),系統(tǒng)具有很好的可擴(kuò)展性。

    4 結(jié) 論

    本文提出云計(jì)算環(huán)境下基于相似性高維數(shù)據(jù)的聚類算法的并行化實(shí)現(xiàn)。根據(jù)非負(fù)矩陣分解和聚類方法的特點(diǎn)設(shè)計(jì)了Map和Reduce函數(shù),并將該算法在Hadoop平臺(tái)下進(jìn)行性能測試。實(shí)驗(yàn)結(jié)果表明,基于MapReduce的算法具有良好的擴(kuò)展性和加速比。在數(shù)據(jù)量急劇增長的大數(shù)據(jù)時(shí)代,在云計(jì)算平臺(tái)上實(shí)現(xiàn)基于MapReduce的數(shù)據(jù)挖掘算法具有重要的意義。

    注:本文通訊作者為徐勝超。

    參考文獻(xiàn)

    [1] ZHENG Y, CAPRA L, WOLFSON O, et al. Urban computing: concepts, methodologies, and applications [J]. ACM transactions on intelligent systems and technology, 2014(1): 1?9.

    [2] 李應(yīng)安.基于MapReduce的聚類算法的并行化研究[D].廣州:中山大學(xué),2011.

    LI Y A. Research on parallelization of clustering algorithm based on MapReduce [D]. Guangzhou: Sun Yat?sen University, 2011.

    [3] 曹澤文,周姚.基于MapReduce的JP算法設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程,2012,38(24):14?16.

    CAO Z W, ZHOU Y. Design and implementation of JP algorithm based on MapReduce [J]. Computer engineering, 2012, 38(24): 14?16.

    [4] 楊燕,王全根,黃波.蟻群聚類算法的并行化設(shè)計(jì)與實(shí)現(xiàn)[J].控制工程,2013,20(3):411?414.

    YANG Yan, WANG Quangen, HUANG Bo. Parallel design and implementation of ant colony clustering algorithm [J]. Control engineering of China, 2013, 20(3): 411?414.

    [5] 楊慧中,董陶,陶洪峰.基于改進(jìn)K?means聚類算法的組合模型建模[J].控制工程,2013,20(2):201?203.

    YANG Huizhong, DONG Tao, TAO Hongfeng. Combination model based on improved K?means clustering algorithm [J]. Control engineering of China, 2013, 20(2): 201?203.

    [6] 李歡,劉鋒,朱二周.基于改進(jìn)K?means算法的海量數(shù)據(jù)分析技術(shù)研究[J].微電子學(xué)與計(jì)算機(jī),2016,33(5):52?57.

    LI Huan, LIU Feng, ZHU Erzhou. Research of an improved K?means algorithm for analyzing mass data [J]. Microelectronics & computer, 2016, 33(5): 52?57.

    [7] LI F, OOI B C, ?ZSU M T, et al. Distributed data management using MapReduce [J]. ACM computing surveys, 2014, 46(3): 31.

    [8] 吳詩極,李川,唐常杰.面向大規(guī)模信息網(wǎng)絡(luò)的高效自適應(yīng)聚類算法[J].計(jì)算機(jī)科學(xué)與探索,2014,8(4):406?416.

    WU Shiji, LI Chuan, TANG Changjie. Efficient adaptive clustering algorithm for large scale information network [J]. Journal of frontiers of computer science & technology, 2014, 8(4): 406?416.

    [9] 任重魯,李金明.非負(fù)矩陣分解在微陣列數(shù)據(jù)分類和聚類發(fā)現(xiàn)中的應(yīng)用[J].計(jì)算機(jī)工程與科學(xué),2014,36(7):1389?1397.

    REN Zhonglu, LI Jinming. Application of non?negative matrix factorization in microarray data classification and clustering discovery [J]. Computer engineering and science, 2014, 36(7): 1389?1397.

    [10] 徐森,盧志茂,顧國昌.結(jié)合K均值和非負(fù)矩陣分解集成文本聚類算法[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2011,41(4):1077?1082.

    XU Sen, LU Zhimao, GU Guochang. Integrating K?means and non?negative matrix factorization to ensemble document clustering [J]. Journal of Jilin University (engineering and technology edition), 2011, 41(4): 1077?1082.

    [11] 羅明偉,姚宏亮,李俊照,等.一種基于節(jié)點(diǎn)相異度的社團(tuán)層次劃分算法[J].計(jì)算機(jī)工程,2014,40(1):275?279.

    LUO Mingwei, YAO Hongliang, LI Junzhao, et al. A hierarchical division algorithm for community based on node dissi?milarity [J]. Computer engineering, 2014, 40(1): 275?279.

    [12] Hadoop. Hadoop Open source Web site 2016 [EB/OL]. [2016?10?23]. http://hadoop.apache.org/.endprint

    猜你喜歡
    聚類算法
    數(shù)據(jù)挖掘算法性能優(yōu)化的研究與應(yīng)用
    K—Means聚類算法在MapReduce框架下的實(shí)現(xiàn)
    基于K?均值與AGNES聚類算法的校園網(wǎng)行為分析系統(tǒng)研究
    基于改進(jìn)的K_means算法在圖像分割中的應(yīng)用
    大規(guī)模風(fēng)電場集中接入對(duì)電力系統(tǒng)小干擾穩(wěn)定的影響分析
    科技視界(2016年8期)2016-04-05 18:39:39
    基于暫態(tài)特征聚類的家用負(fù)荷識(shí)別
    日韩在线高清观看一区二区三区| 亚洲av二区三区四区| 少妇人妻精品综合一区二区| 久久 成人 亚洲| 女人十人毛片免费观看3o分钟| 国产高清国产精品国产三级 | 成年免费大片在线观看| 久久久久网色| 国产在视频线精品| 美女内射精品一级片tv| 成人18禁高潮啪啪吃奶动态图 | 日韩免费高清中文字幕av| 亚洲色图综合在线观看| 久久人人爽av亚洲精品天堂 | 国产午夜精品一二区理论片| av福利片在线观看| 日日撸夜夜添| 亚洲成人中文字幕在线播放| 这个男人来自地球电影免费观看 | 街头女战士在线观看网站| 亚洲av欧美aⅴ国产| 国产成人精品久久久久久| 青青草视频在线视频观看| 我要看日韩黄色一级片| 激情 狠狠 欧美| 在线观看美女被高潮喷水网站| 色婷婷久久久亚洲欧美| 精品酒店卫生间| 国产欧美亚洲国产| 伦理电影大哥的女人| 黄色配什么色好看| 国产精品一区二区三区四区免费观看| 黄色配什么色好看| 老司机影院毛片| 高清黄色对白视频在线免费看 | 男人添女人高潮全过程视频| 又爽又黄a免费视频| 热re99久久精品国产66热6| 亚洲精品第二区| 亚洲国产最新在线播放| 最近中文字幕高清免费大全6| 久久久久人妻精品一区果冻| 男女国产视频网站| 国产视频首页在线观看| 91久久精品国产一区二区三区| 国产男女内射视频| 秋霞伦理黄片| 国产精品久久久久久精品电影小说 | 国产黄色视频一区二区在线观看| 又大又黄又爽视频免费| 久久婷婷青草| av线在线观看网站| 三级国产精品片| 建设人人有责人人尽责人人享有的 | 国产精品不卡视频一区二区| 日韩一区二区三区影片| 一级毛片我不卡| 91精品伊人久久大香线蕉| 亚洲精品久久午夜乱码| 超碰av人人做人人爽久久| 91在线精品国自产拍蜜月| 天天躁日日操中文字幕| 最后的刺客免费高清国语| 欧美xxxx黑人xx丫x性爽| 高清欧美精品videossex| 一本一本综合久久| 水蜜桃什么品种好| 秋霞在线观看毛片| 日韩 亚洲 欧美在线| 妹子高潮喷水视频| 亚洲精品国产av蜜桃| 美女视频免费永久观看网站| 99热6这里只有精品| 精品一区二区三区视频在线| 色婷婷久久久亚洲欧美| 亚洲精品第二区| 国产亚洲一区二区精品| 色视频www国产| 日韩一区二区三区影片| 亚洲精品中文字幕在线视频 | 国产成人freesex在线| 国产精品一区二区在线观看99| 国产av精品麻豆| kizo精华| 久久精品国产a三级三级三级| 成人美女网站在线观看视频| 校园人妻丝袜中文字幕| 蜜桃亚洲精品一区二区三区| 国产91av在线免费观看| 男人添女人高潮全过程视频| 国产精品人妻久久久久久| 国产精品一区二区三区四区免费观看| 国产男女超爽视频在线观看| 久久热精品热| 日韩伦理黄色片| 十分钟在线观看高清视频www | 亚洲国产日韩一区二区| 日本免费在线观看一区| 久久热精品热| 国产 一区精品| 日韩制服骚丝袜av| 亚洲精品乱久久久久久| xxx大片免费视频| 99九九线精品视频在线观看视频| 91久久精品国产一区二区成人| 久久韩国三级中文字幕| 久久6这里有精品| 国产亚洲精品久久久com| 麻豆成人午夜福利视频| av不卡在线播放| 国产黄色视频一区二区在线观看| 黑丝袜美女国产一区| 色网站视频免费| 精品国产一区二区三区久久久樱花 | 十八禁网站网址无遮挡 | 一个人免费看片子| 日韩电影二区| 女人久久www免费人成看片| 亚洲第一区二区三区不卡| 日本av免费视频播放| 亚洲自偷自拍三级| 观看美女的网站| 在线 av 中文字幕| 免费黄网站久久成人精品| 午夜免费男女啪啪视频观看| 人人妻人人爽人人添夜夜欢视频 | 欧美变态另类bdsm刘玥| 九草在线视频观看| 边亲边吃奶的免费视频| 日本色播在线视频| 亚洲综合色惰| 美女xxoo啪啪120秒动态图| 一本久久精品| 狂野欧美激情性bbbbbb| 中文字幕亚洲精品专区| 国产一区有黄有色的免费视频| 少妇的逼水好多| 亚洲av二区三区四区| 日韩av不卡免费在线播放| 久久久久精品久久久久真实原创| 日韩av免费高清视频| 亚洲欧美日韩卡通动漫| 欧美精品亚洲一区二区| 午夜精品国产一区二区电影| 日韩欧美精品免费久久| 亚洲不卡免费看| 在线观看人妻少妇| 亚洲av电影在线观看一区二区三区| 亚洲四区av| 婷婷色av中文字幕| 免费人成在线观看视频色| .国产精品久久| 久久久午夜欧美精品| 在线观看一区二区三区| av一本久久久久| 国内精品宾馆在线| 久久久久久久久久久丰满| 国产精品人妻久久久久久| 欧美三级亚洲精品| 亚洲美女黄色视频免费看| 精品久久国产蜜桃| 18禁在线无遮挡免费观看视频| 亚洲精品中文字幕在线视频 | 一本一本综合久久| 国产爽快片一区二区三区| 国产在线男女| 最近中文字幕2019免费版| 免费大片黄手机在线观看| 亚洲国产日韩一区二区| 久久99精品国语久久久| 一边亲一边摸免费视频| 亚洲欧美清纯卡通| 成人二区视频| 国产日韩欧美在线精品| 麻豆成人av视频| 汤姆久久久久久久影院中文字幕| 高清日韩中文字幕在线| 天堂8中文在线网| 国产成人aa在线观看| 一个人免费看片子| 一个人看视频在线观看www免费| 高清黄色对白视频在线免费看 | 草草在线视频免费看| 一级毛片电影观看| av国产久精品久网站免费入址| 欧美精品亚洲一区二区| 国产乱人偷精品视频| 高清视频免费观看一区二区| 国产免费福利视频在线观看| 免费播放大片免费观看视频在线观看| 丰满迷人的少妇在线观看| 国产精品久久久久久精品电影小说 | 国产免费又黄又爽又色| 久久久久久久久久成人| 欧美精品一区二区大全| 国产精品秋霞免费鲁丝片| 91在线精品国自产拍蜜月| 麻豆乱淫一区二区| 国产高清三级在线| 成人高潮视频无遮挡免费网站| 日韩av在线免费看完整版不卡| 中文精品一卡2卡3卡4更新| 久久国产亚洲av麻豆专区| 欧美丝袜亚洲另类| 99久久人妻综合| 欧美人与善性xxx| 午夜日本视频在线| 日日撸夜夜添| 国产综合精华液| 男人爽女人下面视频在线观看| av线在线观看网站| 99国产精品免费福利视频| 国产免费一级a男人的天堂| 五月伊人婷婷丁香| 国产精品欧美亚洲77777| 一区二区三区乱码不卡18| 亚洲国产成人一精品久久久| 99久久精品一区二区三区| 国产精品久久久久久久电影| 免费播放大片免费观看视频在线观看| 国产精品国产三级国产av玫瑰| 亚洲精品国产色婷婷电影| 大香蕉97超碰在线| 欧美极品一区二区三区四区| 欧美变态另类bdsm刘玥| 亚洲国产高清在线一区二区三| 精品国产三级普通话版| 天美传媒精品一区二区| 乱系列少妇在线播放| tube8黄色片| .国产精品久久| 亚洲av成人精品一二三区| 啦啦啦视频在线资源免费观看| 国产视频内射| 国产淫语在线视频| 国产精品久久久久久久电影| 少妇人妻 视频| 国产精品国产三级专区第一集| 菩萨蛮人人尽说江南好唐韦庄| 日韩成人av中文字幕在线观看| 国产淫语在线视频| 婷婷色麻豆天堂久久| 我的女老师完整版在线观看| 亚洲,一卡二卡三卡| 天堂俺去俺来也www色官网| 国产成人a区在线观看| 人体艺术视频欧美日本| 日本色播在线视频| 久久人人爽av亚洲精品天堂 | 亚洲第一av免费看| www.av在线官网国产| 3wmmmm亚洲av在线观看| 在线观看国产h片| 丝袜脚勾引网站| 亚洲国产毛片av蜜桃av| 亚洲av二区三区四区| 成人国产麻豆网| av在线播放精品| 美女视频免费永久观看网站| 国产伦在线观看视频一区| 国产精品成人在线| 亚洲国产欧美人成| 国产黄色视频一区二区在线观看| 国产欧美日韩精品一区二区| 制服丝袜香蕉在线| 一本色道久久久久久精品综合| 亚洲aⅴ乱码一区二区在线播放| 亚洲欧美日韩另类电影网站 | 国产午夜精品一二区理论片| 欧美变态另类bdsm刘玥| 高清黄色对白视频在线免费看 | 国产精品免费大片| 日本欧美国产在线视频| 97在线人人人人妻| 人人妻人人澡人人爽人人夜夜| av免费观看日本| 日韩成人av中文字幕在线观看| 免费看日本二区| 国产精品99久久久久久久久| 日本av免费视频播放| 18禁在线播放成人免费| 超碰97精品在线观看| 国产精品不卡视频一区二区| 国产黄色免费在线视频| 国产视频首页在线观看| 少妇熟女欧美另类| 欧美激情国产日韩精品一区| 一区二区三区精品91| 综合色丁香网| 国产v大片淫在线免费观看| 亚洲久久久国产精品| 国产乱人视频| 精品一区在线观看国产| 少妇 在线观看| 久久久欧美国产精品| 天堂中文最新版在线下载| 又粗又硬又长又爽又黄的视频| 久久久久网色| 久久这里有精品视频免费| 午夜福利高清视频| 国产国拍精品亚洲av在线观看| 亚洲aⅴ乱码一区二区在线播放| 熟妇人妻不卡中文字幕| 看十八女毛片水多多多| 黄片wwwwww| 嫩草影院入口| 涩涩av久久男人的天堂| 欧美三级亚洲精品| 国产精品三级大全| 国产精品一二三区在线看| 99国产精品免费福利视频| 国产精品国产三级专区第一集| 青春草亚洲视频在线观看| 三级国产精品片| 人妻一区二区av| 久久久久精品久久久久真实原创| av卡一久久| 新久久久久国产一级毛片| 边亲边吃奶的免费视频| 激情五月婷婷亚洲| 免费看日本二区| av天堂中文字幕网| av又黄又爽大尺度在线免费看| 女性被躁到高潮视频| 联通29元200g的流量卡| 成人毛片60女人毛片免费| 成人特级av手机在线观看| 狂野欧美激情性bbbbbb| 国产一区有黄有色的免费视频| 男女免费视频国产| 一级毛片电影观看| 免费看日本二区| 精品国产一区二区三区久久久樱花 | 只有这里有精品99| 日日摸夜夜添夜夜爱| av在线app专区| 三级国产精品欧美在线观看| 国产成人精品婷婷| 2021少妇久久久久久久久久久| 在线观看人妻少妇| 久久国产精品大桥未久av | 久久久国产一区二区| 在线免费观看不下载黄p国产| 久久亚洲国产成人精品v| 男女下面进入的视频免费午夜| 六月丁香七月| 亚洲三级黄色毛片| 婷婷色麻豆天堂久久| 视频中文字幕在线观看| 中文字幕人妻熟人妻熟丝袜美| 亚洲欧美精品自产自拍| 精品久久国产蜜桃| 超碰97精品在线观看| 精品国产一区二区三区久久久樱花 | 欧美日韩国产mv在线观看视频 | 国产伦精品一区二区三区视频9| videossex国产| 国产亚洲欧美精品永久| 18禁在线无遮挡免费观看视频| 在线观看一区二区三区激情| 久久99蜜桃精品久久| 国产免费又黄又爽又色| 3wmmmm亚洲av在线观看| 欧美日韩国产mv在线观看视频 | 成人毛片a级毛片在线播放| 免费av中文字幕在线| 特大巨黑吊av在线直播| 精品熟女少妇av免费看| 青春草亚洲视频在线观看| 干丝袜人妻中文字幕| 最近中文字幕2019免费版| 欧美国产精品一级二级三级 | 精品亚洲成a人片在线观看 | 国产精品一区www在线观看| 91精品一卡2卡3卡4卡| 精品国产三级普通话版| av不卡在线播放| 在线精品无人区一区二区三 | 又爽又黄a免费视频| 人妻夜夜爽99麻豆av| 国产精品女同一区二区软件| 欧美成人午夜免费资源| 亚洲电影在线观看av| 激情 狠狠 欧美| 性色av一级| 欧美高清成人免费视频www| 国产乱人视频| 成人18禁高潮啪啪吃奶动态图 | 伦精品一区二区三区| 菩萨蛮人人尽说江南好唐韦庄| 精品人妻熟女av久视频| 黄色一级大片看看| 免费不卡的大黄色大毛片视频在线观看| 日韩一区二区三区影片| 免费观看在线日韩| 国产黄片视频在线免费观看| 国产久久久一区二区三区| 亚洲精品乱码久久久久久按摩| 美女内射精品一级片tv| 精品一品国产午夜福利视频| 亚洲av成人精品一二三区| 最近2019中文字幕mv第一页| 久久久久久久久久久免费av| 精品久久国产蜜桃| 熟妇人妻不卡中文字幕| 成人毛片a级毛片在线播放| 校园人妻丝袜中文字幕| 成人综合一区亚洲| 少妇被粗大猛烈的视频| 久久久久精品性色| 少妇高潮的动态图| 一级毛片电影观看| 精品99又大又爽又粗少妇毛片| 国产av码专区亚洲av| 精品一区在线观看国产| 97在线人人人人妻| 日产精品乱码卡一卡2卡三| 国产精品久久久久成人av| 色5月婷婷丁香| av免费在线看不卡| 少妇熟女欧美另类| 国产有黄有色有爽视频| 青青草视频在线视频观看| 欧美一级a爱片免费观看看| 亚洲天堂av无毛| 国产老妇伦熟女老妇高清| 色综合色国产| 国产男女内射视频| 99热这里只有精品一区| 男女边摸边吃奶| 99久久综合免费| 久久av网站| 亚洲内射少妇av| 国产久久久一区二区三区| 蜜臀久久99精品久久宅男| 热99国产精品久久久久久7| 精品酒店卫生间| 久久久精品94久久精品| 久久久a久久爽久久v久久| 亚洲熟女精品中文字幕| av国产久精品久网站免费入址| 色5月婷婷丁香| xxx大片免费视频| 亚洲人成网站在线播| 国产午夜精品久久久久久一区二区三区| 大香蕉97超碰在线| 国产欧美亚洲国产| 成人特级av手机在线观看| 黄色欧美视频在线观看| 一区二区av电影网| 狂野欧美激情性bbbbbb| 免费观看在线日韩| 色视频在线一区二区三区| 一级a做视频免费观看| 深爱激情五月婷婷| 国产成人精品一,二区| 女性被躁到高潮视频| 99re6热这里在线精品视频| 亚洲国产欧美人成| 中文在线观看免费www的网站| 中文欧美无线码| 丝袜脚勾引网站| 在线天堂最新版资源| 国产亚洲av片在线观看秒播厂| 国产成人精品久久久久久| 久久久久久久精品精品| 18+在线观看网站| 国产亚洲91精品色在线| 亚洲美女搞黄在线观看| 国产黄频视频在线观看| 麻豆成人午夜福利视频| 国产男女超爽视频在线观看| 久久青草综合色| 国产精品国产av在线观看| 日日撸夜夜添| 国产91av在线免费观看| 日本av免费视频播放| 亚洲精品第二区| 两个人的视频大全免费| 国产精品久久久久久av不卡| 黄色欧美视频在线观看| 99热网站在线观看| 美女视频免费永久观看网站| 1000部很黄的大片| 中文字幕精品免费在线观看视频 | 日韩在线高清观看一区二区三区| 久久人人爽人人爽人人片va| 中文在线观看免费www的网站| 日韩制服骚丝袜av| 欧美成人午夜免费资源| 久久精品久久久久久噜噜老黄| 日韩一区二区三区影片| 久久精品人妻少妇| 国产黄色视频一区二区在线观看| 我的老师免费观看完整版| 最近手机中文字幕大全| 黄色日韩在线| 国精品久久久久久国模美| 成人高潮视频无遮挡免费网站| 一级毛片电影观看| 日韩电影二区| 成人国产av品久久久| 国产欧美另类精品又又久久亚洲欧美| 蜜桃久久精品国产亚洲av| 日本色播在线视频| 美女高潮的动态| 精品人妻偷拍中文字幕| 亚洲国产色片| 夜夜看夜夜爽夜夜摸| 好男人视频免费观看在线| 伊人久久精品亚洲午夜| 丰满迷人的少妇在线观看| 久久国产精品男人的天堂亚洲 | 99热国产这里只有精品6| 欧美丝袜亚洲另类| 日韩一本色道免费dvd| 亚洲av免费高清在线观看| 大陆偷拍与自拍| av国产精品久久久久影院| 国产成人一区二区在线| av一本久久久久| 小蜜桃在线观看免费完整版高清| 国产精品一及| 国产乱人偷精品视频| 99久久精品热视频| 精品99又大又爽又粗少妇毛片| 精品人妻视频免费看| 麻豆乱淫一区二区| 日日啪夜夜撸| 亚洲国产色片| 日韩国内少妇激情av| 激情五月婷婷亚洲| 亚洲av成人精品一区久久| 国产乱人视频| 亚洲aⅴ乱码一区二区在线播放| 中文在线观看免费www的网站| 男的添女的下面高潮视频| 精品少妇久久久久久888优播| 韩国高清视频一区二区三区| 国产男女超爽视频在线观看| 我的女老师完整版在线观看| 老司机影院成人| 色5月婷婷丁香| 哪个播放器可以免费观看大片| 亚洲国产最新在线播放| 欧美激情极品国产一区二区三区 | 国产爱豆传媒在线观看| 久久国产亚洲av麻豆专区| 欧美高清成人免费视频www| 久久综合国产亚洲精品| 男女无遮挡免费网站观看| 中文精品一卡2卡3卡4更新| 亚洲av成人精品一区久久| 国产精品国产三级国产av玫瑰| 乱码一卡2卡4卡精品| 丰满人妻一区二区三区视频av| 中文字幕人妻熟人妻熟丝袜美| 日韩伦理黄色片| 婷婷色av中文字幕| 黄片无遮挡物在线观看| 极品教师在线视频| 欧美日韩精品成人综合77777| 中文字幕亚洲精品专区| 国产一区二区在线观看日韩| 免费黄网站久久成人精品| 九九久久精品国产亚洲av麻豆| 久久精品国产鲁丝片午夜精品| 精品久久久久久电影网| 亚洲美女搞黄在线观看| 色婷婷av一区二区三区视频| av在线老鸭窝| 亚洲av福利一区| 80岁老熟妇乱子伦牲交| 91久久精品国产一区二区三区| 国产伦在线观看视频一区| 国产高清有码在线观看视频| 性高湖久久久久久久久免费观看| 欧美成人一区二区免费高清观看| 欧美三级亚洲精品| 亚洲国产精品成人久久小说| 亚洲精品视频女| 亚洲成人一二三区av| 少妇被粗大猛烈的视频| 国产精品蜜桃在线观看| 在线精品无人区一区二区三 | 久久久精品免费免费高清| 成人影院久久| 国产成人一区二区在线| 天美传媒精品一区二区| 三级经典国产精品| 能在线免费看毛片的网站| 在线看a的网站| 亚洲精品成人av观看孕妇| 国产黄频视频在线观看| 国产v大片淫在线免费观看| 国产精品秋霞免费鲁丝片| 在线观看人妻少妇| 久久人人爽人人爽人人片va| 免费看不卡的av| 欧美zozozo另类| 最近中文字幕2019免费版| 中文乱码字字幕精品一区二区三区| 婷婷色麻豆天堂久久| 女的被弄到高潮叫床怎么办| 少妇人妻久久综合中文| 国产精品麻豆人妻色哟哟久久| 男女边吃奶边做爰视频| 欧美激情国产日韩精品一区| av卡一久久| 久久人妻熟女aⅴ| 乱系列少妇在线播放| 国产精品无大码| 国产午夜精品久久久久久一区二区三区| 欧美日韩亚洲高清精品| 久久久成人免费电影|