• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于MapReduce編程模型的改進(jìn)KNN分類算法研究

    2017-03-30 08:11:34邱寧佳郭暢楊華民王鵬溫暖
    關(guān)鍵詞:約簡(jiǎn)訓(xùn)練樣本分類

    邱寧佳,郭暢,楊華民,王鵬,溫暖

    (長(zhǎng)春理工大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,長(zhǎng)春 130022)

    基于MapReduce編程模型的改進(jìn)KNN分類算法研究

    邱寧佳,郭暢,楊華民,王鵬,溫暖

    (長(zhǎng)春理工大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,長(zhǎng)春 130022)

    采用一種屬性約簡(jiǎn)算法,將待分類的數(shù)據(jù)樣本進(jìn)行兩次約簡(jiǎn)處理--初次決策表屬性約簡(jiǎn)和基于核屬性值的二次約簡(jiǎn)。通過(guò)屬性約簡(jiǎn)方法來(lái)刪除數(shù)據(jù)集中的冗余數(shù)據(jù),進(jìn)而提高KNN算法的分類精度。在此基礎(chǔ)上應(yīng)用MapReduce并行編程模型,在Hadoop集群環(huán)境上實(shí)現(xiàn)并行化分類計(jì)算實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,改進(jìn)后的算法在集群環(huán)境下執(zhí)行的效率得到很大提升,能夠高效處理實(shí)驗(yàn)數(shù)據(jù)。實(shí)驗(yàn)執(zhí)行的加速比也有明顯提高。

    KNN;屬性約簡(jiǎn);MapReduce編程模型;Hadoop

    隨著信息技術(shù)以及“互聯(lián)網(wǎng)+”的快速發(fā)展,數(shù)據(jù)在大容量、多樣性和高增速方面爆炸式增長(zhǎng),給數(shù)據(jù)的處理和分析帶來(lái)了巨大挑戰(zhàn)[1]。數(shù)據(jù)的分類處理就變得尤為重要,在經(jīng)典分類算法中KNN分類算法操作比較簡(jiǎn)單,在諸多領(lǐng)域都有很廣泛的應(yīng)用。不過(guò)KNN作為一種惰性算法在處理大容量數(shù)據(jù)集時(shí),由于數(shù)據(jù)的屬性較多,會(huì)影響KNN算法的分類效率和分類精度,因此對(duì)KNN分類算法進(jìn)行改進(jìn)是很有必要的。

    國(guó)內(nèi)外的學(xué)者們對(duì)KNN算法已經(jīng)有了一些研究,閆永剛等人提出了將KNN分類算法通過(guò)MapReduce編程模型實(shí)現(xiàn)并行化[2];Papadimitriou等人提出了一重新的聚類分析算法DisCo[3],且這種新算法應(yīng)用在分布式平臺(tái)上進(jìn)行并行化實(shí)驗(yàn)研究;鮑新中等人應(yīng)用了粗糙集權(quán)重確定方法來(lái)解決粗糙集信息上的權(quán)重確定問(wèn)題[4];汪凌等人應(yīng)用了一種基于相對(duì)可辨識(shí)矩陣的決策表屬性約簡(jiǎn)算法[5]來(lái)解決KNN算法中的數(shù)據(jù)冗余問(wèn)題;張著英等人在研究KNN分類算法時(shí)將粗糙集理論應(yīng)用到KNN算法中從而實(shí)現(xiàn)屬性約簡(jiǎn)[6];樊存佳等人提出了一種基于文本分類的新型改進(jìn)KNN分類算法[7],同時(shí)采用聚類算法裁剪對(duì)KNN分類貢獻(xiàn)小的訓(xùn)練樣本,從而減少數(shù)據(jù)冗余;Zhu等人提出了一種基于哈希表的高效分類算法H-c2KNN[8],應(yīng)用在高維數(shù)據(jù)下的KNN分類算法中;Wang等人提出了一種基于內(nèi)核改進(jìn)的屬性約簡(jiǎn)KNN分類算法[9];吳強(qiáng)提出了一種基于概念格的屬性約簡(jiǎn)方法[10],將粗糙集理論的可辨識(shí)矩陣方法應(yīng)用于概念格的約簡(jiǎn),從而提高效率簡(jiǎn)化;魯偉明等人提出了一種基于近鄰傳播的改進(jìn)聚類算法-DisAP[11],并將其應(yīng)用在MapReduce編程框架中;王煜將KNN文本分類算法進(jìn)行了基于決策樹算法的改進(jìn)并進(jìn)行并行化研究[12];梁鮮等人提出了一種全局K-均值算法[13],解決了全局K-均值算法時(shí)間復(fù)雜度大的問(wèn)題;王鵬等人提出了在MapReduce模型基礎(chǔ)上的K-均值聚類算法的實(shí)現(xiàn)問(wèn)題[14]。本文在上述研究的基礎(chǔ)上,對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行基于決策表和核屬性值的兩次屬性約簡(jiǎn)改造并結(jié)合MapReduce編程框架進(jìn)行KNN分類算法的并行化實(shí)現(xiàn)。

    1 相關(guān)知識(shí)

    1.1 KNN分類算法的基本原理

    K最近鄰(K Nearest Neighbors,KNN)算法是一種基于實(shí)例的學(xué)習(xí)方法。其基本原理如下:通過(guò)將給定的檢驗(yàn)樣本與和它相似的訓(xùn)練樣本進(jìn)行比較來(lái)分析結(jié)果,此為學(xué)習(xí)。訓(xùn)練樣本通常用屬性來(lái)描述,一個(gè)訓(xùn)練樣本包含多個(gè)屬性,每個(gè)屬性則代表n維空間的一個(gè)點(diǎn)。當(dāng)輸入新的訓(xùn)練樣本時(shí),KNN算法即開始進(jìn)行遍歷搜索,得到與新樣本最近鄰的k個(gè)訓(xùn)練樣本,其示例如圖1所示。

    圖1 KNN分類示例

    可以看出,給定的訓(xùn)練樣本共有三種:正方形、圓形和五邊形。每給定一個(gè)新的檢驗(yàn)樣本,就需要計(jì)算與其最近的K個(gè)訓(xùn)練樣本,計(jì)算的方法通常采用歐式距離計(jì)算,再由計(jì)算出的K個(gè)訓(xùn)練樣本的分類情況來(lái)確定新樣本的分類情況。由上圖中心圓所選出的即為離待分類樣本最近的六個(gè)訓(xùn)練樣本,這六個(gè)樣本中有四個(gè)為五邊形,按照分類號(hào)進(jìn)行“投票”,則可以將該訓(xùn)練樣本分類為五邊形。

    1.2 MapReduce框架

    MapReduce是一種面向大數(shù)據(jù)并行處理的計(jì)算模式,它是基于集群的高性能并行計(jì)算平臺(tái),也是并行計(jì)算與運(yùn)行軟件的框架,同時(shí)也是一個(gè)并行程序設(shè)計(jì)的模型。MapReduce框架程序主要由Map函數(shù)和Reduce函數(shù)組成,首先由Map函數(shù)負(fù)責(zé)對(duì)數(shù)據(jù)進(jìn)行分布計(jì)算,即將輸入的數(shù)據(jù)集切分為若干獨(dú)立的數(shù)據(jù)塊,各個(gè)Mapper節(jié)點(diǎn)在工作時(shí)不能夠?qū)崟r(shí)的交互,框架會(huì)將Map輸出的數(shù)據(jù)塊進(jìn)行排序;然后將輸入結(jié)果發(fā)送給Reduce函數(shù),Reduce函數(shù)負(fù)責(zé)對(duì)中間結(jié)果進(jìn)行處理,以得到最終結(jié)果并進(jìn)行結(jié)果輸出,圖2為MapReduce程序執(zhí)行示意圖。

    圖2 MapReduce程序執(zhí)行示意圖

    1.3 屬性約簡(jiǎn)方法

    屬性約簡(jiǎn)即通過(guò)刪除不相關(guān)屬性或者降低屬性維度從而減少數(shù)據(jù)冗余,提高數(shù)據(jù)處理的效率,節(jié)約數(shù)據(jù)計(jì)算成本。屬性約簡(jiǎn)是計(jì)算最小屬性子集的過(guò)程,在此過(guò)程中還要保證其數(shù)據(jù)的分布概率基本保持不變或有較少改動(dòng)。常見的屬性約簡(jiǎn)方法有逐步向前選擇法、合并屬性法、決策樹歸納和主成分分析等方法。主成分分析是一種用于連續(xù)屬性的數(shù)據(jù)降維方法,構(gòu)造了原始數(shù)據(jù)的一個(gè)正交變換,新空間的基底去除了原始空間基底下數(shù)據(jù)的相關(guān)性,這樣較少的新變量能夠刻畫出原始數(shù)據(jù)的絕大部分變異情況。在應(yīng)用中,通常是選出比原始變量個(gè)數(shù)少,能解釋大部分?jǐn)?shù)據(jù)中的幾個(gè)新變量,即主成分來(lái)代替原始變量進(jìn)行建模。

    其計(jì)算步驟如下:

    設(shè)原始變量X1,X2,…,XP的n次觀測(cè)數(shù)據(jù)矩陣為:

    對(duì)觀測(cè)的數(shù)據(jù)矩陣進(jìn)行中心標(biāo)準(zhǔn)化,并將標(biāo)準(zhǔn)化后的數(shù)據(jù)矩陣仍然記為X。

    求相關(guān)系數(shù)矩陣R,R=(rij)p×p,rij的定義為:

    求R的特征方程det(R-λE)=0的特征根λ1≥λ2≥λp>0;

    計(jì)算m個(gè)相應(yīng)的單位特征向量:

    計(jì)算主成分:

    Zi=β1iX1+β2iX2+…+βpiXp,i=1,2,…,m

    再使用主成分分析降維的方法,可以得到特征方程的特征根,對(duì)應(yīng)的特征向量以及各個(gè)成分各自的方差百分比(即貢獻(xiàn)率),貢獻(xiàn)率百分比越大,向量權(quán)重越大。通過(guò)此種方法可以在完成屬性歸約的同時(shí)保存與原始數(shù)據(jù)相配的數(shù)據(jù)信息。

    2 改進(jìn)KNN算法

    2.1 基于屬性約簡(jiǎn)的KNN分類算法

    改進(jìn)后的KNN分類算法即在進(jìn)行KNN分類算法的基礎(chǔ)上利用屬性約簡(jiǎn)的相關(guān)知識(shí),將算法進(jìn)行先基于決策表再基于核屬性值的兩次屬性約簡(jiǎn),將冗余的數(shù)據(jù)進(jìn)行約簡(jiǎn),在不影響結(jié)果的情況下,提高分類的效率,下面給出改進(jìn)后算法的形式化描述:

    輸出:樣本數(shù)據(jù)的類別。

    算法步驟:

    (1)對(duì)輸入的訓(xùn)練數(shù)據(jù)進(jìn)行初次屬性約簡(jiǎn),并計(jì)算出核屬性值;

    (2)根據(jù)樣本屬性進(jìn)行基于核屬性的二次屬性約簡(jiǎn),通過(guò)信息熵理論,計(jì)算核屬性的重要度w(p),若w(p)=0,則認(rèn)為該屬性為冗余屬性,從核屬性中移除該屬性,得到二次約簡(jiǎn)屬性集[4];

    (3)利用分布式處理平臺(tái)對(duì)樣本數(shù)據(jù)進(jìn)行分塊處理,對(duì)每一塊樣本數(shù)據(jù)分別計(jì)算其與訓(xùn)練數(shù)據(jù)屬性之間的距離d(X,Xi),此處的距離采用歐式距離進(jìn)行計(jì)算;

    (4)對(duì)計(jì)算出的距離d(X,Xi)進(jìn)行從小到大的排序,選取排在前K個(gè)訓(xùn)練數(shù)據(jù);

    (5)統(tǒng)計(jì)前K個(gè)訓(xùn)練數(shù)據(jù)的類別,將個(gè)數(shù)最多的類別預(yù)測(cè)為當(dāng)前樣本的類別,進(jìn)行結(jié)果分析。

    2.2 改進(jìn)后的KNN算法的MapReduce并行化

    將改進(jìn)后的KNN算法進(jìn)行MapReduce并行化,主要分為三個(gè)階段來(lái)實(shí)現(xiàn)。

    (1)下載文件系統(tǒng)中的訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集到本地存儲(chǔ)節(jié)點(diǎn)。

    (2)Map函數(shù)將測(cè)試樣本數(shù)據(jù)分塊,計(jì)算出測(cè)試數(shù)據(jù)到訓(xùn)練數(shù)據(jù)的歐式距離,進(jìn)行排序。

    (3)將排序結(jié)果傳送給Reduce函數(shù),Reduce函數(shù)將執(zhí)行KNN分類算法進(jìn)行規(guī)約操作并計(jì)算出分類結(jié)果。因?yàn)镸ap階段的關(guān)鍵為對(duì)應(yīng)待分類樣本在文件中的偏移值,其在Map階段完成時(shí)會(huì)被MapReduce框架自動(dòng)排序,所以Reduce階段輸出的分類號(hào)就對(duì)應(yīng)了待分類樣本在原文件中的順序。本文中的Map函數(shù)和Reduce函數(shù)的算法步驟如下所示:

    表1 Map函數(shù)的算法步驟

    表2 Reduce函數(shù)的算法步驟

    經(jīng)過(guò)上述改進(jìn)后,得出了一個(gè)基于屬性約簡(jiǎn)的改進(jìn)KNN算法,并對(duì)其進(jìn)行MapReduce編程模型的搭建。

    3 實(shí)驗(yàn)分析

    3.1 實(shí)驗(yàn)環(huán)境及數(shù)據(jù)

    實(shí)驗(yàn)運(yùn)行所需的云平臺(tái)由實(shí)驗(yàn)室4臺(tái)電腦組成,每臺(tái)電腦裝有3臺(tái)虛擬機(jī),共12個(gè)節(jié)點(diǎn)。Hadoop分布式云計(jì)算集群采用Centos6.0操作系統(tǒng)、hadoop-1.1.2版本的Hadoop。其中一個(gè)作為Master節(jié)點(diǎn),其余作為Slave節(jié)點(diǎn)。本次實(shí)驗(yàn)采用7個(gè)數(shù)據(jù)節(jié)點(diǎn)來(lái)進(jìn)行實(shí)驗(yàn)。

    實(shí)驗(yàn)數(shù)據(jù)采用標(biāo)準(zhǔn)數(shù)據(jù)集CoverType DataS-et,該數(shù)據(jù)具有54個(gè)屬性變量,58萬(wàn)個(gè)樣本,7個(gè)類別。本文將數(shù)據(jù)分為測(cè)試數(shù)據(jù)(data1)和訓(xùn)練數(shù)據(jù)(data2)兩部分,其中測(cè)試數(shù)據(jù)共20萬(wàn)個(gè)樣本,大小約為500MB,訓(xùn)練數(shù)據(jù)共38萬(wàn)個(gè)樣本,大小約為1000MB。

    3.2 實(shí)驗(yàn)過(guò)程及分析

    本實(shí)驗(yàn)的主要內(nèi)容分為兩部分:

    (1)分析KNN算法在數(shù)據(jù)規(guī)模相同而在數(shù)據(jù)節(jié)點(diǎn)數(shù)目不同的情況下,數(shù)據(jù)執(zhí)行時(shí)間的對(duì)比情況。首先對(duì)給定的訓(xùn)練樣本進(jìn)行初次屬性約簡(jiǎn)和二次基于核屬性值的約簡(jiǎn),以達(dá)到刪除冗余數(shù)據(jù)的效果,然后在Hadoop分布式平臺(tái)上進(jìn)行基于MapReduce的并行化實(shí)驗(yàn),依次導(dǎo)入訓(xùn)練樣本和測(cè)試樣本,實(shí)驗(yàn)數(shù)據(jù)節(jié)點(diǎn)數(shù)目依次從1個(gè)添加到7個(gè),通過(guò)增加節(jié)點(diǎn)數(shù)目來(lái)對(duì)實(shí)驗(yàn)執(zhí)行時(shí)間進(jìn)行比較,得出相應(yīng)結(jié)論;

    (2)研究數(shù)據(jù)在執(zhí)行分類算法的過(guò)程中,不同數(shù)據(jù)節(jié)點(diǎn)數(shù)目所對(duì)應(yīng)的加速比情況。此部分實(shí)驗(yàn)是由實(shí)驗(yàn)(1)的實(shí)驗(yàn)結(jié)果分析而得出的,不用數(shù)據(jù)節(jié)點(diǎn)數(shù)目條件下對(duì)應(yīng)的實(shí)驗(yàn)結(jié)果加速比理論上應(yīng)該是不同的,所以通過(guò)實(shí)驗(yàn)來(lái)做真實(shí)的數(shù)據(jù)分析,得出具體的變化曲線。

    實(shí)驗(yàn)結(jié)果分別如圖3、4所示:

    圖3 數(shù)據(jù)集的時(shí)間對(duì)比圖

    圖3可以看出,兩組數(shù)據(jù)集分別為改進(jìn)前和改進(jìn)后的測(cè)試數(shù)據(jù)和訓(xùn)練數(shù)據(jù),由實(shí)驗(yàn)可以驗(yàn)證每組數(shù)據(jù)在進(jìn)行屬性約簡(jiǎn)改進(jìn)后都其運(yùn)行的時(shí)間都比沒(méi)有改進(jìn)前有明顯減少,訓(xùn)練數(shù)據(jù)約簡(jiǎn)后執(zhí)行時(shí)間平均縮短了2.28min,測(cè)試數(shù)據(jù)的執(zhí)行時(shí)間平均縮減了1.71min,且數(shù)據(jù)量大的訓(xùn)練數(shù)據(jù)時(shí)間減少的更為明顯,通過(guò)對(duì)數(shù)據(jù)進(jìn)行屬性約簡(jiǎn)后其運(yùn)行的效率明顯提高,改進(jìn)的KNN算法在分布式平臺(tái)上能夠高效運(yùn)行,對(duì)于單個(gè)數(shù)據(jù)集而言隨著節(jié)點(diǎn)數(shù)增加數(shù)據(jù)在平臺(tái)上運(yùn)行的時(shí)間相應(yīng)減少,訓(xùn)練數(shù)據(jù)在7個(gè)數(shù)據(jù)節(jié)點(diǎn)條件下執(zhí)行的時(shí)間是單機(jī)條件的58.3%,測(cè)試數(shù)據(jù)僅僅為40%。測(cè)試結(jié)果說(shuō)明改進(jìn)后的KNN算法能滿足實(shí)際并行分布式環(huán)境下大數(shù)據(jù)處理的需求。由此可以看出將算法改造后,能夠很好的提高處理數(shù)據(jù)效率,進(jìn)而降低對(duì)大數(shù)據(jù)的分類工作復(fù)雜度。

    圖4 加速比對(duì)比圖

    圖4看出,兩組數(shù)據(jù)的實(shí)驗(yàn)運(yùn)行加速比曲線都是成正相關(guān)的,即隨著數(shù)據(jù)節(jié)點(diǎn)個(gè)數(shù)的增加實(shí)驗(yàn)運(yùn)行加速比有明顯提高,可以看出分布式平臺(tái)在處理KNN分類算法上有很好的計(jì)算能力,可以看出,當(dāng)數(shù)據(jù)量不夠大時(shí),使用分布式平臺(tái)執(zhí)行任務(wù)沒(méi)有單機(jī)環(huán)境下執(zhí)行效率高,當(dāng)數(shù)據(jù)規(guī)模足夠大時(shí),并且每一個(gè)數(shù)據(jù)分片都在進(jìn)行處理工作時(shí),集群的效率最高,訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)這兩組數(shù)據(jù)的加速比分別提高了140%和100%。實(shí)驗(yàn)通過(guò)對(duì)兩組數(shù)據(jù)的運(yùn)行加速比進(jìn)行研究分析,表明分布式計(jì)算在集群環(huán)境下運(yùn)行效率最高。

    4 結(jié)論

    本文在研究過(guò)程中主要實(shí)現(xiàn)了如下內(nèi)容:對(duì)KNN分類算法的研究與分析,提出了基于決策表和核屬性值的兩次屬性約簡(jiǎn)的改造,對(duì)改造后的KNN算法進(jìn)行MapReduce并行化研究實(shí)驗(yàn)。通過(guò)研究過(guò)程及實(shí)驗(yàn)分析得出了如下結(jié)論:

    (1)實(shí)驗(yàn)通過(guò)對(duì)數(shù)據(jù)進(jìn)行兩次屬性約簡(jiǎn),大大減少了數(shù)據(jù)冗余,提高了實(shí)驗(yàn)的運(yùn)行效率;

    (2)對(duì)改造后的算法使用MapReduce編程模型進(jìn)行實(shí)驗(yàn)設(shè)計(jì),并在Hadoop平臺(tái)上進(jìn)行并行化實(shí)驗(yàn)分析;

    (3)實(shí)驗(yàn)表明在大數(shù)據(jù)環(huán)境下,屬性約簡(jiǎn)后的數(shù)據(jù)在集群環(huán)境下執(zhí)行算法提高了KNN算法的加速比和可擴(kuò)展性,算法效率也隨著集群規(guī)模的擴(kuò)大而變高。

    實(shí)驗(yàn)證實(shí)了通過(guò)對(duì)現(xiàn)有經(jīng)典KNN算法的改進(jìn)可以大大提高其執(zhí)行效率,減少工作量,在下一步的研究過(guò)程中還將對(duì)數(shù)據(jù)量進(jìn)行擴(kuò)大,研究對(duì)比數(shù)據(jù)量變大時(shí)算法的執(zhí)行效率是否會(huì)有所影響,以及再次改良后算法的執(zhí)行情況。

    [1]王元卓,靳小龍,程學(xué)旗.網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望[J].計(jì)算機(jī)學(xué)報(bào),2013,36(6):1125-1138.

    [2]閆永剛,馬廷淮,王建.KNN分類算法的MapReduce并行化實(shí)現(xiàn)[J].南京航空航天大學(xué)學(xué)報(bào),2013,45(4):

    [3]Papadimitriou S,Sun J.DisCo:Distributed Co-clustering with Map-Reduce[C].Data Mining,IEEE International Conference on.IEEE,2015:512-521.

    [4]鮑新中,張建斌,劉澄.基于粗糙集條件信息熵的權(quán)重確定方法[J].中國(guó)管理科學(xué),2009,17(3):131-135.

    [5]汪凌,吳潔,黃丹.基于相對(duì)可辨識(shí)矩陣的決策表屬性約簡(jiǎn)算法[J].計(jì)算機(jī)工程與設(shè)計(jì),2010,31(11):2536-2538.

    [6]張著英,黃玉龍,王翰虎.一個(gè)高效的KNN分類算法[J].計(jì)算機(jī)科學(xué),2008,35(3):170-172.

    [7]樊存佳,汪友生,邊航.一種改進(jìn)的KNN文本分類算法[J].國(guó)外電子測(cè)量技術(shù),2015(12):39-43.

    [8]Zhu P,Zhan X,Qiu W.Efficient k-Nearest neighborssearchinhighdimensionsusingMapReduce[C].Fifth International Conference on Big Data and Cloud Computing.IEEE,2015:23-30.

    [9]Xueli W,Zhiyong J,Dahai Y.An improved KNN algorithm based on kernel methods and attribute reduction[C].Fifth International Conference on Instrumentation and Measurement,Computer,Communication and Control.IEEE,2015.

    [10]吳強(qiáng).采用粗糙集中可辨識(shí)矩陣方法的概念格屬性約簡(jiǎn)[J].計(jì)算機(jī)工程,2004,30(20):141-142.

    [11]魯偉明,杜晨陽(yáng),魏寶剛,等.基于MapReduce的分布式近鄰傳播聚類算法[J].計(jì)算機(jī)研究與發(fā)展,2012,49(8):1762-1772.

    [12]王煜.基于決策樹和K最近鄰算法的文本分類研究[D].天津:天津大學(xué),2006.

    [13]梁鮮,曲福恒,楊勇,等.一種高效的全局K-均值算法[J].長(zhǎng)春理工大學(xué)學(xué)報(bào):自然科學(xué)版,2015,38(3):112-115.

    [14]王鵬,王睿婕.K-均值聚類算法的MapReduce模型實(shí)現(xiàn)[J].長(zhǎng)春理工大學(xué)學(xué)報(bào):自然科學(xué)版,2015,38(3):120-123. wirless channels[C].Rhodes:Vrhicular Technology Conference,2001:680-692.

    The Research of Modified KNN Classification Algorithm Based on MapReduce Model

    QIU Ningjia,GUO Chang,YANG Huamin,WANG Peng,WEN Nuan
    (School of Computer Science and Technology,Changchun University of Science and Technology,Changchun 130022)

    An attribute reduction algorithm is proposed.The algorithm will be classified data samples for the two reduction processing--attribute reduction of the initial decision table and second reduction based on kernel attribute value. The method of attribute reduction is to delete the redundant data,and then to improve the classification accuracy of KNN algorithm.On the basis of the application of the MapReduce parallel programming model,the parallel computing experiments are implemented in the Hadoop cluster environment.The experimental results show that the efficiency of the improved algorithm in the cluster environment has been greatly improved,which can effectively deal with the experimental data.Experimental implementation of the speedup is also significantly improved.

    KNN;attribute reduction;MapReduce programming model;hadoop

    TP391

    A

    1672-9870(2017)01-0110-05

    2016-08-01

    吉林省科技發(fā)展計(jì)劃重點(diǎn)科技攻關(guān)項(xiàng)目(20150204036GX)

    邱寧佳(1984-),男,博士后,講師,E-mail:269212811@qq.com

    猜你喜歡
    約簡(jiǎn)訓(xùn)練樣本分類
    分類算一算
    人工智能
    基于二進(jìn)制鏈表的粗糙集屬性約簡(jiǎn)
    分類討論求坐標(biāo)
    數(shù)據(jù)分析中的分類討論
    實(shí)值多變量維數(shù)約簡(jiǎn):綜述
    教你一招:數(shù)的分類
    基于模糊貼近度的屬性約簡(jiǎn)
    寬帶光譜成像系統(tǒng)最優(yōu)訓(xùn)練樣本選擇方法研究
    融合原始樣本和虛擬樣本的人臉識(shí)別算法
    69av精品久久久久久| 天美传媒精品一区二区| 欧美三级亚洲精品| 日日撸夜夜添| 一边摸一边抽搐一进一小说| 久久久久久久久久久丰满| 国产伦在线观看视频一区| 1000部很黄的大片| 久久久久久久久久黄片| 1024手机看黄色片| 亚洲三级黄色毛片| 亚洲成人久久性| 久久中文看片网| 一个人观看的视频www高清免费观看| 夜夜夜夜夜久久久久| 午夜视频国产福利| 国产亚洲5aaaaa淫片| 久久精品综合一区二区三区| 日韩 亚洲 欧美在线| 亚洲在线自拍视频| 欧美精品一区二区大全| 爱豆传媒免费全集在线观看| 国产老妇伦熟女老妇高清| 别揉我奶头 嗯啊视频| 黄色配什么色好看| 18禁黄网站禁片免费观看直播| 一级二级三级毛片免费看| 午夜激情欧美在线| 亚洲人成网站在线观看播放| 久久久久久九九精品二区国产| 深夜精品福利| 亚洲欧美中文字幕日韩二区| 在线国产一区二区在线| 亚洲欧美精品专区久久| 亚洲精品色激情综合| 亚洲真实伦在线观看| 欧美日韩国产亚洲二区| 国产精品久久电影中文字幕| 久久韩国三级中文字幕| 亚洲aⅴ乱码一区二区在线播放| 能在线免费看毛片的网站| 国内精品宾馆在线| 午夜激情欧美在线| 国产日本99.免费观看| 高清毛片免费观看视频网站| 听说在线观看完整版免费高清| 国产真实伦视频高清在线观看| 夫妻性生交免费视频一级片| 两性午夜刺激爽爽歪歪视频在线观看| 日日摸夜夜添夜夜添av毛片| 免费看av在线观看网站| 精品一区二区三区视频在线| 夜夜爽天天搞| 高清毛片免费观看视频网站| 久久婷婷人人爽人人干人人爱| 小蜜桃在线观看免费完整版高清| 高清毛片免费看| 国产麻豆成人av免费视频| 成人鲁丝片一二三区免费| 一级黄片播放器| 久久久久久久久久久丰满| 亚洲欧美日韩东京热| 成人亚洲欧美一区二区av| 国产av在哪里看| 亚洲精品色激情综合| 成人午夜高清在线视频| 给我免费播放毛片高清在线观看| 亚洲精品456在线播放app| 国产av一区在线观看免费| 别揉我奶头 嗯啊视频| 亚洲第一电影网av| 日韩视频在线欧美| 国产精品一区二区三区四区免费观看| 2022亚洲国产成人精品| 亚洲自偷自拍三级| 日本免费a在线| 国产人妻一区二区三区在| 老女人水多毛片| 中国美白少妇内射xxxbb| 熟女电影av网| 国产不卡一卡二| 色综合亚洲欧美另类图片| 黄色视频,在线免费观看| 亚洲四区av| 国内久久婷婷六月综合欲色啪| 日韩成人伦理影院| 边亲边吃奶的免费视频| 国产高清激情床上av| 亚洲最大成人av| 亚洲四区av| 国产一级毛片在线| 日日摸夜夜添夜夜添av毛片| 久久久午夜欧美精品| 哪里可以看免费的av片| 一本久久中文字幕| 啦啦啦啦在线视频资源| 国产av一区在线观看免费| 国产精品野战在线观看| 大又大粗又爽又黄少妇毛片口| 五月玫瑰六月丁香| 国产精品综合久久久久久久免费| 全区人妻精品视频| 久久久久久久久久久免费av| 在线a可以看的网站| 日日摸夜夜添夜夜添av毛片| 欧美日韩国产亚洲二区| 伊人久久精品亚洲午夜| 又爽又黄a免费视频| 真实男女啪啪啪动态图| 国产av一区在线观看免费| 国产大屁股一区二区在线视频| 久久精品国产99精品国产亚洲性色| 亚洲真实伦在线观看| 欧美最黄视频在线播放免费| 亚洲av二区三区四区| 日本免费一区二区三区高清不卡| 中文字幕av成人在线电影| av免费观看日本| 亚洲av男天堂| 免费观看人在逋| 能在线免费看毛片的网站| 午夜激情欧美在线| 高清在线视频一区二区三区 | 校园人妻丝袜中文字幕| 麻豆国产av国片精品| 在线播放国产精品三级| 亚洲精品自拍成人| 一个人观看的视频www高清免费观看| 中文在线观看免费www的网站| 亚洲一区二区三区色噜噜| 欧美性猛交黑人性爽| 国产成人aa在线观看| 国产精品一区www在线观看| 国产熟女欧美一区二区| 国产在线男女| 国产精品野战在线观看| 久久人妻av系列| 国产精品野战在线观看| 在线观看免费视频日本深夜| 中文欧美无线码| 丰满乱子伦码专区| 99久久精品国产国产毛片| 黄色欧美视频在线观看| 哪个播放器可以免费观看大片| 我要搜黄色片| 免费观看的影片在线观看| 男人和女人高潮做爰伦理| 在现免费观看毛片| 日韩亚洲欧美综合| 日本撒尿小便嘘嘘汇集6| 51国产日韩欧美| 插阴视频在线观看视频| 午夜激情福利司机影院| 一卡2卡三卡四卡精品乱码亚洲| 97热精品久久久久久| 久久6这里有精品| 久久久久久久午夜电影| 国产一区二区激情短视频| 美女内射精品一级片tv| 联通29元200g的流量卡| 精华霜和精华液先用哪个| 能在线免费看毛片的网站| 99久久精品一区二区三区| 日韩欧美精品v在线| 午夜福利在线观看吧| 国产成人a区在线观看| kizo精华| 波多野结衣巨乳人妻| av在线亚洲专区| 麻豆一二三区av精品| 熟妇人妻久久中文字幕3abv| 男的添女的下面高潮视频| 久久久久久久久久黄片| 天天躁日日操中文字幕| 日本撒尿小便嘘嘘汇集6| 国产探花极品一区二区| 哪里可以看免费的av片| 国产精品永久免费网站| 22中文网久久字幕| 亚洲aⅴ乱码一区二区在线播放| 精品久久久噜噜| 人人妻人人澡欧美一区二区| 国产亚洲精品久久久com| 中文资源天堂在线| 久久精品影院6| 成人二区视频| 国产精品综合久久久久久久免费| 一区二区三区免费毛片| 国产伦一二天堂av在线观看| 国产黄a三级三级三级人| 久久久国产成人精品二区| 国产精品一区二区三区四区免费观看| or卡值多少钱| 亚洲欧美日韩高清在线视频| 日韩精品有码人妻一区| 久久久久性生活片| 全区人妻精品视频| 我要搜黄色片| 精品久久久久久久人妻蜜臀av| 国内揄拍国产精品人妻在线| 国产片特级美女逼逼视频| 免费看光身美女| 波多野结衣高清作品| 嘟嘟电影网在线观看| 欧美三级亚洲精品| 欧美成人a在线观看| 美女被艹到高潮喷水动态| 久久国产乱子免费精品| 亚洲成人久久爱视频| 白带黄色成豆腐渣| 偷拍熟女少妇极品色| 中文在线观看免费www的网站| 日韩欧美 国产精品| 黑人高潮一二区| 狠狠狠狠99中文字幕| 乱系列少妇在线播放| 亚洲一区高清亚洲精品| 直男gayav资源| 免费一级毛片在线播放高清视频| 久久亚洲国产成人精品v| 12—13女人毛片做爰片一| 最好的美女福利视频网| 黄片wwwwww| 97在线视频观看| 日本欧美国产在线视频| 国产综合懂色| 99视频精品全部免费 在线| 菩萨蛮人人尽说江南好唐韦庄 | 九九热线精品视视频播放| 亚洲图色成人| 免费看a级黄色片| 插阴视频在线观看视频| 国产伦一二天堂av在线观看| 国国产精品蜜臀av免费| 久久久久久久久久久丰满| 晚上一个人看的免费电影| 人体艺术视频欧美日本| 日日摸夜夜添夜夜爱| 看片在线看免费视频| 久久精品国产亚洲av香蕉五月| 狂野欧美白嫩少妇大欣赏| 精品不卡国产一区二区三区| 国产黄片视频在线免费观看| 免费av观看视频| 久久中文看片网| 国产精品久久久久久久久免| 最好的美女福利视频网| 美女 人体艺术 gogo| 日本成人三级电影网站| 亚洲欧美日韩卡通动漫| av在线亚洲专区| 亚洲av成人av| 亚洲精品乱码久久久v下载方式| 久久精品人妻少妇| 1024手机看黄色片| 成人亚洲欧美一区二区av| 青青草视频在线视频观看| 欧美一级a爱片免费观看看| www日本黄色视频网| 国产精品一区www在线观看| 亚洲成人av在线免费| 欧美性感艳星| 赤兔流量卡办理| 97超视频在线观看视频| 国产在视频线在精品| 91av网一区二区| 国产真实乱freesex| 一个人看的www免费观看视频| 欧美性猛交╳xxx乱大交人| 啦啦啦观看免费观看视频高清| 草草在线视频免费看| 久久精品国产亚洲网站| 91久久精品电影网| 1024手机看黄色片| 小说图片视频综合网站| 18禁在线无遮挡免费观看视频| 欧美日韩国产亚洲二区| 最近视频中文字幕2019在线8| 日韩大尺度精品在线看网址| 久久中文看片网| 一卡2卡三卡四卡精品乱码亚洲| 神马国产精品三级电影在线观看| 乱系列少妇在线播放| 美女脱内裤让男人舔精品视频 | 久久久欧美国产精品| 亚洲一级一片aⅴ在线观看| 性欧美人与动物交配| 岛国毛片在线播放| 少妇被粗大猛烈的视频| 床上黄色一级片| 春色校园在线视频观看| 亚洲图色成人| 亚洲欧美日韩东京热| 久久99蜜桃精品久久| 国产亚洲91精品色在线| 能在线免费看毛片的网站| 成年免费大片在线观看| 日本黄色片子视频| 国产日韩欧美在线精品| 国产精品一区二区三区四区免费观看| 亚洲一区二区三区色噜噜| 丰满的人妻完整版| 99国产精品一区二区蜜桃av| 99久久人妻综合| 麻豆久久精品国产亚洲av| 久久久久久大精品| 亚洲av电影不卡..在线观看| 男人舔奶头视频| 久久九九热精品免费| 一级黄色大片毛片| 欧美xxxx黑人xx丫x性爽| 天天一区二区日本电影三级| 亚洲七黄色美女视频| 欧美高清成人免费视频www| 国产国拍精品亚洲av在线观看| 又爽又黄a免费视频| 亚洲精品日韩av片在线观看| 能在线免费看毛片的网站| 老师上课跳d突然被开到最大视频| www.av在线官网国产| 国产午夜精品久久久久久一区二区三区| 97超视频在线观看视频| 久久午夜福利片| 久久人妻av系列| 天天躁夜夜躁狠狠久久av| 久久久精品欧美日韩精品| 欧美丝袜亚洲另类| 网址你懂的国产日韩在线| 长腿黑丝高跟| 国内精品久久久久精免费| 99热网站在线观看| 亚洲精品乱码久久久v下载方式| 91av网一区二区| 春色校园在线视频观看| 高清午夜精品一区二区三区 | 成人亚洲欧美一区二区av| 91久久精品国产一区二区成人| 伦精品一区二区三区| 久久久精品94久久精品| 日韩在线高清观看一区二区三区| or卡值多少钱| 色5月婷婷丁香| 国产一区二区三区在线臀色熟女| 91精品一卡2卡3卡4卡| 国产一区二区在线av高清观看| 成人美女网站在线观看视频| 国产亚洲91精品色在线| 亚洲av成人精品一区久久| 91麻豆精品激情在线观看国产| 九九爱精品视频在线观看| 国产不卡一卡二| 99久国产av精品| 此物有八面人人有两片| 少妇人妻精品综合一区二区 | 99riav亚洲国产免费| 国产精品1区2区在线观看.| 国产高清有码在线观看视频| 不卡视频在线观看欧美| 两个人视频免费观看高清| 特级一级黄色大片| 免费大片18禁| 国产伦一二天堂av在线观看| 亚洲七黄色美女视频| 内射极品少妇av片p| a级毛片免费高清观看在线播放| 午夜激情欧美在线| 色5月婷婷丁香| 婷婷色综合大香蕉| videossex国产| 久久精品国产鲁丝片午夜精品| 欧美最新免费一区二区三区| 国产不卡一卡二| 一区二区三区四区激情视频 | 亚洲av中文av极速乱| 亚洲国产欧洲综合997久久,| 一区二区三区四区激情视频 | 国产精品一及| 一本精品99久久精品77| av又黄又爽大尺度在线免费看 | 国产伦理片在线播放av一区 | 国产色婷婷99| 国产男人的电影天堂91| 国产在线男女| 18禁在线播放成人免费| 欧美+日韩+精品| 深爱激情五月婷婷| 国产精品99久久久久久久久| 一个人免费在线观看电影| 亚洲无线观看免费| 日本爱情动作片www.在线观看| 久久鲁丝午夜福利片| 亚洲欧美日韩卡通动漫| 白带黄色成豆腐渣| 18禁裸乳无遮挡免费网站照片| 国产熟女欧美一区二区| 在线免费十八禁| 亚洲七黄色美女视频| 欧美高清成人免费视频www| 嫩草影院精品99| 亚洲无线观看免费| 69av精品久久久久久| 大香蕉久久网| 国产精品女同一区二区软件| 欧美高清成人免费视频www| 青春草亚洲视频在线观看| 亚洲,欧美,日韩| 69人妻影院| 国语自产精品视频在线第100页| 亚洲高清免费不卡视频| 国产一级毛片七仙女欲春2| 美女cb高潮喷水在线观看| 全区人妻精品视频| 好男人在线观看高清免费视频| 精品一区二区三区人妻视频| 午夜激情福利司机影院| 日韩欧美精品v在线| 精品日产1卡2卡| 久久精品国产亚洲av香蕉五月| 精品久久久久久久久久久久久| 免费不卡的大黄色大毛片视频在线观看 | 色吧在线观看| 精品久久久噜噜| 精品久久国产蜜桃| 欧美日韩国产亚洲二区| 女人十人毛片免费观看3o分钟| 婷婷精品国产亚洲av| 最近手机中文字幕大全| 人妻夜夜爽99麻豆av| 国产麻豆成人av免费视频| 人人妻人人澡欧美一区二区| 欧美另类亚洲清纯唯美| 99热网站在线观看| 国产欧美日韩精品一区二区| 美女xxoo啪啪120秒动态图| 一个人看视频在线观看www免费| 亚洲av第一区精品v没综合| 国产精品国产高清国产av| 午夜福利在线观看吧| 国产极品精品免费视频能看的| 99在线视频只有这里精品首页| 亚洲精品日韩在线中文字幕 | 国产蜜桃级精品一区二区三区| 内地一区二区视频在线| 国产精品福利在线免费观看| 国产精华一区二区三区| 日韩欧美在线乱码| 中文欧美无线码| videossex国产| a级一级毛片免费在线观看| 亚洲精品日韩av片在线观看| 好男人视频免费观看在线| 久久久欧美国产精品| 热99在线观看视频| 久久久色成人| 91狼人影院| 波多野结衣高清作品| 老司机福利观看| 色哟哟哟哟哟哟| 真实男女啪啪啪动态图| 大型黄色视频在线免费观看| 亚洲国产精品成人综合色| 99热这里只有是精品50| 亚洲欧美精品专区久久| 亚洲四区av| 成人特级黄色片久久久久久久| 亚洲精品久久国产高清桃花| 午夜福利高清视频| 欧美3d第一页| 美女国产视频在线观看| 麻豆一二三区av精品| 综合色丁香网| 在线观看66精品国产| 日韩亚洲欧美综合| 人人妻人人澡欧美一区二区| 亚洲国产精品国产精品| 麻豆国产97在线/欧美| 日日摸夜夜添夜夜添av毛片| 亚洲婷婷狠狠爱综合网| 国产免费一级a男人的天堂| 99热全是精品| avwww免费| 亚洲在线自拍视频| 亚洲精品国产成人久久av| 日韩国内少妇激情av| 一级毛片我不卡| 天天躁夜夜躁狠狠久久av| 免费看日本二区| av免费在线看不卡| 国产综合懂色| 国产精品av视频在线免费观看| 欧美色欧美亚洲另类二区| 不卡一级毛片| 欧美zozozo另类| 在线国产一区二区在线| 国产精品久久久久久精品电影| 桃色一区二区三区在线观看| 精品人妻视频免费看| 亚洲国产精品国产精品| 久久久久久久午夜电影| 白带黄色成豆腐渣| 男人和女人高潮做爰伦理| av在线观看视频网站免费| 蜜桃久久精品国产亚洲av| 国产亚洲91精品色在线| 免费看光身美女| 99久久精品国产国产毛片| 午夜福利在线在线| 直男gayav资源| 亚洲国产欧美人成| 九草在线视频观看| 老司机影院成人| av天堂在线播放| 国产精品永久免费网站| 综合色av麻豆| av天堂中文字幕网| 午夜爱爱视频在线播放| 亚洲欧美日韩无卡精品| 又黄又爽又刺激的免费视频.| 欧美性感艳星| 国产精品久久久久久久电影| 日本黄色片子视频| 丰满人妻一区二区三区视频av| 看黄色毛片网站| 性插视频无遮挡在线免费观看| 91久久精品电影网| 精品久久久久久成人av| 亚洲欧洲日产国产| 三级经典国产精品| 国产麻豆成人av免费视频| 男人舔女人下体高潮全视频| 国产伦精品一区二区三区四那| 成人午夜高清在线视频| 12—13女人毛片做爰片一| 欧美3d第一页| 久久精品国产清高在天天线| 中国美白少妇内射xxxbb| 日韩高清综合在线| 久久人人精品亚洲av| 观看免费一级毛片| 青青草视频在线视频观看| 亚洲国产高清在线一区二区三| 麻豆av噜噜一区二区三区| 国产成人91sexporn| 成人午夜精彩视频在线观看| 精品久久久久久久末码| 神马国产精品三级电影在线观看| 高清在线视频一区二区三区 | 内射极品少妇av片p| 亚洲最大成人av| 亚洲国产日韩欧美精品在线观看| 欧美性猛交黑人性爽| 午夜视频国产福利| 久久久久久国产a免费观看| 免费人成在线观看视频色| 久久精品影院6| 中文在线观看免费www的网站| 高清日韩中文字幕在线| 在线播放国产精品三级| 国产精品av视频在线免费观看| 晚上一个人看的免费电影| 亚洲欧美精品专区久久| 人妻系列 视频| 久久人人精品亚洲av| 国产一级毛片在线| 国内揄拍国产精品人妻在线| 中文字幕人妻熟人妻熟丝袜美| 黑人高潮一二区| 啦啦啦韩国在线观看视频| 久久久久久大精品| 内射极品少妇av片p| 亚洲精品久久国产高清桃花| 久久99蜜桃精品久久| 国产成人a区在线观看| 狠狠狠狠99中文字幕| 欧美精品一区二区大全| 国产久久久一区二区三区| 丰满乱子伦码专区| 国产老妇女一区| 一级av片app| 九色成人免费人妻av| 波野结衣二区三区在线| 日本撒尿小便嘘嘘汇集6| 五月玫瑰六月丁香| 少妇高潮的动态图| 久久精品国产亚洲网站| 99热只有精品国产| 欧美激情国产日韩精品一区| 国产淫片久久久久久久久| 男女下面进入的视频免费午夜| 少妇的逼水好多| 午夜免费激情av| 五月伊人婷婷丁香| 波多野结衣巨乳人妻| 男人的好看免费观看在线视频| av免费观看日本| 赤兔流量卡办理| 亚洲精品国产av成人精品| 美女大奶头视频| 天堂av国产一区二区熟女人妻| 久久午夜福利片| 欧美日韩在线观看h| 我要搜黄色片| 我的老师免费观看完整版| 别揉我奶头 嗯啊视频| 18禁在线播放成人免费| 国产高潮美女av| 国产av一区在线观看免费| 国产黄色小视频在线观看| 人妻夜夜爽99麻豆av| 99久久成人亚洲精品观看| 日本免费a在线| 大型黄色视频在线免费观看| 国产大屁股一区二区在线视频| 亚洲欧美日韩卡通动漫| 午夜福利在线在线|