• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于Spark框架的高效KNN中文文本分類算法

      2017-01-13 20:13:00于蘋蘋倪建成姚彬修李淋淋曹博
      計(jì)算機(jī)應(yīng)用 2016年12期
      關(guān)鍵詞:分類號(hào)框架聚類

      于蘋蘋+倪建成+姚彬修+李淋淋+曹博

      摘 要:針對(duì)K-最近鄰(KNN)分類算法時(shí)間復(fù)雜度與訓(xùn)練樣本數(shù)量成正比而導(dǎo)致的計(jì)算量大的問題以及當(dāng)前大數(shù)據(jù)背景下面臨的傳統(tǒng)架構(gòu)處理速度慢的問題,提出了一種基于Spark框架與聚類優(yōu)化的高效KNN分類算法。該算法首先利用引入收縮因子的優(yōu)化K-medoids聚類算法對(duì)訓(xùn)練集進(jìn)行兩次裁剪;然后在分類過程中迭代K值獲得分類結(jié)果,并在計(jì)算過程中結(jié)合Spark計(jì)算框架對(duì)數(shù)據(jù)進(jìn)行分區(qū)迭代實(shí)現(xiàn)并行化。實(shí)驗(yàn)結(jié)果表明,在不同數(shù)據(jù)集中傳統(tǒng)K-最近鄰算法、基于K-medoids的K-最近鄰算法所耗費(fèi)時(shí)間是所提Spark框架下的K-最近鄰算法的一個(gè)范圍3.92~31.90倍,所提算法具有較高的計(jì)算效率,相較于Hadoop平臺(tái)有較好的加速比,可有效地對(duì)大數(shù)據(jù)進(jìn)行分類處理。

      關(guān)鍵詞:K-最近鄰;聚類;收縮因子;K-medoids;Spark;并行化計(jì)算

      中圖分類號(hào): TP391.1

      文獻(xiàn)標(biāo)志碼:A

      文章編號(hào):1001-9081(2016)12-3292-06

      猜你喜歡
      分類號(hào)框架聚類
      框架
      廣義框架的不相交性
      基于DBSACN聚類算法的XML文檔聚類
      電子測試(2017年15期)2017-12-18 07:19:27
      WTO框架下
      法大研究生(2017年1期)2017-04-10 08:55:06
      A Study on the Change and Developmentof English Vocabulary
      基于改進(jìn)的遺傳算法的模糊聚類算法
      一種基于OpenStack的云應(yīng)用開發(fā)框架
      Translation on Deixis in English and Chinese
      一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
      The law of exercise applies on individual behavior change development
      霞浦县| 佛教| 泗阳县| 凤山县| 汉阴县| 巴林左旗| 佛教| 延庆县| 巴林左旗| 沂源县| 冕宁县| 安多县| 定边县| 贺兰县| 横峰县| 兴仁县| 铜川市| 桃源县| 柯坪县| 北流市| 万源市| 井陉县| 长沙县| 滦南县| 木兰县| 盐池县| 柞水县| 松溪县| 大城县| 通道| 阿鲁科尔沁旗| 广德县| 谷城县| 阜宁县| 贵溪市| 营山县| 来宾市| 航空| 西贡区| 雷山县| 阳东县|