• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于密度最大值的K—means初始聚類中心點算法改進

      2018-01-11 14:01:52劉闖陳桂芬
      關(guān)鍵詞:可靠性聚類穩(wěn)定性

      劉闖+陳桂芬

      摘要:聚類分析是機器學(xué)習(xí)中重要的方法,傳統(tǒng)的K-means算法對于聚類的初始中心點的選擇具有隨機性,這就造成不同的選擇產(chǎn)生不同的聚類結(jié)果。針對這一問題,提出一種基于密度最大值的優(yōu)化初始聚類中心選取算法。試驗結(jié)果顯示,改進后的算法與傳統(tǒng)算法相比具有較高的穩(wěn)定性和可靠性。

      關(guān)鍵詞:聚類;穩(wěn)定性;局部密度;可靠性

      中圖分類號:TP393 文獻標識碼:A 文章編號:1007-9416(2017)11-0118-02

      1 引言

      聚類算法是數(shù)據(jù)挖掘中一種重要的算法,K-means聚類算法思路簡單,聚類快速。但是,其缺點也是十分明顯,易受噪聲影響,容易陷入局部最優(yōu)解。為解決傳統(tǒng)K-means聚類算法問題,很多學(xué)者從不同角度提出改進算法。文獻[1]根據(jù)密度和平均距離完成聚類中心的優(yōu)化,文獻[2]選擇相互距離最遠的K個處于高密度區(qū)域的點作為中心。文獻[3]選擇平均密度優(yōu)化初始聚類中心。綜合各個改進思想,提出基于密度最大值初始聚類中心的K-means算法。

      4 仿真實驗分析

      為驗證改進算法的有效性,采用國際上的專門用來測試機器學(xué)習(xí)算法的UCI數(shù)據(jù)集中Iris、Wine、Soybean這三組數(shù)據(jù)進行測試。Iris數(shù)據(jù)有950條數(shù)據(jù),每個數(shù)據(jù)對象有4個屬性,分三類;Wine數(shù)據(jù)750條數(shù)據(jù),每個數(shù)據(jù)13屬性,分三類;Soybean數(shù)據(jù)500條,每個數(shù)據(jù)對象35個屬性,分7類。測試實驗結(jié)果如表1,表2所示。

      由表1,表2實驗對比結(jié)果可知改進后算法在迭代次數(shù),平方誤差,測試時間,準確率等方面對比傳統(tǒng)K-means算法,由表可知,改進后算法準確率明顯高于其他兩種算法。

      5 結(jié)語

      對于提出基于密度最大值初始化聚類中心的K-means算法,通過實驗對比表明,算法迭代次數(shù)和聚類所需時間減小,準確率提高。

      參考文獻

      [1]王浩,黃越.基于距離測度學(xué)習(xí)的AP聚類圖像標注[J].計算機工程與應(yīng)用,2016:43-46.

      [2]孫士保,秦克云.改進的k-平均聚類算法研究[J].計算機工程,2014:57-62.

      [3]邢長征.基于平均密度優(yōu)化初始聚類中心的K-means算法[J].計算機應(yīng)用工程,2014:56-59.

      [4]Han Jiawei.Data mining:concepts and techniques[M].San Francisco:Morgan Kaufmann Publishers,2014:32-35.

      Abstract:Clustering analysis is an important method in machine learning. The traditional K-means clustering algorithm has randomness to the initial central point of clustering, which leads to different choices to produce different clustering results. In response to this problem, an optimal initial clustering center selection algorithm based on maximum density is proposed. Compared with the standard data UCI, the experiment shows that the improved algorithm has higher stability and reliability than the traditional algorithm.

      Key Words:Clustering;stability;local density;reliabilityendprint

      猜你喜歡
      可靠性聚類穩(wěn)定性
      可靠性管理體系創(chuàng)建與實踐
      非線性中立型變延遲微分方程的長時間穩(wěn)定性
      基于DBSACN聚類算法的XML文檔聚類
      電子測試(2017年15期)2017-12-18 07:19:27
      電子制作(2017年2期)2017-05-17 03:55:06
      半動力系統(tǒng)中閉集的穩(wěn)定性和極限集映射的連續(xù)性
      基于改進的遺傳算法的模糊聚類算法
      基于可靠性跟蹤的薄弱環(huán)節(jié)辨識方法在省級電網(wǎng)可靠性改善中的應(yīng)用研究
      電測與儀表(2015年6期)2015-04-09 12:01:18
      一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
      可靠性比一次采購成本更重要
      風(fēng)能(2015年9期)2015-02-27 10:15:24
      自適應(yīng)確定K-means算法的聚類數(shù):以遙感圖像聚類為例
      隆子县| 黄大仙区| 齐齐哈尔市| 邯郸县| 行唐县| 吕梁市| 柳河县| 厦门市| 三亚市| 黔西| 青浦区| 马尔康县| 理塘县| 米易县| 东乡县| 高要市| 花垣县| 措勤县| 定远县| 西贡区| 建水县| 无棣县| 成都市| 如皋市| 尼木县| 宽甸| 任丘市| 奈曼旗| 高陵县| 七台河市| 泊头市| 从江县| 比如县| 故城县| 灌南县| 太仓市| 汨罗市| 高淳县| 三江| 镇坪县| 伊吾县|