• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于劃分的聚類算法研究與應(yīng)用

      2017-07-14 14:28:12何宇
      電腦知識與技術(shù) 2017年16期
      關(guān)鍵詞:聚類算法研究與應(yīng)用

      何宇

      摘要:隨著數(shù)學(xué)、計算機科學(xué)以及統(tǒng)計學(xué)、生物學(xué)等的快速發(fā)展,促進(jìn)了聚類算法的產(chǎn)生。聚類分析在數(shù)據(jù)的處理和分析當(dāng)中有著舉足輕重的作用,并且被廣泛應(yīng)用到多個領(lǐng)域,介于此人們發(fā)明出了聚類算法。這些算法可以被分為以劃分方法為代表的多種多樣的處理方法。今天我們著重來探討一下基于劃分的聚類算法的研究與應(yīng)用。

      關(guān)鍵詞:劃分方法;聚類算法;研究與應(yīng)用

      隨著我國的數(shù)學(xué)、計算機科學(xué)以及經(jīng)濟(jì)學(xué)學(xué)科的快速發(fā)展,聚類算法得到廣泛使用,加快了數(shù)據(jù)處理與分析的速度,很大程度上促進(jìn)了這些學(xué)科的發(fā)展。而且聚類算法的應(yīng)用領(lǐng)域已經(jīng)涉及生活和生產(chǎn)的方方面面,它是將物理或抽象對象的集合分組為由類似的對象組成的多個類的分析過程。這有很多具體應(yīng)用的實例,比如說在商業(yè)方面,聚類分析方法可以幫助銷售工作者找到不同的客戶群,并且通過聚類分析中特定的模式來展現(xiàn)客戶群的差異性。實際出真知,聚類分析方法對于市場的整體分析和數(shù)據(jù)處理等有著極其重要的作用,而且可以根據(jù)對客戶群特點的分析準(zhǔn)確把握客戶的消費心理,這樣一來能夠促使廠商發(fā)現(xiàn)新的商機,開發(fā)新型的產(chǎn)業(yè)和地區(qū)市場,并且能夠?qū)⑦@些信息整合起來;在保險行業(yè),聚類分析的應(yīng)用更是在很大程度上解放的人力,很多數(shù)據(jù)的收集、處理變得極其方便,主要是根據(jù)地區(qū)的保險業(yè)的平均水平來劃分的,以平均值為劃分的界限,再結(jié)合局部地區(qū)的經(jīng)濟(jì)發(fā)展速度、人均工資水平以及對保險業(yè)的態(tài)度和購買程度進(jìn)行分組;再者便是在近些年來最為流行的貿(mào)易方式——電子商務(wù)。電子商務(wù)顧名思義用的就是計算機,其本身在數(shù)據(jù)處理上就占有一定的優(yōu)勢,利用聚類分析的方法使得電子商務(wù)中的交易數(shù)據(jù)和人群劃分更加明顯,交易人群特點的掌握有利于電商事業(yè)的發(fā)展,也為更近一步的商務(wù)交流提供了建設(shè)性的意見。

      1劃分方法的基本概念及其常用的方法

      劃分方法(PAM:Partitioning method)的定義是首先創(chuàng)建k個劃分,k為要創(chuàng)建的劃分個數(shù)。常用的劃分方法有:k-means,k-medics,CLARA(Clustering Large Application),CLARANS(Clus-tering Large Application based upon Randomized Searchl.FCM。其中以k-means的使用最為普通,嚴(yán)格來說k--means屬于非層次聚類法的一種,下面我們來看一下它的整個執(zhí)行過程,一共分為兩個部分,分別是初始化,循環(huán)。所謂初始化就是指選擇或是人為指定某些記錄作為凝聚點,但是要注意的一點就是按就近原則進(jìn)行初始化的選擇,而且要注意記錄中心的數(shù)據(jù),最后根據(jù)記錄數(shù)據(jù)重新進(jìn)行這一過程。一直不斷地重復(fù)這一過程,直到凝聚點位置收斂為止。這種方法一般具有節(jié)省運算時間等特點。

      2具體的運算過程

      2.1數(shù)據(jù)預(yù)處理

      數(shù)據(jù)預(yù)處理是指我們在對數(shù)據(jù)進(jìn)行正式的處理之前,要先對數(shù)據(jù)的整體進(jìn)行一下估量,主要從數(shù)據(jù)的數(shù)量、范圍、程度和既定標(biāo)準(zhǔn)這幾方面入手,進(jìn)行規(guī)劃分類和簡單的預(yù)測分析,然后再就每一個方面對整體數(shù)據(jù)的影響進(jìn)行估量式判斷,建立起一個預(yù)測模式。當(dāng)然在我們有了明確的數(shù)據(jù)處理和分析結(jié)果時要將這一預(yù)測模式清楚,避免結(jié)果混淆。

      2.2定義距離函數(shù)

      聚類的產(chǎn)生是由于多個領(lǐng)域和數(shù)據(jù)之間存在著相似性,正是由于事物之間相似性的存在,才促生了聚類的算法。但是這些相似性的存在也極容易造成事物之間的混淆。所以給這些數(shù)據(jù)設(shè)置一個定義函數(shù)是非常有必要的。函數(shù)的設(shè)置是為了避免誤差,所以在設(shè)置相似距離時一定要把握好度量,保持?jǐn)?shù)據(jù)點之間的平衡,從而保證整個運算過程的準(zhǔn)確性。

      2.3聚類或分組

      數(shù)據(jù)對象的分類要根據(jù)數(shù)據(jù)的特點、適應(yīng)的環(huán)境或是發(fā)揮的作用等來進(jìn)行分類,而且由于分類時采用的方法不同或是人為因素的干擾,總會產(chǎn)生不同的數(shù)據(jù)分組。劃分方法一般從初始劃分和最優(yōu)化一個聚類標(biāo)準(zhǔn)開始。Crisp Clustering,它的每一個數(shù)據(jù)都屬于單獨的類;Fuzzy Clustering,它的每個數(shù)據(jù)可能在任何一個類中,Crisp Clustering和Fuzzy Clustering是劃分方法的兩個主要技術(shù),劃分方法聚類方法具有自身的法則優(yōu)勢,它可以找到在不同的分類組之間的相似性,甚至可以分析出在同一組內(nèi)分類數(shù)據(jù)之間存在的差異性,我們常說數(shù)據(jù)的處理和分析要科學(xué),要辯證的看到事物的兩面性。這種方法本身就是一種辯證的方法,所以用它來分析和處理數(shù)據(jù)最合適不過了。

      3聚類方法的主要應(yīng)用研究

      聚類算法在實際應(yīng)用過程中涉及多個行業(yè)發(fā)展。從商業(yè)、生物、地理、保險行業(yè)、因特網(wǎng)行業(yè)以及電子商務(wù)行業(yè)等都所有涉獵。

      3.1商業(yè)

      在商業(yè)市場的發(fā)展過程中,往往對于市場未知風(fēng)險的預(yù)測是企業(yè)可持續(xù)發(fā)展的一個重要問題。如果企業(yè)能夠有效的預(yù)測未來的市場風(fēng)險,探究潛在的消費者動向,那么往往能夠取得顯著的利益。因此在當(dāng)前階段,聚類算法能夠為企業(yè)研究消費者行為、探究潛在市場發(fā)展、選擇實驗室市場等奠定堅實的理論數(shù)據(jù)基礎(chǔ)。

      3.2生物

      在生物行業(yè)發(fā)展過程中,由于現(xiàn)代化科學(xué)技術(shù)的發(fā)展,在進(jìn)行生物學(xué)的研究過程中,基因數(shù)據(jù)庫的容量大大提升,通過聚類算法能夠有效的根據(jù)基因數(shù)據(jù)庫的特點進(jìn)行劃分,使人們能夠?qū)ΨN群的固有特征有顯著的認(rèn)識。

      3.3保險行業(yè)

      當(dāng)前世界保險行業(yè)發(fā)展速度較快,而不同的行業(yè)所需要的保險種類略有區(qū)別。聚類算法能夠根據(jù)不同的行業(yè)發(fā)展類型,制定相應(yīng)的保險措施,為保險更好地發(fā)揮作用效果奠定基礎(chǔ)。

      3.4因特網(wǎng)及電子商務(wù)

      當(dāng)前階段,電子文庫的發(fā)展規(guī)模逐漸擴大,聚類算法電子文庫的信息修復(fù)以及信息分類上發(fā)揮了顯著的作用效果。在進(jìn)行信息特征搜索的過程中,聚類算法能夠根據(jù)相應(yīng)的關(guān)鍵詞檢測整篇文章,大大降低了工作量。

      其次當(dāng)前物聯(lián)網(wǎng)時代的到來,物聯(lián)網(wǎng)對人們的影響愈加擴大。而通過聚類算法的數(shù)據(jù)分析和統(tǒng)計等,能夠在最短的時間內(nèi)根據(jù)消費者的消費記錄以及瀏覽行為確定消費者特征,為電子商務(wù)的更好更快發(fā)展提供有效的保障。

      4總結(jié)

      通過對聚類算法的研究和分析,我們清楚地了解了劃分方法的原理以及其作用機制。加深了對劃分方法的理解,也為聚類算法在更多領(lǐng)域的應(yīng)用提供了完備的理論支持,與此同時也促進(jìn)了聚類算法自身知識和體系的進(jìn)一步完善和發(fā)展。最后,通過對目前階段聚類算法的實際應(yīng)用分析發(fā)現(xiàn),其對于我們生活方式產(chǎn)生了極大的影響,其已經(jīng)滲透到了人們生活的方方面面。

      猜你喜歡
      聚類算法研究與應(yīng)用
      馬鈴薯中耕施肥機的研究與應(yīng)用
      數(shù)據(jù)挖掘算法性能優(yōu)化的研究與應(yīng)用
      K—Means聚類算法在MapReduce框架下的實現(xiàn)
      基于K?均值與AGNES聚類算法的校園網(wǎng)行為分析系統(tǒng)研究
      綜采工作面瓦斯綜合治理的研究與應(yīng)用
      基于改進(jìn)的K_means算法在圖像分割中的應(yīng)用
      復(fù)雜落物打撈工具的研究與應(yīng)用
      特厚表土層巖移沉降規(guī)律研究及應(yīng)用
      大規(guī)模風(fēng)電場集中接入對電力系統(tǒng)小干擾穩(wěn)定的影響分析
      科技視界(2016年8期)2016-04-05 18:39:39
      大數(shù)據(jù)時代的數(shù)據(jù)挖掘技術(shù)探究
      常宁市| 清河县| 中山市| 全南县| 眉山市| 正镶白旗| 海口市| 化州市| 日照市| 高雄市| 石河子市| 双牌县| 武清区| 郁南县| 东丽区| 那坡县| 寿宁县| 高阳县| 洪湖市| 墨竹工卡县| 建湖县| 西吉县| 兴安盟| 泰和县| 吐鲁番市| 桃江县| 邯郸市| 卢龙县| 和田市| 鹤峰县| 乌鲁木齐县| 葵青区| 汉沽区| 琼中| 邵阳县| 文成县| 宁陵县| 滦平县| 雷山县| 昌黎县| 原平市|