• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于二進制蜉蝣優(yōu)化的特征選擇及文本聚類算法

    2023-05-21 04:02:44高新成周中雨王莉利邵國銘
    吉林大學學報(理學版) 2023年3期
    關(guān)鍵詞:蜉蝣二進制特征選擇

    高新成,周中雨,王莉利,邵國銘,張 強

    (1.東北石油大學 現(xiàn)代教育技術(shù)中心,黑龍江 大慶 163318; 2.東北石油大學 計算機與信息技術(shù)學院,黑龍江 大慶 163318)

    0 引 言

    文本聚類是將給定對象的集合劃分為不同子集的過程,目標是使每個子集內(nèi)部的元素盡量相似,不同子集間的元素盡量迥異,其在文本挖掘中應用廣泛.空間矢量模型VSM(vector space model)是文本數(shù)據(jù)挖掘的常用模型,其通過把詞條變成一維空間向量便于進行空間向量計算.因此,聚類效果主要受特征維度[1]大小和冗余特征的影響,文本特征中存在冗余特征,無監(jiān)督特征選擇是選取非冗余特征,使聚類效果得到明顯提升.

    傳統(tǒng)的特征選擇方式有文檔頻率DF、互信息MI、卡方檢驗CHI和信息增益,這些方式均存在局限性且特征選擇后的精度較低問題.目前特征選擇的目標有兩個: 一是基于特征選擇后聚類效果得到提升; 二是如何獲得最多有用的文本特征[2-3].因此,本文設(shè)計一種基于二進制蜉蝣算法優(yōu)化的特征選擇及文本聚類算法,首先對文本特征進行選擇,選擇出最優(yōu)子集并把特征選擇的最優(yōu)解作為K-means++算法的輸入,得到最優(yōu)的聚類效果.

    目前已有的特征選擇方法主要有3種: 過濾法、嵌入法和封裝法.過濾法是一種基于數(shù)學的統(tǒng)計方法,其特征選擇方法與后面的模型訓練分開,聚類效果較差; 嵌入法是將學習器訓練過程與特征選擇過程融為一體,二者在同一優(yōu)化過程中完成,在學習器訓練過程中自動進行特征選擇[4],但參數(shù)設(shè)置需要較深的背景知識,不利于實際推廣; 封裝法利用搜索策略尋找優(yōu)質(zhì)特征子集,并基于學習算法得到優(yōu)質(zhì)特征子集,是直接面向算法優(yōu)化,不需要太多的知識,也是最常用的特征選擇方法.

    元啟發(fā)式算法已廣泛應用于最優(yōu)化問題求解中,且已被應用到文本挖掘領(lǐng)域中特征選擇的求解問題[5-6],主要包括一些智能優(yōu)化算法,如蟻群算法、遺傳算法、粒子群優(yōu)化算法、野草算法等.這類問題通過迭代的方式不斷去搜索最優(yōu)解.劉占峰等[7]提出了一種基于粒子群優(yōu)化的模糊粗糙集和實例聯(lián)合選擇算法,算法用于特征和實例聯(lián)合選擇任務中識別高質(zhì)量的模糊粗糙雙約簡集,通過ε-雙約簡的適應度函數(shù)評估約簡集的質(zhì)量,并把粒子群算法用于搜索過程中,實現(xiàn)特征的約減與精準分類; Chen等[8]用混沌蟻獅算法與特征選擇模型結(jié)合并對文本特征進行篩選,在11個基準函數(shù)上利用3個文本數(shù)據(jù)集和其他4種分類算法比較,該方法能減少文本特征,具有較好的分類效果; 張陽等[9]提出了一種基于Word2Vec詞嵌入和高維生物基因選擇遺傳算法的文本特征選擇方法,對高維詞向量模擬基因表達方式進行迭代進化,用Word2vec把文本轉(zhuǎn)換成基因的詞向量,最后基于遺傳算法搜索策略,在特征縮減率和文本聚類精度方面性能良好; Mahdieh等[10]提出了一種多目標相對判別準則(MORDC),平衡了最小冗余特征及與目標最大相關(guān)的特征,并采用多目標進化框架,通過解空間進行搜索文本特征,該方法具有較好的分類性能; 王琛等[11]把灰狼尋找食物的過程模擬成特征選擇的過程,對特征子集合并然后交叉,選出最優(yōu)的子集,最后得到特征子集與多目標的K-means算法進行融合,經(jīng)多方面評估性能良好.因此,元啟發(fā)式算法在縮減特征數(shù)量與優(yōu)質(zhì)特征選擇上效果較好,但以上早期的智能群體算法尋優(yōu)能力不強,且收斂速度較慢,與過濾的方法相結(jié)合效果也不明顯.而蜉蝣算法(mayfly algorithm,MA)是一種結(jié)合粒子群優(yōu)化算法(particle swarm optimization,PSO)[12]、遺傳算法(genetic algorithm,GA)[13]、螢火蟲算法(firefly algorithm,FA)[14]等優(yōu)點的群體智能優(yōu)化算法,具有極強的尋優(yōu)能力,但受限于解決連續(xù)型問題.因此,本文將傳統(tǒng)蜉蝣算法改進為解決離散型問題的蜉蝣優(yōu)化算法,即二進制蜉蝣優(yōu)化算法(MOMA).該算法對傳統(tǒng)二進制位置更新公式進行改進,克服了局部尋優(yōu)能力弱的缺點,并提出新的交配與變異操作,提高了全局尋優(yōu)能力.

    1 算法設(shè)計

    為更好實現(xiàn)聚類效果,本文首先利用二進制蜉蝣優(yōu)化算法對文本特征進行選擇,獲得去除冗余特征的最優(yōu)子集,然后在最優(yōu)特征子集上進行聚類分析.算法過程分3個階段: 第一階段構(gòu)建向量空間模型,其中涉及必要的文本預處理步驟; 第二階段用二進制蜉蝣優(yōu)化算法對特征進行選擇,得到初始的信息化特征子集; 第三階段在最優(yōu)特征子集的基礎(chǔ)上[15],利用文本聚類算法K-means++進行聚類,得到文檔最終聚類效果.

    1.1 構(gòu)建空間向量模型

    構(gòu)建空間向量模型主要分4步: 1) 分詞,根據(jù)空格和標點符號把文本和文檔分割成詞語和詞條,并移除空格; 2) 去除停用詞,去除小權(quán)重、高頻率詞語,如果這些詞語存在于文檔中將會影響聚類的結(jié)果; 3) 提取詞干,去除詞匯的前綴和后綴,轉(zhuǎn)換為相同詞根,并將相同詞定義為一個特征,該步驟可進行提詞器操作; 4) 計算文本詞條權(quán)重,當詞條在不同文檔中的頻率較高時,可利用該詞區(qū)分文檔內(nèi)容,且詞條應被賦予更高的權(quán)重值.目前,應用的主要詞條權(quán)重計算方法為統(tǒng)計分析算法中的逆文檔頻率指數(shù)TF-IDF方法,計算公式為

    (1)

    其中wi,j為文檔i中詞條j的權(quán)重,TF(i,j)為文檔i中詞條j的頻率,IDF(i,j)為倒數(shù)文檔頻率,n為文檔數(shù)量,DF(j)為包括特征j的文檔數(shù)量.構(gòu)造空間向量模型VSM如下:

    (2)

    1.2 基于二進制蜉蝣優(yōu)化算法的特征選擇策略

    1.2.1 特征選擇模型

    特征選擇的目標是選出具有明顯區(qū)分性的樣本特征,而文本特征選擇就是選出代表文檔主要含義的特征詞.假設(shè)給定文本特征集合為F,表示為Fi={fi,1,fi,2,…,fi,j,…,fi,t},其中t表示預處理后唯一文本特征數(shù)量,i為文檔數(shù)量.FS經(jīng)過特征選擇算法選擇后選出新的特征子集FSi={fsi,1,fsi,2,fsi,j,…,fsi,m},其中m為選擇后的特征長度,fsi,j∈{1,0},j=1,2,…,m.若fsi,j=1,則表明文檔中所選特征j為優(yōu)質(zhì)特征; 若fsi,j=0,則表明文檔中所選特征j為無用特征.

    1.2.2 解表示

    在用二進制蜉蝣算法對文本特征進行選擇過程中,每個雄雌蜉蝣的位置代表一個特征文檔的子集,如表1所示.蜉蝣種群包括蜉蝣的位置集合,其中位置集合由二進制0或1表示,每個蜉蝣的位置表示文檔是否選擇其特征.蜉蝣第j個位置表示文檔第j個特征的位置.

    表1 特征選擇的解表示

    該算法從隨機解開始搜索,不斷地選擇高質(zhì)量的特征并改進蜉蝣種群總體以獲得全局最優(yōu)解,最優(yōu)蜉蝣的位置表示最優(yōu)解和新文檔的子集.在給定的數(shù)據(jù)集中,每個特征都被視為一個搜索空間.表1中假設(shè)蜉蝣位置值為1,則表示該位置的特征為信息特征; 蜉蝣位置值是0,則表示特征j會被選擇為非信息特征.

    1.2.3 適應度函數(shù)

    適應度函數(shù)用于評價算法的候選解,每一代都要計算候選解的適應度值.若解的適應度值較大,則該解用于替換當前較小適應度值的解.平方誤差(MAD)是特征選擇領(lǐng)域常用的度量方式,本文使用MAD作為特征選擇的適應度函數(shù),并作為評判蜉蝣位置的目標函數(shù).MAD可由均值與Xi,j的中值之差表示:

    (3)

    (4)

    1.3 二進制蜉蝣優(yōu)化算法

    受蜉蝣生物活動啟發(fā),Zervoudakis等[16]提出了蜉蝣算法,每只蜉蝣在搜索空間中的位置表示問題的解.算法工作原理: 隨機產(chǎn)生兩組蜉蝣種群,其中分別表示雄性和雌性蜉蝣種群.每只蜉蝣被隨機放置在問題空間中,作為由d維向量表示的候選解x=(x1,x2,…,xd),并結(jié)合目標函數(shù)f(x)對其性能進行評估.蜉蝣的速度v=(v1,v2,…,vd)定義為其位置的變化,每只蜉蝣的飛行方向是個體和社會飛行經(jīng)驗的動態(tài)交互作用.每只蜉蝣都會調(diào)整自己的軌跡,使其向個人最佳位置(pbest)以及整個過程中蜉蝣所獲得的最佳位置(gbest)飛行.算法偽代碼如下:

    算法1蜉蝣優(yōu)化算法特征選擇算法MA.

    Initializing the male mayfly populationxi(i=1,2,…,N) and speedvmi//初始化雄蜉蝣種群位置及速度

    Initializing the female mayfly populationyi(i=1,2,…,M) and speedvFi//初始化雌蜉蝣種群位置及速度

    Evaluate the fitness values of each mayfly//評估每只蜉蝣的適應度

    Find the global optimal solutiongbest//發(fā)現(xiàn)全局最好的蜉蝣位置

    Do While the termination criteria are not met//為滿足終止規(guī)則

    Update male and female mayfly speed reconciliation//更新雄性和雌性蜉蝣的速度和位置

    Evaluation of solution//評估解

    Mayflies sorting//蜉蝣排序

    Mayflies mate//蜉蝣交配

    Evaluation of offspring//評估子代

    Randomly divide the offspring into male and female//隨機將子代分為雄性與雌性

    Updatepbestandgbest//更新全局最優(yōu)解與蜉蝣歷史位置最優(yōu)解

    End while.

    每只蜉蝣位置表示的候選解通過式(3)定義的適應度函數(shù)進行評估.在MA算法中,解包含單個實體(特征),且算法不斷對蜉蝣位置進行評估.蜉蝣當前的位置按適應度函數(shù)進行評估,全局最好的蜉蝣由自身速度更新位置,其余雄蜉蝣按全局最好位置和歷史最佳位置更新位置,而雌蜉蝣由雄蜉蝣位置更新速度與方向.直到取得表示問題最優(yōu)解的蜉蝣位置.

    二進制蜉蝣個體更新策略如下: 雄蜉蝣位置更新公式為

    (5)

    雄蜉蝣移動速率更新公式為

    (6)

    實際上,為繁衍雌蜉蝣會一直向雄蜉蝣運動,吸引過程取決于解的質(zhì)量,雌蜉蝣的位置更新公式為

    (7)

    速度更新公式為

    (8)

    針對傳統(tǒng)蜉蝣算法僅解決連續(xù)性問題,不適用于特征選擇的離散性問題,本文借鑒劉建華等[18]提出的基于改進二進制粒子群算法的優(yōu)化思路,在保持速度公式不變的前提下,對雄雌蜉蝣的速度概率映射函數(shù)進行重新定義,表示為

    (9)

    圖1 映射概率函數(shù)值Fig.1 Mapping probability function values

    (10)

    (11)

    由于最初雄蜉蝣位置的舞蹈系數(shù)d很大,導致映射的概率很大,因此位置改變概率也會變大,這種情況下,最優(yōu)雄蜉蝣位置容易變化,可增強算法全局的搜索能力.隨著迭代次數(shù)的增加,最優(yōu)的雄蜉蝣速度逐漸變小,位置變化概率也會變小,此時全局搜索能力變?nèi)?局部探測能力變強.對于非最優(yōu)雄蜉蝣,速度的更新是由最優(yōu)位置和歷史最優(yōu)位置決定的.當速度為0時,最優(yōu)蜉蝣和歷史最優(yōu)位置相等,位置一般不需要改變.當速度為負時,利用式(10)進行位置更新,此時最優(yōu)雄蜉蝣位置和歷史最優(yōu)位置很可能為0,雄蜉蝣的位置很可能為1,因此位置需大概率變?yōu)?.當速度為正時,利用式(11)對位置進行更新,此時最優(yōu)雄蜉蝣位置可能為1,而雄蜉蝣的位置很可能是0,所以位置需要最大概率變?yōu)?.對于雌蜉蝣,其位置由雄蜉蝣的位置確定.當優(yōu)于對應的雄蜉蝣位置時,雌蜉蝣根據(jù)自身的速度進行變化,隨著迭代次數(shù)的增加,雌蜉蝣速度趨于0,位置改變概率也逐漸變小,這種情況下雌蜉蝣位置小概率會改變.當劣于對應的雄蜉蝣位置時,雌蜉蝣的位置由雄蜉蝣的位置更新,當雌蜉蝣速度為負時,對應的雄蜉蝣位置很大可能為0,而雌蜉蝣位置很大可能是1,此時雌蜉蝣的位置可能為0.當雌蜉蝣速度為正時,對應的雄蜉蝣位置很可能為1,而雌蜉蝣位置很可能為0,所以雌蜉蝣的位置可能變?yōu)?.

    1.4 進化策略

    1.4.1 交配操作

    蜉蝣交配根據(jù)解的質(zhì)量將同等級的雄雌蜉蝣進行交配,產(chǎn)生兩個后代.為解決原始蜉蝣算法只能求解連續(xù)值的問題,現(xiàn)對蜉蝣的交叉策略進行改變.本文采用多點交叉的方式,隨機生成初始交叉點和交叉結(jié)束點,如圖2所示,[1,0,0,1,1]為雄蜉蝣位置,[0,0,1,0,0]為雌蜉蝣位置,[0]和[1]為雄、雌蜉蝣隨機生成的初始交叉點,[1]和[0]為雄、雌蜉蝣隨機生成的交叉結(jié)束點,雄、雌蜉蝣通過交換選中區(qū)間完成交叉,最終生成兩個子代.

    圖2 交配操作示意圖Fig.2 Schematic diagram of mating operation

    1.4.2 變異操作

    原始的蜉蝣算法變異是高斯近似變異,應用于連續(xù)值問題的求解,并不適用于二進制變異策略.本文采用基本位變異方法,該方法隨機生成一個(0,1)的隨機數(shù),當隨機數(shù)小于變異概率時進行變異,為增加種群的多樣性,采用多點變異的方式,如圖3所示.由圖3可見,蜉蝣位置第一個隨機選[0]為變異初始點,第二個[0]為變異結(jié)束點,變異操作即對變異區(qū)間的數(shù)取反.原始蜉蝣位置由[1,0,1,1,0,1]變?yōu)閇1,1,0,0,1,1].

    圖3 變異操作示意圖Fig.3 Schematic diagram of mutation operation

    1.5 基于K-means++算法聚類分析

    K-means算法[19]是目前常用的聚類算法之一,已在許多領(lǐng)域中得到成功應用,實用性良好,但傳統(tǒng)的K-means算法存在聚類中心參數(shù)難以確定且聚類結(jié)果不穩(wěn)定的問題.本文利用提出的二進制蜉蝣優(yōu)化算法對K-means++算法進行聚類優(yōu)化.K-means++算法采用一定策略選擇質(zhì)心,其中輪盤賭算法是最簡單有效的策略.在輪盤賭算法中,第m個質(zhì)心的選取取決于選取數(shù)據(jù)點距離第(m-1)個質(zhì)心的距離,度量距離越大則越有可能被選取.假設(shè)K-means++算法的輸入樣本集為D={x1,x2,…,xm},聚類的簇數(shù)為k,則經(jīng)過N次迭代后算法停止.K-means++算法的運行步驟如下.

    1) 找出k個聚類中心點: 從文本數(shù)據(jù)集D中隨機選出一個樣本作為初始的質(zhì)心向量c1,計算每只樣本與最近的質(zhì)心向量距離和Sum(D(x)),取一個能位于Sum(D(x))中的隨機值Random,并令Random-=D(x),直到其值≤0,此時的點便可作為下一個質(zhì)心點.重復上述步驟,直到k個聚類中心被選出來,k個聚類中心可記作{c1,c2,…,ck}.

    2) 利用這k個初始聚類中心運行K-means算法,對于n=1,2,…,N進行如下操作:

    ① 將簇劃分Ci,初始化為Ci={ci}(i=1,2,…,k);

    ② 對i=1,2,…,m分別計算樣本xi和各質(zhì)心向量cj(j=1,2,…,k)的距離ci,j,其中ci,j=‖xi-cj‖,將最小的xi標記為di,j所對應的類別j,然后更新C=Cj∪{xi};

    ④ 如果k個質(zhì)心的位置都未發(fā)生變化,則終止算法,轉(zhuǎn)步驟3).

    3) 輸出結(jié)果簇劃分C={C1,C2,…,Ck}.

    2 實驗對比及分析

    本文用Python編寫二進制蜉蝣優(yōu)化算法,用該算法進行文本特征選擇[20],尋求擁有更多有用特征的最優(yōu)子集,利用K-means++算法對選擇的特征進行文本聚類,并通過實驗驗證基于二進制蜉蝣算法特征選擇后的聚類效果.

    2.1 測試文本數(shù)據(jù)集

    為驗證算法的穩(wěn)定性和適應性,本文采用智能實驗室LABIC(http://sites.labic.icme.usp.br/text_collections/)提供的5種基準數(shù)據(jù)集進行測試,測試文檔數(shù)據(jù)集信息列于表2.

    表2 測試文檔數(shù)據(jù)集信息

    2.2 算法評估指標

    準確率(Accuracy)、查準率(Precision)、查全率(Recall)和F度量(F-measure)是文本聚類常用的指標,為驗證二進制蜉蝣優(yōu)化算法的效果,引入特征選擇的數(shù)量和適應度值與迭代次數(shù)的關(guān)系.

    1) 準確率.準確率用于計算真實樣本被分為正確類別的比例,計算公式為

    (13)

    其中K表示總聚類數(shù)量,p(i,j)表示聚類j中分類i的精確值.

    2) 查準率.查準率P表示相關(guān)文檔占所有聚類中i文檔總量的比例,計算公式為

    (14)

    3) 查全率.查全率R表示相關(guān)文檔實際數(shù)量占所有文檔的比例,計算公式為

    (15)

    其中R(i,j)表示聚類j中分類i的召回值,ni表示分類i中的實際樣本數(shù)量.

    4)F度量.F度量根據(jù)查準率P和查全率R計算,其中F是0~1的小數(shù),其值越接近1效果越好,聚類j中分類i的F度量計算公式為

    (16)

    所有聚類的F-measure可表示為

    (17)

    5) 特征數(shù)量.該指標表示基于元啟發(fā)式算法對特征選擇后得到的特征個數(shù),特征數(shù)量的選擇影響文本聚類效率與準確性.

    6) 收斂性能.該指標用于衡量算法的尋優(yōu)能力,本文通過計算進行特征選擇的適應度函數(shù)值評估算法的性能,算法收斂值即通過若干次迭代后的最優(yōu)適應度值.

    7) 收斂時間.收斂時間是指進行特征選擇和文本聚類所用的總時間(s),該指標用于衡量算法的收斂速度.

    2.3 實驗結(jié)果分析

    2.3.1 文本特征縮減率對比

    在5個測試文本數(shù)據(jù)集上,用傳統(tǒng)元啟發(fā)式算法和本文提出的二進制蜉蝣優(yōu)化算法得到的特征選擇情況對比結(jié)果如圖4所示.由圖4可見: 在特征縮減方面,遺傳算法特征縮減率約為50%,表現(xiàn)較差; 二進制粒子群優(yōu)化算法特征縮減率為50%~70%,表現(xiàn)一般; 二進制蜉蝣算法的特征縮減率達到75%~80%,相比于前兩種算法,二進制蜉蝣算法對特征縮減率的效果更好,表明二進制蜉蝣算法和特征選擇模型的結(jié)合,可降低冗余性特征,并降低維度空間.此外,二進制蜉蝣算法在5種數(shù)據(jù)集中保持穩(wěn)定且領(lǐng)先的特征縮減率,也說明其具有良好的普適性和廣泛性.

    2.3.2 算法收斂性對比

    MOMA,GA和PSO三種算法的復雜度對比列于表3.由表3可見,當種群個數(shù)和迭代次數(shù)為N時,3種啟發(fā)式算法的時間復雜度理論上均為O(n2),但在實際運行過程中,PSO和MOMA算法尋優(yōu)具有方向性,因此這兩種算法運行中所用的時間比GA算法低.而MOMA算法與PSO算法相比,前者的尋優(yōu)能力較強,其迭代次數(shù)通常比N小,因此MOMA算法在實際運行過程中時間小于GA算法與PSO算法.在空間復雜度上,由于GA算法是無記憶性算法,只需要得到種群中最大的適應度值,因此其空間復雜度是O(1),而PSO和MOMA算法要記錄個體的當前位置與種群的最佳位置,且所占空間和種群大小有關(guān),因此其空間復雜度為O(n).由于種群個數(shù)通常較小,所以3種算法分配的內(nèi)存空間差距較小.

    表3 不同算法的復雜度對比

    5個數(shù)據(jù)集基于3種元啟發(fā)式算法在特征選擇方面的算法收斂性實驗結(jié)果如圖5所示.通過計算適應度函數(shù)值評價算法的收斂性能,算法收斂即通過若干次迭代得到最優(yōu)適應度的值.由圖5可見,二進制蜉蝣算法約在300代收斂,而其他兩種算法約在500代收斂,因此二進制蜉蝣算法收斂性能較好.在文本特征選擇中,二進制蜉蝣算法得到的特征結(jié)果也具有較高的適應度,表明其尋優(yōu)能力較好,再次證明了二進制蜉蝣算法的有效性.

    圖5 不同算法在5個數(shù)據(jù)集上的收斂性對比Fig.5 Comparison of convergence of different algorithms on 5 datasets

    2.3.3 算法精度對比

    3種算法在5個公共數(shù)據(jù)集上得到的類準確率、查準率、查全率和F度量值的指標對比結(jié)果列于表4.由表4可見:K-means++的聚類評估指標較其他算法差,因為K-means++算法未經(jīng)過特征選擇機制,文本中存在大量的非信息化特征; 經(jīng)過元啟發(fā)式算法進行選擇后,聚類精度得到一定提升; 二進制蜉蝣算法在5個指標上明顯優(yōu)于其他兩種傳統(tǒng)算法.因為二進制蜉蝣算法是在螢火蟲、遺傳和粒子群優(yōu)化算法基礎(chǔ)上改進而來的,其尋優(yōu)能力強,能選取表示文檔意義的適應度值,所以精度顯著提高.

    2.3.4 算法收斂時間對比

    不同算法在進行文本特征選擇時的收斂時間對比結(jié)果如圖6所示.時間越短說明算法運行的速度越快,3種算法在5個數(shù)據(jù)集上進行測試的結(jié)果表明,在進行特征選擇過程中,相比其他傳統(tǒng)的遺傳和粒子群優(yōu)化算法,二進制蜉蝣算法運行時間短,運行速度較快.此外,在特征選擇時,算法的運行時間長短與文本的特征數(shù)目和文檔數(shù)量有關(guān),文檔數(shù)目越多,特征越多,進行特征選擇的時間越長.

    表4 不同算法精度的對比

    圖6 不同算法收斂時間的對比Fig.6 Comparison of convergence time of different algorithms

    綜上所述,針對文本冗余特征導致聚類精度較低的問題,本文提出了一種基于二進制蜉蝣優(yōu)化的特征選擇算法(MOMA).首先對文本進行分詞、去停用詞以及計算文本權(quán)重構(gòu)造向量空間模型; 然后改進蜉蝣位置更新和交叉變異策略,并結(jié)合特征模型選出優(yōu)質(zhì)特征,將其輸入到K-means++算法中; 最后利用5個公開數(shù)據(jù)集進行實驗.實驗結(jié)果表明,本文提出的二進制蜉蝣優(yōu)化的特征選擇算法能有效選取信息化特征,大幅度縮減特征維度,聚類效率較好.

    猜你喜歡
    蜉蝣二進制特征選擇
    《蜉蝣》
    用二進制解一道高中數(shù)學聯(lián)賽數(shù)論題
    有趣的進度
    二進制在競賽題中的應用
    黃昏的蜉蝣
    Kmeans 應用與特征選擇
    電子制作(2017年23期)2017-02-02 07:17:06
    聯(lián)合互信息水下目標特征選擇算法
    基于特征選擇和RRVPMCD的滾動軸承故障診斷方法
    基于二元搭配詞的微博情感特征選擇
    計算機工程(2014年6期)2014-02-28 01:26:36
    一個生成組合的新算法
    国产精品一区二区三区四区久久| 亚洲成人中文字幕在线播放| 男人狂女人下面高潮的视频| 在现免费观看毛片| 男人爽女人下面视频在线观看| 三级国产精品片| 欧美3d第一页| 三级毛片av免费| 亚洲精品第二区| 亚洲综合精品二区| 大片免费播放器 马上看| 最后的刺客免费高清国语| 嫩草影院入口| 美女内射精品一级片tv| 午夜精品在线福利| 免费看美女性在线毛片视频| 一二三四中文在线观看免费高清| 亚洲婷婷狠狠爱综合网| 午夜福利视频1000在线观看| 日韩 亚洲 欧美在线| 久久草成人影院| 晚上一个人看的免费电影| 国产乱人偷精品视频| 日韩一区二区视频免费看| 天堂av国产一区二区熟女人妻| 中文字幕亚洲精品专区| 国产大屁股一区二区在线视频| 成年免费大片在线观看| 丰满少妇做爰视频| 乱系列少妇在线播放| 少妇熟女欧美另类| 成年免费大片在线观看| 国产高清三级在线| kizo精华| 欧美人与善性xxx| 欧美日韩综合久久久久久| 久久99蜜桃精品久久| 只有这里有精品99| 中文精品一卡2卡3卡4更新| 欧美另类一区| 亚洲国产精品成人综合色| 在现免费观看毛片| 国产色爽女视频免费观看| 天堂影院成人在线观看| 国产伦精品一区二区三区四那| 大香蕉久久网| 免费高清在线观看视频在线观看| 国产男人的电影天堂91| av一本久久久久| 精品久久久久久久末码| 国产精品美女特级片免费视频播放器| 国产大屁股一区二区在线视频| .国产精品久久| 国内少妇人妻偷人精品xxx网站| 五月伊人婷婷丁香| 永久免费av网站大全| 汤姆久久久久久久影院中文字幕 | 熟妇人妻不卡中文字幕| 精品久久久久久久久久久久久| 成人美女网站在线观看视频| 亚洲无线观看免费| 午夜福利网站1000一区二区三区| 永久网站在线| 免费高清在线观看视频在线观看| 精品久久久久久电影网| 一级毛片电影观看| 成人漫画全彩无遮挡| 亚洲精品日本国产第一区| 国产精品日韩av在线免费观看| 午夜激情久久久久久久| 午夜福利在线观看吧| 亚洲国产成人一精品久久久| 99热这里只有是精品50| 亚洲欧美成人精品一区二区| 高清午夜精品一区二区三区| 人人妻人人澡欧美一区二区| 夜夜看夜夜爽夜夜摸| 五月伊人婷婷丁香| 偷拍熟女少妇极品色| 最近手机中文字幕大全| 熟女人妻精品中文字幕| 亚洲av电影不卡..在线观看| 麻豆成人av视频| 夫妻性生交免费视频一级片| 欧美bdsm另类| 激情五月婷婷亚洲| 卡戴珊不雅视频在线播放| 色播亚洲综合网| 欧美xxxx性猛交bbbb| 久久精品熟女亚洲av麻豆精品 | 国产女主播在线喷水免费视频网站 | 国产成人精品久久久久久| 亚洲欧美一区二区三区黑人 | 99久国产av精品| 国产精品人妻久久久久久| 大陆偷拍与自拍| 神马国产精品三级电影在线观看| 免费黄频网站在线观看国产| 欧美成人精品欧美一级黄| 亚洲在线自拍视频| 伦理电影大哥的女人| 国产精品综合久久久久久久免费| 国产一区二区在线观看日韩| 777米奇影视久久| av卡一久久| 亚洲av不卡在线观看| 尾随美女入室| 国产精品国产三级专区第一集| 国国产精品蜜臀av免费| 日韩亚洲欧美综合| 免费看日本二区| 免费黄网站久久成人精品| 日韩国内少妇激情av| 久久久午夜欧美精品| 淫秽高清视频在线观看| 亚洲成人久久爱视频| 日韩视频在线欧美| 亚洲第一区二区三区不卡| 日本wwww免费看| 国产高清有码在线观看视频| 三级国产精品片| 亚洲性久久影院| 国产精品综合久久久久久久免费| 国产 亚洲一区二区三区 | 久久99热这里只有精品18| 超碰av人人做人人爽久久| 人妻系列 视频| a级一级毛片免费在线观看| 国产熟女欧美一区二区| 亚洲国产av新网站| 免费大片18禁| videossex国产| 亚洲国产色片| 老司机影院成人| 嘟嘟电影网在线观看| 别揉我奶头 嗯啊视频| 成人午夜精彩视频在线观看| 午夜视频国产福利| 亚洲成色77777| 亚洲精品日韩在线中文字幕| 美女国产视频在线观看| 国产精品精品国产色婷婷| 97热精品久久久久久| 精品人妻熟女av久视频| 国产 一区 欧美 日韩| 精品少妇黑人巨大在线播放| 国产v大片淫在线免费观看| 国产91av在线免费观看| 日本黄大片高清| 国产高清国产精品国产三级 | 老司机影院成人| kizo精华| 又大又黄又爽视频免费| 人妻少妇偷人精品九色| 熟妇人妻久久中文字幕3abv| 午夜激情久久久久久久| 国产亚洲一区二区精品| 国产精品久久久久久久电影| 天堂√8在线中文| 成人性生交大片免费视频hd| 亚洲av二区三区四区| 国产一区亚洲一区在线观看| 欧美日韩亚洲高清精品| 日韩一本色道免费dvd| 啦啦啦中文免费视频观看日本| 久久精品国产鲁丝片午夜精品| 1000部很黄的大片| 91在线精品国自产拍蜜月| 国产 一区 欧美 日韩| 日韩精品青青久久久久久| 国产黄片视频在线免费观看| 免费少妇av软件| 亚洲精品自拍成人| 97热精品久久久久久| 成人午夜精彩视频在线观看| 日韩伦理黄色片| 国产免费视频播放在线视频 | 国产精品人妻久久久久久| 黄色欧美视频在线观看| 亚洲成人av在线免费| 看非洲黑人一级黄片| 美女xxoo啪啪120秒动态图| 欧美xxxx性猛交bbbb| 久久久欧美国产精品| 2021天堂中文幕一二区在线观| 淫秽高清视频在线观看| 亚洲四区av| 国产大屁股一区二区在线视频| 伦理电影大哥的女人| 亚洲激情五月婷婷啪啪| 亚洲欧洲国产日韩| 狂野欧美激情性xxxx在线观看| 亚洲精品影视一区二区三区av| 嘟嘟电影网在线观看| 亚洲精品第二区| 一级爰片在线观看| 亚洲在久久综合| 亚洲精品日韩在线中文字幕| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 国产精品一区二区性色av| 亚洲精品成人久久久久久| 偷拍熟女少妇极品色| 成人二区视频| 亚洲精品乱码久久久久久按摩| 少妇猛男粗大的猛烈进出视频 | 边亲边吃奶的免费视频| 亚洲高清免费不卡视频| 国产一区有黄有色的免费视频 | 免费黄色在线免费观看| 欧美不卡视频在线免费观看| 深爱激情五月婷婷| 亚洲天堂国产精品一区在线| 美女大奶头视频| 五月天丁香电影| 亚洲在久久综合| 亚洲av成人av| 国产成人a区在线观看| 内射极品少妇av片p| 国产精品人妻久久久影院| 亚洲精品中文字幕在线视频 | 五月玫瑰六月丁香| 成人二区视频| 亚洲精品久久久久久婷婷小说| 97热精品久久久久久| 少妇的逼水好多| 午夜日本视频在线| 精品欧美国产一区二区三| 一个人看视频在线观看www免费| 中文精品一卡2卡3卡4更新| 欧美 日韩 精品 国产| 天堂中文最新版在线下载 | 亚洲欧美清纯卡通| 免费大片黄手机在线观看| 中文精品一卡2卡3卡4更新| 晚上一个人看的免费电影| 边亲边吃奶的免费视频| 禁无遮挡网站| 欧美激情国产日韩精品一区| 亚洲国产欧美人成| 国产一级毛片在线| 日韩一本色道免费dvd| 嫩草影院入口| 黄色配什么色好看| 国产亚洲最大av| 久久精品国产鲁丝片午夜精品| 国产av在哪里看| 久久久久九九精品影院| 国产精品.久久久| or卡值多少钱| 欧美变态另类bdsm刘玥| 2018国产大陆天天弄谢| 18禁动态无遮挡网站| 人妻夜夜爽99麻豆av| 久久韩国三级中文字幕| 久久鲁丝午夜福利片| 日韩三级伦理在线观看| 免费黄网站久久成人精品| 国产精品国产三级专区第一集| 2021少妇久久久久久久久久久| 岛国毛片在线播放| 久久人人爽人人爽人人片va| 高清毛片免费看| 亚洲欧美精品专区久久| 简卡轻食公司| 精品一区二区三区人妻视频| 六月丁香七月| 一级毛片aaaaaa免费看小| 热99在线观看视频| 亚洲一区高清亚洲精品| 2022亚洲国产成人精品| 成年人午夜在线观看视频 | 乱人视频在线观看| 中文字幕久久专区| 久久久久久久久久黄片| 国产亚洲av片在线观看秒播厂 | 国产精品一二三区在线看| 亚洲成人av在线免费| 最近中文字幕高清免费大全6| 波多野结衣巨乳人妻| 亚洲精品色激情综合| 97精品久久久久久久久久精品| 黄色日韩在线| 天天躁日日操中文字幕| 欧美激情国产日韩精品一区| 精品一区在线观看国产| 小蜜桃在线观看免费完整版高清| 一级毛片 在线播放| 亚洲精品国产av蜜桃| 天天躁夜夜躁狠狠久久av| 免费观看的影片在线观看| 国产成人freesex在线| 麻豆国产97在线/欧美| 你懂的网址亚洲精品在线观看| 国产亚洲午夜精品一区二区久久 | h日本视频在线播放| 亚洲av电影在线观看一区二区三区 | 中文字幕久久专区| 精品午夜福利在线看| 内地一区二区视频在线| 日产精品乱码卡一卡2卡三| 男人爽女人下面视频在线观看| 欧美区成人在线视频| 观看美女的网站| 中文字幕久久专区| xxx大片免费视频| 免费黄网站久久成人精品| 国产精品无大码| 国产成人aa在线观看| 精品熟女少妇av免费看| 亚洲va在线va天堂va国产| 成年版毛片免费区| 国产免费视频播放在线视频 | 深爱激情五月婷婷| 18+在线观看网站| 中文精品一卡2卡3卡4更新| 午夜久久久久精精品| 欧美bdsm另类| 亚洲久久久久久中文字幕| 美女大奶头视频| 国产视频内射| 街头女战士在线观看网站| 午夜激情福利司机影院| 久久久久久久久久久免费av| 卡戴珊不雅视频在线播放| 国产探花极品一区二区| 激情 狠狠 欧美| 青春草视频在线免费观看| 七月丁香在线播放| 非洲黑人性xxxx精品又粗又长| 肉色欧美久久久久久久蜜桃 | 免费黄网站久久成人精品| 精华霜和精华液先用哪个| 欧美3d第一页| 免费观看a级毛片全部| 日本黄色片子视频| av在线观看视频网站免费| 亚洲精品日本国产第一区| 国产午夜福利久久久久久| 日韩欧美精品免费久久| 在线天堂最新版资源| av国产久精品久网站免费入址| 久久鲁丝午夜福利片| 校园人妻丝袜中文字幕| 十八禁网站网址无遮挡 | 亚洲国产最新在线播放| 人体艺术视频欧美日本| 美女cb高潮喷水在线观看| 插逼视频在线观看| 午夜老司机福利剧场| www.av在线官网国产| 欧美性猛交╳xxx乱大交人| 国产又色又爽无遮挡免| 深爱激情五月婷婷| 伊人久久精品亚洲午夜| 国产黄片视频在线免费观看| 大香蕉久久网| videossex国产| 成人亚洲精品一区在线观看 | 日产精品乱码卡一卡2卡三| 久久午夜福利片| 狠狠精品人妻久久久久久综合| 欧美不卡视频在线免费观看| 99热网站在线观看| 韩国av在线不卡| 人妻夜夜爽99麻豆av| 久久国内精品自在自线图片| 天天躁夜夜躁狠狠久久av| 天天躁日日操中文字幕| 老司机影院毛片| 天天躁日日操中文字幕| 一个人看的www免费观看视频| 亚洲欧美日韩卡通动漫| 十八禁网站网址无遮挡 | 精品不卡国产一区二区三区| 春色校园在线视频观看| 看十八女毛片水多多多| 亚洲国产最新在线播放| 国产一级毛片七仙女欲春2| 一本一本综合久久| 我的老师免费观看完整版| 国产黄色小视频在线观看| 亚洲无线观看免费| 国精品久久久久久国模美| 伊人久久国产一区二区| 亚洲国产精品专区欧美| 一级av片app| 男人舔奶头视频| 精品人妻熟女av久视频| 亚洲真实伦在线观看| 日韩 亚洲 欧美在线| ponron亚洲| 亚洲国产色片| 蜜臀久久99精品久久宅男| 麻豆乱淫一区二区| 午夜福利高清视频| 麻豆成人午夜福利视频| 91午夜精品亚洲一区二区三区| 简卡轻食公司| 91久久精品电影网| 能在线免费观看的黄片| 国产三级在线视频| 精品99又大又爽又粗少妇毛片| 日本wwww免费看| 中文字幕人妻熟人妻熟丝袜美| 菩萨蛮人人尽说江南好唐韦庄| 色尼玛亚洲综合影院| 最近最新中文字幕免费大全7| 又黄又爽又刺激的免费视频.| 一级毛片 在线播放| 国产成人精品一,二区| 国产精品一区二区三区四区久久| 少妇的逼水好多| 99九九线精品视频在线观看视频| www.av在线官网国产| 好男人视频免费观看在线| 夜夜看夜夜爽夜夜摸| 成年人午夜在线观看视频 | 丰满少妇做爰视频| 人妻夜夜爽99麻豆av| 97精品久久久久久久久久精品| 免费看a级黄色片| 久久精品久久久久久久性| 男女啪啪激烈高潮av片| 亚洲精品456在线播放app| 日韩精品有码人妻一区| 国产人妻一区二区三区在| 亚洲精品视频女| 免费看av在线观看网站| 日韩中字成人| 老师上课跳d突然被开到最大视频| 我的女老师完整版在线观看| 国产免费又黄又爽又色| 国产av不卡久久| 黄色欧美视频在线观看| 乱人视频在线观看| 国产伦理片在线播放av一区| 有码 亚洲区| 亚洲在线观看片| 欧美高清成人免费视频www| 麻豆久久精品国产亚洲av| 日日摸夜夜添夜夜爱| 97超碰精品成人国产| 美女国产视频在线观看| 嘟嘟电影网在线观看| 亚洲精品亚洲一区二区| 大香蕉97超碰在线| 国产精品99久久久久久久久| av又黄又爽大尺度在线免费看| 人妻系列 视频| 22中文网久久字幕| 18禁裸乳无遮挡免费网站照片| 亚洲色图av天堂| 校园人妻丝袜中文字幕| 久久久欧美国产精品| 色综合亚洲欧美另类图片| 哪个播放器可以免费观看大片| 丰满乱子伦码专区| 国产中年淑女户外野战色| 亚洲欧美精品自产自拍| 精品久久久久久久末码| 免费大片黄手机在线观看| 成人漫画全彩无遮挡| 天堂网av新在线| 久久这里只有精品中国| 精品99又大又爽又粗少妇毛片| 2022亚洲国产成人精品| 秋霞在线观看毛片| 男女啪啪激烈高潮av片| 国语对白做爰xxxⅹ性视频网站| 亚洲精品影视一区二区三区av| av黄色大香蕉| 亚洲自拍偷在线| 97精品久久久久久久久久精品| 精品熟女少妇av免费看| 一级毛片我不卡| 欧美日韩综合久久久久久| 少妇猛男粗大的猛烈进出视频 | 天堂网av新在线| 免费av毛片视频| 99久久人妻综合| 久久精品夜夜夜夜夜久久蜜豆| 久久久色成人| 岛国毛片在线播放| 啦啦啦中文免费视频观看日本| 特级一级黄色大片| 少妇裸体淫交视频免费看高清| 久久久精品免费免费高清| 亚洲欧洲日产国产| 欧美97在线视频| 日韩三级伦理在线观看| 中文精品一卡2卡3卡4更新| 久久精品久久久久久久性| av网站免费在线观看视频 | 少妇猛男粗大的猛烈进出视频 | 国内精品一区二区在线观看| 一夜夜www| 精品少妇黑人巨大在线播放| 免费大片18禁| 国产伦一二天堂av在线观看| 欧美性感艳星| 97在线视频观看| 欧美成人午夜免费资源| 久久这里只有精品中国| 欧美成人午夜免费资源| 日本wwww免费看| av线在线观看网站| 最新中文字幕久久久久| 干丝袜人妻中文字幕| 亚洲自拍偷在线| 国产一级毛片在线| 97人妻精品一区二区三区麻豆| 免费看av在线观看网站| 亚洲综合色惰| 91精品一卡2卡3卡4卡| 亚洲18禁久久av| 熟妇人妻久久中文字幕3abv| 毛片女人毛片| 97人妻精品一区二区三区麻豆| 国产高清三级在线| 综合色丁香网| 国产精品久久久久久久电影| 国产69精品久久久久777片| 久久久久精品久久久久真实原创| 亚洲精品456在线播放app| av又黄又爽大尺度在线免费看| 亚洲,欧美,日韩| 免费观看的影片在线观看| 街头女战士在线观看网站| 十八禁国产超污无遮挡网站| 亚洲av电影在线观看一区二区三区 | 国产高清不卡午夜福利| 国产麻豆成人av免费视频| 亚洲欧洲国产日韩| 小蜜桃在线观看免费完整版高清| 亚洲婷婷狠狠爱综合网| 2022亚洲国产成人精品| 乱码一卡2卡4卡精品| 亚洲最大成人av| 看免费成人av毛片| 国产精品久久久久久av不卡| 男人舔奶头视频| 尤物成人国产欧美一区二区三区| 亚洲内射少妇av| 国产精品.久久久| 日韩 亚洲 欧美在线| 日本wwww免费看| kizo精华| 禁无遮挡网站| 五月伊人婷婷丁香| 秋霞伦理黄片| 日日摸夜夜添夜夜爱| 精品人妻偷拍中文字幕| 亚洲国产精品国产精品| 18禁在线播放成人免费| 永久网站在线| 午夜精品国产一区二区电影 | 青青草视频在线视频观看| 波野结衣二区三区在线| 亚洲欧美中文字幕日韩二区| 草草在线视频免费看| 一级毛片aaaaaa免费看小| 国产黄片视频在线免费观看| 波野结衣二区三区在线| 99久久精品国产国产毛片| 22中文网久久字幕| 久久草成人影院| av免费在线看不卡| 午夜视频国产福利| 国产高清有码在线观看视频| 一个人看的www免费观看视频| 久久久久网色| 亚洲真实伦在线观看| 色尼玛亚洲综合影院| 日韩av免费高清视频| 国产精品人妻久久久久久| 亚洲aⅴ乱码一区二区在线播放| 成人亚洲欧美一区二区av| 日韩亚洲欧美综合| 汤姆久久久久久久影院中文字幕 | 国产午夜福利久久久久久| 免费在线观看成人毛片| eeuss影院久久| 十八禁国产超污无遮挡网站| 嫩草影院精品99| 国内精品一区二区在线观看| 一区二区三区乱码不卡18| 三级国产精品欧美在线观看| 老司机影院成人| 91av网一区二区| 99热这里只有是精品50| 久久综合国产亚洲精品| 亚洲成色77777| 好男人在线观看高清免费视频| 久久久午夜欧美精品| 亚洲av不卡在线观看| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 精品一区二区三区视频在线| 久久久午夜欧美精品| 欧美日韩亚洲高清精品| 国产成人免费观看mmmm| 真实男女啪啪啪动态图| 久久久精品94久久精品| 日本熟妇午夜| 丰满少妇做爰视频| 精品人妻偷拍中文字幕| 91精品国产九色| 国产精品国产三级国产av玫瑰| 亚洲人成网站在线观看播放| 免费大片18禁| 国产高清不卡午夜福利| 成人av在线播放网站| 国产精品无大码| 中文字幕人妻熟人妻熟丝袜美| 夫妻午夜视频| 精品少妇黑人巨大在线播放|