• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種小樣本數(shù)據(jù)的特征選擇方法

    2018-10-15 09:05:50王文劍
    計(jì)算機(jī)研究與發(fā)展 2018年10期
    關(guān)鍵詞:互信息特征選擇子集

    許 行 張 凱 王文劍,2

    1(山西大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院 太原 030006) 2(計(jì)算智能與中文信息處理教育部重點(diǎn)實(shí)驗(yàn)室(山西大學(xué)) 太原 030006)

    隨著通信和存儲技術(shù)的發(fā)展、網(wǎng)絡(luò)的普及,各領(lǐng)域數(shù)據(jù)的產(chǎn)生和收集變的更加容易,大數(shù)據(jù)及相關(guān)產(chǎn)業(yè)應(yīng)運(yùn)而生,而處理這些數(shù)據(jù)成為機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘領(lǐng)域研究的核心及關(guān)鍵問題.現(xiàn)實(shí)生活中,有一類稱為小樣本的數(shù)據(jù),其特點(diǎn)是相比于特征維數(shù)其樣本數(shù)目較少,比如基因表達(dá)譜數(shù)據(jù)需要通過微陣列實(shí)驗(yàn)獲取,實(shí)驗(yàn)成本的昂貴限制了實(shí)驗(yàn)次數(shù),使得數(shù)據(jù)的規(guī)模較小,同時(shí)該實(shí)驗(yàn)測試上萬個(gè)基因的表達(dá)水平,又使得數(shù)據(jù)維數(shù)非常高,這使得傳統(tǒng)的機(jī)器學(xué)習(xí)算法處理小樣本數(shù)據(jù)可能會失效[1],因此,通過特征選擇來降低數(shù)據(jù)維數(shù)是解決它的一種有效途徑.

    特征選擇能在不失去數(shù)據(jù)原有價(jià)值的基礎(chǔ)上去除不相關(guān)和冗余特征,提高數(shù)據(jù)的質(zhì)量,降低學(xué)習(xí)算法在數(shù)據(jù)集上的計(jì)算代價(jià),加快數(shù)據(jù)挖掘的速度,同時(shí)有助于生成更易理解的結(jié)果和更緊湊、泛化能力更強(qiáng)的模型[2].根據(jù)是否與后續(xù)完成數(shù)據(jù)分析任務(wù)(如分類、聚類、回歸等)的算法相獨(dú)立,特征選擇方法可分為嵌入、封裝和過濾3類[3].嵌入型方法將特征選擇算法作為分類算法的一個(gè)組成部分嵌入到分類算法中,封裝型方法將后續(xù)分類算法的分類準(zhǔn)確率作為所選特征子集的評價(jià)準(zhǔn)則,過濾型方法與后續(xù)分類算法無關(guān),直接利用訓(xùn)練數(shù)據(jù)的統(tǒng)計(jì)性能評估特征.對于嵌入型和封裝型方法,將特征選擇算法作為分類算法的組成部分或者使用分類算法作為特征子集的評價(jià)標(biāo)準(zhǔn),都會造成特征選擇算法的計(jì)算成本隨著維數(shù)的升高而急劇上升,可能不適合小樣本數(shù)據(jù)的特征選擇.而過濾型方法有獨(dú)立的評估函數(shù),通過樣本的統(tǒng)計(jì)屬性來評價(jià)特征子集對于分類任務(wù)所起的作用,它不將任何分類器納入到評估標(biāo)準(zhǔn),由此選擇出無關(guān)于特定分類算法的特征子集.因此,過濾型方法可以離線進(jìn)行特征選擇,它相對于后續(xù)分類算法的獨(dú)立性可避免高維數(shù)據(jù)造成的較高的分類算法運(yùn)行成本,與嵌入型和封裝型相比,過濾型特征選擇方法在計(jì)算上是高效的.

    典型的過濾型特征選擇方法使用距離度量、信息度量、相關(guān)性度量和一致性度量等統(tǒng)計(jì)指標(biāo)衡量特征的類區(qū)分能力.距離度量是利用距離來度量特征之間、特征與類別之間的相關(guān)性,常用的有歐氏距離、S階閔可夫斯基測度、切比雪夫距離、平方距離等,Relief[4]及其變種ReliefF[5]、BFF(best first strategy for feature selection)[6]和基于核空間距離方法[7]都是基于距離度量的算法.信息度量是指選擇具有最小不確定性的特征,常用的信息度量為衡量信息不確定性的熵函數(shù),如Shannon熵、條件熵、信息增益、互信息(mutual information, MI)等.BIF(best individual features)[8], UFS -MI(unsupervised feature selection approach based on mutual information)[9], CMIM(conditional mutual information maximiza-tion)[10]分別是使用互信息和條件互信息作為評價(jià)標(biāo)準(zhǔn)的特征選擇方法.相關(guān)性度量是利用特征與類別的可分離性間的重要性程度判斷相關(guān)性,如Pearson相關(guān)系數(shù)、概率誤差、Fisher分?jǐn)?shù)、線性可判定分析、最小平方回歸誤差[11]、平方關(guān)聯(lián)系數(shù)[12]等.Ding等人[13]和Peng等人[14]在mRMR(minimal-redundancy-maximal- relevance)中處理連續(xù)特征時(shí),分別使用F-Statistic和Pearson相關(guān)系數(shù)度量特征與類別和已選特征間的相關(guān)性程度,Hall[15]給出一種同時(shí)考慮特征的類區(qū)分能力和特征間冗余性的相關(guān)性度量標(biāo)準(zhǔn).一致性度量是指給定2個(gè)樣本,若他們特征值相同而類別不同,則它們是不一致的,否則是一致的,一致性準(zhǔn)則試圖保留原始特征的辨識能力,用不一致率來度量,典型算法有Focus[16],LVF(Las Vegas filter)[17]等.這些方法有的運(yùn)行效率不夠高,有的降維之后分類模型性能不夠好,因此研究針對小樣本數(shù)據(jù)的過濾型特征選擇方法仍有重要的價(jià)值.

    由于互信息有2個(gè)優(yōu)點(diǎn)[18]:1)可以測量隨機(jī)變量之間的多種關(guān)系,包括非線性關(guān)系,這保證了互信息在特征與類別之間的關(guān)系未知的情況下仍然有效;2)在平移、旋轉(zhuǎn)和保留特征矢量順序的特征空間變換情況下,值不會發(fā)生改變,這保證了互信息在特征選擇中的任何階段都能準(zhǔn)確度量任意2個(gè)特征之間的關(guān)系.因此,基于互信息的過濾型特征選擇方法可以很好地度量特征與特征之間、特征與類別之間的關(guān)系,從而更有效地進(jìn)行特征選擇.本文針對小樣本數(shù)據(jù)提出一種基于互信息的過濾型特征選擇方法,用以提高其選出的特征子集所構(gòu)造的分類模型的分類性能,同時(shí)具有更好的運(yùn)行效率.

    1 小樣本數(shù)據(jù)的特征選擇方法

    本文首先提出一種基于互信息的特征選擇方法(MI-based feature selection, MIFS),根據(jù)互信息對特征排序,之后按順序迭代地對特征分組,在各組內(nèi)選出與類別相關(guān)性最大的特征得到特征子集,然后利用Boruta算法[19]自動(dòng)地確定最佳特征子集.

    1.1 基于互信息的特征選擇方法

    有效的特征選擇方法需要同時(shí)考慮特征與類別的相關(guān)性和不同特征之間的冗余性,并且避免在類別相關(guān)度差別較大的特征上計(jì)算冗余度.為了實(shí)現(xiàn)以上2點(diǎn),提出基于互信息的特征選擇算法MIFS.考慮到互信息度量特征與類別之間的關(guān)系的優(yōu)勢,MIFS先根據(jù)特征與類別之間的相關(guān)性對特征排序,之后提出了一個(gè)分組標(biāo)準(zhǔn),將特征進(jìn)行分組,并從不同的組內(nèi)找到需要選出的特征作為特征子集.

    給定數(shù)據(jù)集D的樣本數(shù)為n,特征維數(shù)為m,用a1,a2,…,am表示其特征,c表示其類別,特征ai的值域?yàn)閂i,c的值域?yàn)閂c.

    特征ai與類別c之間的互信息I(ai,c)為

    (1)

    其中p(vi,vc)表示特征ai的取值為vi且類別c的取值為vc的概率.I(ai,c)的值越大,表示特征ai和類別c的關(guān)聯(lián)度越大.

    計(jì)算每個(gè)特征與類別之間的互信息后,按互信息從大到小的順序?qū)μ卣髋判?,然后對特征集進(jìn)行分組,定義特征分組的標(biāo)準(zhǔn)Q為

    (2)

    (3)

    (4)

    其中,G表示一個(gè)特征組,ai,aj為G內(nèi)的特征,I(ai,aj)為特征ai與特征aj之間的互信息:

    (5)

    其中p(vi,vj)表示特征ai的取值為vi且特征aj的取值為vj的概率.I(ai,aj)的值越大,表示特征ai和aj越相似.

    這里SG為特征組G與類別的關(guān)聯(lián)度,RG為特征組G內(nèi)所有特征的相似性,特征組G的Q值越大,表示該特征組中的特征與類別的關(guān)聯(lián)度越大,特征組內(nèi)特征之間的冗余度越??;反之,Q值越小,表示該特征組中的特征與類別的關(guān)聯(lián)度越小,特征組內(nèi)特征之間的冗余度越大.

    為了計(jì)算特征分組的初始Q值,需要選出2個(gè)特征放入分組中:首先將排在第1位的特征a1放入分組,然后計(jì)算特征a1與其他每個(gè)特征ai之間的互信息,并選出互信息最大的特征,即最相似的特征放入該分組.之后按式(2)計(jì)算分組的Q值,記錄為q0.

    對于其他特征,將此時(shí)排在最前面的特征添加到當(dāng)前分組中,再計(jì)算其Q值,如果Qq0時(shí)停止向這個(gè)特征組添加特征,此時(shí)的特征組就作為第1個(gè)分組.在未被分組的特征上重復(fù)上述步驟得到新的特征組,依此類推,直到所有的特征都被分入特征組中,則得到所有特征組.最后取出每個(gè)特征組中的第1個(gè)特征作為其所在特征組的代表,用取出的特征構(gòu)成候選特征子集.

    MIFS算法的主要步驟總結(jié)如下:

    算法1. MIFS算法.

    輸入:數(shù)據(jù)集D、候選特征個(gè)數(shù)k;

    輸出:候選特征子集Scan.

    ① 按式(1)計(jì)算數(shù)據(jù)集D中每個(gè)特征與類別c的互信息I(ai,c);

    ② 將特征按互信息從大到小排序,得到特征集A;

    ③ 按以下步驟對特征集A分組:

    ④ 令t=1,從A中取出排在第1位的特征a1放入分組Gt;

    ⑤ 按式(5)計(jì)算特征a1與其他每個(gè)特征ai之間的互信息I(ai,aj),將最大的特征放入分組Gt;

    ⑥ 按式(2)計(jì)算Gt的Q值,記為q0;

    ⑦ 從A中剩余的特征中取出排在最前面的特征放入分組Gt中,按式(2)計(jì)算Gt的Q值;如果Q≤q0,則重復(fù)步驟⑦;如果Q>q0,則將當(dāng)前的Gt作為第1個(gè)分組;

    ⑧ 令t=t+1,在剩下的A上重復(fù)步驟④~⑦,得到新的特征組Gt,直到t=k,或者A中所有特征都被分入特征組中時(shí)停止;

    ⑨ 取出每個(gè)特征組的第1個(gè)特征放入特征集Scan;

    ⑩ 返回Scan.

    1.2 MIFS-Boruta算法

    MIFS算法可以通過對特征分組的方式去除冗余特征,但它同大多數(shù)過濾型特征算法類似,無法自動(dòng)確定最佳特征.

    Boruta[19]是一種全相關(guān)的封裝型特征選擇方法,它試圖找到攜帶可用于預(yù)測的信息的所有特征,而不是像大多數(shù)傳統(tǒng)封裝型算法一樣只找到在分類器上產(chǎn)生最小誤差的特征子集.無論特征與決策變量的相關(guān)性強(qiáng)弱與否,Boruta都會找到所有的相關(guān)特征,這使得它非常適合應(yīng)用于確定最佳特征子集.

    Boruta算法首先將數(shù)據(jù)集擴(kuò)充,通過隨機(jī)打亂原數(shù)據(jù)集各特征的取值,生成與原數(shù)據(jù)集的特征數(shù)量相同的“影子”特征,由于這些“影子”特征是隨機(jī)生成的,所以Boruta算法認(rèn)為它們是不重要的特征.之后分別在各個(gè)原始特征與“影子”特征上采用隨機(jī)森林進(jìn)行分類,計(jì)算各特征的效果,將“影子”特征中分類效果最好的特征作為衡量原始特征是否重要的標(biāo)準(zhǔn),從而去除不重要的特征.Boruta算法能找到候選特征中與類別相關(guān)的所有特征,從而直接確定特征數(shù)目,得到最優(yōu)特征子集.

    Boruta可以找到所有相關(guān)特征這一優(yōu)點(diǎn)正好可以解決MIFS算法無法自動(dòng)給出最佳子集的問題,因此我們考慮建立MIFS和Boruta的混合模型.在混合模型中,封裝型算法可以充分利用過濾方法獲得的結(jié)果,提高運(yùn)行效率,并獲得產(chǎn)生較高分類性能的子集,同時(shí),過濾型方法也可以利用封裝型方法來確定特征子集中的特征個(gè)數(shù),這樣封裝和過濾方法的特性得到了很好的互補(bǔ)[14].因此本節(jié)提出一種基于MIFS和Boruta的混合模型,用以設(shè)計(jì)高效的特征選擇算法自動(dòng)選出一組冗余較小且數(shù)量較小的特征,稱為MIFS-Boruta算法.

    MIFS-Boruta算法的主要步驟歸納如下:

    算法2. MIFS-Boruta特征選擇算法.

    輸入:數(shù)據(jù)集D、候選特征子集個(gè)數(shù)k、迭代次數(shù)r;

    輸出:特征子集S.

    ① 在數(shù)據(jù)集D上運(yùn)行MIFS算法得到包含k個(gè)候選特征的特征集Scan;

    ② 從數(shù)據(jù)集D中取出特征集Scan對應(yīng)的數(shù)據(jù)作為新的數(shù)據(jù)集Dsub;

    ③ 在數(shù)據(jù)集Dsub上運(yùn)行Boruta算法,Boruta算法的迭代次數(shù)為參數(shù)r;

    ④ 返回特征子集S.

    MIFS算法初始化時(shí)選擇的和類別互信息最大的特征將會包含在最優(yōu)的特征子集中,因?yàn)樵撎卣魇紫缺环湃氲?個(gè)特征分組,之后根據(jù)分組標(biāo)準(zhǔn)Q向該特征組中添加特征使其內(nèi)部的特征之間有較高的冗余度,同時(shí)使得特征組與類別的關(guān)聯(lián)度隨著特征數(shù)量的增加而減小,所以在此特征組中只需選擇一個(gè)與類別關(guān)聯(lián)度最大的特征作為該組的代表,這個(gè)特征就是算法初始化時(shí)選出的和類別互信息最大的特征,因此該特征被選為最優(yōu)特征子集的候選特征;然后采用Boruta算法從候選特征中去除不重要的特征,而由于與類別互信息最大的特征的分類效果通常不會低于“影子”特征的分類效果,因此該特征不會被去除,包含在最優(yōu)特征子集中.

    1.3 時(shí)間復(fù)雜度分析

    假設(shè)給定數(shù)據(jù)集的樣本數(shù)為n,特征維數(shù)為m,則MIFS算法中求類別和每個(gè)特征之間的互信息的時(shí)間復(fù)雜度為O(mn2),對特征排序的時(shí)間復(fù)雜度為O(mlogm),迭代地對特征分組的復(fù)雜度在最壞的情況下為O(mn),所以MIFS算法的時(shí)間復(fù)雜度為O(mlogm+mn2).由于本文算法針對小樣本數(shù)據(jù),其中n?m,因此可以將樣本數(shù)n視為常數(shù),得到關(guān)于特征維數(shù)m的時(shí)間復(fù)雜度為O(mlogm).

    而MIFS-Boruta特征選擇算法的運(yùn)行時(shí)間是由MIFS算法和Boruta算法2部分運(yùn)行時(shí)間組成,如果用k表示第1階段MIFS算法得到的候選特征子集中特征的個(gè)數(shù),根據(jù)文獻(xiàn)[19]中的分析可知,Boruta算法的時(shí)間復(fù)雜度為O(kn),同理,在小樣本問題中可看作關(guān)于維數(shù)的時(shí)間復(fù)雜度O(k).綜上,MIFS-Boruta特征選擇算法的時(shí)間復(fù)雜度為O(mlogm)+O(k),又因?yàn)閗?m,因此算法的時(shí)間復(fù)雜度實(shí)際上為O(mlogm).

    2 實(shí)驗(yàn)結(jié)果與分析

    2.1 實(shí)驗(yàn)數(shù)據(jù)

    為了驗(yàn)證算法在高維數(shù)據(jù)上的性能和有效性,以及該方法是否適用于實(shí)際問題,本文使用了11個(gè)公開可用的數(shù)據(jù)集,特征數(shù)目在1 024~19 993之間,平均特征個(gè)數(shù)為6 924,其中6個(gè)數(shù)據(jù)集的維度超過了5 000,3個(gè)數(shù)據(jù)集具有不少于10 000維的特征,這些數(shù)據(jù)集主要是圖像和生物微陣列數(shù)據(jù),數(shù)據(jù)集的詳細(xì)信息如表1所示.為了便于處理,本文對連續(xù)型特征的數(shù)據(jù)使用等距離散化的方法進(jìn)行了預(yù)處理.實(shí)驗(yàn)在1臺i7-2600 3.40 GHz 4核處理器、4 GB內(nèi)存的電腦上運(yùn)行,開發(fā)環(huán)境為Matlab R2015a.

    Table 1 Datasets Used in the Experiments表1 實(shí)驗(yàn)數(shù)據(jù)集

    2.2 特征選擇結(jié)果比較

    為了驗(yàn)證本文算法是否能夠獲得較好的特征選擇結(jié)果,將本文的MIFS-Boruta算法與CMIM[10],ICAP(interaction capping)[20],CIFE(conditional infomax feature extraction)[21],mRMR[14],L1MI(L1 least-squares mutual information)[22]5種經(jīng)典的特征選擇算法進(jìn)行比較,其中CMIM,ICAP,CIFE,L1MI方法是基于互信息度量的過濾型特征選擇算法,mRMR是基于相關(guān)性度量的過濾型特征選擇算法.這些方法在使用時(shí)一般都要指定降維之后的特征數(shù),為公平起見,實(shí)驗(yàn)中將這些方法分別與Boruta方法結(jié)合,預(yù)先設(shè)定了特征選擇算法在每個(gè)樣本集上的候選特征數(shù)k,本文根據(jù)經(jīng)驗(yàn)將其設(shè)為原始數(shù)據(jù)集特征維數(shù)的1.5%~5%之間.表2為在不同數(shù)據(jù)集上各特征選擇算法選出的特征個(gè)數(shù).由于每種方法的第2階段都是Boruta,故本文表中的方法名稱都省略了-Boruta.

    Table 2 Feature Selection Results Under the Combinations of Different Feature Selection Algorithms and Boruta Algorithm表2 不同特征選擇算法與Boruta算法組合時(shí)特征選擇結(jié)果

    從表2可以看出所有的特征選擇算法所選出的特征個(gè)數(shù)遠(yuǎn)小于原始特征維度m,最終選出的特征個(gè)數(shù)也明顯小于候選特征個(gè)數(shù),CIFE算法在8個(gè)數(shù)據(jù)集上都得到了最少的特征個(gè)數(shù),ICAP和CMIM算法分別在2個(gè)和1個(gè)數(shù)據(jù)集上取得了最少的特征個(gè)數(shù),本文的MIFS方法所選出的特征個(gè)數(shù)在5個(gè)數(shù)據(jù)集上少于L1MI和mRMR,4個(gè)數(shù)據(jù)集上少于CIMI.

    5種算法分別和Boruta算法組合的特征選擇方法得到的5個(gè)特征子集中,存在部分與MIFS-Boruta算法所選特征相同的特征,相同特征的個(gè)數(shù)如圖1所示:

    Fig. 1 The comparison of the same features selected by MIFS-Boruta algorithm and other algorithms圖1 MIFS-Boruta算法與其他算法選出的相同特征比較

    從圖1可以看出,MIFS選出的特征與5種算法選出的特征中基本上都存在相同的特征,其中與mRMR方法所選特征最為相近,相同特征的數(shù)量最多.盡管MIFS與這些方法選出的特征不盡相同,但后邊的實(shí)驗(yàn)表明這對分類結(jié)果的影響不大.

    2.3 運(yùn)行時(shí)間比較

    由于確定最佳特征子集都采用算法Boruta,因此只需要比較6種算法在確定候選特征子集過程中的運(yùn)行時(shí)間,這些算法在11個(gè)數(shù)據(jù)集上的運(yùn)行時(shí)間結(jié)果如表3所示.為了比較的公平性,本實(shí)驗(yàn)將選出的特征數(shù)目k全部設(shè)定為150個(gè).從表3中可以看到,所提出的MIFS算法在8個(gè)數(shù)據(jù)集上的運(yùn)行時(shí)間均小于其他幾個(gè)基于互信息的特征選擇算法,只有在lung,pixraw10P,SMK_CAN_187這3個(gè)數(shù)據(jù)集上,MIFS算法稍慢于CMIM算法.因此在大多數(shù)數(shù)據(jù)集上,MIFS算法具有更高的運(yùn)行效率.

    Table 3 The Running Time of Different Feature Selection Algorithms表3 不同特征選擇算法運(yùn)行時(shí)間 s

    2.4 在特征子集的分類性能比較

    為了驗(yàn)證所提算法特征選擇的有效性,分別選取支持向量機(jī)(support vector machine, SVM),決策樹,K-近鄰(K-nearest neighbor, KNN) 3個(gè)分類器作為分類算法.SVM是監(jiān)督學(xué)習(xí)模型,本文使用常用的線性SVM模型;決策樹是通過學(xué)習(xí)算法構(gòu)造的樹形結(jié)構(gòu)的分類器,它是一種非線性分類器,本文使用經(jīng)典的ID3算法;對于KNN分類器,選用1NN算法(單最近鄰算法),它通過最鄰近的1個(gè)樣本的類別來決定待分樣本所屬的類別.在所有數(shù)據(jù)集上進(jìn)行10次十折交叉驗(yàn)證測試分類性能.

    實(shí)驗(yàn)使用3個(gè)指標(biāo)來評價(jià)特征子集選擇算法的性能:1)最低分類錯(cuò)誤率;2)平均最低分類錯(cuò)誤率;3)Win/Tie/Lose記錄(該記錄表示在給定度量上,所提算法獲得比其他特征選擇算法更好、相等和更差的性能的數(shù)據(jù)集數(shù)目,可簡記為W/T/L).

    不同特征選擇方法得到的特征子集在使用SVM、決策樹和KNN作為分類器時(shí)的最低分類錯(cuò)誤率分別如表4~6所示,表中的Average Error表示各方法在所有數(shù)據(jù)集下的平均最低分類錯(cuò)誤率,W/T/L行表示所提出方法在11個(gè)數(shù)據(jù)集上的分類錯(cuò)誤率勝于、相同、弱于其所在列的方法的數(shù)據(jù)集數(shù)目.

    Table 4 Classification Error Rate on SVM Classifier表4 SVM分類器上的分類錯(cuò)誤率 %

    Table 5 Classification Error Rate on Decision Tree Classifier表5 決策樹分類器上的分類錯(cuò)誤率 %

    Table 6 Classification Error Rate on CNN Classifier表6 KNN分類器上的分類錯(cuò)誤率 %

    從表4可以看出,在使用SVM作分類器時(shí),MIFS算法在4個(gè)數(shù)據(jù)集上取得了最低的分類錯(cuò)誤率,并且平均分類錯(cuò)誤率最低;在W/T/L指標(biāo)中,MIFS算法除了小幅落后于mRMR算法外,均優(yōu)于其他方法.因此MIFS算法選出的特征子集在SVM分類器上的表現(xiàn)良好.

    從表5可以看出,在使用決策樹作分類器時(shí),MIFS算法在5個(gè)數(shù)據(jù)集上取得了最低的分類錯(cuò)誤率,接近全部數(shù)據(jù)集的一半.對于平均分類錯(cuò)誤率,MIFS算法取得了第2名,僅與第1名相差0.2個(gè)百分點(diǎn);在W/T/L指標(biāo)中,MIFS算法均優(yōu)于其他方法.

    從表6可以看出,MIFS算法在KNN分類器上分別在4個(gè)數(shù)據(jù)集中取得了最低的分類錯(cuò)誤率,同時(shí)取得了最低的平均分類錯(cuò)誤率,低于第2名1.09個(gè)百分點(diǎn);從W/T/L指標(biāo)來看,MIFS算法也都優(yōu)于其他方法,因此MIFS算法選出的特征子集在KNN分類器上具有更好的分類性能.

    綜上,在使用最簡單的支持向量機(jī)、決策樹、KNN三種分類器時(shí),MIFS方法都取得了很好的分類結(jié)果.

    3 結(jié) 論

    本文提出了一種針對小樣本數(shù)據(jù)的特征選擇方法,該方法首先通過互信息對特征分組,選出組內(nèi)與類別相關(guān)性最大的特征,大大降低了數(shù)據(jù)集的維度.同時(shí)為了解決無法自動(dòng)給出最佳子集的問題,構(gòu)造了過濾型與封裝型算法結(jié)合的2階段混合模型,即MIFS-Boruta算法,該算法不僅降低了數(shù)據(jù)集的維度,而且能夠自動(dòng)確定最佳特征子集,實(shí)驗(yàn)驗(yàn)證了所提算法的有效性.該算法為解決小樣本問題提供了一種有效的方法.

    然而,MIFS-Boruta算法的候選特征個(gè)數(shù)需要人為設(shè)定,如果設(shè)定的值過大,則會影響最終特征選擇的運(yùn)行效率;如果設(shè)定的值過小,則會影響最終選出特征的性能.因此,如何自動(dòng)確定合理的候選特征個(gè)數(shù)還需要進(jìn)一步的研究.

    猜你喜歡
    互信息特征選擇子集
    由一道有關(guān)集合的子集個(gè)數(shù)題引發(fā)的思考
    拓?fù)淇臻g中緊致子集的性質(zhì)研究
    關(guān)于奇數(shù)階二元子集的分離序列
    Kmeans 應(yīng)用與特征選擇
    電子制作(2017年23期)2017-02-02 07:17:06
    基于互信息的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)
    聯(lián)合互信息水下目標(biāo)特征選擇算法
    改進(jìn)的互信息最小化非線性盲源分離算法
    電測與儀表(2015年9期)2015-04-09 11:59:22
    每一次愛情都只是愛情的子集
    都市麗人(2015年4期)2015-03-20 13:33:22
    基于增量式互信息的圖像快速匹配方法
    基于特征選擇和RRVPMCD的滾動(dòng)軸承故障診斷方法
    国产成人免费观看mmmm| 乱人伦中国视频| 欧美日韩一级在线毛片| 亚洲一区高清亚洲精品| 午夜成年电影在线免费观看| 免费在线观看日本一区| 韩国av一区二区三区四区| 亚洲自偷自拍图片 自拍| 老司机深夜福利视频在线观看| 韩国av一区二区三区四区| 精品卡一卡二卡四卡免费| 亚洲自偷自拍图片 自拍| 一边摸一边抽搐一进一出视频| 亚洲五月色婷婷综合| 女人被躁到高潮嗷嗷叫费观| 亚洲伊人色综图| 99精品欧美一区二区三区四区| 免费人成视频x8x8入口观看| 成熟少妇高潮喷水视频| 在线十欧美十亚洲十日本专区| 老熟女久久久| 久久中文字幕一级| 777米奇影视久久| 在线观看舔阴道视频| 天天躁夜夜躁狠狠躁躁| 美女高潮到喷水免费观看| 后天国语完整版免费观看| 亚洲欧洲精品一区二区精品久久久| 成年人午夜在线观看视频| 波多野结衣av一区二区av| 午夜福利在线免费观看网站| 老司机午夜十八禁免费视频| 一级毛片高清免费大全| 成人av一区二区三区在线看| 国产精品.久久久| 一级作爱视频免费观看| 黄色毛片三级朝国网站| 国产精品影院久久| 久久中文字幕一级| 欧美另类亚洲清纯唯美| 亚洲精品一卡2卡三卡4卡5卡| 国产一区在线观看成人免费| 国产精品 国内视频| 久久草成人影院| 国产亚洲精品一区二区www | 岛国毛片在线播放| 美女 人体艺术 gogo| 免费在线观看日本一区| 亚洲伊人色综图| 90打野战视频偷拍视频| e午夜精品久久久久久久| 9191精品国产免费久久| 午夜福利视频在线观看免费| 欧美日韩乱码在线| 熟女少妇亚洲综合色aaa.| 欧美性长视频在线观看| 亚洲国产看品久久| 免费看十八禁软件| 看免费av毛片| 精品亚洲成a人片在线观看| 国产精品一区二区在线观看99| 精品国产一区二区久久| 欧美人与性动交α欧美软件| av欧美777| 大型av网站在线播放| 狂野欧美激情性xxxx| 一本大道久久a久久精品| 国产日韩欧美亚洲二区| 国产成人精品无人区| 大片电影免费在线观看免费| 午夜激情av网站| 成年动漫av网址| 亚洲av日韩在线播放| 欧美一级毛片孕妇| 变态另类成人亚洲欧美熟女 | 日韩欧美国产一区二区入口| 香蕉丝袜av| 久久这里只有精品19| 欧美日韩国产mv在线观看视频| 精品人妻1区二区| 黄色视频,在线免费观看| 日韩一卡2卡3卡4卡2021年| 99久久99久久久精品蜜桃| 国产日韩欧美亚洲二区| 亚洲精华国产精华精| 国产精品 欧美亚洲| 亚洲专区国产一区二区| 老汉色av国产亚洲站长工具| 无人区码免费观看不卡| 亚洲va日本ⅴa欧美va伊人久久| 国产精品久久久av美女十八| av不卡在线播放| 欧美日韩精品网址| 免费在线观看影片大全网站| 一a级毛片在线观看| 国产亚洲欧美在线一区二区| a级毛片在线看网站| 久久久国产成人精品二区 | 亚洲专区字幕在线| 悠悠久久av| 少妇被粗大的猛进出69影院| 国产亚洲精品久久久久5区| 成人黄色视频免费在线看| 久久精品国产99精品国产亚洲性色 | 亚洲熟妇中文字幕五十中出 | 少妇裸体淫交视频免费看高清 | 亚洲美女黄片视频| 精品福利永久在线观看| 午夜免费鲁丝| 成人国产一区最新在线观看| 一夜夜www| 国产精品久久电影中文字幕 | 欧美激情高清一区二区三区| 成人国语在线视频| 国产亚洲精品久久久久久毛片 | av电影中文网址| 欧美av亚洲av综合av国产av| 久久精品成人免费网站| 男男h啪啪无遮挡| 午夜福利视频在线观看免费| 一区二区三区精品91| 夜夜躁狠狠躁天天躁| 午夜精品国产一区二区电影| 久久99一区二区三区| 国产精品 欧美亚洲| 一边摸一边做爽爽视频免费| 精品久久久久久久毛片微露脸| 国产97色在线日韩免费| 亚洲欧美激情在线| 国产精品一区二区在线观看99| 中文字幕色久视频| 精品国产超薄肉色丝袜足j| 亚洲av美国av| 18禁裸乳无遮挡动漫免费视频| 欧美日韩瑟瑟在线播放| 亚洲成av片中文字幕在线观看| 女警被强在线播放| 亚洲一区二区三区不卡视频| 亚洲视频免费观看视频| 久久香蕉激情| 亚洲色图av天堂| 美女高潮喷水抽搐中文字幕| 亚洲成国产人片在线观看| 曰老女人黄片| 午夜免费观看网址| 久久这里只有精品19| 757午夜福利合集在线观看| 人妻 亚洲 视频| 国产av精品麻豆| 日本一区二区免费在线视频| 欧美精品亚洲一区二区| 女性生殖器流出的白浆| 欧洲精品卡2卡3卡4卡5卡区| 成人av一区二区三区在线看| 欧美精品人与动牲交sv欧美| 在线观看免费高清a一片| 午夜福利视频在线观看免费| 麻豆国产av国片精品| 91在线观看av| 国产主播在线观看一区二区| 美女 人体艺术 gogo| 亚洲国产精品合色在线| 天堂动漫精品| 亚洲综合色网址| 国产亚洲av高清不卡| 黄色视频不卡| 国产精品欧美亚洲77777| 身体一侧抽搐| 男女下面插进去视频免费观看| 制服人妻中文乱码| 免费看a级黄色片| 满18在线观看网站| 看黄色毛片网站| 美女午夜性视频免费| 久久精品成人免费网站| 国产精品久久久久成人av| 亚洲成人国产一区在线观看| 成年女人毛片免费观看观看9 | 狠狠婷婷综合久久久久久88av| 中文字幕最新亚洲高清| 午夜影院日韩av| 一级,二级,三级黄色视频| 亚洲精品av麻豆狂野| 国产一区有黄有色的免费视频| 桃红色精品国产亚洲av| 9191精品国产免费久久| 高清视频免费观看一区二区| 亚洲avbb在线观看| 99久久人妻综合| a级毛片在线看网站| 美女福利国产在线| 久久亚洲精品不卡| 无人区码免费观看不卡| 久久久精品区二区三区| 99国产精品一区二区蜜桃av | 亚洲九九香蕉| xxxhd国产人妻xxx| 黄色女人牲交| 狂野欧美激情性xxxx| 精品国产亚洲在线| 午夜亚洲福利在线播放| 精品久久久久久久久久免费视频 | 日韩精品免费视频一区二区三区| 亚洲欧美激情综合另类| 亚洲欧美激情在线| 高清黄色对白视频在线免费看| 国产精品一区二区免费欧美| 国产精品香港三级国产av潘金莲| 国产精品秋霞免费鲁丝片| 老司机在亚洲福利影院| 大香蕉久久网| 成人18禁高潮啪啪吃奶动态图| 男人舔女人的私密视频| 久久精品成人免费网站| 亚洲国产精品合色在线| 俄罗斯特黄特色一大片| 中文字幕av电影在线播放| 精品一品国产午夜福利视频| 日本撒尿小便嘘嘘汇集6| 一级黄色大片毛片| 99国产综合亚洲精品| 欧美精品av麻豆av| 久久精品熟女亚洲av麻豆精品| 欧美色视频一区免费| 午夜日韩欧美国产| 久久精品国产a三级三级三级| 欧美日韩乱码在线| 午夜日韩欧美国产| 搡老岳熟女国产| 人人妻人人爽人人添夜夜欢视频| 久久人妻熟女aⅴ| 久久久久国产一级毛片高清牌| 欧美精品啪啪一区二区三区| 久久精品国产亚洲av香蕉五月 | 久热爱精品视频在线9| 精品乱码久久久久久99久播| 久久午夜亚洲精品久久| 久久国产亚洲av麻豆专区| 婷婷精品国产亚洲av在线 | 高清欧美精品videossex| 久久国产乱子伦精品免费另类| 亚洲九九香蕉| 18禁黄网站禁片午夜丰满| 脱女人内裤的视频| 妹子高潮喷水视频| 国产一区二区三区综合在线观看| 欧美日韩福利视频一区二区| 真人做人爱边吃奶动态| 国产野战对白在线观看| 国产精品成人在线| 又紧又爽又黄一区二区| а√天堂www在线а√下载 | 最近最新中文字幕大全免费视频| 亚洲av片天天在线观看| 在线免费观看的www视频| 国产97色在线日韩免费| 日韩欧美国产一区二区入口| 欧美人与性动交α欧美精品济南到| 美女国产高潮福利片在线看| 香蕉丝袜av| 亚洲 欧美一区二区三区| 80岁老熟妇乱子伦牲交| 久久久久国产一级毛片高清牌| 国产欧美日韩一区二区三区在线| 一区二区三区精品91| 久久久久国产精品人妻aⅴ院 | 老司机亚洲免费影院| 国产一区二区三区综合在线观看| 9色porny在线观看| 1024香蕉在线观看| svipshipincom国产片| 国产亚洲精品第一综合不卡| 国产极品粉嫩免费观看在线| 久久久久久免费高清国产稀缺| 亚洲av熟女| 亚洲午夜理论影院| av有码第一页| 精品少妇久久久久久888优播| 精品人妻在线不人妻| 国产97色在线日韩免费| 婷婷精品国产亚洲av在线 | 久久久国产欧美日韩av| 无人区码免费观看不卡| 999久久久国产精品视频| 超色免费av| 欧美精品啪啪一区二区三区| 国产亚洲精品久久久久5区| 啦啦啦视频在线资源免费观看| 另类亚洲欧美激情| 多毛熟女@视频| 亚洲美女黄片视频| 操美女的视频在线观看| 日韩制服丝袜自拍偷拍| 一级作爱视频免费观看| 老司机靠b影院| 18在线观看网站| 久久精品亚洲熟妇少妇任你| 叶爱在线成人免费视频播放| 色综合婷婷激情| 亚洲精品美女久久av网站| 国产人伦9x9x在线观看| 精品国产美女av久久久久小说| 99久久综合精品五月天人人| 久久久国产欧美日韩av| 精品无人区乱码1区二区| 999精品在线视频| 在线观看午夜福利视频| 亚洲欧美日韩另类电影网站| 亚洲五月天丁香| 一本大道久久a久久精品| 成人亚洲精品一区在线观看| 一区二区三区国产精品乱码| 亚洲成av片中文字幕在线观看| av一本久久久久| 午夜福利欧美成人| 91麻豆av在线| 天天影视国产精品| 中出人妻视频一区二区| 巨乳人妻的诱惑在线观看| 亚洲人成伊人成综合网2020| 午夜视频精品福利| 操出白浆在线播放| ponron亚洲| 视频在线观看一区二区三区| 亚洲专区国产一区二区| 亚洲一区二区三区欧美精品| 在线观看66精品国产| 51午夜福利影视在线观看| 女人爽到高潮嗷嗷叫在线视频| 女性生殖器流出的白浆| 一级毛片高清免费大全| 久久精品人人爽人人爽视色| 91精品国产国语对白视频| 十八禁网站免费在线| 高清在线国产一区| 1024香蕉在线观看| 国产在线精品亚洲第一网站| 高清视频免费观看一区二区| 亚洲欧美日韩高清在线视频| 国产野战对白在线观看| 国产不卡av网站在线观看| 少妇被粗大的猛进出69影院| 18禁裸乳无遮挡免费网站照片 | 欧美最黄视频在线播放免费 | 下体分泌物呈黄色| 女人久久www免费人成看片| 成人18禁在线播放| 美女视频免费永久观看网站| 国产亚洲精品久久久久5区| 欧美久久黑人一区二区| 久久国产乱子伦精品免费另类| 1024香蕉在线观看| 国产区一区二久久| 欧美日韩黄片免| 满18在线观看网站| 精品久久久久久久久久免费视频 | 午夜两性在线视频| 久久久国产精品麻豆| 国产男女内射视频| 好男人电影高清在线观看| 亚洲男人天堂网一区| 91av网站免费观看| 淫妇啪啪啪对白视频| 在线视频色国产色| bbb黄色大片| 精品国产亚洲在线| 一夜夜www| 人人妻人人添人人爽欧美一区卜| 欧美+亚洲+日韩+国产| 久久精品国产亚洲av高清一级| 自拍欧美九色日韩亚洲蝌蚪91| 精品少妇一区二区三区视频日本电影| 国产精品一区二区在线观看99| svipshipincom国产片| 丝瓜视频免费看黄片| 一级片免费观看大全| 91在线观看av| 一本一本久久a久久精品综合妖精| 久久久久视频综合| 免费在线观看影片大全网站| 欧美精品人与动牲交sv欧美| 亚洲精品av麻豆狂野| av在线播放免费不卡| 国产精华一区二区三区| 午夜免费观看网址| 免费不卡黄色视频| 久久国产精品影院| 国产精品九九99| 久久午夜综合久久蜜桃| 国产在线一区二区三区精| 中国美女看黄片| 高清欧美精品videossex| 少妇被粗大的猛进出69影院| 男人的好看免费观看在线视频 | 天天操日日干夜夜撸| 久久国产亚洲av麻豆专区| 国产精品久久久人人做人人爽| 免费不卡黄色视频| 精品国产亚洲在线| 久久久久久久精品吃奶| 免费在线观看日本一区| avwww免费| 午夜精品久久久久久毛片777| 美国免费a级毛片| 国产精品二区激情视频| 久久午夜亚洲精品久久| 99国产精品一区二区三区| 日本精品一区二区三区蜜桃| 在线av久久热| 一边摸一边做爽爽视频免费| 国产一区二区激情短视频| 狂野欧美激情性xxxx| 建设人人有责人人尽责人人享有的| 国产精品.久久久| 国产日韩一区二区三区精品不卡| 国产又爽黄色视频| 午夜老司机福利片| 日本黄色视频三级网站网址 | 真人做人爱边吃奶动态| 国产不卡av网站在线观看| 国产精品秋霞免费鲁丝片| 国产亚洲av高清不卡| 国产欧美亚洲国产| 高清av免费在线| 少妇粗大呻吟视频| 亚洲一区二区三区欧美精品| 韩国av一区二区三区四区| 另类亚洲欧美激情| 精品一区二区三区四区五区乱码| www日本在线高清视频| 日韩熟女老妇一区二区性免费视频| 国产精品一区二区在线不卡| 国产在线观看jvid| 久久久精品国产亚洲av高清涩受| 999久久久精品免费观看国产| 亚洲aⅴ乱码一区二区在线播放 | 每晚都被弄得嗷嗷叫到高潮| 很黄的视频免费| 在线观看一区二区三区激情| 色尼玛亚洲综合影院| 99热只有精品国产| 91精品国产国语对白视频| 丝袜美腿诱惑在线| 黄色成人免费大全| 制服诱惑二区| 国产野战对白在线观看| 免费av中文字幕在线| 男女床上黄色一级片免费看| 两个人看的免费小视频| 高清视频免费观看一区二区| 在线国产一区二区在线| 国产成人精品无人区| 国产精品亚洲一级av第二区| 中文字幕人妻熟女乱码| 日韩成人在线观看一区二区三区| 亚洲国产中文字幕在线视频| 男女床上黄色一级片免费看| 咕卡用的链子| 色精品久久人妻99蜜桃| 国产高清视频在线播放一区| 可以免费在线观看a视频的电影网站| 久久精品国产亚洲av香蕉五月 | 91av网站免费观看| 又紧又爽又黄一区二区| 国产精品美女特级片免费视频播放器 | 国产精品一区二区免费欧美| 亚洲av电影在线进入| 亚洲国产精品合色在线| 国产色视频综合| 大型黄色视频在线免费观看| 人妻久久中文字幕网| 亚洲,欧美精品.| 黄色毛片三级朝国网站| 高清黄色对白视频在线免费看| 亚洲成人免费电影在线观看| 久久久精品国产亚洲av高清涩受| avwww免费| 高潮久久久久久久久久久不卡| 午夜福利在线免费观看网站| 97人妻天天添夜夜摸| 成人黄色视频免费在线看| 极品少妇高潮喷水抽搐| 国产高清videossex| 日本黄色日本黄色录像| 搡老熟女国产l中国老女人| 亚洲国产欧美一区二区综合| 纯流量卡能插随身wifi吗| 欧美丝袜亚洲另类 | 免费看a级黄色片| 日韩欧美在线二视频 | 99国产精品一区二区三区| 99riav亚洲国产免费| 好男人电影高清在线观看| av网站在线播放免费| 欧美黑人欧美精品刺激| 日韩免费高清中文字幕av| 母亲3免费完整高清在线观看| 国产精品久久久久久精品古装| 国产区一区二久久| 国产91精品成人一区二区三区| 国产成人免费无遮挡视频| 最近最新中文字幕大全免费视频| 婷婷成人精品国产| 成年女人毛片免费观看观看9 | 熟女少妇亚洲综合色aaa.| 亚洲成av片中文字幕在线观看| 搡老熟女国产l中国老女人| 午夜福利在线观看吧| 91字幕亚洲| 久久精品国产99精品国产亚洲性色 | 久久国产精品人妻蜜桃| 免费高清在线观看日韩| 麻豆成人av在线观看| 热99re8久久精品国产| 日韩 欧美 亚洲 中文字幕| 亚洲欧美日韩高清在线视频| 性色av乱码一区二区三区2| 亚洲中文字幕日韩| 性少妇av在线| 1024香蕉在线观看| 天天躁日日躁夜夜躁夜夜| 最新的欧美精品一区二区| 久久人人97超碰香蕉20202| 国产精品免费大片| 国产亚洲欧美在线一区二区| 欧美日韩av久久| 日韩有码中文字幕| 亚洲国产看品久久| 久久 成人 亚洲| 在线看a的网站| 黄色 视频免费看| 亚洲精品乱久久久久久| 午夜福利,免费看| 无限看片的www在线观看| 国产精华一区二区三区| 亚洲国产精品sss在线观看 | av电影中文网址| 嫁个100分男人电影在线观看| 亚洲少妇的诱惑av| xxx96com| а√天堂www在线а√下载 | 精品欧美一区二区三区在线| 捣出白浆h1v1| 欧美日韩av久久| 国产国语露脸激情在线看| 久热这里只有精品99| 热re99久久国产66热| 中国美女看黄片| 新久久久久国产一级毛片| 久久热在线av| 亚洲七黄色美女视频| 国产一区二区三区视频了| 婷婷丁香在线五月| 大香蕉久久网| 久热爱精品视频在线9| 极品人妻少妇av视频| 亚洲成人国产一区在线观看| 日韩欧美国产一区二区入口| 亚洲熟女精品中文字幕| 每晚都被弄得嗷嗷叫到高潮| 国产成人av教育| 在线视频色国产色| 日韩欧美在线二视频 | 国产日韩一区二区三区精品不卡| 99精品欧美一区二区三区四区| 一级毛片精品| 亚洲人成77777在线视频| 欧美日韩瑟瑟在线播放| 久久精品成人免费网站| 少妇粗大呻吟视频| 亚洲免费av在线视频| 久久狼人影院| 淫妇啪啪啪对白视频| 午夜福利免费观看在线| 无限看片的www在线观看| 麻豆av在线久日| 女人被躁到高潮嗷嗷叫费观| 久久久久久亚洲精品国产蜜桃av| 日韩 欧美 亚洲 中文字幕| 中文字幕最新亚洲高清| 99在线人妻在线中文字幕 | 久久人妻熟女aⅴ| 在线观看免费视频日本深夜| 别揉我奶头~嗯~啊~动态视频| 国产日韩欧美亚洲二区| 国产精品免费大片| 亚洲av成人av| 国产亚洲精品一区二区www | 在线观看免费视频日本深夜| 国产精品一区二区在线观看99| 国产极品粉嫩免费观看在线| 999精品在线视频| 99久久国产精品久久久| 亚洲少妇的诱惑av| 人妻久久中文字幕网| 国产精品久久久人人做人人爽| 精品国产乱子伦一区二区三区| 露出奶头的视频| 欧美 亚洲 国产 日韩一| 母亲3免费完整高清在线观看| 超碰97精品在线观看| 极品人妻少妇av视频| 国产又色又爽无遮挡免费看| 久久久久久久久免费视频了| 人人妻人人澡人人爽人人夜夜| 变态另类成人亚洲欧美熟女 | 亚洲av欧美aⅴ国产| 男女午夜视频在线观看| av国产精品久久久久影院| 国产精品 国内视频| 波多野结衣av一区二区av| 免费一级毛片在线播放高清视频 | 狠狠狠狠99中文字幕| 黑人巨大精品欧美一区二区蜜桃| 黄片播放在线免费|