鄭 虹, 周麗媛, 韓旭明
(長春工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院, 吉林 長春 130012)
聚類是數(shù)據(jù)挖掘領(lǐng)域的一個重要分支,在無監(jiān)督條件下用于挖掘數(shù)據(jù)潛在結(jié)構(gòu)。目前已經(jīng)成功應(yīng)用于計(jì)算機(jī)科學(xué)、地理科學(xué)和經(jīng)濟(jì)領(lǐng)域[1-2]。聚類是根據(jù)數(shù)據(jù)樣本之間的相似性,將空間中n個數(shù)據(jù)樣本劃分成合理類簇的過程,聚類結(jié)果使得同一類簇內(nèi)的樣本具有較高相似性,不同類簇間的樣本具有較低相似性[3-5]。沒有任何一種聚類算法能夠適用于不同數(shù)據(jù)集所呈現(xiàn)的結(jié)構(gòu)[6]。鑒于此,針對不同數(shù)據(jù)集,多種不同聚類方法提出,傳統(tǒng)的聚類分析算法有分式聚類方法、層次聚類方法、基于密度的聚類方法和基于網(wǎng)格的聚類方法。
DPC算法是一種基于密度的聚類算法,由Alex Rodriguez等[7]在Science雜志上提出。DPC算法基于局部數(shù)據(jù)點(diǎn)的密度進(jìn)行聚類,能夠聚成任意形狀的類簇。其局部密度點(diǎn)計(jì)算方法靈感來源于均值偏移理論[8];其聚類分配與K中心聚類算法[9]相似,確定中心點(diǎn)后,將剩余數(shù)據(jù)點(diǎn)根據(jù)其與中心點(diǎn)的相似度分配給最近的中心點(diǎn)。K中心算法需要反復(fù)迭代確定聚類中心,具有較高復(fù)雜度。DPC算法不需要反復(fù)迭代確定聚類中心,而是通過密度大小和距離遠(yuǎn)近,人為手動劃出聚類中心,降低多次尋找聚類中心的復(fù)雜度。Alex Rodriguez認(rèn)為潛在聚類中心為:數(shù)據(jù)點(diǎn)自身要有較高密度,且距離其他密度更高點(diǎn)的距離較遠(yuǎn)。
布谷鳥算法是由Xin-She Yang和Suash Deb兩位學(xué)者于2009年提出,該算法利用布谷鳥特殊的繁育寄生機(jī)理和Levy飛行搜索機(jī)制,模擬出布谷鳥尋窩產(chǎn)卵行為的一種群體智能優(yōu)化算法。CS算法憑借Levy飛行隨機(jī)游動和偏好游動策略,在求解優(yōu)化問題時具有較好性能。其具有參數(shù)少、邏輯結(jié)構(gòu)簡單、全局搜索能力強(qiáng)等優(yōu)點(diǎn),目前已經(jīng)成功用于求解多種工程優(yōu)化問題,如異構(gòu)系統(tǒng)任務(wù)分配問題、無線傳感器網(wǎng)絡(luò)定位問題。
針對不同類型數(shù)據(jù),DPC算法具有較好聚類結(jié)果,但其也存在一些缺陷。
1)文獻(xiàn)[7]并沒有給出計(jì)算截?cái)嗑嚯x的方法,而聚類結(jié)果對于截?cái)嗑嚯x很敏感。
2)運(yùn)用歐氏距離作為聚類相似度的度量標(biāo)準(zhǔn),該標(biāo)準(zhǔn)忽略了數(shù)據(jù)間的方向信息。眾多學(xué)者對其進(jìn)行研究與改進(jìn)[10-20]。針對上述DPC算法的缺陷,提出布谷鳥優(yōu)化的密度峰值快速搜索聚類算法。首先運(yùn)用布谷鳥算法[21]優(yōu)化截?cái)嗑嚯x,根據(jù)布谷鳥搜索算法較強(qiáng)全局搜索能力,可以尋找到最優(yōu)的截?cái)嗑嚯x值。其次引入余弦相似度,基于方向與距離相結(jié)合的相似度能更好區(qū)分一些距離相等方向不同點(diǎn)的數(shù)據(jù)點(diǎn),特別是對于兩個類簇中間區(qū)域點(diǎn)的劃分。對于兩個類簇的中間區(qū)域數(shù)據(jù)點(diǎn),其到兩個聚類中心距離一樣,算法在對該點(diǎn)進(jìn)行分配時,可能會隨機(jī)分配,每次實(shí)驗(yàn)會分配給不同的聚類中心,出現(xiàn)誤差,引入余弦相似度后,會避免這種情況發(fā)生。實(shí)驗(yàn)結(jié)果表明,布谷鳥優(yōu)化的密度峰值快速搜索聚類算法與DPC算法相比,具有較好的聚類效果。
DPC算法的基本原理是以空間中任意兩點(diǎn)間歐氏距離為基礎(chǔ),假定聚類中心的局部密度大于其附近鄰居點(diǎn)局部密度,并且與密度更大數(shù)據(jù)點(diǎn)間距離(非歐氏距離)較遠(yuǎn)。為找到滿足以上兩個特點(diǎn)的聚類中心,DPC算法引入兩個量:
1)數(shù)據(jù)點(diǎn)i的局部密度ρi;
2)到比數(shù)據(jù)點(diǎn)i的局部密度大的數(shù)據(jù)點(diǎn)集合中,距離其最近點(diǎn)的距離δi。
文獻(xiàn)[7]認(rèn)為,當(dāng)數(shù)據(jù)點(diǎn)集合較大時,計(jì)算數(shù)據(jù)點(diǎn)i的局部密度:
ρi=∑χ(dij-dc)
(1)
其中:
當(dāng)數(shù)據(jù)點(diǎn)集合較小時,用指數(shù)核[7]計(jì)算數(shù)據(jù)點(diǎn)的局部密度ρi,計(jì)算公式為:
(2)
其中,dij為數(shù)據(jù)點(diǎn)i和j間的歐氏距離,dc>0,為截?cái)嗑嚯x,需手動給出。
計(jì)算數(shù)據(jù)點(diǎn)i的距離公式為:
(3)
對于局部密度最大數(shù)據(jù)點(diǎn)i的距離公式為:
(4)
文獻(xiàn)[7]采用決策圖的方式,認(rèn)為ρi和δi都比較大的點(diǎn)有可能成為聚類中心。
DPC算法步驟如下:
1)初始化截?cái)嗑嚯xdc,計(jì)算任意兩點(diǎn)間歐式距離dij,計(jì)算每個數(shù)據(jù)點(diǎn)的密度值ρi,并將其順序排序,計(jì)算判定距離δi;
2)確定聚類中心,并初始化數(shù)據(jù)點(diǎn)歸類屬性標(biāo)記;
3)對非聚類中心數(shù)據(jù)點(diǎn)進(jìn)行歸類;
4)將每個簇類中的數(shù)據(jù)點(diǎn)劃分為核心點(diǎn)和邊緣點(diǎn)。
布谷鳥算法是一種優(yōu)化算法,由Xin-She Yang等[21]提出?;诓脊萨B產(chǎn)卵習(xí)性和3條理想規(guī)則提出布谷鳥搜索算法。3條理想規(guī)則為:
1)每次只產(chǎn)1個蛋,并隨機(jī)選擇鳥巢孵化;
2)在隨機(jī)選擇的一組鳥巢中,最好的鳥巢位置被保留到下一代;
3)外來鳥蛋被鳥巢主人發(fā)現(xiàn)的概率是Рα∈[0,1]。
布谷鳥尋找下一代鳥窩位置χ(t+1)的更新公式為:
⊕Levy(λ)
(5)
式中:t----當(dāng)前迭代次數(shù);
α----步長控制因子,一般取α=1;
?----點(diǎn)對點(diǎn)乘法;
Levy(λ)----隨機(jī)搜索路徑,服從Levy分布,滿足Levy~u=t-λ(1<λ≤3)。
鳥窩位置更新后,產(chǎn)生隨機(jī)數(shù)k∈(0,1)與被發(fā)現(xiàn)概率Рα對比,大于被發(fā)現(xiàn)概率,則對當(dāng)前鳥巢位置更新,否則不變。
布谷鳥算法的實(shí)現(xiàn)步驟:
1)初始化種群,隨機(jī)產(chǎn)生n個鳥巢初始位置,并設(shè)置相關(guān)參數(shù);
2)計(jì)算每個鳥巢的適應(yīng)度值,并保留當(dāng)前最優(yōu)解;
3)每個鳥巢位置按照式(5)進(jìn)行更新;
4)計(jì)算目標(biāo)函數(shù)適應(yīng)度值,如果優(yōu)于上一代適應(yīng)度值,則鳥巢位置保留到下一代,否則保持原來鳥巢位置不變;
5)產(chǎn)生隨機(jī)數(shù)k,如果k大于被發(fā)現(xiàn)概率Рα,改變鳥巢位置,否則保持原來位置不變。
6)判斷當(dāng)前最優(yōu)解是否滿足條件,滿足則輸出全局最優(yōu)解,算法結(jié)束,否則轉(zhuǎn)2)。
余弦相似度是計(jì)算空間數(shù)據(jù)點(diǎn)間相似度的一種方法。該方法首先將數(shù)據(jù)點(diǎn)維度映射成空間向量,然后通過計(jì)算兩個數(shù)據(jù)點(diǎn)空間向量的夾角余弦值來衡量他們之間的相似性。兩個數(shù)據(jù)點(diǎn)向量夾角越小,即夾角余弦值越大,表明二者的方向越一致,相似度越高;而兩個數(shù)據(jù)點(diǎn)向量夾角越大,即夾角余弦值越小,表明二者的方向越不一致,相似度越低。該值越大,表明夾角越小,即二者的方向越一致,兩個向量越相似。兩個向量間的余弦值采用歐幾里德點(diǎn)積公式計(jì)算:
a·b=|a|×|b|cosθ,θ∈[0,2π]
(6)
余弦相似度定義如下:
(7)
式中:xi,xj----空間中任意兩點(diǎn)。
任意兩個向量夾角的余弦相似度是一條余弦曲線,在0°到180°隨著角度增加余弦值降低,而180°到360°隨著角度增加余弦值增加。鑒于余弦值不能隨著角度的增加而增加或者減小,余弦曲線不是單調(diào)函數(shù),根據(jù)兩個數(shù)據(jù)點(diǎn)間余弦值很難直觀地判斷數(shù)據(jù)點(diǎn)間方向,將余弦值取絕對值,引入指數(shù)函數(shù),使余弦值隨著方向的增加而增加。改進(jìn)的余弦相似度(方向因子)為:
(8)
鑒于DPC算法截?cái)嗑嚯xdc需要手動隨機(jī)給出,利用歐氏距離計(jì)算數(shù)據(jù)點(diǎn)的局部密度,此密度僅考慮到數(shù)據(jù)點(diǎn)間的距離,而忽略了數(shù)據(jù)點(diǎn)間的方向信息。對于數(shù)據(jù)量較大、數(shù)據(jù)點(diǎn)較為分散的數(shù)據(jù)結(jié)構(gòu),數(shù)據(jù)點(diǎn)間的方向會影響DPC算法聚類效果。提出用布谷鳥算法優(yōu)化dc,避免手動給出dc,通過引入余弦相似度來增加數(shù)據(jù)點(diǎn)局部密度的可靠性。
對于空間中m個n維數(shù)據(jù)點(diǎn)χ1,χ2,χ3, …,χm
χ1=(χ11,χ12,χ13,…,χ1n)
χ2=(χ21,χ22,χ23,…,χ2n)
?
χm=(χm1,χm2,χm3,…,χmn)
任意兩點(diǎn)χi,χj間歐式距離為:
(9)
m個數(shù)據(jù)點(diǎn)的歐氏距離矩陣為:
歐式距離衡量的是空間中各點(diǎn)的絕對距離,跟各個點(diǎn)所在的位置坐標(biāo)直接相關(guān)。其只考慮數(shù)據(jù)點(diǎn)間的實(shí)際距離,若數(shù)據(jù)點(diǎn)p到比其大的兩個潛在聚類中心距離相等,此時DPC算法的劃分準(zhǔn)則無法正確分配p。鑒于此,引入余弦相似度的指數(shù)形式,保證在歐式距離無法解決數(shù)據(jù)點(diǎn)分配問題時,提供一個相對較好的解決方案。在每個數(shù)據(jù)點(diǎn)計(jì)算歐式距離基礎(chǔ)上引入方向因子,此時,m個數(shù)據(jù)點(diǎn)的距離矩陣為
(10)
在DPC算法中,每次執(zhí)行需要手動輸入截?cái)嗑嚯xdc,原作者并沒有給出具體計(jì)算dc的規(guī)則,導(dǎo)致dc的選取缺少規(guī)范性。并且數(shù)據(jù)集聚類效果對于dc的取值比較敏感,dc取值過大,導(dǎo)致聚類個數(shù)多于真實(shí)簇類數(shù),相反,dc取值過小,導(dǎo)致聚類個數(shù)少于真實(shí)簇類數(shù)。因此,dc取值大小對DPC算法產(chǎn)生很重要的影響。布谷鳥算法是一種比較新穎的群體智能算法,具有參數(shù)少、結(jié)構(gòu)簡單等特點(diǎn)。該算法即能通過Levy飛行進(jìn)行全局搜索,又能通過偏好游動進(jìn)行局部尋優(yōu)。鑒于布谷鳥算法的較強(qiáng)全局搜索能力和局部搜索能力,能夠發(fā)現(xiàn)測試數(shù)據(jù)集的最優(yōu)聚類結(jié)構(gòu),提出引用布谷鳥搜索算法優(yōu)化dc,Silhouette指標(biāo)作為目標(biāo)函數(shù)。通過多次迭代,根據(jù)最優(yōu)聚類結(jié)果(Silhouette指標(biāo)最優(yōu))輸出最優(yōu)dc值。
布谷鳥優(yōu)化的密度峰值快速搜索聚類算法步驟如下:
1)初始化種群,種群個數(shù)為10(10個鳥巢),dc取值范圍為(Dmin,Dmax);
2)執(zhí)行DPC算法,獲得Silhouette指標(biāo);
3)保留當(dāng)前最優(yōu)Silhouette指標(biāo);
4)每個dc按照式(6)進(jìn)行更新;
5)計(jì)算每個dc所對應(yīng)的Silhouette指標(biāo),如果優(yōu)于上一代Silhouette指標(biāo),則dc值保留到下一代,否則保持原來dc值不變;
6)產(chǎn)生隨機(jī)數(shù)k,如果k大于被發(fā)現(xiàn)概率P,改變dc值,否則保持原來dc值不變;
7)當(dāng)前最優(yōu)解不變或者滿足最大迭代次數(shù),輸出相應(yīng)的Silhouette指標(biāo)和截?cái)嗑嚯xdc,算法結(jié)束,否則轉(zhuǎn)2)。
為了測試CS-DPC算法的準(zhǔn)確性能達(dá)到原始DPC 算法的聚類結(jié)果,選擇5個人工數(shù)據(jù)集和3個標(biāo)準(zhǔn)UCI數(shù)據(jù)集進(jìn)行測試,實(shí)驗(yàn)數(shù)據(jù)見表1。
表1 實(shí)驗(yàn)數(shù)據(jù)集
Flame、 Pathbased、 R15 和Spiral是二維并且樣本數(shù)較少的數(shù)據(jù)集,D31是二維但數(shù)據(jù)量相對較大數(shù)據(jù)集,Iris、 Wine和 Pima是多維數(shù)據(jù)集。布谷鳥種群規(guī)模為 20,迭代次數(shù)T=50,Pα=0.25。
為驗(yàn)證CS-DPC算法聚類結(jié)果的有效性,引入兩個有效性指標(biāo)來評價(jià)DPC算法和CS-DPC算法聚類結(jié)果,分別為內(nèi)部評價(jià)指標(biāo)Silhouette和外部評價(jià)指標(biāo)F-measure。
3.2.1 Silhouette指標(biāo)
Silhouette指標(biāo)用來評價(jià)聚類效果的內(nèi)部評價(jià)指標(biāo)。一般定義為,設(shè)一個具有n個樣本點(diǎn)的數(shù)據(jù)集被劃分為k個聚類Ci(i=1,2,…,k),a(t)為聚類C中的樣本點(diǎn)t與其所在的類中所有其它樣本的平均不相似度或距離,d(t,Ci)為Cj的樣本t到另一個類Ci的所有樣本的平均不相似度或距離,則b(t)=min{d(t,Ci)},其中i=1,2,…,k,且i≠j。樣本t的Silhouette指標(biāo):
(11)
聚類中的所有樣本的平均Silhouette值表示此類的緊密性和可分性;Silhouette取值范圍為[-1,1],Silhouette指標(biāo)越大,即越接近1,表示聚類質(zhì)量越好。
3.2.2 F-measure指標(biāo)
F-measure指標(biāo)結(jié)合查全率和準(zhǔn)確率用來評價(jià)聚類效果的外部評價(jià)指標(biāo)。對于一個真實(shí)類簇Pj和Ci,其準(zhǔn)確率P(i,j)和召回率R(i,j)的定義為:
(12)
(13)
相應(yīng)的F-measure指標(biāo)為:
(14)
將所有類簇的F-measure值加權(quán)求平均,得到整個聚類結(jié)果的F-measure值。
(15)
其中,N為樣本點(diǎn)個數(shù);F-measure值越大,算法越準(zhǔn)確。
使用MATLAB對CS-DPC算法和DPC算法進(jìn)行實(shí)驗(yàn)仿真。通過對5個人工數(shù)據(jù)集和3個標(biāo)準(zhǔn)UCI數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)仿真,結(jié)果表明,CS-DPC算法在聚類效果方面優(yōu)于DPC算法。
CS-DPC算法和DPC算法聚類結(jié)果的評價(jià)指標(biāo)見表2,聚類數(shù)目對比見表3。
表2 聚類結(jié)果的評價(jià)指標(biāo)對比
表3 聚類數(shù)目對比
從表2可以看出,對于數(shù)據(jù)集Flame、Pathbased、R15、D31,Wine 和Pima,CS-DPC算法的內(nèi)部指標(biāo)Sil 比DPC算法均有所提高,特別是數(shù)據(jù)集R15和 Pima,CS-DPC算法的Sil比DPC算法提高10%;數(shù)據(jù)集Wine,CS-DPC算法的Sil比DPC算法提高19%;數(shù)據(jù)集D31,CS-DPC算法的Sil比DPC算法提高40%。對于數(shù)據(jù)集Wine、R15和 D31,CS-DPC算法的準(zhǔn)確度FM比DPC算法提高13%、29%和51%,特別是對于數(shù)據(jù)集Flame和Spiral,CS-DPC算法的準(zhǔn)確度達(dá)到了100%。
從表3可以看出,DPC算法和CS-DPC算法聚類個數(shù)均可達(dá)到實(shí)際聚類個數(shù),DPC算法需手動給出參數(shù)dc值,而CS-DPC算法不用給出具體dc值,在一定范圍內(nèi),通過Levy飛行的全局搜索能力,可以直接給出最優(yōu)dc值的聚類結(jié)果。
Flame、Pathbased、R15和D31等數(shù)據(jù)集的聚類結(jié)果二維圖分別如圖1~圖4所示。
(a) DPC,dc=3%,1.133 6
(b) CS-DPC,dc=0.493 8
圖1 Flame聚類結(jié)果
(a) DPC,dc=3%,0.472 6
(a) DPC,dc=3%,1.897
(a) DPC,dc=3%,1.990 0
對于數(shù)據(jù)集Flame、R15、Pathbased,CS-DPC算法可以達(dá)到DPC算法的聚類效果,并且對于數(shù)據(jù)集D31,CS-DPC算法聚類效果要優(yōu)于DPC算法。
聚類結(jié)果對比如圖5所示。
(a) Silhouette指標(biāo)對比
(b) F-measure指標(biāo)對比
圖5 聚類結(jié)果對比圖
圖5(a)清晰地表明,CS-DPC算法聚類結(jié)果的內(nèi)部指標(biāo)與DPC算法對比,無論二維還是多維數(shù)據(jù)集,CS-DPC算法聚類結(jié)果準(zhǔn)確度相對于DPC算法都提高很多。圖5(b)表明,CS-DPC算法聚類結(jié)果準(zhǔn)確度比DPC算法聚類結(jié)果準(zhǔn)確度更高。
密度峰值快速搜索聚類算法是一種基于密度的聚類算法,基本原理類似均值偏移理論和K中心聚類算法。相比較其他聚類算法,DPC算法具有簡單高效的特點(diǎn)。布谷鳥算法利用布谷鳥特殊的繁育寄生機(jī)理和Levy飛行搜索機(jī)制,模擬出布谷鳥尋窩產(chǎn)卵行為的一種群體智能優(yōu)化算法。其具有參數(shù)少、邏輯結(jié)構(gòu)簡單、全局搜索能力強(qiáng)等優(yōu)點(diǎn),目前已經(jīng)成功用于求解多種工程優(yōu)化問題。CS算法憑借Levy飛行隨機(jī)游動和偏好游動策略,在求解優(yōu)化問題時具有較好性能?;贑S算法全局搜索能力和局部快速搜索的優(yōu)勢,提出布谷鳥優(yōu)化的密度峰值快速搜索聚類(CS-DPC)算法,解決DPC算法需手動給出截?cái)嗑嚯xdc的缺陷。改進(jìn)的算法引入方向因子解決兩個聚類中間部分?jǐn)?shù)據(jù)劃分問題。通過5個人工數(shù)據(jù)集和3個標(biāo)準(zhǔn)UCI數(shù)據(jù)集實(shí)驗(yàn)仿真,采用內(nèi)部評價(jià)指標(biāo)Silhouette和外部評價(jià)指標(biāo)F-measure驗(yàn)證兩個聚類結(jié)果的有效性。實(shí)驗(yàn)結(jié)果表明,CS-DPC算法的聚類結(jié)果和準(zhǔn)確度均優(yōu)于DPC算法。
參考文獻(xiàn):
[1] Xu R, C Wunsch D. Survey of clustering algorithms[J]. IEEE Transactions on Neural Networks,2005,16:645-678.
[2] J Frey B, Dueck D. Clustering by passing messages between data points[J]. Science,2007,315:972-976.
[3] 胡明,唐東凱,李芬田,等.不確定聚類中距離計(jì)算方法綜述[J].長春工業(yè)大學(xué)學(xué)報(bào),2017,38(5):477-483.
[4] Frey B J, Dueck D. Clustering by passing messages between data points[J]. Science,2007,315:972-976.
[5] Xu R, Wunsch D. Survey of clustering algorithms[J]. IEEE Trans Neural Netw Learn Syst.,2005,16:645-678.
[6] Sambasivam S, Theodosopoulos N. Advanced data clustering methods of mining Web documents[J]. Issues in Informing Science and Information Technology,2006(3):563-579.
[7] Rodriguez A, Laio A. Clustering by fast search and find of density peaks[J]. Science,2014,344:1492-1496.
[8] Cheng Y. Mean shift, mode seeking and clustering[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,1995,17:790-799.
[9] Kaufman L, JRousseeuw P. Finding groups in data: An introduction to cluster analysis[M]. [s.l.]:DBLP,1990.
[10] Du M, Ding S, Jia H. Study on density peaks clustering based on k-nearest neighbors and principal component analysis[J]. Knowledge Based Systems,2016,99:135-145.
[11] Wang M, Zuo W, Wang Y. An improved density peaks-based clustering method for social circle discovery in social networks[J]. Neurocomputing,2016,179:219-227.
[12] Aksehirli E, Goethals B, Muller E. Efficient cluster detection by ordered neighborhoods[C]// In Big Data Analytics and Knowledge Discovery.2015:15-27.
[13] Chen Y, Lai D, Qi H, et al. A new method to estimate ages of facial image for large database[J]. Multimedia Tools and Applications,2015(2):1-19.
[14] Li Y, Liu W, Wang Y. Co-spectral clustering based density peak[C]//In 2015 IEEE 16th International Conference on Communication Technology (ICCT).2015:925-929.
[15] Jia S, Tang G, Hu J. Band selection of hyperspectral imagery using a weighted fast density peak-based clustering approach[C]//In Intelligence Science and Big Data Engineering. Image and Video Data Engineering.2015:50-59.
[16] Xie K, Wu J, Yang W, et al. K-means clustering based on density for scene image classification[C]//Proceedings of the 2015 Chinese Intelligent Automation Conference.2015:379-386.
[17] Zhang W, Li J. Extended fast search clustering algorithm: widely density clusters, no density peaks[C]// Computer Science,2015.
[18] Aksehirli E, Goethals B, Muller E. Efcient cluster detection by ordered neighborhoods[C]//In Big Data Analytics and Knowledge Discovery.2015:15-27.
[19] Chen Y, Lai D, Qi H, et al. A new method to estimate ages of facial image for large database[C]//Multimedia Tools and Applications.2015:1-19.
[20] Jia S, Tang G, Hu J. Band selection of hyperspectral imagery using a weighted fast density peak-based clustering approach[C]//Intelligence Science and Big Data Engineering. Image and Video Data Engineering,2015:50-59.
[21] Yang X, Deb S. Cuckoo search via L’evy flights[C]//Proceedings of the World Congress on Nature and Biologically Inspired Computing (NABIC’09). [S.l.]: IEEE, 2009:210-214.