張 伍,陳紅梅
(西南交通大學(xué) 信息科學(xué)與技術(shù)學(xué)院,成都 611756)
多光譜或高光譜圖像是20世紀(jì)80年代興起的遙感空間技術(shù),通過搭載不同平臺的傳感器,能在連續(xù)緊密的光譜波波段上對目標(biāo)同時(shí)成像。高光譜數(shù)據(jù)是一個(gè)圖像立方體,它的前兩個(gè)維度代表圖像的空間位置,第三個(gè)維度代表圖像的波段,所以它的每一個(gè)像元是一條連續(xù)的光譜曲線,通過分析光譜曲線的特點(diǎn),可以得到像素點(diǎn)所代表的地物真值對象。也可以把像元看成一個(gè)模式,它的屬性值等于對應(yīng)波段上的輻射亮度值。高光譜圖像因?yàn)楹泻艽蟮男畔⒘?,使其在多種應(yīng)用(醫(yī)學(xué)、農(nóng)作生產(chǎn)、礦物勘探等)方面具有很大的價(jià)值,但因波段之間具有較高的冗余,所以存在存儲空間消耗大、計(jì)算時(shí)間長、圖像分類時(shí)可能存在“HUGHES”問題[1];因而需要對高光譜圖像進(jìn)行處理,降低它的維度并且同時(shí)保留較高的地物分類的能力。
高光譜降維技術(shù)分為特征選擇以及特征提取。在特征提取中,經(jīng)過一系列數(shù)學(xué)的變換,可將原來的所有波段數(shù)據(jù)壓縮為新的數(shù)據(jù)以代替原來的數(shù)據(jù)集,如主成分分析[2]、獨(dú)立成分分析[3]、局部線性嵌入[4]等?;谧儞Q的降維方式,其優(yōu)點(diǎn)是可以經(jīng)過若干變換直接將高維數(shù)據(jù)減少到幾維甚至一維,降維后會縮短數(shù)據(jù)進(jìn)一步分析處理時(shí)間。缺點(diǎn)是對圖像進(jìn)行了變換,改變了圖像原有的特性,使一個(gè)特征下的值無法還原成為對應(yīng)的圖像中的值。高光譜波段選擇是指從原始數(shù)據(jù)集中挑選出一些未經(jīng)變換過的波段圖像組成高光譜圖像子集,并盡可能反映原始高光譜圖像的特性。高光譜圖像波段選擇不會破壞原本圖像本身的物理屬性,其結(jié)果解釋性更強(qiáng)。
根據(jù)是否使用地物真值信息,高光譜圖像波段選擇算法又分為無監(jiān)督波段選擇算法和有監(jiān)督波段選擇算法。Liu等[5]基于鄰域粗糙集理論進(jìn)行高光譜波段選擇,并分析了算法的穩(wěn)定性;Patra等[6]用粗糙集理論計(jì)算每個(gè)光譜波段的相關(guān)性和重要度,定義了一個(gè)新的準(zhǔn)則用來選擇有效的波段;Guo等[7]根據(jù)真實(shí)地物真值表與波段圖像間的互信息進(jìn)行高光譜波段選擇。這些方法進(jìn)行高光譜波段選擇時(shí),需要依靠地物真值信息表,是有監(jiān)督波段選擇方法。劉春紅等[8]提出了通過計(jì)算高光譜信息含量以及與前后波段相似度之和的比值,進(jìn)行優(yōu)先度排序的自適應(yīng)波段選擇算法。學(xué)者們提出的使用相對熵作為衡量波段信息含量的最大信息量方法[9]、基于選取聚類中代表波段的方法[10-11]則屬于無監(jiān)督波段選擇方法,它們不需要地物真值信息,直接進(jìn)行波段圖像選取。
本文提出了一種基于核模糊粗糙集理論的有監(jiān)督高光譜波段選擇算法。它考慮波段像素類分布,定義一種新的度量方式。算法同時(shí)考慮波段相似性及波段信息熵選擇波段,直至達(dá)到預(yù)先設(shè)定的波段個(gè)數(shù)。這種方式產(chǎn)生的波段子集波段間冗余小,且信息含量大。本文算法與相關(guān)波段選擇算法進(jìn)行了比較,具有較好的效果。
經(jīng)典粗糙集理論是一種分析不精確和不確定信息的數(shù)學(xué)范式,它能夠在不損失有效信息的情況下獲得數(shù)據(jù)核心知識,對數(shù)據(jù)進(jìn)行約簡,實(shí)現(xiàn)數(shù)據(jù)的分類和預(yù)測;然而,在實(shí)際應(yīng)用中,對象屬性值可能是模糊的或者是數(shù)值型的,它們間的關(guān)系不能如經(jīng)典粗糙集中通過等價(jià)關(guān)系進(jìn)行判斷。因而Dubois和Prade提出了模糊粗糙集理論,推廣了經(jīng)典粗糙集。
定義1[12]設(shè)U是論域,A:U→ [0,1],則稱A是U上的一個(gè)模糊集合,A(x)稱為模糊集合A的隸屬函數(shù)。對?x∈U,A(x)表示x隸屬于模糊集合A的程度,簡稱為隸屬度。U上全體模糊集合的類稱為U的模糊冪集,用F(U)表示,A∈F(U)意指A是U上的一個(gè)模糊集合。
定義2[13]設(shè)U,V為兩個(gè)論域,當(dāng)滿足R∈F(U×V)時(shí),則稱R為U到V的一個(gè)模糊關(guān)系,隸屬度R(u,v)稱為(u,v)∈(U×V)關(guān)于R的相關(guān)程度。
定義3[12]設(shè)U是有限論域,U≠?,且R∈F(U×V),若x,y,z∈U滿足:
自反性:R(x,x)=1;
對稱性:R(x,y)=R(y,x);
min-max傳遞性:min(R(x,y),R(y,z))≤R(x,z);
則稱R是模糊等價(jià)關(guān)系。
定義4[13]設(shè)R為論域U上的一個(gè)模糊等價(jià)關(guān)系,A是U的一個(gè)模糊子集,模糊粗糙集的上近似集以及下近似集定義為:
定義5[15]給出一個(gè)非空有限論域U,如果一個(gè)實(shí)值函數(shù)k:U×U→R,是對稱且半正定的,稱它為核函數(shù)。
4)圓核:
5)球核:
‖x-y‖<δ
其中:
定義7[17]給定決策系統(tǒng)DIS=〈U,C∪D,V,f〉,RG是論域U上的高斯核模糊等價(jià)關(guān)系。U被決策屬性劃分為{d1,d2,…,dn},那么D對B?C的模糊正域定義如下:
定義8[17]給定決策系統(tǒng)DIS=〈U,C∪D,V,f〉,RG是論域U上的核模糊等價(jià)關(guān)系。U被決策屬性劃分為{d1,d2,…,dn},那么D對B?C的屬性依賴度定義如下:
本文提出了基于核模糊粗糙集(Fuzzy Rough Set, FRS)的高光譜波段選擇算法。它能在獲得有效地物信息時(shí),確定波段間的相似性。算法采用最大相關(guān)性最大重要度的搜索策略對高光譜圖像進(jìn)行波段選擇,這樣既考慮了波段間相似性又考慮了波段圖像信息含量。
皮爾遜系數(shù)是一種常用的相似性度量方式。皮爾遜系數(shù)計(jì)算波段i與波段j間的相似性公式如下:
(1)
根據(jù)去除水汽污染的Indian Pines數(shù)據(jù)集為例,計(jì)算它的波段相似度矩陣,并將其可視化,如圖1所示。
圖1 相關(guān)性矩陣Fig. 1 Correlation matrix
在高光譜圖像中,波段值表示場景對不同波長電磁的反射率。從物理角度來看,波長較近的電磁波產(chǎn)生相似的反射率。圖1是由圖像的灰度來畫出來的。根據(jù)灰度圖像的亮度特點(diǎn)可以知道,亮度越高相似性越大,亮度越暗相似度越低。從圖1中可以發(fā)現(xiàn)對角線區(qū)域的亮度一直很高,因此可以說明相鄰近的波段之間相似性較強(qiáng),但是當(dāng)有時(shí)候能獲得地物真值信息的情況下,皮爾遜系數(shù)并不能利用地物真值信息。粗糙集能有效地分析不確定信息,而高光譜圖像相鄰波段之間相似性較強(qiáng),因此本文引入核模糊粗糙集定義了一種新的高光譜波段圖像間的相似性度量。
設(shè)U={x1,x2,…,xn}是高光譜圖像n個(gè)像元的集合,B={b1,b2,…,bm}為高光譜數(shù)據(jù)的m個(gè)波段的集合,這些像元以及波段組成了一個(gè)表T。T={wij|i=1,2,…,n,j=1,2,…,m},這里wij代表的是xi像元在波段bj下對應(yīng)輻射亮度值。設(shè)D為一個(gè)決策屬性集,其包含像元xi∈U的類標(biāo)簽,B為條件屬性集,因此,根據(jù)粗糙集理論,一個(gè)高光譜數(shù)據(jù)集可以用一個(gè)決策表T=(U,B∪D)表示。
根據(jù)定義8,可以求得波段bj與決策屬性D之間的屬性依賴度,以及波段bi與決策屬性D之間的依賴度,如果它們值大小接近,可以近似說明bi以及bj較為接近,但是這樣有可能不夠細(xì)化,因?yàn)殡m然每個(gè)波段下像素的屬性下近似總和一致,但是分布情況有較大差異時(shí),仍然具有較高的相似性。
故采用分別計(jì)算波段bi中每個(gè)像素與其決策屬性的下近似減去波段bj對應(yīng)像素的下近似的差值取絕對值,把所有像素對應(yīng)絕對值求和,代表波段bi以及波段bj之間的廣義距離。定義波段bi以及波段波段bj之間的距離公式如下:
(2)
故本文取式(2)的值的倒數(shù)作為相似性度量。
假設(shè)高光譜圖像數(shù)據(jù)集中有L個(gè)波段,可以計(jì)算出一個(gè)L×L的波段相關(guān)性矩陣。波段相關(guān)性矩陣可以被表示如下:
(3)
這里C表示所有波段之間的相關(guān)性,ci, j表示第i個(gè)波段以及第j個(gè)波段之間的相關(guān)性。ci, j值越大,波段i以及波段j之間的相關(guān)性越大。
高光譜波段選擇算法旨在選擇出信息量大且冗余小的波段子集。如果只考慮相關(guān)性則可能會忽略掉一些信息含量較大的波段。本文提出的核模糊粗糙集波段選擇算法把波段信息含量也納入了考量范圍。
根據(jù)香農(nóng)的信息理論,信息熵被用來衡量不確定信息的信息含量。假設(shè)A是一個(gè)隨機(jī)變量,a是它每一種可能的值。a的分布概率用PA(a)表示。信息熵定義如下:
(4)
一些方法直接使用信息熵作為一個(gè)評價(jià)標(biāo)準(zhǔn)在波段選擇中。在這些方法中,信息熵被用來衡量各個(gè)波段的信息含量,然后根據(jù)大小進(jìn)行排序,之后選擇信息熵大的那些波段,但是這樣會出現(xiàn)冗余的情況,可能兩個(gè)波段雖然信息量都很大,但是它們比較類似,對之后的分類精度并沒有很大提高。
圖2顯示了離散化之后計(jì)算的數(shù)據(jù)集Indian Pines中一個(gè)波段的信息熵變化曲線。
圖2 Indian Pines波段信息熵Fig. 2 Entropy of Indian Pines band
從圖2中可以看出每一個(gè)波段所對應(yīng)的信息熵即信息含量的大小,相鄰波段之間的信息熵在大多數(shù)情況下非常接近。
Zhang等[18]提出的波段相關(guān)性分析(Band Correlation Analysis, BCA)算法采用了最大相關(guān)性的思路,每次只挑選一個(gè)波段。假設(shè)準(zhǔn)備從全部波段L中選取n個(gè)波段,并且已經(jīng)選擇了m個(gè)波段,正準(zhǔn)備去選擇第m+1個(gè)波段。對于每一個(gè)待選擇的波段,當(dāng)前波段可以分為兩個(gè)集合,一個(gè)是已經(jīng)選擇了波段集合ΦS以及剩余未選選擇的波段集合ΦU,它們分別具有m,L-m-1個(gè)元素在集合內(nèi)。波段i的代表能力可以用式(5)計(jì)算:
(5)
Su(i)表示波段i與其他剩余未選擇波段之間的平均相似性。它的值越大,它越能代表其他波段。對于波段i的冗余部分用式(6)表達(dá):
(6)
它的值越小,冗余相對應(yīng)地也越小。
因此,在剩余未選擇波段中,可以把上述兩者結(jié)合起來,并根據(jù)信息熵選取選擇第m+1個(gè)波段。如式(7)所示:
S(i)=(Su(i)-Ss(i))×H(i)
(7)
然后每一次在剩余波段中計(jì)算S(i),把值最大的波段添加進(jìn)來,更新已選擇波段。
FRS算法流程如下所示。
1)
輸入s=?,B={b1,b2,…,bl},目標(biāo)選擇的波段數(shù)n。
2)
根據(jù)式(2),計(jì)算每個(gè)波段與其他波段的相關(guān)性。生成相關(guān)性矩陣。
3)
重復(fù)下述3個(gè)步驟直至選擇好預(yù)定的波段數(shù)。
4)
使用式(7),計(jì)算每一個(gè)在B中剩余波段的排序值。
5)
選擇bj∈B產(chǎn)生最大值的那個(gè)波段。
6)
更新S={s,bj},B={B-bj}。
S即為波段選擇結(jié)果。
為了驗(yàn)證本文提出的FRS波段選擇算法的可行性與有效性,本文下載了Indian Pines數(shù)據(jù)集。
數(shù)據(jù)集大概有一半的像素點(diǎn)為無法標(biāo)記的地物,它的地物真值分布不均勻,從幾十個(gè)到兩千余個(gè)不等。Indian Pines數(shù)據(jù)集采用的是機(jī)載成像光譜儀AVIRIS于1992年6月于美國印第安納州所拍攝。該圖像大小為145×145像素,其空間分辨率為25 m,光譜分辨率為10 nm,波長范圍0.4~2.5 μm,對應(yīng)的波段數(shù)為220個(gè)。目前,國內(nèi)外高光譜遙感數(shù)據(jù)的降維以及分類實(shí)驗(yàn)都廣泛采用此數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn)分析。美國普度大學(xué)曾針對該地區(qū)給出一份實(shí)地考察報(bào)告。區(qū)域主要位于印第安納州的西北方向。該區(qū)域內(nèi)主要被各種蔬菜和天然植被覆蓋,蔬菜主要為玉米、大豆、小麥等,天然植被主要為干草、森林、草地等。除此之外,還有一些是高速公路和鐵路,以及一座無線電發(fā)射塔和房屋等人工用地。數(shù)據(jù)中還有一些無法區(qū)分的具體類別的像素點(diǎn)以編號0表示。
此外,移除了20個(gè)水汽污染波段以及15個(gè)噪聲波段,用剩余的[4-102],[113-147],[166-216]波段進(jìn)行選擇。數(shù)據(jù)對應(yīng)的真實(shí)地物情況如圖3所示,16種地物類型及數(shù)目由表1所示。
圖3 Indian Pines數(shù)據(jù)Fig. 3 Indian Pines data
表1 印第安農(nóng)林?jǐn)?shù)據(jù)地物類別 Tab. 1 Culture feature categories of Indian agriculture and forestry data
為了檢測本文算法分類精度的優(yōu)劣程度,本文算法FRS將與基于歸一化互信息(Normalized Mutual Information, NMI)[7]、基于鄰域粗糙集(Dependency Measure of NRS theory,DMNRS)[5]、最大信息量(Max Information,MI)[9]以及BCA[18]波段選擇算法進(jìn)行比較。
1)最大信息量高光譜波段選擇算法。
高光譜圖像波段的具體信息含量是很難衡量出來的,可以通過計(jì)算高光譜圖像波段之間信息量的差,來間接計(jì)算高光譜波段的信息含量。使用相對熵可以衡量波段之間的信息量差。通過計(jì)算兩個(gè)波段間最小的相對熵,迭代移除對整體高光譜圖像信息含量影響最小的波段,最后留下的即為信息量大的波段子集,即波段選擇的結(jié)果。相對熵的公式如下:
(8)
如果相對熵越小,說明兩個(gè)波段之間的信息差異越小。
2)基于互信息高光譜波段選擇算法。
通過計(jì)算波段圖像與采集獲得的地物真值信息,可以得到兩者之間的統(tǒng)計(jì)相關(guān)性,因此可以用來評估每個(gè)波段對分類的相對效用,但是如果根據(jù)互信息大小直接進(jìn)行選取則會產(chǎn)生波段之間的冗余。通過設(shè)置鄰域?qū)挾纫约盎パa(bǔ)閾值的方式,避免將冗余的波段同時(shí)添加進(jìn)波段選擇子集。如果互補(bǔ)閾值過低,在將把目標(biāo)波段選入的同時(shí),會把鄰接波段全部移除,這樣可以減少冗余。
3)基于鄰域粗糙集高光譜波段選擇算法。
鄰域粗糙集(Neighborhood Rough Set,NRS)是粗糙集理論的一種擴(kuò)展,在特征選擇中得到了廣泛的應(yīng)用。NRS具有處理連續(xù)型數(shù)據(jù)的優(yōu)點(diǎn)。Liu等[5]提出的DMNRS算法鄰域依賴關(guān)系來評估波段的重要性。當(dāng)添加一個(gè)新的波段進(jìn)入已選擇子集時(shí),能通過屬性依賴度的變化情況衡量波段的重要性。變化越大,屬性的重要性也就越大。
4)波段相關(guān)性分析波段選擇算法。
BCA算法即基于波段相關(guān)性分析的高光譜波段選擇算法。它首先根據(jù)皮爾遜系數(shù)計(jì)算高光譜波段圖像間的相關(guān)性。算法隨后計(jì)算每個(gè)波段與剩余未選擇的全部波段的平均相關(guān)性以及已選擇進(jìn)波段子集的波段的平均相關(guān)性,根據(jù)兩者關(guān)系每次挑選一個(gè)當(dāng)前最佳的波段進(jìn)入子集。
實(shí)驗(yàn)使用Java語言編寫實(shí)現(xiàn)NMI[7]波段選擇算法、MI[9]波段選擇算法、DMNRS[5]波段選擇算法、BCA[18]高光譜波段選擇算法以及本文的FRS波段選擇算法。通過上述算法獲得選取后的波段子集。由于單一的分類器可能不能很好地衡量波段選擇后的子集優(yōu)劣,本文采用了J48、K最近鄰(K-Nearest Neighbors,KNN)分類器進(jìn)行分類精度比較。在WEKA默認(rèn)的十折交叉的方式下,本文分別選擇3~15個(gè)波段子集下的分類結(jié)果,進(jìn)行實(shí)驗(yàn)分析。在KNN分類器中,本文設(shè)置近鄰數(shù)為5。不同近鄰數(shù)對分類結(jié)果有少量的影響,但是隨著近鄰數(shù)增加,計(jì)算復(fù)雜度也會增加,波段選擇的有效性與近鄰數(shù)無關(guān)。因而綜合考慮,本文設(shè)置近鄰數(shù)為5。
1)J48分類結(jié)果。
在J48分類器下,本文分析選擇3~15個(gè)波段時(shí)候的分類精度變化情況。這里本文算法采用機(jī)器學(xué)習(xí)里最常用的高斯核,參數(shù)δ設(shè)置為0.32。實(shí)驗(yàn)結(jié)果如圖4(a)所示。從圖中發(fā)現(xiàn),DMNRS算法在挑選5~10個(gè)波段時(shí)具有較高的分類精度,但是仍然比不上本文的FRS算法。BCA算法的分類精度略高于NMI算法和MI算法。MI算法在波段個(gè)數(shù)較少時(shí)分類精度比不上同期其他幾個(gè)波段選擇算法。本文提出的FRS算法分類精度優(yōu)于其他波段選擇算法。
2)KNN分類結(jié)果。
在KNN分類器下,本文分析選擇3~15個(gè)波段時(shí)候的分類精度變化情況,同樣采用高斯核,并將參數(shù)δ設(shè)置為0.32。實(shí)驗(yàn)結(jié)果如圖4(b)所示。從圖中可知本文提出的FRS算法一直都有較高的分類精度,且隨著波段個(gè)數(shù)的增加,F(xiàn)RS算法的分類精度比其他算法有顯著提高。DMNRS算法分類精度有較大波動,在9個(gè)波段后分類精度有所降低。MI算法仍然分類精度較低。
圖4 不同波段選擇方法分類精度對比Fig. 4 Comparison of classification accuracy of different band selection methods
3)不同核函數(shù)的結(jié)果。
本文測試了高斯核函數(shù)、指數(shù)核函數(shù)、二次有理核函數(shù)等3種不同的核函數(shù),在參數(shù)設(shè)置為0.32時(shí),選取的3~15個(gè)波段時(shí)分類精度變化情況。采用J48和KNN分類器時(shí)的實(shí)驗(yàn)結(jié)果分別如圖5(a)、圖5(b)所示。
從圖5(a)、5(b)中可見高斯核函數(shù)在兩個(gè)分類器下從挑選4個(gè)波段開始一直具有較高的分類精度。在J48分類器下,高斯核與二次有理核的分類精度大致趨同,比指數(shù)核普遍高一些。在KNN分類器下,二次有理核在挑選較多波段時(shí)分類精度不及另外兩個(gè)核函數(shù)的分類精度。
圖5 不同核函數(shù)分類精度對比Fig. 5 Comparison of classification accuracy of different kernel functions
不同核函數(shù)下FRS算法在包含3~15個(gè)波段的情況下的總平均分類精度如表2所示。
表2 不同核函數(shù)分類精度 單位:% Tab. 2 Classification accuracy of different kernel functions unit:%
從表2中可見高斯核的分類精度比指數(shù)核及二次有理核高。二次有理核在J48分類器下分類精度比指數(shù)核高,在KNN分類器下指數(shù)核比二次有理核分類精度高。
4)不同高斯核參數(shù)的影響。
由于不同的高斯核參數(shù)δ在計(jì)算波段之間相似性的時(shí)候會導(dǎo)致不同的結(jié)果,故可能選擇出不同的波段子集。本文測試不同高斯核參數(shù)δ下選擇的波段子集,并測試包含3~15個(gè)波段的情況下分類器J48和KNN的平均分類精度。這里設(shè)置高斯核參數(shù)為0.22,0.32,0.45,0.5,0.55,0.60。實(shí)驗(yàn)結(jié)果如表3所示。
表3 Indian Pine平均分類精度 單位:% Tab. 3 Average classification accuracy of Indian Pine unit:%
從表3中可以發(fā)現(xiàn),隨著高斯核參數(shù)δ的變化,本文提出的FRS算法在J48分類器以及KNN分類器中一直具有較高的分類精度,且平均分類精度變化不大。
由于本文算法要通過核模糊粗糙集的方式計(jì)算波段之間的相似性矩陣,故本文算法時(shí)間復(fù)雜度偏高。設(shè)圖像像素?cái)?shù)為n,波段個(gè)數(shù)為f,目標(biāo)波段數(shù)為T,像素量化階數(shù)x,類標(biāo)個(gè)數(shù)y。本文算法首先計(jì)算每個(gè)波段圖像的信息熵,時(shí)間復(fù)雜度為O(f·n)。隨后計(jì)算波段圖像間的相似度矩陣。由于需要計(jì)算每個(gè)像素與最近異類點(diǎn)的距離,求相似度矩陣的時(shí)間復(fù)雜度為O(f2·n2),搜索部分的時(shí)間復(fù)雜度為O(T·f2),最后本文提出算法的時(shí)間復(fù)雜度為O(f2·(n2+T))。DMNRS算法的時(shí)間復(fù)雜度為O(n2·f·T),BCA算法的時(shí)間復(fù)雜度為O((T+n)·f2),MI算法的時(shí)間復(fù)雜度為O((f+n-T)·f2),NMI算法的時(shí)間復(fù)雜度為O((T+x·y·n)·f)。雖然本文算法分類精度高,但是通過比較上述算法的時(shí)間復(fù)雜度,本文提出算法的時(shí)間復(fù)雜度偏高。
本文根據(jù)模糊粗糙集理論,通過計(jì)算高光譜波段圖像像素類標(biāo)的下近似分布情況來得到波段圖像間的相似性。隨后在計(jì)算波段間相似性時(shí)引入信息熵的概念,該方法可以使得最后選出的波段子集中各波段間的冗余度小且各波段的信息含量大。實(shí)驗(yàn)結(jié)果表明,本文算法具有較好的效果。盡管本文工作產(chǎn)生了較好的效果,但是仍有一些可以改進(jìn)的地方。比如目前大多數(shù)高光譜波段選擇算法包括本文算法在內(nèi)需要人工給定選擇的波段個(gè)數(shù),未來希望能自動計(jì)算出合適的波段數(shù);同時(shí),本文算法采用核模糊粗糙集的方式計(jì)算相似度,雖然效果較好,但是時(shí)間復(fù)雜度略高,如何快速計(jì)算是進(jìn)一步的研究方向。