王 進,朱文曉,孫開偉,2,鄧 欣,陳喬松
(1.重慶郵電大學計算智能重慶市重點實驗室,重慶400065;2.韓國仁荷大學信息與通信工程系,仁川402-751)
DNA微陣列(DNA microarray),又名基因芯片(gene chip),是上世紀末分子生物學領(lǐng)域的一項重大技術(shù)突破。近年來,DNA微陣列技術(shù)已被廣泛應(yīng)用于生物醫(yī)學上的惡性腫瘤分子診斷、生物標簽辨別、藥物開發(fā)、分子靶向治療等相關(guān)領(lǐng)域。相對于傳統(tǒng)的基于形態(tài)學的癌癥分型方法,利用惡性腫瘤基因表達模型的差異,基于DNA微陣列的癌癥分型技術(shù)能夠有效地提高識別精度,辨別新的癌癥亞型,促進臨床治療。DNA微陣列數(shù)據(jù)具有基因數(shù)量多(通常數(shù)千甚至更多,其中包含大量冗余,不相關(guān)基因),樣本少(遠小于基因數(shù)量)的特點。針對上述特性,研究人員已提出了包括人工神經(jīng)網(wǎng)絡(luò)[1]、貝葉斯網(wǎng)絡(luò)[2]、支持向量機[3]等多種經(jīng)典分類器,以及多分類器集成[4]等方法來提高DNA微陣列數(shù)據(jù)分類精度。然而大量前期實驗結(jié)果表明,不同的分類器對同一DNA微陣列數(shù)據(jù)集分類效果不同;即使對同一數(shù)據(jù)集采用同種分類器,隨著提取特征基因和分類器學習過程的差異,分類性能也會有較大波動。在實際癌癥分子診斷應(yīng)用中偶然的一次失誤可能會造成嚴重的后果,因此對DNA微陣列數(shù)據(jù)分類穩(wěn)定性的研究具有重要意義。
超網(wǎng)絡(luò)(hypernetworks)是受生物分子網(wǎng)絡(luò)啟發(fā)而建立的一種基于超圖(hypergraph)的認知學習模型。組成超網(wǎng)絡(luò)的超邊(hyperedge)包含多個模式特征,可以表達特征變量之間的關(guān)聯(lián)性。通過演化學習,超網(wǎng)絡(luò)可以有效獲取與模式分類相關(guān)的特征組合,因此非常適用于基于DNA微陣列數(shù)據(jù)的癌癥分子診斷以及生物標簽發(fā)現(xiàn)等問題。在癌癥分型應(yīng)用中,作者[5-6]已成功利用超網(wǎng)絡(luò)模型實現(xiàn)對癌癥樣本與正常樣本分型和對癌癥基因間相互作用的有效挖掘。在傳統(tǒng)超網(wǎng)絡(luò)演化學習過程中,主要采用隨機的方式完成超邊庫初始化,超邊庫初始化的效果對演化學習后超網(wǎng)絡(luò)的分類性能有顯著影響。為提高超網(wǎng)絡(luò)分類性能,從改進其演化學習方式的視角,近年來先后出現(xiàn)了基于權(quán)值調(diào)整[7],和基于超邊替代[5-6]等學習方式。然而受隨機初始化超邊庫方法的制約,演化超網(wǎng)絡(luò)的分類性能通常不夠穩(wěn)定。本文從優(yōu)化超網(wǎng)絡(luò)的初始化過程入手,提出了一種基于殘差分析的演化超網(wǎng)絡(luò)分類模型。針對DNA微陣列數(shù)據(jù)中的海量基因,作者以基于95%的置信水平,運用殘差分析從中提取關(guān)聯(lián)性強的基因組合,完成對超邊庫的初始化。急性白血病、前列腺癌和肺癌3個數(shù)據(jù)集的實驗結(jié)果表明,通過優(yōu)化超網(wǎng)絡(luò)初始化過程,本文方法不僅具有較好的分類精度,而且有效提高了分類器的穩(wěn)定性和收斂效果。
超網(wǎng)絡(luò)是超圖的推廣,超圖G是由超邊組成的無向圖,所謂超邊是指它所連接的頂點個數(shù)可以大于2,即G=(V,E),其中V={v1,v2,…,vn}是包含n個頂點的集合,E={e1,e2,…,em}是包含m條超邊的集合,E中每個元素ei={vi1,vi2,…,vik},(k≥1)是一條連接k個頂點的超邊。圖1為一個擁有7個頂點4條超邊的超圖。
圖1 具有7個頂點4條邊的超圖Fig.1 A hypergraph with 7 vertexes and 4 hyperedges
對超圖的每條超邊賦予權(quán)值和類別標識形成超網(wǎng)絡(luò)模型,可以用1個三元組H表示:H=(V,E,W)。其中V是特征變量集合,n表示V的大小。E={e1,e2,…,em}為超網(wǎng)絡(luò)的超邊集合,超邊ei={vi1,vi2,…,vik,yi}由k個特征及類別標識yi組成,k(1≤k≤n)稱為超邊的階數(shù)。W={w1,w2,…,wm}是超邊的權(quán)值集合。圖2是一個包含7個特征3條超邊的超網(wǎng)絡(luò),圖中超邊線條的粗細代表了超邊權(quán)值的大小。
圖2 具有7個頂點3條超邊的超網(wǎng)絡(luò)Fig.2 A hypernetwork with 7 vertexes and 3 hyperedges
超網(wǎng)絡(luò)經(jīng)過演化學習形成分類器。超邊連接的頂點被看作決策屬性,超邊作為決策規(guī)則,大量超邊組成的超網(wǎng)絡(luò)就是一個決策系統(tǒng):對于給定的輸入模式X={X1,X2,…,Xn},它能輸出該模式所對應(yīng)的類別。當超邊包含的頂點特征值與樣本對應(yīng)的特征值相等,且超邊的類別標識與樣本的類別相同時稱為2者正確匹配,否則為錯誤匹配。
根據(jù)輸入訓練集D,對其中每個樣本的特征進行多次采樣,建立一個初始化超邊庫;再通過演化學習形成超網(wǎng)絡(luò)分類器,超網(wǎng)絡(luò)分類器利用所有超邊共同做出決策,輸出該模式所對應(yīng)的類別Y。
D具有以下形式
(1)式中:N為訓練集樣本總數(shù);Xi為第i個訓練樣本;xij表示第i個樣本的第j維特征的表達值;n表示特征空間大小;yi為Xi的類別標識。
超網(wǎng)絡(luò)分類器H(X)可以表示輸入模式X與輸出類別Y∈{0,1}的聯(lián)合概率P(X,Y)。該聯(lián)合概率可以通過對超邊進行點估計近似得到
在分類過程中,超網(wǎng)絡(luò)的每條超邊與樣本X進行匹配,通過計算輸入樣本X屬于每個類別的條件概率,取條件概率最大的類別作為分類結(jié)果
(4)式中,P(X)≈|M|/|L|表示輸入樣本X被超網(wǎng)絡(luò)學習記憶的概率,通過計算所有與輸入樣本X匹配的超邊數(shù)|M|與超邊總數(shù)的比值得出。由(2)式和(4)式得
超網(wǎng)絡(luò)分類器的分類過程如下:
1)對超網(wǎng)絡(luò)進行初始化和演化學習;
2)輸入待分類樣本X;
3)根據(jù)以下步驟對輸入樣本X進行分類:
①將X與L中所有超邊進行匹配,并將與X匹配的超邊放入集合M中。
②對集合M中的超邊根據(jù)超邊的類別標識劃分:類別為0的超邊歸類到M0中,將類別為1的超邊歸類到M1中。
關(guān)聯(lián)性是指屬性之間的相互關(guān)聯(lián),相互作用,廣泛應(yīng)用于屬性選擇、數(shù)據(jù)清理等方面。研究表明DNA微陣列數(shù)據(jù)特征維數(shù)高,包含噪音,屬性之間以及屬性與樣本類別之間有著很復(fù)雜的關(guān)聯(lián)性。而在傳統(tǒng)超網(wǎng)絡(luò)初始化過程中,一般通過從訓練集中隨機挑選屬性值形成超邊,但是并非任意屬性組合都能與樣本的類別相關(guān)聯(lián)。為了解決這個問題,本文采用殘差算法對超網(wǎng)絡(luò)進行初始化,再利用梯度下降法對超網(wǎng)絡(luò)進行演化學習,保證了每條超邊的分類性能。
殘差算法基于顯著性檢驗,可以挖掘出關(guān)聯(lián)性強的屬性組合。首先假設(shè)選取的屬性相互獨立,然后判斷總體的真實情況與原假設(shè)是否有顯著性差異。殘差是指觀測值與預(yù)測值之間的差[8],標準殘差有一個利于計算的特性,殘差的平方和服從卡方分布,故在其方差近似為1,均值近似為0時殘差服從正態(tài)分布[9]。為了精確計算,本文設(shè)定置信水平為95%,根據(jù)正太分布和置信水平計算得到拒絕域臨界值為1.96,把殘差值和臨界值比較,當落入拒絕域時,拒絕原假設(shè),即顯著表明真實的差異存在,也就選取出了彼此具有很強的關(guān)聯(lián)性的屬性組合。根據(jù)殘差方法選取頂點組成超邊也就可以保證超網(wǎng)絡(luò)的分類特性。
訓練集D包含M個樣本,每個樣本包含N個屬性值,訓練集D={D1,D2,…,DM},Dm表示第m個樣本,屬性集X={X1,X2,…,XN},XN為樣本類別集合,第n個屬性集Xn={x1n,x2n,…,xMn}屬性值xin∈{0,1}。初始超網(wǎng)絡(luò)超邊庫為空,訓練集中的每個類別值形成100條階數(shù)為1的超邊。
超邊ej從訓練集中挑選屬性值形成頂點。首先假設(shè)選取的屬性相互獨立,則超邊的邊界概率Pr應(yīng)與預(yù)測概率有顯著的差別。超邊ej={v1,v2,…,vp}未檢測過的屬性集為X*,X*?X。隨機從X*中選取屬性Xn,屬性值xn=0,將此屬性加入超邊ej。定義超邊頂點組合的觀測值為obs,它是訓練集中可與超邊匹配的樣本數(shù)。例如:對于超邊ej,訓練集中可與此屬性組合匹配的樣本數(shù)為26,則超邊ej的obs=26。
對于預(yù)測值e
(6)式中,D*為訓練集中與該超邊類別相同的樣本數(shù)。邊界頻率Pr(vj=xin)=k/M,為超邊頂點vj相應(yīng)屬性值在訓練集中的比例,k為vj出現(xiàn)的次數(shù)。如頂點對應(yīng)屬性X9,屬性值x9=0,在屬性集X9中有18個屬性值為0的元素,則k=18。因超邊階數(shù)過大時將難以進行統(tǒng)計測試[8],故限制預(yù)測值e>ωe(ωe為常數(shù))以限制其階數(shù)范圍,使事件符合統(tǒng)計顯著性的測試條件。
區(qū)別Pr與預(yù)測概率等價于區(qū)別obs與e,用標準殘差z衡量他們之間的差異[8]
為了確保z的方差近似為1,均值近似為0,也就是保證殘差服從正態(tài)分布。對z進行如下調(diào)整得到調(diào)整殘差d。如果d的絕對值大于1.96,則obs與e差異的顯著性水平大于95%,則原假設(shè)失敗
(8)式中,v是z的最大似然估計。v=(1-∏Pri)(1-Prn),Pri表示超邊已有頂點的邊界概率,Prn表示新增頂點的邊界概率。如果e>ωe且d>1.96,說明該屬性組合有較強的關(guān)聯(lián)性,則將此屬性值加入超邊,否則改變該屬性值并檢測,滿足則加入超邊庫,否則繼續(xù)選取其他屬性進行檢測?;跉埐罘治龅某W(wǎng)絡(luò)初始化過程如下
1)初始化。
初始化超邊庫L為空,訓練集中的每個特征屬性形成100條階數(shù)為1的超邊;
2)超邊的頂點(屬性)選取。
①從該超邊未檢測過的屬性集中隨機選取一個屬性,屬性值設(shè)為0,加入超邊;
②根據(jù)新形成的屬性組合(超邊),按(8)式和式(10)分別計算e和d,如果滿足e>ωe且d>1.96,則將此屬性加入超邊,執(zhí)行步驟④,否則執(zhí)行步驟③;
③將屬性值改為1,按照新的屬性組合,計算e和d,如果滿足條件,則將該屬性加入超邊,否則將該屬性刪除,并執(zhí)行步驟④;
④如超邊已將所有屬性檢測完畢,則執(zhí)行3),否則執(zhí)行步驟①;
3)檢驗是否完成全部超邊的頂點選取,如完成則結(jié)束,否則為下一條超邊選取頂點,執(zhí)行2)。
為了更直觀地說明超網(wǎng)絡(luò)初始化過程中的超邊頂點選取操作,圖3描述了在數(shù)據(jù)集D中(包含6個樣本,10個屬性),為超邊e={v1=1,y=0}選取并添加一個頂點的過程。
圖3 基于殘差算法的屬性選擇過程Fig.3 Process of vertex selection based on residual algorithm
本文采用梯度下降法對超網(wǎng)絡(luò)進行演化學習。通過降低分類錯誤超邊的權(quán)值,同時提高分類正確超邊的權(quán)值,增強分類正確超邊在分類過程中的作用,其學習過程如下:
對訓練集中的每個樣本進行超邊匹配,C表示匹配正確的超邊數(shù),C0表示其中類別為0的超邊數(shù),C1表示類別為1的超邊數(shù)。如果C0>C1則Y=0,P=C0/C,反之Y=1,P=C1/C。若Y與該樣本的類別不同,說明大多數(shù)超邊分類錯誤,將其中分類錯誤的超邊權(quán)值進行以下變化,Weight=Weight+0.25*(0.0-P),分類正確的超邊權(quán)值進行以下變化Weight=Weight+0.25*(1.0-P)。
因在演化學習過程中改變了超邊的權(quán)值,故對所有超邊的權(quán)值按(9)式進行歸一化處理
(9)式中:Weight表示超邊權(quán)值;MaxNum表示超邊總數(shù);tatal表示全部超邊原權(quán)值之和。
本文采用急性白血病、前列腺癌和肺癌3個DNA微陣列數(shù)據(jù)集進行對比實驗。急性白血病數(shù)據(jù)集來源于麻省理工學院采集的72個不同病人的白血病樣本[5],包含ALL和AML 2種類型。其中38個樣本(27個ALL,11個AML)作為訓練集;另外獨立的34個樣本(20個ALL,14個AML)作為測試集。前列腺數(shù)據(jù)集[5]共136個樣本,其中102個樣本作為訓練集(52個癌細胞樣本和50個正常樣本),另外獨立的34個樣本作為測試集(包含25個癌細胞樣本和9個正常樣本)。肺癌數(shù)據(jù)集[5]包含惡性胸膜間皮瘤(malignant pleural mesothelioma,MPM)和肺腺瘤(lung adenocarcinoma,ADCA)2種類型,共181個樣本,其中32個樣本(16個MPM,16個ADCA)作為訓練集,另外獨立的149個樣本(15個MPM,134個ADCA)作為測試集。用信噪比[5]方法對3個數(shù)據(jù)集進行特征選擇,選取32個基因進行分類實驗。本文中所有平均實驗結(jié)果都來自50次獨立實驗。
在超網(wǎng)絡(luò)模型中,超邊階數(shù)的設(shè)定對系統(tǒng)分類性能有著較大影響[5-7]。本文中預(yù)測值e的取值直接影響超邊階數(shù)的范圍:超邊階數(shù)總體隨e的下限ωe的增大而減小。本文通過對3個DNA微陣列數(shù)據(jù)集的訓練集進行留一交叉驗證(leave one out cross validation,LOOCV)[5]測試,完成參數(shù) ωe的選擇和設(shè)定。
圖4給出了不同ωe設(shè)定下,殘差超網(wǎng)絡(luò)對急性白血病、前列腺癌和肺癌數(shù)據(jù)集訓練集的平均LOOCV識別率。當ωe為9時,殘差超網(wǎng)絡(luò)對急性白血病數(shù)據(jù)集的分類精度最高為99.87%,此時超邊階數(shù)在1到4之間;當ωe為5時,對前列腺癌數(shù)據(jù)集的分類精度最高為94.5%,此時超邊階數(shù)為3或4;而對肺癌數(shù)據(jù)集,當0<ωe<5時分類精度最高為100%,此時大多數(shù)超邊的階數(shù)為2。根據(jù)圖4,在后續(xù)對急性白血病、前列腺癌和肺癌的獨立測試集實驗中,ωe分別取值為9,5和4。
圖4 不同ωe下殘差超網(wǎng)絡(luò)對3個數(shù)據(jù)集的訓練集平均LOOCV識別率Fig.4 Average LOOCV-accuracy of residual hypernetworks with different parameters for three datasets
根據(jù)3.2節(jié)選取的ωe值,用3個數(shù)據(jù)集中的訓練集對殘差超網(wǎng)絡(luò)進行初始化和演化學習,然后對獨立的測試集進行分類。表1給出了殘差超網(wǎng)絡(luò)和傳統(tǒng)基于梯度下降法的超網(wǎng)絡(luò)[7]在急性白血病、前列腺癌和肺癌3個數(shù)據(jù)集上的獨立測試集分類效果對比。可以看出,通過優(yōu)化超網(wǎng)絡(luò)初始化過程,本文提出的殘差超網(wǎng)絡(luò)相對于傳統(tǒng)超網(wǎng)絡(luò)不僅具有較高的識別率,而且具有更好的分類穩(wěn)定性。
表1 對3個數(shù)據(jù)集的獨立測試集分類結(jié)果對比Tab.1 Classification performance comparison of three datasets
圖5、圖6為殘差超網(wǎng)絡(luò)與傳統(tǒng)超網(wǎng)絡(luò)對急性白血病和前列腺癌數(shù)據(jù)進行演化學習過程中的測試集識別率收斂效果對比。圖5、圖6中,對每個癌癥數(shù)據(jù)均進行了45次基于梯度下降的迭代學習。因傳統(tǒng)超網(wǎng)絡(luò)在對肺癌數(shù)據(jù)進行學習時,其首次迭代后的訓練集分類精度即達到100%,導(dǎo)致無法進行后續(xù)迭代學習,測試集分類精度無法提高(見表1),故未對該數(shù)據(jù)集上殘差超網(wǎng)絡(luò)與傳統(tǒng)超網(wǎng)絡(luò)的收斂性進行比較。
圖5 急性白血病數(shù)據(jù)的測試集識別率收斂效果對比Fig.5 Convergence comparison of the acute leukemia test datasets
圖6 前列腺癌數(shù)據(jù)的測試集識別率收斂效果對比Fig.6 Convergence comparison of prostate test datasets
根據(jù)圖5、圖6,殘差超網(wǎng)絡(luò)在迭代學習過程中對測試集的分類精度成穩(wěn)步上升趨勢,而且很快達到并保持最佳分類精度。而傳統(tǒng)超網(wǎng)絡(luò)的分類精度在迭代學習過程中上下震蕩周期較長,難以達到平衡。殘差超網(wǎng)絡(luò)具備更好的收斂性能,主要在于其初始化過程中限定了e和殘差條件,產(chǎn)生的超邊能更好地表達基因間的關(guān)聯(lián)性;而傳統(tǒng)超網(wǎng)絡(luò)則是無條件限制地隨機生成超邊,這樣就可能造成超邊的分類性能較低的情況。
殘差分析方法的引入不僅提高了超網(wǎng)絡(luò)的分類精度、穩(wěn)定性和收斂性,在超網(wǎng)絡(luò)階數(shù)設(shè)定方面也有一定優(yōu)勢。殘差超網(wǎng)絡(luò)的階數(shù)根據(jù)參數(shù)ωe自適應(yīng)產(chǎn)生,避免了傳統(tǒng)超網(wǎng)絡(luò)對階數(shù)的硬性設(shè)定,進而避免產(chǎn)生屬性冗余項。比如數(shù)據(jù)實際只有3階高階關(guān)聯(lián)性,傳統(tǒng)超網(wǎng)絡(luò)卻可能設(shè)定其超邊階數(shù)超過3階。
表2、表3和表4分別給出了殘差超網(wǎng)絡(luò)分類器與其他現(xiàn)有模式識別方法在3個數(shù)據(jù)集中的獨立測試集平均識別率??梢钥闯?,殘差超網(wǎng)絡(luò)具有與其他分類方法可比的分類精度。
表2 不同分類算法對急性白血病數(shù)據(jù)獨立測試集的平均識別率對比Tab.2 Average accuracy comparison of the acute leukemia test datasets with different classification algorithm
表3 不同分類算法對前列腺癌數(shù)據(jù)獨立測試集的平均識別率對比Tab.3 Average accuracy comparison of prostate test datasets with different classification algorithm
表4 不同分類算法對肺癌數(shù)據(jù)獨立測試集的平均識別率對比Tab.4 Average accuracy comparison of lung test datasets with different classification algorithm
本文提出了一種基于殘差算法的演化超網(wǎng)絡(luò)超邊初始化方法.通過運用殘差分析對超邊庫進行初始化,其后采用梯度下降法演化學習超網(wǎng)絡(luò)分類模型,得到以下結(jié)論:
1)基于殘差算法初始化的超網(wǎng)絡(luò)可有效獲取關(guān)聯(lián)性較強的超邊組合,解決了傳統(tǒng)演化超網(wǎng)絡(luò)在超邊初始化過程中存在較大的隨機性,影響DNA微陣列數(shù)據(jù)分類效果的問題。
2)因為超邊頂點根據(jù)殘差算法自主生成,避免了超網(wǎng)絡(luò)階數(shù)設(shè)定的硬性要求。
3)殘差超網(wǎng)絡(luò)相較于傳統(tǒng)超網(wǎng)絡(luò)分類器在總體分類精度、分類穩(wěn)定性和學習算法收斂性方面都有一定的提高。
[1]SENAPATI M R,MOHANTY A K,DASH S,et al.Local linear wavelet neural network for breast cancer recognition[J].Neural Computing and Applications,2013,22(1):125-131.
[2]MUTALIB M A,CHAI L E,CHONG C K,et al.Inferring gene networks from gene expression data using dynamic bayesian network with different scoring metric approaches[C]//Proceedings of International Symposium on Biomedical Data Infrastructure.Kuala Lumpur,Malaysia:Springer Berlin Heidelberg,2013:77-86.
[3]李凌波,張靜,陳丹.基于SVM和平均影響值的人腫瘤信息基因提取[J].生物信息學,2013,11(3):72-78.
LI Lingbo,ZHANG Jing,CHEN Dan.Selection of human tumor information genes based on the support vector machine and mean impact value[J].Chinese Journal of Bioinformatics,2013,11(3):72-78.
[4]王進,陳文,冉仟元,等.用于微陣列數(shù)據(jù)癌癥分類的演化硬件多分類器[J].江蘇大學學報:自然科學版,2013,34(4):410-415.
WANG Jin,CHEN Wen,RAN Qianyuan,et al.Multiple classifiers based on evolvable hardware for cancer classification with microarray data[J].Journal of Jiangsu University:Natural Science Edition,2013,34(4):410-415.
[5]王進,丁凌,孫開偉,等.演化超網(wǎng)絡(luò)在多類型癌癥分子分型中的應(yīng)用[J].電子與信息學報,2013,35(10):2425-2431.
WANG Jin,DING Ling,SUN Kaiwei,et al.Applying evolutionary hypernetworks for multiclass molecular classification of cancer[J].Journal of Electronics and Information Technology,2013,35(10):2425-2431.
[6]王進,張軍,胡白帆.結(jié)合最優(yōu)類別信息離散的細粒度超網(wǎng)絡(luò)微陣列數(shù)據(jù)分類[J].上海交通大學學報,2013,47(12):1856-1862.
WANG Jin,ZHANG Jun,HU Baifan.Optimal class-dependent discretization-based fine-grain hypernetworks for classification of microarray data[J].Journal of Shanghai Jiao Tong University,2013,47(12):1856-1862
[7]王進,任小龍,孫開偉,等.HSV顏色空間下用演化超網(wǎng)絡(luò)識別道路限速標志的研究[J].高技術(shù)通訊,2013,23(7):679-684.
WANG Jin,REN Xiaolong,SUN Kaiwei,et al.Road speed limit sign recognition using HSV color space and evolutionary hypernetwork[J].Chinese High Technology Letters,2013,23(7):679-684.
[8]WONG A K C,WANG Y.High-order pattern discovery from discrete-valued data[J].IEEE Transactions on Knowledge and Data Engineering,1997,9(6):877-893.
[9]CHIU D K Y,WONG A K C,CHEUNG B.Information discovery through hierarchical maximum entropy discretization and synthesis[J].Knowledge Discovery in Databases,1991:125-140.
[10]TAN A C,GILBERT D.Ensemble machine learning on gene expression data for cancer classification[J].Applied Bioinformatics,2003,2(3):75-83.
[11]王進,黃萍麗,孫開偉,等.基于演化學習超網(wǎng)絡(luò)的微陣列數(shù)據(jù)分類[J].江蘇大學學報:自然科學版,2014,35(1):56-62.
WANG Jin,HUANG Pingli,SUN Kaiwei,et al.Microarray data classification based on evolutionary learning hypernetwork[J].Journal of Jiangsu University:Natural Science Edition,2014,35(1):56-62.
[12]HA J W,KIM B H,LEE B,et al.Layered hypernetwork models for cross-model associative text and image keyword generation in multimodal information retrieval[C]//Proceedings of the PRICAI 2010.Berlin:Spring Berlin Heidelberg,2010:76-87.
[13]SHARMA A,IMOTO S,MIYANO S.A top-r feature selection algorithm for microarray gene expression data[J].IEEE/ACM Transactions on Computational Biology and Bioinformatics,2012,9(3):754-764.
[14]CHENG Q.A sparse learning machine for high-dimensional data with application to microarray gene analysis[J].IEEE/ACM Transactions on Computational Biology and Bioinformatics,2010,7(4):636-646.
[15]盧新國,林亞平,駱嘉偉,等.癌癥識別中一種基于組合GCM和CCM的分類算法[J].軟件學報,2010,21(11):2838-2851.
LU Xinguo,LIN Yaping,LUO Jiawei,et al.Classification algorithm combined GCM with CCM in cancer recognition[J].Journal of Software,2010,21(11):2838-2851.