• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于GSA的復(fù)雜產(chǎn)品關(guān)鍵質(zhì)量特性識別

      2015-07-26 11:11:58李岸達(dá)何曙光
      關(guān)鍵詞:模擬退火特征選擇適應(yīng)度

      李岸達(dá),何 楨,何曙光

      (天津大學(xué)管理與經(jīng)濟(jì)學(xué)部,天津300072)

      基于GSA的復(fù)雜產(chǎn)品關(guān)鍵質(zhì)量特性識別

      李岸達(dá),何 楨,何曙光

      (天津大學(xué)管理與經(jīng)濟(jì)學(xué)部,天津300072)

      為了識別復(fù)雜產(chǎn)品關(guān)鍵質(zhì)量特性(critical-to-quality characteristics,CTQs),提出基于遺傳模擬退火算法(genetic simulated annealing algorithm,GSA)的特征選擇算法。所提算法將遺傳算法(genetic algorithm,GA)與模擬退火算法(simulated annealing algorithm,SA)結(jié)合,兼有不錯局部搜索與全局搜索能力。提出一種綜合適應(yīng)度函數(shù)應(yīng)用于所提算法,以同時優(yōu)化CTQ集分類性能和所選質(zhì)量特性數(shù)。算例結(jié)果表明,所提算法能有效過濾無關(guān)、冗余質(zhì)量特性,識別關(guān)鍵質(zhì)量特性;與Memetic算法和信息增益(information gain,IG)算法相比,所提算法在識別更少關(guān)鍵質(zhì)量特性的同時,得到更高預(yù)測精度。

      關(guān)鍵質(zhì)量特性;遺傳算法;模擬退火算法;復(fù)雜產(chǎn)品;特征選擇

      0 引 言

      具有“客戶需求復(fù)雜、產(chǎn)品組成復(fù)雜、產(chǎn)品技術(shù)復(fù)雜、制造流程復(fù)雜、試驗維護(hù)復(fù)雜、項目管理復(fù)雜、工作環(huán)境復(fù)雜”等特征的一類產(chǎn)品被稱之為復(fù)雜產(chǎn)品[1]。由于復(fù)雜產(chǎn)品零部件眾多,結(jié)構(gòu)復(fù)雜,質(zhì)量特性相互影響關(guān)系復(fù)雜,因此對該類產(chǎn)品進(jìn)行質(zhì)量控制、質(zhì)量監(jiān)控的難度相對較高。在實際生產(chǎn)中,由于不能判斷復(fù)雜產(chǎn)品制造過程中哪些質(zhì)量特性是關(guān)鍵質(zhì)量特性(critical-to-quality characteristics,CTQs),只能將所有零件公差范圍收縮,并對每一個生產(chǎn)過程進(jìn)行嚴(yán)格監(jiān)控,從而導(dǎo)致加工成本增加,生產(chǎn)周期變長。對于復(fù)雜產(chǎn)品,如何從眾多質(zhì)量特性中有效過濾無關(guān)、冗余質(zhì)量特性,識別影響產(chǎn)品質(zhì)量的CTQ是一個亟待解決的問題。

      傳統(tǒng)CTQ識別方法包括關(guān)鍵特性展開(key characteristics flowdown,KCF)[2]和質(zhì)量功能展開(quality function deployment,QFD)[3]。KCF對產(chǎn)品進(jìn)行逐層分解,將產(chǎn)品從上到下分解為產(chǎn)品特性、部件特性、零件特性、工藝特性等,之后應(yīng)用定性、定量的分析方法,從中識別CTQ[2,4]。但是復(fù)雜產(chǎn)品包含大量零部件級質(zhì)量特性,質(zhì)量特性間影響關(guān)系復(fù)雜,難以用傳統(tǒng)定性、定量方法確定各質(zhì)量特性間的影響關(guān)系并識別CTQ。QFD把顧客對產(chǎn)品的要求進(jìn)行多層分析,最終轉(zhuǎn)換為產(chǎn)品的設(shè)計要求、生產(chǎn)要求、工藝要求等,從而建立產(chǎn)品的生產(chǎn)策略,該方法的重要特點是體現(xiàn)了客戶需求導(dǎo)向[3]。但是顧客只關(guān)注對其使用有直接影響的因素,很多影響產(chǎn)品(尤其是復(fù)雜產(chǎn)品)質(zhì)量潛在因素是顧客所不能關(guān)注到的。此外,對于復(fù)雜產(chǎn)品,在高緯度帶來的復(fù)雜性影響下,QFD的質(zhì)量矩陣不易確定,最終影響CTQ識別效果[5]。

      特征選擇是機(jī)器學(xué)習(xí)領(lǐng)域一類能夠有效處理高維數(shù)據(jù)集的降維方法[6-7]。該類方法相繼被引入復(fù)雜產(chǎn)品CTQ識別領(lǐng)域[5,8]。通常,特征選擇算法可以分為兩類:Filter算法和Wrapper算法。

      在Filter算法中,特征選擇是在應(yīng)用學(xué)習(xí)算法分類之前的一個預(yù)處理步驟,該類算法通過一定的評估策略過濾掉一些特征,接著應(yīng)用學(xué)習(xí)算法得到算法分類精度。文獻(xiàn)[5]應(yīng)用一種經(jīng)典的過濾算法信息增益(information gain,IG)進(jìn)行關(guān)鍵質(zhì)量特性識別,該方法以信息增益為度量標(biāo)準(zhǔn),計算各質(zhì)量特性(特征)與產(chǎn)品質(zhì)量(類標(biāo)簽)之間的相關(guān)程度,最終得到各質(zhì)量特性的權(quán)重,然后過濾掉權(quán)重較小的質(zhì)量特性,得到CTQ集。但是,由于IG算法單獨評價每個質(zhì)量特性的重要性,有些潛在重要的質(zhì)量特性不能發(fā)現(xiàn);另外IG算法沒有考慮質(zhì)量特性間的冗余性,不能有效過濾冗余質(zhì)量特性。

      Wrapper算法將學(xué)習(xí)算法包含在特征選擇過程中,學(xué)習(xí)算法的分類性能是評價特征子集好壞的重要指標(biāo)。Wrapper算法在進(jìn)行特征選擇時將每個特征集合作為一個整體對其好壞進(jìn)行評價的,能夠發(fā)現(xiàn)潛在關(guān)鍵特征和處理特征間的冗余性[9]。Wrapper算法可以看作是一個優(yōu)化過程,其目標(biāo)通常是選擇一個盡可能小的特征子集并使它的分類性能盡可能大,所以Wrapper算法通常包含一個搜索策略。Wrapper算法常用的搜索策略包括各類順序?qū)?yōu)算法[10]以及遺傳算法[1112](genetic algorithm,GA)。相對于順序?qū)?yōu)算法,全局最優(yōu)算法GA能夠脫離局部最優(yōu),并在更廣的空間內(nèi)搜索特征子集[12]。文獻(xiàn)[13]將特征選擇作為一個單目標(biāo)優(yōu)化問題,以分類性能作為GA算法的適應(yīng)度函數(shù)。然而,僅優(yōu)化分類性能容易造成對訓(xùn)練集的過擬合,最終會選擇過多的特征,不利于過濾無關(guān)、冗余特征。因此,將最小化特征數(shù)也作為優(yōu)化目標(biāo)以有效處理以上問題是必要的[14]。

      GA算法能夠有效地全局尋優(yōu),所以將其應(yīng)用于復(fù)雜產(chǎn)品CTQ識別能夠有效解決高維度問題。但是,GA算法局部搜索能力較差,單獨使用GA算法不能得到理想結(jié)果。Memetic算法可以看作是一種混合GA算法,它將局部搜索與GA算法相結(jié)合,彌補(bǔ)了GA算法局部搜索能力差的缺點,通常比GA算法有更好效果[15]。由于模擬退火(simulated annealing algorithm,SA)算法有較強(qiáng)的局部搜索能力,部分學(xué)者將SA與GA結(jié)合,建立遺傳模擬退火算法(genetic simulated annealing algorithm,GSA),該算法同樣能夠彌補(bǔ)GA算法的缺點,快速收斂得到滿意解[16-17]。

      基于以上分析,本文將GSA應(yīng)用于特征選擇,構(gòu)建基于GSA的特征選擇算法,并將其應(yīng)用于復(fù)雜產(chǎn)品CTQ識別。所提算法應(yīng)用了一種綜合適應(yīng)度函數(shù)以同時優(yōu)化CTQ集的分類性能和所選質(zhì)量特性數(shù)。算例結(jié)果表明,相對于IG算法與Memetic算法,所提算法能夠在得到更高預(yù)測精度的同時,識別更少CTQ。說明所提算法能夠有效過濾無關(guān)、冗余質(zhì)量特性。

      1 基于GSA的CTQ識別框架

      假設(shè)在產(chǎn)品質(zhì)量特性數(shù)據(jù)集Ω中,包含M個樣本,每個樣本可以表示為Xi=(xi1,xi2,…,xiK,yi),i=1,…,M;產(chǎn)品樣本含有K個質(zhì)量特性,分別用Qi表示,i=1,…,K;xij表示第i個產(chǎn)品樣本的第j個質(zhì)量特性的測量值;每個產(chǎn)品樣本的類標(biāo)簽是yi。類標(biāo)簽表示每個產(chǎn)品樣本的質(zhì)量好壞。例如,若產(chǎn)品分為“合格”、“不合格”兩類,則可以分別賦予類標(biāo)簽為“-1”和“1”。產(chǎn)品樣本Xi最終屬于哪個類別受到其質(zhì)量特性取值xi1,xi2,…,xiK的影響,但是不是每個質(zhì)量特性都是影響產(chǎn)品質(zhì)量的關(guān)鍵影響因素,需要從這些質(zhì)量特性中識別CTQ。本文應(yīng)用特征選擇算法識別CTQ,由于特征選擇算法能夠選擇出影響樣本分類最顯著的特征,故可以將特征選擇算法用于識別影響產(chǎn)品質(zhì)量(分類)的關(guān)鍵質(zhì)量特性(特征)[8]。

      由于GSA算法兼有不錯全局與局部尋優(yōu)的能力,本文提出基于GSA算法的特征選擇算法,并將該算法用于復(fù)雜CTQ識別?;贕SA算法的CTQ識別框架如圖1所示。識別框架可以分為3個階段。第一階段:數(shù)據(jù)集劃分。將數(shù)據(jù)集劃分為產(chǎn)品訓(xùn)練數(shù)據(jù)集與產(chǎn)品測試數(shù)據(jù)集。第二階段:利用GSA算法識別CTQ。將產(chǎn)品訓(xùn)練數(shù)據(jù)集輸入基于GSA的特征選擇算法,識別得到CTQ集。第三階段:CTQ識別結(jié)果評估。使用測試集得到CTQ集的預(yù)測精度,并評估CTQ識別結(jié)果。CTQ集預(yù)測精度與CTQ集包含質(zhì)量特性數(shù)是CTQ識別效果的兩個重要度量標(biāo)準(zhǔn),預(yù)測精度越高,質(zhì)量特性數(shù)越少,說明算法能夠越有效過濾無關(guān)、冗余質(zhì)量特性,從而有效識別CTQ。識別框架具體步驟如下:

      第一階段:

      步驟1 從生產(chǎn)制造過程中收集產(chǎn)品質(zhì)量特性數(shù)據(jù)集。

      步驟2 將原始數(shù)據(jù)集劃分為兩部分:產(chǎn)品質(zhì)量特性訓(xùn)練數(shù)據(jù)集與產(chǎn)品質(zhì)量特性測試數(shù)據(jù)集。

      第二階段:

      步驟3 將訓(xùn)練集輸入基于GSA的特征選擇算法,對GSA算法進(jìn)行初始化參數(shù)設(shè)置,令i=0。

      步驟4 產(chǎn)生初始群體G0,并評價G0各個體的適應(yīng)度。

      步驟5 對群體Gi進(jìn)行遺傳操作(包括選擇、交叉、變異),得到過渡群體G′i+1,并評價G′i+1各個體的適應(yīng)度。

      步驟6 對G′i+1的個體進(jìn)行模擬退火操作,根據(jù)Metropolis準(zhǔn)則判斷是否接受從Gi中父代個體到G′i+1中子代個體的轉(zhuǎn)移,得到群體Gi+1,并評價Gi+1個體的適應(yīng)度。

      步驟7 判斷是否滿足GSA算法的終止條件,若滿足終止條件則進(jìn)入步驟8;否則,令i=i+1,并返回步驟5。

      步驟8 從群體中Gi+1選擇具有最高適應(yīng)度的個體作為最終結(jié)果,得到CTQ集。

      第三階段:

      步驟9 使用訓(xùn)練集訓(xùn)練學(xué)習(xí)算法,并使用測試集測試訓(xùn)練后學(xué)習(xí)算法,得到CTQ集對應(yīng)的預(yù)測精度。

      步驟10 根據(jù)預(yù)測精度及CTQ集質(zhì)量特性數(shù)評估CTQ集。

      2 基于GSA的特征選擇算法

      第1節(jié)提出基于GSA的CTQ識別框架,本節(jié)提出“基于GSA的特征選擇算法”(見圖1虛框)。本節(jié)余下部分包括:編碼方式、初始群體的產(chǎn)生、適應(yīng)度函數(shù)、選擇操作、交叉操作、變異操作、模擬退火操作、終止條件。

      圖1 GSA算法CTQ識別框架

      2.1 編碼方式

      編碼采用二進(jìn)制編碼方式,若產(chǎn)品質(zhì)量特性數(shù)據(jù)集Ω包含K個質(zhì)量特性,則個體編碼B=(b1,b2,…,bK),其中bj∈{0,1},j=1,2,…,K,編碼長度NB=K。編碼中每一個bj表示對應(yīng)的第j個質(zhì)量特性是否被識別為CTQ。若bj=1,則表示第j個質(zhì)量特性被包含在CTQ集中;若bj=0,則表明第j個質(zhì)量特性不在CTQ集中。

      若一個數(shù)據(jù)集中包含10個質(zhì)量特性,第1、3、5、9個質(zhì)量特性被包含在CTQ集中,則個體編碼為B=(1,0,1,0,1,0,0,0,1,0)。解碼過程與編碼過程相反,若個體編碼B=(0,0,1,1,0,0,1,0,1,0),則表明第3、4、7、9個質(zhì)量特性被包含在CTQ集中。

      2.2 初始群體的產(chǎn)生

      隨機(jī)產(chǎn)生初始群體,產(chǎn)生1×K的隨機(jī)向量,向量中每一個元素bj(j=1,2,…,K)隨機(jī)取值為0或1,令其取1的概率為P1,則初始化方法如式(1)所示,其中Rand(0,1)表示以均勻分布在0到1之間產(chǎn)生的隨機(jī)數(shù)。由于復(fù)雜產(chǎn)品數(shù)據(jù)集維度較高,為了使算法更快收斂到較小的質(zhì)量特性集,在初始化時選擇一個較小的P1,本文選取P1=0.3。群體規(guī)模Np與問題的復(fù)雜程度有關(guān),通常在50到500之間[11],本文選取Np=100。

      2.3 適應(yīng)度函數(shù)

      本節(jié)提出一個改進(jìn)綜合適應(yīng)度函數(shù),以同時優(yōu)化CTQ集(特征子集)分類性能和所選質(zhì)量特性(特征)數(shù)。文獻(xiàn)[13]在特征選擇時僅將最大化特征子集的分類性能作為優(yōu)化目標(biāo)。但是由于缺少對所選特征數(shù)的優(yōu)化,算法會造成對訓(xùn)練集的過擬合,不能有效過濾冗余、無關(guān)特征等問題[14]。為了解決以上問題,本文將所選質(zhì)量特性數(shù)引入適應(yīng)度函數(shù),構(gòu)造一個綜合適應(yīng)度函數(shù),以同時優(yōu)化CTQ集分類性能和所選質(zhì)量特性數(shù)。應(yīng)用層面,識別少量CTQ對于節(jié)約成本、有效提高產(chǎn)品質(zhì)量是很有意義的。這樣可以將有限時間與金錢用于少量影響產(chǎn)品質(zhì)量的關(guān)鍵特性,從而能夠顯著改善產(chǎn)品質(zhì)量并節(jié)約成本。所以,從理論與實際兩方面來看,將最小化質(zhì)量特性數(shù)作為優(yōu)化目標(biāo)很有必要。

      根據(jù)以上分析,可知在進(jìn)行CTQ識別時有兩個優(yōu)化目標(biāo):①最大化CTQ集分類性能;②最小化所選質(zhì)量特性數(shù)。通常,分類性能的估計是通過訓(xùn)練集的內(nèi)部5折交叉驗證精度得到的[9]。所選質(zhì)量特性個數(shù)可以通過計算個體編碼“1”的個數(shù)得到。

      優(yōu)化第一個目標(biāo),可以建立如式(2)所示的目標(biāo)函數(shù)。

      式中,QS(Bi)是個體Bi對應(yīng)的質(zhì)量特性集;R(QS(Bi))表示QS(Bi)對應(yīng)的5折交叉驗證精度。

      優(yōu)化第二個目標(biāo),可以建立如式(3)所示的目標(biāo)函數(shù),該式表示了被過濾掉的質(zhì)量特性數(shù)所占總特性數(shù)的比例。

      式中,#QS(Bi)表示質(zhì)量特性子集QS(Bi)包含質(zhì)量特性的個數(shù);#FS代表原質(zhì)量特性數(shù)。

      通過最大化式(3)可以最小化所選質(zhì)量特性數(shù)。在式(2)與式(3)的基礎(chǔ)上,可以將兩個目標(biāo)綜合,建立如式(4)所示的綜合目標(biāo)函數(shù)。通過優(yōu)化式(4),能夠同時優(yōu)化兩個目標(biāo)。

      式中,β是一個調(diào)節(jié)參數(shù),主要目的是調(diào)整分類性能與所選質(zhì)量特性數(shù)的相對重要程度,β取值在0到1之間,β取值越大交叉驗證精度越重要,當(dāng)β=0時,只考慮質(zhì)量特性數(shù),當(dāng)β=1時,只考慮交叉驗證精度。

      J3可以同時優(yōu)化分類精度和質(zhì)量特性數(shù),但是直接將J3作為適應(yīng)度函數(shù)也會有以下問題。由于J3的取值范圍是在0到1之間,不同的個體Bi對應(yīng)的J3目標(biāo)函數(shù)值差異可能是很小的,GSA算法在進(jìn)行選擇操作的時候就不能有效的將目標(biāo)函數(shù)值高的個體選擇出來,從而影響GSA算法的收斂速度和算法尋優(yōu)結(jié)果。所以通過一種變換適當(dāng)放大不同個體適應(yīng)度的差異是必要的。本文引入指數(shù)函數(shù),將J3變換得到J4,如式(5)所示。

      式中,α是放大差異參數(shù)。令Bi、Bj為兩不同個體,且J3(Bi)>J3(Bj),則有式(6)推導(dǎo),可以看到J4(Bi)與J4(Bj)的比例是與α密切相關(guān)的,α越大這個比例就越大,所以α能夠有效放大不同個體目標(biāo)函數(shù)值的差異。通過以上分析,可知目標(biāo)函數(shù)J4既能同時優(yōu)化分類性能和質(zhì)量特性數(shù),又能放大不同個體好壞的差異。

      根據(jù)以上分析,本文將J4作為GSA的適應(yīng)度函數(shù),該適應(yīng)度函數(shù)是一個綜合適應(yīng)度函數(shù),可以同時最大化分類性能和最小化所選質(zhì)量特性數(shù),如式(7)所示。

      式中,R(QS(Bi))為質(zhì)量特性集QS(Bi)對應(yīng)的訓(xùn)練集5折交叉驗證精度;#QS(Bi)表示QS(Bi)包含質(zhì)量特性的個數(shù);#FS代表原始數(shù)據(jù)集中包含的質(zhì)量特性的個數(shù);α是放大參數(shù),能夠放大適應(yīng)度的差異;β是一個調(diào)節(jié)參數(shù),可以調(diào)整CTQ集分類性能與所選質(zhì)量特性數(shù)的相對重要程度,β取值在0到1之間,β取值越大分類性能權(quán)重越高,反之亦然。本文取α=4,β=0.7。

      2.4 選擇操作

      采用輪盤賭方式進(jìn)行選擇操作,將群體中的個體按照其適應(yīng)度從大到小排序,然后進(jìn)行選擇操作。個體被選擇的概率和其適應(yīng)度有關(guān),適應(yīng)度越大則被選擇的概率就越大,反之亦然。采用輪盤賭方式從父代Gi中選擇Np個個體,并對選擇個體配對得到Np/2對個體,然后進(jìn)入交叉操作。

      2.5 交叉操作

      采用一點交叉方式進(jìn)行交叉操作。個體以交叉概率pc進(jìn)行交叉操作。對每對被選擇的個體,隨機(jī)產(chǎn)生一個交叉位(不能是最后一位),兩個個體交叉位之后的編碼串互換。例如,對于個體B1=(b11,b12,…,b1K)和B2=(b21,b22,…,b2K),隨機(jī)選擇交叉位x∈{1,2,…,K-1},交換之后產(chǎn)生兩個新的個體B′1=(b11,b12,…,b1x,b2(x+1),…,b2K),B′2=(b21,b22,…,b2x,b1(x+1),…,b1K)。本文選取pc=0.9。

      2.6 變異操作

      本文采用一種子集導(dǎo)向變異算子(subset size oriented mutation,SSOM),在應(yīng)用于特征選擇算法時,該變異算子有更好效果[18]。SSOM能夠保證“0”位與“1”位變異的期望個數(shù)相等,這能夠保證變異算子整體上不改變變異之前“0”位與“1”位的比例,也就是變異過程中從特征集合剔除的特征數(shù)與包含到特征集合內(nèi)的特征數(shù)的期望是相等的。SSOM對“0”位的變異與“1”位的變異是分別進(jìn)行的,令pm1為個體中“1”位變異的概率,則個體中“0”位變異的概率pm0由下式得到:

      式中,N1表示變異前個體中“1”位的個數(shù);N0表示變異前個體中“1”位的個數(shù);本文取pm1=0.01。

      2.7 模擬退火操作

      模擬退火算法優(yōu)化目標(biāo)函數(shù)是望小的,但是遺傳算法的適應(yīng)度函數(shù)是望大的,所以在進(jìn)行模擬退火操作之前需要對目標(biāo)函數(shù)進(jìn)行變換。式(9)為變換后的模擬退火算法目標(biāo)函數(shù)。

      式中,B代表群體中的個體;f為模擬退火算法優(yōu)化目標(biāo)函數(shù)。通過式(9)的變換,將最大值優(yōu)化問題改為最小值優(yōu)化問題,v為足夠大的數(shù)保證變換后的目標(biāo)函數(shù)非負(fù)。

      令d1,d2為父代Gi的一對個體,該對個體經(jīng)過交叉、變異之后,得到過渡代G′i+1的一對個體s1,s2。那么以概率P接受s為群體Gi+1中的個體,如式(10)所示。

      將式(9)代入式(10)得到概率P的計算公式如下:

      式(10)、式(11)中T是模擬退火算法中的溫度,算法運(yùn)行中溫度逐漸降低。令第i代溫度為Ti,則Ti+1=η·Ti,0<η<1。本文取初始溫度T0=2 000,系數(shù)η=0.95。

      進(jìn)行模擬退火操作之后,得到下一代群體Gi+1,為了保證算法不丟失所得到的最優(yōu)解,采用精英保留策略,將Gi代中的最優(yōu)個體保留并加入到群體Gi+1中。

      2.8 終止條件

      群體進(jìn)化Nt代之后,進(jìn)化操作停止,選取最后一代有最高適應(yīng)度值的個體作為最終解。本文選取Nt=500。

      3 算法應(yīng)用實例

      為了驗證算法有效性,本節(jié)選取3個數(shù)據(jù)集進(jìn)行實驗,分別是AIRMANU、SPIRA以及LATEX。數(shù)據(jù)集AIR-MANU是飛機(jī)陀螺儀的質(zhì)量特性數(shù)據(jù)集,其質(zhì)量特性主要包含陀螺儀的物理參數(shù)、光學(xué)參數(shù)、電參數(shù)等,該數(shù)據(jù)收集自國內(nèi)某航空研究所。飛機(jī)陀螺儀結(jié)構(gòu)復(fù)雜,質(zhì)量特性眾多,在實際生產(chǎn)中進(jìn)行質(zhì)量控制難度較大,導(dǎo)致產(chǎn)品合格率較低,有大量的返修情況。因此,識別陀螺儀CTQ,并對所識別CTQ進(jìn)行重點控制是一項非常重要的任務(wù)。數(shù)據(jù)集SPIRA收集自抗生素生產(chǎn)過程,產(chǎn)品質(zhì)量特性包括溫度水平和耗氧峰值等;數(shù)據(jù)集LATEX收集自膠乳生產(chǎn)過程,產(chǎn)品質(zhì)量特性包括反應(yīng)濃度、溫度水平等[19]。同樣,從大量質(zhì)量特性中識別CTQ并進(jìn)行重點控制,對于提高抗生素以及膠乳的質(zhì)量有重要意義。AIRMANU、SPIRA以及LATEX數(shù)據(jù)集信息如表1所示。

      表1 數(shù)據(jù)集信息

      實施條件。在進(jìn)行CTQ識別之前,需要將數(shù)據(jù)集劃分為訓(xùn)練集和測試集。訓(xùn)練集用來進(jìn)行CTQ識別,測試集用來驗證CTQ識別的有效性。要使算法有效識別CTQ,應(yīng)保證訓(xùn)練集中有足夠的訓(xùn)練數(shù)據(jù),因此本文將數(shù)據(jù)集按照3∶1的比例劃分為訓(xùn)練集和測試集。樸素貝葉斯分類器被廣泛用于特征選擇領(lǐng)域[20],因此本文選取樸素貝葉斯分類器作為學(xué)習(xí)算法。為了驗證算法有效性,本文選取兩個對比算法,第一個是經(jīng)典Filter算法——IG算法[5];第二個是一種Wrapper算法——Memetic算法,一種混合遺傳算法[15]。本文算法與Memetic算法的參數(shù)設(shè)置如表2所示。此外,IG算法使用Weka[21]實現(xiàn);本文算法與Memetic算法在Matlab環(huán)境下編程實現(xiàn),所用樸素貝葉斯分類器從Weka中調(diào)用。

      表2 本文算法與Memetic算法參數(shù)設(shè)置

      本文應(yīng)用兩個標(biāo)準(zhǔn)度量CTQ的識別效果[7]:①CTQ集的測試集預(yù)測精度。預(yù)測精度越高,CTQ集的相關(guān)性越好,說明影響產(chǎn)品質(zhì)量的關(guān)鍵特性被包含在CTQ集中。②CTQ集所選質(zhì)量特性數(shù)。質(zhì)量特性數(shù)越少,則表明CTQ識別算法越多地有效了過濾無關(guān)、冗余的質(zhì)量特性。綜合來看,CTQ集的預(yù)測精度越高,包含質(zhì)量特性越少,CTQ識別越有效。

      圖2所示為本文算法與Memetic算法的收斂性能圖,各子圖分別表示了3個數(shù)據(jù)集的訓(xùn)練集5折交叉驗證精度(為簡要表述之后用交叉驗證精度代替)收斂曲線與所選質(zhì)量特性數(shù)收斂曲線。由交叉驗證精度收斂曲線(見圖2(a)、圖2(c)和圖2(e))可以看到,兩個算法都能有效收斂。相比本文算法,Memetic算法在AIRMANU上得到了更高交叉驗證精度。在SPIRA與LATEX上,兩個算法最終得到了相等交叉驗證精度。由所選質(zhì)量特性數(shù)收斂曲線(見圖2(b)、圖2(d)、圖2(f))可以看到,本文算法能夠快速降低所選質(zhì)量特性數(shù),并達(dá)到收斂狀態(tài);Memetic算法同樣能夠達(dá)到收斂,但是質(zhì)量特性數(shù)降低效果要差與本文算法。造成以上結(jié)果,是因為本文算法在進(jìn)行特征選擇時,是綜合優(yōu)化交叉驗證精度與所選質(zhì)量特性數(shù)兩個指標(biāo)的,所以本文算法在提高交叉驗證精度的同時,顯著降低了所選質(zhì)量特性數(shù)。Memetic單純優(yōu)化交叉驗證精度,能夠得到較高交叉驗證精度,但是由于單純優(yōu)化交叉驗證精度,造成了過多質(zhì)量特性被選擇。另外,從收斂速度來說,本文算法在3個數(shù)據(jù)集上都能在150代之前達(dá)到交叉驗證精度與所選質(zhì)量特性數(shù)的收斂,有不錯的收斂速度。綜合來說,本文算法能夠快速有效收斂。

      表3所示為各識別算法的CTQ識別結(jié)果。由表3可知,本文算法在3個數(shù)據(jù)集都有不錯預(yù)測精度,平均預(yù)測精度達(dá)到85.77%。IG算法與Memetic算法在3個數(shù)據(jù)集上的預(yù)測精度都不高于本文算法,平均預(yù)測精度分別為77.44%和79.04%。同時,在3個數(shù)據(jù)集上,本文算法能夠選擇更少關(guān)鍵質(zhì)量特性,平均選擇質(zhì)量特性為11.33個。IG與Memetic算法平均選擇質(zhì)量特性分別為29.00和29.67個。綜合來看,本文算法能夠在得到更高預(yù)測精度的同時選擇更少的質(zhì)量特性。得到這樣的結(jié)果,是因為本文算法將CTQ集所選質(zhì)量特性數(shù)作為一個優(yōu)化目標(biāo)。一方面,通過對質(zhì)量特性的數(shù)量的控制,算法盡可能少的選擇質(zhì)量特性,將最重要的質(zhì)量特性保留下來,從而達(dá)到過濾無關(guān)、冗余質(zhì)量特性的目的。另一方面,將最小化CTQ集所選質(zhì)量特性數(shù)包含到適應(yīng)度函數(shù),能夠同時優(yōu)化CTQ集的分類性能和所選質(zhì)量特性數(shù),使算法避免了一味追求訓(xùn)練集交叉驗證精度最大化而造成對訓(xùn)練集的過擬合。Memetic算法單純優(yōu)化CTQ集的分類性能,算法得到很高的交叉驗證精度,但是相對本文算法,其預(yù)測精度相對交叉驗證精度出現(xiàn)了更明顯的下降。這說明Memetic算法在識別CTQ時出現(xiàn)了更嚴(yán)重的過擬合問題,使得算法選擇了過多無關(guān)、冗余質(zhì)量特性,對算法預(yù)測精度造成影響,最終影響CTQ識別效果。IG算法在CTQ識別時,單獨評估每個質(zhì)量特性影響產(chǎn)品質(zhì)量的程度,沒有考慮到質(zhì)量特性間的冗余性,不能有效過濾冗余質(zhì)量特性,所以識別的質(zhì)量特性數(shù)也較多??傮w來看,本文算法有更好的CTQ識別結(jié)果。綜上,本文算法進(jìn)行CTQ識別時能夠快速有效收斂,并能有效過濾無關(guān)、冗余質(zhì)量特性,識別復(fù)雜產(chǎn)品CTQ。

      圖2 收斂性能圖

      表3 各算法CTQ識別結(jié)果

      4 結(jié) 論

      復(fù)雜產(chǎn)品包含大量質(zhì)量特性,為了有效識別影響產(chǎn)品質(zhì)量的CTQ,本文建立基于GSA算法特征選擇算法,并用于CTQ識別。首先,所提算法將GA算法與SA算法融合,兼有兩者的優(yōu)點,有不錯全局搜索與局部搜索能力。其次,為了處理對訓(xùn)練集的過擬合問題,提高算法過濾無關(guān)、冗余質(zhì)量特性的能力,本文提出綜合的適應(yīng)度函數(shù)應(yīng)用于所提算法。所提綜合適應(yīng)度函數(shù),能夠使算法在優(yōu)化過程中同時最大化CTQ集分類性能和最小化CTQ集所選質(zhì)量特性數(shù)。本文通過算例驗證了算法的有效性,結(jié)果表明所提算法能夠快速有效收斂,同時算法在識別更少的CTQ的同時得到更高預(yù)測精度。說明算法能夠有效過濾無關(guān)、冗余質(zhì)量特性,并有效識別CTQ。如何將所提算法擴(kuò)展到不平衡數(shù)據(jù)的CTQ識別,是今后需要做的工作。

      [1]Li B H.Key technologies in informatization of complex product:complex product integrated manufacturing system[J].Manufacture Information Engineering of China,2006(14):19-23.(李伯虎.復(fù)雜產(chǎn)品制造信息化的重要技術(shù)——復(fù)雜產(chǎn)品集成制造系統(tǒng)[J].中國制造業(yè)信息化,2006(14):19-23.)

      [2]Thornton A C.A mathematical framework for the key characteristic process[J].Research in Engineering Design,1999,11(3):145-157.

      [3]Jia G Z,Bai M.An approach for manufacturing strategy development based on fuzzy-QFD[J].Computers&Industrial Engineering,2011,60(3):445-454.

      [4]Lee D J,Thornton A C.The identification and use of key characteristics in the product development process[C]∥Proc.of the ASME Design Engineering Technical Conferences and Computers in Engineering Conference,1996:211-217.

      [5]Yan W,He Z,Tian W M,et al.Research on complex products critical-to-quality characteristics identification method based on IG[J].Industrial Engineering and Management,2012,17(1):55-60.(閆偉,何楨,田文萌,等.基于IG的復(fù)雜產(chǎn)品關(guān)鍵質(zhì)量特性識別方法的研究[J].工業(yè)工程與管理,2012,17(1):55-60.)

      [6]Hua J,Tembe W D,Dougherty E R.Performance of feature-selection methods in the classification of high-dimension data[J].Pattern Recognition,2009,42(3):409-424.

      [7]Yao X,Wang X D,Zhang Y X,et al.Ensemble feature selection algorithm based on Markov blanket and mutual information[J].Systems Engineering and Electronics,2012,34(5):1046-1050.(姚旭,王曉丹,張玉璽,等.基于Markov blanket和互信息的集成特征選擇算法[J].系統(tǒng)工程與電子技術(shù),2012,34(5):1046-1050.)

      [8]Yan W,He Z,Li A D.Identification of critical-to-quality characteristics for complex products using CEM-IG algorithm[J].Systems Engineering-Theory&Practice,2014,34(5):1230-1236.(閆偉,何楨,李岸達(dá).基于CEM-IG算法的復(fù)雜產(chǎn)品關(guān)鍵質(zhì)量特性識別[J].系統(tǒng)工程理論實踐,2014,34(5):1230-1236.)

      [9]Kohavi R,John G H.Wrappers for feature subset selection[J].Artificial Intelligence,1997,97(1):273-324.

      [10]Pudil P,NovovicˇováJ,kittler J.Floating search methods in feature selection[J].Pattern Recognition Letters,1994,15(11):1119-1125.

      [11]Leardi R,Boggia R,Terrile M.Genetic algorithms as a strategy for feature selection[J].Journal of Chemometrics,1992,6(5):267-281.

      [12]Vasighi M,Zahraei A,Bagheri S,et al.Diagnosis of coronary heart disease based on 1H NMR spectra of human blood plasma using genetic algorithm based feature selection[J].Journal of Chemometrics,2013,27(10):318-322.

      [13]Min S H,Lee J,Han I.Hybrid genetic algorithms and support vector machines for bankruptcy prediction[J].Expert Systems with Applications,2006,31(3):652-660.

      [14]Soyel H,Tekguc U,Demirel H.Application of NSGA-II to feature selection for facial expression recognition[J].Computers &Electrical Engineering,2011,37(6):1232-1240.

      [15]Pacheco J,Casado S,Nú?ez L,et al.Analysis of new variable selection methods for discriminant analysis[J].Computational Statistics&Data Analysis,2006,51(3):1463-1478.

      [16]Li J H,Yu F,F(xiàn)an F J.Ship block assembly selquence optimization based on genetic simulated annealing algorithm[J].Computer Integrated Manufacturing Systems,2013,19(1):39-45.(李敬花,余峰,樊付見.基于遺傳模擬退火融合算法的船舶分段裝配序列優(yōu)化[J].計算機(jī)集成制造系統(tǒng),2013,19(1):39-45.)

      [17]He X L,Bi Y M.Modeling and optimization of formation airto-ground attack fire distribution based on simulated annealing genetic algorithm[J].Systems Engineering and Electronics,2014,36(5):900-904.(賀小亮,畢義明.基于模擬退火遺傳算法的編隊對地攻擊火力分配建模與優(yōu)化[J].系統(tǒng)工程與電子技術(shù),2014,36(5):900-904.)

      [18]Oh I S,Lee JS,Moon B R.Hybrid genetic algorithms for feature selection[J].IEEE Trans.on Pattern Analysis and Machine Intelligence,2004,26(11):1424-1437.

      [19]Anzanello M J,Albin S L,Chaovalitwongse W A.Selecting the best variables for classifying production batches into two quality levels[J].Chemometrics and Intelligent Laboratory Systems,2009,97(2):111-117.

      [20]Bermejo P,Gámez J A,Puerta J M.Speeding up incremental wrapper feature subset selection with Naive Bayes classifier[J].Knowledge-Based Systems,2014,55:140-147.

      [21]Hall M,F(xiàn)rank E,Holmes G,et al.The WEKA data mining software:an update[J].ACM SIGKDD Explorations Newsletter,2009,11(1):10-18.

      Critical-to-quality characteristics identification for complex products using GSA

      LI An-da,HE Zhen,HE Shu-guang
      (College of Management and Economics,Tianjin University,Tianjin 300072,China)

      To identify critical-to-quality characteristics(CTQs)for complex products,a genetic simulated annealing algorithm(GSA)based feature selection algorithm is proposed.As the proposed algorithm combines the genetic algorithm(GA)and simulated annealing algorithm(SA),it has both good local search ability and good global search ability.Additionally,the proposed algorithm adopts an aggregated fitness function,which can optimize the classification performance on CTQ set and the number of selected quality characteristics simultaneously.Experimental results illustrate that the proposed algorithm can efficiently eliminate irrelevant and redundant quality characteristics and identify CTQs,as it can identify fewer CTQs with even higher predictive accuracy compared with the Memetic algorithm and the information gain(IG)algorithm.

      critical-to-quality characteristics(CTQs);genetic algorithm(GA);simulated annealing algorithm(SA);complex products;feature selection

      F 406.3 文獻(xiàn)標(biāo)志碼:A DOI:10.3969/j.issn.1001-506X.2015.09.18

      李岸達(dá)(1989-),男,博士研究生,主要研究方向為質(zhì)量工程、智能算法。

      E-mail:lianda1989@gmail.com

      何 楨(1967-),男,教授,博士,主要研究方向為質(zhì)量管理、質(zhì)量工程。

      E-mail:zhhe@tju.edu.cn

      何曙光(1979-),男,教授,博士,主要研究方向為質(zhì)量工程、信息系統(tǒng)。

      E-mail:shuguanghe@tju.edu.cn

      1001-506X(2015)09-2073-07

      2014-07-08;

      2014-12-25;網(wǎng)絡(luò)優(yōu)先出版日期:2015-01-20。

      網(wǎng)絡(luò)優(yōu)先出版地址:http://www.cnki.net/kcms/detail/11.2422.TN.20150120.1050.005.html

      國家自然科學(xué)基金(71102140);國家杰出青年科學(xué)基金(71225006)資助課題

      猜你喜歡
      模擬退火特征選擇適應(yīng)度
      改進(jìn)的自適應(yīng)復(fù)制、交叉和突變遺傳算法
      模擬退火遺傳算法在機(jī)械臂路徑規(guī)劃中的應(yīng)用
      Kmeans 應(yīng)用與特征選擇
      電子制作(2017年23期)2017-02-02 07:17:06
      基于空調(diào)導(dǎo)風(fēng)板成型工藝的Kriging模型適應(yīng)度研究
      中國塑料(2016年11期)2016-04-16 05:26:02
      基于模糊自適應(yīng)模擬退火遺傳算法的配電網(wǎng)故障定位
      聯(lián)合互信息水下目標(biāo)特征選擇算法
      SOA結(jié)合模擬退火算法優(yōu)化電容器配置研究
      基于遺傳-模擬退火算法的城市軌道交通快慢車停站方案
      基于特征選擇和RRVPMCD的滾動軸承故障診斷方法
      基于二元搭配詞的微博情感特征選擇
      惠水县| 梁河县| 金川县| 政和县| 陆河县| 萝北县| 江孜县| 阿城市| 康定县| 利川市| 黔西县| 辉南县| 嘉鱼县| 平原县| 光泽县| 洛南县| 灵武市| 德保县| 利津县| 潼南县| 凤翔县| 托克逊县| 新河县| 赞皇县| 东安县| 南阳市| 青冈县| 绥滨县| 南城县| 安庆市| 扶余县| 隆林| 楚雄市| 鄢陵县| 汉川市| 广安市| 上犹县| 滨海县| 乐至县| 富宁县| 长沙市|