• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于多目標(biāo)演化算法和改進(jìn)概率分類的重尾時(shí)間序列預(yù)測(cè)

      2020-12-14 10:21:48鄒小云林文學(xué)
      關(guān)鍵詞:分類器準(zhǔn)確率分類

      鄒小云 林文學(xué)

      1(湖北職業(yè)技術(shù)學(xué)院科研處 湖北 孝感 432000)2(湖北職業(yè)技術(shù)學(xué)院繼續(xù)教育學(xué)院 湖北 孝感 432000)

      0 引 言

      隨著互聯(lián)網(wǎng)和計(jì)算機(jī)領(lǐng)域的普及和廣泛應(yīng)用,許多應(yīng)用領(lǐng)域不斷地產(chǎn)生新的數(shù)據(jù)流,如金融市場(chǎng)[1]、視頻直播、語(yǔ)音通話和安全監(jiān)控系統(tǒng)[2]等。數(shù)據(jù)流有別于傳統(tǒng)的靜態(tài)數(shù)據(jù),所以傳統(tǒng)數(shù)據(jù)挖掘技術(shù)無(wú)法直接用來(lái)分析數(shù)據(jù)流。數(shù)據(jù)流分析逐漸成為了數(shù)據(jù)挖掘領(lǐng)域的研究熱點(diǎn),頻繁模式挖掘[3]、高效用模式挖掘[4]、概念漂移數(shù)據(jù)分類[5]、數(shù)據(jù)流異常檢測(cè)是其中的重點(diǎn)方向。數(shù)據(jù)流分類方法要求時(shí)間序列的主要特征都出現(xiàn)后才能分類,但在天氣預(yù)報(bào)、金融市場(chǎng)行情、網(wǎng)絡(luò)安全等應(yīng)用場(chǎng)景中,如果能盡早預(yù)測(cè)出數(shù)據(jù)流的趨勢(shì),能夠?yàn)闆Q策者帶來(lái)巨大的效益。

      為了在獲得部分特征的情況下對(duì)整個(gè)時(shí)間序列進(jìn)行提前預(yù)測(cè),Alonso等[6]首次提出了時(shí)間序列早期分類的概念,利用基于謂詞的分類器結(jié)合boosting算法可以達(dá)到早期分類的目的,但該方法的基分類器訓(xùn)練需要多次掃描樣本。時(shí)間序列普通分類問(wèn)題和早期分類問(wèn)題之間的差別在于,前者的目標(biāo)是最大化預(yù)測(cè)準(zhǔn)確率,而后者存在預(yù)測(cè)準(zhǔn)確率和早期性(時(shí)間提前量)兩個(gè)沖突的目標(biāo)。時(shí)間序列早期分類算法[7-8]主要分為兩個(gè)類型:基于Shapelet的分類算法通過(guò)搜索時(shí)間序列中的Shapelet特征來(lái)判斷樣本的分類[9-10];集成多個(gè)分類器評(píng)估不同時(shí)間戳的預(yù)測(cè)可靠性,確定預(yù)測(cè)分類的有效性。

      在時(shí)間序列早期分類的問(wèn)題中,早期性和分類準(zhǔn)確率是兩個(gè)沖突的目標(biāo),目前的主要方法是將這兩個(gè)目標(biāo)組合為一個(gè)總目標(biāo),再通過(guò)群體智能技術(shù)計(jì)算總目標(biāo)的Pareto最優(yōu)解[11]。如果使用30%的序列可獲得80%的準(zhǔn)確率,或者使用50%的序列可獲得90%的準(zhǔn)確率,難以判斷這兩種情況的優(yōu)劣。在不同的應(yīng)用場(chǎng)景下,對(duì)早期性和準(zhǔn)確率兩個(gè)目標(biāo)的要求不同,如安全領(lǐng)域需要盡早檢測(cè)出危險(xiǎn),而天氣預(yù)報(bào)需要在指定天數(shù)前盡可能準(zhǔn)確地預(yù)測(cè)出天氣?,F(xiàn)有的方法一般通過(guò)設(shè)置體現(xiàn)偏好的目標(biāo)重要性參數(shù)來(lái)調(diào)節(jié)分類模型,但這種方法需要獲取后驗(yàn)信息,并通過(guò)多次運(yùn)行分類程序才能完成對(duì)參數(shù)的調(diào)節(jié),顯然無(wú)法適用于實(shí)時(shí)數(shù)據(jù)流預(yù)測(cè)的情況。

      針對(duì)上述問(wèn)題,本文將早期性和分類準(zhǔn)確率作為兩個(gè)獨(dú)立的目標(biāo),采用演化算法同時(shí)優(yōu)化兩個(gè)目標(biāo),給出不同時(shí)間戳的預(yù)測(cè)準(zhǔn)確率和早期性結(jié)果,供用戶根據(jù)應(yīng)用場(chǎng)景自行選擇。此外,針對(duì)時(shí)間序列的重尾分布特點(diǎn),對(duì)高斯過(guò)程分類進(jìn)行了修改,提高對(duì)重尾分布時(shí)間序列的分類準(zhǔn)確率。

      1 時(shí)間序列預(yù)測(cè)算法設(shè)計(jì)

      1.1 問(wèn)題模型

      首先給出時(shí)間序列預(yù)測(cè)問(wèn)題的相關(guān)定義。

      定義1一個(gè)長(zhǎng)度為L(zhǎng)的時(shí)間序列定義為:

      TS={(ti,xi)|i=1,2,…,L}

      (1)

      定義2從時(shí)間t截?cái)嗟臅r(shí)間序列定義為T(mén)St,記為T(mén)St={(ti,xi)|i=1,2,…,t}。

      基于定義1和定義2,給出時(shí)間序列預(yù)測(cè)問(wèn)題的定義。

      定義3假設(shè)一個(gè)標(biāo)記時(shí)間序列的訓(xùn)練集為X={(TS1,CL1),(TS2,CL2),…,(TSn,CLn)},其中:TSi為時(shí)間序列;CLi為對(duì)應(yīng)的類標(biāo)簽。時(shí)間序列預(yù)測(cè)分類問(wèn)題定義為:根據(jù)一部分時(shí)間序列TSt*建立從時(shí)間序列到類標(biāo)簽的映射,并能夠盡早預(yù)測(cè)出新到達(dá)樣本的類標(biāo)簽。

      1.2 時(shí)間序列早期分類的優(yōu)化方法設(shè)計(jì)

      本文的目標(biāo)是獲得一個(gè)集合{((h1,h2,…,hL),sγ1),((h1,h2,…,hL),sγ2),…,((h1,h2,…,hL),sγg)},其中:{h1,h2,…,hL}為分類器序列;sγi為分類器對(duì)應(yīng)的觸發(fā)函數(shù);{sγ1,sγ2,…,sγg}為優(yōu)化的觸發(fā)函數(shù)集。

      本文方法主要分為3個(gè)步驟:訓(xùn)練概率分類器集,選擇指定的觸發(fā)函數(shù),優(yōu)化選擇的觸發(fā)函數(shù)集。

      1.3 訓(xùn)練分類器

      首先訓(xùn)練一個(gè)分類器集,負(fù)責(zé)預(yù)測(cè)每個(gè)時(shí)間戳樣本的類標(biāo)簽,圖1是訓(xùn)練分類器的主要流程。在訓(xùn)練時(shí)間戳t的分類器之前,提取X的所有時(shí)間序列,然后在時(shí)間戳t截?cái)嘈蛄小r(shí)間戳t可以是絕對(duì)時(shí)間,也可以是序列長(zhǎng)度的百分比。接著選擇一個(gè)度量指標(biāo)評(píng)估時(shí)間序列之間的距離,再組成一個(gè)距離矩陣。

      圖1 分類器訓(xùn)練程序的流程

      不同的學(xué)習(xí)算法對(duì)輸入數(shù)據(jù)的格式具有特定要求,動(dòng)態(tài)時(shí)間歸整(Dynamic Time Warping, DTW)采用動(dòng)態(tài)規(guī)劃方法來(lái)進(jìn)行時(shí)間規(guī)整的計(jì)算,尤其適用于不同長(zhǎng)度、不同節(jié)奏的時(shí)間序列,所以本文采用DTW度量時(shí)間序列之間的距離。采用改進(jìn)的貝葉斯分類器輸出時(shí)間戳t的樣本關(guān)于每個(gè)類的隸屬度。

      1.4 定義觸發(fā)函數(shù)

      圖2 時(shí)間序列預(yù)測(cè)分類的流程圖

      圖2中觸發(fā)函數(shù)的輸出為0或者1。如果觸發(fā)函數(shù)判斷預(yù)測(cè)結(jié)果的可靠度高,則選擇當(dāng)前預(yù)測(cè)準(zhǔn)確率最高的分類方案;如果觸發(fā)函數(shù)判斷預(yù)測(cè)結(jié)果不可靠,那么等待、收集更多的時(shí)間序列。線性觸發(fā)函數(shù)定義為:

      (2)

      觸發(fā)函數(shù)集內(nèi)所有函數(shù)的形狀均相同,區(qū)別在于γ參數(shù)不同,因此需要計(jì)算優(yōu)化預(yù)測(cè)準(zhǔn)確率和預(yù)測(cè)提前量的γ參數(shù)。

      1.5 最優(yōu)觸發(fā)函數(shù)集

      γ參數(shù)向量是決定觸發(fā)函數(shù)(式(2))的關(guān)鍵,如果γi設(shè)為[-1,1]內(nèi)的隨機(jī)數(shù),則可能出現(xiàn)重復(fù)值,并且其觸發(fā)函數(shù)獲得的預(yù)測(cè)準(zhǔn)確率和早期性并非最優(yōu)值。

      1)評(píng)價(jià)觸發(fā)函數(shù)的質(zhì)量。為了評(píng)價(jià)觸發(fā)函數(shù)的預(yù)測(cè)準(zhǔn)確率和早期性,采用兩個(gè)被廣泛使用的評(píng)價(jià)指標(biāo),評(píng)估早期性質(zhì)量的方法為:

      (3)

      (4)

      (5)

      然后使用元啟發(fā)式算法求解多目標(biāo)優(yōu)化問(wèn)題。采用多目標(biāo)優(yōu)化的理由主要有三點(diǎn):(1)如果將兩個(gè)目標(biāo)組合成一個(gè)優(yōu)化問(wèn)題,那么Ca和Ce必須縮放到相同的區(qū)間,才能使兩個(gè)目標(biāo)間保持平衡。(2)兩個(gè)目標(biāo)組合優(yōu)化問(wèn)題需要預(yù)先分配權(quán)重,該參數(shù)難以確定。(3)為了權(quán)衡兩個(gè)目標(biāo)的關(guān)系,需要多次運(yùn)行程序,而多目標(biāo)優(yōu)化程序通過(guò)一次運(yùn)行即可獲得一組非支配解集。本文將非支配解集輸出供用戶根據(jù)具體的應(yīng)用場(chǎng)景選擇。

      1.6 結(jié)構(gòu)設(shè)計(jì)

      本文目標(biāo)是為用戶提供一組分類器和觸發(fā)函數(shù)的集合{((h1,h2,…,hL),sγ1),((h1,h2,…,hL),sγ2),…,((h1,h2,…,hL),sγg)}。圖3是本文時(shí)間序列預(yù)測(cè)方法的結(jié)構(gòu),用戶根據(jù)實(shí)際需求選擇滿足其預(yù)測(cè)準(zhǔn)確率和早期性的最佳觸發(fā)函數(shù)sγ*,本文算法基于觸發(fā)函數(shù)sγ*和分類器(h1,h2,…,hL)來(lái)預(yù)測(cè)新時(shí)間序列的分類。

      圖3 時(shí)間序列預(yù)測(cè)方法的結(jié)構(gòu)

      2 概率分類器設(shè)計(jì)

      設(shè)計(jì)開(kāi)發(fā)了高斯過(guò)程分類器預(yù)測(cè)時(shí)間序列的分類概率,并針對(duì)重尾分布型時(shí)間序列進(jìn)行了改進(jìn)。將貝葉斯分類器和半?yún)?shù)模型結(jié)合,能夠自適應(yīng)調(diào)節(jié)模型的參數(shù),并提高對(duì)時(shí)間序列中風(fēng)險(xiǎn)數(shù)據(jù)的預(yù)測(cè)能力。

      2.1 時(shí)間序列的貝葉斯分類器模型

      設(shè)yi(s)表示子集Si的訓(xùn)練函數(shù),設(shè)ci∈{1,2,…,G}為對(duì)應(yīng)的類標(biāo)簽。假設(shè)類g的觀察樣本滿足相同的平均函數(shù)ηg(s)和協(xié)方差函數(shù)γg(s,t),觀察樣本可以是動(dòng)態(tài)或靜態(tài)的。設(shè)πg(shù)表示觀察樣本屬于類g的先驗(yàn)概率,分類器的目標(biāo)是學(xué)習(xí)一個(gè)預(yù)測(cè)模型,將新觀察樣本y分配到G中的一個(gè)類。貝葉斯分類器的最優(yōu)規(guī)則是最大化類g的后驗(yàn)概率:

      (6)

      式中:p(y|g)表示樣本y的類標(biāo)簽為g的似然概率。

      以網(wǎng)格形式記錄序列函數(shù)曲線,設(shè)yit=y(sit)表示位置sit(t=1,2,…,ni)、第i個(gè)樣本的觀察函數(shù)。新的觀察樣本表示為向量形式y(tǒng),將式(6)的p(y|g)替換為f(y|g),其中f(·|g)表示類g的分布密度。式(6)的分類隸屬度后驗(yàn)信息提供了分類不確定性的重要信息,該信息對(duì)于風(fēng)險(xiǎn)預(yù)測(cè)具有巨大的價(jià)值。傳統(tǒng)的高斯過(guò)程分類生成每個(gè)曲線的極限后驗(yàn)概率,對(duì)于錯(cuò)誤分類表現(xiàn)出過(guò)度置信,導(dǎo)致對(duì)重尾分布存在過(guò)度置信的問(wèn)題。為了解決這個(gè)問(wèn)題,本文對(duì)高斯過(guò)程分類做出修改,簡(jiǎn)稱為改進(jìn)的高斯過(guò)程分類器(Improved Gaussian Classifier,IGC),IGC不僅降低了重尾分布數(shù)據(jù)的分類錯(cuò)誤率,同時(shí)所估計(jì)的后驗(yàn)概率分布能夠準(zhǔn)確地反映樣本在類中的不確定性。

      采用分類錯(cuò)誤率和對(duì)數(shù)損失LogLoss從不同角度評(píng)價(jià)分類器的性能,LogLoss通過(guò)懲罰錯(cuò)誤分類實(shí)現(xiàn)對(duì)分類器準(zhǔn)確性的量化。LogLoss定義為:

      (7)

      式中:i表示觀察樣本,如果i屬于類g,那么Iig等于1,否則等于0;pig表示第i個(gè)觀察樣本分配到類g的預(yù)測(cè)概率。

      2.2 改進(jìn)的高斯過(guò)程

      為了提高式(6)的魯棒性和后驗(yàn)密度,將式(6)修改為半?yún)?shù)的混合高斯訓(xùn)練模型,定義為:

      (8)

      式中:i=1,2,…,Mg,Mg為類g的觀察樣本數(shù)量;yi表示第i個(gè)觀察樣本的離散響應(yīng)(長(zhǎng)度為ni);Bi和Ri分別為ni×p和ni×q的樣條基矩陣;β和γi分別為Bi和Ri的系數(shù)因子;εi為高斯模型的位移因子;tq和tni分別表示范圍為q和ni的高斯分布;采用多變量的t-分布建模隨機(jī)系數(shù)和度量誤差,兩者的自由度均設(shè)為v;Γ和Λi分別表示兩者的縮放矩陣。

      本文的改進(jìn)模型保留了高斯模型原有的優(yōu)點(diǎn),如支持無(wú)參數(shù)的擬合平均函數(shù),支持通過(guò)無(wú)結(jié)構(gòu)的協(xié)方差矩陣Γ來(lái)近似曲線內(nèi)的協(xié)方差結(jié)構(gòu),支持多種數(shù)據(jù)分布類型。高斯模型也具有一定的魯棒性,對(duì)重尾分布也具有一定的處理能力,這也是本文選擇以高斯分類器為基礎(chǔ)的原因。

      對(duì)每個(gè)類訓(xùn)練一個(gè)魯棒模型,計(jì)算新觀察樣本對(duì)類的似然來(lái)近似式(6)。使用伽瑪-正態(tài)混合分布表示多變量t模型,yi的邊緣分布屬于多變量的t-分布,定義為:

      (9)

      式中:vd為密度函數(shù);設(shè)γi|τi~Nq(0,Γ/τi)和εi|γi兩者之間條件獨(dú)立,新到達(dá)樣本概率τi服從正態(tài)分布:τi~Nni(0,Λi/τi),也服從伽瑪分布:τi~Gamma(v/2,v/2)。

      參考文獻(xiàn)[12]的方法將數(shù)據(jù)投影到一個(gè)特征函數(shù)的序列來(lái)近似式(6)的密度概率,采用基樣條曲線來(lái)擬合離散的度量指數(shù),本文方法能夠處理不規(guī)則采樣的數(shù)據(jù)和多曲線的分類問(wèn)題。時(shí)間序列中存在許多高維數(shù)據(jù)的情況,因此分類器可能使用高維信息來(lái)建模密度,一般通過(guò)粗糙懲罰(L1泛化)或者稀疏性條件(L2泛化)來(lái)解決高維問(wèn)題。因?yàn)楸疚牡姆诸惼髟趯?shí)數(shù)數(shù)據(jù)流的情況下工作,分類效率是一個(gè)關(guān)鍵的要素,所以本文采用B樣條基進(jìn)行無(wú)參數(shù)建模,從而使本文方法的計(jì)算效率高于L1泛化和L2泛化高維近似方法。

      2.3 改進(jìn)的高斯過(guò)程分類

      在時(shí)間序列的實(shí)際應(yīng)用中,存在大量重復(fù)的觀察樣本,所以觀察樣本之間存在相關(guān)性,通過(guò)分析相關(guān)的觀察樣本,能夠加快時(shí)間序列預(yù)測(cè)的速度。為了考慮觀察樣本間的依賴性,對(duì)式(8)進(jìn)行修改,增加類級(jí)別的隨機(jī)函數(shù),其系數(shù)服從以v為密度函數(shù)的t-分布。設(shè)yij為第i個(gè)類、第j次重復(fù)的nij維響應(yīng)向量,如果每個(gè)類包含多次重復(fù),那么將多級(jí)分類模型重寫(xiě)為:

      (10)

      式中:Dij為nij×r的樣條基矩陣;δi為一個(gè)隨機(jī)向量。根據(jù)多變量t-分布將每個(gè)樣本分類;ψ表示高斯分布的偏差。

      (11)

      (12)

      3 實(shí) 驗(yàn)

      3.1 實(shí)驗(yàn)數(shù)據(jù)集

      目前主流的時(shí)間序列早期分類算法和預(yù)測(cè)算法均采用UCR時(shí)間序列數(shù)據(jù)庫(kù)作為benchmark數(shù)據(jù)庫(kù)。本文從UCR數(shù)據(jù)庫(kù)中選擇17個(gè)不同應(yīng)用場(chǎng)景的數(shù)據(jù)集,便于與其他算法的結(jié)果作比較。這17個(gè)數(shù)據(jù)集的應(yīng)用場(chǎng)景不同、維度不同且分類數(shù)量也不同。將分類器的學(xué)習(xí)步長(zhǎng)定義為時(shí)間序列總長(zhǎng)度的5%,采用DTW度量時(shí)間序列之間的距離。

      3.2 參數(shù)設(shè)置

      本文方法包含兩個(gè)重要的模塊:雙目標(biāo)優(yōu)化算法和分類器的學(xué)習(xí)算法。分類器采用本文所設(shè)計(jì)的改進(jìn)高斯過(guò)程分類器。此外,需要通過(guò)雙目標(biāo)優(yōu)化方法計(jì)算非支配解集,多目標(biāo)優(yōu)化方法并非本文的研究重點(diǎn),因此選擇3個(gè)被廣泛應(yīng)用的多目標(biāo)演化優(yōu)化算法分別與本文方法集成,評(píng)估本文時(shí)間序列預(yù)測(cè)方法的性能。3個(gè)雙目標(biāo)優(yōu)化算法分別為非支配排序遺傳算法(NSGA-II)、多目標(biāo)螢火蟲(chóng)算法(MOFA)和多目標(biāo)粒子群優(yōu)化(MOPSO)。3個(gè)優(yōu)化算法與本文方法的結(jié)合版本分別簡(jiǎn)稱為NSGA_IPA、MOFA_IPA和MOPSO_IPA。表1所示是3個(gè)優(yōu)化算法的參數(shù)設(shè)置。

      表1 優(yōu)化算法的參數(shù)設(shè)置

      3.3 對(duì)比方法選擇

      本文方法的特殊之處是獨(dú)立優(yōu)化預(yù)測(cè)準(zhǔn)確率和早期性兩個(gè)目標(biāo),而其他許多方法均將多個(gè)目標(biāo)組合為一個(gè)單目標(biāo)的優(yōu)化算法。

      本文方法與最近相關(guān)的2個(gè)時(shí)間序列早期分類方法做比較:CAEC算法[13]、ESC算法[14]。CAEC算法是一種廣義的時(shí)間序列預(yù)測(cè)分類算法,該算法也是一種基于概率的分類程序,而本文方法也是基于概率的分類程序。ESC算法是一種基于Shapelet的時(shí)間序列分類算法,該算法與本文方法屬于不同的類型,但其分類準(zhǔn)確率好于其他基于Shapelet的算法。表2是這2個(gè)算法在實(shí)驗(yàn)中的參數(shù)設(shè)置。

      表2 對(duì)比方法的參數(shù)設(shè)置

      3.4 實(shí)驗(yàn)結(jié)果分析

      每隔5%的時(shí)間序列訓(xùn)練一組分類器,分別使用NSGA-II、MOFA和MOPSO算法作為優(yōu)化算法,3個(gè)優(yōu)化算法均采用隨機(jī)的初始化種群。采用式(3)和式(4)分別計(jì)算早期性Ce和預(yù)測(cè)準(zhǔn)確率Ca。

      采用超體積指標(biāo)[15]評(píng)估3個(gè)優(yōu)化算法解空間的質(zhì)量,該指標(biāo)度量了解空間的體積。解集的超體積指標(biāo)越大,表示其支配的解空間和覆蓋的區(qū)域越大,其性能越好,該指標(biāo)同時(shí)反映了解集的質(zhì)量和多樣性。統(tǒng)計(jì)了3個(gè)優(yōu)化算法對(duì)17個(gè)數(shù)據(jù)集最小化Ca和Ce的超體積結(jié)果圖,如圖4所示,以(100,100)坐標(biāo)為參考點(diǎn),該坐標(biāo)是最差的可能解。

      圖4 3個(gè)優(yōu)化算法最小化成本Ca和Ce的超體積結(jié)果比較

      圖4并未統(tǒng)計(jì)其他3個(gè)對(duì)比方法,因?yàn)樗鼈兊哪繕?biāo)是以分類準(zhǔn)確率為支配目標(biāo),在大多數(shù)情況下僅獲得了極少的解。從圖中可看出,本文方法和3個(gè)優(yōu)化算法的組合方法均獲得了較多的解集,其中NSGA_IPA的求解質(zhì)量略好于其他MOFA和MOPSO,因此選擇NSGA_IPA作為實(shí)驗(yàn)方法。

      3.5 時(shí)間序列的預(yù)測(cè)實(shí)驗(yàn)

      (1)搜索的解集。表3所示是3個(gè)預(yù)測(cè)方法對(duì)于17個(gè)數(shù)據(jù)集獲得的解集數(shù)量統(tǒng)計(jì),表中“i/j”中i表示非支配解的數(shù)量,j表示計(jì)算的所有解數(shù)量??煽闯鯟AEC計(jì)算了固定的總候選解的數(shù)量為8,ESC也計(jì)算了固定的總候選解的數(shù)量為12,本文方法則提供了較多的候選解數(shù)量,并且從解集中提取出非支配解供用戶選擇??傮w而言,本文計(jì)算的解集數(shù)量遠(yuǎn)高于其他2個(gè)算法。

      表3 3個(gè)預(yù)測(cè)算法的解集數(shù)量

      (2)預(yù)測(cè)準(zhǔn)確率的結(jié)果。雖然本文的目標(biāo)是為用戶提供非支配解集,使用戶按照應(yīng)用需求選擇最合適的解,但本文方法對(duì)高斯過(guò)程分類進(jìn)行了改進(jìn),有效地提高了重尾分布時(shí)間序列的分類性能。CAEC和ESC 2個(gè)算法均以最大化分類準(zhǔn)確率為支配目標(biāo),以早期性為約束條件,所以這2個(gè)算法的分類準(zhǔn)確率應(yīng)當(dāng)較為理想。此外將本文方法和普通高斯過(guò)程分類方法結(jié)合,組成的算法簡(jiǎn)稱為NSGA_GC,比較本文對(duì)高斯過(guò)程分類的改進(jìn)效果,NSGA_GC和NSGA_IPA的支配解作為該組實(shí)驗(yàn)的性能結(jié)果。4個(gè)時(shí)間序列早期分類算法對(duì)于17個(gè)數(shù)據(jù)集分別進(jìn)行了預(yù)測(cè)分類實(shí)驗(yàn),每組實(shí)驗(yàn)獨(dú)立運(yùn)行30次,統(tǒng)計(jì)30次的平均準(zhǔn)確率作為實(shí)驗(yàn)結(jié)果,如圖5所示。比較NSGA_GC和NSGA_IPA兩個(gè)算法,NSGA_IPA對(duì)于17個(gè)數(shù)據(jù)集的分類準(zhǔn)確率均高于NSGA_GC,反映出本文對(duì)于高斯過(guò)程分類的改進(jìn)效果較好。ESC的預(yù)測(cè)準(zhǔn)確率與本文算法較為接近,ESC通過(guò)檢測(cè)Shapelet實(shí)現(xiàn)了較好的分類準(zhǔn)確率。但綜合17個(gè)數(shù)據(jù)集的結(jié)果,NSGA_IPA的預(yù)測(cè)分類質(zhì)量最高,并且提供了豐富的解集供用戶選擇。

      圖5 時(shí)間序列早期分類的平均準(zhǔn)確率

      4 結(jié) 語(yǔ)

      本文將早期性和分類準(zhǔn)確率作為2個(gè)獨(dú)立的目標(biāo),采用演化算法同時(shí)優(yōu)化2個(gè)目標(biāo),給出不同時(shí)間戳的預(yù)測(cè)準(zhǔn)確率和早期性結(jié)果,供用戶根據(jù)應(yīng)用場(chǎng)景自行選擇。此外,針對(duì)時(shí)間序列的重尾分布特點(diǎn),對(duì)高斯過(guò)程分類進(jìn)行了修改,提高對(duì)重尾分布時(shí)間序列的分類準(zhǔn)確率,并且優(yōu)化了時(shí)間效率。實(shí)驗(yàn)結(jié)果表明,本文算法有效地提高了時(shí)間序列的預(yù)測(cè)準(zhǔn)確率,并為用戶提供了豐富的非支配解集。

      本文采用了經(jīng)典的3個(gè)多目標(biāo)優(yōu)化算法完成了仿真實(shí)驗(yàn),優(yōu)化算法是本文時(shí)間序列早期分類的一個(gè)關(guān)鍵部分。未來(lái)將針對(duì)早期性和預(yù)測(cè)準(zhǔn)確率2個(gè)指標(biāo)研究更加合適的多目標(biāo)優(yōu)化算法,以提高算法的總體性能。

      猜你喜歡
      分類器準(zhǔn)確率分類
      分類算一算
      乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
      健康之家(2021年19期)2021-05-23 11:17:39
      不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
      2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
      分類討論求坐標(biāo)
      高速公路車牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法
      數(shù)據(jù)分析中的分類討論
      BP-GA光照分類器在車道線識(shí)別中的應(yīng)用
      教你一招:數(shù)的分類
      加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
      太仓市| 新干县| 江山市| 新丰县| 合水县| 台前县| 梅州市| 武威市| 泰兴市| 太湖县| 周口市| 金坛市| 景东| 蛟河市| 元谋县| 綦江县| 临洮县| 宁乡县| 永胜县| 元朗区| 安国市| 湘西| 永和县| 阳曲县| 长治县| 卢龙县| 石门县| 浦北县| 临猗县| 张家川| 辽阳县| 山西省| 武宁县| 淮北市| 措美县| 龙岩市| 庆安县| 柯坪县| 顺义区| 成都市| 南和县|