• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于SSI-PSO 的汽車碰撞試驗(yàn)時序數(shù)據(jù)處理與分類方法

    2022-07-17 07:42:38晗,劉釗,朱
    關(guān)鍵詞:粒子神經(jīng)網(wǎng)絡(luò)分類

    李 晗,劉 釗,朱 平

    (1.上海交通大學(xué) 機(jī)械與動力工程學(xué)院,上海 200240,中國;2.上海交通大學(xué) 設(shè)計學(xué)院,上海 200240,中國)

    假人響應(yīng)曲線是汽車碰撞試驗(yàn)中從試驗(yàn)假人傳感器采集得到的多組時序數(shù)據(jù),是反映汽車安全性的重要數(shù)據(jù)。在進(jìn)行汽車碰撞安全試驗(yàn)時,通常在每個試驗(yàn)假人上布置50~70 處傳感器,以測量和記錄碰撞發(fā)生時刻后300 ms 內(nèi)各處的力、力矩、加速度、位移等信息,每組數(shù)據(jù)即具備時序、多變量、高維度等特性?;诎踩ㄒ?guī)和標(biāo)準(zhǔn),汽車安全性評價和乘員損傷指標(biāo)即通過假人響應(yīng)曲線的峰值、累計值等信息計算。假人響應(yīng)曲線中蘊(yùn)含了大量信息,在工程開發(fā)過程中,同樣會參考?xì)v史記錄中相似的曲線波形,以評估當(dāng)前乘員約束系統(tǒng)的設(shè)計狀態(tài)、獲取設(shè)計的參考信息。

    然而,在面向工程應(yīng)用開發(fā)的汽車碰撞安全數(shù)據(jù)統(tǒng)計和分析過程中發(fā)現(xiàn),假人曲線數(shù)據(jù)存在一定量的位置信息不一致(標(biāo)注錯誤)、試驗(yàn)工況標(biāo)注缺失(標(biāo)注缺失)等數(shù)據(jù)質(zhì)量問題。這些問題在單次的工程開發(fā)過程中不會造成直接的影響;然而在基于數(shù)據(jù)挖掘的分析和應(yīng)用過程中,則影響后續(xù)工程指標(biāo)的提取和結(jié)論判定,亟需有效的數(shù)據(jù)治理方法。

    在對汽車碰撞試驗(yàn)假人響應(yīng)曲線進(jìn)行數(shù)據(jù)挖掘與知識發(fā)現(xiàn)的過程中,特征的選擇、參數(shù)的調(diào)整、模型的構(gòu)造等問題可以轉(zhuǎn)化為優(yōu)化問題,數(shù)據(jù)模型的訓(xùn)練本身即為參數(shù)優(yōu)化問題,因此優(yōu)化算法是數(shù)據(jù)挖掘的重要的驅(qū)動工具[1-3]。啟發(fā)式群智能類優(yōu)化算法基于自組織的結(jié)構(gòu)在優(yōu)化過程中積累數(shù)據(jù),并從數(shù)據(jù)中學(xué)習(xí)經(jīng)驗(yàn)和知識以指導(dǎo)自身的優(yōu)化搜索行為,是廣義的機(jī)器學(xué)習(xí)方法[4]。智能優(yōu)化算法在解決上述優(yōu)化問題中取得了一定的效果,過早收斂而陷入局部最優(yōu)解的問題仍阻礙著其進(jìn)一步的應(yīng)用[4-5]。

    本文針對汽車碰撞安全試驗(yàn)假人曲線分類問題,基于社會蜘蛛粒子群優(yōu)化算法,研究面向智能優(yōu)化算法的優(yōu)化問題轉(zhuǎn)換和構(gòu)造方法,提出優(yōu)化驅(qū)動的碰撞試驗(yàn)多變量時序數(shù)據(jù)特征選擇和分類方法,并利用汽車碰撞試驗(yàn)采集的曲線數(shù)據(jù)進(jìn)行方法的測試和驗(yàn)證。

    1 假人曲線數(shù)據(jù)分類問題描述

    某公司通過汽車安全試驗(yàn)累積了大量假人響應(yīng)數(shù)據(jù),其中部分駕駛員假人頭部、副駕駛側(cè)假人頭部的加速度響應(yīng)曲線如圖1 所示。其中:ax、ay、az為假人頭部的3 向加速度。該數(shù)據(jù)集還包括:頭、頸、胸、股骨、髕骨、脛骨等部位的位移、速度、加速度等信息,技術(shù)規(guī)范[6]規(guī)定的如何處理試驗(yàn)曲線并計算工程指標(biāo)。

    圖1 汽車安全試驗(yàn)假人頭部碰撞響應(yīng)曲線數(shù)據(jù)(部分)

    該公司的汽車安全試驗(yàn)假人碰撞響應(yīng)曲線數(shù)據(jù)的部分統(tǒng)計信息如表1 所示。其中,曲線名稱與曲線編號是各組曲線數(shù)據(jù)中均有標(biāo)注的信息,記錄來自試驗(yàn)過程的不同來源。曲線編號即根據(jù)曲線名稱編譯得到。

    表1表明:實(shí)際數(shù)據(jù)集中存在著曲線編號與曲線名稱不一致的情況,即存在同一個曲線名稱對應(yīng)多個曲線編號,或同一個曲線編號對應(yīng)多個曲線名稱。針對表1 所列舉的統(tǒng)計信息,在曲線名稱正確的前提下,根據(jù)曲線編號規(guī)則可以明確地指出在3 組曲線名稱對應(yīng)計數(shù)較少的曲線編號標(biāo)注錯誤,其分別是由標(biāo)注錯位置、方向、位置導(dǎo)致的。而針對單一的曲線數(shù)據(jù),則無法直接判斷正確的標(biāo)注應(yīng)當(dāng)遵從曲線名稱或者曲線編號。

    表1 汽車安全試驗(yàn)假人碰撞響應(yīng)曲線數(shù)據(jù)統(tǒng)計信息(部分)

    這些問題通常是由于試驗(yàn)人員操作不規(guī)范、失誤、疏忽,數(shù)據(jù)遺漏等原因造成成套假人曲線的測量位置、工況缺失或標(biāo)注錯誤等問題。例如在進(jìn)行臺架試驗(yàn)時,基于特定目的或僅需做單側(cè)假人試驗(yàn),而在進(jìn)行傳感器接入和配置時未全部設(shè)置正確。在這種情況下試驗(yàn)仍然是有效的,工程師亦能從試驗(yàn)結(jié)果中判斷實(shí)際情況并獲取有效信息;然而,在后續(xù)進(jìn)行數(shù)據(jù)挖掘時,則需要發(fā)現(xiàn)并糾正此類數(shù)據(jù)標(biāo)注問題,避免數(shù)據(jù)類別錯誤影響后續(xù)工程指標(biāo)的提取和判斷。

    針對假人曲線數(shù)據(jù)存在的多種標(biāo)注問題,需要建立有效的分類模型加以治理。由于假人曲線數(shù)據(jù)采集自多條通道,每條通道即包含3 000 個樣本點(diǎn),故屬多變量高維時序數(shù)據(jù),計算成本較高。一方面,基于技術(shù)規(guī)范對損傷指標(biāo)進(jìn)行提取,該種數(shù)據(jù)降維方法舍棄了大量的數(shù)據(jù)特征,數(shù)據(jù)差異較小,難以有效地建立區(qū)分?jǐn)?shù)據(jù)采集位置、工況等信息的分類模型;另一方面,由于數(shù)據(jù)的強(qiáng)非線性和差異性,直接基于單一類別曲線亦難以建立精確的分類模型。

    為實(shí)現(xiàn)對汽車碰撞安全試驗(yàn)假人曲線數(shù)據(jù)的缺失類別標(biāo)注和錯誤標(biāo)注檢測、降低高維數(shù)據(jù)下的計算開銷,需要研究有效的多變量時序數(shù)據(jù)特征處理和分類方法,利用多通道傳感器采集的多變量時序數(shù)據(jù)構(gòu)造特征處理問題和分類問題,并基于有效的優(yōu)化算法進(jìn)行求解。

    2 社會蜘蛛粒子群優(yōu)化算法

    2.1 標(biāo)準(zhǔn)粒子群優(yōu)化算法

    根據(jù)啟發(fā)式智能優(yōu)化算法比喻(metaphor)來源的不同,可分為4 類:生物遺傳類算法、物理法則類算法、群智能類算法、直接啟發(fā)類算法(或稱為人類活動啟發(fā)的算法)。根據(jù)比喻義來源的分類法通常難以反映算法的機(jī)理,而根據(jù)算法核心迭代公式進(jìn)行推導(dǎo),可重新分為2 類:1) 直接搜索類算法,這類算法通常含有速度的概念,如中心力優(yōu)化算法[7]、引力搜索算法[8]、粒子群優(yōu)化算法[9]、人工蜂群算法[10]、蜻蜓算法[11]等;2)迭代選擇類算法,這類算法在每步迭代后會對新產(chǎn)生的種群進(jìn)行比較和選擇,如遺傳算法[12]、差分進(jìn)化算法[13]、和弦搜索算法等[14]。

    粒子群優(yōu)化算法(particle swarm optimization,PSO)因其相對的易用性和有效性,被視為代表性的群智能優(yōu)化算法,其通過模仿鳥類的捕食行為設(shè)計的算法迭代格式。針對最小化問題,有:

    其中:x是D維設(shè)計變量,f(x)是優(yōu)化目標(biāo)函數(shù)。

    粒子群優(yōu)化算法構(gòu)造了NP個粒子對公式(1)所示的D維問題進(jìn)行迭代求解。以xi(t)和vi(t)分別表示第i個粒子在第t迭代步的位置和速度。位置即當(dāng)前粒子對應(yīng)的候選解,速度是當(dāng)前粒子下一步尋優(yōu)的移動方向,兩者均為D維向量。pi(t)第i個粒子截止到第t迭代步所搜索到的個體最優(yōu)解,g(t)是全部NP個粒子截止到第t迭代步所搜索到的全局最優(yōu)解。適應(yīng)度是比較粒子優(yōu)劣的標(biāo)準(zhǔn),通常直接利用目標(biāo)函數(shù)構(gòu)造適應(yīng)度。

    對于t+1 時刻的第i個粒子,位置更新公式為:

    其中:xd,i和vd,i分別為xi和vi的第d維分量;速度更新公式為:

    其中:pd,i和gd分別為pi和g的第d維分量;ω是慣性系數(shù),通常隨迭代過程由0.9 線性遞減至0.1;c1和c2是兩項(xiàng)對應(yīng)的個體認(rèn)知系數(shù)和社會認(rèn)知系數(shù),通常在[1,2]區(qū)間取值;r1和r2是[0, 1]區(qū)間均勻分布的隨機(jī)數(shù)。

    2.2 基于動態(tài)子種群的優(yōu)化性能改進(jìn)

    粒子群優(yōu)化算法的優(yōu)化能力主要受限于其過早收斂現(xiàn)象。面向工程優(yōu)化問題的特殊性,本研究基于一種改進(jìn)的粒子群算法——社會蜘蛛粒子群算法(social spider inspired particle swarm optimization,SSI-PSO)[15],通過設(shè)計新的種群結(jié)構(gòu)和混合迭代策略增強(qiáng)算法的全局探索能力和局部搜索能力?;跇?biāo)準(zhǔn)粒子群算法框架,SSI-PSO 算法通過模仿社會蜘蛛(social spider)群落的個體間行為[16-17],將全部粒子隨機(jī)地劃分為F 粒子(female particle)和M 粒子(male particle),各子種群策略具體如下。

    2.2.1 F 粒子

    F 粒子關(guān)注優(yōu)化過程中的全局探索能力,由正F(positive female,PF)粒子和負(fù)F(negative female, NF)粒子組成。在每一輪迭代中,F(xiàn) 粒子隨機(jī)地劃分為PF粒子和NF 粒子,這2 類粒子適應(yīng)度的優(yōu)劣亦是隨機(jī)的。

    PF 粒子采用標(biāo)準(zhǔn)的速度更新公式,如式(4)所示。因?yàn)镻F 粒子是從種群中隨機(jī)選取的,所以避免了全部粒子均為高適應(yīng)度或者低適應(yīng)度等弱化多樣性的情形。因此,PF 粒子是充分利用標(biāo)準(zhǔn)粒子群算法優(yōu)勢的基礎(chǔ)。

    其中:變量定義與式(3)相同。

    NF 粒子的速度更新公式如式(5)所示。NF 粒子與PF 粒子處于相同狀態(tài)時,傾向于向相反方向移動??紤]到實(shí)際優(yōu)化問題通常是復(fù)雜且多峰的,NF 粒子的策略也有利于增加種群的多樣性。同時,因?yàn)镹F 粒子不再被個體最優(yōu)解和全局最優(yōu)解所吸引,過早收斂于局部最優(yōu)解的問題亦可以在一定程度上緩解,進(jìn)而更可能發(fā)現(xiàn)潛在的更優(yōu)解。

    其中:變量定義與式(3)相同。

    2.2.2 M 粒子

    M 粒子關(guān)注優(yōu)化過程中的局部搜索能力,由支配性M(dominant male, DM)粒子和非支配性M(nondominant male, NM)粒子組成。與F粒子隨機(jī)劃分不同,在每一輪迭代中先對M 粒子進(jìn)行適應(yīng)度排序,適應(yīng)度高的為DM 粒子,適應(yīng)度低的為NM 粒子。

    盡管在算法設(shè)計過程中不希望過早地收斂于局部最優(yōu)解,但一般認(rèn)為最終的全局最優(yōu)解可能在局部最優(yōu)解附近。因此,具有較高適應(yīng)度的DM 粒子采用局部搜索策略,其修改后的速度更新公式為

    其中:變量定義與公式(3)相同。此外,利用第i個粒子當(dāng)前的局部最優(yōu)解li(t)替代了全局最優(yōu)解g(t)。局部最優(yōu)解是從距離當(dāng)前粒子最近的LR×NP個個體最優(yōu)解確定的。LR是預(yù)設(shè)的局部搜索范圍,在確定局部的搜索范圍后,距離為確定候選個體最優(yōu)解后,從中選擇適應(yīng)度最好的候選個體最優(yōu)解作為當(dāng)前粒子的局部最優(yōu)解。局部最優(yōu)解的更新公式為

    NM 粒子即適應(yīng)度較低的M 粒子,其在迭代過程中向著當(dāng)前最優(yōu)解移動,以期潛在的提升和發(fā)現(xiàn)。其速度更新公式為

    其中:變量定義與式(3)相同。

    本研究所基于的SSI-PSO 算法流程如圖2 所示。

    圖2 SSI-PSO 算法流程

    2.3 優(yōu)化算法性能驗(yàn)證

    為驗(yàn)證SSI-PSO 算法的有效性,選取9 個廣泛使用的啟發(fā)式優(yōu)化算法作為對比,包括:人工蜂群算法(ABC)、蜻蜓算法(DA)、差分進(jìn)化算法(DE)、遺傳算法(GA)、引力搜索算法(GSA)、和旋搜索算法(HS)、標(biāo)準(zhǔn)粒子群算法(PSO)、蜘蛛搜索算法(SSO)[18]。測試函數(shù)是2017 年進(jìn)化計算大會(2017 Congress on Evolutionary Computation, CEC 2017)提出的無約束函數(shù),測試函數(shù)的維度D分別設(shè)置為30、50 和100,變量取值限制在[-100, 100]區(qū)間。SSI-PSO 算法所使用的粒子數(shù)量NP為40,速度更新公式的c1和c2分別設(shè)置為1.25 和1.75,慣性系數(shù)ω隨迭代過程從0.9 線性下降到0.1。對比算法的粒子數(shù)同樣設(shè)置為40,其他參數(shù)設(shè)置采用其文獻(xiàn)推薦的默認(rèn)值[8-14,18]。每輪測試中,限制目標(biāo)函數(shù)評估次數(shù)為問題維度D的10 000 倍。以保證結(jié)果的可比性,每組測試重復(fù)50 次以獲取穩(wěn)定的結(jié)果度量和統(tǒng)計信息。

    測試結(jié)束后,依次對每個問題下各個算法50 次求解的最小目標(biāo)值的均值和標(biāo)準(zhǔn)差進(jìn)行遞減排序,將排序序號作為對應(yīng)方法的得分,即排名越靠后、數(shù)值越小、結(jié)果越好。為更加直觀地展示算法的性能差異,將同一項(xiàng)目中各函數(shù)下的分?jǐn)?shù)相加,繪制于得分圖上。得分即優(yōu)化算法尋優(yōu)結(jié)果的絕對好壞。

    圖3為在CEC 2017 測試函數(shù)上,SSI-PSO 算法與其他9 種優(yōu)化算法的性能表現(xiàn)的對比。顯然SSI-PSO算法(圖3 中標(biāo)記為SSI)在各個維度上均取得了最高總分,其尋優(yōu)能力滿足下一步的數(shù)據(jù)處理問題的應(yīng)用。

    圖3 SSI-PSO 算法與其他9 種優(yōu)化算法對比

    3 假人曲線數(shù)據(jù)處理方法

    針對汽車碰撞安全試驗(yàn)假人曲線數(shù)據(jù)的分類問題,基于SSI-PSO 優(yōu)化算法,本文提出一種優(yōu)化驅(qū)動的曲線數(shù)據(jù)特征處理與分類模型構(gòu)建方法。該方法包含2 個階段:第1 階段利用優(yōu)化算法進(jìn)行假人曲線數(shù)據(jù)的特征處理;第2 階段利用優(yōu)化算法進(jìn)行淺層神經(jīng)網(wǎng)絡(luò)的曲線分類模型構(gòu)造。

    3.1 基于優(yōu)化的碰撞曲線數(shù)據(jù)特征處理

    不同于從單一設(shè)備長期采集且同一變量所有數(shù)據(jù)在時間上連續(xù)的信號類時序數(shù)據(jù),汽車安全試驗(yàn)假人曲線僅在試驗(yàn)測量范圍內(nèi)(即碰撞發(fā)生時刻后的300 ms 內(nèi))是連續(xù)的,且大量采集的多通道數(shù)據(jù)是并列、獨(dú)立且等長度的,即為高維、多變量問題。

    3.1.1 選擇設(shè)計變量

    數(shù)據(jù)模型所耗費(fèi)的計算資源通常與數(shù)據(jù)維度正相關(guān),即高維數(shù)據(jù)耗費(fèi)的計算資源相對較高。而由于假人響應(yīng)數(shù)據(jù)時序采集的特性,可通過對每類曲線數(shù)據(jù)進(jìn)行重采樣而達(dá)到降維的目的,以提高計算效率[19-20];同時,由于每類曲線以同等的信息密度記錄了不同的工程信息,而這些信息在實(shí)際研發(fā)過程中被不同程度地參考,則可通過配置每類曲線的權(quán)重的方式強(qiáng)化反映關(guān)鍵信息的曲線在決策模型訓(xùn)練中的占比,進(jìn)而提高模型精度。因此,本研究所提出方法將時序數(shù)據(jù)的重采樣數(shù)量、多變量數(shù)據(jù)的各曲線權(quán)重構(gòu)造為優(yōu)化變量,通過對單次試驗(yàn)同一個假人采集得到的多個類別曲線進(jìn)行不同密度的采樣、加權(quán)和拼接,將多變量時序數(shù)據(jù)構(gòu)造為一般的單變量結(jié)構(gòu)化數(shù)據(jù)。

    對于曲線數(shù)據(jù)集C中的樣本為

    其中:函數(shù)stack(·)表示通過順序拼接操作擴(kuò)充一維向量。給定向量M= {m1,m2, … ,mp}和N= {n1,n2,… ,nq},若

    其中:c'和xw分別表示一條重采樣后的曲線數(shù)據(jù)和其對應(yīng)的合并權(quán)重。曲線c'依據(jù)設(shè)計變量xs對原始曲線c重采樣得

    其中:函數(shù)resample(·)表示重采樣過程。

    3.1.2 定義優(yōu)化目標(biāo)

    本方法中優(yōu)化的目的是確定最佳的曲線數(shù)據(jù)預(yù)處理方法,具體到優(yōu)化算法定義中,優(yōu)化目標(biāo)為多個基礎(chǔ)分類器的混合折交叉驗(yàn)證分類精度,其構(gòu)造方式如圖4 所示。其中:基礎(chǔ)分類器選擇決策樹(decision tree,DT)、K 近鄰分類器(K-nearest neighbor,KNN)和支持向量機(jī)分類器(support vector classifier,SVC)等3類監(jiān)督學(xué)習(xí)方法[21-22]。

    圖4 基于混合交叉驗(yàn)證分類精度構(gòu)造目標(biāo)函數(shù)

    該優(yōu)化目標(biāo)的定義使得進(jìn)行曲線特征處理的同時進(jìn)行模型構(gòu)建,可以歸類為廣義的包裹式特征選擇過程。分類性能的度量指標(biāo)為預(yù)測精度:

    其中:?i是第i個樣本對應(yīng)的預(yù)測標(biāo)簽;yi是第i個樣本的真實(shí)標(biāo)簽;nsam是樣本數(shù)量;I(x)是指標(biāo)函數(shù):

    3.1.3 構(gòu)造優(yōu)化問題

    所提出方法不需要構(gòu)造特殊的約束函數(shù),而是直接約束優(yōu)化變量中對應(yīng)曲線采樣點(diǎn)數(shù)量的部分為整數(shù),同時約束采樣點(diǎn)數(shù)量和權(quán)重的上下限。最終,構(gòu)造優(yōu)化問題如下:

    其中:nfold是交叉驗(yàn)證次數(shù);ncur是曲線的類別數(shù); CLS為基于混合交叉驗(yàn)證訓(xùn)練分類器:

    其中:函數(shù)train(·)表示模型訓(xùn)練過程;C是曲線數(shù)據(jù);y是曲線數(shù)據(jù)對應(yīng)的類別標(biāo)注。

    3.2 基于淺層神經(jīng)網(wǎng)絡(luò)的曲線分類模型構(gòu)造

    神經(jīng)網(wǎng)絡(luò)(neural networks,NN)模型由一系列的非線性數(shù)學(xué)模型組成,適用于多種響應(yīng)預(yù)測和分類任務(wù),其高度靈活的理論性質(zhì)使之成為通用近似器[23-24]。在神經(jīng)網(wǎng)絡(luò)模型的各感知層中,首層(第0 層)被定義為輸入層,末層被定義為輸出層,其他層為隱藏層。每個感知層由神經(jīng)元組成,各個神經(jīng)元接收前一層輸入的信息,并向后一層傳送信號,即凈激活值(輸出)。第l層的凈激活值zl為:

    其中:al為第l層的激活值;a0即輸入數(shù)據(jù)x;bl為自l–1 層到l層的偏置;Wl為自l–1 層到l層的權(quán)值矩陣;hl(·)為l層的激活函數(shù)。

    隨著神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練方法的發(fā)展,具有少量隱藏層的淺層神經(jīng)網(wǎng)絡(luò)(shallow neural network,SNN)即能取得較好的擬合效果,并更為適合處理較小規(guī)模數(shù)據(jù)的問題。因此,本研究利用淺層神經(jīng)網(wǎng)絡(luò)構(gòu)建分類器。盡管淺層神經(jīng)網(wǎng)絡(luò)模型的參數(shù)相較于深度神經(jīng)網(wǎng)絡(luò)模型大大減少,但仍需要對模型結(jié)構(gòu)進(jìn)行設(shè)計,以避免不合適的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)制約其分類性能。

    3.2.1 選擇設(shè)計變量

    輸入數(shù)據(jù)和輸出數(shù)據(jù)的結(jié)構(gòu)確定后,神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)由隱藏層的層數(shù)和每層的神經(jīng)元數(shù)量決定,因此將隱藏層層數(shù)和神經(jīng)元個數(shù)作為設(shè)計對象。由于優(yōu)化算法需要在固定的變量空間內(nèi)搜索,為方便計算,以nl維向量xn表示設(shè)計變量。其中nl為隱藏層層數(shù)的上限,xn在每個維度上的分量即為對應(yīng)隱藏層上神經(jīng)元的個數(shù)。在迭代過程中,若某個維度的分量小于設(shè)定閾值后,則在構(gòu)建神經(jīng)網(wǎng)絡(luò)模型過程中刪除該層,即實(shí)現(xiàn)了隱藏層層數(shù)的設(shè)計。

    3.2.2 定義優(yōu)化目標(biāo)函數(shù)

    基于設(shè)計變量的信息構(gòu)建神經(jīng)網(wǎng)絡(luò)模型,以所構(gòu)建的神經(jīng)網(wǎng)絡(luò)模型對測試樣本的交叉驗(yàn)證精度為優(yōu)化目標(biāo)。選擇S 形函數(shù)(或稱sigmoid 函數(shù))作為隱藏層和輸出層的激活函數(shù),并將函數(shù)值域轉(zhuǎn)換到[-1,1],以便于模型訓(xùn)練:

    在神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練過程中,選則交叉熵(cross entropy,CE)作為損失函數(shù):

    其中:yi是第i個樣本的標(biāo)簽(正類為1,負(fù)類為0);pi是對第i個樣本預(yù)測為正類的概率;nsam是樣本數(shù)量。

    3.2.3 構(gòu)造優(yōu)化問題

    所提出方法不需要構(gòu)造特殊的約束函數(shù),而是直接約束優(yōu)化變量為整數(shù),同時約束設(shè)計變量的上下限。最終,構(gòu)造優(yōu)化問題如下:

    其中:nfold是交叉驗(yàn)證次數(shù); NN 為神經(jīng)網(wǎng)絡(luò)模型。

    3.3 本文方法流程及步驟

    本文所提出的兩階段方法流程如圖5 所示。

    圖5 本文方法流程圖

    步驟如下:

    階段1 將假人曲線數(shù)據(jù)各類別曲線的采樣數(shù)量和曲線權(quán)重作為設(shè)計變量,最大化當(dāng)前構(gòu)造數(shù)據(jù)訓(xùn)練基礎(chǔ)分類器分類混合交叉驗(yàn)證精度為優(yōu)化目標(biāo),利用SSI-PSO 算法進(jìn)行采樣數(shù)量和曲線權(quán)重的尋優(yōu)計算。

    階段2 獲取最優(yōu)化的采樣數(shù)量和曲線權(quán)重,將多變量時序數(shù)據(jù)構(gòu)造為降低維度的單變量時序數(shù)據(jù),基于SSI-PSO 優(yōu)化算法構(gòu)造神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),進(jìn)而訓(xùn)練淺層神經(jīng)網(wǎng)絡(luò),以進(jìn)一步提高模型精度。

    4 碰撞試驗(yàn)假人響應(yīng)曲線數(shù)據(jù)集應(yīng)用

    為充分闡釋本文所提出兩階段方法的特性并驗(yàn)證其有效性,本節(jié)基于某公司整車碰撞試驗(yàn)數(shù)據(jù)進(jìn)行對比分析。試驗(yàn)數(shù)據(jù)包括對整車碰撞試驗(yàn)中從第50 百分位假人采集得到的315 組試驗(yàn)數(shù)據(jù),每組曲線包含23條響應(yīng)曲線,即頭部加速度ax、ay、az,頸部力Fx、Fz及力矩My,胸部變形Dches,左、右大腿壓縮力Fz,左、右膝關(guān)節(jié)滑動位移Dknee,左、右小腿上、下脛骨力Fz及力矩Mx、My。每條曲線以0.1 ms 間隔采集自碰撞開始后的300 ms,即3 000 個數(shù)據(jù)點(diǎn)。每組數(shù)據(jù)的標(biāo)注為其測量位置,即分類整組曲線采集自前排駕駛員側(cè)假人或前排副駕駛員側(cè)假人。

    4.1 特征處理策略對比分析

    4.1.1 采樣范圍對比分析

    在優(yōu)化過程中,適度縮減設(shè)計變量的可行域有利于提高優(yōu)化算法的搜索效率;此外,在本方法中,曲線采樣這一設(shè)計變量同時影響分類模型的規(guī)模,適度縮減設(shè)計域同樣有利于降低分類模型的建模開銷。為對比分析采樣量的影響,從區(qū)間[3,3000]中離散地選取3、10、30、150、300、600、900、1 500、1 800、2 000、2 400、3 000 等12 個采樣水平,即控制曲線的采樣率在0.1%~100%范圍內(nèi)。隨后,基于3.1.2 節(jié)所提出的混合交叉驗(yàn)證方法構(gòu)造目標(biāo)函數(shù),選擇決策樹、支持向量機(jī)和k 近鄰分類器作為基礎(chǔ)分類器,并測試其分類精度。

    訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集的樣本劃分為4:1,每組測試重復(fù)10 次以獲取穩(wěn)定的統(tǒng)計結(jié)果。為直觀地展示不同采樣點(diǎn)下所建立模型的預(yù)測精度Pacc及其波動情況,基于重復(fù)測試結(jié)果繪制統(tǒng)計圖,如圖6 所示。圖6 中橫坐標(biāo)為不同的采樣率Rsam,縱坐標(biāo)為對應(yīng)數(shù)據(jù)所建立的模型分類準(zhǔn)確度和單次計算時間。

    圖6 不同采樣點(diǎn)的基礎(chǔ)分類器混合交叉驗(yàn)證精度

    由計算結(jié)果分析可得,各組測試所得到的基礎(chǔ)分類器混合交叉驗(yàn)證精度整體上與采樣點(diǎn)的數(shù)量呈現(xiàn)正相關(guān)性,并具有一定的波動性。當(dāng)采樣點(diǎn)過少時 (如0.1%采樣率),則無法訓(xùn)練得到有效的分類模型。此外,訓(xùn)練分類模型所花費(fèi)的時間隨采樣點(diǎn)的增加而上升得更為明顯;而模型的分類精度并未得到顯著提升,因此優(yōu)化調(diào)整曲線數(shù)據(jù)的樣本點(diǎn)數(shù)量是可行的。

    根據(jù)計算結(jié)果,30 至600 采樣點(diǎn)的區(qū)間范圍內(nèi)即在顯著降低計算時間的前提下維持一定的模型精度。由于未對數(shù)據(jù)特征做進(jìn)一步處理,此時模型精度的絕對水平和波動情況均未達(dá)到應(yīng)用要求,而在后續(xù)優(yōu)化問題設(shè)置中,可將[30, 600]作為優(yōu)化變量區(qū)間。

    4.1.2 優(yōu)化參數(shù)設(shè)置

    利用SSI-PSO 算法進(jìn)行優(yōu)化設(shè)計,同時設(shè)置兩組對照試驗(yàn)用以分析本文所提出方法的特性,各優(yōu)化問題的粒子數(shù)和迭代次數(shù)均設(shè)置為100,即函數(shù)評估次數(shù)為104。為同時優(yōu)化樣本數(shù)據(jù)中23 條曲線的采樣數(shù)量和合并權(quán)重,故優(yōu)化問題的維度為46。此外,3 組測試的區(qū)別如下:

    測試1 固定采樣數(shù)量為300,在[-1, 1]范圍內(nèi)優(yōu)化曲線權(quán)重;

    測試2 固定曲線權(quán)重為1,在[10, 600]范圍內(nèi)優(yōu)化采樣數(shù)量;

    測試3 按測試1、2 的范圍同時優(yōu)化曲線權(quán)重和采樣數(shù)量。

    4.1.3 優(yōu)化結(jié)果與分析

    各組試驗(yàn)重復(fù)測試10 次,并提取統(tǒng)計信息,其結(jié)果如表2 所示。

    表2 特征優(yōu)化問題的計算結(jié)果

    由測試結(jié)果可得:在利用SSI-PSO 算法對樣本曲線數(shù)據(jù)的采樣數(shù)量和合并權(quán)重進(jìn)行優(yōu)化后,平均采樣率接近,即均有效降低數(shù)據(jù)維度的同時可提高分類模型的混合交叉驗(yàn)證精度;單獨(dú)優(yōu)化采樣數(shù)量或合并權(quán)重后的分類模型精度相近,而本研究所提出的同時優(yōu)化策略進(jìn)一步提高了模型分類精度。

    4.2 分類模型建立對比分析

    4.2.1 建模方法分析

    本節(jié)首先對不同的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行測試,包括1至4 層不等的隱藏層數(shù)量,以及每層隱藏層中10 至40個不等的神經(jīng)元數(shù)量。為直觀地展示不同方法及不同神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)所建立模型的精度Pacc及其波動情況,基于重復(fù)測試結(jié)果繪制箱線圖,如圖7 所示。

    圖7 不同分類器的分類精度

    圖7 中,以數(shù)組的形式表示不同的神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu),括號內(nèi)數(shù)組長度表示隱藏層數(shù)量,數(shù)值表示對應(yīng)隱藏層神經(jīng)元數(shù)量。由測試結(jié)果可得:小規(guī)模的淺層神經(jīng)網(wǎng)絡(luò)經(jīng)過充分的訓(xùn)練過程即可得到較高精度;另一方面,由于訓(xùn)練樣本相對于特征數(shù)量是有限的,引入過多的神經(jīng)元后,同樣不利于模型精度的提升。因此,兩階段分類模型中的淺層神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)基于后續(xù)的優(yōu)化策略確定,以減少經(jīng)驗(yàn)設(shè)計的影響。

    4.2.2 優(yōu)化過程分析

    利用SSI-PSO 算法進(jìn)行優(yōu)化設(shè)計,粒子數(shù)設(shè)置為40,迭代次數(shù)設(shè)置為100。此外,變量維度設(shè)置為6,即允許的最大隱藏層數(shù)量為6 層。計算優(yōu)化目標(biāo)時,所接受的最小神經(jīng)元數(shù)量為10,即某維度變量小于10 時則刪除該層;若全部維度小于10,則設(shè)定為單隱藏層10 個神經(jīng)元。設(shè)計變量的采樣范圍為[–20, 80],下界小于可接受最小神經(jīng)元數(shù)量,通過此策略控制可行域趨向于較小規(guī)模的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。

    在迭代優(yōu)化過程中,提取全局最優(yōu)解在迭代路徑上的關(guān)鍵點(diǎn)。因?yàn)槿肿顑?yōu)解總是隨迭代過程提升或持平的,因此將全局最優(yōu)解對應(yīng)的神經(jīng)網(wǎng)絡(luò)性能表現(xiàn)Pacc作為橫坐標(biāo)、將全局最優(yōu)解對應(yīng)的神經(jīng)網(wǎng)絡(luò)神經(jīng)元總數(shù)Nneu作為縱坐標(biāo),并以不同符號區(qū)分全局最優(yōu)解對應(yīng)的神經(jīng)網(wǎng)絡(luò)隱藏層層數(shù),繪制于圖8。

    圖8 優(yōu)化過程的歷史全局最優(yōu)解

    在初始化階段,由于粒子分布較為廣泛、均勻,所對應(yīng)的神經(jīng)網(wǎng)絡(luò)隱藏層數(shù)量亦多;隨著迭代進(jìn)程的繼續(xù),隱藏層層數(shù)和神經(jīng)元個數(shù)均有所下降,這一趨勢符合對淺層神經(jīng)網(wǎng)絡(luò)性能的預(yù)期。最終,優(yōu)化過程收斂在單隱藏層26 個神經(jīng)元的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中。

    4.2.3 結(jié)果對比

    基于4.1 節(jié)針對曲線采樣數(shù)量和合并權(quán)重的3 組測試的優(yōu)化結(jié)果重新處理樣本數(shù)據(jù),進(jìn)而訓(xùn)練包含26 個隱神經(jīng)元的單隱藏層的淺層神經(jīng)網(wǎng)絡(luò)模型(OptNN)。此外,選擇決策樹分類器(DT)、K 近鄰分類器(KNN)和支持向量機(jī)分類器(SVM)作為測試的對照組。為直觀地展示基于不同測試優(yōu)化結(jié)果所建立模型的精度及其波動情況,基于重復(fù)測試結(jié)果繪制箱線圖,如圖9所示。

    圖9 基于最優(yōu)采樣和加權(quán)特征處理的模型分類精度

    由測試結(jié)果可得:相對于決策樹的 (0.790 ±0.022)、K 近鄰分類器的(0.886 ± 0.019)和支持向量機(jī)的(0.922 ± 0.011),基于最優(yōu)采樣和加權(quán)特征處理建立的兩階段分類模型取得了最高的分類精度(0.965± 0.003);同時,該結(jié)果的波動性較小,即保持了較高的穩(wěn)定性。對比前序測試的結(jié)果,同時優(yōu)化采樣點(diǎn)和權(quán)重的策略優(yōu)勢延續(xù)到了第2 階段模型構(gòu)建中,使得分類精度得到了進(jìn)一步的提升。對比未經(jīng)特征處理和模型結(jié)構(gòu)優(yōu)化的分類模型精度,本研究所提出方法的分類精度從82.1%提升至96.5%,相對提升17.5%。

    綜上所述,本文所提出的兩步式方法在碰撞試驗(yàn)假人多變量時序數(shù)據(jù)分類問題上是有效的。

    5 結(jié) 論

    本文針對汽車碰撞安全試驗(yàn)假人響應(yīng)曲線數(shù)據(jù)存在的標(biāo)注錯誤和缺失問題,提出優(yōu)化驅(qū)動的兩階段碰撞試驗(yàn)多變量時序數(shù)據(jù)特征選擇和分類方法,本文方法采用2 階段策略:

    在第1 階段中,將采樣密度和曲線權(quán)重作為設(shè)計變量,通過混合交叉驗(yàn)證精度構(gòu)造目標(biāo)函數(shù),以優(yōu)化的方式同時對曲線數(shù)據(jù)進(jìn)行轉(zhuǎn)換和特征選擇(降維);

    在第2 階段中,將用于構(gòu)建分類模型的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中的隱藏層數(shù)量和神經(jīng)元個數(shù)作為設(shè)計變量,以優(yōu)化的方式獲取最佳結(jié)構(gòu)設(shè)計。利用汽車碰撞試驗(yàn)數(shù)據(jù)進(jìn)行測試和驗(yàn)證。

    結(jié)果表明:本文方法可獲得面向假人曲線數(shù)據(jù)分類的最佳特征組合方式與神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),其中假人響應(yīng)曲線分類任務(wù)適合選用較小規(guī)模的淺層神經(jīng)網(wǎng)絡(luò)模型;基于本文方法,假人曲線分類模型性能提升17.5%、精度達(dá)到96.5%。從而,實(shí)現(xiàn)了對碰撞試驗(yàn)假人響應(yīng)曲線標(biāo)注信息的有效分類。

    猜你喜歡
    粒子神經(jīng)網(wǎng)絡(luò)分類
    分類算一算
    神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
    電子制作(2019年19期)2019-11-23 08:42:00
    分類討論求坐標(biāo)
    基于粒子群優(yōu)化的橋式起重機(jī)模糊PID控制
    數(shù)據(jù)分析中的分類討論
    基于粒子群優(yōu)化極點(diǎn)配置的空燃比輸出反饋控制
    教你一招:數(shù)的分類
    基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
    復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
    基于支持向量機(jī)回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
    响水县| 简阳市| 汨罗市| 海阳市| 罗江县| 古交市| 巴林左旗| 福海县| 古交市| 贵阳市| 抚顺县| 合水县| 屯昌县| 岐山县| 师宗县| 都江堰市| 盱眙县| 商水县| 登封市| 纳雍县| 博兴县| 繁峙县| 丹东市| 郸城县| 桂平市| 高州市| 巨野县| 翁源县| 耒阳市| 开江县| 玉环县| 大连市| 高要市| 定结县| 双辽市| 淳化县| 铜陵市| 普宁市| 铜川市| 大同市| 叶城县|