周仁, 張向文,2*
(1.桂林電子科技大學(xué)電子工程與自動(dòng)化學(xué)院, 桂林 541004; 2. 廣西自動(dòng)檢測技術(shù)與儀器重點(diǎn)實(shí)驗(yàn)室, 桂林 541004)
為了應(yīng)對(duì)燃油車帶來的環(huán)境污染和能源危機(jī)問題,世界各國都在積極推動(dòng)和發(fā)展新能源汽車,特別是純電動(dòng)汽車的研發(fā)和推廣應(yīng)用。純電動(dòng)車擁有零排放、零污染、成本低等優(yōu)勢,在中國被確定為七大戰(zhàn)略性新興產(chǎn)業(yè)之一[1]。純電動(dòng)汽車的關(guān)鍵技術(shù)在電池、電機(jī)、電控3個(gè)方面,而電池的能量密度遠(yuǎn)低于汽油,這嚴(yán)重影響了純電動(dòng)汽車的行駛速度和續(xù)航里程,而電池的老化也制約了純電動(dòng)汽車的使用壽命。另外,電池的成本在整車中占比1/3[2]。隨著使用時(shí)間、充放電次數(shù)和極端工作溫度影響而出現(xiàn)老化現(xiàn)象,依據(jù)IEEE Std 1188—1996標(biāo)準(zhǔn)規(guī)定,當(dāng)動(dòng)力電池的儲(chǔ)能能力下降到出廠容量80%時(shí)達(dá)到報(bào)廢標(biāo)準(zhǔn),應(yīng)及時(shí)更換電池[3]。因此,對(duì)電池健康狀態(tài)(state of health, SOH)的準(zhǔn)確估計(jì),對(duì)延長動(dòng)力電池的使用壽命和降低電動(dòng)汽車的使用成本具有重要的現(xiàn)實(shí)意義和實(shí)用價(jià)值。
目前,電池SOH估計(jì)的主要方法包括實(shí)驗(yàn)法、模型法、數(shù)據(jù)驅(qū)動(dòng)法和大數(shù)據(jù)分析法四類[4-5]。
實(shí)驗(yàn)法包含定義法、內(nèi)阻法、電化學(xué)分析法、容量衰減法、部分放電法和阻抗譜分析法,這些方法不方便實(shí)車在線應(yīng)用,在近幾年中使用頻率越來越低。
模型法基于壽命衰減模型、經(jīng)驗(yàn)?zāi)P秃偷刃щ娐纺P?,通過數(shù)學(xué)模型結(jié)合各類濾波器與估計(jì)算法來進(jìn)行SOH的估計(jì),美國阿克倫大學(xué)的Hashemi等[6]提出一種在線參數(shù)估計(jì)方法,該方法通過該參數(shù)估計(jì)器提出一種自適應(yīng)滑模觀測器來估計(jì)實(shí)車電池容量,可針對(duì)溫度變化對(duì)電池SOH估計(jì)精度進(jìn)行修正,但其溫度補(bǔ)償公式效果較差,實(shí)際電池SOH的估計(jì)誤差在1.3%以上。
數(shù)據(jù)驅(qū)動(dòng)法,國內(nèi)方面,武漢理工大學(xué)的楊勝杰等[7]對(duì)電池剩余容量(state of capacity, SOC)切片分區(qū),使用容量增量分析法 (incremental capacity analysis, ICA)提取的特征進(jìn)行SOH預(yù)測,該研究選用NASA數(shù)據(jù)集中的四組電池,提取IC曲線特征基于高斯回歸建立預(yù)測模型,很好地量化了SOH與IC曲線特征參數(shù)的關(guān)系,但是僅選取IC曲線的特征作為特征輸入,得到的預(yù)測結(jié)果精度較低,其均方根誤差(root mean squard error,RMSE)為2%;國外方面,法國巴黎-薩克雷大學(xué)的Mawonou等[8]開發(fā)了兩種新的老化指標(biāo),使用充電和駕駛期間采集的數(shù)據(jù),結(jié)合實(shí)際用戶行為和環(huán)境條件,使用隨機(jī)森林算法來對(duì)電池老化進(jìn)度進(jìn)行預(yù)測,對(duì)實(shí)車電池SOH的估計(jì)誤差在1.27%左右,但這兩種指標(biāo)的具體提取方式并未標(biāo)明,該指標(biāo)與電池SOH的相關(guān)性有待考究。
大數(shù)據(jù)分析法是一種新興方法,國內(nèi)方面,北京航空航天大學(xué)的宋林軍等[9]提出了基于互聯(lián)網(wǎng)平臺(tái)在線大數(shù)據(jù)的SOH估計(jì)方法,在原有數(shù)據(jù)的基礎(chǔ)上從歷史運(yùn)行數(shù)據(jù)中提取的運(yùn)行狀況特征進(jìn)行SOH預(yù)測,對(duì)不同駕駛模式下700輛電動(dòng)車的監(jiān)測數(shù)據(jù)集進(jìn)行了測試驗(yàn)證,對(duì)不同類型車輛的適應(yīng)性較好,但是該方法對(duì)SOH的估計(jì)誤差較大,預(yù)測結(jié)果的RMSE為4.5%;國外方面,美國北達(dá)科他州立大學(xué)的Phattara等[10]使用機(jī)器學(xué)習(xí)算法基于大數(shù)據(jù)分析,采用深度神經(jīng)網(wǎng)絡(luò)方法對(duì)鋰離子電池的SOH和剩余壽命進(jìn)行預(yù)測,使用了NASA Ames大數(shù)據(jù)卓越中心數(shù)據(jù)庫采集的實(shí)車動(dòng)力電池?cái)?shù)據(jù)集,并將結(jié)果與支持向量機(jī)、最近鄰分類、人工神經(jīng)網(wǎng)絡(luò)和線性回歸等算法進(jìn)行比較試驗(yàn),估算結(jié)果的RMSE在5%以內(nèi),該方法在保證樣本適應(yīng)性的同時(shí),估計(jì)精度較低,大數(shù)據(jù)分析法精度受車輛類型影響較大,且需要體量較大的大數(shù)據(jù)平臺(tái)提供數(shù)據(jù)采集服務(wù),不利于常規(guī)性的研究,該方法發(fā)展到成熟還需要一些時(shí)間。
目前的SOH估計(jì)方法大部分都是使用實(shí)驗(yàn)室數(shù)據(jù),這些數(shù)據(jù)一般在規(guī)定的溫度和充放電電流下進(jìn)行測試獲得,具有很好的連續(xù)性和完整性。通過前面的分析可以看出,由于實(shí)際電池的循環(huán)老化壽命受到很多因素的影響[11-12],地域溫度不同、快慢充電流、非滿充滿放循環(huán)、數(shù)據(jù)采集丟失等原因都會(huì)造成估計(jì)的誤差,因此,利用實(shí)際數(shù)據(jù)進(jìn)行SOH估計(jì)的難度較大。
現(xiàn)利用實(shí)車數(shù)據(jù)進(jìn)行SOH估計(jì)研究,通過對(duì)原始數(shù)據(jù)的清洗、篩選、填充缺失值等一系列預(yù)處理,對(duì)不同類型車輛數(shù)據(jù)進(jìn)行車型分類,得到規(guī)范化的車輛數(shù)據(jù),然后使用ICA方法提取出IC峰值與對(duì)應(yīng)電壓位置的特征參數(shù),進(jìn)行數(shù)據(jù)特征的相關(guān)性分析和特征選擇,隨后,利用穩(wěn)定性高的反向傳播-自適應(yīng)推進(jìn)(back propagation-adapt boost,BP-AdaBoost)算法進(jìn)行數(shù)據(jù)訓(xùn)練,建立數(shù)據(jù)特征和SOH之間的聯(lián)系,最后,進(jìn)行SOH估計(jì)算法的驗(yàn)證。以期滿足基于實(shí)車測試數(shù)據(jù)的SOH估計(jì)精度要求,具有一定的應(yīng)用價(jià)值。
使用的數(shù)據(jù)集來源于國家大數(shù)據(jù)聯(lián)盟NCBDC(National College New Energy Vehicle Big Data Application Innovation Competition)比賽的實(shí)車數(shù)據(jù),包含京滬兩地10輛在運(yùn)行的車輛2018年3月—2020年3月收集的數(shù)據(jù),時(shí)間跨度高達(dá)24個(gè)月。該數(shù)據(jù)集以《電動(dòng)汽車遠(yuǎn)程服務(wù)與管理系統(tǒng)技術(shù)規(guī)范》(GB/T 32960—2016)為基礎(chǔ),大數(shù)據(jù)平臺(tái)數(shù)據(jù)采樣周期為10 s,得到總計(jì)1 600萬行17列的數(shù)據(jù)樣本。監(jiān)控?cái)?shù)據(jù)包括車輛ID、數(shù)據(jù)采集時(shí)間、車輛狀態(tài)、充電狀態(tài)、車輛運(yùn)行模式、車速、累計(jì)里程、總電壓、總電流、SOC、電池單體電壓最高值、電池單體電壓最低值、最高溫度值、最低溫度值、最高報(bào)警級(jí)別和報(bào)警標(biāo)志定義數(shù)據(jù)。通過對(duì)車輛的數(shù)據(jù)特征和計(jì)算容量的分析,10輛車可以分成A、B、C、D 4個(gè)類型,為了簡化分析,后續(xù)研究以C類三輛車為例,利用C類三輛車car5、car6、car9的充電數(shù)據(jù)進(jìn)行研究。
原始數(shù)據(jù)繁多且雜亂,基于大數(shù)據(jù)處理的思維建立了一個(gè)完整的數(shù)據(jù)預(yù)處理模型,獲取電池的容量和數(shù)據(jù)特征。預(yù)處理模型分為數(shù)據(jù)處理和容量處理兩部分。
1.2.1 數(shù)據(jù)處理步驟
步驟1遍歷數(shù)據(jù)集,根據(jù)車輛標(biāo)識(shí)符把數(shù)據(jù)集分為不同車輛類型的數(shù)據(jù)集。
步驟2把每一輛車的時(shí)間數(shù)據(jù)類型由數(shù)值型轉(zhuǎn)換為時(shí)間類型,方便后續(xù)操作,同時(shí)根據(jù)時(shí)間序列對(duì)車輛數(shù)據(jù)進(jìn)行排序。
步驟3根據(jù)車輛狀態(tài)、充放電數(shù)據(jù)、行駛里程和 SOC等相關(guān)數(shù)據(jù),提取車輛的充電和放電片段。
預(yù)處理模型流程如圖1所示。
圖1 預(yù)處理模型流程圖Fig.1 Flowchart of the preprocess model
1.2.2 容量處理步驟
步驟1對(duì)選用車輛數(shù)據(jù)特征進(jìn)行規(guī)范化處理,根據(jù)片段內(nèi)的充電電流和時(shí)間數(shù)據(jù),區(qū)分快充和慢充行為,并使用安時(shí)積分法計(jì)算每次循環(huán)充入的容量。
步驟2將快慢充數(shù)據(jù)處理合并成同一個(gè)時(shí)間序列下的完整充電容量數(shù)據(jù)。
步驟3通過溫度補(bǔ)償函數(shù)對(duì)容量數(shù)據(jù)進(jìn)行溫度容量補(bǔ)償。
步驟4通過箱型圖法刪除誤差較大的容量結(jié)果,去除異常數(shù)據(jù)。
步驟5將首次充電數(shù)據(jù)設(shè)為出廠容量,定義此時(shí)的電池SOH為100%,后續(xù)的容量數(shù)據(jù)基于此標(biāo)準(zhǔn)轉(zhuǎn)換為電池SOH特征,從而獲得完整的可用容量數(shù)據(jù)集。
由于采集頻率和使用工況等一系列不可控因素影響,實(shí)車數(shù)據(jù)準(zhǔn)確度不高,質(zhì)量較差,為了提高估計(jì)結(jié)果的精度,需要對(duì)原始數(shù)據(jù)進(jìn)行規(guī)范化處理,將離散、雜亂、低質(zhì)量的數(shù)據(jù)規(guī)范為便于使用的高質(zhì)量數(shù)據(jù)。
數(shù)據(jù)規(guī)范化的過程如下。
(1)通過時(shí)間數(shù)據(jù)的識(shí)別對(duì)重復(fù)采樣點(diǎn)進(jìn)行合并處理。
(2)使用箱型圖對(duì)超出邊界的電壓電流數(shù)據(jù)進(jìn)行剔除。
(3)針對(duì)所屬不同類型的空白值數(shù)據(jù),選用合適的插值函數(shù)進(jìn)行插值填充。
(4)刪除部分缺失過大的數(shù)據(jù)。
(5)最后進(jìn)行交叉驗(yàn)證,確認(rèn)每一列的基礎(chǔ)數(shù)據(jù)都能符合規(guī)范。
(6)將電壓、電流和時(shí)間數(shù)據(jù)的單位分別統(tǒng)一到伏(V)、安(A)、秒(s)。
實(shí)際車輛使用過程中存在快速充電和慢速充電的充電行為,對(duì)電池實(shí)際容量的確定存在一定的干擾[13],不同車型受到的影響程度不同,需要單獨(dú)分開處理。以C類車為例,可以通過完整充電過程的平均電流數(shù)據(jù)和總充電時(shí)間數(shù)據(jù)來劃分快充和慢充,根據(jù)describe函數(shù)設(shè)定充電電流閾值為20 A、充電時(shí)間閾值為1.5 h,來綜合區(qū)分car5的快慢充行為片段,結(jié)果如圖2所示。
圖2 兩種充電行為下的電壓和電流變化曲線Fig.2 Voltage and current curves under two charging behaviors
由圖2可以看出,慢充過程耗費(fèi)的時(shí)間是快充的4~5倍,快充過程平均電流是慢充過程平均電流的4~5倍。另外,慢充過程大部分充電電流較為穩(wěn)定,不存在過大波動(dòng),可以直接使用,但是快充過程充電電流變化過大和充電過程較短,不利于平均濾波,需要對(duì)通過安時(shí)積分獲取的容量結(jié)果進(jìn)行進(jìn)一步處理。
容量數(shù)據(jù)是一個(gè)重要的特征量,但是,原數(shù)據(jù)集沒有給出,可以通過SOC數(shù)據(jù)、汽車充電行為數(shù)據(jù)和電流數(shù)據(jù)進(jìn)行求解。由于實(shí)車數(shù)據(jù)都不是完整的充放電過程,放電數(shù)據(jù)由于實(shí)際運(yùn)行工況的離散程度過高且連續(xù)性較差,難以清晰得到SOH相關(guān)的有效數(shù)據(jù),而充電數(shù)據(jù)均采集于停車時(shí)的充電過程中,相對(duì)穩(wěn)定,干擾因素也較少,因此,將其作為容量標(biāo)定的特征數(shù)據(jù)。實(shí)際使用中,車主很少在SOC偏低時(shí)進(jìn)行充電,也很少完全充電,這導(dǎo)致充電開始和結(jié)束時(shí)的SOC都不相同,最后根據(jù)數(shù)據(jù)量分布情況,選取在SOC位于40%~80%段的數(shù)據(jù)進(jìn)行分析,該段電壓電流變化相對(duì)穩(wěn)定且具有代表性,用此段數(shù)據(jù)結(jié)合安時(shí)積分法得到每次循環(huán)過程中的電池容量,根據(jù)獲取的電池容量,可以進(jìn)行SOH的估計(jì),計(jì)算公式為
(1)
式(1)中:Qnow-max為電池當(dāng)前循環(huán)時(shí)SOC位于40%~80%的最大可用容量;Qnew-max為電池第一次循環(huán)時(shí)SOC位于40%~80%的最大可用容量。
通過安時(shí)積分得到容量數(shù)據(jù),然后利用式(1)標(biāo)定電池SOH,積分容量結(jié)果與采樣時(shí)間有關(guān),數(shù)據(jù)采集平臺(tái)的采樣周期存在少量差異,其中采樣周期為10 s的數(shù)據(jù)占97%以上,采樣周期的變化會(huì)引起容量計(jì)算的誤差[13],其中的關(guān)系如表1所示。
表1中采樣周期為1 s和10 s的數(shù)據(jù)對(duì)結(jié)果的影響較低,為了確保最后得到優(yōu)質(zhì)、準(zhǔn)確的SOH特征,在充電行為判斷中對(duì)分段數(shù)據(jù)內(nèi)間隔大于10 s的數(shù)據(jù)進(jìn)行刪除,保留間隔較小的數(shù)據(jù)。缺失較少的電流數(shù)據(jù)使用前后插值、平均插值、函數(shù)插值等方法進(jìn)行填充,電流和時(shí)間缺失過多的充電次數(shù)僅保留時(shí)間值,容量積分結(jié)果進(jìn)行剔除以免出現(xiàn)過大誤差。
表1 采樣周期與容量估計(jì)誤差Table 1 Sampling period and capacity estimation error
不同類型車輛受到快慢充行為的影響程度不同,C類車受到不同充電行為的影響最小,該類型車輛的快慢充容量結(jié)果在處理后能夠統(tǒng)合成一個(gè)數(shù)據(jù)集,例如car5的快慢充容量結(jié)果如圖3所示,隨著電池循環(huán)次數(shù)增加有明顯的容量下降趨勢。
圖3中快充容量和慢充容量變化曲線相似,容量值也屬于同一量級(jí),可以對(duì)car5的快慢充容量結(jié)果進(jìn)行歸一化處理,考慮到實(shí)際運(yùn)行過程中快充行為和慢充行為交替進(jìn)行,按照時(shí)間序列將快慢充合并為一個(gè)完整的循環(huán)老化過程。
除了充電電流的影響之外,數(shù)據(jù)時(shí)間跨度高達(dá)兩年,實(shí)際運(yùn)行環(huán)境的溫差較大,考慮到電池溫度對(duì)容量造成的影響,對(duì)初步計(jì)算得到的容量結(jié)果進(jìn)行溫度容量補(bǔ)償操作。根據(jù)實(shí)車數(shù)據(jù),結(jié)合文獻(xiàn)[11]相同特征的經(jīng)驗(yàn)公式,經(jīng)過數(shù)據(jù)擬合得出合適的對(duì)數(shù)函數(shù)模型為
K=-0.068 3lgT+0.790 9
(2)
QT=QK
(3)
式中:T為某次循環(huán)電池組的平均溫度, ℃;K為溫度補(bǔ)償系數(shù);Q為安時(shí)積分法得到的容量;QT為溫度修正后的容量。兩個(gè)常數(shù)-0.068 3、0.790 9通過實(shí)驗(yàn)測試結(jié)果進(jìn)行擬合得到。
圖3 car5的快慢充容量結(jié)果Fig.3 Fast and slow charging capacity results of car5
數(shù)據(jù)集中沒有單體溫度高于40 ℃或者低于0 ℃的數(shù)據(jù),所以不考慮過高溫度帶來的容量下降因素。通過單體最高溫度和最低溫度計(jì)算得到平均溫度數(shù)據(jù),作為溫度補(bǔ)償函數(shù)的修改依據(jù)?;谑?2)和式(3),可以得到溫度修正后的結(jié)果如圖4所示。
由圖4可以看出,相對(duì)于溫度修正之前的快慢統(tǒng)合結(jié)果,經(jīng)過溫度修正后的結(jié)果波動(dòng)更小。安時(shí)積分法得到的容量結(jié)果在40次循環(huán)時(shí)存在異常,主要原因是car5在40次循環(huán)時(shí)最低溫度為0 ℃,導(dǎo)致實(shí)際充入電池的電量過少,反之,較高環(huán)境溫度時(shí)則會(huì)充入比平時(shí)更多的容量。對(duì)此類數(shù)據(jù)進(jìn)行溫度補(bǔ)償后,電池容量數(shù)據(jù)均方差有所降低,比僅僅使用安時(shí)積分法得到的容量數(shù)據(jù)更加符合容量衰退規(guī)律,在一定程度上修正了溫度變化所帶來的誤差。
圖4 添加溫度補(bǔ)償后的容量對(duì)比Fig.4 Capacity comparison after adding temperature compensation
動(dòng)力電池的充放電過程是非常復(fù)雜的電化學(xué)變化過程,測試數(shù)據(jù)的特征與電池SOH之間具有較高的關(guān)聯(lián)性,其中IC曲線的峰值點(diǎn)與電池的反應(yīng)速率和儲(chǔ)能能力有關(guān)[14-15]。ICA方法不僅適用于車載動(dòng)力電池的低倍率充電過程,也同樣適用于高倍率充電過程[16],選取車輛的快充和慢充數(shù)據(jù)不會(huì)造成ICA結(jié)果出現(xiàn)誤差,且選取的車輛數(shù)據(jù)都是在恒流充電情況下采集的,所以可以通過分析充電過程中的IC曲線峰值高度與對(duì)應(yīng)電壓關(guān)系得到與電池SOH相關(guān)的特征。以car5的數(shù)據(jù)為例,基于ICA方法,每間隔20次循環(huán)提取一次循環(huán)的IC曲線,并且通過高斯濾波器對(duì)噪聲進(jìn)行平滑處理,該處理目的是為了找到明顯的IC峰值點(diǎn),然后根據(jù)該峰值點(diǎn)選取原數(shù)據(jù)坐標(biāo),并不會(huì)影響數(shù)據(jù)的真實(shí)性,最終得到容量增量峰值與對(duì)應(yīng)電壓位置變化的關(guān)系曲線如圖5所示。
由圖5可以看出,容量增量峰值隨循環(huán)次數(shù)增加而有所降低,峰值對(duì)應(yīng)電壓位置隨循環(huán)次數(shù)增加在一定程度上右偏。第80次循環(huán)峰值不明顯,出現(xiàn)平臺(tái)區(qū)的原因是部分慢充過程時(shí)間較長,電壓變化緩慢,而第100次循環(huán)峰值存在左偏異常,是由于快充過程充電電流的波動(dòng)較大導(dǎo)致的。
新提取的特征需要進(jìn)行關(guān)聯(lián)度分析[15],通過皮爾森相關(guān)系數(shù)法對(duì)該特征參數(shù)與SOH進(jìn)行相關(guān)性分析,car5的峰值和對(duì)應(yīng)電壓位置數(shù)據(jù)與電池SOH的關(guān)聯(lián)度分別為0.895 8和0.813 4,因此,這兩個(gè)特征都可以作為模型估計(jì)的特征參數(shù)。
除了上述的ICA特征之外,為了降低實(shí)車數(shù)據(jù)中部分合理的強(qiáng)噪聲對(duì)單一特征預(yù)測結(jié)果穩(wěn)定性的影響,同時(shí)也為了提高模型估計(jì)精度,選取了實(shí)車數(shù)據(jù)充電過程中的一段充電數(shù)據(jù)的容量樣本作為特征樣本輸入,綜合數(shù)據(jù)分布的可視化分析和真實(shí)充電行為的特征分析,最終選定每次充電循環(huán)中SOC在50%~60%段的累計(jì)充入容量作為容量樣本,該段充電過程中容量、電壓和電流數(shù)據(jù)變化趨勢最為平緩,且片段長度較短不會(huì)導(dǎo)致過擬合現(xiàn)象。由于其本身就是與SOH計(jì)算相關(guān)的一部分?jǐn)?shù)據(jù),所以不需要進(jìn)行相關(guān)性分析。
圖5 電池IC曲線Fig.5 IC curve of battery
長短期記憶-循環(huán)神經(jīng)網(wǎng)絡(luò)(long short term memory-recurrent neural network,LSTM-RNN)模型廣泛地用于數(shù)據(jù)預(yù)測研究,其結(jié)構(gòu)為多個(gè)LSTM單元構(gòu)成的RNN模型,可以有效地捕捉連續(xù)性數(shù)據(jù)在時(shí)間維度上的長期和短期特征依賴,電池老化過程屬于時(shí)間序列問題,該類問題使用LSTM-RNN模型的效果較好[17],但這種算法的魯棒性較差,多次預(yù)測結(jié)果之間均存在1%~3%的不一致預(yù)測結(jié)果。
在使用實(shí)車運(yùn)行數(shù)據(jù)集進(jìn)行數(shù)據(jù)處理時(shí),對(duì)影響SOH結(jié)果且占此次循環(huán)數(shù)據(jù)總量不超過5%真實(shí)數(shù)據(jù)都予以保留,視為可用數(shù)據(jù),反之視其與SOH的相關(guān)性進(jìn)行處理或直接剔除。故而部分循環(huán)數(shù)據(jù)在實(shí)際數(shù)據(jù)集中并不是連續(xù)的,且實(shí)際運(yùn)行數(shù)據(jù)的工況較為復(fù)雜且數(shù)據(jù)量巨大,出現(xiàn)部分狀態(tài)正常但數(shù)據(jù)結(jié)果離群值較大的正常數(shù)據(jù),該類數(shù)據(jù)存在有隱含特征,讓依賴記憶前期數(shù)據(jù)特征的LSTM-RNN模型的預(yù)測結(jié)果受到較大的影響。后通過對(duì)該類數(shù)據(jù)結(jié)果的微觀分析發(fā)現(xiàn),實(shí)車數(shù)據(jù)存在日常使用下的隔夜不滿充滿放行為以及不規(guī)律用電帶來的電池長時(shí)間靜置等問題,導(dǎo)致前后兩次充放電循環(huán)過程的數(shù)據(jù)時(shí)間性關(guān)系較差,數(shù)據(jù)特征在時(shí)序性上出現(xiàn)跳躍性的波動(dòng),所以預(yù)測結(jié)果在出現(xiàn)較多的離群點(diǎn)數(shù)據(jù)后,LSTM-RNN算法的預(yù)測結(jié)果往往會(huì)連續(xù)出現(xiàn)一系列誤差。
針對(duì)這一問題,選擇了與實(shí)車數(shù)據(jù)問題類似的股票價(jià)格預(yù)測問題中較為新穎的AdaBoost算法,對(duì)實(shí)車數(shù)據(jù)結(jié)果進(jìn)行預(yù)測,最終結(jié)果表明,該算法可以較好地處理不規(guī)律數(shù)據(jù)變化問題[18]。使用BP-AdaBoost算法通過疊加法以AdaBoost算法為框架,以反向傳播(back propagation,BP)算法為弱預(yù)測器,優(yōu)化樣本節(jié)點(diǎn)和弱預(yù)測器的權(quán)重,最終得到強(qiáng)預(yù)測模型。BP-AdaBoost算法可以利用n個(gè)BP網(wǎng)絡(luò)組成的弱預(yù)測器,最快速地挖掘數(shù)據(jù)特征,然后通過優(yōu)化提升權(quán)重分配將多個(gè)弱預(yù)測器的輸出結(jié)果合并輸出,最大程度降低數(shù)據(jù)噪聲對(duì)學(xué)習(xí)效果的影響,提升估計(jì)效果。同時(shí)對(duì)輸入特征要求也不高,不需要額外進(jìn)行特征篩選,強(qiáng)預(yù)測器可以彌補(bǔ)弱預(yù)測器由于誤差積累所帶來的缺陷,因此,將BP-AdaBoost算法應(yīng)用于基于實(shí)車數(shù)據(jù)的電池SOH估計(jì)研究。
BP神經(jīng)網(wǎng)絡(luò)是一種常用的神經(jīng)網(wǎng)絡(luò),其原理是通過數(shù)據(jù)信號(hào)的正向傳播與誤差的反向傳播來學(xué)習(xí)數(shù)據(jù)集內(nèi)在關(guān)聯(lián)特征。BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)簡單,僅由輸入層、隱藏層和輸出層組成,解決回歸問題具有準(zhǔn)確率高和訓(xùn)練速度快的優(yōu)點(diǎn),適合用于構(gòu)建AdaBoost算法中的弱預(yù)測器。負(fù)反饋過程中該網(wǎng)絡(luò)對(duì)每一個(gè)樣本輸出的結(jié)果y,都會(huì)通過式(4)計(jì)算其與預(yù)期結(jié)果Y的誤差率Er,即
Er=(Yr-yr)2
(4)
式(4)中:r為輸入網(wǎng)絡(luò)的第r個(gè)樣本。對(duì)所有樣本的均方誤差進(jìn)行求和,得到BP神經(jīng)網(wǎng)絡(luò)的目標(biāo)函數(shù),為了得到最優(yōu)的結(jié)果,只需要最小化式(5)中的誤差函數(shù)Ek,即
(5)
式(5)中:M為樣本總量。BP網(wǎng)絡(luò)中局部數(shù)據(jù)的誤差不會(huì)對(duì)全局結(jié)果造成很大影響,適用于消除真實(shí)數(shù)據(jù)中強(qiáng)噪聲對(duì)后續(xù)預(yù)測結(jié)果的影響,也是選擇該神經(jīng)網(wǎng)絡(luò)構(gòu)造AdaBoost模型弱預(yù)測器的原因。結(jié)構(gòu)上通過使用AdaBoost算法規(guī)則組合n個(gè)BP網(wǎng)絡(luò)為強(qiáng)預(yù)測器,有效改善了 BP 神經(jīng)網(wǎng)絡(luò)自身容易過擬合停留在局部最優(yōu)的情況,提高了整個(gè)模型全局搜索能力。為了提高模型預(yù)測精度,最終模型的輸入樣本包括容量樣本和ICA特征樣本,這兩種特征在迭代過程中的權(quán)重采用分開分配的策略,其實(shí)現(xiàn)過程如圖6所示。具體步驟如下。
步驟1導(dǎo)入容量樣本集和特征樣本集,對(duì)其簡單規(guī)范化預(yù)處理后,輸入由BP神經(jīng)網(wǎng)絡(luò)構(gòu)成的弱預(yù)測器,利用car5數(shù)據(jù)集中124次充電循環(huán)數(shù)據(jù)來訓(xùn)練模型,每一個(gè)初始訓(xùn)練樣本點(diǎn)最開始的權(quán)重W1=1/124,在此樣本權(quán)重下得到x1,通過x1訓(xùn)練得到一個(gè)基本預(yù)測器H1,設(shè)置一個(gè)期望的誤差區(qū)間,根據(jù)H1對(duì)樣本的預(yù)測結(jié)果與真實(shí)值y進(jìn)行比對(duì),判斷預(yù)測結(jié)果是否在誤差區(qū)間內(nèi),從而對(duì)樣本進(jìn)行分類并進(jìn)行權(quán)重更新。預(yù)測失敗的樣本數(shù)據(jù),提高數(shù)據(jù)樣本權(quán)重,使其更貼近真實(shí)值,已經(jīng)預(yù)測成功的樣本數(shù)據(jù),則降低權(quán)重,不對(duì)其分類結(jié)果進(jìn)行修改。
圖6 BP-AdaBoost算法流程圖Fig.6 Flowchart of the BP-AdaBoost algorithm
步驟2根據(jù)新的權(quán)重分布訓(xùn)練弱預(yù)測器Hn,將數(shù)據(jù)迭代m次,每次迭代中都進(jìn)行樣本權(quán)重更新。同時(shí)將每一次BP網(wǎng)絡(luò)的預(yù)測結(jié)果與真實(shí)容量進(jìn)行對(duì)比,根據(jù)樣本預(yù)測結(jié)果對(duì)樣本權(quán)重進(jìn)行更新,樣本權(quán)重更新公式為
(6)
(7)
式中:Wmn為第m次迭代第n個(gè)預(yù)測器輸入的樣本權(quán)重;Hn為表示第n個(gè)預(yù)測器;Zm為標(biāo)準(zhǔn)化因子;an為弱預(yù)測器的權(quán)重;n為預(yù)測器的數(shù)量;y為電池SOH的真實(shí)值。
步驟3計(jì)算BP網(wǎng)絡(luò)預(yù)測結(jié)果與真實(shí)容量的誤差率E,作為最終弱預(yù)測器權(quán)重更新的依據(jù),完成m次迭代后,將所有的弱預(yù)測器結(jié)果綜合加權(quán)得到強(qiáng)預(yù)測器模型,該算法能夠修正一部分實(shí)車容量數(shù)據(jù)問題帶來的偏差,提高模型收斂速度,穩(wěn)定預(yù)測結(jié)果,比較適合實(shí)車電池SOH的估計(jì)模型,弱預(yù)測器Hn的權(quán)重更新公式為
(8)
式(8)中:En為第n個(gè)預(yù)測器的誤差率。
首先,BP-AdaBoost模型根據(jù)樣本點(diǎn)的預(yù)測結(jié)果進(jìn)行樣本權(quán)重的迭代修改;其次,根據(jù)每次BP網(wǎng)絡(luò)的誤差率給所有的BP網(wǎng)絡(luò)分配權(quán)重;最后,得到基于BP神經(jīng)網(wǎng)絡(luò)融合AdaBoost算法的電池SOH強(qiáng)預(yù)測器模型。
為了驗(yàn)證設(shè)計(jì)算法的有效性,建立了BP-AdaBoost模型,利用同一類型3車輛的car5、car6和car9的實(shí)車數(shù)據(jù)進(jìn)行訓(xùn)練、驗(yàn)證和測試,數(shù)據(jù)量比例約為2∶1∶1。為了防止循環(huán)次數(shù)長度干擾模型預(yù)測,car9數(shù)據(jù)量最大作為訓(xùn)練集,car6作為驗(yàn)證集,用于在預(yù)測過程中對(duì)參數(shù)進(jìn)行尋優(yōu)輔助模型建立,car5作為最后的測試數(shù)據(jù)。作為對(duì)比,同時(shí)建立了LSTM-RNN模型,利用相同的訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)進(jìn)行驗(yàn)證。
利用car5的數(shù)據(jù)進(jìn)行測試的結(jié)果如圖7所示,可以看到LSTM-RNN模型前20次循環(huán)預(yù)測結(jié)果誤差較大,全過程中的預(yù)測值普遍高于真實(shí)值,且對(duì)于波動(dòng)較大的實(shí)車數(shù)據(jù),無法很好地對(duì)其進(jìn)行預(yù)測,特別是在電池SOH下降速度較快的98%~94%部分。這是由于LSTM-RNN中的梯度優(yōu)化過程受到數(shù)據(jù)噪聲影響,并且實(shí)車數(shù)據(jù)的循環(huán)時(shí)間不是等距序列,間隔增大時(shí)LSTM會(huì)失去學(xué)習(xí)信息的能力,導(dǎo)致誤差增大,從而影響模型估計(jì)精度。
圖7 兩種方法估計(jì)結(jié)果Fig.7 Prediction results of two methods
BP-AdaBoost模型在數(shù)據(jù)開始階段,估計(jì)誤差同樣較大,預(yù)測結(jié)果出現(xiàn)稍許滯后現(xiàn)象,通過樣本權(quán)重的再分配,有效地消除了波動(dòng)較大數(shù)據(jù)對(duì)結(jié)果的影響,能夠很好地貼近實(shí)車數(shù)據(jù)結(jié)果,隨著弱預(yù)測器權(quán)重的迭代修正能夠很好地提高模型穩(wěn)定性,多次預(yù)測結(jié)果相差極小,且隨著迭代次數(shù)增加,效果進(jìn)一步提高。
兩種算法模型在電池老化循環(huán)剛開始時(shí)的估計(jì)誤差均保持在較低范圍,但是LSTM-RNN模型在電池SOH出現(xiàn)較大變化后,對(duì)實(shí)車電池SOH的估計(jì)精度明顯降低,而BP-AdaBoost模型的估計(jì)精度能在出現(xiàn)波動(dòng)后迅速平復(fù),相比之下誤差更低。為了更清楚地顯示兩種方法的估計(jì)結(jié)果變化,繪制兩種算法的估計(jì)誤差曲線如圖8所示。
圖8中,LSTM-RNN模型受到真實(shí)數(shù)據(jù)驟降影響,在第50次循環(huán)之后誤差普遍較大,表明該模型的抗噪聲能力較差。BP-AdaBoost模型總體效果較好,穩(wěn)定性強(qiáng),大部分預(yù)測結(jié)果均方根誤差在0.9%以下,雖然受到第90次循環(huán)真實(shí)值驟降的影響,后續(xù)預(yù)測結(jié)果出現(xiàn)波動(dòng),但能通過權(quán)值修改在一定程度上降低部分突變數(shù)據(jù)的影響。因此,BP-AdaBoost模型對(duì)于實(shí)車數(shù)據(jù)噪聲的抗干擾能力較強(qiáng),穩(wěn)定性較好,能夠?qū)﹄姵豐OH進(jìn)行準(zhǔn)確的預(yù)測。為了更全面地比較兩種算法的估計(jì)結(jié)果,分別計(jì)算了RMSE、平均絕對(duì)誤差(mean absolute error,MAE)、平均絕對(duì)百分比誤差(mean absolute percent error,MAPE),結(jié)果如表2所示。
圖8 兩種方法結(jié)果誤差Fig.8 The result error of the two methods
表2 兩種方法評(píng)價(jià)指標(biāo)對(duì)比Table 2 Comparison of evaluation indexes of two methods
由表2可以看出,相比于LSTM-RNN模型,BP-AdaBoost模型的3種評(píng)價(jià)指標(biāo)較低,BP-AdaBoost模型的均方根誤差為1.116%,相比于LSTM-RNN模型降低了4.4%,其平均絕對(duì)誤差表現(xiàn)最好,誤差精度達(dá)到了0.963%,相比于LSTM-RNN模型降低了3.629%,而平均絕對(duì)百分比誤差為1.009%,相比于LSTM-RNN模型降低了3.664%。綜合3種評(píng)價(jià)指標(biāo),BP-AdaBoost模型在實(shí)車數(shù)據(jù)的電池SOH估計(jì)上效果更好、精度更高。
基于實(shí)車數(shù)據(jù)對(duì)電動(dòng)汽車動(dòng)力電池SOH估計(jì)算法展開研究,結(jié)論如下。
(1)使用大數(shù)據(jù)分析的處理方法,對(duì)京滬兩地實(shí)際運(yùn)行的電動(dòng)汽車數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,得到符合模型估計(jì)精度的動(dòng)力電池容量數(shù)據(jù),在此基礎(chǔ)上進(jìn)行溫度容量補(bǔ)償和汽車快慢充電的容量修正,降低了數(shù)據(jù)分布的離散性,最終在保證數(shù)據(jù)真實(shí)性的情況下,得到了新的可用于模型預(yù)測的實(shí)車運(yùn)行數(shù)據(jù)集。
(2)同時(shí)使用容量特征和數(shù)據(jù)特征作為測試樣本輸入,容量特征使用了電池SOC在50%~60%段累計(jì)充入的容量,數(shù)據(jù)特征則通過ICA方法尋找電池IC曲線峰值和對(duì)應(yīng)電壓位置參數(shù)得到,并驗(yàn)證了該特征參數(shù)與SOH之間具有高關(guān)聯(lián)度,可適用于實(shí)車數(shù)據(jù)預(yù)測。
(3)針對(duì)實(shí)車數(shù)據(jù)部分不可處理的強(qiáng)噪聲和時(shí)序性差的問題,使用BP-AdaBoost算法進(jìn)行SOH的估計(jì),BP-AdaBoost模型對(duì)同一類車型表現(xiàn)出良好的適應(yīng)性,預(yù)測結(jié)果更加貼近真實(shí)值,表現(xiàn)最好的MAE評(píng)價(jià)指標(biāo)達(dá)到0.96%,可以滿足實(shí)際工況下的電動(dòng)汽車動(dòng)力電池SOH估計(jì)精度要求。