于 鵬,楊仁剛(1.中國農(nóng)業(yè)大學(xué)信息與電氣工程學(xué)院,北京100083;2.渤海大學(xué)工學(xué)院,錦州 121013)
?
基于歐氏距離最佳K均值聚類的超級電容組故障在線鑒別方法
于鵬1,2,楊仁剛1※
(1.中國農(nóng)業(yè)大學(xué)信息與電氣工程學(xué)院,北京100083;2.渤海大學(xué)工學(xué)院,錦州 121013)
摘要:為了提高超級電容組運行可靠性需要對故障電容進(jìn)行在線鑒別,針對現(xiàn)有超級電容故障鑒別方法參數(shù)識別難度高和采集數(shù)據(jù)量大的問題,該文采用最佳K均值聚類方法在線檢測故障超級電容器,并提出了最佳聚類的歐氏距離指標(biāo)。該方法首先對在線電壓信號數(shù)據(jù)進(jìn)行預(yù)處理,采用奇異值分解提取特征值進(jìn)行K-Means動態(tài)聚類并計算相應(yīng)的歐氏距離指標(biāo),由最佳聚類結(jié)果鑒別出故障單體。針對該文提出方法設(shè)計了超級電容組充放電仿真試驗進(jìn)行驗證。試驗結(jié)果表明基于歐氏距離指標(biāo)最佳K均值動態(tài)聚類的超級電容組故障在線鑒別方法可以根據(jù)串聯(lián)單體電壓信號進(jìn)行故障檢測。該文可為超級電容在線故障檢測系統(tǒng)的開發(fā)與研制提供參考。
關(guān)鍵詞:故障檢測;信號分析;模型;超級電容;動態(tài)聚類;有效性指標(biāo)
于鵬,楊仁剛. 基于歐氏距離最佳K均值聚類的超級電容組故障在線鑒別方法[J]. 農(nóng)業(yè)工程學(xué)報,2016,32(2):186-192. doi:10.11975/j.issn.1002-6819.2016.02.027http://www.tcsae.org
Yu Peng, Yang Rengang. Online fault identification method for supercapacitor group of optimal K-means cluster based on Euclidean distance[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(2): 186-192. (in Chinese with English abstract)doi:10.11975/j.issn.1002-6819.2016.02.027http://www.tcsae.org
超級電容規(guī)?;褂檬且环N具有前景的電能規(guī)?;鎯夹g(shù),對于清潔能源的使用和增加可再生能源在電網(wǎng)能源構(gòu)成中的比例具有重要作用。超級電容具有總儲能成本低和功率密度大的優(yōu)點。由于超級電容單體耐壓水平低,在規(guī)?;褂脮r需多組單體串聯(lián)構(gòu)成模組[1]。實時檢測模組中故障電容器,適時安排檢修是提高超級電容規(guī)模化串聯(lián)模組整體可靠性的重要手段,也是影響目前超級電容規(guī)模化集成應(yīng)用的瓶頸問題之一。
電路故障分為硬故障和軟故障,超級電容的緩變故障屬于軟故障,主要包括電熱擊穿、容量衰減和外殼軟化等劣化失效或損傷累積失效模式[2]。從故障檢測的目的來看,對超級電容的故障檢測研究[3]可分為對超級電容生命周期預(yù)測和健康狀態(tài)檢測兩大類,對超級電容生命周期的預(yù)測主要目的是評估超級電容的實際壽命,而健康狀態(tài)檢測主要目的是在線檢測出故障電容器,本文主要涉及后者。從檢測方法來看,主要有直接測量法和參數(shù)估計法。直接法[4]是通過實時測量超級電容電壓電流以及環(huán)境溫度,然后根據(jù)端電壓與壽命經(jīng)驗曲線或比較電容能量儲存變化來診斷超級電容的健康狀況。優(yōu)點在于有可能在線應(yīng)用,其缺點在于需要與初始狀態(tài)進(jìn)行比較才能做出判斷。實際應(yīng)用中,模組單體初始狀態(tài)的測量會增加生產(chǎn)的難度與成本。
較為普遍的研究方法是采用參數(shù)估計法,利用在線測量信息估計超級電容單體的容值和串并聯(lián)電阻。參數(shù)估計法又分為頻域參數(shù)估計和時域參數(shù)估計。頻域參數(shù)估計優(yōu)點為可分辨參數(shù)在頻率域的更多細(xì)節(jié);缺點為測量較為復(fù)雜在線實施難度大[5]。時域參數(shù)估計則是通過測量信號與超級電容容值、串聯(lián)和并聯(lián)電阻參數(shù)的數(shù)學(xué)模型,采用數(shù)學(xué)估計的方法獲得參數(shù)進(jìn)而判斷超級電容健康狀況。Akram Eddahech[6]提出了一種基于遺忘因子的最小二乘回歸計算超級電容內(nèi)阻參數(shù)的方法,其優(yōu)點為可以在線估計內(nèi)阻參數(shù),其缺點為選用模型不同將影響結(jié)果且其原理存在建模簡化與最小二乘法所造成的誤差。Shi Zhihao[7]設(shè)計了擴(kuò)展卡爾曼觀測器,通過觀測器計算超級電容參數(shù)的估計值,包括電容值和串并聯(lián)電阻,主要缺點是需要在充電電流中疊加信號,增加了系統(tǒng)成本。
現(xiàn)有方法大多側(cè)重于超級電容參數(shù)的在線辨識,辨識的基礎(chǔ)是超級電容數(shù)學(xué)模型,但超級電容精確建模以及對失效模式的量化分析難度較大;基于對單體電容器特性的分析,需對電容單體逐個參數(shù)識別,識別工作量較大。基于聚類法的非線性系統(tǒng)故障檢測已有研究[8],具有無需建立精確數(shù)學(xué)模型的優(yōu)點。因此,本文提出了基于歐氏距離指標(biāo)最佳K均值動態(tài)聚類的超級電容組故障在線鑒別新方法。該方法無需建立每個超級電容單體數(shù)學(xué)模型,通過對單體電容電壓測量信息中提取樣本特征向量進(jìn)行最佳K均值聚類,可同時檢出多個失效電容器。
本文首先介紹樣本特征向量計算方法并簡要介紹K均值聚類數(shù)學(xué)模型,然后介紹本文提出的判定最佳聚類數(shù)的歐氏距離指標(biāo)和超級電容串聯(lián)組故障在線鑒別的動態(tài)聚類方法,最后通過仿真試驗驗證動態(tài)聚類方法與歐氏距離指標(biāo)的正確性,以期為超級電容在線故障檢測系統(tǒng)的開發(fā)與研制提供參考。
采用聚類方法鑒別串聯(lián)超級電容模組中的故障組,需解決2個問題:1)提取表征模組狀態(tài)的特征作為聚類樣本[9-11];2)確定最佳聚類數(shù)目和判斷失效模組。
1.1電容模組狀態(tài)聚類數(shù)學(xué)模型
單體超級電容等值電路由電容、串聯(lián)電阻和并聯(lián)電阻構(gòu)成,由此形成的串聯(lián)模組經(jīng)典電路模型如圖1所示。
圖1 串聯(lián)電容器等值電路Fig.1 Equivalent circuit of series capacitors
設(shè)ui(t-Δt)和ui(t)分別為2個相鄰時刻(t-Δt)和t,第i個電容器端電壓在線測量值。則有
式中uci(t)為電容電壓,V;角標(biāo)i為電容編號,A;i(t)為電容器電流,A;rsi為第i個電容器的等效串聯(lián)內(nèi)阻,?;ui(t)為測量電壓,V;Δt為采樣時間間隔,s;t為采樣時刻,s。
忽略電容器漏電流,相鄰時刻電容器端電壓差值與電容器電流有以下關(guān)系成立
式中ci為第i個電容器的電容,F(xiàn)。
值得指出的是,忽略電容器漏電流后,串聯(lián)各單體的電流近似相等,在采樣間隔Δt內(nèi)電容模組串聯(lián)電路中的電流不會因某個單體電容值的變化而變化。即在Δt內(nèi),對任意第i個電容器而言,電容值ci與該采樣間隔相鄰時刻電容電壓差成反比。
由此可見,相鄰時刻電容器端電壓測量值之差[ui( t)- ui( t-Δ t )]可以反映超級電容的電容量與內(nèi)阻特征,即可作為檢測第i個超級電容單體的狀態(tài)變量。這里將檢測第i個超級電容單體的狀態(tài)變量定義為
設(shè)總采樣時間為T=m·Δt,其中m為采樣總數(shù)。對n個串聯(lián)單體端電壓采樣結(jié)果可以得到系統(tǒng)的狀態(tài)矩陣
式(4)矩陣A的行向量表征了相應(yīng)單體電容值的狀態(tài),為了提取其特征值對矩陣An× m進(jìn)行奇異值分解(singular value decomposition, SVD),有
式中Rn× n、Qm× m分別為正交陣,其列向量分別稱為A陣的左、右奇異向量;Λn× m為A陣的奇異值對角陣。
奇異值對角陣Λn× m=diag,…,0… 0),其中,...為從大到小排列的矩陣特征值。,...為前n列對角元奇異值,滿足≥≥ ...≥。
等式(5)兩邊右乘正交陣Qm× m,有
Rn× nΛn×m稱為矩陣A在Qm× m上的投影,選取較大奇異值對應(yīng)投影方向得到的投影變換,可以較好地保留原向量表示的信息[12]。因此,本文提取Rn× nΛn×m中對應(yīng)的第1列向量作為n個超級電容串聯(lián)模組端電壓狀態(tài)特征值,即模組狀態(tài)樣本特征向量
式中[x1, x2,..., xn]T為模組狀態(tài)樣本特征向量。
針對式(7)所提取的特征向量進(jìn)行K均值聚類就可以獲得模組狀態(tài)的分類。設(shè)給定聚類數(shù)為k,則K均值聚類目標(biāo)函數(shù)為
式中k為聚類數(shù);Γi為第i個聚類子集,xj為Γi中的樣本,mi為Γi中樣本的平均值,即
式中Ni為子集Γi中的樣本點數(shù)。
1.2最佳聚類數(shù)判定指標(biāo)
所謂最佳K均值(K-Means)聚類算法是通過不斷給定聚類的聚類數(shù)k進(jìn)行聚類計算,然后用最佳聚類數(shù)判定指標(biāo)來確定其中最佳聚類結(jié)果K。以下介紹K-Means聚類方法和聚類數(shù)判定指標(biāo)。
大部分聚類算法需要預(yù)先給定聚類數(shù),因而如何得到最佳聚類數(shù),一直是聚類有效性研究的重要課題。現(xiàn)有方法通常是通過聚類有效性指標(biāo)對給定不同聚類數(shù)k的聚類結(jié)果進(jìn)行評價以確定樣本集最佳聚類數(shù)和最合適的聚類結(jié)果[13-15]。研究表明[16-17],沒有一種有效性指標(biāo)能夠在任何情況下都具有普遍適用性。較為常用的4種有效性指標(biāo)有Hartigan(Ht)指標(biāo)[18]、Homogeneity-Separation(HS)指標(biāo)[19]、Calinski-Harabasz(CH)指標(biāo)[20]、Krzanowski-Lai(KL)指標(biāo)[21]。
采用聚類方法檢測失效超級電容器,首先應(yīng)當(dāng)將參數(shù)異常電容與參數(shù)正常電容區(qū)分開;其次要求參數(shù)能夠區(qū)分異常電容與正常電容分入同組的情況。分組數(shù)不可過多,否則無法區(qū)分正常電容與異常電容。指標(biāo)應(yīng)在一定范圍內(nèi)可以調(diào)節(jié)以適應(yīng)不同具體情況。根據(jù)這一概念,本文提出一種新的最佳K值聚類判定指標(biāo),稱為歐氏距離(euclid distance,ED)指標(biāo)。
歐氏距離指標(biāo)是基于類內(nèi)樣本點距離和聚類中心點距離的判定指標(biāo),即
式中VEDk為聚類數(shù)等于k時歐氏距離聚類有效性指標(biāo);Dgroup為類內(nèi)樣本距離,等于全部類內(nèi)點之間歐氏距離之和;DCmax和DCmin分別為最大中心距離和最小中心距離;p為分子試驗校正參數(shù)、q為分母試驗校正參數(shù)。
歐氏距離指標(biāo)定義式(10)中選取試驗校正參數(shù)p、q時應(yīng)使該定義式的分子分母數(shù)量級一致,滿足
本文采用的經(jīng)驗值為p=1,q=1。類內(nèi)樣本距離為
式中Γl為第l個分類子集。
最大中心距離和最小中心距離DCmax和DCmin為
顯然,最佳聚類是希望同類子集內(nèi)的樣本點越集中越好,即Dgroup越小越好;聚類數(shù)不要太多則希望最大中心距離DCmax越小越好;同時,希望各類之間區(qū)分度越大越好,即DCmin越大越好。因此,最佳聚類的歐氏距離指標(biāo)越小越好,即最佳聚類的歐氏距離指標(biāo)為
式中VED為歐氏距離指標(biāo),k*為最佳聚類數(shù)。
基于最佳K均值聚類的超級電容模組故障狀態(tài)在線鑒別需要在每一個采樣周期獲得樣本后,首先對模組總體狀態(tài)進(jìn)行評估,判斷是否存在失效單體,進(jìn)而對存在失效電容的樣本特征向量進(jìn)行聚類分析,鑒別出參數(shù)劣化單體電容。
在每一個采樣周期通過式(1)~式(6)獲得模組狀態(tài)樣本特征向量X=[ x1, x2... xn]T,計算特征向量的方差σ2[22]。若方差σ2大于給定閾值ε,則特征向量中包含故障電容狀態(tài)特征樣本;反之則說明特征向量結(jié)果合格。
在特征向量的方差大于給定閾值的情況下,求解式(8)聚類問題,得到不同聚類數(shù)k對應(yīng)的分類子集;然后對不同k值的聚類結(jié)果按照式(10)計算歐氏距離指標(biāo)VEDk;由式(14)判定最佳聚類結(jié)果;在最佳聚類子集中,樣本點數(shù)目最多子集所對應(yīng)的單體電容集合確定為正常電容子集,剩余子集判定為非正常子集。故障狀態(tài)在線鑒別方法計算流程如圖2所示。
圖2 故障狀態(tài)在線鑒別方法流程Fig.2 Workflow of online fault state identification method
為了驗證提出的超級電容模組故障狀態(tài)在線鑒別方法的有效性,本文設(shè)計了一個9單體電容器串聯(lián)的超級電容儲能試驗系統(tǒng),并基于MATLAB-simulink環(huán)境設(shè)計了2組試驗。其中,試驗一為最佳聚類指標(biāo)效果對比試驗,在相同工況和相同采樣值的條件下,采用本文提出的最佳聚類指標(biāo)和目前常用Hartigan(Ht)、Homogeneity-Separation(HS)、Calinski-Harabasz(CH)和Krzanowski-Lai(KL)指標(biāo)進(jìn)行故障狀態(tài)檢測并對結(jié)果進(jìn)行對比,以驗證本文歐氏距離指標(biāo)(式(13))的有效性;試驗二為多工況條件下聚類指標(biāo)有效性試驗,為了驗證本文的故障檢測方法在不同情況下都能有效地檢出故障電容器,對超級電容儲能仿真系統(tǒng)在不同工況條件下進(jìn)行了檢測驗證。
3.1系統(tǒng)及參數(shù)
本文設(shè)計的超級電容模組試驗系統(tǒng)為9個單體超級電容串聯(lián)形成的儲能系統(tǒng),模組系統(tǒng)采用如圖1所示經(jīng)典模型,超級電容額定參數(shù):電容c=10 F,串聯(lián)電阻rs=0.1 ?,并聯(lián)電阻rp=27 k?。仿真試驗按照隨機(jī)誤差生成電容數(shù)據(jù),設(shè)計其中電容器c1、c3和c5為非健康狀態(tài)的故障電容器,相應(yīng)電容值的偏差大于20%,系統(tǒng)參數(shù)表1所示。
表1 系統(tǒng)參數(shù)Table 1 Dataset of experiment system
3.2試驗及結(jié)果
3.2.1最佳聚類指標(biāo)效果對比試驗
聚類指標(biāo)對比試驗是在儲能系統(tǒng)隨機(jī)充放電工況下進(jìn)行的,隨機(jī)充放電工況通過隨機(jī)事件發(fā)生器控制充電電源和放電電阻來實現(xiàn),電容器端電壓采樣周期10 s、采樣間隔1 s。
在隨機(jī)充放電工況下,各電容器端電壓的變化曲線如圖3。任選儲能仿真系統(tǒng)的一個周期樣本方差大于闋值ε=0.01的采樣值,由式(4)~式(7)得到樣本特征向量為
圖3 電容器端電壓Fig.3 Curves of capacitor’s voltage
1)本文歐氏距離指標(biāo)計算結(jié)果
對式(15)樣本進(jìn)行動態(tài)聚類計算,得到歐氏距離指標(biāo)關(guān)于聚類數(shù)k的變化曲線VED(k)如圖4所示,由式(14)得最佳聚類數(shù)k*=2。
最佳聚類數(shù)k*=2對應(yīng)的2個聚類子集分別為
圖4 歐氏距離指標(biāo)VED(k)曲線Fig.4 Curves of Euclidean distance Index
根據(jù)樣本點多的聚類子集為正常子集的判據(jù),樣本點少的Γ2為故障電容子集。對比給定參數(shù)表1可知,故障集Γ2中3個故障電容與給定一致。上述結(jié)果表明,在隨機(jī)充放電運行工況下本文的方法能夠有效地檢出故障電容器。
2)常用的4種聚類指標(biāo)計算結(jié)果
對相同的特征向量式(15)采用4種常用最佳聚類Ht、HS、CH和KL指標(biāo)得到各指標(biāo)關(guān)于聚類數(shù)k的變化曲線如圖5所示。
圖5 現(xiàn)有有效性指標(biāo)曲線Fig.5 Curves of existing efficient index
HS、CH和KL指標(biāo)都是取值最大的聚類數(shù)為最佳聚類數(shù)k*,Hartigan指標(biāo)是取指標(biāo)小于等于10的最小類數(shù)為最佳聚類數(shù)k*。由圖5可見,KL指標(biāo)得到的最佳聚類數(shù)k*=6,CH指標(biāo)得到的最佳聚類數(shù)k*=8,HS指標(biāo)得到的最佳聚類數(shù)k*=5,顯然對電容器故障狀態(tài)聚類問題失效;Hartigan指標(biāo)得到最佳聚類數(shù)與本文歐氏距離指標(biāo)一致k*=2,但是其計算方法相對復(fù)雜、評估性能和通用性不強[23-25]。
3.2.2多工況條件下聚類指標(biāo)有效性試驗
為了進(jìn)一步驗證本文故障電容器鑒別方法的有效性和合理性,對超級電容儲能試驗系統(tǒng)進(jìn)行了多工況運行條件下故障電容器檢測仿真試驗。在儲能系統(tǒng)充電、放電和隨機(jī)充放電運行工況下完成了8組試驗,其中第1組和第2組試驗為不同電壓初值的放電試驗,其中第1組試驗超級電容單體初始電壓設(shè)置為1.8 V,第2組試驗超級電容單體初始電壓設(shè)置為2.5 V。第3和第4組為不同充電電流的充電試驗,其中第3組試驗充電電流設(shè)置為1 A,第4組試驗充電電流設(shè)置為0.5 A。第5到第8組為隨機(jī)充放電試驗,為滿足其隨機(jī)充放電條件,設(shè)置其充電電流為0.1 A,放電電阻為10 ?。
采用與3.2.1所述試驗相同的方法采樣并獲得特征向量,對特征向量應(yīng)用本文方法進(jìn)行動態(tài)聚類得到各運行工況下最佳的聚類結(jié)果列于表2。
表2 電容序號與聚類表Table2 Dataset of capacitor numbers and clusters
由試驗結(jié)果表2可見,第1組~第4組試驗樣本的最佳聚類數(shù)都是3,各組試驗對應(yīng)的3個聚類子集元素完全相同,將其元素重新整理為3組
根據(jù)樣本點多的子集為正常子集判據(jù),式(17)中1為正常電容器集,而Γ2和Γ3為非正常集,即檢出c1、c3和c5為故障電容器與預(yù)設(shè)結(jié)果一致。
試驗結(jié)果表2中第5組~第8組試驗樣本的最佳聚類數(shù)都是2,各組試驗對應(yīng)的2個聚類子集與試驗一式(16)完全相同,均正確地檢出了故障電容器。
由此可見,本文提出的最佳K均值聚類檢測故障電容器的方法能夠在各種運行工況下正確地檢出故障電容器。
1)本文提出的基于歐氏距離最佳K均值聚類的超級電容模組故障狀態(tài)在線檢測方法是根據(jù)在線測量超級電容單體電壓信息來判斷串聯(lián)模組內(nèi)的故障電容器,與以往方法相比避免了超級電容容值參數(shù)的計算,因此對傳感器數(shù)據(jù)要求低,便于工程實現(xiàn)。
2)建立了電容模組狀態(tài)K均值聚類數(shù)學(xué)模型,提出了電容模組狀態(tài)樣本特征向量的計算方法和最佳聚類數(shù)判定的歐氏距離指標(biāo)。
3)設(shè)計了超級電容串聯(lián)模組系統(tǒng)的充放電仿真試驗,并采用本文的模型和算法對試驗采樣數(shù)據(jù)進(jìn)行故障電容器檢測計算,計算結(jié)果區(qū)分了超級電容單體健康狀態(tài),驗證了方法和模型的有效性。
[參考文獻(xiàn)]
[1] 于鵬,楊仁剛. 超級電容串聯(lián)儲能系統(tǒng)的并聯(lián)電容均壓方法[J]. 農(nóng)業(yè)工程學(xué)報,2014,30(24):133-140. Yu Peng, Yang Rengang. Voltage equalizing method of energy storage system based on series connected supercapacitros[J]. Transactions of the Chinese Society of Agricultural Engineering(Transactions of the CSAE), 2014,30(24): 133-140.
[2] 李忠學(xué),陳杰. 碳基超級電容器的快速充放電性能及失效模式[J]. 蘭州交通大學(xué)學(xué)報:自然科學(xué)版,2006,25(6):8-11. Li Zhongxue, Chen Jie. Failure modes and rapid charging/ discharging characteristics of carbon-based supercapacitors[J]. Journal of Lanzhou Jiaotong University: Natural Sciences,2006, 25(6): 8-11. (in Chinese with English abstract)
[3] Lystianingrum V. State of health and life estimation methods for supercapacitors[C]//Australasian Universities Power Engineering Conference, Hobart: IEEE, 2013: 1-7.
[4] Amrane O, Boubekeur T. Calendar ageing and health diagnosis of supercapacitor[J]. Electric Power Systems Research, 2013, 95(2): 330-338.
[5] Wei Tongzhen. Deterioration diagnosis of ultracapacitor for power electronics applications[C]//International Conference on Sustainable Power Generation and Supply, Nanjing: IEEE,2009: 1-6.
[6] Akram E. Online parameter identification for real-time supercapacitor performance estimation in automotive applications[J]. International Journal of Electrical Power &Energy Systems, 2013, 51(10): 162-167.
[7] Shi Zhihao. Interconnected observers for online supercapacitor ageing monitoring[C]// Annual Conference of Industrial Electronics Society, Vienna: IEEE, 2013: 6746-6751.
[8] 趙琦,周東華. 一種非線性動態(tài)系統(tǒng)的故障檢測與分類方法[J]. 電工技術(shù)學(xué)報,2001,16(4):65-70. Zhao Qi, Zhou Donghua. Fault detection and classification of a class of nonlinear dynamic systems[J].Transactions of China Electrotechnical Society, 2001, 16(4): 65-70. (in Chinese with English abstract)
[9] 張菁,楊明皓. 基于模糊聚類的電力系統(tǒng)載荷能力安全預(yù)警方法[J]. 電力系統(tǒng)自動化,2007,31(22):31-33. Zhang Jing. Yang Minghao. Security forewarning method of maximum load capacity based on fuzzy clutering[J]. Automation of Electric Power Systems, 2007, 31(22): 31-33. (in Chinese with English abstract)
[10] 張紅斌,賀仁睦,劉應(yīng)梅. 基于KOHONEN 神經(jīng)網(wǎng)絡(luò)的電力系統(tǒng)負(fù)荷動特性聚類與綜合[J]. 中國電機(jī)工程學(xué)報,2003,23(5):2-3. Zhang Hongbin, He Renmu, Liu Yingmei. The characteristice clustering and synthesis of electric dynamic loads based on KOHONEN neural network[J]. Proceedings of the CSEE,2003, 23(5): 2-3. (in Chinese with English abstract)
[11] 方正文,王年,江晉劍. 一種基于低維足底壓力特征的靜態(tài)步態(tài)聚類算法術(shù)[J]. 計算機(jī)應(yīng)用研究,2015,32(7):2177-2178. Fang Zhengwen, Wang Nian, Jiang Jinjian. Clustering algorithm for static gait recognition based on low-dimensional plantar pressure features[J]. Application Research of Computers, 2015, 32(7): 2177-2178. (in Chinese with English abstract)
[12] 尹芳黎,楊雁瑩,王傳棟. 矩陣奇異值分解及其在高維數(shù)據(jù)處理中的應(yīng)用[J]. 數(shù)學(xué)的實踐與認(rèn)識,2011,41(15):171-176. Yin Fangli, Yang Yanying, Wang Chuandong. Research on the advances of singular value decomposition and its application in the high dimensional data mining[J]. Mathematics in Practice and Theory, 2011, 41(15): 171-176. (in Chinese with English abstract)
[13] Macqueen J. Some methods for classification and analysis of multivariate observations[C]//Proceedings of 5th Berkeley Symposium on Mathematical Statistics and Probability, Berkeley: University of California Press,1967: 281-297.
[14] 王莉. 數(shù)據(jù)挖掘中聚類方法的研究[D]. 天津:天津大學(xué),2004:5-8. Wang Li. Study on Clustering Algorithm in Data Mining[D]. Tianjin: Tiajin University, 2004: 5-8. (in Chinese with English abstract)
[15] 楊小兵. 聚類分析中若干關(guān)鍵技術(shù)的研究[D]. 杭州:浙江大學(xué),2005:24-25. Yang Xiaobing. Research of Key Techniques in Cluster Analysis[D]. Hangzhou: Zhejiang University, 2005: 24-25. (in Chinese with English abstract)
[16] 周世兵. 聚類分析中的最佳聚類數(shù)確定方法研究及應(yīng)用[D].無錫:江南大學(xué),2011. Zhou Shibing. Research and Application on Determining Optimal Number of Cluster in Cluster Analysis[D].Wuxi: Jiangnan University, 2011. (in Chinese with English abstract)
[17] 王開軍,李健. 聚類分析中類數(shù)估計方法的實驗比較[J].計算機(jī)工程,2008,34(9):198-202. Wang Kaijun, Li Jian. Experimental comparison of clusters number estimation for cluster analysis[J]. Computer Engineering, 2008, 34(9): 198-202. (in Chinese with English abstract)
[18] Hartigan J A, Wong M A. A K-Means clustering algorithm[J]. Applied Statistics,1979, 28(1): 100-108.
[19] Chen Gengxin. Evaluation and comparison of clustering algorithms in analyzing ES cell gene expression data[J]. Statistica Sinica, 2002, 12(1): 241-262.
[20] Calinski R B, Harabasz J. A dendrite method for cluster analysis[J]. Communications in Statistics, 1974, 3(1): 1-27.
[21] Krzanowski W, Lai Y. A criterion for determining the number of groups in a data set using sum-of-squares clustering[J]. Biometrics, 1988, 44(1): 23-34.
[22] 莊楚強,何春雄. 應(yīng)用數(shù)理統(tǒng)計基礎(chǔ)[M]. 廣州:華南理工大學(xué)出版社,2009:34-35.
[23] Peterson A R. Visual Data Mining: Using Parallel Coordinate Plots with K-Means Clustering and Color to Find Correlations in a Multidimensional Dataset[D]. Kutztown: Kutztown University of Pennsylvania, 2009: 27-29.
[24] 周世兵,徐振源,唐旭清. 基于近鄰傳播算法的最佳聚類數(shù)確定方法比較研究[J]. 計算機(jī)科學(xué),2011,38(2):225-228. Zhou Shibin, Xu Zhenyuanl, Tang Xuqing. Comparative study on method for determining optimal number of clusters based on affinity propagation clustering[J]. Computer Science,2011, 38(2): 225-228. (in Chinese with English abstract)
[25] Albalate A, Suendermann D. A combination approach to cluster validation based on statistical quantiles[C]// International Joint Conference on Bioinformatics, Systems Biology and Intelligent Computing, Shanghai: IEEE, 2009: 549-555.
·農(nóng)業(yè)生物環(huán)境與能源工程·
Online fault identification method for supercapacitor group of optimal K-means cluster based on Euclidean distance
Yu Peng1,2, Yang Rengang1※
(1. College of Informɑtion ɑnd Electricɑl Engineering, Chinɑ Agriculruɑl University, Beijing 100083, Chinɑ; 2. College of Engineering, Bohɑi University, Jinzhou 121013, Chinɑ)
Abstract:In order to keep the energy storage system which is based on supercapacitor group with series connection work reliably, the fault groups of supercapacitors are necessary to be identified. A fault state identification method of K-means cluster was presented in this paper. A Euclidean distance index was proposed to choose K value automatically. In this method,the voltage signal data are preprocessed to form the sample array. The singular value decomposition is applied to project out a shadow subset of the sample array. The K-means method is used to cluster the shadow subset for fault state identification. The fault subsets are detected in the cluster result. The largest cluster is identified as normal state and the others are abnormal state. The Euclidean distance index was proposed to decide the optimal K value automatically after enumeration of all possible K. This index is based on the Euclidean distance of pairwise data points and pairwise cluster centers. The minimize value of index is bonded to the optimal K value. Adjustable coefficients are used to improve the adaptability of this index. Based on the principle of K-means cluster method and Euclidean distance index, the fault state identification process was introduced. In this process, after sampling the voltage of supercapacitor cells, the difference voltage array is established to form the feature space. The singular value decomposition is used on the difference voltage array to form the sample subset. The variance of sample subset is compared to set limitation. If the variance overrides the limitation, K-means algorithm will be used to cluster the sample subset, and the Euclidean distance index will be used to decide the optimal K value. By counting the group amount of sample subset, the fault state capacitors can be distinguished. An experiment system was designed to verify the efficiency and validity of the method and index. The experiment environment was MATLAB-Simulink. Two experiments were carried out based on the experiment system. The first experiment was for the comparison of different indices. This experiment was set in randomly charging and discharging situation to approach the actual situations. The optimal K value was picked out from the enumerated values by searching the minimum value of Euclidean distance index. The result collections distinguished the normal and abnormal sets. As this result was the same with the given situation, the effective of Euclidean distance index was proved. The result showed that the proposed character vector exacting method correctly reflected the characteristics of supercapacitor state. Other existing indices were computed out. The comparison of efficiencies among different indices was made. The homogeneity-separation (HS), Calinski-Harabasz (CH) and Krzanowski-Lai (KL) index failed to identify the right group of this case. Hartigan index got the right result. But the Hartigan index also had its drawback in utilities, efficiency and complexity. The second experiment was designed to prove the correctness of the method and index in different working scenarios. In this experiment, 3 groups were set. The 1stgroup included 2 subsets of samples in which the capacitors were charged with different current, the 2ndgroup included 2 subsets of samples in which the capacitors were discharged with different starting voltage, and the 3rdgroup of data included 4 subset of samples in which the capacitors were charged and discharged randomly. The Euclidean distance index indicated that the 1stand the 2ndgroup got the results of 3 subsets. The largest subset was the normal set and the other 2 subsets were abnormal set. The Euclidean distance index showed that the 3rdgroup got the correct results of 2 subsets. All of the experiment groups got the expected result. The results showed that the fault state could be identified correctly through the dynamic cluster method according to the voltage signal of supercapacitor cell. The validity of Euclidean distance index to select the optimal K value of clusters for fault identification was proved. Two main conclusions were drawn in this paper. The first is that the fault state identification method based on K-means cluster can distinguish the normal and abnormal set of serial connected supercapacitors. The second is that the Euclidean distance index can select the optimal K value automatically. The fault identification method proposed in this paper has 2 advantages. The first advantage is that identification of capacitor parameters is avoided. The second advantage is that this method has low dependency on precise of acquisition data.
Keywords:fault detection; signal analysis; models; supercapacitor; dynamic cluster; validity index
通信作者:※楊仁剛,男,遼寧省大連市人,教授,博導(dǎo)。研究方向為供配電技術(shù)。北京中國農(nóng)業(yè)大學(xué)信電學(xué)院,100083。Email:yrg@cau.edu.cn
作者簡介:于鵬,男,遼寧省錦州市人,講師,博士,研究方向為電力電子。錦州渤海大學(xué)工學(xué)院,121013。Email:22419705@qq.com
基金項目:國家863高技術(shù)基金項目(2012AA050217)。
收稿日期:2015-03-06
修訂日期:2015-12-25
中圖分類號:TM53
文獻(xiàn)標(biāo)志碼:A
文章編號:1002-6819(2016)-02-0186-07
doi:10.11975/j.issn.1002-6819.2016.02.027