鄭文煒,王宇華 *,劉芝庭
(佛山科學(xué)技術(shù)學(xué)院機電工程系,廣東佛山528000)
振動和噪聲是家電質(zhì)量檢測中主要的評價指標(biāo)。在當(dāng)今激烈的家電市場競爭中,良好的振動噪音指標(biāo)往往能夠帶來好的品牌口碑,廠商在對家電出廠質(zhì)量檢測時,提出了很高的要求。但是,在對帶有鈑金結(jié)構(gòu)的家電進(jìn)行振動測試時,受鈑金結(jié)構(gòu)的振動特性的限制,質(zhì)檢人員只能通過徒手感受家電外殼不同部位的振動幅度,技術(shù)工作人員大多根據(jù)經(jīng)驗使用傳感器對空調(diào)外機外殼進(jìn)行布點檢測。這種檢測方式存在相當(dāng)大的局限性。
基于以上問題,本文提出使用聚類分析的方法對空調(diào)外機鈑金結(jié)構(gòu)進(jìn)行布點檢測,同時提取各個振動信號的特征值,并將特征值作為分類指標(biāo),使用K-均值聚類法進(jìn)行聚類分析。
所謂聚類分析,就是根據(jù)數(shù)據(jù)的特征將本身沒有任何類別標(biāo)記的集合,安裝某種距離計算方式及距離閥值定義方式,將集合劃分為不同的類。K-均值聚類算法是1967年由J B Macqueen提出的聚類分析算法。該算法首先需要隨機選擇k個樣品作為聚類種子,然后根據(jù)這k個類的重心作為初始的凝聚點,按照距離最近的原則,對除凝聚點外的所有樣品進(jìn)行逐一歸類,直到所有的樣品都被歸類完成,重新調(diào)整聚類中心,并計算各個類的中心距離,直到相鄰兩次的聚類中心不再更改,結(jié)束歸類[1]。K-均值聚類算法最終的聚類結(jié)果在一定程度上依賴于初始聚類中心或初始分類的選擇。
聚類分析采用距離去衡量樣品之間的相似度,常用的距離有明氏距離、馬氏距離及蘭氏距離。先假定具有p個指標(biāo)的單個樣品xi,它的觀測值能夠被表達(dá)為
其中,p個指標(biāo)構(gòu)成了p維的空間,樣品xi就是該空間上的點,所以在這n個樣品間各個點的距離d(xi,xj)就可以用來表示他們之間的靠近程度。
明氏距離可被分為絕度距離、歐式距離及切比雪夫距離,它們的表達(dá)式分別如下
明氏距離是一種常用的距離算法,該距離算法只能在不考慮指標(biāo)之間的相關(guān)性及各個變量測量值無明顯差異時使用。一般使用該距離算法時,必須先將數(shù)據(jù)標(biāo)準(zhǔn)化再進(jìn)行距離計算。
馬氏距離能夠避免指標(biāo)之間的相關(guān)性及量綱影響。并且在對數(shù)據(jù)進(jìn)行線性變換后,馬氏距離不受影響。其表達(dá)式為
由式(5)可知,馬氏距離排除了各個指標(biāo)之間的相關(guān)性干擾,且不受各指標(biāo)量綱的影響。除此之外,將原數(shù)據(jù)做一線性變換后,馬氏距離仍不改變[2]。
蘭氏距離能夠避免被指標(biāo)之間的量綱干擾,其表達(dá)式如下[3]
提取出波形的均方根值、峭度指標(biāo)及相關(guān)系數(shù)指標(biāo)作為聚類分析的指標(biāo)。
均方根值在振動信號中用于表示能量和烈度[4],其表達(dá)式為
峭度是一種用于表示信號波形分布特性的數(shù)值統(tǒng)計量,其表達(dá)式為
相關(guān)系數(shù)用于表達(dá)數(shù)據(jù)間的相似程度,相關(guān)系數(shù)是具有對稱性的介于-1到1的值[5],其表達(dá)式為
對空調(diào)外機正面鈑金結(jié)構(gòu)進(jìn)行多點振動采集,提取采集所得的振動信號均方根值及峭度特征值,結(jié)果如表1和2所示。
表1 均方值指標(biāo)
表2 峭度指標(biāo)
在檢測點中提取頻率成分差異較大的兩個測試點(a0和a7)的振動信號作為參考信號并進(jìn)行傅里葉變換,其波形和頻譜如圖1~4所示。再與其他點的振動信號的頻域進(jìn)行相關(guān)性分析,求出其相關(guān)系數(shù),其結(jié)果如表3和4所示。
圖1 檢測點a0時域波形
圖2 檢測點a7時域波形
圖3 檢測點a0頻譜
圖4 檢測點a7頻譜
表4 標(biāo)準(zhǔn)信號a7頻譜數(shù)據(jù)與其他振動信號頻譜數(shù)據(jù)的相關(guān)系數(shù)指標(biāo)(歸一化)
使用K-均值聚類對以上40個測試點進(jìn)行聚類分析,聚類距離使用歐氏距離,選擇測試點a0、a1、a2、a4、a6、a7、b1、b7、d0和 c3作為聚類的凝聚點,將樣本分為 10 類,其聚類結(jié)果如表 5 所示。
利用式(9)驗證聚類結(jié)果的合理性,于是有其中,a是第i個點與同類的其他點之間的平均距離;b為一個向量,其元素是第i個點與不同類的類內(nèi)各點之間的平均距離;輪廓值 S(i)的取值范圍為[-1,1],S(i)值越大,說明第 i個點的分類越合理,當(dāng) S(i)<0時,說明第i個點的分類不合理,還有比目前分類更合理的方案[6]。在MATLAB軟件中使用silhouette函數(shù)能夠計算輪廓值并繪制輪廓圖,如圖5所示。由圖5可知,分為10類時,每個觀測的輪廓值都大于0.18,這說明將40個樣本分為10類是合適的。
表5 樣本分類表
圖5 輪廓圖
本文通過采集空調(diào)外機鈑金結(jié)構(gòu)在某一工況下的不同位置的振動信號,提取其峭度、均方值及相關(guān)系數(shù)指標(biāo)作為聚類分析的特征值,使用K-均值聚類分析法對信號進(jìn)行聚類。根據(jù)計算得出的輪廓值可知,將40個樣本分為10類是合適的。
[1]范明,孟小峰.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機械工業(yè)出版社,2006:185-217.
[2]韓涵,王厚軍,龍兵,等.基于改進(jìn)馬氏距離的模擬電路故障診斷方法[J].控制與決策,2013,15(11):1713-1717.
[3]李深洛.基于特征的時間序列聚類[D].桂林:廣西師范大學(xué),2014.
[4]陳孝楨.加速度均方值與平均振動能量密度的關(guān)系[J].噪聲與振動控制,1990,12(6):7-10.
[5]趙志宏,楊紹普,申永軍.基于獨立分量分析與相關(guān)系數(shù)的機械故障特征提取[J].振動與沖擊,2013,15(6):67-72.
[6]謝中華.MATLAB統(tǒng)計與應(yīng)用40個案例分析[M].北京:北京航空航天大學(xué)出版社,2010:316-324.