李紅麗, 馬耀鋒
(鄭州工程技術(shù)學(xué)院 機(jī)電與車輛工程學(xué)院, 鄭州 450044)
核學(xué)習(xí)是一種以核函數(shù)和統(tǒng)計(jì)學(xué)習(xí)理論為基礎(chǔ)的機(jī)器學(xué)習(xí)方法[1-2],該方法能將低維映射到高維,并能有效地避免維數(shù)災(zāi)難.核學(xué)習(xí)通常包括核函數(shù)的選擇與構(gòu)造、使用核函數(shù)構(gòu)建分類器兩個(gè)部分[3-4].
支持向量機(jī)[5](support vector machine,SVM)的本質(zhì)為核方法,在解決非線性、小樣本和高維模式識(shí)別問題中表現(xiàn)出了諸多優(yōu)勢[6-8],然而,每一種核具有較大的差異,對(duì)應(yīng)于不同的應(yīng)用場合.目前,尚未出現(xiàn)完備的選擇核函數(shù)的理論依據(jù),因此,選擇與設(shè)計(jì)適合給定問題核函數(shù)是核方法和SVM共同面臨的問題.當(dāng)數(shù)據(jù)樣本存在多維數(shù)據(jù)不規(guī)則、含異構(gòu)信息或高維空間分布不平坦等問題時(shí),難以使用單一的核函數(shù)映射處理所有樣本[9-10].
可見光和紅外傳感器具有不同的感知特性[11-13],可見光傳感器根據(jù)物體的反射率來成像,紅外傳感器則依據(jù)物體的輻射率或溫度來成像.兩者的空間分辨率、灰度差異、邊緣、紋理以及像素間的相關(guān)性都不相同[14-16],可見光圖像具有更多的光譜信息和更高的空間分辨率.
針對(duì)上述問題,本文通過融合可見光和紅外圖像信息以得到更好的特征來提高分類精度,并提出了一種基于多傳感器特征信息融合和混合核SVM的圖像目標(biāo)識(shí)別方法.首先,利用可見光和紅外圖像的互補(bǔ)性,分別提取同一場景可見光與紅外圖像的灰度共生矩陣[17]以及灰度直方圖統(tǒng)計(jì)特征[18-19],從而得到一組目標(biāo)融合的特征量;然后使用主成分分析法降低特征的維度,減少計(jì)算量;最后,提出了一種混合核SVM[20-21]方法對(duì)目標(biāo)特征進(jìn)行分類識(shí)別.
灰度共生矩陣描述了圖像灰度對(duì)出現(xiàn)的概率,反映的是圖像灰度對(duì)變化幅度和偏移量等局部灰度信息.假設(shè)一副圖像有p個(gè)不同的灰度值,則圖像p×p大小的共生矩陣元素可表示為
(1)
式中:I(x,y)為像素點(diǎn)(x,y)處的灰度值;i和j為灰度值大小.本文使用灰度共生矩陣的4種不同特征參數(shù)來表示特征,分別為:
1) 慣性矩陣,其表達(dá)式為
(2)
該特征也稱為對(duì)比度,表示圖像亮度值的對(duì)比情況,也間接反映了圖像的紋理和清晰度.
2) 角二階矩陣,其表達(dá)式為
(3)
該特征反映了圖像紋理的粗細(xì)程度和圖像灰度值的分布情況,其值為各像素點(diǎn)灰度值的平方和.
3) 逆差矩陣,其表達(dá)式為
(4)
該特征反映了圖像紋理的同質(zhì)性,表示的是圖像的局部平穩(wěn)性.
4) 熵,其表達(dá)式為
(5)
該特征表示圖像紋理的復(fù)雜程度,熵值越大表明像素值分布越分散.
圖像的灰度直方圖刻畫了圖像灰度級(jí)的分布情況,其通過統(tǒng)計(jì)圖像中每種灰度值像素點(diǎn)的個(gè)數(shù)來表征圖像的全局特征.紅外和可見光圖像均蘊(yùn)含著大量的灰度信息,也具有豐富的紋理細(xì)節(jié)信息.紅外和可見光圖像及其對(duì)應(yīng)的灰度直方圖如圖1所示.從圖1中可以看出,不同傳感器獲取的圖像具有不同的分布特點(diǎn),凸顯出不同的圖像特征.
圖1 紅外和可見光圖像及其對(duì)應(yīng)的灰度直方圖Fig.1 Infrared and visible images and their corresponding gray histograms
為了更好地刻畫圖像的灰度直方圖統(tǒng)計(jì)特征,本文分別計(jì)算了圖像的均值、方差、峰度和傾斜度,即
(6)
(7)
(8)
(9)
式中:q(g)=Ng/N,g=0,1,…,L-1,為圖像的灰度統(tǒng)計(jì)分布;Ng為灰度值為g的像素點(diǎn)個(gè)數(shù);N為圖像總像素點(diǎn)數(shù).
獲取到圖像的灰度共生矩陣和灰度直方圖統(tǒng)計(jì)特征后,使用串行融合的方式構(gòu)建特征向量.假設(shè)不同像素維度和方向的灰度共生矩陣的特征向量為X1=(x11,x12,…,x1n1),灰度直方圖統(tǒng)計(jì)特征向量為X2=(x21,x22,…,x2n2),則融合后的特征為X=[X1,X2],特征的總維度為n1+n2,本文取值為1 000維.
目前,由于不同核函數(shù)的非線性組合通常導(dǎo)致較高的時(shí)間、空間復(fù)雜度,無法滿足實(shí)時(shí)應(yīng)用,因此,本文使用線性組合的方式構(gòu)建核函數(shù),基于混合核SVM的分類算法流程如圖2所示.通常核函數(shù)的線性組合又包括加權(quán)求和核、直接求和核以及加權(quán)多項(xiàng)式擴(kuò)展核.同時(shí)考慮到具體的數(shù)據(jù)處理要求,決定了核函數(shù)的選取和使用不同的特征時(shí),同一核函數(shù)表現(xiàn)出不同的性能,本文使用加權(quán)求和核構(gòu)造混合核函數(shù),其表達(dá)式為
(10)
式中:kp為核函數(shù);mp為kp所對(duì)應(yīng)的權(quán)重,各種核函數(shù)的權(quán)重總和為1.由文獻(xiàn)[10]可知,式(10)滿足Mercer條件,因此可以用于SVM.根據(jù)式(10)可知,通過調(diào)整權(quán)重值來獲得不同性能的混合核函數(shù),可以更加靈活地調(diào)節(jié)混合核的學(xué)習(xí)能力,提升分類性能.
圖2 本文分類算法流程Fig.2 Flow chart of proposed classification algorithm
由于多核學(xué)習(xí)多采用基本核函數(shù),如表1所示的直方圖交叉核函數(shù)、多項(xiàng)式核函數(shù)和徑向基核函數(shù)等,因此,可以將多核學(xué)習(xí)問題轉(zhuǎn)化為權(quán)重系數(shù)的求解問題.近年來,針對(duì)組合核優(yōu)化的問題提出了諸多解決方法,如文獻(xiàn)[12]中提出了使用一種凸優(yōu)化的方法——半定規(guī)劃(semi definite programming,SDP)求解該問題,SDP可以求解不同核函數(shù)的組合系數(shù),具有較強(qiáng)的泛化能力;文獻(xiàn)[13]中提出了基于序列最小化的方法處理中等規(guī)模的優(yōu)化問題;文獻(xiàn)[14]中使用半無限線性規(guī)劃解決較復(fù)雜的多核學(xué)習(xí)問題;文獻(xiàn)[15]中使用梯度下降法來解決多核學(xué)習(xí)問題,具有較高的效率和更快的收斂速度,該方法又稱為單多核學(xué)習(xí)方法.
表1 核函數(shù)及其表達(dá)式Tab.1 Kernel functions and their expressions
單多核學(xué)習(xí)的求解目標(biāo)為
(11)
式中:wm為權(quán)重量;b為線性分類器的偏移值;F為懲罰因子;ξi為松弛變量;dm為權(quán)重系數(shù);φi(x)為非線性映射核函數(shù).將式(11)拉格朗日化后可以得到
(12)
式中:αi和βi為拉格朗日乘子;λ和ηm為權(quán)重的約束算子.對(duì)wi、b、ξi分別求導(dǎo)并令導(dǎo)數(shù)為零,可將其轉(zhuǎn)化為
(13)
(14)
式中:J(?)為優(yōu)化目標(biāo);?為權(quán)重系數(shù).式(13)對(duì)偶形式為
(15)
即
使用梯度下降法優(yōu)化該問題,得到最優(yōu)解α*,其中梯度求解表達(dá)式為
(16)
不斷更新dm,直至達(dá)到停止準(zhǔn)則,終止該算法,得到最后多核分類器表達(dá)式為
(17)
用上文提出的特征提取、融合與分類方法對(duì)公共場所的人群密度進(jìn)行分類,分別采集商場高峰期和平峰期的920對(duì)490×455像素的紅外與可見光圖片進(jìn)行訓(xùn)練及測試.其中,包括360對(duì)訓(xùn)練圖片和560對(duì)測試圖片,并將人群密度分為低高兩類.本文設(shè)置各特征權(quán)重相同均為1,直方圖交叉核函數(shù)、多項(xiàng)式核函數(shù)和徑向基核函數(shù)的權(quán)重分別為0.3、0.4、0.3,SVM的懲罰因子值為0.1.實(shí)驗(yàn)樣本具體分布情況如表2所示.
表2 采集的樣本分布Tab.2 Distribution of collected sample
為了證明不同特征對(duì)人群密度分類的有效性,分別使用灰度共生矩陣和灰度直方圖統(tǒng)計(jì)特征進(jìn)行測試,測試結(jié)果如表3、4所示.由表3、4可以看出,在低密度人群分類時(shí)灰度共生矩陣的分類效果更優(yōu),而在對(duì)高密度人群進(jìn)行分類時(shí)灰度直方圖統(tǒng)計(jì)特征效果更好.融合兩種特征和PCA降維后的分類效果如表5所示.根據(jù)表5可以看出,本文所提出的方法能有效提高分類精度.
表3 基于灰度共生矩陣的分類結(jié)果Tab.3 Classification results based on gray co-occurrence matrix
表4 基于灰度直方圖統(tǒng)計(jì)特征的分類結(jié)果Tab.4 Classification results based on statistical characteristics of gray histograms
表5 本文方法分類結(jié)果Tab.5 Classification results of proposed method
將本文算法分別與文獻(xiàn)[12]提出的基于小波特征的方法和文獻(xiàn)[19]提出的基于LBP特征的方法進(jìn)行比較,結(jié)果如表6所示.從表6中可以看出,本文算法分類精度更高,提取出的特征相對(duì)較少,平均處理時(shí)間更短.不同算法對(duì)高、低密度人群的具體分類精度如圖3所示,可以看出本文算法對(duì)高密度與低密度人群均具有更優(yōu)的分類精度.本文算法檢測結(jié)果如圖4所示,從圖4中可以看出,本文算法對(duì)各種密度人群都具備較高的檢測精度.
表6 本文算法與其他算法的比較結(jié)果Tab.6 Comparison results of proposed algorithm and other algorithms
圖3 不同算法分類精度比較Fig.3 Comparison in classification accuracy of different algorithms
圖4 本文算法的檢測示例Fig.4 Detection examples of proposed method
由于可見光和紅外傳感器具有不同的感知特性,本文從特征提取和分類器訓(xùn)練兩個(gè)方面提升目標(biāo)識(shí)別的精度.首先結(jié)合可見光和紅外傳感器的優(yōu)勢,分別提取同一場景可見光與紅外圖像的灰度共生矩陣以及灰度直方圖統(tǒng)計(jì)特征,并使用PCA算法融合兩種特征,獲得了更具判別能力的特征和更快的檢測速度;然后提出了一種混合核SVM算法,加權(quán)融合徑向基核函數(shù)、多項(xiàng)式核函數(shù)和直方圖交叉核函數(shù),以提高分類精度;最后將所提出的算法用于人群密度分類問題中,將人群密度分為高密度和低密度兩類.實(shí)驗(yàn)結(jié)果表明,本文所提出的算法具有更高的分類精度以及更快的處理速度.