劉 穎,劉 蕊,李大湘,楊凡超
(1.西安郵電大學 通信與信息工程學院,陜西 西安 710121;2.中國科學院西安光學精密機械研究所, 中國科學院光譜成像技術重點實驗室,陜西 西安 710119;3.西安郵電大學 電子信息現(xiàn)場勘驗應用技術公安部重點實驗室,陜西 西安 710121)
目前已經(jīng)有大量高光譜圖像[1,2]分類算法被提出,基于支持向量機(support vector machine,SVM)的分類算法在訓練樣本有限的情況下表現(xiàn)出良好的分類性能[3]。分類器SVM-CK(support vector machine composite kernel)構造了一系列的復合內(nèi)核用于組合空間和光譜信息[4]。該算法在足夠帶標簽的訓練樣本的情況下有較好的分類結果,但是獲得大量帶標記樣本需要付出很大代價。同步正交匹配追蹤算法(simultaneous orthogonal matching pur-suit,SOMP)模型中,測試像素周圍的小鄰域中的像素同時由標記樣本的線性組合表示[5]。正交匹配追蹤算法(orthogonal matching pursuit,OMP)施加了顯式的平滑約束迫使重構圖像的拉普拉斯變換為零[9]?;谙∈璞硎镜姆诸愶@著改善了分類性能,但也存在著訓練樣本少以及計算成本較高的問題[6]。最近正則化子空間(nearst regularized subspace,NRS)將最近子空間分類和距離加權Tikhonov正則化結合,從每個類中獨立地生成每個測試樣本的近似值,然后根據(jù)近似值最接近的類而得出類標簽[7]。此算法只考慮了高光譜圖像的光譜信息,而忽略了空間信息。基于協(xié)同表示的分類(collaborative representation classification,CRC)的性能優(yōu)于SRC(sparse represent based classification method),且計算復雜度低[8]。在CR的基礎上開發(fā)了聯(lián)合協(xié)同表示(joint collaborative representation,JC-R)分類方法。JCR克服了NRS的劣勢[9],分類時得到了較高的分類精度,其缺點是沒有充分考慮空間信息對分類結果的影響。
上述算法在高光譜分類中都取得了良好的分類結果。但是仍未解決空間信息利用不足的問題。為了進一步提高分類精度,充分考慮空間信息和光譜信息,針對高光譜圖像的特點,在JCR的分類基礎上,提出了空譜聯(lián)合協(xié)同表征的分類算法。該算法首先計算測試像素與訓練像素的歐式距離得出光譜信息,然后再分別計算訓練像素與測試像素的空間距離以及相鄰像素的鄰域信息得出空間信息,最后將光譜和空間信息同時合并到協(xié)同表示框架的正則化項中。
(1)
測試樣本表示為y∈Rd。 對所有訓練樣本通過CR的方法構造測試樣本如下
(2)
(3)
與L1范數(shù)約束的稀疏表示不同的是,協(xié)同表示的系數(shù)被約束成L2范數(shù)。測試樣本的類別是通過類表示殘差的最小值和L2范數(shù)約束來實現(xiàn)的。
高光譜圖像的某一像素的鄰域與此像素的光譜特征相近,因此很可能屬于同一類。JCR通過計算像素與它鄰域的平均值來幫助在空間窗口對中心像素進行分類
(4)
(5)
權重αl可以通過封閉形式的解決方案估計
(6)
訓練樣本近似估計與測試樣本的殘差為
(7)
與傳統(tǒng)的協(xié)同表示模型不同,本文在基于JCR模型的基礎上提出了一種將空間信息和光譜信息融合到正則化項中的模型。第一部分是構造協(xié)同表征的分類模型,將空間位置信息和頻譜信息誘導入正則化項中;第二部分是在以上分類模型的基礎上引入空間鄰域信息。分類的算法流程如圖1所示。
圖1 算法流程
1.3.1 空譜協(xié)同表征高光譜圖像分類算法
傳統(tǒng)的CR模型是通過相鄰的像素的平均值來獲取空間信息,例如文獻[9,10]中的平均像素值。而在本文中,直接在正則化項中添加空間信息和光譜信息,將空間信息結合到正則化項中
(8)
其中,S代表空間信息,D代表光譜信息。S=dist(y-xi) 訓練樣本xi與測試樣本y的位置坐標分別為 (rxi,pxi) 和 (ry,py)。 則兩樣本像素之間的空間距離為D=[dist((rxi,pxi),(ry,py))]。 dist(.) 表示歐式距離。在計算得到S和D的值后,這里需要將S和D的值分別除以max(S)和max(D)。 對S和D進行歸一化,使其值位于(0,1)之間。 diag(SD) 與Γl表示的作用是相似的,S和D的乘積越小,表示測試像素和訓練像素越接近。權重系數(shù)α越小。xi對測試像素做出的貢獻越大。μ是正則化項,來平衡兩項之間的貢獻。在封閉形式的解決方案中得出權重α的解為
α=(xTX+μdiag(SD))xTy
(9)
一旦得出權重,便可以通過以下公式得出測試樣本的類別標簽
(10)
(11)
1.3.2 空譜聯(lián)合協(xié)同表征高光譜圖像分類算法
綜合訓練像素和測試像素的上下文信息,便將空譜協(xié)同表征擴展到中心像素鄰域信息的聯(lián)合空譜表征
(12)
(13)
(14)
(15)
為了驗證所提算法的有效性,利用了兩個經(jīng)典的數(shù)據(jù)集進行實驗,通過與傳統(tǒng)的方法進行比較來評估算法的性能。
印度松樹數(shù)據(jù)集為于1992年由機載可見紅外中心光譜儀傳感器獲取的位于印第安納州的植被圖像組成。該數(shù)據(jù)集有145×145個像素,分類前去除了20個噪聲波段,只留下200個波段可用。它包含了16個地面真實的類,從中選取10%用于訓練,其余作為測試樣本,見表1。
表1 Indian Pines Data的16個類以及 實驗所用的訓練集與測試集
帕維亞大學數(shù)據(jù)集,它覆蓋了意大利帕維亞大學周圍的城市區(qū)域。該圖像是發(fā)射光學系統(tǒng)成像光譜儀(ROSIS-03)傳感器獲得的。圖像的尺寸為610×340。剔除12個噪聲波段剩下103個波段組成圖像。它有9個被標記的真實類。進行實驗時從每類隨機選擇30個作為訓練集,使用其余的進行測試。見表2。
表2 University of Pavia Data的9個類以及所 使用的訓練集和測試集
μ是全局正則化參數(shù),參數(shù)的大小對分類性能至關重要。通常情況下,基于可訓練樣本的留一交叉驗證(LOOCV)和基于訓練樣本的5倍交叉驗證策略都被考慮用于參數(shù)調(diào)整。在確保其它條件相同的情況下,全局參數(shù)對分類結果的影響如圖2和圖3所示。
圖2 不同的正則化參數(shù)μ對Indians Pines 總體分類精度的影響
圖3 不同的正則化參數(shù)μ對Pavia University 總體精度的影響
圖2和圖3表示的是正則化參數(shù)μ的函數(shù)在兩個高光譜數(shù)據(jù)集上OA值的曲線。實驗結果表明,所提出算法的參數(shù)在很大范圍內(nèi)波動。在圖2中Indian Pines正則化參數(shù)的值為11 000時達到了最佳性能,在15 000后隨著參數(shù)的增大,分類性能下降。在圖3中Pavia University數(shù)據(jù)集正則化參數(shù)為15 000時分類精度達到最高,隨著μ的增大,分類精度一直處于上升趨勢。對于其它的分類算法,例如SVM,通過2交叉驗證來確定相關參數(shù)。以下實驗中,所有算法均使用的是最佳的參數(shù)。
在相同的訓練集和數(shù)據(jù)集上驗證不同算法的性能。表3表示不同算法在Indian Pines數(shù)據(jù)集上進行分類的結果。文中算法的分類精度相比較于SVM、SOMP和NRS以及其它算法的分類精度有明顯提高。Pavia University數(shù)據(jù)集的每個類在幾種算法下的分類精度見表4。文中提出的改進算法在類Bare soil、Bitumen、Bricks、Gravel、Meadows、Meta-lsheets 和Sadows上取得了很好的分類效果,總體精度分類相比于SVM-CK提高了4.3%,相比于SOMP提高了22.17%,比算法NRS的分類精度提高了13.99%,同時在JCR 的基礎上提高了1.31%。綜合以上表格分類的結果可以得出結論,上下文的空間信息的引入大大提高了分類性能。在正則化項中加入空間信息對分類精度的提高是有利的。
表3 Indians Pines數(shù)據(jù)集的分類結果
表3(續(xù))
表4 Pavia University數(shù)據(jù)集的分類總體精度
傳統(tǒng)的高光譜圖像分類算法大多考慮光譜信息,但未能充分利用空間信息。因此,并未取得優(yōu)良的分類結果。針對這一問題提出了一種空譜聯(lián)合協(xié)同表征分類算法。該算法充分利用光譜信息和空間信息。通過訓練樣本與鄰近測試樣本的空間距離來進一步表示空間信息,將得到的空間信息與光譜信息融合進分類模型的正則化項中。再通過訓練樣本與測試樣本鄰域信息而獲取空間信息,進一步的提高了分類性能,但是基于空譜聯(lián)合表征分類算法的實驗運行比較費時。運行速度不能令人滿意。在接下來的研究中,針對算法實現(xiàn)的時間問題進行進一步的優(yōu)化,以達到理想的效果。