馬如遠(yuǎn),金明亮,劉繼忠* ,柴國(guó)鐘
(1.浙江工業(yè)大學(xué)機(jī)械學(xué)院,杭州310000;2.南昌大學(xué)機(jī)電工程學(xué)院,南昌330031;3.嘉興學(xué)院機(jī)電工程學(xué)院,浙江嘉興314001)
環(huán)境認(rèn)知是通過(guò)圖像傳感器獲取環(huán)境圖像信息,將圖信息像看成一個(gè)數(shù)據(jù)矩陣,通過(guò)計(jì)算機(jī)分析處理,進(jìn)行特征提取和模式識(shí)別,完成相關(guān)后續(xù)任務(wù)(如智能機(jī)器人自主運(yùn)行,智能交通等)的重要舉措。圖像采集部分大多采用DSP與圖像傳感器相連,采集到的數(shù)據(jù)由PC機(jī)進(jìn)行后續(xù)處理。然而采集到的數(shù)據(jù)量龐大,一般都有幾十萬(wàn)到幾百萬(wàn)個(gè)數(shù)據(jù),會(huì)嚴(yán)重影響系統(tǒng)運(yùn)行速度與處理性能,特別是對(duì)嵌入式視覺(jué)系統(tǒng)或處理實(shí)時(shí)性要求較高的視覺(jué)系統(tǒng)。自從2006美國(guó)斯坦福大學(xué)的Donoho和Candès從信號(hào)分解和逼近理論提出了壓縮傳感[1],為這一問(wèn)題的解決提供了新的方法。壓縮傳感將采樣與壓縮結(jié)合起來(lái),有效減少采集的數(shù)據(jù)量,降低系統(tǒng)整體復(fù)雜度,加快系統(tǒng)運(yùn)行速度和提高系統(tǒng)處理性能,但目前壓縮傳感的研究仍還大都集中在不同方法的壓縮傳感及信號(hào)重構(gòu)方面[2-8]。2011年米紅妹[9]針對(duì)雷達(dá)回波壓縮傳感信號(hào)進(jìn)行了低分辨雷達(dá)目標(biāo)識(shí)別研究,Ren Yuemei[10]也對(duì)基于壓縮傳感的空間目標(biāo)識(shí)別進(jìn)行了有益的嘗試,雖然前者是基于雷達(dá)信號(hào)特征的稀疏采樣抽取,后者是通過(guò)稀疏系數(shù)構(gòu)建獲得識(shí)別信息庫(kù),但也從側(cè)面對(duì)直接壓縮傳感信號(hào)特征識(shí)別提供了支持。本文將從提高移動(dòng)機(jī)器人嵌入式視覺(jué)處理速度和實(shí)時(shí)性出發(fā),進(jìn)行機(jī)器人環(huán)境視覺(jué)壓縮傳感信號(hào)直接特征識(shí)別研究。不同于事先路徑規(guī)劃的移動(dòng)機(jī)器人運(yùn)行[11],移動(dòng)機(jī)器人嵌入式視覺(jué)系統(tǒng)處理實(shí)時(shí)性對(duì)于自主運(yùn)行機(jī)器人具有極其重要性,環(huán)境視覺(jué)壓縮傳感信息的直接特征識(shí)別,對(duì)于提高嵌入式視覺(jué)系統(tǒng)處理速度和處理性具有更進(jìn)一步的意義。文獻(xiàn)[12]借用壓縮傳感思想和壓縮圖像矩陣實(shí)現(xiàn)了移動(dòng)機(jī)器人嵌入式視覺(jué)實(shí)時(shí)導(dǎo)航,趙士彬等提出了一種基于壓縮感知的低功耗高效率CMOS圖像傳感器[13],為移動(dòng)機(jī)器人嵌入式視覺(jué)壓縮感知提供了可行性。本文基于正交小波稀疏,通過(guò)道路和草坪典型環(huán)境圖像壓縮傳感直接特征提取識(shí)別與環(huán)境認(rèn)知研究和實(shí)驗(yàn),驗(yàn)證壓縮傳感信息直接特征提取識(shí)別的可行性。
壓縮傳感理論表明:如果原始信號(hào)或圖像具有稀疏表示,通過(guò)合適的優(yōu)化算法,可由少量的采樣值或觀測(cè)值來(lái)進(jìn)行信號(hào)或圖像的重建。其核心思想是將壓縮與采樣合并進(jìn)行,可以大大減少數(shù)據(jù)處理量,一般過(guò)程是:首先采集信號(hào)的非自適應(yīng)線性投影(測(cè)量值),然后根據(jù)相應(yīng)重構(gòu)算法由測(cè)量值重構(gòu)原始信號(hào)。因此,壓縮傳感理論主要包括信號(hào)的稀疏表示、編碼測(cè)量和重構(gòu)算法等三個(gè)方面[14]。
(1)信號(hào)的稀疏表示就是將信號(hào)投影到正交變換基時(shí),絕大部分變換系數(shù)絕對(duì)值很小,所得到的變換向量是稀疏或者近似稀疏的,可看作是原始信號(hào)的一種簡(jiǎn)潔表達(dá),這也是壓縮傳感的先驗(yàn)條件。通常變換基可以根據(jù)信號(hào)本身的特點(diǎn)靈活選取,常用有離散余弦變換基、快速傅里葉變換基、離散小波變換基、Curvelet基、Gabor基以及冗余字典等。
(2)在編碼測(cè)量中,首先選擇穩(wěn)定的投影矩陣,為了確保信號(hào)的線性投影能夠保持信號(hào)的原始結(jié)構(gòu),投影矩陣必須滿足約束等距性RIP(Restricted I-sometry Property)條件,然后通過(guò)原始信號(hào)與測(cè)量矩陣的乘積獲得原始信號(hào)的線性投影測(cè)量。最后,運(yùn)用重構(gòu)算法由測(cè)量值及投影矩陣重構(gòu)原始信號(hào)。
(3)信號(hào)重構(gòu)過(guò)程一般轉(zhuǎn)換為一個(gè)最小L0范數(shù)的優(yōu)化問(wèn)題,求解方法主要有最小L1范數(shù)法、匹配追蹤系列算法、最小全變分方法、迭代閾值算法等。
本文主要針對(duì)自主移動(dòng)機(jī)器人視覺(jué)環(huán)境感知的實(shí)時(shí)性問(wèn)題,對(duì)環(huán)境視覺(jué)壓縮傳感采樣,不經(jīng)過(guò)信號(hào)重構(gòu)過(guò)程,而是基于小波稀疏,直接進(jìn)行典型紋理環(huán)境圖像壓縮傳感信息的特征提取與識(shí)別研究,驗(yàn)證這種方法及提高視覺(jué)處理實(shí)時(shí)性的可行性。
稀疏性是信號(hào)本身的特性,指信號(hào)可由少量的非零元素來(lái)表示。圖像信號(hào)包括已壓縮后的商用編碼標(biāo)準(zhǔn)的JPEG和JPEG2000多為稀疏信號(hào)[15]。設(shè)信號(hào)x是長(zhǎng)度為N的K稀疏信號(hào),那么它則可由冗余基ψ∈RM的K(K?M,M≥C0KlogN)個(gè)基向量的線性組合來(lái)表示,如下式(1)所示。
式中α表示變換系數(shù),α=ψTx。文中采用正交小波基進(jìn)行稀疏,給定基本小波函數(shù)ψ(t),則信號(hào)f(t)的連續(xù)小波變換為:
a為尺度參數(shù),b為平移參數(shù)。
通常小波框架都不是L2(R)的正交基,其信息存在冗余,若小波函數(shù)的伸縮平移系{ψa,b(t)}a,b∈Z是正交系就可以得到無(wú)冗余的小波框架。設(shè)ψ(t)∈L2(R)的一個(gè)可容許小波,若其二進(jìn)伸縮平移系滿足下面關(guān)系:
正交小波提供原始信號(hào)的正交分解,各分解系數(shù)彼此獨(dú)立,從而可以去除冗余,減少數(shù)據(jù)量。由于小波只對(duì)信號(hào)的低頻部分做了進(jìn)一步的分解,而對(duì)高頻部分也即是信號(hào)的細(xì)節(jié)部分不再做繼續(xù)分解,所以小波變換能夠很好表征一大類以低頻信息為主成分的信息,但它不能很好地分解和表示包含大量細(xì)節(jié)信息。數(shù)據(jù)量較大的高頻系數(shù)只是在信號(hào)具有奇異性的地方,其小波系數(shù)模值才顯著大于零,其它地方將非常小甚至為零,小波細(xì)節(jié)的這種特性為信號(hào)壓縮和減少數(shù)據(jù)量提供了可能。與一般小波不同的是,正交小波可以對(duì)高頻部分提供更精細(xì)的分解,而且這種分解是無(wú)冗余的。為驗(yàn)證正交小波稀疏效果,本文首先采用經(jīng)典Lena圖像進(jìn)行了稀疏分析,結(jié)果如圖1所示,可以看出稀疏后的圖像在較小范圍內(nèi)的保留了原始圖像的信息。實(shí)際環(huán)境圖像本文采用表征移動(dòng)機(jī)器人野外運(yùn)行環(huán)境的路面和草坪兩種典型環(huán)境圖像,由于包含了許多邊緣和紋理的重要細(xì)節(jié)信息,采用正交小波稀疏后得到的柏油道路、同類草坪紋理環(huán)境圖像的正交小波稀疏后的圖像分別如圖2和圖3所示。
圖1 Lena圖像正交小波稀疏
圖2 路面圖像正交小波稀疏
圖3 草坪圖像正交小波稀疏
紋理是很多自然景物的一個(gè)重要特征。通常認(rèn)為紋理是指圖像在灰度或顏色分布呈現(xiàn)某種規(guī)律性,這種規(guī)律性在不同類別的紋理中有其不同特點(diǎn)。自然界中的馬路和草地,它們的紋理基元沒(méi)有明確的形狀,而是某種灰度或顏色的分布,這種分布在空間位置上的反復(fù)出現(xiàn)形成紋理,這樣的重復(fù)在局部范圍內(nèi)往往難以體察出來(lái),只有從整體上才能顯露,屬于典型的自然紋理。紋理特征描述對(duì)象物表面的粗糙程度和它的方向性,一般而言,自然紋理圖像通常采用統(tǒng)計(jì)分析方法,主要是基于圖像像素的灰度值的分布與相互關(guān)系,基本原理是選擇不同的統(tǒng)計(jì)量提取紋理圖像的統(tǒng)計(jì)特征。文中采用灰度共生矩陣方法[16],進(jìn)行紋理特征提取,原理方法如下:
設(shè)一幅N×N圖像的在任意一點(diǎn)(x,y)掃描至另外一點(diǎn)(x+a,y+b),若對(duì)應(yīng)的灰度值為(g1,g2),統(tǒng)計(jì)出每一種(g1,g2)值出現(xiàn)的次數(shù),然后排列成一個(gè)方陣,并用(g1,g2)出現(xiàn)的總次數(shù)將它們歸一化為出現(xiàn)的概率p(g1,g2),這樣的方陣稱為灰度共生矩陣。若a=1,b=0,像素對(duì)是水平的,為0°掃描;a=1,b=1,像素對(duì)是右對(duì)角線的,為 45°掃描;a=0,b=1,像素對(duì)是垂直的,為 90°掃描;a=1,b=-1 時(shí),像素對(duì)是左對(duì)角線,即135°掃描。紋理圖像的共生灰度矩陣一般采用下面的四個(gè)主要參數(shù)對(duì)圖像進(jìn)行識(shí)別:
紋理能量:
紋理慣性:
紋理熵:
紋理相關(guān)性:
本文隨機(jī)選取10幅柏油道路、同類草坪環(huán)境圖像,對(duì)小波稀疏后的圖像進(jìn)行了紋理特征參數(shù)提取,結(jié)果發(fā)現(xiàn)此兩類環(huán)境圖像的四個(gè)掃描方向上的同種參數(shù)結(jié)果相近,具有一定的旋轉(zhuǎn)不變性的紋理參數(shù)特征。因此,可取參數(shù)均值ˉE、ˉH、ˉI、ˉC作為圖像認(rèn)知的特征參數(shù)。兩種圖像小波稀疏后的四種特征參數(shù)均值和最大均值誤差如表1所示。
表1 小波稀疏后兩種典型環(huán)境圖像的特征參數(shù)
文中圖像是在智能輪椅移動(dòng)機(jī)器人固定嵌入式視覺(jué)系統(tǒng)與環(huán)境距離,圖像傳感器裝有輔助照明裝置情況下[12]采取得到。為分析日照對(duì)嵌入式視覺(jué)壓縮傳感圖像紋理特征參數(shù)的影響,取不同光照下(稍弱、中等、較強(qiáng))的同一環(huán)境圖像進(jìn)行了小波稀疏壓縮傳感紋理參數(shù)特征提取研究,結(jié)果發(fā)現(xiàn)當(dāng)光照強(qiáng)度增強(qiáng)的情況下,實(shí)驗(yàn)樣本中的紋理慣性I、紋理熵H略有增加,紋理能量E、紋理相關(guān)性C略有減小,當(dāng)光照變化不大的情況下可近似忽略光照影響。
由上述可知,同種環(huán)境壓縮傳感圖像具有相近的特征參數(shù),可取訓(xùn)練樣本特征參數(shù)均值ˉE、ˉI、ˉH、ˉC作為特征判斷閾值,我們將待識(shí)別壓縮傳感環(huán)境圖像的特征參數(shù)與判斷閾值的相近度定義為相似度函數(shù)作為識(shí)別依據(jù)。那么與某種環(huán)境壓縮傳感信息特征閾值相近度越大,越說(shuō)明屬于該種環(huán)境。為使相似度函數(shù)與其數(shù)值結(jié)果相一致,我們?nèi)〈R(shí)別圖像特征參數(shù)與判斷閾值的歐氏距離的倒數(shù)作為相似度判據(jù)函數(shù)FS,即
i表示不同壓縮傳感環(huán)境參數(shù)特征閾值序號(hào),如果該種壓縮環(huán)境圖像的第i個(gè)相似度函數(shù)FS的數(shù)值最大,說(shuō)明待識(shí)別壓縮傳感環(huán)境圖像與第i種特征閾值最為相近,也就說(shuō)明屬于第i種特征環(huán)境,即
FS(i)=max(FS)
?{待識(shí)別環(huán)境∈第i種特征環(huán)境}
本文i取1或,即柏油道路或同類草坪。
隨機(jī)取4幅柏油道路、4幅同類草坪共8幅圖像作為驗(yàn)證樣本,進(jìn)行小波稀疏后分別計(jì)算特征參數(shù)紋理能量ˉE、紋理慣性ˉI、紋理熵ˉH、紋理相關(guān)性ˉC和相似度判據(jù)函數(shù)FS,得到對(duì)應(yīng)8幅圖像的相似度判據(jù)函數(shù)的數(shù)值如表2所示。
表2 壓縮傳感信息典型環(huán)境圖像識(shí)別結(jié)果
由表2結(jié)果可以看出,待識(shí)別圖像與兩個(gè)判據(jù)特征閾值的相似度差別較大,通過(guò)壓縮傳感后的直接信息,可以正確識(shí)別兩種典型環(huán)境,說(shuō)明了通過(guò)壓縮傳感信息進(jìn)行直接環(huán)境認(rèn)知的可行性。下一步可進(jìn)一步研究多類型環(huán)境感知(包括其他不同類型環(huán)境和形狀等其他圖像特征壓縮傳感表征)與嵌入式視覺(jué)處理實(shí)時(shí)性問(wèn)題,以及光照、距離對(duì)壓縮傳感特征表征影響的函數(shù)修正。
為了提高移動(dòng)機(jī)器人視覺(jué)環(huán)境感知處理實(shí)時(shí)性和視覺(jué)系統(tǒng)運(yùn)行性能,文中基于小波稀疏進(jìn)行了兩種典型環(huán)境的壓縮傳感信息直接特征處理識(shí)別研究,結(jié)果表明在小波稀疏下,利用壓縮傳感信息可以直接識(shí)別紋理環(huán)境圖像,為進(jìn)一步的壓縮傳感信息的直接特征識(shí)別和特征保留研究提供了前期基礎(chǔ),為基于視覺(jué)特別是嵌入式視覺(jué)的自主移動(dòng)機(jī)器人環(huán)境認(rèn)知實(shí)時(shí)性問(wèn)題的解決提供了一種新的思路。
[1] Donoho D.Compressed Sensing[J].IEEE Transactions on Information Theory,2006,52(4):1289-1306.
[2] 佘青山,徐平,羅志增,等.一種新的分塊壓縮傳感圖像重建算法[J].東南大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,41(sup):27-31.
[3] 魏苗,練秋生.基于壓縮傳感的寬帶頻譜協(xié)方差感知算法[J].傳感技術(shù)學(xué)報(bào),2011,24(7):1022-1026.
[4] Usman M,Prieto C,Odille F,et al.A Computationally Efficient OMP-Based Compressed Sensing Reconstruction for Dynamic MRI[J].Physics in Medicine and Biology,2011,56(7):N99-N114.
[5] Amini Arash,Marvasti Farokh.Deterministic Construction of Binary,Bipolar,and Ternary Compressed Sensing Matrices[J].IEEE Transactions on Information Theory,2011,57(4):2360-2370.
[6] 練秋生,陳書貞.基于混合基稀疏圖像表示的壓縮傳感圖像重構(gòu)[J].自動(dòng)化學(xué)報(bào),2010,36(3):385-391.
[7] 蘇曉園,練秋生.基于迭代收縮法和三維復(fù)數(shù)小波的視頻壓縮傳感重構(gòu)[J].光電工程,2010,37(2):108-112,121.
[8] 金煒,符冉迪,葉明,等.采用殘差估算的衛(wèi)星云圖壓縮傳感重建[J].應(yīng)用科學(xué)學(xué)報(bào),2011,29(5):495-499.
[9] 米紅妹,邱天爽.基于壓縮傳感特征提取的低分辨雷達(dá)目標(biāo)識(shí)別[J].計(jì)算機(jī)應(yīng)用,2011,31(8):2105-2107.
[10] Ren Yuemei,Zhang Yangning,Li Ying.A Space Target Recognition Method Based on Compressive Sensing[C]//Proceedings-6th International Conference on Image and Graphics,Hefei,China,2011:582-586.
[11]陳世明,聶森,麗楠,等.模糊空間中基于人工勢(shì)場(chǎng)的移動(dòng)機(jī)器人運(yùn)動(dòng)規(guī)劃[J].南昌大學(xué)學(xué)報(bào)(工科版),2010,32(2):192-195.
[12] Liu Jizhong,Wu Xuepei,Xia Jiating,et al.Visual Navigation of a NovelEconomicalEmbedded Multi-Mode IntelligentControl System for Powered Wheelchair[C]//Advances in Neural Network Research and Applications,LNEE,2010,67(6):503-511.
[13]趙士彬,姚素英,徐江濤.基于壓縮感知的低功耗高效率CMOS圖像傳感器設(shè)計(jì)[J].傳感技術(shù)學(xué)報(bào),2011,24(8):1151-1157.
[14] 李樹濤,魏丹.壓縮傳感綜述[J].自動(dòng)化學(xué)報(bào),2009,35(11):1369-1374.
[15]金堅(jiān),谷源濤,梅順良.壓縮采樣技術(shù)及其應(yīng)用[J].電子與信息學(xué)報(bào),2010,32(2):470-475.
[16]彭輝.基于紋理特征的圖像識(shí)別分類[J].計(jì)算機(jī)與信息技術(shù),2007,11:16-20.