王 婧,楊 晗
(西南石油大學(xué)信息學(xué)院,四川 南充 637001)
虛擬現(xiàn)實技術(shù)出現(xiàn)在各大博物館、園區(qū)等地,對導(dǎo)覽場景的應(yīng)用十分廣泛。導(dǎo)覽場景出現(xiàn)在生活的各個領(lǐng)域,導(dǎo)致網(wǎng)絡(luò)上出現(xiàn)了海量的虛擬現(xiàn)實導(dǎo)覽場景,如何在海量的導(dǎo)覽場景中尋找自己需要的導(dǎo)覽場景信息成為一項難題[1]。傳統(tǒng)的導(dǎo)覽場景識別方法已經(jīng)無法滿足人們的需求,提出一種新型的導(dǎo)覽場景識別方法變得迫切[2]。
文獻(xiàn)[3]提出基于局部顯著區(qū)域的導(dǎo)覽場景自由切換模式識別方法。由于在識別時未能利用Gabor小波變換法對導(dǎo)覽場景中圖像的紋理特征進(jìn)行提取,所以導(dǎo)致場景自由切換模式識別時的識別效率低,識別時間長。文獻(xiàn)[4]提出核協(xié)同表示下的多特征融合的導(dǎo)覽場景自由切換模式識別方法。由于在識別時未能對導(dǎo)覽場景的圖像元素進(jìn)行歸一化處理,判別能量信息曲線上的顯著峰,導(dǎo)致識別時的識別效率低,識別精度差。文獻(xiàn)[5]提出基于多層次差異圖的導(dǎo)覽場景自由切換模式識別方法。在導(dǎo)覽場景自由切換模式識別是由于未能對顯著峰集合中能量信息的均值與標(biāo)準(zhǔn)方差的計算,從而導(dǎo)致識別時的識別時間長,識別精度低。為解決上述識別方法中存在的問題,提出基于Gabor小波變換的海量虛擬現(xiàn)實導(dǎo)覽場景自由切換模式識別方法。
利用Gabor小波變換法對海量虛擬現(xiàn)實導(dǎo)覽場景的紋理特征進(jìn)行提取[6]。
Gabor小波的本質(zhì)為母小波與Gabor函數(shù)的小波變換。將導(dǎo)覽場景中的圖像尺寸用f(x,y)來表示,B、D分別為導(dǎo)覽場景中的尺度與方向。
設(shè)定BS={0,1,2,…,b-1}為場景中的尺度集合,DS={0,1,2,…,d-1}為場景中的方向集合,那么兩種集合組合在一起就有B×D種尺度和方向的組合個數(shù),而它們的組合集合則如下式所示:
AS={BS0DS0,BS1DS1,…,BSb-1DSd-1}
(1)
式中,AS為方向集合與場景集合的組合集合。
從上述集合中選取m個最大的能量值元素,查找元素中所對應(yīng)的尺度與方向提取紋理特征,依據(jù)尺度與方向的紋理特征構(gòu)造一個圖像標(biāo)識,提取場景中圖像的特征僅為局部特征[7]。場景的能量信息曲線圖如圖1所示。
圖1 能量信息曲線圖
圖中第一條曲線提取的圖像特征是局部的,主要為曲線的第二個峰頂,第二條曲線提取的圖像特征是全局的。為了精確地提取全局的圖像特征,需要對曲線中所有的峰進(jìn)行確定,再將所有的峰進(jìn)行分類,分為顯著峰與干擾峰,確認(rèn)峰的類型如圖2所示。
圖2 確認(rèn)峰類型圖
將圖2中的1看作最小閾限,2作為最大閾限,對應(yīng)的峰值能量則用E*(i,j)來表示,峰的類型則用下式表示:
(2)
式中的1和2需通過先驗知識進(jìn)行確定。
由于顯著峰中存在虛假顯著峰,所以在確定峰集合的過程中要對虛假顯著峰進(jìn)行識別,虛假顯著峰如圖3所示。
圖3 虛假顯著峰示意圖
虛假顯著峰雖然屬于顯著峰但其并不具備標(biāo)識力的尺寸與方向。為了解決虛假顯著峰帶來的影響,引入一種約束條件,若峰值大于0,并且E*(fi+1)≈E*(fi)∧E*(fi)≈E*(fi-1),那么就能夠認(rèn)定該峰屬于虛假峰,不加入峰集。
為了對曲線中的臨界峰進(jìn)行確定,提出一種輔助算法,過程如下式所示:
1)設(shè)定fi為導(dǎo)覽場景中圖像曲線中的起始點,fe則為終點,曲線中的對應(yīng)能量值用E*(fi),E*(fe)分別表示,利用下式對起始點的臨界峰進(jìn)行判斷
DPD=(E*(f3)-E*(f2))/(E*(f2)-E*(f1))
(3)
式中,DPD>0,且E(f3) 2)對終點的臨界峰峰值進(jìn)行識別,過程如下式所示 DPD=(E*(fe)-E*(fe-1))/(E*(fe-1)-E*(fe-2)) (4) 式中,DPD>0,且E(fe)>E(fe-1),E(fe-1)>E(fe-2),這時fe為對應(yīng)臨界峰。 3)通過上式計算,獲取峰值結(jié)果,若能夠確定臨界峰存在,便可將其加入到峰集中。 利用式(2)對顯著峰集合中的元素進(jìn)行能量信息計算,再依據(jù)下式計算能量信息的均值與標(biāo)準(zhǔn)方差,并以此獲取場景中圖像的紋理特征; 最后,根據(jù)獲取的均值與標(biāo)準(zhǔn)方差來確定導(dǎo)覽場景的紋理特征向量[8]。為了防止紋理特征向量出現(xiàn)旋轉(zhuǎn)、平移記憶尺度不變性等問題,對獲取的能量信息進(jìn)行排列并以此為依據(jù)對場景中紋理的特征向量元素排序。 將獲取的場景紋理特征放入構(gòu)建的FLS-SVM分類器中進(jìn)行計算,以此完成海量虛擬現(xiàn)實導(dǎo)覽場景自由切換模式的識別。 基于模糊的最小二乘支持向量機(jī),設(shè)定場景中自由切換模式的模糊樣本為(p1,q1,μ(p1)),(p2,q2,μ(p2)),…,(pn,qn,μ(pn)),其中,i=0,1,2,…,n,樣本的隸屬度為μ(pi),0<μ(pn)≤1,表示導(dǎo)覽場景中圖像紋理特征模糊化后的模糊預(yù)選規(guī)則,衡量其樣本的隸屬類別的可靠程度,同時通過最小二乘支持向量機(jī)的訓(xùn)練過程計算每個訓(xùn)練樣本數(shù)據(jù)的權(quán)重[9]。 在非線性情況下,引入變換機(jī)制φ:Rn→W,將樣本數(shù)據(jù)pn由輸入空間Rn映射到高維特征空間向量w中,構(gòu)建函數(shù)φ(pi),這時FLS-SVM的最優(yōu)分類面的最優(yōu)解則如下式所示 (5) 式中,函數(shù)的閾值為b,懲罰因子是θ,函數(shù)的松弛變量則為εi,所以與上式相對應(yīng)的拉格朗日函數(shù)則如下式所示: (6) 式中,i=0,1,2,…,n,ai為拉格朗日函數(shù)中的系數(shù)。這樣就可以將分類器的優(yōu)化問題轉(zhuǎn)化為線性方程,并對其進(jìn)行求解,過程如下式所示 (7) 式中,Ω中的元素Ωij=φ(pi)φ(pj)=h(pi,qj),a=[a1,a2,…,an],E=[1,1,…,1]T,q=[q1,q2,…,qn]T。 由此,構(gòu)建FLS-SVM分類模型,構(gòu)建過程如下式所示 (8) σ為分類器中的核參數(shù)。將獲取的場景圖像紋理特征放入FLS-SVM分類器中進(jìn)行求解,以此完成海量虛擬現(xiàn)實導(dǎo)覽場景的自由切換模式進(jìn)行識別[10]。 由于識別時,懲罰因子與核參數(shù)的選取較為重要,所以利用自適應(yīng)變尺度混沌算法對場景中的參數(shù)進(jìn)行優(yōu)化。 設(shè)定參數(shù)的適應(yīng)度函數(shù),對分類器中的懲罰因子與核參數(shù)進(jìn)行優(yōu)化,過程如下式所示 (9) 式中,確認(rèn)qi為導(dǎo)覽場景自由模式的期望輸出,x(pi)則為導(dǎo)覽場景中自由模式的實際輸出,e為極小的正數(shù)。 將誤差函數(shù)(MSE)作為分類器的泛化性能評價指標(biāo),對分類器中的訓(xùn)練數(shù)據(jù)M進(jìn)行評價,過程如下式所示 (10) 利用混沌遺傳算法來提高分類器的參數(shù),具體步驟如下所示: 1)對場景中的圖像紋理特征進(jìn)行粗搜索。 首先對場景中r維的連續(xù)空間進(jìn)行優(yōu)化,獲取種群的混沌變量,如下式所示 (11) 為了避免編碼解碼頻繁造成的影響,運(yùn)用實數(shù)位方法對場景中圖像的每條染色體進(jìn)行編碼,利用上述產(chǎn)生的混沌變量對第一代染色體進(jìn)行初始化處理,處理結(jié)果如下式所示 (12) 最后利用線性變換規(guī)則對r組種群規(guī)模中的每條染色體進(jìn)行解空間變換,將其從遍歷空間映射到解空間上,轉(zhuǎn)化為函數(shù)的優(yōu)化問題。染色體概率幅度的解空間優(yōu)化變量如下式所示 (13) 對場景中的參數(shù)進(jìn)行持續(xù)搜索后,可知其最佳染色體的值并無變化,這時留存目前的優(yōu)化變量最優(yōu)解X,結(jié)束參數(shù)的粗搜索過程,進(jìn)入細(xì)搜索階段[11]。 2)細(xì)搜索 首先根據(jù)變量的最優(yōu)解,設(shè)定搜索變量,如下式所示 (14) 式中,ηi是搜索變量中的自適應(yīng)調(diào)節(jié)常數(shù)。利用下式對其自適應(yīng)度進(jìn)行確認(rèn) (15) 式中,d為整數(shù),而細(xì)迭代的次數(shù)則為K。由此可知,隨著細(xì)搜索迭代次數(shù)的增加,自適應(yīng)調(diào)節(jié)常數(shù)ηi會隨之減小,這主要是因為細(xì)搜索初期數(shù)據(jù)a1,a2,…,a2在迭代時需要較大的調(diào)節(jié)常數(shù),隨著細(xì)迭代次數(shù)的增加數(shù)據(jù)的最優(yōu)解將逐漸接近最優(yōu)點,所以在小范圍內(nèi)進(jìn)行細(xì)搜索時需要選擇極小的調(diào)節(jié)常數(shù)[12]。 最后,當(dāng)評價數(shù)據(jù)能夠滿足條件時,輸出最優(yōu)解數(shù)據(jù),即可獲取分類器中的優(yōu)化參數(shù)。提高分類器的導(dǎo)覽場景自由切換模式的識別率。 為了驗證上述識別方法的整體有效性,需對此方法進(jìn)行測試。 采用程序為Visual Studio C++2020、平臺為Eclipse、CPU為Pentium(R)Dual-Core、操作系統(tǒng)為Windows XP、120G硬盤、內(nèi)存為4G、處理器為酷睿i7。 分別采用海量虛擬現(xiàn)實導(dǎo)覽場景自由切換模式識別方法(方法1)、基于局部顯著區(qū)域的導(dǎo)覽場景自由切換模式識別方法(方法2)以及核協(xié)同表示下的多特征融合的導(dǎo)覽場景自由切換模式識別方法(方法3)進(jìn)行測試; 1)利用同一型號的處理器對方法1、方法2以及方法3的導(dǎo)覽場景自由切換模式的識別時間進(jìn)行測試,測試結(jié)果如圖4所示。 圖4 導(dǎo)覽場景自由切換模式識別時間檢測結(jié)果 分析圖4可知,方法1的識別時間明顯優(yōu)于方法2和方法3,并且能夠?qū)⒆R別時間維持在1分鐘內(nèi),與方法2和方法3相比較為穩(wěn)定。這主要是因為方法1在導(dǎo)覽場景自由切換模式識別初期利用了Gabor小波變換法對導(dǎo)覽場景中的圖像進(jìn)行紋理特征提取,從而縮短了導(dǎo)覽場景自由切換模式的識別時間。 2)利用同一型號的處理器,對方法1、方法2以及方法3的導(dǎo)覽場景自由切換模式的識別效率進(jìn)行測試,測試結(jié)果如圖5所示。 圖5 導(dǎo)覽場景自由切換模式識別效率測試結(jié)果 分析圖5可知,方法1的識別效率遠(yuǎn)高于方法2和方法3,雖然方法2的識別效率在測試初期基本可與方法1保持在同一水平上,但是隨著測試次數(shù)的增加,識別效率呈急速下降趨勢。這主要是因為方法1在場景識別時對場景中的圖像元素進(jìn)行了歸一化處理,并以此為基礎(chǔ)對能量信息曲線上的顯著峰進(jìn)行了判別分析,以此實現(xiàn)了導(dǎo)覽場景中圖像的紋理特征提取。增加了識別效率,減少了識別時間。 3)根據(jù)上述的測試結(jié)果對方法1、方法2及方法3的識別精度進(jìn)行測試,測試結(jié)果如圖6所示。 圖6 導(dǎo)覽場景自由切換模式識別精度測試結(jié)果 分析圖6可知,方法1識別精度要高于方法2與方法3,并且能夠?qū)⒆R別的精度穩(wěn)定在80%以上。這主要是因為方法1在導(dǎo)覽場景自由切換模式識別時,通過對顯著峰集合中能量信息的均值與標(biāo)準(zhǔn)方差的計算,獲取導(dǎo)覽場景中圖像的紋理特征。從而使導(dǎo)覽場景自由切換模式在識別時能夠縮短識別時間,提高識別精度。 近年來隨著虛擬現(xiàn)實技術(shù)的出現(xiàn),海量的虛擬現(xiàn)實導(dǎo)覽場景充斥在網(wǎng)絡(luò)里,人們需要花費(fèi)較長的時間尋找自己需要的導(dǎo)覽場景,導(dǎo)覽場景的識別方法對人們來說就變得尤為重要。針對傳統(tǒng)方法在識別時出現(xiàn)的識別時間長、識別效率差、識別精度低的問題,提出一種基于Gabor小波變換的海量虛擬現(xiàn)實導(dǎo)覽場景自由切換模式的識別方法。該方法首先利用Gabor小波變換法提取導(dǎo)覽場景中的圖像的紋理特征,再依據(jù)支持向量機(jī)與模糊遺傳算法構(gòu)建FLS-SVM分類器,最后將獲取的紋理特征放入分類器中進(jìn)行求解,以此完成對導(dǎo)覽場景的識別。由于構(gòu)建的分類器不是特別穩(wěn)定,所以今后會根據(jù)這一缺陷繼續(xù)對FLS-SVM分類器進(jìn)行優(yōu)化。3 導(dǎo)覽場景自由切換模式識別
3.1 FLS-SVM分類器
3.2 參數(shù)優(yōu)化
4 實驗
4.1 實驗環(huán)境
4.2 實驗結(jié)果與分析
5 結(jié)束語