郝 淼,倪泰樂
(西華大學(xué),四川 成都 610000)
計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)和多媒體技術(shù)近年來不斷發(fā)展,圖像的數(shù)量越來越多,需要處理和接收的圖像數(shù)量非常龐大。在此背景下,亟需一種數(shù)字化圖像目標(biāo)搜索算法優(yōu)化海量圖像的處理速度。但是,由于圖像特征具有差異性和不規(guī)則性,其搜索難度較大。特征增強(qiáng)可以提高數(shù)字化圖像目標(biāo)搜索的精度和效率,因此特征增強(qiáng)是目前圖像搜索和分類亟需解決的問題。
孫元輝等人通過形狀、大小不同的卷積核獲取特征,融合處理所提取的特征,修改卷積網(wǎng)絡(luò)結(jié)構(gòu),利用改進(jìn)后的卷積網(wǎng)絡(luò)處理融合后的特征,并將其輸入單步目標(biāo)檢測(cè)器中,實(shí)現(xiàn)圖像目標(biāo)搜索,該算法沒有對(duì)特征增強(qiáng)處理,目標(biāo)搜索結(jié)果的平均查準(zhǔn)率低、虛警率高。史文旭等人將特征提取模塊引入SSD的金字塔特征層中,提高特征提取能力,融合處理提取的特征,匹配候選框與提取的特征,實(shí)現(xiàn)圖像目標(biāo)搜索,該算法對(duì)目標(biāo)進(jìn)行搜索時(shí),存在目標(biāo)搜索概率低的問題。劉勝昔等人計(jì)算圖像的局部相位特征和局部幅值特征,對(duì)像素在圖像中的局部關(guān)聯(lián)性實(shí)現(xiàn)增強(qiáng)處理,設(shè)定加權(quán)系數(shù),加權(quán)融合處理相位特征和幅值特征,利用融合后的特征完成圖像目標(biāo)搜索,該算法搜索目標(biāo)所用的時(shí)間較長(zhǎng),存在搜索效率低的問題。
為了解決上述算法中存在的問題,提出數(shù)字化圖像目標(biāo)搜索眼動(dòng)特征增強(qiáng)算法。
利用眼動(dòng)特征對(duì)目標(biāo)觀測(cè)時(shí)至少需要兩個(gè)成對(duì)的電極才可以獲得電勢(shì)信號(hào)。目前的臨床醫(yī)療水平還無法直接采集與記錄眼球運(yùn)動(dòng)過程中生成的靜息電勢(shì),一般情況下都是將電極傳感器與皮膚組織接觸,以此來獲取眼動(dòng)信號(hào)。合理分析和處理眼動(dòng)跟蹤數(shù)據(jù),可優(yōu)化其在數(shù)字化圖像目標(biāo)搜索中的應(yīng)用。目前常用的眼動(dòng)跟蹤數(shù)據(jù)處理方法包括三維空間法、掃描路徑法、感興趣區(qū)法和熱點(diǎn)圖法。數(shù)字化圖像目標(biāo)搜索眼動(dòng)特征增強(qiáng)算法采用熱點(diǎn)圖方法在數(shù)字化圖像目標(biāo)搜索過程中獲取眼動(dòng)跟蹤數(shù)據(jù)的特征。
用二維色彩圖像描述熱點(diǎn)圖獲取的眼動(dòng)跟蹤數(shù)據(jù),映射處理掃描路徑、注視持續(xù)時(shí)間和注視點(diǎn)個(gè)數(shù)等數(shù)據(jù),將其轉(zhuǎn)變?yōu)橥该鞫?、顏色等可視化參?shù)
(1)
式中,表示熱點(diǎn)圖中存在的第個(gè)注視點(diǎn)對(duì)應(yīng)的像素累計(jì)透明度;表示第個(gè)注視點(diǎn)在處理過程中的持續(xù)時(shí)間;表示附近像素受注視點(diǎn)影響的最大半徑;表示注視點(diǎn)在熱點(diǎn)圖完全透明狀態(tài)下對(duì)應(yīng)的最小持續(xù)時(shí)間;表示第個(gè)注視點(diǎn)與像素之間存在的距離;表示不透明指數(shù)。累計(jì)透明度在區(qū)間[0,1]內(nèi)取值,通過上述分析可知注視時(shí)間可利用“藍(lán)-綠-黃-紅”的顏色映射得以表示,當(dāng)時(shí)間較短時(shí)對(duì)應(yīng)的顏色為偏冷色,當(dāng)時(shí)間較長(zhǎng)時(shí),對(duì)應(yīng)的顏色為偏暖色。
在熱點(diǎn)圖的基礎(chǔ)上提取眼動(dòng)特征的具體過程如下:
1)顏色特征
為了滿足人眼的感知特點(diǎn),用顏色模型代替熱點(diǎn)圖模式,其中∈[0,1]表示亮度;∈[0,1]表示飽和度;∈[0,360]表示色度。亮度和飽和度在眼動(dòng)熱點(diǎn)圖中不存在區(qū)分性,都是統(tǒng)一的,因此顏色特征可以直接選取色度值,設(shè)表示色度平均值,其計(jì)算公式如下
(2)
式中,表示第個(gè)像素點(diǎn)在眼動(dòng)熱點(diǎn)圖中的色度值;表示像素在熱點(diǎn)圖中的數(shù)量。
2)灰度直方圖
數(shù)字化圖像目標(biāo)搜索眼動(dòng)特征增強(qiáng)算法通過灰度直方圖特征提取方法處理熱點(diǎn)圖,獲取熱點(diǎn)圖中存在的細(xì)節(jié)信息,灰度直方圖()的表達(dá)式如下
(3)
式中,=0,1,…,-1表示灰度級(jí);灰度級(jí)類別數(shù)量用描述;表示灰度級(jí)為的像素在熱點(diǎn)圖中的總數(shù)。
在灰度直方圖的基礎(chǔ)上獲取眼動(dòng)特征:
數(shù)字化圖像目標(biāo)搜索眼動(dòng)特征增強(qiáng)算法通過量子遺傳算法篩選上述過程中提取的眼動(dòng)特征,實(shí)現(xiàn)眼動(dòng)特征的增強(qiáng)。
1)量子比特編碼
利用當(dāng)前遺傳算法對(duì)特征進(jìn)行選擇時(shí),特征被選中和未選中對(duì)應(yīng)的編碼二進(jìn)制狀態(tài)分別為1和0。數(shù)字化圖像目標(biāo)搜索眼動(dòng)特征增強(qiáng)算法通過量子比特編碼選擇眼動(dòng)特征,具體編碼過程可通過下式描述
(4)
式中,(,)表示概率幅,通常情況下符合||+||=1,其中||表示量子比特狀態(tài)為1時(shí)對(duì)應(yīng)的概率,||表示量子比特狀態(tài)為0時(shí)對(duì)應(yīng)的概率。=(,)表示編碼染色體;表示染色體中存在的第個(gè)基因。
2)量子觀測(cè)算子
某一特征被選擇的概率可通過量子比特編碼獲得,量子比特在特征選擇過程中會(huì)轉(zhuǎn)變?yōu)槎M(jìn)制狀態(tài)的0,1,可通過下述公式描述上述觀測(cè)過程
(5)
其中,=1,2,…,,為隨機(jī)數(shù),在區(qū)間[0,1]內(nèi)取值,當(dāng)的值為0時(shí),表明沒有選中第個(gè)基因,當(dāng)的值為1時(shí),表明選中了第個(gè)基因。
3)適應(yīng)度函數(shù)
染色體的有效性可通過適應(yīng)度函數(shù)進(jìn)行評(píng)價(jià),圖像的特征組合對(duì)應(yīng)著基因在染色體內(nèi)的狀態(tài),為了準(zhǔn)確的實(shí)現(xiàn)數(shù)字化圖像目標(biāo)搜索,用圖像搜索準(zhǔn)確率定義適應(yīng)度函數(shù)()
(6)
式中,表示數(shù)字化圖像的數(shù)目;()表示正確搜索圖像的數(shù)量。
特征初選節(jié)點(diǎn)即為特征分類階段,可通過分類器實(shí)現(xiàn)
(7)
4)基因變異及量子旋轉(zhuǎn)門改進(jìn)
利用量子旋轉(zhuǎn)門在量子遺傳算法中實(shí)現(xiàn)染色體的進(jìn)化,算法的收斂性能直接受量子旋轉(zhuǎn)門的影響,通過下式更新染色體
(8)
=(,)×Δ
(9)
式中,(,)對(duì)旋轉(zhuǎn)方向進(jìn)行控制;Δ對(duì)旋轉(zhuǎn)角度進(jìn)行控制。
對(duì)Δ與適應(yīng)度值和進(jìn)化代數(shù)之間的關(guān)系進(jìn)行考慮,數(shù)字化圖像目標(biāo)搜索眼動(dòng)特征增強(qiáng)算法對(duì)量子旋轉(zhuǎn)門進(jìn)行改進(jìn),將適應(yīng)度函數(shù)(·)和進(jìn)化代數(shù)引入新的旋轉(zhuǎn)門中,通過下式計(jì)算改進(jìn)后的旋轉(zhuǎn)角度
(10)
式中,()表示當(dāng)前染色體對(duì)應(yīng)的適應(yīng)度;表示當(dāng)前進(jìn)化代數(shù);()表示最佳染色體對(duì)應(yīng)的適應(yīng)度;表示最大進(jìn)化代數(shù)。
5)量子交叉算子
通過量子交叉操作避免早熟現(xiàn)象的發(fā)生。
采用量子遺傳算法增強(qiáng)眼動(dòng)特征的具體過程如下:
1)輸入眼動(dòng)特征向量,將其劃分為兩個(gè)部分,分別用來測(cè)試和訓(xùn)練;
2)對(duì)種群和進(jìn)化代數(shù)進(jìn)行初始化處理,={,,…,},=0;
3)觀測(cè)初始種群,設(shè)置初始觀測(cè)算子={,,…,},在此基礎(chǔ)上選取眼動(dòng)特征組合;
4)通過分類器對(duì)特征集進(jìn)行訓(xùn)練,建立學(xué)習(xí)模型,并建立適應(yīng)度函數(shù)(),根據(jù)搜索準(zhǔn)確率選取最佳染色體對(duì)應(yīng)的基因位;
5)更新染色體,設(shè)置觀測(cè)算子,對(duì)染色體進(jìn)行量子交叉操作;
6)利用決策函數(shù)跟蹤眼動(dòng)特征
線性判別函數(shù)的表達(dá)式為()=+,其中為分類閾值;為向量權(quán)重。用描述超平面與樣本點(diǎn)之間存在的距離,可通過下式計(jì)算得到
=(+)=|()|
(11)
歸一化處理間隔,獲得幾何間隔
(12)
求取最小‖‖問題可以轉(zhuǎn)變?yōu)榍笕∽畲蠡瘞缀伍g隔問題,設(shè)置約束條件(+)≥1,用極值問題描述線性分類問題
(13)
根據(jù)上述線性分類問題建立Lagrange方程
(14)
式中,表示拉格朗日乘子。
(15)
7)輸出被選中的特征,完成眼動(dòng)特征增強(qiáng)。
為驗(yàn)證數(shù)字化圖像目標(biāo)搜索眼動(dòng)特征增強(qiáng)算法的整體有效性,需要對(duì)數(shù)字化圖像目標(biāo)搜索眼動(dòng)特征增強(qiáng)算法進(jìn)行測(cè)試。
將平均查準(zhǔn)率作為指標(biāo)對(duì)本研究提出的數(shù)字化圖像目標(biāo)搜索眼動(dòng)特征增強(qiáng)算法、文獻(xiàn)[3]算法和文獻(xiàn)[4]算法完成測(cè)試,平均查準(zhǔn)率越高,表明算法提取的特征越精準(zhǔn),平均查準(zhǔn)率測(cè)試結(jié)果如圖1所示。
圖1 平均查準(zhǔn)率測(cè)試結(jié)果
分析圖1可知,隨著圖像數(shù)量的增加,所提方法平均查準(zhǔn)率略微下降,但均保持在80以上;文獻(xiàn)[3]算法和文獻(xiàn)[4]算法在不同圖像數(shù)量下的平均查準(zhǔn)率均低于所提算法;通過上述分析可知,所提算法的平均查準(zhǔn)率最高,表明所提算法的眼動(dòng)特征增強(qiáng)效果好。
將虛警率和目標(biāo)搜索概率作為指標(biāo)對(duì)所提算法、文獻(xiàn)[3]算法和文獻(xiàn)[4]算法的有效性進(jìn)行測(cè)試。
虛警率的計(jì)算公式如下
(16)
式中,表示目標(biāo)數(shù)量;表示正確搜索的目標(biāo)數(shù)量。
三種算法的虛警率測(cè)試結(jié)果如圖2所示:
圖2 虛警率測(cè)試結(jié)果
目標(biāo)搜索概率的計(jì)算公式如下:
(17)
式中,表示目標(biāo)真實(shí)數(shù)量。
三種算法的目標(biāo)搜索概率如圖3所示。
圖3 圖像目標(biāo)搜索概率測(cè)試結(jié)果
根據(jù)圖2和圖3中的數(shù)據(jù)可知,在多次迭代中所提算法的虛警率均低于文獻(xiàn)[3]算法和文獻(xiàn)[4]算法,目標(biāo)搜索概率均高于文獻(xiàn)[3]算法和文獻(xiàn)[4]算法,表明所提算法在數(shù)字化圖像目標(biāo)搜索過程中的性能高,主要是因?yàn)樗崴惴▽?duì)提取的眼動(dòng)特征進(jìn)行了增強(qiáng)處理,利用增強(qiáng)后的眼動(dòng)特征實(shí)現(xiàn)數(shù)字化圖像的目標(biāo)搜索,降低了算法的虛警率,提高了算法的目標(biāo)搜索概率。
為了進(jìn)一步驗(yàn)證數(shù)字化圖像目標(biāo)搜索眼動(dòng)特征增強(qiáng)算法的整體有效性,對(duì)比眼動(dòng)特征增強(qiáng)前后算法的搜索時(shí)間,測(cè)試結(jié)果如表1所示。
表1 搜索時(shí)間測(cè)試結(jié)果
對(duì)表1中的數(shù)據(jù)進(jìn)行分析可知,在相同圖像數(shù)量下,眼動(dòng)特征增強(qiáng)后的目標(biāo)搜索時(shí)間遠(yuǎn)遠(yuǎn)低于眼動(dòng)特征增強(qiáng)前的目標(biāo)搜索時(shí)間,表明增強(qiáng)眼動(dòng)特征可減少數(shù)字化圖像目標(biāo)搜索所用的時(shí)間,驗(yàn)證了數(shù)字化圖像目標(biāo)搜索眼動(dòng)特征增強(qiáng)算法的整體有效性。
在計(jì)算機(jī)視覺領(lǐng)域中目標(biāo)搜索屬于重要研究方向之一,在現(xiàn)實(shí)生活中目標(biāo)搜索技術(shù)被廣泛的應(yīng)用在智能監(jiān)控系統(tǒng)、水下目標(biāo)檢測(cè)和無人駕駛等領(lǐng)域中,具有重要作用。目前數(shù)字化圖像目標(biāo)搜索算法存在平均查準(zhǔn)率低、虛警率高、目標(biāo)搜索概率低和搜索效率低問題,提出數(shù)字化圖像目標(biāo)搜索眼動(dòng)特征增強(qiáng)算法,在數(shù)字化圖像目標(biāo)搜索之前對(duì)提取的眼動(dòng)特征進(jìn)行了增強(qiáng)處理,解決了目前算法中存在的問題,為數(shù)字化圖像目標(biāo)搜索技術(shù)的發(fā)展奠定了基礎(chǔ)。