賀兵兵 王潤
摘要:圖像匹配是計算機(jī)視覺和圖像處理中一個很重要的研究內(nèi)容。圖像匹配的發(fā)展對圖像分析、導(dǎo)航、目標(biāo)匹配、文字識別等眾多圖像應(yīng)用技術(shù)的發(fā)展都起著十分重要的作用。圖像配準(zhǔn)作為圖像處理這個廣泛的領(lǐng)域,配準(zhǔn)問題一般形式選取一個場景中的兩幅獨(dú)立視圖,然后得到它們之間的對應(yīng)。該文將介紹一些主要的常用配準(zhǔn)技術(shù)及配準(zhǔn)方面主要的問題。
關(guān)鍵詞:圖像配準(zhǔn);關(guān)鍵技術(shù);圖像處理
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2018)03-0175-02
1 圖像匹配
匹配存在的問題遍及人工智能領(lǐng)域,特別是計算機(jī)視覺。其中的緣由很容易理解;許多應(yīng)用的核心部分就是要搜索一個模型,而一幅圖像或者某個圖像衍生物是具體搜索是操作的對象——我們希望將模型和數(shù)據(jù)進(jìn)行匹配。
這個問題在很多方面有具體的表現(xiàn):
1) 最簡單的情況,在合理對齊的文本掃描圖中用已知的二值模式表示的特定字體的字符,這就是模板匹配,應(yīng)用于(Optical Character Recognition,OCR)光學(xué)字符識別。
2) 更一般的情況,字體無關(guān)的OCR要求識別未知字體和大小的字符,這些字符還有可能有扭曲,這就要求匹配字符的模式。
3) 仍然有更一般的情況,人臉識別要求在三維場景中的一幅圖像中匹配人臉模式:姿態(tài)、配準(zhǔn)、尺度、眼睛、顏色信息都將全部未知。
4) 最為抽象的情況,可能需要在一個視頻序列中匹配一個行人,而我們需要找到個體的行為來匹配某種已知的模型,比如行人是否穿過馬路,行為是否可疑等。
2 圖像配準(zhǔn)中常用的技術(shù)
圖像配準(zhǔn)中,由于光照,天氣條件,或者拍攝高度變換的不同,可能造成圖像之間的錯位,為了配準(zhǔn)這些圖像,我們常常要用到一些圖像變換、相似性測度、插值算法等等。
2.1 圖像變換
1) 剛體變換
如果兩點(diǎn)間的距離經(jīng)過變換后仍保持不變,這種變換我們稱之為剛體變換。在二維空間中,點(diǎn)(x,y)經(jīng)剛體變換點(diǎn)(x,y)的變換公式為:
其中為旋轉(zhuǎn)角,為平移向量。
2) 仿射變換
仿射變換:如果圖像上的直線映射后仍為直線,而且直線之間保持著平衡關(guān)系。在二維空間中,變換公式為:
3) 非線性變換
非線性變換:如果待匹配圖像和目標(biāo)圖像上的直線映射后為曲線。在二維空間中,我們可以用以下公式表示:
2.2 相似性測度
1) 互相關(guān)相似性測度
互相關(guān)相似性測度[1]算是最基本的相似性測度了,假設(shè)有模板T和搜索圖S, 表示模板覆蓋下的那塊搜索圖S,公式可以表示為:
2) 序貫相似檢測算法(SSDA)
序貫相似檢測算法[2]實(shí)際上基于互相關(guān)法,基本思路是,設(shè)計一個閾值,在計算相似性時,如果它的累計誤差超過閾值,則停止計算,這樣就可以減少在誤匹配點(diǎn)上的計算量。
公式可以表示為:
2.3 點(diǎn)映射技術(shù)
點(diǎn)映射技術(shù)指的是在不知道兩幅圖像的映射方式時,人們采用最多的配準(zhǔn)方法。點(diǎn)映射經(jīng)常不能確保一定能完全得到配準(zhǔn),我們需要找到圖像內(nèi)在或者外部的特征來作為控制點(diǎn),另一幅圖像中匹配的控制點(diǎn)可以用手工點(diǎn)擊得到或者互相關(guān)自動獲取。在點(diǎn)匹配后,點(diǎn)映射的方法就只剩下插值或者逼近,利用各個階段之間的反饋來找到最優(yōu)的變換,這樣,點(diǎn)匹配的精度就成了最后配準(zhǔn)的精度。
2.4 基于彈性模型的配準(zhǔn)
彈性模型就是對圖像中的變形,利用了一個彈性的變形來模型化,匹配變換就是一個彈性材料經(jīng)過最小的彎曲和拉伸變換的結(jié)果。彈性材料的能量狀態(tài)決定了彎曲和拉伸的量,然而,能量的最小化需要滿足彈性模型的限制,通常這個問題的所作是最小能量狀態(tài)上的求取。
3 圖像配準(zhǔn)研究的問題
(1) 特征空間。配準(zhǔn)時,首先是特征空間的確定。一般有許多的特征可選擇,比如圖像自身的亮度。其次也有其他類似的選擇,比如建筑物的邊沿、表面;顯著的特征也常常用來配準(zhǔn),例如不變矩、重心;也可以是角點(diǎn)、直線交點(diǎn)等。
統(tǒng)計特征是一個區(qū)域的測度,表示一個區(qū)域的估計,顯著的特征通常值得是在圖像中可以容易辨別處理,有意義特征的一些特殊像素。
(2) 相似性度量。設(shè)計或者選擇相似性度量往往是圖像配準(zhǔn)的第二步。這個階段和匹配特殊的選擇有莫大的關(guān)系。相對內(nèi)部結(jié)構(gòu)來說,也就是圖像的不變特征,一般都是通過特征空間和相似性度量提取而得到的。典型的相似性度量有:互相關(guān),相位相關(guān)等
(3) 搜索空間和策略的選擇。由于很多的匹配特征和相似性度量方法需要大量的計算量,所以好的搜索策略能達(dá)到減少計算量的目的,也是圖像配準(zhǔn)中最不可缺少的一步。
4 結(jié)束語
圖像配準(zhǔn)作為計算機(jī)視覺和圖像處理中一個重要的研究內(nèi)容,其技術(shù)的研究與發(fā)展,是對計算機(jī)視覺和圖像處理有著重要的理論與實(shí)踐意義,但是由于成像過程中有著不可預(yù)知因素,一些技術(shù)難點(diǎn)仍需要一代又一代人的繼續(xù)努力。
參考文獻(xiàn):
[1] 山海濤,郭建星,耿則勛.影像匹配中幾種相似性測度的分析[J].測繪信息與工程,2003 ,28(4):11-13.
[2] Barnea D I,Silverman H F.A class of algorithms for fast digital image registration[J].IEEE Trans on Computers,1972(C-21):179-186.