楊金鋒,李乾司茂,賈桂敏
(中國民航大學天津市智能信號與圖像處理重點實驗室,天津 300300)
近年來,生物特征識別技術成為身份鑒別方法的一個核心研究方向。手指靜脈因其具有唯一性、普遍性、穩(wěn)定性和可度量性以及天然的防偽性和活體性等特點,成為極具應用前景和研究價值的一種生物特征[1-5]。
手指靜脈成像利用近紅外光(NIR,near-infrared radiation)在手指靜脈及其周圍肌肉組織中形成的光吸收差異來成像。在沒有熒光劑的情況下,所獲得的手指靜脈圖像質量較低。造成圖像質量低下的原因有:骨骼和肌肉厚度不同產生的圖像陰影;皮膚表面受可見光影響形成的干涉紋理;光線不均勻,大面積的暗明區(qū)域使得靜脈和背景之間的對比度不高等。這些客觀原因直接造成兩種重要的成像缺陷:①靜脈圖像的退化性模糊;②靜脈血管網絡的局部性殘缺。其中,圖像退化性模糊可采用傳統(tǒng)圖像復原技術來處理,而局部殘缺問題卻無法得到解決,因為生物組織的高散射效應直接造成細小血管無法成像。從識別角度看,決定特征唯一性的恰好是其具有獨特性和復雜性的血管網絡結構。但目前指靜脈識別研究中,在像素層或特征層都沒有從血管內在生成機理和復雜網絡結構的角度進行深入探究。從學科交叉的角度,關注血管結構本身,從根源上探索指靜脈識別問題是有價值的。
自然界中大量存在一種普遍又特殊的幾何結構,即樹狀分叉結構[6]。近年來,相關學者將分形幾何理論作為研究這類復雜結構的理論工具,對血管網的結構特征、血液動力學功能、腫瘤血管生成及腫瘤內物質輸運等問題都進行了大量定量描述及測量工作,提出了血管網、肺氣道、神經網、大腦的褶皺等人體器官結構的數學仿真模型[7-9]。
由于手部血管病變較少,目前尚無針對手部、特別是手指靜脈血管網絡的分形模擬研究,因此對指靜脈圖像進行分形特征研究十分必要。常用的分形特征有分維數、分叉角度、分支血管長度、分叉層數、相似性基本單元等。提取指靜脈血管網絡分形特征對研究指靜脈血管復雜結構有重要意義,并為指靜脈識別和網絡模型重建奠定基礎。
指靜脈原圖首先經過濾波、增強、二值化等預處理,采用計盒維數法提取網絡的分維數。其次提出一種基于二叉樹模型的指靜脈圖像分形特征提取方法,獲取網絡結構的分叉角度、血管長度、分叉層數,分析提取到的所有分形特征,結合已有研究數據,得到指靜脈圖像的分形特征統(tǒng)計結果,如圖1所示。
圖1 分形特征提取流程圖Fig.1 Fractal feature extraction flowchart
在提取分形特征之前,首先要獲取足夠穩(wěn)定的指靜脈主干網絡結構。對手指靜脈圖像進行預處理,指靜脈原始圖像(如圖2(a)所示)經過背景消除、直方圖均衡、中值濾波、歸一化(簡稱濾波)等處理后,主干血管區(qū)域已依稀可見,但受大量噪聲的影響,血管邊緣仍不夠清晰,如圖2(b)所示。為進一步增強指靜脈圖像血管形態(tài)特征,利用靜脈具有的方向性特征,采用基于8方向Gabor濾波器的手指靜脈圖像增強算法[10]對圖像進行增強處理,單尺度多方向Gabor濾波器組為
采用3尺度8方向的Gabor濾波器組對指靜脈圖像進行增強,以獲取穩(wěn)定的主干血管網絡,如圖2(c)所示,將獲取到的血管主干網絡部分作為研究指靜脈血管分形特征的對象。選取合適的σ值以獲得單尺度下的圖像增強結果,所得單尺度下較為復雜的血管網絡如圖 2(d)所示。
圖2 預處理中的圖像增強Fig.2 Preprocessing image enhancement results
利用多閾值分割算法[11],對增強后的圖像進行分割和二值化處理,結果如圖3所示。分割后的二值圖像存在虛假靜脈結構及孔洞,導致細化后的血管結構出現較多毛刺,不利于后期圖像處理。故在細化處理之前先對分割結果去除噪聲、填充孔洞、平滑處理。其中,采用Canny邊緣檢測算法求得血管邊緣圖像,并采用Hildtich算法[12]細化處理,獲得理想的單像素寬度手指靜脈骨架結構。
圖3 圖像二值化、邊緣提取及細化結果Fig.3 Image binarization,edge extraction and thinning results
指靜脈網絡結構具有分形統(tǒng)計自相似的特點,測算指靜脈網絡的分維數用以描述整個網絡的復雜程度,并將其作為后續(xù)指靜脈建模工作的一個重要約束條件。選用3個指靜脈圖像數據庫作為研究對象:數據庫A采集較早,包含585類樣本,每類10張,共5 850張指靜脈圖像,圖像尺寸歸一化后的像素大小為91×200;數據庫B選用山東大學自建庫的100類指靜脈圖像,利用文獻[13-15]中的算法得到對應的指靜脈ROI圖像,每類6張,共600張,尺寸歸一化后的像素大小為116×206;數據庫C為實驗室最新研發(fā)的裝置所采集,共1 000張指靜脈圖像,每類10張,尺寸統(tǒng)一為80×160。
首先,基于圖像數據庫A(隨機選取100類)和B比較計盒維數法、sandbox法[16-17]以及分形布朗隨機場模型法(FBM,fractional Brownian motion)在指靜脈圖像上的分維特征提取的穩(wěn)定性,分別計算3種方法所測分維數據的類內和類間均方差。類內方差越小,則該方法的穩(wěn)定性越好;類間方差越大,則該方法的區(qū)分性越好。由圖4(a)和4(b)可知,計盒維數法最為穩(wěn)定,類內數據波動最小,均方差數值小于0.05,sandbox法的穩(wěn)定性最弱。為進一步比較,計算2個圖像數據庫的類間方差,結果如圖4(c)和4(d)所示。并隨機挑選圖像數據庫A中的1張指靜脈圖像進行預處理,計算3個方法下不同預處理結果的分維數。
結合類內和類間對比結果,發(fā)現2個不同圖像數據庫中,計盒維數法和分形布朗隨機場模型法均較為穩(wěn)定,sandbox法下的數據較為散亂,穩(wěn)定性較弱。不考慮區(qū)分性,并綜合表1所列單張圖片的平均耗時數據,最終選擇耗時短且穩(wěn)定性強的計盒維數法作為指靜脈血管網絡分維數提取方法,以此作為指靜脈模型重建的約束條件。下面對主干血管網絡和復雜血管網絡進行計盒維數提取以及分維數據統(tǒng)計分析。
分維數作為指靜脈血管網絡的全局性生長參數,對描述網絡復雜度起著重要作用,通過研究指靜脈血管網絡從主干生長至復雜網絡的分維數變化范圍,用以控制網絡生長的層數。以下分別從血管網絡的統(tǒng)一性和特異性角度分析A、B、C 3個指靜脈庫的分維特征。
觀察圖5(a),從統(tǒng)一性的角度可明顯看出,3個庫在復雜血管網絡下的分維數都分別大于各自主干網絡的分維數。這一結果驗證了網絡越復雜,層級分支發(fā)育程度越高,分維數就越大。對比主干網絡和復雜網絡的計盒維數結果,隨著網絡復雜度的提高,其分維數波動幅度大幅減小。說明基于主干網絡測算的分維數據,類間的差異性更強。而從特異性角度來看,圖5(b)中各數據庫的類內差值也不同。3個庫的數據值均較為分散,說明就個體而言,血管網絡的分化復雜程度也存在差異。統(tǒng)計主干和復雜網絡的計盒維數差值,其均值區(qū)間在[0.07,0.19]內,可作為基于主干血管網絡重建復原迭代層數的數據參考,描述主干和復原后的復雜血管網絡相差的血管細節(jié)信息,即細小血管重建復雜程度的上下限,可看作統(tǒng)計差異,即血管密集生長的程度和分形級別的差異。分維數作為其中一個重要參數,控制血管的生長限度。
圖4 不同庫下的分維數提取方法對比實驗Fig.4 Experiments of fractal dimension calculation methods under different libraries
表1 單張圖片的3種分維數測算方法對比實驗Tab.1 Contrast experiment of three kinds of fractal dimension calculation methods with one picture
圖5 不同庫下邊緣圖層計盒維數比較Fig.5 Box dimension comparison under different libraries
以上分析了網絡的整體復雜度,以分維數作為重建指靜脈網絡的一個約束條件。但僅由分維數描述血管網絡是不夠的,還需利用網絡的結構特征來更為全面、準確地描述血管。血管所具有的分叉結構是一種高度結合個體差異性和種類統(tǒng)一性的結構。而二叉樹結構是樹狀分叉結構中最典型的一種模式,可以充分描述手指靜脈各個分支的空間分布和相互連接關系[18]。結合血管網絡骨架的基本形態(tài)特征,提出基于指靜脈圖像的二叉樹模型,用于提取指靜脈網絡的分形幾何結構特征。手指靜脈網絡結構比較復雜,包含大量特征信息,其中的血管段是指細節(jié)點之間的曲線段[19]。首先采用文獻[11]中的細節(jié)點提取方法獲取網絡結構中的二分叉點和端點信息,然后找出與所有二分叉點相關聯(lián)的血管曲線段,并將血管段信息進行有序分類和標記,得到此結構的二叉樹模型。模型描述了整個血管網絡的結構,為后續(xù)分形特征提取做好理論準備。
自20世紀以來,人類一直夢想能夠設計出代替手工勞動的各種機械臂.自動化技術的蓬勃發(fā)展使得人類夢想變?yōu)楝F實.機械臂的發(fā)展涉及多種學科,包括機械、電路控制、計算機及仿生學等.目前,機械臂的驅動方式包括氣動驅動、電動機驅動和液壓驅動等[1].氣動驅動方式成本較低、維護方便、質量輕,但是軌跡跟蹤精度低;電動機驅動方式體積較小、結構簡單、價格較低,但是功率質量比不足;液壓驅動方式具有運動精度高、功率質量比大、傳遞負荷和環(huán)境適應能力較強等特點.因此,機械臂驅動方式大多采用液壓驅動,從而掀起了設計者對機械臂液壓驅動方式研究熱潮.
如圖6所示,選取端點(正方形框處)和二分叉點(三角形框處)作為研究對象。通過觀察血管結構,將圖像中的血管類型簡單分為兩類:①連通區(qū)塊具有至少1個二分叉點的血管區(qū)域;②浮游區(qū)塊由2個端點為血管曲線段端點的血管區(qū)域。
圖6 指靜脈圖像的細節(jié)點提取Fig.6 Minutiae extraction of fingerprint images
對于血管連通區(qū)塊,以二分叉點作為曲線段追蹤的出發(fā)點,最終找出以此分叉點建立相關連接的3條血管曲線段,并構成一個二叉樹單元。一幅圖像中單元的個數等同于二分叉點的個數,這樣便將血管網絡以二叉樹單元的方式進行存儲。人體末端組織血管分支總是呈現細長的形態(tài)特征[20],指靜脈血管的生長方向為腕端向指端,設定曲線段追蹤核函數為固定值[8 5 4;9 1 2;7 6 3],如圖 7 中間模塊所示,此核函數代表曲線段追蹤的順序,計算結果越大越優(yōu)先。假設p為任意一個二分叉點,如圖7左側模塊所示,中心點周圍所有值為1的點就是追蹤的目標點,按照右側模塊的計算結果,從小到大依次進行曲線段追蹤,將目標點作為待處理點再次進行判斷和追蹤,直到目標點為二分叉點或端點追蹤結束。對其進行優(yōu)先排序,是為了定義父子血管關系。二叉樹單元的提取結果分別由3 段血管曲線段信息組成,記為 chain1,chain2,chain3。
圖7 基于二分叉點的曲線段追蹤Fig.7 Curve segment tracing based on bifurcation point
對圖6中每個分叉點進行二叉樹單元信息存儲,將獲得的所有曲線段信息記為二叉樹單元鏈路矩陣C。然而對于血管浮游區(qū)塊,需要進行單獨的曲線段追蹤和存儲。血管連通性越好,矩陣C的信息就越豐富,用于表達結構特征的關聯(lián)信息也就越多。每個分叉點對應1個父子層級關系,利用上文所定義的追蹤核函數,結合3條血管曲線段之間的夾角大小關系,定義二叉樹單元的父子血管層級關系:形成的最小夾角所對應的3條曲線段中若出現標記為chain1的血管,則所對應的兩條曲線段為“父血管”,記為“0”;反之,對應的這兩條曲線段同時為“子血管”,記為“1”,這個過程稱為父子標記。對各個二分叉點下的曲線段進行父子標記便可得到二叉樹單元父子層級關系矩陣L。圖6中二叉樹單元的父子層級關系矩陣L如表2所示。
表2 血管父子層級關系矩陣LTab.2 Vascular hierarchical relationship matrix L
利用3.1節(jié)所提出的二叉樹模型,分析指靜脈網絡結構特征,提取血管結構中的血管分叉角度、血管長度以及分叉層數,并進行特征標記,統(tǒng)計分析數據,得到血管結構分形特征的規(guī)律。
1)提取分叉角度 以二分叉點為中心,向外發(fā)散的3條血管曲線段之間的交叉角度稱之為分叉角度。根據生物流體力學模型,可以定義基于二分叉點的由血管曲線段所形成的最小血管夾角,稱之為此二叉樹單元的血管分叉角度,并選取該角度作為夾角統(tǒng)計分析的初始數據。
2)提取血管長度 血管曲線段的長短,即總共包含的像素點數,表征了血管的長度。提取所有血管段的像素數表征其血管長度。
3)提取分叉層數 結合二叉樹單元父子層級關系矩陣L和二叉樹單元鏈路矩陣C中的信息,提取包含整個網絡的層級信息,可對整個血管骨架網絡進行準確的描述。在矩陣C中,兩端都為分叉點的曲線段信息會被同時記錄2次并存儲于不同的二叉樹單元中,通過在矩陣C中找到這些共有曲線段,并對其進行關聯(lián)標記,可獲得一個較為完整的父子層級數據矩陣LN。步驟如下:
第1步區(qū)分連通區(qū)域并標記二分叉點。將二分叉點按照不同的血管連通區(qū)域進行分類,通過父子標記得到各二分叉點之間的父子層級關系,獲得帶有區(qū)域標記的矩陣C和二叉樹單元父子層級關系矩陣L;
第2步獲取同曲線段位置對矩陣SL。對矩陣C進行血管段類型判斷,找出兩端均為二分叉點的曲線段,相應找出此條曲線段在矩陣C中的位置對,并按照順序賦值進行位置對匹配標記,遍歷所有二叉樹單元最終得到位置對矩陣SL;
第3步提取整個網絡的血管分叉層級矩陣LN。結合矩陣L和SL,借助深度遍歷思想,按照區(qū)域順序判斷同曲線段位置對關聯(lián)的所有二叉樹單元之間的關系。假設某網絡的第1個二叉樹單元父子層級數據為[011],其中chain3為同曲線段,層級為1。且其所對應的另一個二叉樹單元的數據為 [0 0 1],對應的同曲線段為chain1,則將層級1賦值給關聯(lián)二叉樹單元的chain1,并進行相對應的層級賦值結果為[1 1 2]。依此層級遍歷法,即可提取整個網絡的血管分叉層數,稱為LN。
以上實現了基于二叉樹模型的指靜脈網絡結構分形幾何特征提取。在此基礎上,將每個樣本所提取到的血管分叉角度、血管長度、分叉層數,利用K-means獲取每種特征的聚類中心及其在該血管網絡中出現的概率,某一指靜脈網絡的分形特征經過聚類后的結果,如表3所示。
表3 K-means聚類結果Tab.3 K-means clustering results
為研究數據庫中每類指靜脈圖像的血管分叉角度、血管長度和分叉層數特征的類間特異性,運用K-means對每類圖像的分形幾何特征進行區(qū)間聚類,分別統(tǒng)計各分形幾何特征在其各聚類區(qū)間的占比,并據此選擇血管重建參數,如表4所示。
表4 不同庫的分叉角度聚類結果Tab.4 Bifurcation angle clustering results of different libraries
由表4可知,不同庫之間的分叉角度聚類結果相差并不大,85°~100°的夾角占比較大,為85%。通過數據集聚類,穩(wěn)定分叉角度范圍在[85°,100°]。將該結果與醫(yī)學研究結果[75°,90°]比對,發(fā)現結果整體上升,原因在于測量的分形特征是基于圖像像素層的結果。
結合分維數統(tǒng)計結果可知,手指靜脈網絡的分維數和分叉角度相對穩(wěn)定,可將分維數作為全局控制參數制約網絡重建的迭代層數,并將分叉角度穩(wěn)定在[85°,100°],在重建時用以控制血管長勢。
同樣地,針對血管長度和分叉層數進行聚類。如表5所示,處于第3類的血管鏈路占比較大,這與血管曲線段分化復雜度相關。且由于實驗所選取的圖像數據庫均只有指靜脈ROI區(qū)域,其首級父血管和末級子血管被截斷,測得的分形特征不能完整地表達整個手指靜脈網結構特征。但僅基于圖像來講,一定程度上表達了靜脈結構的分形特征。
表5 不同庫的血管長度聚類結果Tab.5 Vascular length clustering results of different libraries
觀察表6,基于圖像的靜脈血管網絡分叉層數變化越符合逐級遞增,越能夠體現網絡的完整性和生長良好性。而網絡在某一層級存在大量同級血管,其他級別的血管很少,說明網絡完整性被破壞。通常來講,這種網絡能夠被利用的有用分形信息較少。重建此類網絡需同時結合其他分形特征來進行殘缺復原和重構。
表6 不同庫的分叉層數聚類效果Tab.6 Bifurcation layer number clustering results of different libraries
首先對指靜脈主干網絡結構進行多種分維數測算方法的對比實驗,選擇計盒維數法提取分維數特征,從全局上對血管網絡復雜度進行描述,提供了指靜脈血管主干網絡到復雜網絡生長的數據。其次提出一種基于二叉樹模型的分形幾何特征提取方法,實現了網絡的血管分叉角度、血管長度和分叉層數特征提取,并利用K-means獲取每種特征的聚類中心及其在該血管網絡中出現的概率,較為準確地描述了血管網絡的結構特征。實驗所提取到的分形特征可為指靜脈網絡模型提供基礎數據,從而解決血管網絡局部殘缺問題,有利于提高指靜脈圖像識別精度。
但此分形特征提取方法和實驗都仍有改進空間,為了更加準確地分析和提取血管網絡的分形特征,需采集全手指的圖像庫,提供進一步利用更多的指靜脈分形特征信息,實現指靜脈血管網絡重建。