賈小軍, 鄧洪濤, 滕 姿, 曾 丹
(1. 嘉興學(xué)院 數(shù)理與信息工程學(xué)院, 浙江 嘉興 314001; 2. 嘉興學(xué)院 設(shè)計學(xué)院, 浙江 嘉興 314001;3. 上海大學(xué) 特種光纖與光接入網(wǎng)重點實驗室, 上海 200072)
藍(lán)印花布作為中國最具傳統(tǒng)特色的民間手工藝品,以圖案紋樣造型樸素、粗獷,形式多樣,表現(xiàn)手法簡練,設(shè)計風(fēng)格“筆斷意連”而聞名于海內(nèi)外[1-2]。藍(lán)印花布作為國家非物質(zhì)文化遺產(chǎn)應(yīng)得到更好的傳承與創(chuàng)新。隨著信息技術(shù)的發(fā)展,藍(lán)印花布的數(shù)字化傳承呼聲高漲,數(shù)字化傳承包括藍(lán)印花布的數(shù)字化采集和存儲、數(shù)字化復(fù)原和再現(xiàn)、數(shù)字化展示與傳播、數(shù)字化開發(fā)與創(chuàng)新等[3-4]。數(shù)字化傳承的藍(lán)印花布圖案和通過圖像傳感器采集的圖像具有鮮明的特征[5-7]。藍(lán)印花布圖案包括植物、動物、幾何、文字、符號、器物和人物等題材,以單一、2種或2種以上的題材組合出現(xiàn)。這些圖案以大小、形狀不同的斑點和短線間隔地組成紋樣,以幾何點、線、面為圖案基本元素,通過變化組織而成,形成筆斷意連。
點、線、面是構(gòu)成藍(lán)印花布圖案的基本元素,這些元素的輪廓蘊(yùn)涵了整個作品的信息,提取這些元素的輪廓能夠保留整個作品的結(jié)構(gòu)特點。分離出這些元素,可在此基礎(chǔ)上為重新創(chuàng)作新圖案提供素材,這對藍(lán)印花布的數(shù)字化繼承與創(chuàng)新起著極其重要的作用。
輪廓是物體重要特征之一,用于區(qū)分不同的形狀區(qū)域,在物體檢測中起重要作用,廣泛應(yīng)用于工業(yè)[8-10]、農(nóng)業(yè)[11]、生物醫(yī)學(xué)領(lǐng)域[12-13]。與圖像的其他特征相比,輪廓信息是一個非常穩(wěn)定的特征,相對于照明條件、對象顏色和紋理的變化輪廓信息是不變的,有效地代表了具有較大空間范圍的圖像結(jié)構(gòu)[14-15]。然而,在獲取的原始圖像中,一些重要的形狀輪廓通常被浸沒在紋理豐富或雜亂背景中,僅能觀察到較明顯的局部輪廓區(qū)域,增加了提取難度。傳統(tǒng)的輪廓檢測器主要基于一些低級圖像特征的不連續(xù)性測量,Canny[16]和Arbelaez等[17]利用圖像像素的亮度梯度理論及方法獲取輪廓。梯度信息為局域信息,對圖像噪聲和初始化輪廓敏感,對于復(fù)雜圖像易產(chǎn)生邊界泄露。Chan等[18]提出的分段常數(shù)(CV)模型,能有效地分割含噪聲和弱邊界的圖像,但需要假設(shè)圖像中各區(qū)域灰度是均勻分布的,這種方法其實是一種主動輪廓提取方法。廖祥云等[19]提出了一種引入局部全局信息的區(qū)域自適應(yīng)局域化快速活動輪廓模型,利用灰度分布信息自適應(yīng)地改變局域區(qū)域的半徑大小,進(jìn)而在活動輪廓曲線演化過程中動態(tài)地調(diào)整局域化區(qū)域范圍,以提高分割的準(zhǔn)確性及曲線的演化效率,解決了局部圖像灰度分布不均勻的問題。張桂梅等[20]提出將全局G-L(Grünwald-Letnikov)分?jǐn)?shù)階梯度融合到區(qū)域可調(diào)擬合(region scalable fitting,簡稱RSF)模型中,以增強(qiáng)灰度不均勻和弱紋理區(qū)域的梯度信息,并利用根據(jù)圖像的梯度模值和信息熵構(gòu)建的自適應(yīng)分?jǐn)?shù)階階次以實現(xiàn)輪廓提取,該方法涉及到大量的運(yùn)算,比較耗時。利用信息熵來構(gòu)造自適應(yīng)算子,蔡青等[21]定義了一種新型能量函數(shù)用于輪廓提取。將模糊聚類方法與主動輪廓有機(jī)結(jié)合,孫文燕等[22]提出一種基于模糊主動輪廓的魯棒局部分割方法,利用平均模糊能量函數(shù),通過對演化曲線進(jìn)行形態(tài)學(xué)膨脹和腐蝕運(yùn)算構(gòu)建窄帶,并在窄帶范圍內(nèi)求解模糊能量函數(shù)的最小值來實現(xiàn)局部分割。但這種分割方法易受模型的初始參數(shù)影響,且缺乏平滑約束,不太容易得到連續(xù)平滑的目標(biāo)輪廓。Tian等[23]利用三角形方法逼近跟蹤的邊界得到輪廓,但生成的輪廓線光滑性還需要加強(qiáng)。
要將獲取的現(xiàn)有藍(lán)印花布圖像的所有圖案基元通過信息處理技術(shù)提取出來,作為后續(xù)創(chuàng)作的素材,圖案基元的輪廓提取是其中的一個重要基礎(chǔ)和關(guān)鍵步驟。本文借助輪廓參考點對藍(lán)印花布圖案基元進(jìn)行曲線擬合優(yōu)化,得到光滑、準(zhǔn)確的輪廓曲線。同時,對圖案基元進(jìn)行分割或填充,成為獨(dú)立的基元子圖像,為藍(lán)印花布數(shù)字化圖案的再創(chuàng)作提供了重要的基礎(chǔ)素材。
利用圖像采集設(shè)備獲取藍(lán)印花布的數(shù)字化圖像,具有2個重要特點。
1) 顏色高度保真。得益于圖像采集設(shè)備技術(shù)的發(fā)展,采集的圖像顏色失真度小,圖案清晰。藍(lán)印花布有藍(lán)底白花和白底藍(lán)花2種,有時背景摻雜黑色,但整個圖像輪廓分明。
2) 圖像中的圖案基元輪廓統(tǒng)一,線條清晰,邊界大都圓潤光滑,有少量突兀,并伴有少量污點。
為實現(xiàn)藍(lán)印花布圖案中各基本圖元的輪廓跟蹤,需對圖像進(jìn)行二值化。首先將獲取的初始圖像轉(zhuǎn)變?yōu)榛叶葓D像,然后利用文獻(xiàn)[23]計算出分割閾值T∈(0,255),用式(1)實現(xiàn)灰度圖像的二值化。
(1)
式中:f(x,y)為初始圖像在像素坐標(biāo)(x,y)處的灰度值;F(x,y)為二值圖像像素的值,其值為1表示該像素是圖案基元中的一個像素,其值為0表示該像素不是目標(biāo)像素。
藍(lán)印花布圖像二值化后,某個像素是否為某個基元輪廓的依據(jù)為:如果1個像素非零并且與其連通的區(qū)域至少有1個零像素,則該像素位于輪廓線上。采用八連通域,檢測每個像素和其鄰域的狀態(tài)可以確定輪廓。輪廓線是由若干像素點構(gòu)成,且按一定的方向自動排序(如逆時針)。假設(shè)每張藍(lán)印花布圖像中有k個圖案基元,每個基元產(chǎn)生1個輪廓,整張二值化后的藍(lán)印花布將產(chǎn)生k個輪廓,可用式(2)表示1張藍(lán)印花布圖像中所有圖案基元的輪廓。
(2)
藍(lán)印花布圖案基元的輪廓是由有向像素點構(gòu)成的,是一種初始輪廓線,具有以下特點:輪廓線由單像素組成;由于圖案基元在手工制作中可能存在突兀,例如邊角突出、孤點、重疊等,導(dǎo)致輪廓線不光滑,甚至為偽輪廓。這里的孤點指輪廓線上的像素極少,非需要的圖案基元輪廓需要剔除。在圖像數(shù)字化過程中,可對圖案基元的初始輪廓進(jìn)行改善,以使輪廓線光滑、美觀。借助均值方法,提出一種輪廓線擬合優(yōu)化方法。
給定一個整數(shù)r,稱其為跨度(與當(dāng)前點相隔的像素數(shù)),并且假設(shè)Ip為得到的初始輪廓線Ci中有序像素的索引值,新的輪廓線CNi中的像素坐標(biāo)值滿足式(3),其中N為新的輪廓線的個數(shù)。
(3)
圖1 藍(lán)印花布圖案基元提取過程Fig.1 Processing of extracting image elements for blue calico. (a) Plant pattern; (b) Binarization; (c) Contour with serial number; (d) Sub images of image elements; (e) Enlarged image elements
式中:(xi,yi)表示輪廓線Ci中索引值為i的像素的坐標(biāo);Round (·)為四余五入函數(shù);(xIp,yIp)表示輪廓線CNi中索引值為Ip的坐標(biāo),且F(xIp,yIp)=1。
至于孤立點,可在提取輪廓時設(shè)定一個閾值K,將輪廓線線的像素數(shù)目小于這個閾值的輪廓剔除,其定義如下:
(4)
式中:Num(·)為統(tǒng)計輪廓線上的像素個數(shù);CNl為新生成的第l個輪廓。
圖案基元的提取過程是根據(jù)得到的帶有序號的輪廓圖像,將其按序號順序截取,生成獨(dú)立的基元子圖像并進(jìn)行保存,形成基元子圖庫,為藍(lán)印花布的再創(chuàng)新設(shè)計提供數(shù)字化素材?;獔D像區(qū)域的大小由其輪廓線像素的坐標(biāo)確定,矩形區(qū)域的寬度等于輪廓線像素的x坐標(biāo)的最大值與最小值之差;高度等于輪廓線像素的y坐標(biāo)的最大值與最小值之差。整個藍(lán)印花布圖案基元提取過程如圖1所示。
由圖1可知:圖1(a)為藍(lán)印花布初始圖像,是一張植物紋樣的藍(lán)底白花圖案;經(jīng)過圖像預(yù)處理,得到二值化圖像,如圖1(b)所示;調(diào)用輪廓跟蹤方法,得到二值圖像中各圖案基元的輪廓,利用本文提出的方法進(jìn)行輪廓擬合優(yōu)化,生成帶有序號的圖案基元輪廓,如圖1(c)所示,圖1(c)右側(cè)的圖像為左側(cè)的局部放大圖,可清晰地看到各圖案基元的輪廓線及其輪廓序號;根據(jù)輪廓序號,按序生成基元子圖文件,如圖1(d)所示,圖1(d)右側(cè)的圖像為左側(cè)選中區(qū)域的放大圖像,可清楚地觀察到各基元子圖文件名及基元形狀。為能夠更清晰地觀察藍(lán)印花布中各圖案基元的處理效果,圖1(e)給出了4個圖案基元,其中:第1行第1個圖案基元為專家手工提取的原始基元,第2個圖案基元為二值化結(jié)果,帶有明顯的鋸齒邊緣;第2行第1個圖案基元為輪廓擬合優(yōu)化后的帶序號的圖案基元,第2個圖案基元為提取的優(yōu)化后的圖案基元,邊緣光滑、清晰。
為對藍(lán)印花布圖像的基本圖元進(jìn)行提取,同時分析本文方法的有效性,選取部分掃描后形成的藍(lán)印花布數(shù)字圖像為實驗對象進(jìn)行驗證。實驗中的藍(lán)印花布來自文獻(xiàn)[24],并采用專家手工分割結(jié)果作為基準(zhǔn),如圖2所示。實驗的計算機(jī)環(huán)境為:Intel core i7,主頻3.4 GHz,Windows 7操作系統(tǒng),64位,Microsoft Visual Studio 2008,MatLab R2015b。
圖2 藍(lán)印花布紋樣Fig.2 Patterns of blue calico. (a) Single pattern; (b) Geometric pattern; (c) Flower basket pattern; (d) Text pattern; (e) Plant pattern
將本文方法與Canny、文獻(xiàn)[19]和文獻(xiàn)[23]中提出的輪廓提取方法用于藍(lán)印花布圖案基元的提取,并對其結(jié)果進(jìn)行分析。圖3示出本文方法同其他3種方法在圖2所示5張典型的藍(lán)印花布圖像上的圖案基元提取的結(jié)果。其中,圖3中4個分圖中的A~E表示5張藍(lán)印花布圖像的提取結(jié)果,分別對應(yīng)于 圖2(a)~(e)中的初始圖像。為觀察每種方法提取的效果,在每種方法的右側(cè)給出了提取結(jié)果的局部放大圖,可清晰看到提取的輪廓及輪廓序號,便于了解其光滑特征。并對提取出來的圖案基元輪廓用相應(yīng)的數(shù)字序號進(jìn)行標(biāo)注,表明提取的順序。圖案基元輪廓的提取在圖像上按從左到右、從上到下的順序依次進(jìn)行。
圖4示出了采用4種方法對給定的5組藍(lán)印花布圖像提取圖案基元子圖的結(jié)果。因篇幅關(guān)系,每張圖像的每種方法僅給出16個圖案基元子圖(黑色邊框線包圍而成的矩形框中的各個子圖)。實際上每張圖像生成的圖案基元數(shù)量不止16個,這些基元子圖依次用文件名SImg01.jpg~SImg16.jpg進(jìn)行表示及存儲,對應(yīng)于圖3中各圖案基元的輪廓序號,并且圖4中顯示基元子圖文件時省略了擴(kuò)展名。在分析圖4中生成的基元子圖時,以矩形框為單元:行對應(yīng)于初始藍(lán)印花布圖像處理的結(jié)果,即第 1~5行分別對應(yīng)于圖2(a)~(e)圖像的提取結(jié)果;列代表采用的方法,即第1~4列分別對應(yīng)采用Canny、文獻(xiàn)[19]、文獻(xiàn)[23]和本文方法提取后生成的基元子圖像。
從圖3、4中可看出,Canny是一種比較簡單的輪廓提取方法,較為準(zhǔn)確、快速,但用在藍(lán)印花布圖案基元提取中,存在輪廓線斷裂、背景分割存在噪點、圖案基元提取失敗的問題。對圖2(a)~(e)圖像提取的圖案基元子圖進(jìn)行統(tǒng)計,分別有7、3、10、10、18個圖案基元的輪廓提取失敗。利用文獻(xiàn)[19]和文獻(xiàn)[23]方法進(jìn)行圖案基元提取,均能正確提取出所有的圖案基元輪廓,但文獻(xiàn)[19]是利用局域化信息提取輪廓,輪廓存在明顯的鋸齒,且這種方法計算耗時;文獻(xiàn)[23]是利用邊界點的三角形方法形成輪廓,在保留關(guān)鍵輪廓點的同時,丟棄了部分輪廓像素,因而輪廓是由一些直線段組成,無法準(zhǔn)確、完整、光滑地展現(xiàn)圖案基元的輪廓。綜合分析圖3、4以及圖1(e)的結(jié)果,利用本文提出的方法得到的輪廓線準(zhǔn)確、光滑、圓潤,保留了各圖案基元輪廓像素的特征。
圖3 本文方法同其他3種方法對圖2所示的5張藍(lán)印花布圖案基元的輪廓提取結(jié)果Fig.3 Extracting results of contours of image elements by using our method and other three methods for five blue calico images(Fig.2). (a) Canny method; (b) Reference [19]method; (c) Reference [23] method; (d) This paper′s method
注:圖中第1~5行分別對應(yīng)圖2所示5張藍(lán)印花布。圖4 本文方法同其他3種方法對5張藍(lán)印花布圖案基元提取后生成的基元子圖Fig.4 Generating sub images of image elements after extracting image elements by using our method and other three methods for five blue calico images. (a) Canny method; (b) Reference [19] method; (c) Reference [23] method; (d) This paper′s method
為準(zhǔn)確估計各種輪廓提取算法同專家手工提取效果的定量比較,采用基于面積的DC(dice coefficient)[19]和定義基于輪廓線的CC(contour coefficient)2個評價指標(biāo)進(jìn)行分析,其定義分別如式(5)、(6)所示。
(5)
式中:S1和S2分別代表采用各種輪廓提取算法獲得的結(jié)果和基準(zhǔn);A(·)表示輪廓所包圍的區(qū)域面積(像素點個數(shù))。DC值越接近于1,表明提取效果越好。
(6)
式中:N(·)表示輪廓線上的像素點個數(shù)。CC值越接近于1,表明提取效果越好。
用于評價指標(biāo)的典型藍(lán)印花布圖像共6張,包括圖2中的5張和圖1中的1張,分別對應(yīng)于表1中的A~F。其相應(yīng)的提取效果如表1所示??梢缘贸觯合鄬τ趯<沂止ぬ崛〉膱D案基元輪廓,4種方法得到的DC均接近于1,說明輪廓線所包括的圖案基元形狀非常接近;對于指標(biāo)CC,4種方法差別明顯,這是由其本身算法特性決定的。而本文提出的方法,其DC、CC平均值均高于其他3種方法,提取結(jié)果最優(yōu)。
表1 DC和CC標(biāo)準(zhǔn)下的6張藍(lán)印花布圖案基元輪廓提取的表現(xiàn)Tab.1 Performance of contour extraction of image elements for six blue calico images based on DC and CC
注:F為圖1(a)所示紋樣圖像,表2亦同此。
同時,表2示出4種方法對圖2及圖1中共 6張藍(lán)印花布的圖案基元輪廓提取的計算時間的比較??梢园l(fā)現(xiàn),Canny提取效率最高,但由于Canny本身算法的缺陷(部分圖案基元丟失),該方法不可取。除此之外,采用本文提出的方法的分割效率最高。
表2 4種方法的計算時間Tab.2 Computing time for four methods s
本文提出通過輪廓線擬合優(yōu)化法提取藍(lán)印花布的圖案基元,作為藍(lán)印花布設(shè)計創(chuàng)新素材的方法。利用圖像處理技術(shù),包括灰度化、去噪、二值化、輪廓跟蹤,得到藍(lán)印花布圖案基元的輪廓線,通過提出的輪廓擬合方法獲取光滑、完整的輪廓線,最后提取出圖案基元,生成基元子圖。通過和另外3種方法比較,驗證了本文方法的可行性及有效性,為藍(lán)印花布的創(chuàng)新打下基礎(chǔ)。對于藍(lán)印花布的傳承與創(chuàng)新,今后的研究工作主要集中在以下方面:在提取的圖案基元中,很多是相同或相似的,需要設(shè)計分類器將這些圖案基元進(jìn)行分類,形成基元庫;利用基元庫進(jìn)行藍(lán)印花布的再創(chuàng)作,自動生成新的藍(lán)印花布圖案,實現(xiàn)自動創(chuàng)新。