牟加俊,王 建,何宇清,龐彥偉
(天津大學 電子信息工程學院,天津 300072)
中國畫(簡稱國畫)是中華民族傳統(tǒng)的繪畫,它歷經數千年的文化積累和發(fā)展,已成為中華民族獨特的文化瑰寶之一。國畫是用毛筆、墨在宣紙、絹帛上作畫,它講究筆墨,著眼于用筆墨造型。國畫門類多樣、異彩紛呈,從繪畫種類上分為山水畫、花鳥畫和人物畫。在畫面的構成上,中國畫講究詩、書、畫、印交相輝映。古代璽印有官印和私印之分,其中古畫中的印章以私印為主,用來表現(xiàn)書畫作者或者收藏者姓名及別號等信息。因此,從國畫圖像中自動分割并識別印章信息,對于實現(xiàn)基于內容的國畫圖像檢索與分析是非常必要的。
國內外有關印章處理的工作主要集中在商業(yè)票據或公文身份有效憑證等。Fan和Tsai較早的開展了印章自動識別技術的研究[1],他們根據筆畫拓撲結構的相對穩(wěn)定性提出基于筆劃骨架匹配的決策方法,先將印章圖像做細化和旋轉處理,然后利用距離權相關算法計算預留印章與待識別印章的相似度,這種方法缺點是要求印章的邊框必須是直線且沒有間隙,不能鑒別圓形印章。在前一種方法的基礎上,Chen和Tsai采取廣義霍夫變換(GHT)獲取印章配準的參數[2],該方法可以處理任意形狀的印章,但GHT的計算量太大,其時間復雜度很高。Chen提出了一種基于坐標變換的印章識別方法[3],將二值化后的印章圖像由外向內進行掃描,找到4個切點,從而確定包含印章區(qū)域的最小圓,計算出印章圖像的中心點。再將直角坐標空間變換到極坐標空間,確定預留印章中的像素點與進行旋轉θ角后的匹配程度。匹配后將印章圖像沿著θ軸分為K塊,通過每個塊中相匹配的像素點來計算其匹配值。這種方法同樣受圖像質量影響較大,僅適用于方章和圓章,計算量也很大。Soria等提出了一種基于色調特征的彩色文檔圖像中提取官方印章的方法[4],作者綜合利用色度、飽和度和亮度等信息。基于對個人提交的稅務表格數據的印章處理結果,驗證了所提方法的有效性。Wang等提出了基于顏色信息的銀行票據文檔的印章提取方法[5],他們首先使用K均值算法從背景中分離印章區(qū)域,然后使用最近鄰分類器去除印刷文字,并借助后處理過程改進分割結果。除上述外文文獻之外,還有一些中文文獻也討論了印章檢測與識別問題,如基于Fourier描述子的方法[6],基于極坐標系和小波多尺度分解的方法[7],多特征支持向量機(SVM)[8],基于旋轉不變特性的方法[9],形態(tài)學top?hat變換[10]。
分析國內外印章處理相關文獻,總結出已有方法存在以下2個問題:一是沒有專門針對國畫圖像(特別是古畫圖像)印章區(qū)域分割與提取方法;二是現(xiàn)有方法都假定印章區(qū)域顏色保持一致,形狀完整,沒有考慮單個印章顏色特征存在差別,印章筆劃斷裂等不良情況,而這兩種情況在古畫圖像的印章區(qū)域經常出現(xiàn)。受國畫顏色退化、印章雕刻方式、印泥材質等不同情況的影響,古畫圖像中的印章保存完好程度不盡相同。本文提出了一種針對古畫圖像的紅色印章自動定位算法,目的是從視覺質量下降的古畫圖像中定位方形或圓形紅色印章區(qū)域,為后續(xù)的印章分割和識別做好準備。
通過觀察古畫圖像中的各類印章,總結出下述印章區(qū)域具有的三類特征:
顏色特征:古畫所用印泥以朱砂印泥為主,呈現(xiàn)為高飽和度的鮮紅色。
形狀特征:古畫中的印章以方形(包括正方形和長方形)和圓形為主,少量的是特殊形狀(如葫蘆形等)。
邊緣特征:印章雕刻方法分為陽刻和陰刻兩種情況,古畫中這兩類印章的附近區(qū)域都含有豐富的邊緣特征。
所提算法綜合使用上述三類特征用于印章分割。圖1所示為所提方法的框圖,它包括偏色校正、印章檢測和印章驗證三個步驟。首先針對古畫圖像普遍存在的偏色情況,通過分析背景區(qū)域的主顏色,對古畫進行偏色校正;接下來根據印章的顏色特征,提取紅色增強分量圖,檢測潛在的印章區(qū)域;最后利用印章的形狀區(qū)域和邊緣特征,準確定位印章。所提算法的詳細實現(xiàn)過程在以下各子節(jié)中介紹。
圖1 所提古畫印章分割算法框圖
由于存放年代久遠,以及存放方式和環(huán)境的影響,古畫圖像普遍存在褪色、偏色等顏色退化情況。為了提高印章區(qū)域分割的性能,有必要對古畫圖像進行偏色校正,盡量恢復印章區(qū)域原有的顏色特征。
所提方法在YCbCr顏色空間進行偏色校正。首先使用下式將輸入圖像從RGB空間轉換到YCbCr空間:
在YCbCr空間中,Y表示亮度分量,Cb和Cr分別代表藍色和紅色偏移量。通過觀察發(fā)現(xiàn),前景與背景區(qū)域的Y值差別明顯。所提算法使用Y分量將古畫圖像劃分為前景和背景區(qū)域。具體的做法是:計算Y分量的直方圖,用H(Y)表示;采用經典的Otsu方法,計算閾值T1;將Y值大于T1的點劃歸為背景區(qū)域,并用W表示背景區(qū)域。接下來,計算W內各點Cb和Cr的平均值,分別用和表示,即有:
式中N表示W中像素數的總數。
假定國畫背景區(qū)域是沒有顏色的,即滿足Cb=Cr=128。用(Cb′,Cr′)表示調整后的兩色度通道值,處理過程如下式所示:
圖2所示為背景偏色校正過程示例。其中,圖2(a)為宋徽宗趙佶所畫《鸜鵒圖》的局部彩色截圖,圖中含有18枚印章,其中方形印章13枚,圓形印章5枚,各印章的尺寸差別明顯。圖2(b)是(a)對應的背景區(qū)域二值圖,其中黑色代表背景區(qū)域。圖2(c)是使用式(3)對圖2(a)進行偏色調整的結果,其中Y分量保持不變。
圖2 背景偏色校正過程示例
所提算法使用顏色特征初步定位印章區(qū)域。首先,根據Cr和Cb分量,使用式(4)計算紅色分量增強圖像,用Er(x,y)表示,即有:
根據前面的分析,國畫中的印章筆劃呈現(xiàn)紅色,印章筆劃像素點的Cr取值較大,而Cb取值較小。根據式(4),印章像素點的Er值較大。所提方法采用無監(jiān)督K均值分類算法,使用Er作為特征量分為3類,將類心值最大的一類標記為印章區(qū)域。圖3(a)所示為圖2(a)圖像對應的印章區(qū)域初定位結果,其中白色區(qū)域對應于印章區(qū)域。
受到印章顏色退化、圖像折痕等情況的影響,檢測到的印章筆畫可能存在斷裂或缺損情況,導致部分印章筆劃漏檢。另外,古畫中的紅色衣物或花瓣的顏色與印章顏色非常接近,這類對象常被誤檢為印章區(qū)域??紤]到古畫中的絕大部分印章區(qū)域是方形或者圓形,所提算法引入后處理過程,根據印章的邊緣和形狀特征,去除漏檢和誤檢,精確定位印章區(qū)域。
首先,所提算法使用形態(tài)學操作處理印章筆劃斷裂和缺損情況。具體的做法是:
(1)使用半徑為2的“diamond”算子對初定位結果進行膨脹處理;
(2)填充膨脹結果中印章區(qū)域內的空洞,處理結果用S表示。
接下來,所提算法使用形狀特征去除誤檢區(qū)域。共使用4種結構特征,即面積、寬高比、矩形率和圓形率。用Wi表示S中某個印章區(qū)域,下標i表示該區(qū)域的序號。各種結構特征定義為:
基本特征:Wi的面積定義為Wi內像素點的總數,用AREAi表示。用 TOPi和 BOTi表示 Wi的上、下邊界,它們定義為Wi內各像素點水平方向坐標值xi(n)的最小值和最大值;用LETi和RGTi表示Wi的左、右邊界,它們定義為Wi內各像素點垂直方向坐標值yi(n)的最小值和最大值。Wi的外接矩形定義為其上、下、左、右四個邊界所圍成的矩形區(qū)域。Wi的寬度定義為WIDi=|RGTi-LETi|,高度定義為HETi=|BOTi-TOPi|。用MXi和MYi表示區(qū)域Wi內各點坐標值xi(n)和yi(n)的平均值,定義Wi的中心為Ci=(MXi,MYi)。計算Wi內各點到Ci的街區(qū)距離,Wi的半徑等于最大距離。定義Wi的周長Pi定義為其8連通約束下的外邊界所含的像素數。
寬高比(Width and Height Ratio,WHR):Wi的寬高比定義為寬度和高度的比值,即WHRi=WIDiHETi。
矩形度(Rectangularity,RET)矩形度定義為區(qū)域的面積與其最小外接矩形面積的比值。矩形度反映了物體在最小外接矩形中的填充程度,矩形的矩形度為1,圓形的矩形度為p 4,三角形的矩形度為0.5??紤]到古畫圖像中印章區(qū)域都是按照垂直或者水平方向排列的,每個印章區(qū)域的最小外接矩形與其外接矩形相同。因此有RATi=AREAi/(HETiWIDi)圓形度(Circularity,縮寫為CIR)圓形度反映了物體接近于圓形的程度,它定義為4p倍的面積區(qū)域與周長的平方之比,即有CIRi=4pAREAi/Pi。圓的圓形度為1,正方形的圓形度為p/4。
使用上述結構特征,制定下面4個約束條件。
(1)條件 1:AREAi>T2;
(2)條件 2:T3<WHRi<T4;
(3)條件 3:RA Ti>T5;
(4)條件 4:CI Ri>T6。
條件1描述的是對印章區(qū)域面積的約束,用來去除面積過小的干擾區(qū)域,所提算法取T2=50。條件2描述了對Wi寬高比的約束。對于正方形和圓形情況的印章,其寬高比接近于1。但對于長方形印章情況,其款高于可能大于或者小于1。因此應適當放寬對寬高比的約束,所提方法選取T3=0.33,T4=3。條件3和條件4用來區(qū)分方形印章和圓形印章。
根據矩形度(RET)和圓形度(CIR)的定義,方形印章(包括正方形和長方形)的RET應為1,圓形印章的CIR為1。但考慮到圖像掃描過程中產生的變形,圖像本身存在遮蔽或缺損等因素的影響,導致各印章區(qū)域RET或CIR小于1。為減少漏檢,閾值T5和T6的取值不能太大,所提方法取T5=T6=0.66。所提算法使用兩個步驟完成印章區(qū)域驗證過程:(1)將不滿足條件1和條件2去除干擾區(qū)域;(2)將剩余的候選區(qū)域使用條件3和條件4進一步進行判別并區(qū)分印章類型,即如果滿足條件3,則判為方形印章;如果滿足條件4,則判為圓形印章。
圖3給出基于形狀特征的印章區(qū)域驗證過程。其中,圖3(a)所示為圖2(a)所示圖像對應的印章檢測區(qū)域二值圖。圖3(b)是形態(tài)學膨脹結果,圖3(c)所示為使用形狀特征進行印章區(qū)域驗證的結果,其中方形印章和圓形印章分別用“口”和“O”標出。從實驗結果來看,實驗成功檢測并提取出了原圖像中不同尺寸18個印章中的17個,而且能夠準確區(qū)分方形印章和圓形印章。惟一一個沒有被正確檢測的是原圖中右下角的正方形印章。通過比對輸入圖像發(fā)現(xiàn),該印章的紅色特征退化情況嚴重,篆刻方式為陽刻,印章區(qū)域內部的筆劃稀疏,導致在印章區(qū)域驗證過程中,條件3和條件4都不滿足,最終導致該印章區(qū)域被漏檢。
本實驗選用30幅古畫圖像作為實驗素材,全部圖像從網絡下載得到,其中絹質圖像18幅,紙質圖像12幅。采用人工方式從古畫圖像中提取印章區(qū)域,共得到212個印章區(qū)域,其中包括各種尺寸的方形印章168枚,圓形印章37枚,其他形狀印章7枚。在全部印章212個印章中,陽刻印章133枚,陰刻印章79枚。采用所提算法檢測并分割各圖像中的印章,并與人工提取結果進行比較,表1列出了檢測結果。
圖3 印章區(qū)域驗證過程示例
表1 印章區(qū)域檢測結果
由表1可見,所提算法的總查全率為93.4%,其中方形印章的查全率最高,約為95.8%,圓形印章的查全率約為91.9%,其他形狀印章查全率較低,只有42.8%。
通過分析實驗結果,總結導致印章漏檢的三種情況,一是印章顏色退化嚴重,部分區(qū)域被背景顏色掩蓋;二是受到畫面折痕,以及畫面其他內容的遮蔽等情況,導致本來連續(xù)的印章區(qū)域被劃分為多個小區(qū)域;三是特殊形狀的印章,如葫蘆形。
圖4給出部分印章正檢和漏檢實例。為顯示方便,截取部分圖像區(qū)域顯示,圖4(a)中正確檢測到的方形和圓形印章區(qū)域分別用“口”和“O”標出,其中右圖右下方有圖像部分區(qū)域被誤檢為圓形印章區(qū)域。
圖4(b)左圖中紅色圖中最下方的兩個方形印章沒有正確檢出,其中左側漏檢的印章是因為印泥顏色不夠鮮艷,與背景顏色接近,右側漏檢的印章受到畫中水墨顏色的影響,導致部分印章筆劃存在斷裂。右圖中右下方的葫蘆形印章屬于特殊形狀情況,未被正確檢出。
表2分別列出不同雕刻類型印章,以及不同材質古畫圖像印章的檢測結果。結果顯示,陰刻印章的查全率比陽刻印章高出約5%,這是因為陰刻印章的紅色區(qū)域占整個印章區(qū)域的比重更大,更不容易收斷裂、缺損等不良情況的影響。另外,所提算法對不同材質古畫圖像的印章定位性能存在差別,紙質材質古畫的印章檢測結果略高于絹質材質古畫,這是因為絹質古畫背景顏色偏色情況更嚴重,印章區(qū)域更容易和背景顏色混淆,導致更多的印章區(qū)域漏檢。
圖4 正確檢測和漏檢情況示例
表2 不同材質古畫印章檢測結果
提出一種基于多特征的中國古畫印章定位算法。該方法綜合利用了印章的顏色、形狀和邊緣特征,包括背景偏色校正、基于顏色特征的印章區(qū)域初定位、以及基于邊緣和形狀特征的印章區(qū)域驗證等,實驗結果驗證了所提算法的有效性。未來的工作集中在如何提高印章區(qū)域的檢測精度,以及特殊形狀印章定位方面。
[1]FAN T J,TSAI W H.Automatic Chinese seal identification[J].Computer Vision Graphics and Image Processing,1984,25(2):311?330.
[2]CHENC M,TSAI W H.Automatic identification of Chinese seal imprint with arbitrary or partial shapes[J].Computer Pro?cessing Chinese Oriental Languages,1986,22(6):216?233.
[3]CHEN Y S.Automatic identification for a Chinese seal image[J].Pattern Recognition,1996,29(11):1807?1820.
[4]SORIA?FRISCH A.Color seal extraction from documents:ro?bustness through soft data fusion[J].EURASIP Journal on Ap?plied Signal Processing,2005,13(8):2146?2152.
[5]WANG C Y,CHEN Y B.Seal extraction based on clustering and local thresholding techniques[J].Advanced Materials Re?search,2014,926/930:3467?3470.
[6]曾東武,劉重慶.Fourier描述符的印鑒識別方法[J].上海交通大學學報,1998,32(9):43?45.
[7]王新年,梁德群.基于極坐標和小波的印章配準方法[J].計算機工程與應用,2005,42(24):218?221.
[8]李晗,竇愛萍,解爭龍,等.基于多特征的支持向量機印鑒識別[J].航空計算技術,2006,36(4):32?34.
[9]代紅維,馬社祥.基于旋轉不變特性的印鑒識別方法研究[J].天津理工大學學報,2009,25(4):1?3.
[10]何瑾.金融印鑒真?zhèn)巫R別新方法研究[D].天津:天津大學,2010.
[11]Sonka.圖像處理分析與機器視覺[M].3版.艾海舟,譯.北京:清華大學出版社,2011.