閆文耀,郭銘濤,王志曉,3,張九龍
(1.延安大學(xué)西安創(chuàng)新學(xué)院 數(shù)據(jù)科學(xué)與計(jì)算機(jī)學(xué)院,陜西 西安 710100;2.西安理工大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,陜西 西安 710048;3.陜西省網(wǎng)絡(luò)計(jì)算與安全技術(shù)重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710048)
2017年初,國(guó)家在關(guān)于實(shí)施中華優(yōu)秀傳統(tǒng)文化傳承發(fā)展工程的意見中對(duì)書法提出發(fā)揚(yáng)、普及和創(chuàng)新應(yīng)用的要求。當(dāng)前,基于圖像分析的書法研究在傳統(tǒng)文化保護(hù)和普及方面發(fā)揮著重要的作用。國(guó)內(nèi)已有相當(dāng)多的書法研究成果,主要集中在碑帖圖像去噪及增強(qiáng)[1-2]、書法字庫檢索[3-6]、書法體鑒別與評(píng)價(jià)[7]、特定風(fēng)格生成[8]、書寫質(zhì)量評(píng)價(jià)等方面[9-10]。就本質(zhì)而言,書法字檢索、相似風(fēng)格檢索、體識(shí)別、風(fēng)格生成等諸多應(yīng)用的核心都是對(duì)字體的圖像特征提取問題,包括手工設(shè)計(jì)的特征算子[11]和機(jī)器學(xué)習(xí)方法生成的統(tǒng)一特征[12],如何設(shè)計(jì)符合書法特點(diǎn)直觀感受以及手寫字特點(diǎn)專家評(píng)價(jià)的圖像特征算子,使得機(jī)器與人的評(píng)價(jià)結(jié)果具有較為一致的可解釋性,對(duì)高質(zhì)量的書寫質(zhì)量評(píng)價(jià)產(chǎn)生重要的理論研究?jī)r(jià)值。針對(duì)傳統(tǒng)書寫質(zhì)量評(píng)價(jià)方法所建立特征描述子往往僅適合某一種字體、風(fēng)格的缺陷,肖建國(guó)等人領(lǐng)導(dǎo)的團(tuán)隊(duì)對(duì)漢字按偏旁部首進(jìn)行切分,進(jìn)而應(yīng)用美學(xué)度評(píng)價(jià)準(zhǔn)則,取得了較好的效果[13],但該方法需要較多的部首切分和美學(xué)評(píng)價(jià)規(guī)則制定。近期,該團(tuán)隊(duì)又針對(duì)藝術(shù)象形文字圖像的自動(dòng)生成問題探索性提出了一種新的模型AGIS-Net,該模型是一種一階段模型,在只需少量樣本的情況下就可以同時(shí)傳遞形狀和紋理樣式,并且取得了良好的效果[14-15]。雖然基于圖像統(tǒng)計(jì)特征的方法結(jié)果的解釋性不強(qiáng),但其適應(yīng)性廣、評(píng)價(jià)有效,故仍不失為一種重要的研究途徑。吳江琴等在書法字識(shí)別[16]及體識(shí)別[17]中應(yīng)用了該類方法,取得較好的成果。該文提出將Gabor特征應(yīng)用于書寫質(zhì)量評(píng)價(jià)中,研究書寫漢字的紋理特征,進(jìn)一步應(yīng)用SVM進(jìn)行評(píng)級(jí),分為優(yōu)良和一般兩個(gè)級(jí)別,與專家打分的質(zhì)量評(píng)價(jià)表進(jìn)行對(duì)照分析,形成手寫漢字質(zhì)量評(píng)價(jià)的新途徑。
Gabor濾波器是圖像特征表示的主要方法之一,具有良好的多尺度及多方向性。生物學(xué)家通過實(shí)驗(yàn)證明了Gabor函數(shù)能夠很好地模擬人類視覺細(xì)胞在受到外界刺激時(shí)做出的反應(yīng)。Gabor濾波器的應(yīng)用關(guān)鍵在于頻率、高斯核大小、方向等參數(shù)的選擇上。Gabor函數(shù)定義如下:
W(t,t0,ω)=e-σ(t-t0)2eiω(t-t0)
(1)
那么Gabor變換可以表示為:
(2)
把式(1)代入式(2),整理可得:
(3)
對(duì)式(3)展開后可得:
(4)
其中,C(x(t))(t0,ω)表示原始信號(hào)x(t)在時(shí)間為t0、頻率為ω上的頻率信息,它是一個(gè)復(fù)數(shù)形式,可按式(5)分為實(shí)部和虛部來表示。
C(x(t))(t0,ω)=αreal+iαimag
(5)
因此,C(x(t))(t0,ω)便能通過極坐標(biāo)系下的幅值α和相位角φ來表示:
(6)
(7)
漢字的紋理特征提取本質(zhì)上是使Gabor函數(shù)φμ,v(z)對(duì)漢字樣本做卷積運(yùn)算。設(shè)漢字圖像的灰度分布為I(z),則與φμ,v(z)卷積的過程表示為:
Gμ,v(z)=I(z)*φμ,v(z)
(8)
其中,Gμ,v(z)是復(fù)數(shù),其幅值與相位用以下兩個(gè)公式來表示:
(9)
Pμ,v(z)=tan-1[Im(Gμ,v(z))/Re(Gμ,v(z))]
(10)
鑒于常見的漢字部首主要為橫、豎、撇、捺四個(gè)方向,恰好對(duì)應(yīng)Gabor濾波空間的0,π/4,π/2,3π/4,因此只需選定這4個(gè)方向?qū)h字圖像進(jìn)行Gabor紋理特征提取即可,字庫中樣本“樂”字的濾波后圖像如圖1所示。再提取漢字的5個(gè)尺度,4個(gè)方向,將Gabor濾波器的頻率選為fmax=0.22,取圖像大小的一半尺寸作為濾波器窗口的大小,圖2和圖3分別為實(shí)驗(yàn)所得的幅度圖像和實(shí)部特征。
圖1 “樂”字的濾波后的實(shí)驗(yàn)效果
圖2 “阿”字濾波后幅度特征
圖3 “阿”字濾波后實(shí)部特征
在獲取圖像特征后,需要使用分類器進(jìn)行書寫質(zhì)量的等級(jí)評(píng)價(jià),即分為優(yōu)良和一般兩種等級(jí)。雖然更精細(xì)的評(píng)價(jià)在于為每篇作品在各個(gè)指標(biāo)上打分評(píng)價(jià),但在目前的探索研究中,僅考慮使用圖像特征及分類器進(jìn)行粗分類作為嘗試。SVM是基于統(tǒng)計(jì)學(xué)的機(jī)器學(xué)習(xí)分類方法,準(zhǔn)確率較高,推廣性也較好。它具有核函數(shù)、最優(yōu)超平面等解決方案,可解決過擬合等問題。該文選取常見的SVM方法進(jìn)行二值分類。在計(jì)算完每個(gè)漢字濾波圖像的均值和方差后,得到40維特征向量,以此作為特征輸入支持向量機(jī)。
漢字特征提取具體過程如下:
Begin
gamma←0.5;
theta←pi/4;
a←sqrt(2);
fmax←0.22;
r←m/2;c←n/2;
i←1;
j←21;
foru←0:4
do
f←fmax*a^(-u);
lambda←1/f;
forv←0:3
do
sigma←0.56*lambda ;
GK←getGaborKernel(r,c,v*theta,sigma,lambda,gamma)
x←conv2(pic,GK);
mea←mean2(x);
colvector(i,1)←mea;
i←i+1;
var←std2(x)^2;
colvector(j,1)←var;
j←j+1;
End
End
End
設(shè)pic為所有訓(xùn)練樣本的集合,訓(xùn)練樣本為灰度圖像,n為所有訓(xùn)練樣本的總量。對(duì)Gabor核函數(shù)進(jìn)行參數(shù)設(shè)置:m,n分別為當(dāng)前圖像的高和寬,把Gabor核窗口設(shè)置成圖像窗口的一半[18],gamma的取值為(0,1)之間,由于Gabor濾波器的仿生特性,0.5是比較符合人類視覺的。設(shè)定五個(gè)尺度,四個(gè)方向(0,pi/4,pi/2,3pi/4)。f決定了Gabor濾波器的尺度特性,Gabor濾波器頻率變化公式為f[k]=a^(-k)*fmax,sigma為高斯函數(shù)標(biāo)準(zhǔn)差。函數(shù)getGaborKernel返回一個(gè)方向一個(gè)尺度的Gabor核,函數(shù)conv2(pic,GK)取pic樣本集合中一個(gè)樣本與四個(gè)方向五個(gè)尺度二十個(gè)Gabor核函數(shù)進(jìn)行卷積。函數(shù)mean2和std2分別為卷積過后的均值和標(biāo)準(zhǔn)差,向量colvector內(nèi)存儲(chǔ)的是二十個(gè)卷積圖像分別取的均值和方差,組成40維向量。每個(gè)樣本都有一個(gè)colvector,最終組成列向量集合,然后利用SVM進(jìn)行分類。
下面主要介紹SVM參數(shù)優(yōu)化的過程:
基于統(tǒng)計(jì)方法的SVM算法,其中的參數(shù)在于核函數(shù)的選取以及懲罰因子的系數(shù),這兩個(gè)參數(shù)的選擇直接決定了分類效果的優(yōu)劣。經(jīng)過尋優(yōu)的參數(shù)其效果可以遠(yuǎn)遠(yuǎn)超過未尋優(yōu)的參數(shù)。常見的方法有基于網(wǎng)格的窮舉篩選法和基于遺傳算法的尋優(yōu)方法。窮舉法的思路較簡(jiǎn)單,易實(shí)現(xiàn)。給定參數(shù)的最大最小值范圍,確定搜索步長(zhǎng)即平面上網(wǎng)格大小,逐網(wǎng)格進(jìn)行搜索。在每個(gè)網(wǎng)格參數(shù)點(diǎn)上,將數(shù)據(jù)集5等份,進(jìn)行5重交叉驗(yàn)證,獲取識(shí)別率。最終搜索完網(wǎng)格后確定最佳參數(shù)。
雖然該文只是進(jìn)行了二值分類,但在SVM的輸出中,是存在回歸函數(shù)的具體數(shù)值的,施加了閾值判斷,從而形成二值決策,所以文中方法對(duì)其稍加改進(jìn),即可用于書寫質(zhì)量的打分上來。
實(shí)驗(yàn)數(shù)據(jù)來源于北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所字形計(jì)算技術(shù)實(shí)驗(yàn)室孫榕鞠等人整理的CHAED字庫,它包含30個(gè)人書寫的100個(gè)漢字,每字收集10種寫法構(gòu)成1 000個(gè)字的字庫,并有33個(gè)人工打分?jǐn)?shù)據(jù)。圖4為字庫中不同書寫質(zhì)量以及不同結(jié)構(gòu)的漢字樣本示例。
圖4 字庫部分漢字樣本示例
本部分研究以Gabor特征衡量書寫線條的勻稱性及筆畫的清晰度。好的書寫,筆劃之間清晰,結(jié)構(gòu)勻稱;差的作品,由于筆劃扭曲,比例失調(diào)等形變?cè)斐晒P劃不清晰,結(jié)構(gòu)不勻稱的效果。清晰和勻稱是兩個(gè)較相近的特征,所以選用同一組樣本進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)中選取書寫勻稱、符合規(guī)范的100個(gè)漢字,另外選取不具備這些特征的100個(gè)漢字,提取Gabor特征,用于決策分類。實(shí)驗(yàn)數(shù)據(jù)集如圖5所示。
圖5 筆劃清晰勻稱性實(shí)驗(yàn)數(shù)據(jù)集
通過實(shí)驗(yàn)測(cè)得最終的分類識(shí)別率為91%,反映出Gabor特征可以表示書寫的勻稱性。
同一個(gè)人書寫的漢字風(fēng)格是統(tǒng)一的,不同人的風(fēng)格是不同的,本部分實(shí)驗(yàn)使用Gabor特征進(jìn)行書寫風(fēng)格一致性判斷。實(shí)驗(yàn)數(shù)據(jù)的準(zhǔn)備是這樣的,針對(duì)同一篇楷書作品,不同的人通過透明紙覆蓋在其上進(jìn)行摹寫,鑒別不同的書寫風(fēng)格。實(shí)驗(yàn)數(shù)據(jù)集如圖6所示,選取兩個(gè)人的摹寫樣本各100個(gè)漢字,訓(xùn)練集和測(cè)試集分別包括兩個(gè)人的100個(gè)漢字,風(fēng)格一致性的測(cè)試結(jié)果為65%。
圖6 書寫風(fēng)格一致性判斷實(shí)驗(yàn)數(shù)據(jù)集
這部分實(shí)驗(yàn)風(fēng)格鑒別率不高的原因是兩個(gè)人的樣本都來自同一書法字帖的摹寫,原有的風(fēng)格是一致的。這里只是每人在摹寫時(shí)附加了個(gè)人的特點(diǎn),這種算法在公安部門圖偵室的書寫同一驗(yàn)證中有重要作用。
本部分進(jìn)行漢字書寫質(zhì)量評(píng)價(jià)的綜合實(shí)驗(yàn),需要機(jī)器給出優(yōu)秀和一般兩種判斷。實(shí)驗(yàn)數(shù)據(jù)集如圖7所示,通過和人工打分進(jìn)行對(duì)比,得出文中算法的識(shí)別率為95%。
圖7 漢字書寫質(zhì)量評(píng)價(jià)實(shí)驗(yàn)數(shù)據(jù)集
綜上,文章從三方面對(duì)Gabor濾波器在書法特征鑒別方面的性能進(jìn)行了測(cè)試,實(shí)驗(yàn)表明其效果較為理想。
針對(duì)漢字書寫質(zhì)量的評(píng)價(jià)問題,提出了基于Gabor濾波器特征表示的二值評(píng)價(jià)方法,根據(jù)5個(gè)尺度4個(gè)方向的Gabor特征,以均值和方差作為統(tǒng)計(jì)特征,輸入SVM進(jìn)行分類判別,分別檢驗(yàn)了Gabor特征在筆劃清晰結(jié)構(gòu)勻稱性及風(fēng)格一致性方面的性能,并進(jìn)行了綜合的質(zhì)量評(píng)價(jià)實(shí)驗(yàn),取得了良好的效果。書法質(zhì)量評(píng)價(jià)的研究是一個(gè)具有廣泛應(yīng)用價(jià)值的研究領(lǐng)域,其涉及到特征提取、圖像形態(tài)學(xué)和圖像語義理解等問題,提出的方法不依賴于字體分割精度,這為探索基于統(tǒng)計(jì)學(xué)習(xí)的書法質(zhì)量評(píng)價(jià)研究提供了新的研究思路和方法。