李 綠,占 竹,李立輕,b,汪 軍,b
(東華大學 a.紡織學院,b.紡織面料技術教育部重點實驗室, 上海 201620)
目前,傳統(tǒng)的機織物紋理分析主要依賴于人工視覺,因此存在主觀性較強且效率低等問題。隨著紡織行業(yè)逐步向智能化方向轉型,將圖像處理技術和機器視覺技術應用于采集和分析織物紋理特征已成為研究熱點。隨著機器視覺技術的發(fā)展,紋理分析方法可大致分為2類:傳統(tǒng)紋理分析方法、模式識別與機器學習方法。
傳統(tǒng)紋理分析方法主要利用特征提取算法,包括基于統(tǒng)計、基于信號處理、基于結構分析和基于模型等4類方法。其中表征織物紋理的經典模型主要有以下3種: 基于統(tǒng)計的模型,如灰度共生矩陣;基于信號處理的頻域分析模型[1],如小波變換、傅里葉變換和Gabor變換[2];基于場的模型[3],例如高斯馬爾可夫隨機場。傳統(tǒng)紋理分析方法各有優(yōu)缺點:統(tǒng)計模型可以刻畫織物紋理的整體特性,但部分統(tǒng)計特征僅對特定類型紋理的檢測效果較好;頻域分析模型通常采用濾波器分析圖像紋理,計算量大且實時性較差。然而,即使機織物紋理圖像具有典型的結構性,實際的織物紋理還會呈現(xiàn)一定的隨機性,因此,借助于提取廣義特征值的傳統(tǒng)紋理分析方法存在諸多限制。
字典學習屬于模式識別與機器學習方法[4]中的淺層次學習,能夠按照預先設定的目標提取最有效的紋理特征。字典的構造主要包括固定字典、解析字典和設計訓練算法的自適應學習字典。Zhou等[5]和周建[6]的研究表明,字典學習方法可對機織物紋理進行近似表征。吳瑩等[7]使用過完備解析字典得到穩(wěn)定的機織物紋理表征效果,但重構效果次于K-SVD(singular value decomposition)學習字典。與基于先驗知識的固定字典和解析字典相比,學習字典能夠更好地適應多類別的紋理特征。近十幾年來,研究者將K-SVD算法[8]和MOD(method of optimal direction)算法[9]等自適應學習字典方法引入機織物紋理表征,相繼開發(fā)出非負字典[10]和通用字典[11-12],但這些學習字典只能對特定類型的機織物紋理進行有效表征。為了同時表征多類機織物紋理,本文基于判別共享字典[13]探究機織物紋理圖像分類方案對字典重構和判別性能的影響。
圖1 判別共享字典學習的模型示意圖Fig.1 Schematic diagram of the discriminative-shared dictionary learning model
η2‖X‖1+η3‖D0‖*
(3)
判別共享字典的算法流程圖如圖2所示。第一步,將樣本圖像轉化為灰度圖像后進行子窗口劃分得到數(shù)據矩陣;第二步,輸入超參數(shù)η1、η2和η3,初始化D0、D、X0和X;第三步,迭代更新編碼系數(shù)和字典;第四步,使用學習得到的判別共享字典重構紋理圖像。
圖2 判別共享字典的算法流程圖Fig.2 Algorithm flow chart of the discriminative-shared dictionary
本文采用常用的圖像質量評價方法和判別性指標評價重構圖像的質量和字典的判別能力,進而驗證判別共享字典對多類機織物紋理的表征效果。
1.3.1 相似性指標
峰值信噪比(peak signal to noise ratio,PSNR)[16]是用于客觀衡量原始圖像和重構圖像之間相似度的常用指標。PSNR值越大,表明重構圖像與原始圖像像素點之間的平均距離越小,重構效果越好。
結構相似性指數(shù)測度(structural similarity index measure,SSIM)通過亮度、對比度和結構3個方面對重構圖像和原始圖像的相似性進行評估,提供了與感知圖像失真非常接近的客觀評價方法,相比PSNR,其更符合人類視覺感知系統(tǒng)。SSIM取值范圍為[-1,1],越接近于1,重構圖像與原始圖像越相似。
1.3.2 判別性指標
為了評估判別字典的判別性能,提出了判別性指標。用判別字典重構所有類別的樣本,并計算相似性指標,根據行字典類和列樣本類將計算結果重新排列為相似矩陣S,具體運算過程示意圖如圖3所示。
圖3 判別性指標運算過程示意圖Fig.3 Schematic diagram of the calculation process of the discriminative indicator
對相似矩陣S歸一化以消除不同樣本之間或不同指標之間的數(shù)值差異,在循環(huán)計算對角線元素與其所在行和所在列的剩余元素之間的差值平方和后再求平均值,計算公式如式(4)所示。
式中:Sij為相似矩陣S的第i行、第j列元素;C為樣本類別數(shù)。
表1 機織物樣本編號Table 1 Sample number of woven fabrics
基于機織物紋理特征,為了增加樣本數(shù)量和減小樣本尺寸,判別共享字典學習算法需要對圖像樣本以子窗口的形式進行劃分和密集取樣,即將每一個子窗口圖像作為一個子樣本。以經、緯紗密度均為225根/10 cm的方平織物為樣本,圖像尺寸為256像素×256像素。選取尺寸為64像素×64像素的子窗口,先以32像素的固定步長向右水平移動,直到水平方向的子樣本全部取完,再向下移動32像素的步長,繼續(xù)向右水平取樣,以此類推,直至圖像上所有的子樣本都選取完畢,最終得到49個子樣本。將每個子樣本的每一列首尾相連得到一個列向量樣本,這些列向量組合在一起最終得到一個4 096×49的數(shù)據矩陣。子窗口的劃分過程如圖5所示。
圖5 子窗口劃分過程Fig.5 Sub-windows partition process
為了提高判別共享字典的學習效率,需要在保證機織物重構質量的前提下,使判別字典原子數(shù)量kC和共享字典原子數(shù)量k0盡可能小。因此在進行字典學習前,需要對總字典原子數(shù)量進行優(yōu)選。
判別字典原子數(shù)量為10~100,變化步長為10個字典原子,共享字典原子數(shù)量分別設定為10、20和30個。判別字典原子數(shù)量和共享字典原子數(shù)量對字典重構效果的影響如圖6所示。
圖6 判別字典原子數(shù)量和共享字典原子數(shù)量對字典重構效果的影響Fig.6 Influence of discriminative-dictionary atoms and shared-dictionary atoms on dictionary reconstruction
由圖6可知,隨著判別字典原子數(shù)量的增加,重構圖像和原始圖像的相似性指標均越來越高直至趨于平緩,kC增加到一定數(shù)量后,類子字典的空間重疊度已經足夠小,SSIM的值接近最大值1,重構效果達到飽和。但在圖6(a)中,當kC超過80后,重構質量反而略微降低,這是由于PSNR根據重構圖像和原始圖像的像素點之間的距離差計算平方和后再求均值,容易受異常值的影響,相對來說SSIM的評價結果與實際視覺效果更吻合。共享字典原子數(shù)量對重構誤差的影響可忽略不計。由圖6可知,共享字典和判別字典原子數(shù)量分別取20和80較為合適。
本文的試驗基于MATLAB R2016ba(64位)軟件開發(fā)環(huán)境。為了驗證所提出的判別共享字典用于表征多類機織物紋理,以及分析影響字典的重構性能和判別能力的試驗因素的可行性,以8種組織結構的機織物紋理圖像為樣本,總共設計了10組試驗方案,詳見表2。根據字典原子優(yōu)選的結論,設置kC=80,k0=10,正則化參數(shù)η1=0.001,η2=0.010,η3=0.100,最大迭代次數(shù)為20次。
方案1的分類依據為組織結構,共包含8類紋理圖像,所有機織物樣本的經、緯紗密度均為225根/10 cm。方案2~5依次在方案1樣本圖像基礎上增加經、緯紗密度為250、275、300和350根/10 cm的樣本圖像。方案6按原組織以及由該原組織為基礎組織進行變化和組合而成的組織進行分類,共分為3類,所有機織物的經、緯紗密度均為225根/10 cm。方案7~10依次在方案6樣本的基礎上分別增加經、緯紗密度為250、275、300和350根/10 cm的樣本圖像。使用判別共享字典模型對10組樣本圖像分別進行字典學習和重構。
表2 不同組織結構的紋理圖像分類方案Table 2 Classification schemes of texture images with different weave structures
以方案1為例,使用字典對8類紋理圖像進行重構,得到重構圖像與原始圖像的對比圖(見圖7(a))。對角線上的重構圖像幾乎包含了原始圖像的所有紋理特征,與原始圖像相似性很高,其余重構圖像與原始圖像的相似性均較低,說明判別共享字典對相應類別的紋理圖像都有非常好的重構效果。根據上文提及的圖像相似性評價指標,對重構結果做進一步定量分析。兩個指標的相似矩陣的熱圖分別如圖7(b)、(c)所示,其中,矩陣熱圖的行和列分別表示判別字典和紋理類別。總體而言,熱圖對角線上的值明顯大于其他值,重構效果與圖7(a)的直觀對比結果一致。由此證明,判別共享字典學習模型在同時表征多類織物紋理方面有優(yōu)異的表現(xiàn)。
計算出各組的相似性矩陣,以相似矩陣對角線的平均值和判別性指數(shù)為評價指標,分別對字典的重構性能和判別性能進行定量分析。各組試驗結果的相似性指標和判別性指標如圖8所示。
由圖8(a)可知,方案1~5的PSNR值呈現(xiàn)明顯的下降趨勢,說明隨著經、緯紗密度的增加,特定類別子字典對該類別織物圖像的重構質量顯著下降。這是因為經、緯紗密度的增加將導致紋理信息更加復雜,改變了圖像灰度值的分布,從而影響字典的重構性能。方案6~10的變化趨勢和前5組方案完全一致,進一步證實以織物組織結構作為分類依據時,經、緯紗密度會對圖像的重構質量產生顯著影響。依次將方案1~5以及方案6~10進行兩兩對比,發(fā)現(xiàn)前者的PSNR值明顯高于后者。這說明對于相同規(guī)格的織物圖像,組織結構的劃分依據也會明顯影響圖像的重構質量,不恰當?shù)膭澐址绞綍е潞懿畹闹貥嫿Y果。
由圖8(b)可知:方案1~5的判別性指標接近1.0且沒有明顯波動,即所得字典的判別性能均較高,并不受密度的影響;而方案6~10的判別性指標均低于0.8,且隨著經、緯紗密度的增加,判別性能越來越差。上述試驗結果說明,選取合適的分類依據,不僅能提高字典的判別性能,還能顯著消除其余參數(shù)對判別性能的影響。
由上述試驗結果可知,依據兩種組織結構的劃分依據對機織物圖像進行分類,圖像的重構質量均會隨經、緯紗密度的增加而變得越來越差,但字典的判別性能有可能不受影響。由此說明,在判別共享字典模型中,機織物紋理圖像的分類依據對字典的重構和判別性能都尤為重要。
本文以不同經、緯紗密度的平紋、斜紋、經面緞紋、緯面緞紋、方平、復合斜紋、菱形斜紋和蜂巢織物為樣本,基于子窗口劃分的判別共享字典模型對多類機織物紋理進行表征,確定了重構紋理圖像所需的判別字典和共享字典的最優(yōu)原子數(shù)量,并比較了10種分類方案對機織物紋理圖像的重構效果的影響,得到以下結論:
(1)以組織結構作為分類依據時,隨著經、緯紗密度的增加,所學字典的重構性能越來越差,但其判別性能不會受到明顯影響。
(2)以原組織和由該原組織為基礎組織進行變化和組合而成的組織進行分類時,字典的重構性能和判別性能均會隨著經、緯紗密度的增加而降低。
(3)經、緯紗密度和組織結構均會對字典的重構性能產生影響。相比經、緯紗密度,組織結構對字典的判別性能影響更加顯著。
上述結論說明,機織物紋理圖像的分類結果會對字典的重構結果造成顯著影響,因此需要根據具體紋理特征找到適用于判別共享字典的機織物分類方法,這種分類方法仍需進一步的研究。探尋適用于紋理圖像的分類方法成為利用字典學習對機織物紋理進行稀疏表征的前提。本文方法對樣本量較大的多類機織物的紋理表征具有很好的應用前景,同時也為分析機織物紋理圖像的分類方法提供了判斷依據。