基于GA-SVM模型的機采籽棉雜質(zhì)識別

2016-10-14 03:33:36張成梁董全成葛榮雨

農(nóng)業(yè)工程學(xué)報 2016年24期

張成梁，李蕾，董全成，葛榮雨

張成梁1，李蕾2，董全成1，葛榮雨1

（1.濟南大學(xué)機械工程學(xué)院，濟南250022； 2. 齊魯工業(yè)大學(xué)機械與汽車工程學(xué)院，濟南250353）

針對中國機采棉加工過程中混級混軋、缺乏棉花參數(shù)檢測的現(xiàn)狀，提出使用遺傳算法優(yōu)化支持向量機參數(shù)的機采籽棉圖像分割、雜質(zhì)識別方法。在圖像分割階段，采用像素點鄰域的色調(diào)、飽和度、亮度顏色特征與平均亮度、平均對比度、平滑度、三階矩、一致性、熵等紋理特征構(gòu)建特征向量，使用最優(yōu)保留策略的遺傳算法優(yōu)化懲罰參數(shù)及核函數(shù)參數(shù)，建立圖像分割SVM分類器；對雜質(zhì)識別過程，在計算標記區(qū)域的顏色特征、紋理特征基礎(chǔ)上，增加面積、周長、離心率、矩形度、形狀因子等形狀特征，使用遺傳算法建立雜質(zhì)識別SVM分類器。測試結(jié)果表明，該方法適用于邊緣對比度低、紋理信息豐富的機采籽棉含雜圖像分割，對雜質(zhì)的有效識別率為92.6%。該研究為棉花加工設(shè)備的參數(shù)優(yōu)化和國產(chǎn)采棉機的研制及優(yōu)化提供重要參考依據(jù)。

圖像分割；雜質(zhì)；遺傳算法；機采籽棉；SVM；識別

0 引言

中國是世界上的棉花生產(chǎn)大國，傳統(tǒng)的手摘收獲方式嚴重制約著采棉效率和經(jīng)濟效益，隨著機械化收獲比例的逐年增加，機采棉加工工藝逐步完善。由于機采棉含雜量在8%～15%，一般需要經(jīng)過三級籽棉清理和兩級皮棉清理，但是過度清理會造成棉花纖維的損傷[1-2]，機采棉加工工藝需要統(tǒng)籌考慮棉花纖維質(zhì)量與雜質(zhì)清理效果[3-4]。但是，國內(nèi)棉花加工廠普遍采用手感目測的檢測方式，對整垛棉花采用固定加工參數(shù)，屬于典型的粗放型加工，不符合棉花精細化加工要求。由于各級清雜設(shè)備只對特定類型的雜質(zhì)清理效果明顯[5-6]，因此，檢測加工過程中棉花雜質(zhì)的類型及其含量對使用適當清雜設(shè)備、合理調(diào)整設(shè)備參數(shù)具有重要實用價值和現(xiàn)實意義。

目前，中國農(nóng)業(yè)大學(xué)[7-9]、清華大學(xué)[10-11]山東大學(xué)[12-13]、山東農(nóng)業(yè)大學(xué)[14-15]、四川大學(xué)[16-17]等在皮棉異性纖維檢測識別方面做了很多工作；王欣[18-19]和王昊鵬[20]分別對皮棉和手摘籽棉中的雜質(zhì)進行識別。但是，棉花雜質(zhì)檢測研究方面對于機采籽棉中雜質(zhì)的分類識別問題鮮有報道[21]。皮棉異性纖維檢測技術(shù)為紡紗工藝的開清棉工序提供了支持，并不能指導(dǎo)棉花加工過程，另外皮棉經(jīng)過了多級清雜和梳理，雜質(zhì)含量低，圖像背景較為單一，檢測時皮棉層薄，不存在雜質(zhì)遮擋問題；手摘籽棉的含雜量遠遠低于機采籽棉，同時機采棉加工工藝也比手摘棉復(fù)雜的多。目前，國內(nèi)迫切需要解決機采籽棉雜質(zhì)的分類檢測識別問題，為優(yōu)化機采棉加工工藝提供檢測數(shù)據(jù)及反饋信息。基于此，本文突破機采籽棉含雜量高、圖像背景復(fù)雜、籽棉團遮擋等難點，研究機采籽棉中的鈴殼、僵瓣、棉枝、棉葉、塵雜等天然性雜質(zhì)的分類識別。

邊緣檢測法、閾值分割法、區(qū)域生長法、聚類算法、支持向量機方法（SVM）等[22-23]是目前比較常見的圖像分割算法。其中，SVM方法在原理上充分結(jié)合了統(tǒng)計學(xué)習和神經(jīng)網(wǎng)絡(luò)，該方法對解決高維樣本、小數(shù)據(jù)樣本、非線性模式識別等方面有突出的優(yōu)點，應(yīng)用廣泛[24-25]。一般的SVM彩色圖像分割方法容易忽略圖像細節(jié)的紋理信息和邊緣銳變情況，僅從某一顏色空間的顏色分量或者多顏色空間的顏色分量組合方面考慮，特征使用不夠全面；另外，SVM參數(shù)的優(yōu)選問題也一直是研究熱點[26]。在典型的機采籽棉圖像中，籽棉和雜質(zhì)區(qū)域部分均包含豐富的紋理信息，但是目標區(qū)域邊緣對比度相對較低。本文充分利用棉花及雜質(zhì)的像素鄰域顏色信息及紋理信息作為訓(xùn)練特征樣本集，擺脫傳統(tǒng)方法的局限性；同時利用遺傳算法（GA）優(yōu)化SVM參數(shù)，高效率的解決大范圍并行尋優(yōu)問題；對于分割后的圖像，通過提取雜質(zhì)區(qū)域的顏色、紋理、形狀特征作為訓(xùn)練特征樣本集，利用SVM分類器實現(xiàn)機采籽棉圖像的雜質(zhì)識別。

1 支持向量機理論

1.1 SVM原理

SVM建立在統(tǒng)計學(xué)習理論和結(jié)構(gòu)風險最小原理基礎(chǔ)上，具有較強的高維樣本處理能力。SVM實質(zhì)上是1個二分類算法，主要思想是尋找能夠正確分開2類樣本且具有最大分類間隔的最優(yōu)分類超平面[27]，基本思想可以表述如下：

式中為權(quán)值，為偏置。2類數(shù)據(jù)在合理的分類面方程下都能夠達到要求，即約束條件為

（2）

分別對、求偏導(dǎo)數(shù)，并令其等于零，采用適當?shù)膬?nèi)積函數(shù)實現(xiàn)非線性變換后的線性分類，解決訓(xùn)練樣本間的內(nèi)積運算，式（3）轉(zhuǎn)化為如下對偶問題

（4）

式中表示懲罰參數(shù)，可以控制對錯分樣本的懲罰程度。假設(shè)最優(yōu)解為*，則最優(yōu)分類函數(shù)為

式中sgn(·)為符號函數(shù)；*是分類閾值。

可以看出，SVM在有限訓(xùn)練樣本信息模型的復(fù)雜性和學(xué)習能力之間尋求效果最好的平衡。

1.2 SVM核函數(shù)

函數(shù)稱為SVM的核函數(shù)，它的使用有效避免了算法的維數(shù)災(zāi)難問題。線性核函數(shù)、多項式核函數(shù)、Sigmoid核函數(shù)、和徑向基核函數(shù)（RBF）等是比較常用的核函數(shù)。其中，應(yīng)用最廣的是RBF核函數(shù)，各方面性能均表現(xiàn)穩(wěn)定[28-29]，RBF核函數(shù)為

1.3 遺傳算法優(yōu)化SVM參數(shù)

懲罰參數(shù)控制著經(jīng)驗風險與算法復(fù)雜度的平衡，值越大則對訓(xùn)練樣本的擬合程度就越高，但是值過大會導(dǎo)致經(jīng)驗風險增大、發(fā)生過學(xué)習；反之就對經(jīng)驗誤差的懲罰小，學(xué)習機器的復(fù)雜度小。SVM分類器對數(shù)據(jù)變化的敏感度受核函數(shù)的影響，該值過小分類器的抗干擾能力變差，反之就會造成分類器反應(yīng)遲鈍。如何確定SVM參數(shù)直接影響到分類器的性能好壞。

SVM的參數(shù)選擇問題，其實質(zhì)就是1個優(yōu)化問題。目前SVM參數(shù)選取方法主要有：經(jīng)驗選擇法、實驗試湊法、網(wǎng)格搜索法等。隨機選擇SVM分類器參數(shù)很難達到理想效果；經(jīng)驗選擇法和實驗試湊法不能保證參數(shù)值一定是最優(yōu)的，并且實驗過程嚴重依賴操作者的經(jīng)驗；使用matlab工具箱提供的網(wǎng)格參數(shù)優(yōu)化方法，也能夠找到范圍內(nèi)的最優(yōu)解，但是如果要提高精確度或者增大搜索范圍，該方法會很費時。

目前，啟發(fā)式算法已經(jīng)成功應(yīng)用在參數(shù)尋優(yōu)方面，其中，遺傳算法作為一種實用、高效、魯棒性強的優(yōu)化技術(shù)應(yīng)用廣泛，本文采用遺傳算法優(yōu)化選擇SVM參數(shù)。遺傳算法優(yōu)化SVM參數(shù)的方法，首先從初始種群出發(fā)，采用自行設(shè)計的適應(yīng)度函數(shù)來評價個體適應(yīng)度，并以此從種群中選擇優(yōu)良個體，然后通過交叉、變異操作生成新一代個體。將這個過程迭代循環(huán)，直至達到終止條件，具體操作為：

1）種群初始化：構(gòu)建一定數(shù)量的初始種群，個體編碼方式采用實數(shù)編碼，每一個體包含兩個隨機數(shù)，構(gòu)成一組SVM參數(shù)。

2）適應(yīng)度函數(shù)：以交叉驗證意義下的訓(xùn)練樣本準確率作為個體的適應(yīng)度評價函數(shù)。

3）選擇操作：采用輪盤賭法選擇算子，保證優(yōu)質(zhì)個體有更大的幾率被選中；同時采用最優(yōu)個體保留策略，最優(yōu)個體直接進入下一代。

4）交叉操作：對個體間的2個實數(shù)基因位進行交叉組合。

5）變異操作：根據(jù)變異率，隨機選擇個體，修改基因位上的數(shù)值。

經(jīng)過遺傳算法并行高效的優(yōu)化選擇后，可得到最優(yōu)SVM參數(shù)(,)。本文對機采籽棉圖像分割以及雜質(zhì)識別2個階段均采用上述遺傳算法優(yōu)化SVM的方法。

2 基于鄰域顏色、紋理特征的SVM圖像分割

2.1 顏色空間選擇

在顏色空間的選擇方面，色調(diào)飽和度亮度顏色模型（HSI）從人的視覺系統(tǒng)出發(fā)描述色彩，消除了各分量之間的相關(guān)性，比較符合人的視覺特性。本文選擇在HSI顏色空間進行棉花彩色圖像的分割識別操作。

作為有監(jiān)督的分類器，SVM在選取特征時，既要注意選取特征的有效性，又要注意樣本數(shù)據(jù)的多樣性。SVM圖像分割方法一般只使用特定像素點處的灰度值或顏色值，忽略圖像區(qū)域的邊緣銳變情況和紋理信息，影響分割結(jié)果。本文充分考慮紋理信息在表征雜質(zhì)圖像特征方面的重要性，結(jié)合機采籽棉圖像中區(qū)域塊的連續(xù)性，使用采樣點鄰域區(qū)域顏色特征和紋理特征共同構(gòu)建訓(xùn)練樣本集的方法，提高圖像分割效果。

2.2 特征向量提取

在機采籽棉含雜圖像中，雜質(zhì)與棉花各自具有不同的紋理特性，這些紋理特性不受亮度和顏色的影響，可以作為識別兩者的1個重要特征；但是這種自然環(huán)境下的紋理沒有規(guī)則的形狀和方向性，紋理特性中的統(tǒng)計方法適合處理這種情況，本文選用平均亮度、平均對比度、平滑度、三階矩、一致性和熵等信息作為紋理分析的特征量。

1）平均亮度：基于灰度直方圖的平均亮度。

2）平均對比度：區(qū)域的標準方差，表示清晰度。

3）平滑度：區(qū)域中亮度的相對平滑度度量。

4）三階矩3：灰度直方圖的偏斜性。

5）一致性：灰度一致性的度量。

6）熵：目標區(qū)域的隨機性。

具體操作時，利用人工交互選點的方式，對選定點的5′5鄰域計算HSI空間3個顏色特征均值及6個紋理特征，并分別標記棉花纖維、深色雜質(zhì)、淺色雜質(zhì)。試驗中機采籽棉彩色圖像特征向量值如表1所示。

表1 機采籽棉圖像特征向量值

本文以區(qū)域顏色均值、紋理信息代替單點顏色值，避免單獨像素點的信息孤立性，增強抗噪聲能力，同時有利于增加選取點附近區(qū)域的紋理信息，使用SVM多分類器使得雜質(zhì)分割更加細致，便于進行識別操作。

2.3 SVM圖像分割

在確定了所需的訓(xùn)練樣本后，將選定像素點鄰域的顏色和紋理特征作為特征向量，并對訓(xùn)練樣本進行類別標注，利用遺傳算法優(yōu)化、參數(shù)的方法訓(xùn)練圖像分割SVM分類器，用訓(xùn)練好的SVM分類器對整幅機采籽棉圖像進行分割。由于同類圖像在顏色空間數(shù)據(jù)分布形狀通常是相近的，并且機采籽棉雜質(zhì)紋理特征穩(wěn)定，本文得到的最優(yōu)SVM參數(shù)對同類圖像通用。

圖1為機采籽棉原始圖像，雜質(zhì)種類多，并且鈴殼、僵瓣、棉枝、大葉片周圍以及籽棉團之間的鄰接部位都存在暗色的陰影區(qū)域，籽棉背景區(qū)域的多樣性增加了目標區(qū)域的分割難度。

采用模糊C均值聚類算法（FCM）、傳統(tǒng)SVM方法及本文GA-SVM方法的圖像分割效果如圖2所示。

a. FCM淺色雜質(zhì)a. Light-colored impurities with FCMb. FCM深色雜質(zhì)b. Dark impurities with FCM c. 傳統(tǒng)SVM淺色雜質(zhì)c. Light-colored impurities withtraditional SVMd. 傳統(tǒng)SVM深色雜質(zhì)d. Dark impurities withtraditional SVM e. GA-SVM淺色雜質(zhì)e. Light-colored impurities withGA-SVMf. GA-SVM深色雜質(zhì)f. Dark impurities withGA-SVM

圖2a、圖2b是采用模糊C均值聚類算法圖像分割結(jié)果，在HSI空間采用歐式距離，由于淺色雜質(zhì)與陰影區(qū)域的顏色信息十分相近，以至于出現(xiàn)了兩者大面積合并的現(xiàn)象，同時深色雜質(zhì)的外圍輪廓也有部分被標記為目標區(qū)域，分割效果整體不理想。圖2c、圖2d為采用一般SVM分割方法的結(jié)果，使用人工選點方式訓(xùn)練，采用遺傳算法優(yōu)化、參數(shù)，雜質(zhì)分割效果較FCM方法有所改善，這時如果不根據(jù)原有圖像信息而直接使用形態(tài)學(xué)腐蝕或者細化處理，容易造成邊界區(qū)域分割不精確[30]。一般SVM由于只使用了訓(xùn)練樣本點本身的H、S、I顏色信息，沒有充分利用空間位置信息，仍然沒有達到期望的分割效果。圖2e、圖2f為采用本文SVM分割方法的結(jié)果，采用了與圖2c、圖2d相同的訓(xùn)練樣本點，采用GA優(yōu)化、參數(shù)，同時使用了樣本點附近鄰域塊的3個顏色信息及6個紋理信息，較好的分割出了淺色與深色雜質(zhì)，并且各自區(qū)域相對連續(xù)，效果較好。本文采用SVM方法將圖像識別為3類，而不是只有目標雜質(zhì)區(qū)域和背景棉花區(qū)域的簡單二分類，這樣有利于在深色系雜質(zhì)與淺色系雜質(zhì)出現(xiàn)重疊覆蓋的情況下完成兩者的有效分割，便于后續(xù)的識別操作。

結(jié)果表明，相對于FCM分割和經(jīng)典 SVM分割，本文方法顯著提高了分類精度，當圖像中目標區(qū)域的邊緣對比度較低時，有效避免了將目標的陰影當成邊緣的情形，具有自適應(yīng)性。

3 基于顏色、紋理、形狀特征的SVM雜質(zhì)識別

3.1 形態(tài)學(xué)處理

從圖2e可以看出，在雜質(zhì)區(qū)域塊的內(nèi)部存在小面積的獨立區(qū)域圖塊，例如：僵瓣內(nèi)部有錯誤識別為棉花的部分，這是由于僵瓣本身就是未成熟的棉花，在顏色、紋理特征上與棉花接近。為改善這種情況，本文將SVM分割后的標記圖像采用形態(tài)學(xué)的孔洞填充操作，統(tǒng)一雜質(zhì)區(qū)域類型；然后對淺色雜質(zhì)利用開運算，消除小面積噪聲影響；對深色雜質(zhì)利用閉運算，在保留小面積塵雜的基礎(chǔ)上，平滑目標邊界。

注意到圖1中部的淺色鈴殼外圍有1圈深色雜質(zhì)，這是鈴殼的背面，應(yīng)該將這兩部分識別為一個整體，方法是將淺色雜質(zhì)目標做適當膨脹，如果深色雜質(zhì)中有相當部分與新增加的膨脹區(qū)域重合，則將其區(qū)域標號修改為與該淺色目標一致。

3.2 SVM雜質(zhì)識別

在完成了機采籽棉含雜圖像的分割與形態(tài)學(xué)處理后，雜質(zhì)已經(jīng)不再是圖像分割階段的分離片段狀態(tài)，而是已經(jīng)被完整標記的獨立區(qū)域，在雜質(zhì)識別操作階段，本文在提取顏色、紋理的基礎(chǔ)上，增加形狀特征這一重要信息，具體如下：

1）面積：用同一標記區(qū)域中像素數(shù)表示。

2）周長：用圖形區(qū)域外邊界的相鄰兩像素之間的距離之和表示。

3）離心率：即區(qū)域形狀接近圓形的程度。

4）矩形度：提取雜質(zhì)圖像的最小外接矩形，用最小外接矩形面積與圖像面積之比表示。

5）形狀因子：與區(qū)域周長的平方與面積比有關(guān)。

在圖像分割后，自動提取雜質(zhì)區(qū)域的3個顏色特征均值、6個紋理特征及5個形狀特征，構(gòu)造14維的特征向量，并人工標記雜質(zhì)類型，包括棉枝、棉葉、鈴殼、僵瓣和塵雜，采用遺傳算法優(yōu)化SVM參數(shù)的方法訓(xùn)練雜質(zhì)識別SVM分類器，最后使用完成的SVM分類器對測試圖像的雜質(zhì)進行分類識別操作。

4 算法流程

本文主要的算法流程如圖3所示。

1）對機采籽棉分割用的訓(xùn)練圖像，分別在棉花纖維、深色雜質(zhì)、淺色雜質(zhì)區(qū)域人工選點，標記類別標簽，計算選點鄰域的顏色、紋理特征作為特征向量。

2）使用遺傳算法優(yōu)化、參數(shù)，得到圖像分割SVM分類器。

3）對分割用的測試圖像，在對每個像素進行分類的過程中，構(gòu)建其鄰域的顏色、紋理特征，并結(jié)合分割SVM分類器，實現(xiàn)對機采籽棉含雜圖像的分割。

4）對分割完成的圖像進行形態(tài)學(xué)處理后，一部分圖像用于識別訓(xùn)練，另一部分用于識別測試。

5）對識別用的訓(xùn)練圖像，在自動分割雜質(zhì)區(qū)域后，計算各標記區(qū)域的顏色、紋理和形狀特征，人工標記類別標簽：棉枝、棉葉、鈴殼、僵瓣和塵雜，用遺傳算法優(yōu)化、參數(shù)，得到雜質(zhì)識別SVM分類器。

6）對識別用的測試圖像，在對每個雜質(zhì)區(qū)域計算顏色、紋理、形狀特征后，結(jié)合識別SVM分類器，完成對機采籽棉圖像的雜質(zhì)識別。

7）經(jīng)過以上步驟后，可以得到圖像分割SVM分類器和雜質(zhì)識別SVM分類器，對于其他機采籽棉含雜圖像可直接利用這2個分類器實現(xiàn)自動圖像分割與雜質(zhì)識別。

5 試驗與結(jié)果分析

5.1 試驗材料與裝置

試驗材料為機采籽棉，選用維視圖像的彩色工業(yè)相機，型號MV-EM510C/M，視野范圍100 mm×100 mm，分辨率2456像素×2058像素，CCD尺寸2/3英寸；工業(yè)鏡頭M0824-MPW2，焦距8 mm；光源控制器型號AFT-ALP2430-02，漫射光源型號AFT-WL21244-22W，試驗系統(tǒng)如圖4所示。

將相機和照明系統(tǒng)放置在封閉的暗室中，有效避免外界的干擾，4段條形光源采用正向亮場照明方式，試驗用的機采籽棉被壓在暗室另一側(cè)的透明玻璃板上。訓(xùn)練和測試中用MATLAB R2014b和libsvm-3.21工具箱進行計算，訓(xùn)練圖像和測試圖像各60張。

5.2 實例分析

圖5為兩幅典型的機采籽棉圖像。

a. 實例一a. First exampleb. 實例二b. Second example

圖像中有棉葉、棉枝、僵瓣、塵雜等，籽棉團之間有暗色的陰影區(qū)域，并且存在雜質(zhì)被棉花遮擋的情況。對于圖5a中的實例一采用本文GA-SVM方法分割圖像，如圖6a、圖6b所示，由于使用了基于像素點鄰域的顏色、紋理特征，采用了GA優(yōu)化、參數(shù)，在機采籽棉彩色圖像中實現(xiàn)了淺色目標雜質(zhì)、深色目標雜質(zhì)與白色背景籽棉團的有效分離。圖6c、圖6d為形態(tài)學(xué)處理后的圖片，其中圖6c經(jīng)過區(qū)域填充和開運算后，淺色雜質(zhì)僵瓣、鈴殼目標清晰，邊界平滑，圖像沒有孤立噪聲點；圖6d經(jīng)過區(qū)域填充和閉運算后，深色雜質(zhì)小目標塵雜保留較好，棉葉、棉枝清晰可辯。圖像整體分割效果理想，為雜質(zhì)的正確識別提供了有利條件。

a. GA-SVM淺色雜質(zhì)a. Light-colored impurities withGA-SVMb. GA-SVM深色雜質(zhì)b. Dark impurities withGA-SVM c. 淺色雜質(zhì)形態(tài)學(xué)處理c. Light-colored impurities withmorphology operationd. 深色雜質(zhì)形態(tài)學(xué)處理d. Dark impurities withmorphology operation

對于圖5b中實例二的圖像處理結(jié)果如圖7所示。

從圖7c可以看出，圖像左側(cè)的鈴殼內(nèi)部淺色區(qū)域能夠被識別標記，但是因為籽棉團的遮擋，只能識別出可見部分，造成了該部分區(qū)域形狀的不完整，這在一定程度上會對后續(xù)SVM雜質(zhì)類型識別造成不利影響；對于圖7d中的深色雜質(zhì)識別，圖像左側(cè)中部偏上部分的鈴殼深色外部邊緣不夠連續(xù)，這也是由于棉纖維覆蓋造成，其余部分識別較好，圖像整體分割效果較為理想。

圖8所示為遺傳算法優(yōu)化、參數(shù)的迭代運算圖，種群規(guī)模為40，最大迭代步數(shù)是100，由于最優(yōu)保留策略，種群中的最優(yōu)個體適應(yīng)度逐漸增加，最后穩(wěn)定在95.8%，表明此時的懲罰參數(shù)與核函數(shù)參數(shù)的組合達到最優(yōu)的分類性能。

對機采籽棉圖像分割處理后，分別用5種方法進行雜質(zhì)識別，測試結(jié)果如表2所示。

表2 多種方法測試結(jié)果比較

注：表中“—”表示沒有該項參數(shù)。

Note: In the table “-” represents no such parameter.

從表2可以看出，使用一般SVM1方法，利用雜質(zhì)區(qū)域的顏色、紋理、形狀信息作為特征向量，但是由于隨意設(shè)置、，訓(xùn)練正確率和測試正確率均不高，不是最優(yōu)配對；對于僅使用顏色特征的SVM2方法，雖然使用了遺傳算法優(yōu)化、，訓(xùn)練正確率提高很大，但是測試正確率較低，說明只使用顏色特征不能很好的對機采籽棉未知圖像進行分類識別，提取的雜質(zhì)特征信息嚴重不足；對于使用多項式核函數(shù)的SVM3，使用了默認的參數(shù)設(shè)置，可以看出多項式核函數(shù)對于本文的機采籽棉雜質(zhì)識別問題沒有達到理想效果；構(gòu)建的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為14-29-5，模型訓(xùn)練正確率較高，但是網(wǎng)絡(luò)的泛化能力較差；對于本文采用的GA-SVM方法，訓(xùn)練正確率到達95.8%，測試正確率達到92.6%，效果比較理想。

6 結(jié) 論

1）本文針對機采籽棉含雜圖像的分割、識別問題，提出了一種在HSI顏色空間使用遺傳算法優(yōu)化SVM懲罰參數(shù)及核函數(shù)參數(shù)的方法，算法實現(xiàn)、自動優(yōu)化，克服了參數(shù)選擇的盲目性。

2）結(jié)合像素點鄰域區(qū)域的顏色、紋理特性對機采籽棉含雜圖像進行分割，避免了單獨像素點的信息孤立性，提高了分割精度與分割準確度。雜質(zhì)識別操作采用標記區(qū)域的顏色、紋理及形狀特征，使得機采籽棉雜質(zhì)的正確識別率達到92.6%。

本文所述方法在機采籽棉雜質(zhì)識別方面取得良好效果，這對于完善機采棉多級清理、實現(xiàn)棉花精細化生產(chǎn)等具有重要的現(xiàn)實意義。

[1] Anthony W S. Influence of cotton varieties and gin machinery on trash particles[J]. Applied Engineering in Agriculture, 2002, 18(2): 183－198.

[2] 徐紅，曹吉強，葉偉，等. 鋸齒式皮棉清理對機采棉性能的影響[J]. 紡織學(xué)報，2014，35(1)：35－39.

Xu Hong, Cao Jiqiang, Ye Wei, et al. Influence of saw type lint cleaning on performance of machine stripped cotton[J]. Journal of Textile Research, 2014, 35(1): 35－39. (in Chinese with English abstract)

[3] Boykin J C, Ray S. The effects of seed cotton cleaning on seed coat fragments[J]. Journal of Cotton Science, 2010, 14(2): 91－98.

[4] Byler R K, Delhom C D. Evaluation of fiber and yarn quality with and without seed cotton cleaner material produced in a commercial cotton gin[J]. Applied Engineering in Agriculture, 2013, 29(5): 621－625.

[5] 謝占林. 機采棉加工主要工序?qū)γ藁ㄆ焚|(zhì)指標影響程度比較研究[D]. 烏魯木齊：新疆大學(xué)，2015.

Xie Zhanliln. Study of the Influence Degree of the Main Process to the Cotton Quality Indicators in Machine Harvested Cotton Processing[D]. Urumqi: Xinjiang University, 2015. (in Chinese with English abstract)

[6] Sui R, Thomasson J A, Byler R K, et al. Engineering and ginning: Effect of machine-fiber interaction on cotton fiber quality and foreign-matter particle attachment to fiber[J]. The Journal of Cotton Science, 2010, 14(3): 145－153.

[7] Li Daoliang, Yang Wenzhu, Wang Sile. Classification of foreign fibers in cotton lint using machine vision and multi-class support vector machine[J]. Computers & Electronics in Agriculture, 2010, 74(2): 274－279.

[8] Zhao Xuehua, Li Daoliang, Yang Bo, et al. Feature selection based on improved ant colony optimization for online detection of foreign fiber in cotton[J]. Applied Soft Computing, 2014, 24: 585－596.

[9] 趙學(xué)華，李道亮，于合龍. 基于費舍爾評分與離散粒子群優(yōu)化的棉花異性纖維在線檢測[J]. 農(nóng)業(yè)工程學(xué)報，2014，30(6)：107－115.

Zhao Xuehua, Li Daoliang, Yu Helong. Online detection for cotton foreign fiber based on fisher score and binary particle swarm optimization[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2014, 30(6): 107－115. (in Chinese with English abstract)

[10] Qu Xin, Ding Tianhuai. A fast feature extraction algorithm for detection of foreign fiber in lint cotton within a complex background[J]. Acta Automatica Sinica, 2010, 36(6): 785－790.

[11] 周飛，丁天懷，瞿鑫. 皮棉異性雜質(zhì)的白光/熒光交替成像檢測法[J]. 清華大學(xué)學(xué)報：自然科學(xué)版，2010，50(8)：1234－1238.

Zhou Fei, Ding Tianhuai, Qu Xin. Detection of foreign materials in lint cotton with a white light/fluorescence alternating imaging method[J]. Journal of Tsinghua University (Science and Technology), 2010, 50(8): 1234－1238. (in Chinese with English abstract)

[12] 王昊鵬，馮顯英，王娜，等. 基于改進的粒子群多閾值算法的白色異性纖維檢測[J]. 農(nóng)業(yè)工程學(xué)報，2013，29(23)：153－158.

Wang Haopeng, Feng Xianying, Wang Na, et al. Detection of white foreign fibers based on improved particle swarm algorithm[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2013, 29(23): 153－158. (in Chinese with English abstract)

[13] 王昊鵬，馮顯英，李麗. 基于改進二維最大類間方差法的白色異性纖維檢測算法[J]. 農(nóng)業(yè)工程學(xué)報，2012，28(8)：214－219.

Wang Haopeng, Feng Xianying, Li Li. Detection algorithm of white foreign fibers based on improved two-dimensional maximum between-class variance method[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(8): 214－219. (in Chinese with English abstract)

[14] Wang Rui, Liu Shuangxi, Wang Qinxiang, et al. Classification features of feather and hemp in cotton foreign fibers[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(Supp.2): 202－207.

[15] 王金星，李恒斌，王蕊，等. 基于BPSO的棉花異性纖維目標特征快速選擇方法[J]. 農(nóng)業(yè)機械學(xué)報，2013，44(2)：188－191.

Wang Jinxing, Li Hengbin, Wang Rui, et al. A fast feature selection for cotton foreign fiber objects based on BPSO[J]. Transactions of the Chinese Society for Agricultural Machinery, 2013, 44(2): 188－191. (in Chinese with English abstract)

[16] 王冬，尹伯彪，劉翔，等. 棉花中白色異性纖維的線掃描激光成像檢測方法[J]. 農(nóng)業(yè)工程學(xué)報，2015，31(9)：310－314.

Wang Dong, Yin Bobiao, Liu Xiang, et al. Laser line scan imaging method for detection of white foreign fibers in cotton[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(9): 310－314. (in Chinese with English abstract)

[17] 劉翔，何相呈，蘇真?zhèn)?，? 棉花中白色異性纖維的激光成像快速檢測方法[J]. 農(nóng)業(yè)工程學(xué)報，2014，30(15)：190－196.

Liu xiang, He Xiangcheng, Su Zhenwei, et al. Laser imaging method for fast detecting white foreign fibers in cotton[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2014, 30(15): 190－196. (in Chinese with English abstract)

[18] 王欣，李道亮，楊文柱，等. 基于可見光機器視覺的棉花偽異性纖維識別方法[J]. 農(nóng)業(yè)機械學(xué)報，2015，46(8)：7－14.

Wang Xin, Li Daoliang, Yang Wenzhu, et al. Lint cotton pseudo–foreign fiber detection based on visible spectrum computer vision[J]. Transactions of the Chinese Society for Agricultural Machinery, 2015, 46(8): 7－14. (in Chinese with English abstract)

[19] Wang Xin, Yang Wenzhu, Li Zhenbo. A fast image segmentation algorithm for detection of pseudo-foreign fibers in lint cotton[J]. Computers & Electrical Engineering, 2015, 46: 500－510.

[20] 王昊鵬，李慧. 基于局部二值模式和灰度共生矩陣的籽棉雜質(zhì)分類識別[J]. 農(nóng)業(yè)工程學(xué)報，2015，31(3)：236－241.

Wang Haopeng, Li Hui. Classification recognition of impurities in seed cotton based on local binary pattern and gray level co-occurrence matrix[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(3): 236－241. (in Chinese with English abstract)

[21] 張成梁，李蕾，董全成，等. 基于顏色和形狀特征的機采棉雜質(zhì)識別方法[J]. 農(nóng)業(yè)機械學(xué)報，2016，47(7)：28－34.

Zhang Chengliang, Li Lei, Dong Quancheng, et al. Recognition method for machine-harvested cotton impurities based on color and shape features[J]. Transactions of the Chinese Society for Agricultural Machinery, 2016, 47(7): 28－34. (in Chinese with English abstract)

[22] 章毓晉. 圖像工程（中冊）：圖像分析(第3版)[M]. 北京：清華大學(xué)出版社，2012：29－50.

[23] 張榮，王文劍，白雪飛. 基于訓(xùn)練樣本自動選取的SVM彩色圖像分割方法[J]. 計算機科學(xué)，2012，39(11)：267－271.

Zhang Rong, Wang Wenjian, Bai Xuefei. Color image segmentation SVM approach based on training samples automatic selection[J]. Computer Science, 2012, 39(11): 267－271. (in Chinese with English abstract)

[24] Fernandez M, Caballero J, Fernandez L, et al. Cheminform abstract: genetic algorithm optimization in drug design QSAR: bayesian-regularized genetic neural networks (BRGNN) and genetic algorithm optimized support vectors machines (GA-SVM)[J]. Molecular Diversity, 2011, 15(1): 269－289.

[25] Korkmaz S A, Poyraz M. Least square support vector machine and minumum redundacy maximum relavance for diagnosis of breast cancer from breast microscopic images[J]. Procedia-Social and Behavioral Sciences, 2015, 174(3): 4026－4031.

[26] Subasi A. Classification of EMG signals using PSO optimized SVM for diagnosis of neuromuscular disorders[J]. Computers in Biology & Medicine, 2013, 43(5): 576－586.

[27] Chang C C, Lin C J. LIBSVM: A library for support vector machines[J]. ACM Transactions on Intelligent Systems and Technology, 2011, 2(3): 389－396.

[28] 奉國和. SVM分類核函數(shù)及參數(shù)選擇比較[J]. 計算機工程與應(yīng)用，2011，47(3)：123－124.

Feng Guohe. Parameter optimizing for support vector machines classification[J]. Computer Engineering and Applications, 2011, 47(3): 123－124. (in Chinese with English abstract)

[29] 潘晨，閆相國，鄭崇勛. 基于MEAN-SHIFT和SVM的血細胞圖像分割[J]. 儀器儀表學(xué)報，2004，25(4S)：467－472.

Pan Chen, Yan Xiangguo, Zheng Chongxun. Combining mean-shift and SVM for blood cell image segmentation[J]. Chinese Journal of Scientific Instrument, 2004, 25(4S): 467－472. (in Chinese with English abstract)

[30] Chowdhury A S, Tan S, Yao J, et al. Colonic fold detection from computed tomographic colonography images using diffusion-FCM and level sets[J]. Pattern Recognition Letters, 2010, 31(9): 876－883.

Recognition for machine picking seed cotton impurities based on GA-SVM model

Zhang Chengliang1,Li Lei2,Dong Quancheng1,Ge Rongyu1

(1.,250022,; 2.,,250353,)

The processing technology of the machine picking seed cotton (MPSC) should be influenced significantly by the kinds and the contents of impurities. But during the MPSC processes in China, there is a lot of the mixed level and the mixed ginned, as well as the lack of online detection technology. In view of the present situations, a method for the identification of impurities in MPSC image using genetic algorithm (GA) to optimize the SVM parameters has been presented in this paper. First, in order to label three categories of the cotton fiber, the light-colored impurities and the dark impurities, the feature vectors were constructed for the image segmentation by the color characteristics of hue, saturation and intensity of pixel neighborhood, and the texture features of the average brightness, the average contrast, the smoothness, the third moment, the consistency and the entropy. GA of optimal retention strategy was used to optimize the penalty parameter and kernel function parameter to establish the SVM classifier of image segmentation, and then morphological operation such as hole filling, opening operation, closing operation was adopted. The specific operation was the use of open operation on light-colored impurities to eliminate the influence of small area noise; while the use of closed operation on dark impurities to smooth the target boundary on the basis of retaining small areas of dust. Then, for the impurity recognition process, shape features including area, perimeter, eccentricity, rectangle degree and shape factor were added to feature vectors besides color feature and texture feature of marked region; five categories of cottonseed, cotton leaf, bell shell, stiff valve and dust miscellaneous were marked; and the SVM classifier for impurity recognition by GA was established. At last, automatic segmentation and impurity recognition for MPSC image were realized using these two SVM classifiers. For the experiment MPSC was taken as the test material. The color planar array CCD camera of technical grade (MV-EM510C/M, Microvision, Inc.) with the industrial lens (M0824-MPW2) was used for the shooting system which included the LED diffuse light source of a 4-segment strip (AFT-WL21244-22W) and the light source controller (AFT-ALP2430-02). When shooting, the camera and the light source were placed in the darkroom, and the MPSC used for the test was pressed against the transparent glass plate on the other side of the darkroom. The data training and the picture test were conducted using MATLAB R2014b and libsvm-3.21 toolbox, and 60 pictures were equally used for both training and testing. The SVM multi-classifier was established during segmentation and recognition operation instead of simple binary classifier. This method utilized SVM small sample and high dimensionality learning ability, and the segmentation and recognition accuracy were further increased. Experimental results show that, comparing with the segmentation results from fuzzy C - means clustering algorithm and traditional SVM algorithm, the classification accuracy was improved significantly by using neighborhood spatial information. When the contrast of the edge of the target area in the image was weak, the suggested method could effectively avoid the situation of taking the shadow of the target as the edge which had shown great adaptability in applications. In this study, compared with the traditional SVM recognition algorithm, GA was used to automatically optimize SVM penalty parameter and kernel function parameter. SVM classifiers for image segmentation and impurity recognition were obtained through the suggested method overcame the blindness of parameter selection and the shortcomings of BP neural network generalization ability. Since the data distribution shapes of the homogeneous image in the color space are usually of similarity, and the characteristics of MPSC impurities texture are of stability, the optimal SVM parameters are common to the same kind of images, while for the other MPSC images with impurities, these two classifiers can be directly used to achieve the image segmentation and the impurity recognition automatically. The test results showed that the suggested method was suitable for the segmentation of natural impurities in MPSC image of low edge contrast and rich texture information, and its effective recognition rate of natural impurities was 92.6%. The study can provide important reference for the parameter optimization of cotton processing equipment and the development and optimization of domestic cotton picker.

image segmentation; impurities; genetic algorithm; machine picking seed cotton; SVM; recognition

10.11975/j.issn.1002-6819.2016.24.025

TP391.41

1002-6819(2016)-24-0189-08

2016-09-29

2016-11-08

國家自然科學(xué)基金項目（51305164，51405194）；山東省重點研發(fā)計劃項目（2016GNC110025）

張成梁，男，山東壽光人，講師，博士，主要從事圖像檢測識別、智能儀器儀表和優(yōu)化控制研究。濟南濟南大學(xué)機械工程學(xué)院，250022。Email：me_zhangcl@ujn.edu.cn

基于GA-SVM模型的機采籽棉雜質(zhì)識別

0 引 言

1 支持向量機理論

2 基于鄰域顏色、紋理特征的SVM圖像分割

3 基于顏色、紋理、形狀特征的SVM雜質(zhì)識別

4 算法流程

5 試驗與結(jié)果分析

6 結(jié) 論

0 引言

2 基于鄰域顏色、紋理特征的SVM圖像分割

3 基于顏色、紋理、形狀特征的SVM雜質(zhì)識別