張婧婧 程蕓濤 達(dá)新民
(新疆農(nóng)業(yè)大學(xué)計(jì)算機(jī)與信息工程學(xué)院 烏魯木齊 830052)
K-means聚類是一種迭代求解的聚類分析算法,它根據(jù)樣本距離(相似性)將樣本聚成一類,使得同一簇內(nèi)的樣本相似度高,反之則差異性大。該算法以其易于實(shí)現(xiàn)、收斂速度快且聚類效果好的優(yōu)勢運(yùn)用于圖像缺陷檢測[1]、遙感信息監(jiān)測[2]、等值建模[3]、物流中心選址[4]、案件預(yù)測[5]甚至腫瘤基因變異[6]等領(lǐng)域。本設(shè)計(jì)中針對紅富士蘋果分級過程中各類指標(biāo)的處理要求,采用K-means聚類算法進(jìn)行蘋果圖像分割及缺陷檢測,旨在為其它果類的自動分級設(shè)計(jì)提供參考。
《新疆阿克蘇蘋果質(zhì)量標(biāo)準(zhǔn)體系》中,紅富士蘋果分級主要針對紅色著色比、表面缺陷、果徑大小指標(biāo)進(jìn)行篩選。目前靜態(tài)的蘋果檢測方法雖較為精準(zhǔn)[7~9],但難以滿足實(shí)時性要求。采用神經(jīng)網(wǎng)絡(luò)的方法建立蘋果等級模型,仍面臨學(xué)習(xí)速度慢、訓(xùn)練成本高、分級效率低的風(fēng)險[10]。此外,不同的機(jī)器學(xué)習(xí)方法中訓(xùn)練參數(shù)較為固定,不易根據(jù)不同種類蘋果而靈活改變評價標(biāo)準(zhǔn)。本設(shè)計(jì)基于K-means聚類算法對蘋果圖像進(jìn)行分類,結(jié)合Gamma變換、OTSU算法,對蘋果大小、顏色、缺陷等特征建立模型,重點(diǎn)探討果類分級的快速方法與高效策略。
蘋果分級的主要指標(biāo)為紅色著色比、表面缺陷、果徑大小,這三項(xiàng)指標(biāo)的分級篩選在蘋果圖像處理過程中都需要進(jìn)行果體區(qū)域與背景的分割,之后建立相應(yīng)的模型,由此產(chǎn)生了本設(shè)計(jì)中蘋果的快速分級策略,如圖1所示。
圖1 蘋果分級系統(tǒng)的設(shè)計(jì)
K-means聚類是一種較為經(jīng)典的類別劃分算法,在大規(guī)模數(shù)據(jù)進(jìn)行聚類時廣泛采用。K-means算法以k為參數(shù),把n個對象分為k簇,使簇內(nèi)具有較高的相似度,而簇間的相似度較低。
K-means算法的具體實(shí)現(xiàn)流程為
設(shè)輸入樣本集為D={x1,x2,…,xm},聚類的簇樹k,最大迭代次數(shù)N,輸出是簇劃分C={C1,C2,…,Ck};
1)從數(shù)據(jù)集D中隨機(jī)選擇k個樣本作為初始的k個質(zhì)心向量:{μ1,μ2,…,μk}
2)對于n=1,2,…,N:
(1)將簇劃分為C,初始化Ct=φ,t=1,2…k;
(4)如果所有的k個質(zhì)心向量都沒有發(fā)生變化,則轉(zhuǎn)到步驟3);
3)輸出簇劃分C={C1,C2,…Ck}。
K-means聚類法主要用于數(shù)據(jù)集的類別劃分,實(shí)驗(yàn)中采用K-means聚類首先完成了蘋果輪廓與背景的分割[11]。如圖2(a)所示,將蘋果原圖轉(zhuǎn)換到Y(jié)CbCr顏色空間?;赮CbCr圖片使用K-means算法進(jìn)行聚類,設(shè)簇?cái)?shù)為2,通過OTSU最大類間方差法得到最優(yōu)分閾值,將灰度圖轉(zhuǎn)換為二值圖,并使其黑白色顛倒,如圖2(b)。使用大小為10的模版對圖片做閉預(yù)算,并填充內(nèi)部小孔洞,得到的白色區(qū)域即為檢測得到的果實(shí)區(qū)域,蘋果面積為該區(qū)域的像素?cái)?shù),實(shí)驗(yàn)測得其像素值為62307,如圖2(c),將原圖點(diǎn)乘圖(c),得到去除背景后的實(shí)際果實(shí)區(qū)域如圖2(d)所示。
圖2 蘋果的輪廓分割
Gamma變換主要針對輸入圖像灰度值進(jìn)行非線性操作[12],使輸出圖像灰度值與輸入圖像灰度值呈指數(shù)關(guān)系:
其中指數(shù)即為Gamma,圖像變換原理如圖3所示。
圖3 灰度變換示意圖
在圖3中,將原圖像f灰度變換到新圖像fN,f中灰度值低于low_in的像素點(diǎn)在fN中灰度值被賦值為low_out。同理,f中灰度值高于high_in的像素點(diǎn)變換到fN時其灰度值也被賦值為high_out。對于參數(shù)Gamma,當(dāng)Gamma<1時,灰度圖像靠近low_in的灰度值被升高,其灰度變化范圍被拉伸,灰度圖像靠近high_in的一端其值被壓縮,圖像對比度增強(qiáng),實(shí)驗(yàn)中采用此變換旨在加強(qiáng)顏色的閾值分割效果。
蘋果顏色分級實(shí)驗(yàn)基于HIS顏色空間,利用色度值H(Hue色調(diào))分量提取蘋果表面紅顏色,并在H域?qū)麑?shí)區(qū)域做灰度變換,使得圖片果體變得更明亮,如圖4(b)所示;再通過Gamma變換將圖像中灰度值區(qū)間拉伸[13],得到更大的H域?qū)?yīng)分割閾值,顏色分級后的效果如圖4(c)所示。
圖4 顏色提取方法的測試效果
統(tǒng)計(jì)圖4中白色區(qū)域占整個蘋果區(qū)域的像素?cái)?shù)占比,得到蘋果的紅色著色比為65.537%。
在顏色分級效果測試中,為了驗(yàn)證HIS空間顏色提取、分級的優(yōu)勢,筆者將HIS空間的顏色提取與另一種超紅超綠算法[14]進(jìn)行了對比分析。與本設(shè)計(jì)相區(qū)別,超紅超綠算法基于RGB顏色空間,對比效果如圖5所示。
圖5 顏色特征提取方法的對比效果
據(jù)實(shí)驗(yàn)數(shù)據(jù)對比,就同一個蘋果圖片而言,超紅色-超綠色提取與HIS空間提取的差異很明顯。如圖5中全紅蘋果的著色比計(jì)算結(jié)果為超紅色-超綠色提取68.467%,HIS空間提取99.359%;條紋蘋果的著色比計(jì)算結(jié)果為前者32.187%,后者8.623%,實(shí)驗(yàn)結(jié)果表明提取蘋果圖像中紅色特征分量時,超紅色-超綠色提取比HIS空間提取對光照更為敏感。
蘋果表面缺陷包括疤痕、腐爛、蟲咬、裂傷、碰壓傷等,呈現(xiàn)不規(guī)則形狀的缺陷類型,就圖像缺陷的灰度差異而言,無法設(shè)定一個固定的閾值完成分割。實(shí)驗(yàn)中采用K-means方法在YCbCr顏色空間聚類,簇?cái)?shù)設(shè)為3時缺陷檢測效果較好,如圖6所示。
圖6 蘋果缺陷的聚類效果
圖6(b)為YCbCr空間簇?cái)?shù)為3的聚類效果,圖6(c)、(d)分別呈現(xiàn)G空間簇?cái)?shù)為2,及B空間簇?cái)?shù)為2的聚類對比實(shí)驗(yàn)結(jié)果,不難看出,圖6(b)將蘋果正常果體和缺陷區(qū)域以及背景較好區(qū)分,隨后使用OTSU法得到轉(zhuǎn)換為二值圖的閾值,再將其轉(zhuǎn)換為黑白二值圖,使用大小為7的碟型結(jié)構(gòu)元素對圖片做開運(yùn)算,填充空洞連接小物體,面積大小無明顯改變,如圖7所示。
圖7 圖片的開運(yùn)算測試
去除較小的孤立區(qū)域,對連通域進(jìn)行標(biāo)記,獲取區(qū)域像素面積,并畫出BoundingBox圖,如圖8所示。
圖8 蘋果圖像的缺陷區(qū)域測試
計(jì)算上圖的輸出缺陷區(qū)域面積、蘋果總面積以及缺陷占比為缺陷區(qū)域面積:93956,蘋果面積:4443045,比率:2.115%。
基于蘋果的俯視圖,蘋果果徑大小測量只需先將果體與背景進(jìn)行聚類分割,然后繪制其最小外接圓,即可計(jì)算其直徑,實(shí)驗(yàn)中得到果徑像素為708.94,如圖9所示。
圖9 蘋果的果徑測量
基于Matlab-GUI工具,筆者進(jìn)行了可視化系統(tǒng)的集成實(shí)驗(yàn),其界面設(shè)計(jì)如圖10所示。以某紅富士蘋果的三張樣本圖:左視圖、右視圖、俯視圖為例,分別設(shè)計(jì)了缺陷檢測、顏色分級與果徑測量的實(shí)驗(yàn)環(huán)節(jié),最終以《新疆阿克蘇蘋果質(zhì)量標(biāo)準(zhǔn)體系》的紅富士分級標(biāo)準(zhǔn),檢驗(yàn)該蘋果的等級為“D”,即質(zhì)量沒有達(dá)到一、二、三級果的指標(biāo)要求,符合實(shí)際檢驗(yàn)結(jié)果。
與此同時,為了驗(yàn)證系統(tǒng)能否符合流水線的實(shí)時作業(yè)標(biāo)準(zhǔn),筆者對像素為278*288的蘋果圖像進(jìn)行了分級運(yùn)算的時間測試,其中30次的運(yùn)算時間如表1所示。
表1 分級時間測試
綜上,蘋果圖像的分級測試效果較好。采用K-means聚類算法部分在于蘋果的果體輪廓、表面缺陷在圖像分級中的區(qū)分度較大,且噪聲的干擾較小;K-means聚類過程中調(diào)節(jié)k參數(shù)即可修正聚類標(biāo)準(zhǔn),方式靈活;與簇?cái)?shù)為2的K-means聚類相比,簇?cái)?shù)為3的K-means聚類方法更適于果皮的缺陷檢測。此外,采用Gamma變換能夠?qū)⒐w的灰度變化范圍拉伸,閾值分割效果增強(qiáng)。同時,分級系統(tǒng)運(yùn)算時間大致在0.7s~1.0s之間,適當(dāng)調(diào)整果體間距(建議為1.2m~1.5m),將符合一般的流水線作業(yè)速度。進(jìn)一步地,如果靈活調(diào)整技術(shù)參數(shù),上述圖像處理方法也能夠完整呈現(xiàn)其它果實(shí)類圖像的自動分級過程。