何 敏,王培培,蔣慧慧
(上海海事大學(xué) 電氣自動(dòng)化系,上海200135)
煤炭是我國(guó)的主要能源,資源極為豐富,對(duì)國(guó)民經(jīng)濟(jì)的發(fā)展起著非常重要的作用。但是開(kāi)采結(jié)果中除了煤還伴隨有大量的煤矸石。煤矸石的主要成分是巖石,其密度大、灰分高、發(fā)熱量小,如果工業(yè)生產(chǎn)用煤中混合煤矸石,將嚴(yán)重影響燃燒質(zhì)量及效率。因此,煤矸石分選是煤生產(chǎn)過(guò)程中不可缺少的環(huán)節(jié)[1]。
傳統(tǒng)的煤和煤矸石分選主要有人工和機(jī)械分選法。人工手選由工人將煤矸石從煤塊中挑選出來(lái),該方法效率低下,且工人勞動(dòng)強(qiáng)度比較大,工作環(huán)境惡劣。機(jī)械選擇則一般采用重介法,跳汰等方法,但缺點(diǎn)是設(shè)備龐大,復(fù)雜,環(huán)境污染嚴(yán)重[2]。國(guó)內(nèi)外都對(duì)煤矸石分選做了大量研究工作,如人工γ射線(xiàn)、機(jī)械振動(dòng)、無(wú)線(xiàn)電探測(cè)、紅外反射等方法,盡管這些方法可靠,但需要專(zhuān)業(yè)知識(shí)和設(shè)備,不易實(shí)現(xiàn)。
計(jì)算機(jī)和高性能成像設(shè)備的普及使基于圖像的分選方法變得簡(jiǎn)單易實(shí)現(xiàn)。通常煤塊的顏色比較黑,而矸石的顏色比較淡,因此煤和矸石的灰度分布和峰值也有所不同??梢?jiàn),煤和煤矸石的灰度和紋理分析將有助于它們的識(shí)別,例如,可將樣品煤和煤矸石的灰度和紋理值作為標(biāo)準(zhǔn)存在計(jì)算機(jī)中,識(shí)別時(shí)將實(shí)際值與之比較,就可以將煤和矸石區(qū)分出來(lái)。但灰度和紋理分析能提供多個(gè)特征參數(shù),哪些特征參數(shù)有助于提高識(shí)別成功率,以及如何整合這些特征參數(shù)以完成圖像的自動(dòng)識(shí)別過(guò)程,正是作者的研究重點(diǎn)。
實(shí)驗(yàn)樣本來(lái)自山西,包括兩種煤 (分別稱(chēng)之為有光澤煤和無(wú)光澤煤)和一種煤矸石樣本,如圖1所示。圖像采集在自然光照條件下使用DH-HN2000FC獲取。
圖1 煤和矸石原始圖像
彩色圖像分別包含了圖像的R,G,B顏色的信息,因此,在圖像處理之前需要將原始圖像轉(zhuǎn)化成灰度圖像。
本文采用Otsu法獲自動(dòng)獲取圖像的閾值,實(shí)現(xiàn)圖像的分割和二值化。由于二值圖像中有小顆粒雜質(zhì)以及一些孔洞存在,因此還需要對(duì)二值圖像進(jìn)行數(shù)學(xué)形態(tài)運(yùn)算。通過(guò)膨脹、腐蝕、開(kāi)啟,閉合等運(yùn)算,可以把圖像的小缺口,孔填上,把比結(jié)構(gòu)元素小的突刺濾掉。圖2(a)為煤矸石的原始圖像,圖 (b)為運(yùn)用Otus法獲得的二值圖像,圖(c)為處理后的二值圖像,圖 (d)為將原圖與二值圖像匹配后的圖像。下文中的圖像灰度分析和紋理分析主要是基于圖 (d)來(lái)進(jìn)行的。
圖2 圖像預(yù)處理
灰度直方圖反映圖像中各灰度級(jí)與各灰度級(jí)像素出現(xiàn)頻率之間的關(guān)系。它是圖像的重要特征之一,能給出該幅圖像的概貌描述。在實(shí)際獲取的圖像中,無(wú)光澤煤看起來(lái)比較黑,灰度值比較低,有光澤煤塊由于在光的照射下會(huì)反光,圖像中會(huì)有發(fā)光點(diǎn),而發(fā)光點(diǎn)的灰度值比較高,而煤矸石的灰度值一般比較高。因此煤和煤矸石的灰度直方圖可以直觀的反映它們的灰度范圍和頻率分布。其中,均值和方差是兩個(gè)常用的與灰度有關(guān)的特征參數(shù)。假設(shè)煤或煤矸石圖像為L(zhǎng)級(jí)灰度圖,灰度為b的像素點(diǎn)有hb個(gè),圖像區(qū)域包含的總像素,則煤或矸石圖像的均值μ和方差σ2為:
均值
方差
紋理是一種反映一個(gè)區(qū)域中像素灰度級(jí)的空間分布的屬性。分析過(guò)程主要采用由Haralick定義的灰度共生矩陣(CM),它是描述紋理的一種常用的統(tǒng)計(jì)方法。灰度共生矩陣P(i,j,δ,θ)包含了圖像關(guān)于方向、相鄰間隔、變化幅度的綜合信息。由煤和矸石的灰度共生矩陣,可以提取出二階矩、對(duì)比度、相關(guān)、熵、逆矩差等特征參數(shù)值來(lái)定量描述圖像紋理特性[12-14]。如:二階矩反映了圖像灰度分布均勻程度和紋理粗細(xì)程度,對(duì)比度可以理解為圖像的清晰度。相關(guān)是用來(lái)衡量灰度共生矩陣在行或列方向上的相似度。熵反映圖像中紋理的復(fù)雜程度和非均勻度。其計(jì)算公式如下:
二階矩
對(duì)比度
相關(guān)
熵
逆矩差
其中
由于灰度共生矩陣反映的是灰度概率,因此圖2(d)所示的圖像中煤矸石周?chē)谋尘皥D像會(huì)對(duì)灰度共生矩陣產(chǎn)生影響。為了減小影響,直接截取圖2(d)中的煤或煤矸石圖像進(jìn)行灰度共生矩陣分析。對(duì)一幅圖像可以計(jì)算出0°、45°、90°、135°的灰度共生矩陣,因此,也可以計(jì)算出來(lái)4個(gè)方向的二階矩、對(duì)比度等特性。此外,為消除方向的影響,作者將計(jì)算出的各個(gè)方向下的同一特征的平均值作為這幅圖像此特性的值。
如圖3所示分別為無(wú)光澤煤、有光澤煤和煤矸石的灰度直方圖。從圖中可以看出無(wú)光澤煤的灰度全部集中在20-50之間,煤矸石集中在40-100之間,而有光澤的煤灰度分布在40-255之間,并在灰度為90時(shí)達(dá)到峰值。由此可見(jiàn),我們可以通過(guò)觀察灰度直方圖直接對(duì)兩種煤和煤矸石識(shí)別,但這種識(shí)別方法還不能被稱(chēng)為自動(dòng)識(shí)別。
圖3 煤和矸石直方圖
圖4 為兩種煤和矸石灰度平均值和均方差的分布圖。從圖中可以看出,有光澤煤的灰度均值范圍為80-110,無(wú)光澤煤為40-60,煤矸石為:60-80。而有光澤煤的灰色均方差范圍為38-50,無(wú)光澤煤為30-40,矸石為20-30??梢?jiàn)煤和矸石的灰度均值的差距范圍比灰度方差大。所以灰度均值更能反映出煤和兩種煤矸石的灰度特性。
圖4 圖像灰度均值和均方差
圖5為圖像的灰度共生矩陣最大值、特征能量、逆矩差的對(duì)比圖。圖6為特征相關(guān)、熵、慣性矩的對(duì)比圖。從圖中可以看出,有光澤的煤的逆矩差近似0.83,而無(wú)光澤煤和煤矸石的逆矩差近似0.97,差距范圍很小,不能反映煤和兩種煤矸石的不同點(diǎn)。而圖中其它5種特征值均范圍區(qū)分較大。如:有光澤煤的相關(guān)的范圍為0.05-0.15,無(wú)光澤煤的范圍為3.5-5.5,煤矸石為1.0-2.0。
因此,灰度均值、灰度共生矩陣的最大值、能量、相關(guān)、熵和慣性矩的范圍差距較大,可以利用這些特征值之間的顯著差異可以識(shí)別出有光澤煤、無(wú)光澤煤和煤矸石。而無(wú)光澤煤和煤矸石的灰度均方差、逆矩差的值差距較小,所以利用逆矩差識(shí)別將會(huì)引起誤差。
灰度均值、灰度共生矩陣的最大值等特征值雖然能被用來(lái)識(shí)別出煤或矸石,但考慮到實(shí)際情況中煤以及煤矸石往往種類(lèi)眾多,不同種類(lèi)圖像的特征值也有較大的差別,如果在識(shí)別過(guò)程中僅僅采用一個(gè)特征參數(shù),往往識(shí)別成功率不高,而如果采用上文中的某幾個(gè)特征參數(shù),識(shí)別成功率提高了,但同時(shí)識(shí)別所需時(shí)間增加了,且需要較多的人為操作和判斷。
因此為了在實(shí)際生產(chǎn)過(guò)程中為提高識(shí)別率以及實(shí)現(xiàn)自動(dòng)識(shí)別,有必要采取新的方法融合有效特征參數(shù)。
支持向量機(jī) (support vector machine,SVM)是Cortes和Vapnik與1995年首先提出的。它是建立在統(tǒng)計(jì)學(xué)習(xí)理論的VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小原理基礎(chǔ)上的,根據(jù)有限的樣本信息在模型的復(fù)雜性 (即對(duì)待定訓(xùn)練樣本的學(xué)習(xí)精度)和學(xué)習(xí)能力 (即無(wú)錯(cuò)誤的識(shí)別任意樣本的能力)之間尋求最佳折中,以期獲得最好的推廣能力[17-18]。由于支持向量機(jī)主要是正對(duì)有限樣本,且本文中的實(shí)驗(yàn)樣本種類(lèi)較少,所以作者選擇利用支持向量機(jī)來(lái)完成圖像分類(lèi),以期得到在有限的圖像樣本條件下實(shí)現(xiàn)煤和矸石自動(dòng)識(shí)別的目的。支持向量機(jī)分類(lèi)器的實(shí)現(xiàn)利用了LIBSVM工具包,數(shù)據(jù)處理和訓(xùn)練方法如下。
在本文的第二部分中,經(jīng)過(guò)灰度和紋理分析,作者已發(fā)現(xiàn)煤和矸石的灰度平均值、灰度共生矩陣最大值、能量、相關(guān)、熵和慣性矩值可以作為煤和矸石識(shí)別的特征參數(shù),因此這里也就被選擇作為訓(xùn)練的參數(shù)。由于各特征值的范圍不同,為不免大數(shù)值引起的計(jì)算問(wèn)題,訓(xùn)練SVM前首先須將特征數(shù)據(jù)映射到0-1范圍內(nèi)。
訓(xùn)練時(shí)將煤矸石、無(wú)光澤煤、有光澤煤的標(biāo)號(hào)設(shè)定為[0,1,2]。訓(xùn)練時(shí)最重要的就是確定核函數(shù),核函數(shù)選擇直接關(guān)系到分類(lèi)的效果。RBF核能非線(xiàn)性地將樣本數(shù)據(jù)映射到高維空間,且參數(shù)少,復(fù)雜度低,計(jì)算容易,因此本文選用RBF核。
實(shí)驗(yàn)中選擇兩種煤和矸石共36張圖像作為樣本來(lái)訓(xùn)練SVM,用30張圖像作為測(cè)試樣本,訓(xùn)練結(jié)果顯示支持向量機(jī)能正確識(shí)別29張圖片,識(shí)別正確率為96.7%。由此可見(jiàn),作者選取的6個(gè)特征參數(shù)以及在這些參數(shù)基礎(chǔ)上建立起來(lái)的支持向量機(jī)能較好地完成實(shí)驗(yàn)樣本圖像的自動(dòng)識(shí)別。
近年來(lái),基于視覺(jué)的物體識(shí)別需求急劇增長(zhǎng),并能夠提高效率,保護(hù)環(huán)境。本文以煤矸石識(shí)別為應(yīng)用背景,首先在通過(guò)對(duì)獲取的圖像進(jìn)行一定順序的圖像預(yù)處理后,研究出能有效識(shí)別的各種特征,最后利用SVM和有效的特征實(shí)現(xiàn)了煤矸石圖像的快速準(zhǔn)確識(shí)別。但同時(shí)也因注意到,本文所取的實(shí)驗(yàn)樣本種類(lèi)及數(shù)量均有限,故作者的實(shí)驗(yàn)結(jié)果未必適用于所有的煤和矸石識(shí)別情況。增加樣本圖像的數(shù)量和樣本來(lái)源的種類(lèi),以此來(lái)提高支持向量機(jī)自動(dòng)識(shí)別的準(zhǔn)確率以及普遍性,這也將是作者今后的工作方向之一。
[1]ZHOU Shaolei,SHAN Zhongjian,DENG Xiaoyang.Status of coal preparation in China and trend of development [J].China Coal,2006,32 (11):11-14 (in Chinese). [周少雷,單忠健,鄧曉陽(yáng).中國(guó)選煤業(yè)現(xiàn)狀與發(fā)展趨勢(shì) [J].中國(guó)煤炭,2006,32 (11):11-14.]
[2]YAN Junxu,LI Ye.Application of digital image processing technology in the separation of coal and gangue [J].Sichuan Ordnance Journal,2009,30 (11):16-20 (in Chinese). [閏俊旭,李曄.圖像處理在煤矸石識(shí)別系統(tǒng)中的應(yīng)用 [J].四川兵工學(xué)報(bào),2009,30 (11):16-20.]
[3]MA Xianmin,JIANG yong.Digital image processing method of coal gangues [J].Colliery Mechanical and Trial Technology,2004,31 (5):9-11 (in Chinese).[馬憲民,蔣勇.煤與矸石識(shí)別的數(shù)字圖像處理方法探討 [J].煤礦機(jī)電,2004,31(5):9-11.]
[4]YAO min.Digital image processing [M].Beijing:China Machine Press,2006:78-96 (in Chinese). [姚敏.數(shù)字圖像處理 [M].北京:機(jī)械工業(yè)出版社,2006:78-96.]
[5]SONG Jinling.Study on automatic separation of coal and gangue based on image processing techniques [J].Journal of China Coal Society,2004,41 (10):142-145 (in Chinese).[宋金玲.基于圖像處理技術(shù)的煤和矸石自動(dòng)分選研究 [J].煤炭學(xué)報(bào),2004,41 (10):142-145.]
[6]WU Dongyang,YE Ning,SU Xiaoqing.Wood defect recognition based on GLCM and clustering algorithm [J].Computer and Digital Engineering,2005,37 (11):38-41 (in Chinese).[吳東洋,業(yè)寧,蘇小青.基于灰度共生矩陣和聚類(lèi)方法的木材缺陷識(shí) 別 [J].計(jì)算機(jī)與數(shù) 字工程,2005,37 (11):38-41.]
[7]CAI Yunxiang,XUE Shiqiang,ZHUO Zhiyong,et al.A method based on image processing for background classifying[J].Electro-Optic Technology Application,2010,25 (4):81-84(in Chinese).[蔡云驤,薛士強(qiáng),周志勇,等.一種基于圖像處理的背景分類(lèi)方法 [J].光電技術(shù)應(yīng)用,2010,25(4):81-84.]
[8]Chris Ebey Honeycutt,Roy Plotnick.Image analysis techniques and gray-level co-occurrence matrices(GLCM)for calculating Bioturbation indices and characterizing biogenic sedimentary structures [J].Computers and Geosciences,2008,34(11):1461-1472.
[9]Hobson M,Carter R M,YAN Y.Characterisation and identification of rice grains through digital image analysis [C].IEEEInstrumentation Measurement and Technology Conference,2007:1-3.
[10]FAN Lihong,F(xiàn)U Li,YANG Yong.Analysis of texture feature extracted by gray level co-occurrence matrix [J].Computer Application,2009,29 (4):1018-1021 (in Chinese).[范麗紅,付麗,楊勇.灰度共生矩陣提取紋理特征的實(shí)驗(yàn)結(jié)果分析 [J].計(jì)算機(jī)應(yīng)用,2009,29 (4):1018-1021.]
[11]RUAN Jiuzhong,ZHOU Chenbo,YANG Guohua.Image texture based on co-occurrence matrix for non-planar surface roughness[J].Optics and Optoelectronic Technology,2008,6 (6):36-40 (in Chinese). [阮九忠,周晨波,楊國(guó)華.基于灰度共生矩陣的非平面表面粗糙的圖像紋理研究 [J].光學(xué)與光電技術(shù),2008,6 (6):36-40.]
[12]BAI Xuebing,WANG Keqi,WANG hui.Research on the classification of wood texture based on gray level co-occurrence matrix [J].Journal of Harbin Institute of Technology,2005,37 (12):1667-1670 (in Chinese).[白雪冰,王克奇,王輝.基于灰度共生矩陣的木材紋理分類(lèi)方法的研究 [J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),2005,37 (12):1667-1670.]
[13]David M Hobson,Robert M Carter,Yong Yanl,et al.Differentiation between coal and stone through image analysis of texture features[C].IEEE International Workshop on Imaging Systems and Techniques,2007:1-4.
[14]CHEN Quansheng,ZHAO Jiewen,F(xiàn)ANG C H,et al.Feasibility study on identification of green,black and oolong teas using near-infrared reflectance spectroscopy based on support vector machine(SVM)[J].Spectrochimica Acta Part A,2007,66 (3):568-574.
[15]QI Hengnian.Support vector machines and application research overview [J].Computer Engineering,2004,30 (4):6-9(in Chinese).[祁享年.支持向量機(jī)及其應(yīng)用研究綜述[J].計(jì)算機(jī)工程,2004,30 (4):6-9.]
[16]MA Huaizhi,WU Qingxiao,HAO Yingming.Steelmaking materials recognition based on lifting wavelet transform and SVM classification [J].Computer Engineering and Design,2010,31 (18):4093-4096 (in Chinese).[馬懷志,吳清瀟,郝穎明.基于提升小波和SVM分類(lèi)的煉鋼物料識(shí)別 [J].計(jì)算機(jī)工程與設(shè)計(jì),2010,31 (18):4093-4096.]
[17]Monica Marcuzzo,Pedro Quelhas,Ana Campilho.Automated Arabidopsis plant root cell segmentation based on SVM classification and region merging [J].Computers In Biology and Medicine,2009,39 (9):785-793.
[18]JIANG yuan.Research on target recognition for SAR image based on Contourlet transform and SVM [J].Information technology,2010,34 (11):105-110 (in Chinese). [蔣媛.基于Contourlet變換和SVM的SAR圖像目標(biāo)識(shí)別 [J].信息技術(shù),2010,34 (11):105-110.]