李鐵軍,孫 躍,邵桂芳
(1.重慶大學自動化學院,重慶400044; 2.廈門大學自動化系,福建廈門361005)
一種基因芯片圖像的對比度增強方法
李鐵軍1,孫 躍1,邵桂芳2
(1.重慶大學自動化學院,重慶400044; 2.廈門大學自動化系,福建廈門361005)
為降低對比度對網(wǎng)格定位和基因點分割的影響,提出了一種基因芯片圖像的自適應(yīng)對比度增強方法.基于四階矩進行圖像對比度計算,并統(tǒng)計圖像背景灰度,從而實現(xiàn)僅針對基因點的自適應(yīng)對比度增強.通過6個不同數(shù)據(jù)集的79幅圖像實驗表明:該對比度增強方法無需人工干預及參數(shù)輸入,可自動增強圖像對比度,魯棒性強;對比度增強后的圖像網(wǎng)格定位準確率普遍提高,最高可達25%.
基因芯片;圖像處理;對比度;網(wǎng)格定位
基因芯片 (cDNA microarray)以高通量、微型化、自動化及低成本等優(yōu)點成為后基因組時代最重要的基因檢測工具之一,是緩解重大疾病預防與控制 (中國大腸癌發(fā)病率以4.71%逐年遞增[1])的一項新技術(shù)[2],能夠有效地應(yīng)用于基因測序和生物學研究[3].基因芯片分析包含樣本采集、芯片制備、掃描成像、圖像處理、數(shù)據(jù)分析和生物學應(yīng)用等步驟[4].基因芯片的圖像處理是其中提取基因表達水平信息的關(guān)鍵步驟,其準確性和可靠性將直接影響基因表達譜數(shù)據(jù)的有效性,并最終決定生物學分析和病理分析的成敗.因此,基因芯片圖像處理對解讀成千上萬個基因點的雜交信息,建立可信疾病預測具有重要的意義,其分析的可靠性和準確性將直接影響到芯片的推廣與使用.目前,基因芯片圖像處理的研究主要在網(wǎng)格定位算法[5-7]、基因點分割算法[8-11]和工具軟件三個方面展開.然而,芯片制作過程復雜 (會帶來操作失誤或儀器誤差)、圖像質(zhì)量多變 (會出現(xiàn)噪聲等級不同、基因點形態(tài)各異和基因點分布疏密不一)以及圖像分析方法多樣等,對基因芯片圖像處理造成巨大挑戰(zhàn).導致目前基因芯片圖像處理過程存在如下問題:1)算法精度完全依賴于圖像質(zhì)量;2)單一算法無法滿足要求,需要采用新的理論或方法對基因芯片圖像處理進行更深入的研究.
圖像預處理對提高圖像質(zhì)量,提高圖像分析結(jié)果精度具有重要意義.現(xiàn)有基因芯片圖像預處理著重于基因芯片圖像的噪聲去除[12-13]或者傾斜校正,很少有人研究對比度增強.目前的基因芯片對比度增強研究,大部分是針對磁共振成像的對比度增強掃描[14].另外有少部分文獻研究用直方圖均衡化進行基因芯片圖像的對比度增強[15-16].實際上,除了常用的直方圖均衡化外,一些新方法不斷涌現(xiàn),如小波變換[17]、亮度保持[18]和多尺度top-hat變換[19]等,但這些新方法執(zhí)行速度較慢.為此,本文提出一種新的自適應(yīng)對比度增強方法.為僅增強有效基因點信息,本文提出先進行背景灰度統(tǒng)計,然后基于四階矩自動計算圖像自身對比度,最后進行對比度增強.
通常圖像對比度增強采用的方法是灰度變換法,即對圖像灰度范圍進行線性擴展,如
但該方法涉及到的a,b,c,d參數(shù)均需要預先設(shè)定,即需要人為給出原始圖像的對比度范圍以及需要增強的目標對比度范圍,不具有適應(yīng)性.圖像整體灰度的改變?nèi)菀自斐蛇^度增強.
像素點與其周圍像素點的相似程度,可以說明其對比度變化情況,相似程度高,表明該點所在區(qū)域灰度分布比較平坦,也就是具有較低的對比度.四階矩采用多維方式描述點集分布情況,可以更好地展示像素點與其周圍鄰近點的灰度對比.此外,由于基因芯片圖像的特殊性,即背景灰度值較低,并且只需關(guān)注基因點的灰度值.因此,通過背景灰度統(tǒng)計,只放大基因點部分灰度值,從而實現(xiàn)局部對比度增強,是一種有效增強圖像對比度的方法,其關(guān)鍵是如何實現(xiàn)背景估計以及對比度增強系數(shù)設(shè)計.
自適應(yīng)對比度增強方法主要包括3個關(guān)鍵部分:1)為了只增強基因點,進行背景灰度估計;2)基于四階矩的圖像對比度獲取;3)自適應(yīng)對比度增強.
算法具體流程如下:
步驟1:讀入圖像f(x,y),為簡化計算,將其由16位轉(zhuǎn)換為8位,f(x,y)=f(x,y)/256.
步驟2:采用10×10的Aj窗口在圖像邊緣位置掃描,取每個窗口內(nèi)最大灰度值.
步驟3:每個邊緣位置分別隨機選擇兩邊和中間3個位置,共計12個窗口位置,最后取最大灰度值集合的最小值作為背景灰度值,即
步驟4:為避免隨機性及噪聲影響,重復步驟2~3,取m=10,即重復10次,取平均值作為最后的背景估計值k.
步驟5:計算圖像f(x,y)的水平投影信號x,即將二維信號轉(zhuǎn)換為一維信號.
步驟7:圖像對比度計算采用
步驟8:對圖像f(x,y)進行掃描,如果判斷是背景f(x,y)≤k,則保留圖像內(nèi)容,如果是基因點f(x,y)>k,則進行對比度增強,即
步驟9:為了去除增強后的噪聲影響,采用3×3的中值濾波器對圖像進行掃描,針對某個像素點g(x,y),取其鄰域圖像塊g(x+n,y+l),其中l(wèi),n∈[-1,1].
步驟11:對圖像塊進行從小到大排序gs=sort(g(x+n,y+l)).
步驟12:取中間值g′(x,y)=gs(5);
步驟13:重復步驟9~12,最后得到濾除噪聲后的圖像g′(x,y).
步驟14:還原圖像g′(x,y)=g′(x,y)×256.
2.1 實驗設(shè)置
為驗證所提方法的有效性,本文選取了6個數(shù)據(jù)庫進行實驗,包括:1)貝勒醫(yī)學院 (BaylorCollege of Medicine,BCM)提供的圖像數(shù)據(jù);2)瑞士生物信息研究所的癌癥基因組學計算小組提供的圖像 (Swiss Institute of Bioinformatics,SIB);3)Joe DeRisi個人網(wǎng)站提供的圖像數(shù)據(jù);4)加利福尼亞大學 (University of California,San Francisco,UCSF)提供的圖像數(shù)據(jù);5)基因表達譜數(shù)據(jù)庫(Gene Expression Omnibus,GEO);6)斯坦福大學基因數(shù)據(jù)庫 (Stanford Microarray Database,SMD).數(shù)據(jù)庫詳細信息如表1所示.
表1 6個數(shù)據(jù)庫的基因芯片圖像細節(jié)信息Table 1 Information of microarray images on six different data sets
全部實驗在Matlab 6.5下實現(xiàn),為方便實驗,利用網(wǎng)格定位方法先將整幅基因芯片圖像分割成子網(wǎng)格,對比度增強及后續(xù)網(wǎng)格定位效果分析都在子網(wǎng)格圖像上進行.
2.2 對比度增強效果
圖1展示了子網(wǎng)格圖像增強前后的對比度數(shù)值.由圖1可以看出本文方法在很大程度上提高了圖像對比度,可以看出基因點對比度被增強了,證明本文提出的自適應(yīng)對比度增強方法是有效的.
圖1 SMD和GEO數(shù)據(jù)集對比度增強前后效果對比Fig.1 Comparison of contrast enhancement on SMD and GEO data sets
表2給出了SMD數(shù)據(jù)庫圖像的對比度數(shù)值統(tǒng)計結(jié)果,可以看出對比度增強前圖像的平均對比度為2 340.483,增強后平均對比度為6 694.416,圖像對比度增強了3倍左右.
表2 對比度增強前后SMD數(shù)據(jù)集圖像對比度值Table 2 Contrast values of SMD data set before and after contrast enhancement
圖2給出了其他4個數(shù)據(jù)庫圖像對比度增強對比情況,可以看出在6個數(shù)據(jù)集里,GEO和USCF圖像對比度普通較低,BCM和UCSF數(shù)據(jù)庫圖像對比度增強倍數(shù)最大.實驗表明,不論原始圖像如何,本文方法都可以有效實現(xiàn)基因點的對比度增強.
圖2 4個數(shù)據(jù)集增強前后對比度數(shù)值變化情況Fig.2 Contrast values vary on four different data sets before and after contrast enhancement
2.3 對比度增強對網(wǎng)格定位的影響
為進一步比較對比度增強對基因芯片圖像處理的影響,文中詳細分析了6個數(shù)據(jù)集下不同類型圖像的網(wǎng)格定位效果.網(wǎng)格定位方法采用課題組之前提出的基于最大類間方差方法[20].表3給出了對比度增強前后不同數(shù)據(jù)集下網(wǎng)格定位準確率,可以看出,對比度增強后,網(wǎng)格定位準確率都有所提高.
表3 對比度增強前后網(wǎng)格定位平均準確率Table 3 Average precision of gridding before and after contrast enhancement
圖3給出了對比度增強前后網(wǎng)格定位結(jié)果,可以看出,對比度較低的圖像,都無法精確實現(xiàn)網(wǎng)格定位,而在對比度增強后基本都能準確定位,除了SIB數(shù)據(jù)庫的圖像因含有大量噪聲導致網(wǎng)格定位失敗外.
圖3 圖像的對比度增強前后網(wǎng)格定位結(jié)果對比Fig.3 Gridding results before and after contrast enhancement
上述實驗均表明,圖像對比度是影響基因芯片圖像網(wǎng)格定位準確與否的一大因素,因此,進行對比度增強是有必要的.此外,本文提出的對比度增強方法不需要任何參數(shù)輸入,完全自動獲取圖像對比度并進行增強,不僅能用到各種類型的基因芯片圖像上,也可以直接移植到其他圖像上,具有通用的適用價值.重要的是,利用該方法對基因芯片圖像進行對比度增強后,可以大幅度提高后續(xù)圖像分析處理的準確率,最高可達25%.
基因芯片圖像預處理對后續(xù)網(wǎng)格定位、基因點分割準確率有很大影響,而現(xiàn)有基因芯片圖像預處理主要關(guān)注圖像去噪和傾斜校正.但通過研究發(fā)現(xiàn),圖像對比度對網(wǎng)格定位準確率影響非常大.因此,本文提出通過自動計算圖像對比度,并估計背景灰度,而有效針對基因點進行對比度增強的方法.該方法可自動實現(xiàn)圖像對比度增強,無需任何參數(shù)輸入.實驗結(jié)果表明對比度增強后的網(wǎng)格定位準確率可提高5%~25%.通過對BCM,SIB,DeRisi,UCSF,GEO和SMD 6個數(shù)據(jù)集的圖像進行對比度增強實驗,發(fā)現(xiàn)在6個數(shù)據(jù)庫上,所有圖像對比度都得到了增強.就網(wǎng)格定位準確率而言,GEO數(shù)據(jù)庫圖像網(wǎng)格定位準確率提高最多,原因是該數(shù)據(jù)庫圖像對比度較低,難以區(qū)分背景和基因點.而SIB數(shù)據(jù)庫網(wǎng)格定位準確率提高最少,原因是該數(shù)據(jù)集圖像含噪聲比較多.此外,本文方法存在噪聲點會同時增強及部分圖像過度增強的缺陷,后續(xù)工作將研究修改對比度增強公式,以避免對比度非常低的圖像過度增強,從而導致噪聲增多的情況.
[1]王媛媛.大腸癌干細胞基因表達譜特點及其信號通路的篩選鑒定 [D].廣州:南方醫(yī)科大學,2011.
[2]夏俊芳,劉箐.生物芯片應(yīng)用概述 [J].生物技術(shù)通報,2010(7):73-77.
[3]博思數(shù)據(jù)研究中心.2011—2013年中國生物芯片行業(yè)深度調(diào)研與投資前景研究報告 [R].北京:博思數(shù)據(jù)研究中心,2011.
[4]PETER B.An overview of DNA microarray image requirements for automated processing[C]//IEEE Computer Society International Conference on Computer Vision and Pattern Recognition.San Diego:Springer,2005,147.
[5]THAMARAIMANALAN P,KUMAR D,NIRMALAKUMARI K.Efficient gridding and segmentation for microarray images[J].International Journal of Computer Science and Mobile Computing,2014,3(2):353-360.
[6]HARIKIRAN J,AVINASH B,VLAKSHMI D R,et al.Automatic gridding method for microarray images[J].Journal of Theoretical and Applied Information Technology,2014,65(1):235-241.
[7]RUEDA L,REZAEIAN I.A fully automatic gridding method for cDNA microarray images[J].BMC Bioinformatics,2011,12(16):1-17.
[8]ALIAA S E,GHADA E,MOHAMED M E,et al.Segmentation of complementary DNA microarray images using markercontrolled watershed technique[J].International Journal of Computer Applications,2015,110(12):30-34.
[9]MAGULURI L P,RAJAPANTHULA K,SRINIVASU P N.A comparative analysis of clustering based segmentation algorithms in microarray images[J].International Journal of Emerging Science and Engineering,2013,1(5):27-32.
[10]WANGA Zi-dong,ZINEDDIN B,LIANG Jin-ling,et al.cDNA microarray adaptive segmentation[J].Neurocomputing,2014,142(22):408-418.
[11]GIANNAKEAS N,KARVELIS P S,F(xiàn)OTIADIS D I.A classification-based segmentation of cDNA microarray images using support vector machines[C] //The 30th Annual International IEEE EMBS Conference.Vancouver:Springer,2008:875-878.
[12]SHAMS R,RABBANIB H,GAZORC S.A Comparison of x-lets in denoising cDNA microarray images[C]//IEEE International Conference on Acoustic,Speech and Signal Processing.Florence:Springer,2014:2 843-2 847.
[13]HOWLADER T,CHAUBEY Y P.Noise reduction of cDNA microarray images using complex wavelets[J].IEEE Transactions on Image Processing,2010,19(8):1 953-1 967.
[14]CHOYKE P L,DWYER A J,KNOPP M V.Functional tumor imaging with dynamic contrast-enhanced magnetic resonance imaging[J].Journal of Magnetic Resonance Imaging,2003,17(5):509-520.
[15]SAFFARIAN N,ZOU J J.DNA microarray image enhancement using conditional sub-block bi-histogram equalization[C]//IEEE International Conference on Video and Signal Based Surveillance.Sydney:[s.n.],2006:86-91.
[16]尹寧.基因芯片圖像識別系統(tǒng)研究 [D].長春:吉林大學,2012.
[17]STARCK J L,MURTAGH F,CANDES E J,et al.Gray and color image contrast enhancement by the curvelet transform[J].IEEE Transactions on Image Processing,2003,12(6):706-717.
[18]IBRAHIM H,KONG N S P.Brightness preserving dynamic histogram equalization for image contrast enhancement[J]. IEEE Transactions on Consumer Electronics,53(4):1 752-1 758.
[19]BAI X Z,ZHOU F G,XUE B D.Infrared image enhancement through contrast enhancement by using multiscale new top-hat transform[J].Infrared Physics&Technology,2011,54(2):61-69.
[20]SHAO G F,YANG F,ZHANG Q,et al.Using the maximum between-class variance for automatic gridding of cDNA microarray images[J].IEEE/ACM Transactions on Computational Biology and Bioinformatics,2013,10(1):181-192.
A Contrast Enhanced Imaging for cDNA Microarray
LI Tie-jun1,SUN Yue1,SHAO Gui-fang2
(1.College of Automation,Chongqing University,Chongqing 400044,China;2.Department of Automation,Xiamen University,Xiamen 361005,China)
An automatic algorithm for enhanced contrast is proposed for microarray imaging to reduce the low precision of gridding and segmentation caused with low contrast images.Contrast was first computed based on the fourth order moment,and a background gray value estimated.Contrast was thus enhanced on the spot only.Experiments on 79 images drawn from six different data sets were then done.The results show that the proposed method can enhance the image contrast with good robustness without any parameter input or other human intervention.In addition,the gridding accuracy is increased with enhanced contrast,up to a maximum of 25%.
cDNA microarray;imaging;contrast;gridding
TP391.4
A
1673-4432(2015)03-0029-06
(責任編輯 李 寧)
2015-04-08
2015-05-12
國家自然科學基金項目 (61403318,6140138);福建省自然科學基金項目 (2013J01255;2013J01246)
李鐵軍 (1976-),男,工程師,碩士,研究方向為模式識別與智能優(yōu)化處理.E-mail:litiejunxin@gmail.com