高翔 李根 陳程 王高峰 周穎
(長安民生物流股份有限公司,重慶 400020)
質(zhì)檢是一個有助于健康管理機(jī)構(gòu)、醫(yī)院、科研機(jī)構(gòu)減少生產(chǎn)錯誤,進(jìn)而提高生產(chǎn)效率的一個工序。廣義上講這是一種凡是有缺陷的物品都能被檢測并篩選出來的機(jī)器設(shè)備。狹義上講這是一種能處理生產(chǎn)印刷問題的智慧方法。
質(zhì)檢的方案隨著電子學(xué)、計算機(jī)技術(shù)的發(fā)展,進(jìn)入到前所未見的高速發(fā)展階段。其中印刷的質(zhì)檢需求已越來越大,隨著數(shù)字化的發(fā)展,其技術(shù)也越來越成熟。但自動化的印刷質(zhì)檢仍面臨著巨大挑戰(zhàn):(1)耗能將進(jìn)一步下降。在現(xiàn)有的耗能范圍內(nèi)進(jìn)行更多的檢測或保持現(xiàn)有的檢測能力而降低能耗。(2)增加在芯片固定區(qū)域的元件數(shù)量,使得能在芯片面積上進(jìn)行更復(fù)雜化的信號處理,或保持元件數(shù)量不變而進(jìn)一步使芯片變小,并且其檢測速度將會進(jìn)一步上升。(3)將來的技術(shù)可以將微小的機(jī)械裝置與電子元件一起蝕刻在芯片上,稱為微電子機(jī)械系統(tǒng)。將此技術(shù)運(yùn)用于印刷質(zhì)檢系統(tǒng),可能有助于減小印刷質(zhì)檢系統(tǒng)的體積和能耗。(4)印刷質(zhì)檢系統(tǒng)的選配制作已有了新設(shè)想,如可以通過超聲影像掃描技術(shù)進(jìn)行三維成像。由此就可代替常規(guī)的掃描式技術(shù)完成缺陷的檢測。
傳統(tǒng)印刷質(zhì)檢在工業(yè)應(yīng)用中都是由人工肉眼檢測完成,因為其不具備由計算機(jī)自動發(fā)現(xiàn)缺陷的功能,隨人工智能發(fā)展,印刷質(zhì)檢自動化技術(shù)越來越成熟,其應(yīng)用也廣泛起來,其中藥盒印刷字符的質(zhì)檢尤為突出。要進(jìn)行質(zhì)量檢測,首先就需要對印刷字符進(jìn)行識別,印刷字符識別屬于工業(yè)現(xiàn)場字符識別,因為工業(yè)現(xiàn)場環(huán)境的原因,拍攝到的圖像與傳統(tǒng)的文本圖像有比較大區(qū)別。
藥品包裝上的說明,是有明確要求的,對印刷的字體的清晰度可辨識度有很高要求。并且,印刷的說明,不能有錯字漏字等情況,以免錯誤用藥造成難以挽回的后果。藥盒上的印刷字符圖像會出現(xiàn)不清晰,存在噪聲或有粉塵遮擋字符等現(xiàn)象,并且印刷過程字符有時會出現(xiàn)粘連、扭曲甚至倒置或瑕疵雜點(diǎn)等情況,如圖1 所示。傳統(tǒng)的字符分類方法往往只對完整清晰的字符圖像有效,對于印刷字符圖像的識別精度較低。不同功能用途的藥盒,其外觀形狀與其標(biāo)識都不相同,這也為自動識別帶來了難度,如何采用相應(yīng)的圖像識別算法和優(yōu)化方案進(jìn)行質(zhì)量檢測,是迫切需要解決的問題。
圖1 標(biāo)簽?zāi):淖煮wFig.1 Fonts with fuzzy labels
深度學(xué)習(xí)在計算機(jī)視覺主流領(lǐng)域已經(jīng)應(yīng)用的很成熟,但是在工業(yè)領(lǐng)域,還有很多存在這真空區(qū)域。比如產(chǎn)品表面缺陷檢測,近幾年,深度學(xué)習(xí)的多個神經(jīng)網(wǎng)絡(luò)框架,已經(jīng)在產(chǎn)品表面缺陷檢測的中進(jìn)行應(yīng)用,從CNN到Y(jié)OLO,SSD,甚至到語義分割的FCN相關(guān)論文,通過一些技術(shù),對框架進(jìn)行輕量化,對缺陷進(jìn)行分類或檢測。不過,逃不出一個基礎(chǔ):一定要有缺陷樣本可供訓(xùn)練,而且數(shù)量不能太少。并且稀疏編碼、字典學(xué)習(xí)、稀疏自編碼等對表面缺陷進(jìn)行檢測,這類方法很有局限性,主要針對那些有周期性背景紋理的圖像,比如絲織品等。
本文提出一種基于OCR的方法,只依據(jù)已有的正常表面圖像樣本,通過一定的技術(shù)手段對缺陷樣本進(jìn)行檢測。首先對圖像進(jìn)行均值濾波。然后通過GAN完成缺陷數(shù)據(jù)集的補(bǔ)充,最后通過CNN網(wǎng)絡(luò)進(jìn)行判斷,是否存在字符缺陷。本文選用的分類主干網(wǎng)絡(luò)為AlexNet。其網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 AlexNet 網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 AlexNet network structure
AlexNet是一個非常經(jīng)典的深度學(xué)習(xí)卷積網(wǎng)絡(luò)框架。網(wǎng)絡(luò)的每一層都是一個卷積網(wǎng)絡(luò),傳統(tǒng)的方式是使用Sigmod作為激活函數(shù)。為了解決梯度彌散問題,我們使用ReLU替代了Sigmod,在很多網(wǎng)絡(luò)層數(shù)較深的網(wǎng)絡(luò)中,起到很好的效果。其中ReLU公式如下:
我們將藥盒上印刷的說明書,通過光學(xué)傳感器轉(zhuǎn)化為數(shù)字圖像,傳入AlexNet模型,在模型中進(jìn)行前向傳播。最后形成一個一維向量。該向量,代表文字的清晰程度,是對印刷質(zhì)量的判斷。我們在每一層網(wǎng)絡(luò)中都加入了池化層,可以將圖像的干擾模糊化。我們也通過加入LRN層,增強(qiáng)模型的泛化能力。我們使用印刷的說明進(jìn)行測試,其檢測效果,如圖3所示。
圖3 檢測效果Fig.3 Detection effect
我們使用該模型進(jìn)行實(shí)驗,其質(zhì)量判定結(jié)果,正確率達(dá)到了80.2%,證明我們的方法確實(shí)有效,并且有應(yīng)用于工程的可能性。
藥盒包裝上的說明書,本身是有很高的質(zhì)量要求。但印刷過程中,存在諸多問題,我們針對文字印刷質(zhì)量問題,以AlexNet為骨干網(wǎng)絡(luò),設(shè)計模型,對印刷的文字進(jìn)行位置檢測和質(zhì)量判定。實(shí)驗表明該方法有很好的效果,能夠較好地解決質(zhì)量檢測的問題。代替人工完成文字的檢測。本文僅針對字符是否印刷有誤進(jìn)行判斷,在未來,我們會針對標(biāo)簽規(guī)范進(jìn)行檢測。