(浙江美濃世紀(jì)集團(tuán)有限公司,浙江杭州 311100)
自2013 年國(guó)家煙草專賣局發(fā)布了有關(guān)煙草包裝材料回收的文件以來(lái),煙草行業(yè)的工商企業(yè)都加強(qiáng)了煙草瓦楞包裝箱的回收利用。2018年,煙草行業(yè)商業(yè)企業(yè)共向工業(yè)企業(yè)返還卷煙包裝11473.92百萬(wàn)次(不包括非相鄰省份主要品牌的收益),總收益率為94.2%,比上年同期高0.72個(gè)百分點(diǎn)[1-2]。隨著中國(guó)將人工智能推向國(guó)家戰(zhàn)略水平,工業(yè)自動(dòng)化程度不斷提高,工業(yè)企業(yè)的生產(chǎn)方式正在發(fā)生變化,并逐漸從傳統(tǒng)模式向自動(dòng)化智能模式轉(zhuǎn)變[3]。在過去的兩年中,已經(jīng)在人工智能領(lǐng)域開發(fā)和應(yīng)用了許多技術(shù),并且圖像識(shí)別技術(shù)是基于人工智能的代表性技術(shù)之一。卷煙紙箱通常專用于某種產(chǎn)品,因此回收必須梳理產(chǎn)品分類,以實(shí)現(xiàn)逆向物流并返回源頭的工業(yè)公司復(fù)用。對(duì)于如此龐大而瑣碎的回收業(yè)務(wù),我們需要根據(jù)公司的實(shí)際需要提高分揀效率和速度,減少人工判斷并降低回收成本[4]。
當(dāng)前,大多數(shù)人工智能的學(xué)習(xí)準(zhǔn)確性需要大量投資,而自動(dòng)機(jī)器學(xué)習(xí)(AutoML)是減少數(shù)據(jù)預(yù)處理,特征提取,模型選擇,參數(shù)調(diào)整等方面的新興方向。它使企業(yè)可以低成本采用人工智能。通過比較百度的EasyDL,阿里云視覺智能中的圖像識(shí)別,亞馬遜的Amazon SageMaker Ground Truth,谷歌的Google Cloud AutoML,微軟的Custom Vision Services以及其他自動(dòng)化機(jī)器學(xué)習(xí)系統(tǒng)[5],百度EasyDL提供了簡(jiǎn)單的界面和便捷的訪問。因此,在本文中,我們將把百度的EasyDL用作圖形深度學(xué)習(xí)工具,以實(shí)現(xiàn)在卷煙包裝回收中的價(jià)值,并初步探討在其他工業(yè)生產(chǎn)環(huán)節(jié)中的實(shí)現(xiàn)前景。
分類識(shí)別系統(tǒng)的整體結(jié)構(gòu)如圖1所示。傳送帶將要分類的產(chǎn)品運(yùn)送到識(shí)別和檢測(cè)位置。光電傳感器檢測(cè)紙箱的入口,工業(yè)相機(jī)自動(dòng)捕獲延遲的貼標(biāo)位置,以獲取目標(biāo)瓦楞箱貼標(biāo)區(qū)域的原始圖像。離線SDK 通過本地PC 分發(fā)(離線SDK由百度EasyDL平臺(tái)生成),以識(shí)別和判斷所拍攝的圖片并獲得相關(guān)的控制指令。發(fā)送控制指令至變速箱分類控制模塊,對(duì)相關(guān)的異常包裝進(jìn)行分類,并根據(jù)瓦楞箱上的條形碼執(zhí)行產(chǎn)品分類信息收集,并為再次分揀提供信息依據(jù)。
圖1 分類識(shí)別系統(tǒng)的整體結(jié)構(gòu)Fig.1 The overall structure of the classification and recognition system
分揀識(shí)別系統(tǒng)硬件平臺(tái)主要包括:PC一體機(jī)、光感應(yīng)模塊、工業(yè)相機(jī)、條碼識(shí)別模塊、分揀控制模塊、聲光報(bào)警模塊、傳送帶、電源等[6]。
其中,PC一體機(jī)是本地部署的核心,負(fù)責(zé)收集圖像信息和生成控制命令,報(bào)警異常并顯示實(shí)時(shí)結(jié)果,并可以根據(jù)實(shí)際情況計(jì)算塊內(nèi)的對(duì)齊數(shù)量。光電傳感器模塊主要用于裝配線上,以檢查盒子是否已進(jìn)入圖像識(shí)別區(qū)域并觸發(fā)通知信號(hào)。工業(yè)相機(jī)主要用于收集圖像信息。條形碼識(shí)別模塊用于在進(jìn)入前端識(shí)別和分類鏈接后對(duì)不同的產(chǎn)品包裝進(jìn)行重新分類。分類控制模塊用于對(duì)未貼標(biāo)簽的產(chǎn)品進(jìn)行分類或?qū)Ξa(chǎn)品進(jìn)行分類,聲光報(bào)警模塊用于在系統(tǒng)異常時(shí)產(chǎn)生報(bào)警。
分揀識(shí)別系統(tǒng)因?yàn)榭紤]到很多工廠實(shí)際情況不具備上網(wǎng)條件,所以軟件基于C#和百度EasyDL的離線SDK進(jìn)行開發(fā)。后期基于百度開放平臺(tái)飛槳(PaddlePaddle)以及Python做了部分深度學(xué)習(xí)模型的進(jìn)一步嘗試,用來(lái)改進(jìn)和提升異常外觀的判斷和學(xué)習(xí)效率提升。
整個(gè)過程可視化且易于操作。訓(xùn)練用的圖片和測(cè)試數(shù)據(jù)準(zhǔn)備就緒后,您可以在幾分鐘內(nèi)獲得自定義模型。它分為四個(gè)階段。(1)數(shù)據(jù)準(zhǔn)備;(2)模型創(chuàng)建;(3)模型訓(xùn)練;(4)模型發(fā)布。
我們使用百度EasyDL定制的培訓(xùn)平臺(tái)對(duì)瓦楞箱圖像進(jìn)行深度學(xué)習(xí)。該平臺(tái)現(xiàn)在支持深度學(xué)習(xí),例如:圖像分類、對(duì)象檢測(cè)、聲音分類和文本分類。因?yàn)樗趫D像中被識(shí)別,所以本文使用“對(duì)象檢測(cè)”模型。對(duì)象檢測(cè)模型可以識(shí)別圖像中對(duì)象的名稱,數(shù)量和位置,并且可以識(shí)別圖像中具有多個(gè)對(duì)象的場(chǎng)景。當(dāng)平臺(tái)用戶進(jìn)入平臺(tái)時(shí),它首先創(chuàng)建一個(gè)模型和數(shù)據(jù)集,上傳一個(gè)紙板箱的圖像,并在數(shù)據(jù)集管理中顯示該圖像。其次,訓(xùn)練模型并測(cè)試其有效性。最后,在線模型獲取API或離線SDK。
創(chuàng)建模型后,在“數(shù)據(jù)中心”中創(chuàng)建一個(gè)數(shù)據(jù)集,在“數(shù)據(jù)集管理”中找到剛創(chuàng)建的數(shù)據(jù)集,然后上傳捕獲的靜止圖像。使用EasyDL平臺(tái)的標(biāo)記工具拖移框架,以構(gòu)圖框。
在為所有照片添加注釋后,通過在“模型中心”中選擇“訓(xùn)練模型”來(lái)訓(xùn)練模型。EasyDL平臺(tái)將使用模型數(shù)據(jù)中70%照片進(jìn)行訓(xùn)練,其余30%照片用于測(cè)試模型的有效性,培訓(xùn)大約需要3個(gè)小時(shí)。
mAP是EasyDL培訓(xùn)平臺(tái)中衡量模型效果的指標(biāo)。對(duì)于物體檢測(cè)任務(wù),每一類檢測(cè)目標(biāo)都可以計(jì)算出精確率和召回率,在不同閾值下多次計(jì)算或試驗(yàn),每個(gè)類都可以得到一條P-R曲線,曲線下的面積就是AP的值?!癿ean”的意思是對(duì)每個(gè)類的AP再求平均,得到的就是mAP值,mAP值越接近于1,模型效果越好。精確率為正確識(shí)別的物體數(shù)與識(shí)別物體總數(shù)之比,召回率為正確識(shí)別的物體數(shù)與真實(shí)物體數(shù)之比。
在物體檢測(cè)模型中,我們發(fā)現(xiàn)使用百度超大規(guī)模預(yù)訓(xùn)練模型的YOLOv3_DarkNet 相比普通模型在各類數(shù)據(jù)集上平均提升5.12%,使用百度超大規(guī)模預(yù)訓(xùn)練模型的Faster_RCNN,相比于普通預(yù)訓(xùn)練模型,平均提升1.11%。并且,在物體檢測(cè)方向,新增了Cascade_Rcnn_ResNet50_FPN模型、YOLOv3_ResNet50vd_DCN模型、YOLOv3_MobileNetv1網(wǎng)絡(luò),以及基于百度超大規(guī)模預(yù)訓(xùn)練模型訓(xùn)練出來(lái)的YOLOv3_Darknet、Faster_R-CNN_ResNet50_FP,其中,Cascade_Rcnn_ResNet50_FPN通過級(jí)聯(lián)多個(gè)檢測(cè)器以及設(shè)置不同IOU 的重采樣機(jī)制,使得檢測(cè)器的精度、和定位的準(zhǔn)確度進(jìn)一步提升。因增加了可形變卷積,對(duì)不規(guī)則紙箱和破損的檢測(cè)效果也有一定的正向提升。
在AI產(chǎn)業(yè)化過程中,新興IT企業(yè)已經(jīng)積累了大量?jī)?yōu)質(zhì)的算法框架、模型和數(shù)據(jù),這些優(yōu)質(zhì)的AI技術(shù)正是產(chǎn)業(yè)AI化過程中行業(yè)用戶所需要的,聚合AI最強(qiáng)算力平臺(tái)、最優(yōu)質(zhì)的算法模型開發(fā)能力和最優(yōu)質(zhì)的集成、部署和服務(wù)能力,從而支撐和加速各行業(yè)、各產(chǎn)業(yè)與人工智能的融合,讓各個(gè)行業(yè)、各個(gè)產(chǎn)業(yè)具備可感知、自學(xué)習(xí)、可進(jìn)化的能力,最終幫助用戶完成業(yè)務(wù)智能轉(zhuǎn)型升級(jí)。自動(dòng)化學(xué)習(xí)平臺(tái)在卷煙包裝箱循環(huán)回收環(huán)節(jié)取消不必要的工序、合并工序、減少搬運(yùn)、安排最佳的順序、找出最經(jīng)濟(jì)的移動(dòng)方法、盡可能地減少在制品的貯存供應(yīng)鏈壓力。
EasyDL將EasyDL圖形開發(fā)的易用性及編程的靈活性結(jié)合在一起。在提供了很多便利的同時(shí),又將控制權(quán)交給了客戶,讓客戶可以更加靈活和簡(jiǎn)便的使用深度學(xué)習(xí)技術(shù),激發(fā)人工智能+的無(wú)限可能,而PaddlePaddle是百度主推的開源機(jī)器深度學(xué)習(xí)平臺(tái)。它是Parallel Asynchronous Distributed Deep Learning的簡(jiǎn)稱,也為我們提供了大量的深度學(xué)習(xí)模型庫(kù)。數(shù)字化和機(jī)器學(xué)習(xí)是現(xiàn)代網(wǎng)絡(luò)信息技術(shù)不斷發(fā)展的產(chǎn)物,該技術(shù)如果在印刷包裝行業(yè)得到良好的應(yīng)用,不僅可以大大提高印刷包裝產(chǎn)品的整體質(zhì)量和水平,而且也可以大大減少印刷包裝整個(gè)過程的時(shí)間消耗,提升效率實(shí)現(xiàn)降本增效,從而帶動(dòng)整個(gè)印刷包裝行業(yè)的良性發(fā)展。因此,我們可以大膽地預(yù)料,在印刷包裝行業(yè)的未來(lái)發(fā)展中,人工智能作為未來(lái)工廠的數(shù)字印刷包裝技術(shù)之一將發(fā)揮舉足輕重的作用,更加適合當(dāng)前的市場(chǎng)和技術(shù)發(fā)展需求。
卷煙包裝箱回收是供應(yīng)鏈包裝逆向物流的一種,由于涉及到工商企業(yè)與其他單位,因此整個(gè)流程比較復(fù)雜,需要考慮各方的工作任務(wù),并權(quán)衡各方的利益。對(duì)于卷煙箱的回收工作,一方面需要結(jié)合企業(yè)自身的特點(diǎn),選擇合適的運(yùn)行管理機(jī)制,做好各機(jī)構(gòu)的分工和工序之間的銜接,保證整個(gè)系統(tǒng)的順暢運(yùn)行。另外,對(duì)于煙箱回收利用的作業(yè)方式也要進(jìn)行改善,保證紙箱在經(jīng)歷所有的環(huán)節(jié)之后還能保持完好的狀態(tài),相關(guān)設(shè)備也要適應(yīng)循環(huán)使用的紙箱的作業(yè)要求。