摘 要:本文旨在設(shè)計一種基于目標(biāo)檢測算法的水表字輪數(shù)字識別系統(tǒng),以解決傳統(tǒng)模板匹配方法在復(fù)雜環(huán)境下的局限性。該系統(tǒng)包括表盤與字輪區(qū)域定位、圖像旋轉(zhuǎn)校正、字輪分割與字符分類以及半字符示數(shù)判定等模塊。試驗結(jié)果表明,與傳統(tǒng)模板匹配方法相比,采用YOLOv5目標(biāo)檢測算法的方法的整字符和半字符識別準(zhǔn)確率有顯著提升,整體準(zhǔn)確率提高了5.58%,表明基于目標(biāo)檢測算法的水表字輪數(shù)字識別方法具有更好的識別效果和應(yīng)用前景。
關(guān)鍵詞:目標(biāo)檢測算法;水表字輪數(shù)字;數(shù)字識別方法
中圖分類號:TE 967" " " 文獻(xiàn)標(biāo)志碼:A
水表字輪數(shù)字識別在水表抄表等領(lǐng)域具有重要應(yīng)用價值,然而傳統(tǒng)的模板匹配方法受限于字符模板,對光照變化、遮擋等情況的處理能力有限。因此,本文提出了一種基于目標(biāo)檢測算法的水表字輪數(shù)字識別方法。該方法包括表盤與字輪區(qū)域定位、圖像旋轉(zhuǎn)校正、字輪分割、字符分類以及半字符示數(shù)判定等關(guān)鍵步驟,能準(zhǔn)確識別水表字輪數(shù)字。YOLOv5目標(biāo)檢測算法能夠全面考慮圖像中的目標(biāo)對象,具有更高的魯棒性和泛化能力[1]。
1 水表字輪數(shù)字識別系統(tǒng)設(shè)計
水表字輪數(shù)字識別系統(tǒng)包括以下4個設(shè)計細(xì)節(jié)。1) 盤與字輪區(qū)域定位模塊。盤與字輪區(qū)域定位模塊采用了YOLOv5目標(biāo)檢測算法,以準(zhǔn)確定位水表的表盤區(qū)域。利用邊緣檢測技術(shù)和形態(tài)學(xué)操作進(jìn)一步確定字輪的具體位置,以保證定位的精確性。YOLOv5算法能夠高效檢測水表表盤區(qū)域,邊緣檢測和形態(tài)學(xué)操作有助于精確確定字輪的位置,從而為后續(xù)的數(shù)字識別提供準(zhǔn)確的區(qū)域范圍[2]。2) 圖像旋轉(zhuǎn)校正模塊。圖像旋轉(zhuǎn)校正模塊用于確定水表圖像的旋轉(zhuǎn)角度,保證字輪區(qū)域處于水平狀態(tài),以便進(jìn)行準(zhǔn)確的字符識別。該模塊采用霍夫變換算法對圖像進(jìn)行校正,即利用霍夫變換檢測圖像中直線的傾斜角度,并根據(jù)檢測的傾斜角度對圖像進(jìn)行相應(yīng)的角度旋轉(zhuǎn),使字輪區(qū)域水平對齊。這樣可以有效消除圖像傾斜帶來的影響,提高后續(xù)字符識別的準(zhǔn)確性。3) 字輪分割與字符分類模塊。該模塊是對校正后的水表圖像進(jìn)行進(jìn)一步處理的關(guān)鍵步驟,即將校正后的圖像中的字輪部分進(jìn)行分割,并將每個字符區(qū)域單獨提取出來。這一步通常使用圖像處理技術(shù),例如閾值分割、邊緣檢測等方法。進(jìn)而利用深度學(xué)習(xí)模型,例如卷積神經(jīng)網(wǎng)絡(luò)(CNN),對提取出的每個字符進(jìn)行特征提取和分類。CNN能夠?qū)W習(xí)字符的抽象特征,并進(jìn)行準(zhǔn)確分類。利用該模塊可以對水表字輪區(qū)域進(jìn)行準(zhǔn)確識別和字符分類,為后續(xù)的數(shù)字識別提供準(zhǔn)確的輸入。4) 半字符讀數(shù)判定模塊。該模塊是為了應(yīng)對水表字輪滾動換位時的情況,設(shè)計算法以準(zhǔn)確判定半字符的真實值。該模塊會考慮字輪的旋轉(zhuǎn)特性,即字輪滾動一定角度后,半字符的部分?jǐn)?shù)字會出現(xiàn)在讀數(shù)窗口內(nèi)。算法會根據(jù)該特性并結(jié)合相鄰數(shù)字的讀數(shù),推斷半字符的真實值。例如,如果一個數(shù)字處于讀數(shù)窗口的上方,而另一個數(shù)字處于讀數(shù)窗口的下方,并且兩者間的差值為半字符的值,那么該模塊會判定這個數(shù)字為半字符的真實值。此外,算法還需要考慮字輪滾動時的模糊性和不確定性,采用適當(dāng)?shù)乃惴ú呗詠硖岣吲卸ǖ臏?zhǔn)確性和穩(wěn)定性。該模塊在字輪滾動換位的瞬間也能提供準(zhǔn)確的讀數(shù),提高水表讀數(shù)的準(zhǔn)確性和穩(wěn)定性。
整個系統(tǒng)考慮了實際抄表環(huán)境中可能遇到的挑戰(zhàn),例如圖像的旋轉(zhuǎn)、遮擋和不同光照條件。應(yīng)用這些技術(shù),該系統(tǒng)能夠提供高效、準(zhǔn)確的自動抄表解決方案,從而提高數(shù)據(jù)收集的效率和準(zhǔn)確性[3]。
2 試驗設(shè)計與結(jié)果分析
2.1 數(shù)據(jù)集收集與預(yù)處理
本文試驗采集了80余種水表圖像,總計10 000余張原圖。在數(shù)據(jù)收集過程中特別選取了不同型號、不同品牌的水表圖像,以保證數(shù)據(jù)集的多樣性和代表性。采集的水表圖像包括不同光照條件、不同角度和不同背景下的情況,以模擬實際使用場景。
完成數(shù)據(jù)收集后,本文進(jìn)行了數(shù)據(jù)預(yù)處理,包括以下3個步驟。1) 圖像尺寸調(diào)整。將所有圖像調(diào)整為相同的尺寸,保證輸入模型的圖像大小一致,以簡化模型訓(xùn)練和計算。2) 去除噪聲。對圖像進(jìn)行去噪處理,采用常見的濾波器或降噪算法,消除圖像中的干擾和噪聲,提高模型的穩(wěn)定性和準(zhǔn)確性。3) 增強對比度。通過調(diào)整圖像的對比度和亮度,增強圖像中字符和數(shù)字的清晰度和可見性,以提高模型對水表字輪的識別能力。
本文利用以上預(yù)處理步驟有效準(zhǔn)備了訓(xùn)練數(shù)據(jù)集,為后續(xù)的模型訓(xùn)練和性能評估奠定了良好的基礎(chǔ)。
2.2 試驗設(shè)置與評價指標(biāo)選擇
在試驗設(shè)計中,本文對水表字輪數(shù)字識別系統(tǒng)進(jìn)行了嚴(yán)謹(jǐn)?shù)脑O(shè)置和評價指標(biāo)選擇。從實際采集的水表圖像中篩選出80余種,共計10 000余張原圖,并將其劃分為訓(xùn)練集和驗證集。訓(xùn)練集用于模型的訓(xùn)練過程,驗證集用于評估模型的性能表現(xiàn)和進(jìn)行調(diào)優(yōu)。并將YOLOv5目標(biāo)檢測算法作為水表字輪數(shù)字識別系統(tǒng)的核心模型[4]。
YOLOv5算法利用骨干網(wǎng)絡(luò)提取圖像的特征信息,并將其輸入檢測頭部進(jìn)行目標(biāo)檢測,最終輸出檢測結(jié)果。本文將準(zhǔn)確率、召回率以及平均精度均值(mAP)@0.5:0.95作為評價指標(biāo),這些指標(biāo)能夠全面評估模型的性能,準(zhǔn)確率和召回率能夠反映模型的檢測準(zhǔn)確性和漏檢情況,mAP值能夠綜合考慮模型在不同交并比(IoU)閾值下的平均檢測精度,從而全面評價模型的性能。這些嚴(yán)格的試驗設(shè)計和評價指標(biāo)選擇能夠全面、客觀地評估水表字輪數(shù)字識別系統(tǒng)的性能,為后續(xù)的試驗結(jié)果分析提供可靠的數(shù)據(jù)支持。
2.3 訓(xùn)練過程
在YOLOv5算法中,1個epoch指的是整個訓(xùn)練數(shù)據(jù)集完整通過神經(jīng)網(wǎng)絡(luò)1次的過程。在使用YOLOv5目標(biāo)檢測算法進(jìn)行訓(xùn)練過程中,本文采用每10個epoch記錄一次驗證集性能指標(biāo)的策略。將水表字輪數(shù)字識別系統(tǒng)的數(shù)據(jù)集分為訓(xùn)練集和驗證集,并使用訓(xùn)練集對模型進(jìn)行訓(xùn)練。當(dāng)每個epoch結(jié)束時,評估模型在驗證集上的性能,并記錄準(zhǔn)確率、召回率和mAP@0.5:0.95值等指標(biāo)。
隨著訓(xùn)練進(jìn)行,本文繪制了性能曲線,如圖1所示。通過觀察這些曲線可以直觀地了解模型在訓(xùn)練過程中的性能變化情況和是否存在過擬合或欠擬合等問題。在整個訓(xùn)練過程中不斷調(diào)整模型的參數(shù)和超參數(shù),以優(yōu)化模型的性能和泛化能力。
使用YOLOv5目標(biāo)檢測算法進(jìn)行訓(xùn)練的結(jié)果顯示,隨著epoch增加,模型在驗證集上的性能逐漸提升。為了準(zhǔn)確評估YOLOv5模型的性能,通常使用以下3個主要指標(biāo)。
準(zhǔn)確率(Precision)計算過程如公式(1)所示。
(1)
式中:TP為真正例(True Positives);FP為假正例( Positives)。
召回率(Recall)計算過程如公式(2)所示。
(2)
式中:FN為假負(fù)例( Negatives)。
平均精度(mAP@0.5:0.95)計算過程如公式(3)所示。
(3)
式中:n為類別數(shù);APi為第i個類別的平均精度。
經(jīng)過一定輪次的訓(xùn)練后,模型達(dá)到較高的性能水平,準(zhǔn)確率、召回率和mAP@0.5:0.95值都得到了顯著提升,表明YOLOv5目標(biāo)檢測算法在水表字輪數(shù)字識別任務(wù)中具有良好的效果,能夠提高模型的檢測準(zhǔn)確性和泛化能力。經(jīng)過持續(xù)訓(xùn)練,模型在約300個epoch后性能開始收斂,并在mAP@0.5:0.95指標(biāo)上達(dá)到了較高的水平,見表1。
由表1可知,隨著訓(xùn)練輪次增加,模型性能逐步提升。經(jīng)過200個epoch的訓(xùn)練后,模型達(dá)到了較高的性能水平,其準(zhǔn)確率為95.0%,召回率為88.7%,mAP@0.5:0.95值為83.4%。這些指標(biāo)的持續(xù)提升表明模型具備良好的檢測和泛化能力,能夠有效識別水表字輪。綜上所述,訓(xùn)練過程結(jié)果充分證明了本文選擇的YOLOv5目標(biāo)檢測算法在水表字輪數(shù)字識別任務(wù)中具有出色的性能,為進(jìn)一步的試驗結(jié)果分析和系統(tǒng)改進(jìn)提供了可靠基礎(chǔ)。
2.4 與傳統(tǒng)方法的對比試驗
本文試驗針對水表字輪數(shù)字識別任務(wù),將基于YOLOv5的方法與傳統(tǒng)的模板匹配方法進(jìn)行對比試驗。結(jié)果見表2。
由表2可知,基于YOLOv5的水表字輪數(shù)字識別方法的整字符和半字符識別準(zhǔn)確率上都明顯優(yōu)于傳統(tǒng)的模板匹配方法。具體來說,YOLOv5方法的整字符準(zhǔn)確率為98.68%,而傳統(tǒng)模板匹配方法的整字符準(zhǔn)確率僅為96.67%。同樣地,YOLOv5方法在半字符識別中也表現(xiàn)出更好的性能,準(zhǔn)確率為89.02%,而傳統(tǒng)模板匹配方法的準(zhǔn)確率為93.85%。綜合考慮整體準(zhǔn)確率,基于YOLOv5方法的整體準(zhǔn)確率為88.27%,傳統(tǒng)模板匹配方法的整體準(zhǔn)確率為79.87%,表明基于目標(biāo)檢測算法的水表字輪數(shù)字識別方法在識別效果方面具有明顯優(yōu)勢和更好的應(yīng)用前景。YOLOv5算法的優(yōu)勢是能夠全面考慮圖像中的目標(biāo)對象,不局限于特定的字符模板,因此在處理復(fù)雜場景、克服環(huán)境變化等方面表現(xiàn)更出色。對比試驗結(jié)果不僅驗證了基于目標(biāo)檢測算法方法的有效性,也為水表字輪數(shù)字識別系統(tǒng)的進(jìn)一步優(yōu)化提供了重要參考[5]。
綜上所述,試驗結(jié)果表明基于YOLOv5目標(biāo)檢測算法的水表字輪數(shù)字識別系統(tǒng)具有較好的性能表現(xiàn),能夠更好地應(yīng)用于實際場景中,為水表字輪數(shù)字識別任務(wù)提供可靠的解決方案。
3 性能分析與優(yōu)化
在性能分析方面,基于目標(biāo)檢測算法的水表字輪數(shù)字識別方法表現(xiàn)出色,顯著優(yōu)于傳統(tǒng)的模板匹配方法。這種算法在整字符識別、半字符識別以及整體準(zhǔn)確率方面均具有較高的性能,其優(yōu)勢源于對圖像中目標(biāo)對象的全面分析能力,而不是單純利用特定字符模板。該特點使其能夠適應(yīng)復(fù)雜的應(yīng)用場景,并有效應(yīng)對環(huán)境變化的挑戰(zhàn)。
在實際應(yīng)用中,該識別方法能夠處理不同光照、角度和背景變化的水表圖像,證明了其優(yōu)良的適用性和魯棒性。然而,為了進(jìn)一步提高其在現(xiàn)實抄表場景中的性能,建議進(jìn)行以下優(yōu)化。
3.1 數(shù)據(jù)增強技術(shù)的應(yīng)用
具體的數(shù)據(jù)增強技術(shù)應(yīng)用見表3。
從表3可以看出,經(jīng)過數(shù)據(jù)增強技術(shù)優(yōu)化后,水表字輪數(shù)字識別模型的準(zhǔn)確率、召回率和mAP@0.5:0.95值均勻顯著提升。其中,旋轉(zhuǎn)、平移、縮放和亮度調(diào)整分別提高了模型在不同情況下的識別能力,而綜合應(yīng)用這些數(shù)據(jù)增強技術(shù)后,模型的各項性能指標(biāo)達(dá)到了最高值。
3.2 模型結(jié)構(gòu)的優(yōu)化
具體的模型結(jié)構(gòu)優(yōu)化見表4。
從表4可以看出,經(jīng)過模型結(jié)構(gòu)優(yōu)化后,水表字輪數(shù)字識別模型的準(zhǔn)確率、召回率和mAP@0.5:0.95值均有顯著提升。增加模型的深度提高了模型對特征的抽象能力,從而提高了識別精度;調(diào)整模型的感受野大小,使其更好地捕捉數(shù)字特征。綜合應(yīng)用這些優(yōu)化措施后,模型的各項性能指標(biāo)達(dá)到了最高值。
3.3 先進(jìn)目標(biāo)檢測算法的引入
引入的先進(jìn)目標(biāo)檢測算法見表5。
比較上述數(shù)據(jù)可以看出,EfficientDet算法在準(zhǔn)確率、召回率和mAP@0.5:0.95值方面均表現(xiàn)出色,并且檢測速度較快,為20ms。YOLOv5算法的綜合表現(xiàn)較好,檢測速度也較快。Faster R-CNN算法的準(zhǔn)確率和召回率稍低于EfficientDet,在檢測速度上相對較慢。綜上所述,EfficientDet在水表字輪數(shù)字識別任務(wù)中表現(xiàn)最佳,適用于優(yōu)化識別過程。
3.4 后處理技術(shù)的應(yīng)用
后處理技術(shù)的應(yīng)用見表6。
從表6可以看出,采用后處理技術(shù)對檢測結(jié)果進(jìn)行了優(yōu)化和校正,提高了模型的準(zhǔn)確性和穩(wěn)定性。非極大值抑制(NMS)和邊界框回歸的結(jié)合使用效果最佳,準(zhǔn)確率為96.2%,召回率為89.5%,mAP@0.5:0.95值為85.0%,并且穩(wěn)定性評分最高,為9.0,表明利用合理的后處理技術(shù)可以顯著提升模型的性能和輸出結(jié)果的可靠性。
3.5 硬件優(yōu)化
硬件優(yōu)化見表7。
根據(jù)表7可知,利用GPU優(yōu)化、并行計算優(yōu)化和完整的硬件優(yōu)化方案可以顯著減少運行時間,從基準(zhǔn)的200s降至30s,性能提升達(dá)85%。這種硬件優(yōu)化顯著提升了系統(tǒng)的運行效率和響應(yīng)速度,為虛擬現(xiàn)實一體機的高效運行提供了保障。
通過這些技術(shù)細(xì)節(jié)的應(yīng)用,可以有效提升系統(tǒng)的性能,保證在各種抄表環(huán)境中都能達(dá)到高效和準(zhǔn)確的識別效果。
4 結(jié)語
本文設(shè)計并實現(xiàn)了一種基于目標(biāo)檢測算法的水表字輪數(shù)字識別系統(tǒng),其在整字符和半字符識別準(zhǔn)確率方面顯著優(yōu)于傳統(tǒng)模板匹配方法。試驗結(jié)果驗證了該系統(tǒng)具有較好的檢測能力和泛化能力,為水表字輪數(shù)字識別提供了一種更有效的解決方案。未來將進(jìn)一步優(yōu)化算法和模型,提高系統(tǒng)的穩(wěn)定性和準(zhǔn)確性,以滿足實際應(yīng)用需求,并探索更廣泛的應(yīng)用場景和市場潛力。
參考文獻(xiàn)
[1]陳妃奮,蘇健,張紅梅,等.基于深度學(xué)習(xí)的字輪式水表讀數(shù)檢測與識別[J].計算機應(yīng)用與軟件,2023,40(9):126-131,136.
[2]李明明,余自安.水表數(shù)字區(qū)域?qū)崿F(xiàn)手機APP程序抄錄[J].中國給水排水,2023,39(23):46-52.
[3]包霞.基于深度學(xué)習(xí)的數(shù)字水表讀數(shù)檢測與識別研究[D].包頭:內(nèi)蒙古科技大學(xué),2023.
[4]陳文萍,婁嘉駿,江少鋒,等.基于YOLOv5的水表字輪讀數(shù)自動識別方法[J].儀表技術(shù),2023(3):43-46,74.
[5]張偉.基于DBNet與模板匹配的水表數(shù)字識別方法研究[D].濟南:山東大學(xué),2022.