• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      一種基于機(jī)器學(xué)習(xí)的經(jīng)濟(jì)數(shù)據(jù)識(shí)別方法

      2018-06-28 09:04:54
      關(guān)鍵詞:矩形分類器投影

      (泉州經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院 信息技術(shù)系,福建 泉州 362000)

      0 引 言

      隨著人工智能與大數(shù)據(jù)的不斷發(fā)展,對(duì)海量的數(shù)據(jù)進(jìn)行實(shí)時(shí)識(shí)別與分析,并從中獲取有效的信息已經(jīng)成為計(jì)算機(jī)領(lǐng)域研究的熱點(diǎn)課題。在日常的經(jīng)濟(jì)活動(dòng)中,需要對(duì)外界的如計(jì)算機(jī)、觸摸屏、經(jīng)濟(jì)管理系統(tǒng)等的LED顯示信息或者經(jīng)濟(jì)報(bào)表,股票,基金數(shù)據(jù)進(jìn)行有效的存儲(chǔ)以及記錄,該工作一直以來都是采用傳統(tǒng)人工方式完成,由于經(jīng)濟(jì)數(shù)據(jù)量過大,時(shí)間緊迫,人員的工作存在任務(wù)繁重、效率低下等一系列問題,不可避免的造成一定的錯(cuò)誤。因此,結(jié)合機(jī)器學(xué)習(xí)與人工智能算法,建立一套能夠自動(dòng)識(shí)別經(jīng)濟(jì)數(shù)字的智能系統(tǒng)是發(fā)展的必然趨勢(shì)[1-2]。

      筆者以某款股票分析軟件為例,提出了一種基于機(jī)器學(xué)習(xí)的數(shù)字識(shí)別方法,很好地解決了上述存在的LED顯示數(shù)據(jù)識(shí)別以及存儲(chǔ)問題。

      1 數(shù)字識(shí)別的總體方案

      提出的識(shí)別算法是以數(shù)字圖像為主體進(jìn)行的研究,其總體識(shí)別算法流程如圖1所示,主要包括數(shù)據(jù)采集、目標(biāo)定位、特征提取、學(xué)習(xí)模型訓(xùn)練以及數(shù)字預(yù)測(cè)。

      首先通過相機(jī)實(shí)時(shí)采集LED顯示相應(yīng)區(qū)域的圖像,采用人工ROI的方式劃分識(shí)別區(qū)域,其采集圖如圖2所示,每個(gè)矩形框?yàn)槿斯ぴO(shè)置ROI的區(qū)域顯示。

      圖1 經(jīng)濟(jì)數(shù)據(jù)識(shí)別方法的總體流程圖

      然后采用水平投影法定位數(shù)字區(qū)域與分割單個(gè)目標(biāo),對(duì)特殊的符號(hào)以及小數(shù)點(diǎn)采用其自身的幾何特性定位到其位置,提取歸一化后目標(biāo)的投影特征分布,將其作為學(xué)習(xí)模型的輸入特征。學(xué)習(xí)模型主要分為訓(xùn)練與預(yù)測(cè)兩個(gè)階段,訓(xùn)練階段用于生成具體的數(shù)字判別模型,因?yàn)镾VM是監(jiān)督學(xué)習(xí),因此要提前對(duì)樣本空間對(duì)樣本進(jìn)行標(biāo)記,然后對(duì)數(shù)字進(jìn)行類別預(yù)測(cè),最后用完成經(jīng)濟(jì)數(shù)據(jù)的識(shí)別。

      2 圖像前期處理

      2.1 圖像預(yù)處理

      為了得到更加穩(wěn)健的目標(biāo)特征,圖像的預(yù)處理環(huán)節(jié)是必不可少的,識(shí)別系統(tǒng)主要涉及的預(yù)處理技術(shù)包括灰度化、中值濾波、開運(yùn)算以及門限閾值處理,主要作用分別如下[3-5]。

      圖2 經(jīng)濟(jì)數(shù)據(jù)的采集以及人工ROI設(shè)置分布圖

      (1)灰度特征相比其他特征,對(duì)外界環(huán)境的干擾具有更強(qiáng)魯棒性,且相機(jī)采集的數(shù)字圖像如圖2所示,圖像的質(zhì)量也比較好,采用多特征策略會(huì)降低識(shí)別系統(tǒng)的實(shí)時(shí)性。

      (2)在采集圖像的過程中,不可避免地帶來椒鹽噪聲,這樣會(huì)影響整個(gè)圖像的質(zhì)量。中值濾波不僅可以保護(hù)圖像的細(xì)節(jié),而且可以較好地消除椒鹽噪聲,采用卷積核為3×3中值濾波對(duì)數(shù)字圖像進(jìn)行處理。

      (3)開運(yùn)算是形態(tài)學(xué)的一種操作機(jī)制,包含兩步:先腐蝕再膨脹,腐蝕可以消除預(yù)處理留下的微小瑕疵,再采用膨脹結(jié)構(gòu)元素對(duì)目標(biāo)進(jìn)行并集處理,填充或者連接微小目標(biāo)引起空洞或毛刺,也采用3×3的矩形結(jié)構(gòu)元素進(jìn)行處理。

      (4)由于數(shù)字采集圖像的前后背景對(duì)比度較高,采用門限閾值對(duì)定位后的圖像進(jìn)行處理,以滿足實(shí)際的分割要求,取閾值T=60。圖3分別是圖1人工設(shè)置定位“創(chuàng)業(yè)板”指數(shù)的ROI圖,中值濾波后灰度化圖以及開運(yùn)算處理后的閾值化圖,如下圖(a)、(b)、(c)所示。

      2.2 目標(biāo)的定位

      數(shù)字識(shí)別系統(tǒng)的目標(biāo)定位主要是兩種類型,分別為識(shí)別區(qū)域的定位以及單個(gè)目標(biāo)的定位[6]。

      (1)由于相機(jī)與LED屏幕的相對(duì)位置關(guān)系固定,根據(jù)成像原理,識(shí)別區(qū)域的定位可通過人工先驗(yàn)ROI的方式確定,這樣不僅可以快速定位到待識(shí)別區(qū)域,而且大大降低了識(shí)別系統(tǒng)因?yàn)槎ㄎ凰惴ǖ臅r(shí)間消耗。

      (2)數(shù)字定位主要是通過水平投影的方法來確定,其主要原理是計(jì)算圖像的像素值在水方向的投影,其計(jì)算公式如式(1)所示,J為圖像豎直方向的最大高度,h(i)為圖像的水平投影函數(shù)。

      (1)

      由圖3(c)可以發(fā)現(xiàn),數(shù)字與符號(hào)之間的區(qū)域在水平投影的h(i)的值為0,根據(jù)該原理,可以將h(i)在水平方向變化對(duì)應(yīng)的波谷處作為分割的目標(biāo)位置。為方便顯示,假設(shè)投影值不為0的位置h(i)分布值相同,圖3(c)對(duì)應(yīng)的h(i)的空間分布圖4(a)為如下所示,圖4(b)為每個(gè)分割后的目標(biāo)用矩形來進(jìn)行標(biāo)識(shí)。

      (3)小數(shù)點(diǎn)的定位是數(shù)值識(shí)別關(guān)鍵問題,一旦發(fā)生錯(cuò)誤,將會(huì)造成巨大的經(jīng)濟(jì)損失,主要結(jié)合小數(shù)點(diǎn)自身的幾何特性,通過目標(biāo)的長(zhǎng)寬比、圓度以及矩形度約束來定位小數(shù)點(diǎn)的位置。其具體的計(jì)算方式如式(2)所示。

      Ga=h/w
      Gc=4A/(π×(w2+h2))
      Gr=A/(w×h)

      (2)

      h與w分別是目標(biāo)最小外接矩形的長(zhǎng)度與寬度,A為目標(biāo)輪廓的面積,Gr是輪廓面積與最小外接矩形面積的比值作為矩形度的衡量,Gr是自身面積與最小外接矩形所對(duì)的外接圓的比值作為圓度的衡量。由于小數(shù)點(diǎn)的外接矩形獨(dú)立于輪廓而存在,其具有很好地包絡(luò)性質(zhì),因此使定位的算法更加魯棒,圖4(b)紅色矩形為標(biāo)識(shí)的小數(shù)點(diǎn)的定位位置。根據(jù)目標(biāo)自身的特性,各個(gè)閾值的標(biāo)準(zhǔn)Ga、Gc、Gr分別為0.85,0.8以及0.9。

      3 投影特征提取

      由于分割后圖像的尺度存在差異,因此造成了目標(biāo)特征在維度上的差異,為解決該問題,采用雙線性插值對(duì)分割目標(biāo)進(jìn)行歸一化處理,考慮到圖像的失真度以及特征提取的維度,具體做法是:將每個(gè)分割目標(biāo)歸一化為24×24的圖像,利用上節(jié)得到的h(k)投影作為目標(biāo)的特征。為方便區(qū)分,在此定義為x(k),k為特征向量維度的索引,因此每個(gè)目標(biāo)都會(huì)形成一個(gè)維度為1×24的特征向量。

      為了驗(yàn)證特征向量的表征能力,將圖4(b)中的數(shù)字x(k)在二維空間表示出來,從左向右的特征分布圖5圖所示。不同的波形表示數(shù)字特征向量的分布,可以看到投影特征向量的分布可以很好地表現(xiàn)出不同目標(biāo)之間的差異性,十分有利于后續(xù)分類器的分類。同時(shí)也使分類器的泛化能力得到提高,然后將每個(gè)目標(biāo)得到的特征x(k)作為SVM分類器的輸入。

      圖3 經(jīng)濟(jì)數(shù)據(jù)預(yù)處理效果圖

      圖4 經(jīng)濟(jì)數(shù)字分割效果圖

      圖5 目標(biāo)投影特征的分布圖

      4 分類模型

      支持向量機(jī)(SVM,Support Vector Machine)模型是基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化與 VC 維理論的統(tǒng)計(jì)學(xué)學(xué)習(xí)的一種線性分類器優(yōu)化準(zhǔn)則,其算法核心在于構(gòu)造樣本空間最優(yōu)分類超平面,使得分類的樣本之間具有最大的幾何間隔[7-8]。設(shè)給出包含投影特征的訓(xùn)練樣本(x1,y1),(x2,y2),…(xn,yn),n為訓(xùn)練樣本的數(shù)量,由上節(jié)可知,xi∈[0,1),假設(shè)投影特征樣本線性可分,的情形(不可分可以通過核函數(shù)處理),設(shè)分類的超平面為:

      ωTx+b=0

      (3)

      經(jīng)過推導(dǎo)可知,其滿足的約束條件與等價(jià)方程為:

      (4)

      s.t.yi[(ωTxi+b)]≥1(i=1,2,…n)

      然后引入拉格朗日乘子求導(dǎo)獲取模型參數(shù),得到的模型為:

      (5)

      為了進(jìn)一步提高SVM的對(duì)樣本的容錯(cuò)性,引入松弛變量C來量化訓(xùn)練中錯(cuò)誤樣本對(duì)分類面的影響,其目標(biāo)函數(shù)為

      (6)

      由于SVM僅為二類分類器,對(duì)于多分類問題,采用多個(gè)SVM的1:M級(jí)聯(lián)的方式構(gòu)成學(xué)習(xí)模型,獲得模型的局部最優(yōu)解,強(qiáng)化模型的決策能力。

      5 實(shí)驗(yàn)分析

      (1)為了驗(yàn)證SVM學(xué)習(xí)模型在數(shù)字識(shí)別的優(yōu)勢(shì),與基于樹結(jié)構(gòu)分類器RandomForest以及3層BP神經(jīng)網(wǎng)絡(luò)作了對(duì)比實(shí)驗(yàn),主要是在數(shù)字識(shí)別算法的準(zhǔn)確率與實(shí)時(shí)性上,各學(xué)習(xí)模型的性能表現(xiàn)如表1所示[9-10]。

      表1 學(xué)習(xí)模型性能對(duì)比

      從實(shí)驗(yàn)結(jié)果可以看出,RandomFores所耗費(fèi)的算法時(shí)間最少,因?yàn)樵摲诸惼鳛槎诸悰Q策,同時(shí)準(zhǔn)確率也最低,BP神經(jīng)網(wǎng)絡(luò)識(shí)別算法時(shí)間較長(zhǎng),識(shí)別準(zhǔn)確率次于SVM,主要由于小樣本的數(shù)據(jù)無法發(fā)揮神經(jīng)網(wǎng)絡(luò)的泛化能力,導(dǎo)致網(wǎng)絡(luò)處于欠擬合狀態(tài)。而SVM在小樣本數(shù)據(jù)學(xué)習(xí)中有著比其他分類模型更好的性能,主要其采用樣本中的極少的特征向量來確定分類面?;谝陨戏治?,采用SVM作為數(shù)字識(shí)別的學(xué)習(xí)模型是較合理的。

      (2)建立一套基于在線的實(shí)時(shí)數(shù)字檢測(cè)系統(tǒng),該檢測(cè)系統(tǒng)根據(jù)提出的機(jī)器學(xué)習(xí)算法可以自動(dòng)識(shí)別采集到LED經(jīng)濟(jì)數(shù)據(jù)并且可以實(shí)時(shí)識(shí)別顯示,并且將識(shí)別的數(shù)據(jù)保存到數(shù)據(jù)庫(kù)當(dāng)中便于后續(xù)的分析,準(zhǔn)確率達(dá)到100%,基本達(dá)到市場(chǎng)的需求,解決了一定的問題。

      6 結(jié) 論

      為實(shí)現(xiàn)經(jīng)濟(jì)數(shù)據(jù)報(bào)表自動(dòng)識(shí)別的問題,提出了一種基于機(jī)器學(xué)習(xí)的數(shù)字識(shí)別方法,該算法單個(gè)數(shù)字的檢測(cè)時(shí)間到達(dá)0.007s,環(huán)境較好的情況下,識(shí)別率到達(dá)100%,相對(duì)其它常規(guī)識(shí)別算法具有一定的優(yōu)勢(shì)。今后主要將研究對(duì)于復(fù)雜環(huán)境下或者遮擋的數(shù)字識(shí)別,構(gòu)建更加穩(wěn)定的局部目標(biāo)識(shí)別算子,提高識(shí)別算法的性能。

      參考文獻(xiàn):

      [1] 董峻妃, 鄭伯川, 楊澤靜. 基于卷積神經(jīng)網(wǎng)絡(luò)的車牌字符識(shí)別[J]. 計(jì)算機(jī)應(yīng)用, 2017, 37(7):2014-2018.

      [2] 鹿琛, 王姍珊. 基于BP神經(jīng)網(wǎng)絡(luò)的車牌字符識(shí)別方法[J]. 山東農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版), 2017, 48(1):113-116.

      [3] 多化豫, 孫梟雄, 袁云梅. 基于圖像處理提高木材識(shí)別準(zhǔn)確性的新方法[J]. 西北林學(xué)院學(xué)報(bào), 2017, 32(1):244-247.

      [4] 葉敏, 周文暉, 顧偉康. 基于FPGA的實(shí)時(shí)圖像濾波及邊緣檢測(cè)方法[J]. 傳感技術(shù)學(xué)報(bào), 2007, 20(3):623-627.

      [5] 尹星云, 王峻. 基于改進(jìn)的彩色圖像形態(tài)學(xué)膨脹和腐蝕算子設(shè)計(jì)[J]. 計(jì)算機(jī)工程與應(yīng)用, 2008, 44(14):172-174.

      [6] 陳鐵錚, 魯港, 商維斌,等. 最小曲率法中水平投影長(zhǎng)度的計(jì)算[J]. 石油地質(zhì)與工程, 2007, 21(5):82-84.

      [7] 程淑紅, 劉潔, 朱丹丹. 基于計(jì)算機(jī)視覺與SVM的水質(zhì)異常監(jiān)測(cè)方法[J]. 光電工程, 2014,(5):28-33.

      [8] 孫國(guó)棟, 楊林杰, 梅術(shù)正,等. 一種基于幾何特征的列車集塵器形狀匹配算法[J].中國(guó)機(jī)械工程, 2016, 27(2): 230-234.

      [9] 高琰, 谷士文, 唐琎,等. 機(jī)器學(xué)習(xí)中譜聚類方法的研究[J]. 計(jì)算機(jī)科學(xué), 2007, 34(2):201-203.

      [10] 王涌天, 林精敦, 陳靖,等. 隨機(jī)樹特征匹配算子性能研究[J]. 北京理工大學(xué)學(xué)報(bào), 2009, 29(11):988-993.

      猜你喜歡
      矩形分類器投影
      解變分不等式的一種二次投影算法
      兩矩形上的全偏差
      基于最大相關(guān)熵的簇稀疏仿射投影算法
      找投影
      化歸矩形證直角
      找投影
      BP-GA光照分類器在車道線識(shí)別中的應(yīng)用
      從矩形內(nèi)一點(diǎn)說起
      加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
      結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
      南陵县| 太谷县| 青神县| 桐梓县| 翁源县| 东兴市| 紫金县| 赤峰市| 九龙坡区| 修文县| 吉林省| 亚东县| 宿迁市| 镇康县| 金寨县| 普定县| 滦平县| 临沂市| 平武县| 海原县| 南乐县| 天柱县| 定边县| 酉阳| 文安县| 交城县| 靖宇县| 九江县| 宁陵县| 长垣县| 定陶县| 西平县| 渑池县| 宁德市| 淳安县| 兰溪市| 盖州市| 崇礼县| 波密县| 尉犁县| 长寿区|