• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于卷積神經(jīng)網(wǎng)絡(luò)的手寫漢字識別研究

      2020-06-24 03:06:44張慧宇
      中國新通信 2020年2期
      關(guān)鍵詞:識別卷積神經(jīng)網(wǎng)絡(luò)漢字

      張慧宇

      摘要:神經(jīng)網(wǎng)絡(luò)仿照生物神經(jīng)元的工作原理,本質(zhì)上是輸入與輸出之間的一種映射,卷積神經(jīng)網(wǎng)絡(luò)具有參數(shù)共享機制與連接的稀疏性,其對傳統(tǒng)神經(jīng)網(wǎng)絡(luò)層級結(jié)構(gòu)中層的功能和形式做了部分變化,通過局部連接的方式,形成了一種特殊的結(jié)構(gòu)化多層前饋神經(jīng)網(wǎng)絡(luò),具有較強的魯棒性與泛化性能?;诖?,以卷積神經(jīng)網(wǎng)絡(luò)為模型,構(gòu)建出漢字識別網(wǎng)絡(luò),進行漢字樣本特征提取和分類輸出。

      關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò);漢字;識別

      目前,手寫漢字識別可分為聯(lián)機與脫機兩種形式,其中聯(lián)機手寫體漢字識別主要處理書寫者依托物理設(shè)備即時輸入的文字信號,而脫機手寫體漢字識別主要處理圖像設(shè)備采集到的圖像形式文字信息。一般來說,脫機手寫文字識別比聯(lián)機手寫文字識別更加困難。漢字識別屬于人工智能范疇,目前是個研究熱點,且具有挑戰(zhàn)性,繁雜的漢字字符、隨意性無約束性的手寫字體等因素會增加漢字識別難度,造成識別錯誤、無法識別等問題。因此,需要尋找更加有效的方法,以推動漢字識別的發(fā)展。卷積神經(jīng)網(wǎng)絡(luò)是基于深度學(xué)習(xí)的前饋型的神經(jīng)網(wǎng)絡(luò),非常適用于處理大型圖像,將其運用于漢字識別工作中,有利于簡化漢字識別流程,產(chǎn)生更好的識別效果。

      一、卷積神經(jīng)網(wǎng)絡(luò)的特點與結(jié)構(gòu)

      (一)卷積神經(jīng)網(wǎng)絡(luò)的特點。神經(jīng)網(wǎng)絡(luò)仿照生物神經(jīng)元的工作原理,本質(zhì)上是輸入與輸出之間的一種映射,卷積神經(jīng)網(wǎng)絡(luò)具有參數(shù)共享機制與連接的稀疏性,其對傳統(tǒng)神經(jīng)網(wǎng)絡(luò)層級結(jié)構(gòu)中層的功能和形式做了部分變化,通過局部連接的方式,形成了一種特殊的結(jié)構(gòu)化多層前饋神經(jīng)網(wǎng)絡(luò),核心在于它的kernel,特點是頭重腳輕,實現(xiàn)了參數(shù)共享,避免BP神經(jīng)網(wǎng)絡(luò)反向傳播梯度損失過快的問題。[1]運用卷積運算取代一般的矩陣乘法運算,避免了顯式特征抽取,提升了神經(jīng)網(wǎng)絡(luò)模型的泛化能力與魯棒性,開啟了神經(jīng)網(wǎng)絡(luò)新時代。在實際應(yīng)用領(lǐng)域,卷積神經(jīng)網(wǎng)絡(luò)是一種高效的識別算法,也是一種多層感知器與特征提取器,通過卷積方式來提取圖像數(shù)據(jù)特征,能夠?qū)iT處理具有網(wǎng)格狀拓?fù)浣Y(jié)構(gòu)的數(shù)據(jù),被廣泛應(yīng)用于人臉識別、圖像識別、語音分析等計算機視覺應(yīng)用領(lǐng)域。在卷積神經(jīng)網(wǎng)絡(luò)中,首先對于圖片中的每一個特征進行局部感知,然后更高層次對局部進行綜合操作,從而得到全局信息;每個卷積濾波器共享權(quán)值,同一特征映射面具有相同神經(jīng)元權(quán)值,無需考慮圖像局部特征坐標(biāo)位置,使得對高維數(shù)據(jù)處理無壓力,減少了特征提取與分類數(shù)據(jù)重建難度;無需手動選取特征,利于特征圖的精確提取與分類識別。

      (二)卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)組成可分為五部分,依次為數(shù)據(jù)輸入層、卷積計算層、池化層、全連接層、輸出層。輸入層是整個神經(jīng)網(wǎng)絡(luò)的輸入,在處理圖像的卷積神經(jīng)網(wǎng)絡(luò)中,它一般代表了一張圖片的像素矩陣,卷積神經(jīng)網(wǎng)絡(luò)的輸入層可以處理多維數(shù)據(jù);卷積層是一個卷積神經(jīng)網(wǎng)絡(luò)中最重要的部分,由濾波器和激活函數(shù)構(gòu)成,進行局部關(guān)聯(lián)與窗口聯(lián)動操作,能夠提取數(shù)據(jù)圖像的特征,將神經(jīng)網(wǎng)絡(luò)中的每一個小塊進行更加深入的分析從而得到抽象程度更高的特征;池化層又叫下采樣層,用于壓縮數(shù)據(jù)和參數(shù)的量、降低數(shù)據(jù)維度,對樣本數(shù)據(jù)進行子抽樣操作,具有保持信息尺度不變性特征,可以去除冗余信息,抽取重要特征,防止神經(jīng)網(wǎng)絡(luò)的過擬合;全連接層是一排神經(jīng)元,用于連接扁平化多維數(shù)據(jù),在卷積神經(jīng)網(wǎng)絡(luò)的最后部分,是對提取的特征進行非線性組合以得到輸出,用來完成分類任務(wù)。輸出層的結(jié)構(gòu)和工作原理與傳統(tǒng)前饋神經(jīng)網(wǎng)絡(luò)中的輸出層相同,對于圖像分類問題,輸出層使用邏輯函數(shù)或歸一化指數(shù)函數(shù)(softmax function)輸出分類標(biāo)簽[2]。

      二、基于卷積神經(jīng)網(wǎng)絡(luò)的漢字識別

      在傳統(tǒng)的漢字識別方法中,常用彈性網(wǎng)格特征、方向線素特征以及Gabor特征方法,來提取漢字特征,例如,方向線素特征是根據(jù)漢字的八方向線素特征與路徑簽名特征,來提取圖像中漢字內(nèi)在特征;提取特征之后,用模板匹配法、決策樹算法、Adaboost算法等來對漢字圖像進行分類。傳統(tǒng)的方法需要人工干預(yù),需要做出大量的工作,且識別的效果有限。

      隨著計算機技術(shù)的發(fā)展,數(shù)據(jù)信息技術(shù)與智能技術(shù)為漢字識別提供了新的實踐與理論模式,使得漢字識別數(shù)字化與智能化成為可能。深度學(xué)習(xí)技術(shù)的發(fā)展,滿足了手寫漢字識別革新需求,使得聯(lián)機和脫機手寫漢字的識別率都大為提升,同傳統(tǒng)的方法相比進步非常明顯。利用深度學(xué)習(xí)的方法進行手寫漢字識別,不需要人工提取漢字特征,深度神經(jīng)網(wǎng)絡(luò)會自動完成漢字圖像特征的提取和分類。目前,在漢字識別領(lǐng)域,具有代表性的神經(jīng)網(wǎng)絡(luò)為CNN和RNN,CNN主要用于對漢字單字的識別,RNN主要用于文本行的識別。下面主要對基于卷積神經(jīng)網(wǎng)絡(luò)的漢字識別進行介紹。

      (一)基于卷積神經(jīng)網(wǎng)絡(luò)的漢字識別流程。在傳統(tǒng)的漢字識別流程中,可分為預(yù)處理、特征提取與降維、分類器分類與識別以及輸出結(jié)果等幾個模塊,其識別性能較為不穩(wěn)定、識別速率不高,耗時費力。對于卷積神經(jīng)網(wǎng)絡(luò),想要完成漢字識別,首先必須準(zhǔn)備大量的手寫漢字樣本,一般情況下,手寫漢字的識別流程為:收集漢字樣本集和測試集、利用樣本訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)、調(diào)參、利用測試集進行測試、輸出測試結(jié)果。[3]對于卷積神經(jīng)網(wǎng)絡(luò)而言,由于網(wǎng)絡(luò)良好的特性,能夠從不同的樣本圖像中提取出最能表達(dá)漢字本質(zhì)的數(shù)據(jù)特征,實現(xiàn)對大規(guī)模漢字樣本集的訓(xùn)練,大大提高了漢字識別率與正確率。

      (二)漢字識別流程主要步驟介紹。首先,要從網(wǎng)絡(luò)上搜集漢字樣本,手寫漢字樣本可以利用中科院自動化研究所模式識別國家重點實驗室的CASIA-HWDB 數(shù)據(jù)集,這里有充足的手寫漢字樣本,只有利用多樣的樣本來構(gòu)建充足的訓(xùn)練數(shù)據(jù)集,才能防止出現(xiàn)過擬合,為訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)做好數(shù)據(jù)準(zhǔn)備,進而提升識別性能。此外,可根據(jù)自身需求,對樣本進行預(yù)處理,運用數(shù)字圖像處理技術(shù)增強漢字對比度,[4]對圖像進行平滑去噪處理,進行隨機形變、隨機噪聲,減少因為不均勻光、噪聲干擾等因素造成的筆畫模糊、斷裂、缺失等問題。利用縮放大小、水平或垂直拉升、角度變化等變換方法處理漢字圖像樣本。其次,選取合適的卷積神經(jīng)網(wǎng)絡(luò)模型,越深的網(wǎng)絡(luò)模型,通常參數(shù)調(diào)整難度較大,訓(xùn)練過程極為耗時,因此在選擇神經(jīng)網(wǎng)絡(luò)時,應(yīng)該根據(jù)各種網(wǎng)絡(luò)模型的特性,選擇合適的網(wǎng)絡(luò)。經(jīng)典的CNN模型有LeNet5、AlexNet、VGG、GoogleNet、ResNets等,各自有自己的特色,其中LeNet5最早用于手寫字符的識別,后面幾種模型都是近些年提出的,逐漸變得層數(shù)更多,且都有自己的創(chuàng)新點。當(dāng)然,除此之外,我們還可以在前人的基礎(chǔ)上,構(gòu)造自己的卷積神經(jīng)網(wǎng)絡(luò),通過不斷調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)和權(quán)值參數(shù),來構(gòu)造出最合適的網(wǎng)絡(luò)模型。最后,利用設(shè)計好的卷積神經(jīng)網(wǎng)絡(luò)模型,逐層提取手寫漢字圖片特征,然后對提取的特征進行非線性組合以得到輸出。

      三、結(jié)語

      隨著人工智能的蓬勃發(fā)展,現(xiàn)代社會中信息量空前擴大,人機交互與信息處理成為了信息技術(shù)發(fā)展的重要課題之一,漢字識別已成為研究熱點。一方面,人工智能、信息技術(shù)等新興技術(shù)發(fā)展為漢字識別提供了全新的工具與思路,另一方面,漢字識別的發(fā)展需求也推動著各學(xué)科生產(chǎn)變革。從現(xiàn)階段下漢字識別發(fā)展情況而言,盡管當(dāng)前漢字識別已經(jīng)取得較大進展,能滿足人機快速交互需求,但是也存在著很大部分的發(fā)展空間。得益于大型的計算集群、數(shù)據(jù)存儲技術(shù)巨大進步,卷積神經(jīng)網(wǎng)絡(luò)在處理計算機視覺數(shù)據(jù)方面突顯出很大的優(yōu)勢,能夠輔助漢字識別工作,對漢字準(zhǔn)確識別有重要意義。

      參考文獻(xiàn):

      [1] 李斯凡,高法欽. 基于卷積神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別[J]. 浙江理工大學(xué)學(xué)報,2017,37(3):438-443.

      [2]Ng,A.,Kian,K.and Younes, B. Convolutional Neural Networks, Deep learning.

      [3] 常歡 . 基于卷積神經(jīng)網(wǎng)絡(luò)的孤立手寫體漢字識別研究 [D]. 安徽大學(xué) ,2015.

      [4] 宋光慧 . 基于遷移學(xué)習(xí)與深度卷積特征的圖像標(biāo)注方法研究 [D]. 浙江大學(xué) ,2016.

      猜你喜歡
      識別卷積神經(jīng)網(wǎng)絡(luò)漢字
      漢字這樣記
      漢字這樣記
      基于深度卷積神經(jīng)網(wǎng)絡(luò)的物體識別算法
      深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
      淺談哈密瓜病蟲害的防治措施
      基于深度卷積網(wǎng)絡(luò)的人臉年齡分析算法與實現(xiàn)
      軟件工程(2016年8期)2016-10-25 15:47:34
      蘋果樹常見病蟲害防治技術(shù)
      青島市中山公園園林樹木易混淆品種識別
      基于卷積神經(jīng)網(wǎng)絡(luò)的樹葉識別的算法的研究
      論犯罪危險人格的識別
      漳浦县| 铜川市| 阳信县| 开远市| 扎赉特旗| 长子县| 嫩江县| 平潭县| 临澧县| 田东县| 贞丰县| 车险| 长治市| 隆德县| 仁怀市| 纳雍县| 涡阳县| 尤溪县| 马公市| 军事| 景洪市| 江川县| 锡林浩特市| 西华县| 奉贤区| 台东市| 海晏县| 黔江区| 济南市| 榆社县| 米易县| 万安县| 洪洞县| 酒泉市| 南乐县| 滦南县| 象州县| 辽宁省| 施甸县| 南郑县| 普兰店市|