廖干洲 曾霞
摘要:本文首先對機器學習和模式識別下了定義,強調(diào)它們之間的主要區(qū)別位研究的核心問題不同,機器學習研究重點是在于模型上,模式識別的研究重點是在于輸入數(shù)據(jù)上。然后介紹了機器學習中的深度學習的研究方法,并應(yīng)用在模式識別的任務(wù)上,獲得良好的結(jié)果。
關(guān)鍵詞:模式識別;深度學習;卷積神經(jīng)網(wǎng)絡(luò)
中圖分類號:TP18 文獻標識碼:A 文章編號:1007-9416(2018)02-0229-02
機器學習在當前的人工智能[1]研究中處于一個非常核心的地位。得益于近十年來機器學習中的深度學習技術(shù)[2]的飛速發(fā)展。本文主要闡述利用機器學習的方法解決模式識別[3]的若干問題。
1 機器學習定義
機器學習是一門多領(lǐng)域交叉學科。專門研究計算機怎樣模擬或?qū)崿F(xiàn)人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能。
2 深度學習的研究方法
深度學習其原型是多層神經(jīng)網(wǎng)絡(luò)[4](Multilayer Neural Network)傳統(tǒng)神經(jīng)網(wǎng)絡(luò)中,采用的是BP算法[5]進行訓練,簡單說來就是采用迭代的算法來訓練整個網(wǎng)絡(luò),隨機設(shè)定初值,計算當前網(wǎng)絡(luò)的輸出,然后根據(jù)當前網(wǎng)絡(luò)輸出與標簽之間的差值去改變前面各層的參數(shù),直至收斂。
深度學習把傳統(tǒng)機器學習的尋找特征參數(shù)問題轉(zhuǎn)化為構(gòu)建深度網(wǎng)絡(luò)問題,在眾多方法當中,最著名的可算是卷積神經(jīng)網(wǎng)絡(luò)(CNN)方法。CNN方法通過圖像卷積以及池化的步驟,可較為容易地構(gòu)建一個多層神經(jīng)網(wǎng)絡(luò),對于手寫辨識和圖像辨識具有非常好的效果。
3 卷積神經(jīng)網(wǎng)絡(luò)在模式識別中的應(yīng)用
卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用在手寫辨識上具有非常好的效果,本次卷積神經(jīng)網(wǎng)絡(luò)使用傳統(tǒng)LeNet-5[6]的基礎(chǔ)上,結(jié)合Alex-Net[7]的新方法,在nmist數(shù)據(jù)集上進行實驗,訓練模型如下圖1所示。
3.1 訓練模型
如圖1所示,本次模型采用和LeNet-5的相同的層數(shù),但是在第一層卷基層上采用16個3×3的卷積核,并采用relu激活函數(shù);第三層卷基層上也采用較多的24個3×3的卷積核,也采用了relu激活函數(shù),所以在最后的Flatten層上,數(shù)據(jù)量有864個,而且是連接層,所以可以預(yù)計在訓練時間上會比LeNet-5長。
3.2 訓練、測試結(jié)果
兩個模型均采用128的Batch,20次Epoch,結(jié)果如下表1所示。
從結(jié)果可以看出,本模型在訓練時間是經(jīng)典模型的3倍左右,但是在訓練的精度以及測試精度上分別提高了1.35%和1.02%。
從這些結(jié)果里拿出一組訓練過程,如圖2所示。
其中圖2(a)是傳統(tǒng)LeNet-5下的結(jié)果,2(b)是本模型的結(jié)果。從兩圖比較可以看出,無論在訓練或者測試,本模型從第一次Epoch開始,精度就已經(jīng)非常高,分別達到了81%和96%,進一步說明了本模型在手寫識別上具有一定的實用性。
4 結(jié)語
本文嘗試了以機器學習上建立模型的方法解決模式識別的分類任務(wù),并用一個實際的深度建模例子進行說明。本文的主要意義在于強調(diào)機器學習及模式識別之間區(qū)別,以使得的在模式識別中強化模型建立的作用,為模式識別提供更多的研究方法。
參考文獻
[1]盧妙娜,王潤.人工智能綜述[J].智能計算機與應(yīng)用,2010,(2):3-4.
[2]郭麗麗,丁世飛.深度學習研究進展[J].計算機科學,2015,42(5):28-33.
[3]趙志宇,常健.模式識別概述及其應(yīng)用[J].信息與電腦:理論版,2010,(10):27-27.
[4]馮帥.合作型模塊化神經(jīng)網(wǎng)絡(luò)的研究與應(yīng)用[D].武漢理工大學,2008.
[5]張鈴,張鈸.神經(jīng)網(wǎng)絡(luò)中BP算法的分析[J].模式識別與人工智能,1994,(3):191-195.
[6]Krizhevsky A, Sutskever I, Hinton G E. ImageNet classification with deep convolutional neural networks[J]. Communications of the Acm, 2013,60(2):2012.