徐靜(鄭州大學(xué)軟件與應(yīng)用科技學(xué)院,河南 鄭州 450003)
深度學(xué)習(xí),作為機(jī)器學(xué)習(xí)研究中一個(gè)新的范疇,其過(guò)程是創(chuàng)建和模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),從而能夠模仿人腦的機(jī)制,來(lái)讀取和分析數(shù)據(jù)。廣義地說(shuō),人工神經(jīng)網(wǎng)絡(luò)更貼近大眾生活的名稱(chēng)是深度學(xué)習(xí),深度學(xué)習(xí)的“深”是指網(wǎng)絡(luò)的深度。在過(guò)去深度網(wǎng)絡(luò)的說(shuō)法并不存在,但隨著Hinton在《科學(xué)》發(fā)表文章指出,如果把神經(jīng)網(wǎng)絡(luò)加深而不是加寬,那么這個(gè)網(wǎng)絡(luò)會(huì)取得很好的效果。深度學(xué)習(xí)就是由這一現(xiàn)象延伸出來(lái)的,此后大家也逐漸習(xí)慣用深度學(xué)習(xí)來(lái)建立各種模型并用深度一詞來(lái)彰顯模型的特性。
大數(shù)據(jù)+大模型+大平臺(tái),使得深度學(xué)習(xí)成為人工智能時(shí)代的核心驅(qū)動(dòng)力之一。從自動(dòng)販賣(mài)機(jī)到汽車(chē)無(wú)人駕駛再到機(jī)器翻譯,它們背后所隱藏的深度學(xué)習(xí)及其模型也在不斷的被發(fā)掘和研究。目前,關(guān)于深度學(xué)習(xí)的研究熱點(diǎn)主要集中在以下方面:
? 深度強(qiáng)化、遷移學(xué)習(xí)(感知能力與決策能力的有力結(jié)合,AlphaGo,無(wú)人超市值守);
? 深度對(duì)偶學(xué)習(xí)(對(duì)偶框架下的無(wú)監(jiān)督學(xué)習(xí))
? 深度遞歸/循環(huán)神經(jīng)網(wǎng)絡(luò)(自然語(yǔ)言處理,如機(jī)器翻譯);
? 并行化深度學(xué)習(xí)(如基于TensorFlow,Caffe基于算法設(shè)計(jì)下的多通路、多分辨深度網(wǎng)絡(luò)搭建與平臺(tái)設(shè)計(jì));
? 深度生成網(wǎng)絡(luò)(深度置信網(wǎng)絡(luò),生成式對(duì)抗網(wǎng)絡(luò),變分白編碼器,深度貝葉斯網(wǎng)絡(luò));
?基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)、識(shí)別與迫蹤(RCNN,Fast-RCNN,R-FCN,YOLO,SSD等等);
? 傳統(tǒng)模型與深度學(xué)習(xí)的融合。
實(shí)際上,深度學(xué)習(xí)并不是一個(gè)全新的名詞,它可以追溯到上世紀(jì)40年代。迄今為止,它已經(jīng)經(jīng)歷了三個(gè)階段的發(fā)展,但是直到2006年,Hinton等人在機(jī)器學(xué)習(xí)中的相關(guān)工作使深度學(xué)習(xí)又重現(xiàn)大眾眼前并逐漸有復(fù)興之象。近年來(lái)伴隨著人工智能的普及已經(jīng)在很多領(lǐng)域取得了重大的突破,也由第一代深度學(xué)習(xí)模型演化成了后深度學(xué)習(xí)模型。其中深度卷積神經(jīng)網(wǎng)絡(luò)CNN、深度循環(huán)/遞歸神經(jīng)網(wǎng)絡(luò)RNN,LSTM、深度強(qiáng)化學(xué)習(xí)深度等等均已經(jīng)在一些具體的現(xiàn)實(shí)場(chǎng)景中得到了廣泛地應(yīng)用。
然而,深度學(xué)習(xí)在理論上的進(jìn)展卻遠(yuǎn)遠(yuǎn)不盡人意。比如說(shuō)沒(méi)有統(tǒng)一的理論可以指導(dǎo)在不同模型中網(wǎng)絡(luò)分多少層或者在不同場(chǎng)景下初始化參數(shù)應(yīng)該如何正確設(shè)置等等。近年來(lái)雖然深度學(xué)習(xí)已經(jīng)被廣泛應(yīng)用且取得了不可思議的研究成果,但這些研究成果并不能很好地解釋其中所蘊(yùn)含的各種理論。
其次,目前深度學(xué)習(xí)遇到了嚴(yán)重的計(jì)算瓶頸。在這一方面,很多人都存在一個(gè)誤區(qū),研究人員往往執(zhí)著于關(guān)注深度學(xué)習(xí)的計(jì)算本身。實(shí)質(zhì)上,帶寬問(wèn)題才是在研究深度學(xué)習(xí)過(guò)程中遇到的最大瓶頸。
另外,深度學(xué)習(xí)具有一定的局限性。某種準(zhǔn)則下,淺層網(wǎng)絡(luò)不一定比深度學(xué)習(xí)運(yùn)用的深層網(wǎng)絡(luò)性能差。比如說(shuō)優(yōu)化目標(biāo)函數(shù),訓(xùn)練深度網(wǎng)絡(luò)在計(jì)算和調(diào)試方面成本代價(jià)太高,并且對(duì)于許多日常預(yù)測(cè)問(wèn)題并沒(méi)有任何意義此時(shí)運(yùn)用淺層網(wǎng)絡(luò)就足夠了,在滿(mǎn)足需要的同時(shí)更節(jié)約了成本。再比如說(shuō)我們?cè)谝恍┨囟ㄇ闆r下需要的模型,雖然深度網(wǎng)絡(luò)模型預(yù)測(cè)或者表征能力相對(duì)淺層網(wǎng)絡(luò)更為強(qiáng)大,但卻存在可解釋性差不易理解等問(wèn)題。
(1)無(wú)人駕駛
目前,無(wú)人駕駛必須要具備環(huán)境感知、高精度地圖導(dǎo)航和駕駛決策三個(gè)部分的能力。首先,環(huán)境感知包括車(chē)道線(xiàn)、車(chē)輛、行人、交通標(biāo)志等的自動(dòng)檢測(cè),使用深度學(xué)習(xí)可以訓(xùn)練出一個(gè)識(shí)別率非常高的分類(lèi)器從而能夠使環(huán)境感知部分以高精度完成,為駕駛決策模塊提供正確的環(huán)境信息與認(rèn)知,保證無(wú)人駕駛正常的完成。
另外,在高精度地圖的創(chuàng)建與導(dǎo)航方面也會(huì)用到深度學(xué)習(xí)。高精度地圖基于視覺(jué),運(yùn)用深度學(xué)習(xí)高識(shí)別率的特性,通過(guò)識(shí)別特定的標(biāo)志(建筑物等)從而定位車(chē)輛的位置或者目的地。
最后,駕駛決策部分,運(yùn)用深度學(xué)習(xí)通過(guò)試錯(cuò)與自我修正的方法完成駕駛策略的決策。核心技術(shù)。
(2)無(wú)人超市值守
目前,無(wú)人超市面向“人與商品”之間發(fā)生的關(guān)系(動(dòng)作),通過(guò)傳感器采集數(shù)據(jù),建立起一個(gè)關(guān)于任何商品間動(dòng)作關(guān)系的大數(shù)據(jù)(人與商品間動(dòng)作關(guān)系集),進(jìn)一步使用深度學(xué)習(xí)技術(shù)建立人與商品之間的動(dòng)作判別模型,提高系統(tǒng)反作弊識(shí)別能力的同時(shí),結(jié)合超市進(jìn)出口支付系統(tǒng),完成購(gòu)物。其中所包含的數(shù)據(jù)獲取結(jié)構(gòu)、模型設(shè)計(jì)原則、核心模塊構(gòu)建均采用了深度學(xué)習(xí)模型。核心技術(shù)驅(qū)動(dòng):基于卷積神經(jīng)網(wǎng)絡(luò)的識(shí)別系統(tǒng),例如網(wǎng)絡(luò)模型SSD。
(3)機(jī)器翻譯
“翻譯”一詞大家都不陌生,其中翻和譯就表明了其包含兩個(gè)部分即編碼和譯碼。編碼階段和譯碼階段均采用了深度學(xué)習(xí),編碼階段:運(yùn)用深度學(xué)習(xí)中的RNN網(wǎng)絡(luò)源語(yǔ)言子句被編碼成一固定長(zhǎng)度的輸出隱向量;解碼階段:仍使用RNN把編碼階段輸出的固定長(zhǎng)度的隱向量解碼成目標(biāo)語(yǔ)言子句。
(1)首先是要慶幸我們生活在這個(gè)大數(shù)據(jù)的時(shí)代。深度學(xué)習(xí)本就與大數(shù)據(jù)有著千絲萬(wàn)縷的聯(lián)系,深度學(xué)習(xí)可以從大數(shù)據(jù)中挖掘出全新的有價(jià)值的數(shù)據(jù)、知識(shí)和規(guī)律從而將這些知識(shí)運(yùn)用到新數(shù)據(jù)上。而我們現(xiàn)有的大數(shù)據(jù)恰恰為深度學(xué)習(xí)的發(fā)展創(chuàng)造了極有利的條件。
(2)深度學(xué)習(xí)模型具有強(qiáng)大的擬合能力、高密度的計(jì)算能力、并且可以海量的訓(xùn)練數(shù)據(jù),它們是深度學(xué)習(xí)獲得成功的重要因素。
(3)深度學(xué)習(xí)的應(yīng)用范圍非常廣泛,可以滲透應(yīng)用到很多領(lǐng)域。比如說(shuō)棋類(lèi)博弈、復(fù)雜函數(shù)擬合、機(jī)器編譯等等。
(4)人工智能日益普及,大量智能產(chǎn)品已經(jīng)出現(xiàn)在了人們?nèi)粘5纳町?dāng)中且正在便利著我們的生活,人類(lèi)日益增長(zhǎng)的便利需求不斷推動(dòng)著深度學(xué)習(xí)的完善和發(fā)展。
第一,深度學(xué)習(xí)可以解決一些不能運(yùn)用理論完全解釋的問(wèn)題,也就是說(shuō)“知其然,不知其所以然”的問(wèn)題;第二,它能夠針對(duì)一些充滿(mǎn)不確定性的問(wèn)題,不斷的變化,不斷的再學(xué)習(xí)。第三,深度學(xué)習(xí)還有一個(gè)徹底改變傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的作用,它不單單做函數(shù)映射,更主要的是提取那些多層次反復(fù)的模式。一個(gè)深度學(xué)習(xí)所推動(dòng)的智能世界正在到來(lái),我們沒(méi)有其他選擇,只能雙倍押注,奔赴這未來(lái)。