邢星飛
摘 要 敘述深度學(xué)習(xí)的概念及深度學(xué)習(xí)人工智能在環(huán)境感知技術(shù)上的應(yīng)用,詳細(xì)闡述深度學(xué)習(xí)的工作原理以及其應(yīng)用前景。
關(guān)鍵詞 人工智能 無(wú)人駕駛 環(huán)境感知技術(shù) 深度學(xué)習(xí)
中圖分類號(hào):TP29 文獻(xiàn)標(biāo)識(shí)碼:A
機(jī)器深度學(xué)習(xí)是近年來(lái)在人工智能領(lǐng)域的重大突破之一,它在語(yǔ)音識(shí)別、自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)等領(lǐng)域都取得了不少成功。由于車輛行駛環(huán)境復(fù)雜,當(dāng)前感知技術(shù)在檢測(cè)與識(shí)別度方面無(wú)法滿足無(wú)人駕駛發(fā)展需要,深度學(xué)習(xí)被證明在復(fù)雜環(huán)境感知方面有巨大優(yōu)勢(shì)。
視覺(jué)感知技術(shù)是無(wú)人駕駛的核心技術(shù)。
無(wú)人駕駛一般包括四個(gè)等級(jí)或者五個(gè)等級(jí),不管哪個(gè)等級(jí)都會(huì)包含環(huán)境感知、規(guī)劃決策和執(zhí)行控制等三個(gè)方面。其中環(huán)境感知方式主要有視覺(jué)感知、毫米波雷達(dá)感知和激光雷達(dá)感知,其中的視覺(jué)感知是無(wú)人駕駛感知的最主要的方式。
中國(guó)的路況較為復(fù)雜,雨天、霧霾天以及下雪天。另外,像馬車、吊車以及摩托車,還有摩托車?yán)i、卡車?yán)瓨?shù)的現(xiàn)象在我們生活中經(jīng)常遇到,這些場(chǎng)景對(duì)視覺(jué)是一個(gè)難題,提高這種復(fù)雜路況下的感知精度是無(wú)人駕駛研究的挑戰(zhàn)。
1深度學(xué)習(xí)能夠滿足復(fù)雜路況下視覺(jué)感知的高精度需求
深度學(xué)習(xí)被認(rèn)為是一種有效的解決方案,深度學(xué)習(xí)是模擬人的大腦,是近10年來(lái)人工智能取得一個(gè)較大的突破。深度學(xué)習(xí)在視覺(jué)感知中近幾年應(yīng)取得了較大的進(jìn)展,相對(duì)于傳統(tǒng)的計(jì)算機(jī)視覺(jué),深度學(xué)習(xí)在視覺(jué)感知精度方面有比較大的優(yōu)勢(shì)。
特別是2011年以后,有報(bào)導(dǎo)指出深度學(xué)習(xí)如果算法和樣本量足夠的話,其準(zhǔn)確率可以達(dá)到99.9%以上,傳統(tǒng)的視覺(jué)算法檢測(cè)精度的極限在93%左右。而人的感知,也就是人能看到的準(zhǔn)確率一般為95%,所以從這個(gè)方面看,深度學(xué)習(xí)在視覺(jué)感知方面是有優(yōu)勢(shì)的。
所謂深度學(xué)習(xí),又名深度神經(jīng)網(wǎng)絡(luò),相對(duì)于以前的神經(jīng)網(wǎng)絡(luò)來(lái)說(shuō)是一種更多層和節(jié)點(diǎn)的神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)算法,從這兒可以看出來(lái),其實(shí)深度學(xué)習(xí)是一種機(jī)器學(xué)習(xí),可以說(shuō)是一種更智能的機(jī)器學(xué)習(xí)。深度學(xué)習(xí)主要類型一般包括5種類型,像CNN、RNN、LSTM、RBM和Autoencoder,其中我們主要的是用的CNN,CNN另外一個(gè)名字叫卷積神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)被證明在圖像處理中有很好的效果。
其中,自學(xué)特征是深度學(xué)習(xí)的最大優(yōu)勢(shì)。例如智能駕駛需要識(shí)別狗,在以前的算法中如果要識(shí)別狗,對(duì)狗的特征要用程序來(lái)詳細(xì)描述,深度學(xué)習(xí)這個(gè)地方如果采集到足夠的樣本,然后放在深度學(xué)習(xí)中訓(xùn)練,訓(xùn)練出來(lái)后的系統(tǒng)就可以識(shí)別這個(gè)狗。傳統(tǒng)的計(jì)算機(jī)的視覺(jué)算法需要手工提取特征,很多時(shí)候需要專家的知識(shí),算法的魯棒性設(shè)計(jì)非常困難,很難保證魯棒性,我們做視覺(jué)感知的時(shí)候就遇到很多困難。另外如果要保證這個(gè)穩(wěn)定需要大量的調(diào)試,非常耗時(shí)。
深度學(xué)習(xí)一般包括四種類型的神經(jīng)網(wǎng)絡(luò)層,輸入層、卷積層、池化層、輸出層。網(wǎng)絡(luò)的結(jié)構(gòu)可以10層甚至上百層,一般層數(shù)越多檢測(cè)精度會(huì)更精準(zhǔn)。并且隨著網(wǎng)絡(luò)層數(shù)和節(jié)點(diǎn)數(shù)的增加,可以表達(dá)更細(xì)、更多的識(shí)別物的特征,這樣的話可以為檢測(cè)精度的提高打下基礎(chǔ)。
其中卷積層和池化層是深度學(xué)習(xí)的核心處理層。卷積層主要是用于負(fù)責(zé)物體特征的提取;池化層主要是負(fù)責(zé)采樣。比如簡(jiǎn)單理解池化層,(就是一個(gè)數(shù)獨(dú)里面取一個(gè)最大值),這就是池化層。卷積層與池化層是深度學(xué)習(xí)兩個(gè)核心的層。
深度學(xué)習(xí)工作的原理,深度學(xué)習(xí)一般包括兩個(gè)方面,一個(gè)是訓(xùn)練,一個(gè)是檢測(cè),訓(xùn)練一般主要是離線進(jìn)行,就是把采集到的樣本輸入到訓(xùn)練的網(wǎng)絡(luò)中。訓(xùn)練網(wǎng)絡(luò)進(jìn)行前向輸出,然后利用標(biāo)定信息進(jìn)行反饋,最后訓(xùn)練出模型,這個(gè)模型導(dǎo)入到檢測(cè)的網(wǎng)絡(luò)中,檢測(cè)網(wǎng)絡(luò)就可以對(duì)輸入的視頻和圖像進(jìn)行檢測(cè)和識(shí)別。通常情況下,樣本的數(shù)量越多,識(shí)別的精度一般也會(huì)越高,所以這個(gè)樣本的數(shù)量是影響深度學(xué)習(xí)精度重要的一個(gè)因素。
2深度學(xué)習(xí)在無(wú)人駕駛感知上應(yīng)用前景廣闊
一般的環(huán)境感知方面用到的深度學(xué)習(xí)會(huì)多一些,主要是視覺(jué)與毫米波雷達(dá)方面。在駕駛策略里面也會(huì)用到機(jī)器學(xué)習(xí),但是我們一般叫做增強(qiáng)學(xué)習(xí),用于駕駛策略的研究。在環(huán)境感知方面,深度學(xué)習(xí)可以在視覺(jué)感知、激光雷達(dá)感知,還有駕駛員狀態(tài)監(jiān)測(cè)等方面,甚至在攝像頭和毫米波雷達(dá)融合方面都具有優(yōu)勢(shì)。
在環(huán)境感知方面,我們?cè)谶@方面做的重要工作就是前向視覺(jué)感知應(yīng)用。大家知道前向視覺(jué)感知是作為無(wú)人駕駛很重要的一部分,我們嘗試深度學(xué)習(xí)在這方面一些應(yīng)用。主要采用了單目攝像頭的方案,選用的模型是Faster R-CNN,在GPU TITAN 平臺(tái)上運(yùn)行。目標(biāo)檢測(cè)物主要包括車道線、車輛、行人、交通標(biāo)識(shí)和自行車,目前車輛的樣本有3萬(wàn)左右,行人樣本大概2萬(wàn)左右,其他的樣本較少,大概1000—2000。從運(yùn)行效果來(lái)看,識(shí)別精度、識(shí)別類型較以前開(kāi)發(fā)的一些傳統(tǒng)的視覺(jué)算法,我們覺(jué)得有比較大的改善。
3結(jié)論
深度學(xué)習(xí)人工智能給車主提供了更人性化、更智能化的功能,將給車主行車帶來(lái)極大的便利。但人工智能技術(shù)帶來(lái)的挑戰(zhàn)也不可小覷。需要汽車行業(yè)的及互聯(lián)網(wǎng)行業(yè)的人才一起努力,創(chuàng)建和諧的互聯(lián)網(wǎng)環(huán)境。
參考文獻(xiàn)
[1] 王建軍,李世威,曾俊偉.車聯(lián)網(wǎng)發(fā)展模式分析[J].計(jì)算機(jī)技術(shù)與發(fā)展,2011,21(12):1-3.
[2] 楊震.物聯(lián)網(wǎng)發(fā)展研究[J].南京郵電大學(xué)學(xué)報(bào),2010,12(02):1-4.