任淏哲
摘 要 無人駕駛作為當(dāng)前社會的技術(shù)熱點和人工智能產(chǎn)業(yè)的重要一支,引起了越來越多的人的關(guān)注。神經(jīng)網(wǎng)絡(luò)是機器學(xué)習(xí)諸多技術(shù)中重要的一環(huán),其在無人駕駛中也有著至關(guān)重要的應(yīng)用。文章介紹了神經(jīng)網(wǎng)絡(luò)的原理并闡述其在無人駕駛中的具體應(yīng)用。
關(guān)鍵詞 無人駕駛;神經(jīng)網(wǎng)絡(luò);增強學(xué)習(xí);決策;識別
中圖分類號 TP3 文獻(xiàn)標(biāo)識碼 A 文章編號 1674-6708(2019)230-0138-02
隨著科學(xué)技術(shù)的發(fā)展和進(jìn)步,大數(shù)據(jù)、人工智能等新興技術(shù)開始被應(yīng)用于生產(chǎn)生活中,而隨著近些年來社會生產(chǎn)力的不斷提升,這些新興技術(shù)與新興產(chǎn)業(yè)也蓬勃發(fā)展,在很多領(lǐng)域已經(jīng)有了顛覆傳統(tǒng)方式的趨勢。
自動駕駛作為人工智能浪潮中重要的一股分支,其發(fā)展一直備受社會關(guān)注。與傳統(tǒng)的人工駕駛有所不同,自動駕駛一般按照其自動化程度分為4個等級:輔助駕駛,半自動駕駛,自動駕駛,完全自動駕駛。目前已經(jīng)有很多廠商將輔助駕駛應(yīng)用于量產(chǎn)車,并積極研制開發(fā)半自動駕駛和自動駕駛技術(shù)。
如今的自動駕駛領(lǐng)域,通用公司是業(yè)界的翹楚,通用已在美國的許多洲開設(shè)了無人駕駛的區(qū)域用于自動駕駛的研究與測試。特斯拉,谷歌也開始在無人駕駛領(lǐng)域加大投入,在國內(nèi),以BAT為首的互聯(lián)網(wǎng)公司開始重視自動駕駛。前些日子,李彥宏在北京五環(huán)正式開始了自動公交汽車的項目,標(biāo)志著自動駕駛逐漸走進(jìn)我們的生活。
但目前自動駕駛的發(fā)展形勢仍不明朗,尤其是對于駕駛網(wǎng)絡(luò)的研究還有許多發(fā)展的空間。現(xiàn)在的無人駕駛主要所面臨的問題就是識別復(fù)雜的駕駛場景和駕駛情況[ 1 ],對于雨雪天氣、霧天、晴天等不同天氣的識別,對于高速路,城市道路等不同路段中選擇不同的駕駛模式。對于道路上行人或是其他移動中的物體的識別(如貓狗,其他汽車等),綜合交通信號燈,指示牌,路標(biāo)等對現(xiàn)行狀況的判定,這些都是十分復(fù)雜的。而神經(jīng)網(wǎng)絡(luò)的運用將極大地改變無人駕駛,使得無人駕駛的識別準(zhǔn)確性大大提升,具有更多的現(xiàn)實意義。
1 神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是當(dāng)前人工智能技術(shù)鏈中極其重要的一環(huán),被廣泛應(yīng)用于數(shù)據(jù)挖掘、數(shù)據(jù)分析、機器學(xué)習(xí)等領(lǐng)域,無人駕駛作為人工智能技術(shù)的衍生,也大量應(yīng)用了神經(jīng)網(wǎng)絡(luò)技術(shù)[ 2 - 3 ]。
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,簡寫為ANNs)是一種模仿動物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型。這種網(wǎng)絡(luò)依靠系統(tǒng)的復(fù)雜程度,通過調(diào)整內(nèi)部大量節(jié)點之間相互連接的關(guān)系,從而達(dá)到處理信息的目的,并具有自主學(xué)習(xí)和自適應(yīng)的能力。
具體而言,神經(jīng)網(wǎng)絡(luò)是一種數(shù)學(xué)算法,其核心思想在于挖掘大量數(shù)據(jù)中的特征并給這些特征賦予權(quán)重,使得他們對于網(wǎng)絡(luò)結(jié)果的輸出給予不同程度的影響。例如,在判斷一個人是否患有肥胖癥時,大多數(shù)人都會選擇將該人的體重和身高作為重要的評判標(biāo)準(zhǔn)。
對于神經(jīng)網(wǎng)絡(luò)而言,在最初各個輸入數(shù)據(jù)并沒有好壞優(yōu)劣之分,其各自的權(quán)重也是隨機的、無章法的,而隨著我們把網(wǎng)絡(luò)的輸出結(jié)果與實際結(jié)果作比較并將比較結(jié)果反饋給網(wǎng)絡(luò),網(wǎng)絡(luò)就可以自行調(diào)節(jié)各項權(quán)重,使得對結(jié)果影響更大的項的權(quán)重更大(或者說比重更大)。通過循環(huán)這樣的過程,我們就能夠不斷調(diào)整整個網(wǎng)絡(luò),使得其對于那些重要的數(shù)據(jù)更加敏感并且能夠?qū)⑦@些數(shù)據(jù)做必要的處理來進(jìn)行準(zhǔn)確的判斷。
2 神經(jīng)網(wǎng)絡(luò)在無人駕駛中的應(yīng)用
一般認(rèn)為無人駕駛技術(shù)上可被分為三大模塊,分別是:感知模塊、決策模塊和執(zhí)行模塊。其中,執(zhí)行模塊隨著自動化技術(shù)(尤其是控制技術(shù))的逐漸成熟而不斷完善。因此,“感知”和“決策”也常常被認(rèn)為是自動駕駛技術(shù)發(fā)展道路上的“攔路虎”。雖然有著這樣那樣的困難,但感知和決策將會是接下來幾十年各大科技公司關(guān)注的技術(shù)方向。
一般認(rèn)為,感知模塊要完成兩個功能:識別與定位。所謂識別是指系統(tǒng)要及時收集周圍環(huán)境的各項障礙物(此處的障礙物既包括有生命的,也包括無生命的,是對周圍物體的一種泛稱)并對其性質(zhì)加以界定,并且對其方位做出比較準(zhǔn)確的判斷。
決策模塊則是無人駕駛的“大腦”,需要將感知模塊收集的信息加以整合并作出相應(yīng)決策。這個模塊比起感知模塊可能更加符合人們對于“人工智能”的認(rèn)知。
2.1 卷積神經(jīng)網(wǎng)絡(luò)與目標(biāo)識別
卷積神經(jīng)網(wǎng)絡(luò)實際上是普通神經(jīng)網(wǎng)絡(luò)的變式,對于邏輯較為復(fù)雜的神經(jīng)網(wǎng)絡(luò),準(zhǔn)確的判斷往往需要大量的輸入,而在圖片判斷及其相關(guān)問題中,我們需要考慮每一個像素——這也意味著一幅1080×1020的圖片最少需要1080×1020個輸入,盡管理論上我們可以通過控制神經(jīng)網(wǎng)絡(luò)的層數(shù)(但是強行下降層數(shù)也意味著判斷準(zhǔn)確率會大打折扣)來減小數(shù)據(jù)維度,但即便只有三層(已經(jīng)是神經(jīng)網(wǎng)絡(luò)的極限?。\算規(guī)模也已經(jīng)非常巨大。
為了解決這個問題,人們在神經(jīng)網(wǎng)絡(luò)正式開始計算前加入了卷積層。所謂卷積是指按照一定的權(quán)重將局部的圖像化為一個“點”(例如將3×3大小的圖像按照一定的權(quán)重相乘并相加,變成一個像素),而卷積的權(quán)重則是由訓(xùn)練所得。這樣我們就能夠在正式計算前有效降低數(shù)據(jù)維度[ 4 ]。
對于卷積層的作用有多種說法,一般認(rèn)為卷積層的作用是“將重要的特征進(jìn)一步放大,將無用的數(shù)據(jù)進(jìn)一步降零”。
目標(biāo)識別是無人駕駛中至關(guān)重要的功能之一。如前文所說,無人駕駛汽車需要實時地對周圍目標(biāo)加以識別并將識別結(jié)果傳輸給決策網(wǎng)絡(luò),而卷積神經(jīng)網(wǎng)絡(luò)能夠?qū)D片進(jìn)行比較好的識別。我們都知道視頻本質(zhì)上是由一幀一幀的圖像構(gòu)成的,因此實時的目標(biāo)識別任務(wù)就轉(zhuǎn)換為了連續(xù)的圖像識別任務(wù)。這也是為什么卷積神經(jīng)網(wǎng)絡(luò)能夠較好地應(yīng)用于感知模塊。
2.2 決策網(wǎng)絡(luò)
2.2.1 增強學(xué)習(xí)
增強學(xué)習(xí)是在決策問題中廣泛應(yīng)用的一種人工智能算法[ 5 ],其本質(zhì)在于設(shè)定一個“外部獎勵”,該外部獎勵是評價決策好壞的重要指標(biāo),當(dāng)我們發(fā)現(xiàn)某個決策帶來大的獎勵更多時,我們認(rèn)為該決策是更加科學(xué)的、可取的,反之,當(dāng)某個決策帶來的獎勵很少甚至沒有時,系統(tǒng)對于該策略的選取傾向就更低。
例如,我們在玩賽車游戲時,就可以將單位時間內(nèi)賽車前進(jìn)的距離作為決策系統(tǒng)的外部獎勵,但是這種操作從本質(zhì)上來講并不嚴(yán)謹(jǐn),因為我們忽略了大量其他的“特殊情況”,比如碰撞、刮蹭,因此筆者所提出的這種類比雖然在思想上是正確的,但并不可行。
究其根本,一個合格的外部獎勵或者稱之為決策系統(tǒng)的“指導(dǎo)函數(shù)”應(yīng)當(dāng)是很復(fù)雜的,它不僅要隨外界環(huán)境的變化而變化,并且其需要納入考慮的評估指標(biāo)也是復(fù)雜而多樣的,以無人駕駛為例,當(dāng)汽車行駛在空曠無人的高速公路上時,速度的優(yōu)先級自然會提高;當(dāng)汽車行駛在城市中時,速度的優(yōu)先級必然需要降低。除此之外,指導(dǎo)函數(shù)還應(yīng)該有一定的“預(yù)見性”,因為很多決策并不是一開始執(zhí)行就會立即帶來有效收益,或者我們可以這樣理解,在謀劃一場戰(zhàn)爭時,將軍不僅要有戰(zhàn)術(shù)意識,更要有戰(zhàn)略意識。
綜上,在決策系統(tǒng)工作時,指導(dǎo)函數(shù)并不是一成不變的,而是隨著外部環(huán)境/信息的變化而不斷調(diào)整的,而這種調(diào)整顯然是需要大量計算的(因為要考慮各種各樣的信息),那么從本質(zhì)上來講該問題仍然屬于神經(jīng)網(wǎng)絡(luò)非常適合解決的問題,即我們可以使用神經(jīng)網(wǎng)絡(luò)的計算來得到一個能夠及時變化的指導(dǎo)函數(shù)。該神經(jīng)網(wǎng)絡(luò)的輸入是感知系統(tǒng)的各項信息,而輸出是當(dāng)前時刻的指導(dǎo)函數(shù)/外部獎勵。
2.2.2 決策網(wǎng)絡(luò)
決策網(wǎng)絡(luò),或者說決策系統(tǒng)是一種非常典型的機器學(xué)習(xí)產(chǎn)物。如前文所說,通過增強學(xué)習(xí)我們能夠得到一個科學(xué)的指導(dǎo)函數(shù),在不同外界數(shù)據(jù)的輸入下會給出不同的評估結(jié)果,無人駕駛汽車根據(jù)該時刻決策系統(tǒng)的評估選擇最優(yōu)的策略并傳輸給控制系統(tǒng)。
3 結(jié)論
在不遠(yuǎn)的將來無人駕駛汽車就能夠替代如今的駕駛者,無人駕駛的發(fā)展道路還很長,人工智能的不斷發(fā)展為無人駕駛指明了一條嶄新的發(fā)展道路,人工智能將在感知識別,計算決策等方面對無人駕駛有著深遠(yuǎn)影響。有人工智能加持的無人駕駛將大大提高城市交通的效率和安全系數(shù),使得駕駛不再是人們?nèi)粘I畹囊粋€“麻煩事”。
參考文獻(xiàn)
[1]喬維高,徐學(xué)進(jìn).無人駕駛汽車的發(fā)展現(xiàn)狀及方向[J].上海汽車,2007(7):40-43.
[2]陳慧巖,熊光明,龔建偉.無人駕駛汽車概論[M].北京:北京理工大學(xué)出版社,2014.
[3]端木慶玲,阮界望,馬鈞.無人駕駛汽車的先進(jìn)技術(shù)與發(fā)展[J].農(nóng)業(yè)裝備與車輛工程,2014,52(3):30-33.
[4]周飛燕,金林鵬,董軍.卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J].計算機學(xué)報,2017,40(6):1229-1251.
[5]馬振.AlphaGo背后的機器學(xué)習(xí)技術(shù)[J].電腦迷,2018(6):81.