倪繼平
摘要:隨著芯片計算能力的大幅度提升,以深度學習為代表的機器學習技術成為人工智能領域的主要發(fā)展方向。通過對機器學習領域的研究背景和發(fā)展現(xiàn)狀的介紹,以及無人駕駛領域應用情況的分析,討論了機器學習技術在車輛場景感知方面所帶來的性能提升和車載通信技術的成熟,并預測了無人駕駛技術所帶來的產(chǎn)業(yè)技術革命,肯定了其在未來發(fā)展方向上的重要性。
關鍵詞:機器學習;無人駕駛;場景感知;產(chǎn)業(yè)變革
中圖分類號:TP181文獻標志碼:A文章編號:1008-1739(2018)06-68-3
Research of Driverless Technology Based on Machine Learning
NI Jiping(Nanchang Power Supply Company, State Grid Jiangxi Electric Power Company, Nanchang Jiangxi 330000, China)
0引言
隨著人口的增加和城鎮(zhèn)化腳步的加快,人們的生活水平逐步提高,導致私家車數(shù)量急劇上漲,交通安全成為人們關注的焦點。為了減少安全隱患,眾多汽車科技公司紛紛進入無人駕駛領域,希望通過科技改變人們的出行方式。
汽車領域將無人駕駛技術分為5個級別,分別對應不同階段無人駕駛技術的發(fā)展情況。
①L1級:駕駛員可以在一些車載智能輔助系統(tǒng)的幫助下安全駕駛;②L2級:車輛可以自主完成某些特定的駕駛任務,但駕駛員仍然需要手握方向盤,時刻對車況進行監(jiān)管,以防意外的發(fā)生;③L3級:車輛可以完成所有的駕駛任務,駕駛員可以不需要手握方向盤,但仍需要對行車情況進行觀察,以確保安全;④L4級:車輛已經(jīng)可以在特定場景完全實現(xiàn)無人駕駛,安全完成出行任務;⑤L5級:車輛可以在任何場景都實現(xiàn)無人行駛,無需人為干預,徹底解放人力?,F(xiàn)階段,大部分廠商正在從L2級加速向L3級發(fā)展,若想完全實現(xiàn)無人駕駛,還有很長的一段路要走。
1機器學習的研究背景和發(fā)展現(xiàn)狀
1.1研究背景
機器學習是人工智能的重要方面,通俗地講就是讓機器擁有學習的能力。在20世紀中葉,已經(jīng)有了一些機器學習的研究,比較有代表性的是A.Samuel的跳棋程序[1],20世紀50年代,基于神經(jīng)網(wǎng)絡的“連接主義”學習開始出現(xiàn),如F.Rosenblatt的感知機等[2],而到了20世紀六七十年代,基于邏輯表示的“符號主義”學習技術誕生并快速發(fā)展,代表性工作有E.B.Hunt等人的“概念學習系統(tǒng)”等相關內容[3]。到了90年代中期,以支持向量機為代表的統(tǒng)計學習成為機器學習領域主流的方法[4],迄今為止,支持向量機仍然是機器學習領域中最常用的學習方法之一。
1.2發(fā)展現(xiàn)狀
隨著大數(shù)據(jù)時代的到來,硬件計算能力大幅度提升,推動了以深度學習技術為代表的連接主義學習的發(fā)展,使其成為當今最熱門的領域。深度學習,從狹義來說,就是多層神經(jīng)網(wǎng)絡。由于層數(shù)增多,導致參數(shù)和數(shù)據(jù)量都大大增加,提高了結果的準確度,尤其在計算機視覺及語音識別等領域取得了很好的成果,成為圖像和音頻領域的重要技術。
現(xiàn)代生活中,機器學習隨處可見。在天氣預報、數(shù)據(jù)分析、環(huán)境檢測及能源探查等領域,均利用機器學習取得了不錯的效果,所以這一技術大量應用于無人駕駛領域,推動了無人駕駛技術的發(fā)展。
2無人駕駛的關鍵技術和難點
無人駕駛汽車主要功能模塊大體上分為傳感器、控制器和執(zhí)行器3部分,如圖1所示。
①傳感器主要模擬司機的眼睛,用來感知駕駛場景和路況信息;②控制器主要模擬司機的大腦,根據(jù)傳感器獲取的場景信息,做出不同的判斷,然后發(fā)出指令;③執(zhí)行器相當于司機的手和腳,根據(jù)獲取到的指令不同,執(zhí)行器會做出不同的反應,用來控制車輛的行駛,其中最關鍵的就是場景的感知和控制器的判斷。
2.1場景檢測
傳感器用來幫助汽車認識所處的環(huán)境,主要負責障礙檢測和場景識別,如圖2所示。
通常傳感器是由超聲波雷達、激光傳感器、攝像頭和GPS模塊組成。由于汽車行駛場景不同,在隧道和樹林小道中會導致GPS信號不夠穩(wěn)定,因此GPS模塊通常只用來進行定位,不負責場景識別。激光傳感器和超聲波雷達相互配合,負責對車身周邊的障礙物進行感知,因其不受光照、天氣和場景的限制,魯棒性較高。因此在無人駕駛領域,一般使用激光和超聲波傳感器來進行障礙物感知,確保車輛不會產(chǎn)生誤判斷,提高安全系數(shù)[5]。
但僅有激光和超聲波雷達是不夠的,由于行車場景的不同,將要面對的情況也不相同,因此無人駕駛汽車還應該有場景識別的功能,根據(jù)識別出的行車場景,對接下來要發(fā)生的情況進行預判,最大限度地規(guī)避風險。傳統(tǒng)計算機視覺技術通?;趫D像序列進行計算,從而實現(xiàn)場景識別,車輛前置攝像頭所獲取的場景信息和場景識別過程,如圖3所示。
傳統(tǒng)場景識別將獲取到的圖像轉為灰度圖之后,利用數(shù)學方法計算出圖像亮度變化梯度,得到場景邊緣信息,再利用閾值獲取路面位置區(qū)域之后,通過霍夫變換算法識別出行車線,這樣就可以實現(xiàn)簡單的道路場景識別。稍微復雜一些的算法還可以根據(jù)光流法,對路面上移動的陰影區(qū)域進行判斷,從而識別出路面上正在運動的物體,幫助實現(xiàn)場景識別。不過,傳統(tǒng)計算機視覺算法對場景的識別作用有限,當汽車所在地場景變得復雜時,很難根據(jù)傳統(tǒng)計算機視覺方法做出很好的判斷。
由于深度學習的興起,基于深度神經(jīng)網(wǎng)絡的計算機視覺算法擺脫了傳統(tǒng)計算機視覺方法的局限性,可以通過對輸入數(shù)據(jù)的訓練,識別出多種物體,從而對車輛所行駛的場景進行更準確地判斷,Google公司做出的物體識別結果如圖4所示。
基于深度學習算法,可以實現(xiàn)不同物體的檢測和認知,根據(jù)檢測出的所有物體進行場景判斷,最終實現(xiàn)場景的識別。到目前為止,道路場景的訓練樣本已經(jīng)足夠大,可以實現(xiàn)很好的識別結果。但是,由于汽車上路之后,面對的環(huán)境通常更為復雜,會發(fā)生不可預測的情況,以及所使用的算法對光照、色差及天氣等因素敏感度的不同,要想對所有場景完全識別和判斷,還需要時間和技術的積累。
2.2車載通信技術
通過傳感器獲取的數(shù)據(jù)信息必須交由云端進行處理。因此,車載數(shù)據(jù)的通信能力變得至關重要。車載通信技術必須實現(xiàn)實時性、可靠性和穩(wěn)定性。①實時性用來保證車輛可以根據(jù)不停變換的場景,確定自己和其他車輛所處的位置,提高車輛對周邊場景的感知能力;②可靠性用來保證無人駕駛車輛的安全行駛,一旦通信網(wǎng)絡被襲擊,在無法保證可靠的通信系統(tǒng)下,車輛將會陷于癱瘓,甚至發(fā)生嚴重的車禍事故;③穩(wěn)定性是所有車輛所具備的基本要求,用來保證車輛的持續(xù)行駛能力,同時也提高了交通安全和乘車人員的用戶體驗。
這3個方面對車載通信技術提出了很高的要求?,F(xiàn)階段,5G等相關通信技術的發(fā)展,已經(jīng)基本上可以滿足無人駕駛的需求,但這些通信技術仍然需要時間的檢驗。
2.3芯片的計算能力
由于行車情況復雜,控制器會收到多種場景感知信息,此時,能否快速處理感知信息并做出正確的判斷,則是控制器的關鍵。因此,車輛控制器芯片應該具有基于深度學習的計算平臺、出色的圖像處理能力和計算能力。而現(xiàn)階段的芯片技術,可以基本達到測試要求,但仍有很大的進步空間。
3無人駕駛所帶來的產(chǎn)業(yè)變革
無人駕駛技術是當今發(fā)展的主流方向,更是時代發(fā)展的必然方向。當無人駕駛技術達到L5級別時,所帶來的產(chǎn)業(yè)革命遠遠不止在交通領域,還會在環(huán)境工程、房地產(chǎn)、城市規(guī)劃及區(qū)域發(fā)展等眾多領域影響人們的生活。
①隨著時代的發(fā)展,當今社會進入大數(shù)據(jù)時代,大量數(shù)據(jù)的獲取成為發(fā)展的關鍵,無人駕駛汽車恰恰成為了一個個行動的數(shù)據(jù)掃描儀。類似于機器人領域的SLAM技術,無人駕駛汽車所搭載的攝像頭在幫助汽車進行場景識別的同時,可以在云端形成高精度地圖,用以實現(xiàn)不同車輛之間的信息共享,實現(xiàn)實時路況信息更新,從而更加方便人們出行。
②與此同時,根據(jù)眾多車輛所獲取的場景信息,也可以實現(xiàn)環(huán)境的實時監(jiān)測。相比之前各個環(huán)境點的固定檢測,基于車載攝像頭的檢測可以更加直觀和實時地獲取環(huán)境、天氣和人類活動的信息,提高災害預警和環(huán)境治理的效率。
③在房地產(chǎn)領域,一方面由于無人駕駛給人們帶來的便捷,大量解放了人力,提高了出行效率,使得人們會更傾向于去環(huán)境較好、房價較低的郊區(qū)買房,從而促使房價的回落;另一方面,由于車輛帶來的數(shù)據(jù),使得房地產(chǎn)商更加清楚人流的流向,更精準地預測接下來人們的聚集區(qū),從而提高了市場調查的效率,降低了調研經(jīng)費,也從側面促使了房價的回落。
④在城市規(guī)劃方面,根據(jù)車輛提供的人流數(shù)據(jù)和環(huán)境數(shù)據(jù),利用大數(shù)據(jù)分析技術可以更加合理地規(guī)劃未來城市的發(fā)展方向,從而使城市遷移、改造和新建的成本降到最低。
⑤在區(qū)域發(fā)展方面,更多的是依賴長途客車和貨車的流向來判斷人口流動方向,預測接下來幾年內哪些地區(qū)會有重要發(fā)展,率先進行經(jīng)濟布局,實現(xiàn)真正的智能化、現(xiàn)代化。
基于機器學習的無人駕駛技術會促進智慧城市和智慧交通等概念的實現(xiàn),使道路成為真正意義上的城市的血管,而無人駕駛車輛,則是支持城市正常運轉的紅細胞,是未來城市不可或缺的重要組成部分。
4結束語
機器學習尤其是深度學習的興起,使無人駕駛成為可能。利用深度神經(jīng)網(wǎng)絡,可以實現(xiàn)對物體的識別和場景的感知,從而促使車輛控制器做出符合當前場景的判斷,提高了無人駕駛車輛的穩(wěn)定性和安全性。與此同時,機器學習技術還可以利用車輛獲取到的海量數(shù)據(jù)進行數(shù)據(jù)分析,從而推動多個產(chǎn)業(yè)變革,從真正意義上實現(xiàn)智慧交通和智慧城市。
參考文獻
[1]周志華.機器學習[M].北京:清華大學出版社,2016:21-22.
[2] Rosenblatt F.The Perceptron: A Probabilistic Model for Information Storage and Organization in The Brain.[M]. Neurocomputing:Foundations Of Research:MIT Press,1988: 386-408.
[3] Hovland C I,Hunt E B.Programming A Model of Human Concept Formulation[C]//IRE-AIEE-ACM Computer Conference,May 9-11,1961,Los Angeles,California.New York:ACM,1961:145-155.
[4] Vapnik V N.An Overview of Statistical Learning Theory[J]. IEEE Transactions on Neural Networks,1999,10(5):988.
[5]段建民,鄭凱華,周俊靜.多層激光雷達在無人駕駛車中的環(huán)境感知[J].北京工業(yè)大學學報,2014,40(12):1891-1898.