王銓
(中國(guó)神華國(guó)際工程有限公司,北京 100007)
AGV(automated guided vehicle)車技術(shù)是一種背負(fù)式的、可無(wú)軌移動(dòng)的、基于電磁及光學(xué)自我感知和自動(dòng)尋跡的自動(dòng)化運(yùn)輸車輛技術(shù)[1]。小負(fù)荷AGV車輛可以用于快遞、郵件分揀系統(tǒng);大負(fù)荷AGV車輛可以在車間系統(tǒng)中跨生產(chǎn)線搬運(yùn)加工中間物資[2]。當(dāng)前我國(guó)的AGV車輛技術(shù)已經(jīng)處于國(guó)際先進(jìn)水平,主要實(shí)現(xiàn)方式是通過(guò)輪對(duì)控制法實(shí)現(xiàn)車輛驅(qū)動(dòng),通過(guò)激光點(diǎn)云雷達(dá)和可見(jiàn)光實(shí)時(shí)建模技術(shù)實(shí)現(xiàn)尋跡和避障[3]。
車間內(nèi)跨生產(chǎn)線運(yùn)輸系統(tǒng)早期依靠小型叉車或者梭車實(shí)現(xiàn),因?yàn)橥ǖ垒^為狹窄,人員跨線走動(dòng)情況帶來(lái)的環(huán)境干擾較為復(fù)雜,所以該運(yùn)輸系統(tǒng)容易造成車間生產(chǎn)事故[4]。人工駕駛的小型叉車或者梭車很難實(shí)現(xiàn)較高的生產(chǎn)效率,所以促進(jìn)了對(duì)AGV車輛的市場(chǎng)需求[5]。
該研究在輪對(duì)全自動(dòng)驅(qū)動(dòng)底盤系統(tǒng)上實(shí)現(xiàn)AGV車輛技術(shù),提升車間跨生產(chǎn)線運(yùn)輸效率,提升車間安全管理效能,特別針對(duì)AGV輪對(duì)全自動(dòng)輸送車的算法優(yōu)化進(jìn)行技術(shù)創(chuàng)新,并評(píng)價(jià)新技術(shù)的優(yōu)勢(shì)及后續(xù)開(kāi)發(fā)方向[6]。
輪對(duì)式驅(qū)動(dòng)系統(tǒng)通過(guò)調(diào)節(jié)一對(duì)膠輪的相對(duì)轉(zhuǎn)速,實(shí)現(xiàn)車輛的直行、后退、轉(zhuǎn)向功能。驅(qū)動(dòng)輪分別通過(guò)獨(dú)立的驅(qū)動(dòng)電機(jī)進(jìn)行驅(qū)動(dòng)。驅(qū)動(dòng)電機(jī)為大功率同步交流電動(dòng)機(jī),電源來(lái)自車載逆變器(部分大負(fù)荷AGV車輛電源來(lái)自車載發(fā)電機(jī))[7]。該底盤系統(tǒng)整體架構(gòu)詳見(jiàn)圖1。
圖1 輪對(duì)驅(qū)動(dòng)AGV車輛底盤系統(tǒng)示意圖
圖1中,左、右兩套驅(qū)動(dòng)系統(tǒng)驅(qū)動(dòng)輪對(duì)底盤,利用變頻器實(shí)現(xiàn)4個(gè)前進(jìn)擋、1個(gè)停止擋和2個(gè)后退擋,同時(shí)驅(qū)動(dòng)左右獨(dú)立的制動(dòng)系統(tǒng),構(gòu)建輪對(duì)驅(qū)動(dòng)系統(tǒng)。驅(qū)動(dòng)輪直徑33cm,該驅(qū)動(dòng)策略詳見(jiàn)表1[8]。
表1 驅(qū)動(dòng)策略匯總表
表1中,該車輛的最大前進(jìn)線速度約為4.00m/s,即14.4km/h,用作長(zhǎng)距離低風(fēng)險(xiǎn)轉(zhuǎn)運(yùn)過(guò)程,如封閉或半封閉長(zhǎng)距離轉(zhuǎn)運(yùn)通道;低速前進(jìn)速度約為1.25m/s,即4.5km/h,用作長(zhǎng)距離高風(fēng)險(xiǎn)轉(zhuǎn)運(yùn)過(guò)程。該車輪對(duì)中線間距設(shè)計(jì)為1.44m,最大車寬1.55m,最大車長(zhǎng)設(shè)計(jì)為1.89m,其中輪對(duì)軸線前方1.25m,輪對(duì)軸線后方0.64m,其轉(zhuǎn)向能力驗(yàn)算圖如圖2所示[9]。
圖2中,該輪對(duì)底盤的轉(zhuǎn)向方式主要分為兩種,其中圖2(a)為輪對(duì)對(duì)向運(yùn)行實(shí)現(xiàn)以輪對(duì)驅(qū)動(dòng)軸中點(diǎn)為回轉(zhuǎn)中心的小半徑轉(zhuǎn)向方式,圖2(b)為抱死一側(cè)驅(qū)動(dòng)輪,使用另一側(cè)驅(qū)動(dòng)輪低速驅(qū)動(dòng)實(shí)現(xiàn)的以一側(cè)驅(qū)動(dòng)輪為轉(zhuǎn)向回轉(zhuǎn)中心的轉(zhuǎn)向驅(qū)動(dòng)方式。為計(jì)算該兩種轉(zhuǎn)向方式的底盤參數(shù),應(yīng)計(jì)算其轉(zhuǎn)向過(guò)程的最大掃過(guò)半徑Lmax和理論角速度ω,該輪對(duì)驅(qū)動(dòng)底盤的具體數(shù)據(jù)如表2所示[10-12]。
圖2 該輪對(duì)底盤轉(zhuǎn)向能力相關(guān)參數(shù)試算圖
表2 驅(qū)動(dòng)底盤具體數(shù)據(jù)匯總表
該驅(qū)動(dòng)算法,采用機(jī)器人視覺(jué)神經(jīng)系統(tǒng)理念,利用深度卷積神經(jīng)網(wǎng)絡(luò),將4個(gè)視頻探頭和4個(gè)激光點(diǎn)云探頭數(shù)據(jù)分別進(jìn)行深度卷積,形成8個(gè)避障數(shù)據(jù),將該8個(gè)避障數(shù)據(jù)進(jìn)行繼續(xù)卷積,形成多列神經(jīng)網(wǎng)絡(luò)決策,詳見(jiàn)圖3。
圖3 驅(qū)動(dòng)系統(tǒng)神經(jīng)網(wǎng)絡(luò)算法示意圖
圖3中,涉及到5個(gè)關(guān)鍵技術(shù)點(diǎn),現(xiàn)分析如下。
1)激光點(diǎn)云的數(shù)據(jù)卷積方案
單個(gè)激光點(diǎn)云探頭的掃描視域?yàn)? 024×768點(diǎn)陣,共涉及到1個(gè)通道786 432個(gè)數(shù)據(jù),數(shù)據(jù)格式為雙精度浮點(diǎn)變量格式。采用多項(xiàng)式回歸法進(jìn)行節(jié)點(diǎn)設(shè)計(jì),數(shù)據(jù)無(wú)損卷積率可達(dá)到40%,即其包含隱藏層14層,分別為314 573節(jié)點(diǎn)、125 830節(jié)點(diǎn)、50 332節(jié)點(diǎn)、20 133節(jié)點(diǎn)、8 054節(jié)點(diǎn)、3 222節(jié)點(diǎn)、1 289節(jié)點(diǎn)、516節(jié)點(diǎn)、207節(jié)點(diǎn)、83節(jié)點(diǎn)、33節(jié)點(diǎn)、14節(jié)點(diǎn)、6節(jié)點(diǎn)、3節(jié)點(diǎn)。其節(jié)點(diǎn)基函數(shù)如下:
(1)
式中:Xi為節(jié)點(diǎn)輸入項(xiàng)中的第i個(gè)輸入值;Y為節(jié)點(diǎn)輸出值;j為多項(xiàng)式階數(shù);Aj為第j階多項(xiàng)式的待回歸系數(shù)。
激光點(diǎn)云處理器需要同時(shí)運(yùn)行上述4個(gè)卷積神經(jīng)網(wǎng)絡(luò)模塊,對(duì)嵌入系統(tǒng)的浮點(diǎn)計(jì)算能力要求較高,所以嵌入設(shè)備應(yīng)配置多個(gè)高頻率(>2.4GHz)浮點(diǎn)型處理器及通用處理器運(yùn)行操作系統(tǒng),并控制多嵌入設(shè)備的周圍總線通信。該處理器向中央處理器報(bào)送4個(gè)雙精度浮點(diǎn)變量作為中央處理器的視覺(jué)參照數(shù)據(jù)。
2)可見(jiàn)光的數(shù)據(jù)卷積方案
可見(jiàn)光處理器的節(jié)點(diǎn)設(shè)計(jì)與激光點(diǎn)云處理器相同,即采用公式(1)基函數(shù)進(jìn)行節(jié)點(diǎn)設(shè)計(jì),但因?yàn)檩斎霐?shù)據(jù)量不同,其隱藏層架構(gòu)有所不同??梢?jiàn)光采用三通道采集可見(jiàn)光數(shù)據(jù),每通道為640×480解析度,故每個(gè)攝像頭探頭采集的可見(jiàn)光數(shù)據(jù)包括921 600個(gè)數(shù)據(jù),數(shù)據(jù)格式為長(zhǎng)整型變量,可在計(jì)算中強(qiáng)制轉(zhuǎn)化為神經(jīng)網(wǎng)絡(luò)可識(shí)別的雙精度浮點(diǎn)型變量進(jìn)行控制。同樣采用40%卷積率,其隱藏層共14層,分別為368 640節(jié)點(diǎn)、147 456節(jié)點(diǎn)、58 983節(jié)點(diǎn)、23 593節(jié)點(diǎn)、9 438節(jié)點(diǎn)、3 775節(jié)點(diǎn)、1 510節(jié)點(diǎn)、604節(jié)點(diǎn)、242節(jié)點(diǎn)、97節(jié)點(diǎn)、39節(jié)點(diǎn)、16節(jié)點(diǎn)、7節(jié)點(diǎn)、3節(jié)點(diǎn)。
可見(jiàn)光處理器需要同時(shí)運(yùn)行上述4個(gè)卷積神經(jīng)網(wǎng)絡(luò)模塊,處理器硬件設(shè)計(jì)同激光點(diǎn)云處理器。
3)路徑預(yù)設(shè)的跳點(diǎn)方式
傳統(tǒng)計(jì)算模式中,在路徑中設(shè)計(jì)拐點(diǎn),計(jì)算拐點(diǎn)的回轉(zhuǎn)中心點(diǎn)與回轉(zhuǎn)角度,但在該設(shè)計(jì)中,將路徑下一跳點(diǎn)坐標(biāo)(x,y)與AGV車輛當(dāng)前定位點(diǎn)(x0,y0)共4個(gè)變量輸入到中央處理器的判斷坐標(biāo)中,使其通過(guò)卷積神經(jīng)網(wǎng)絡(luò)判斷輪對(duì)驅(qū)動(dòng)方案。該4個(gè)變量均為雙精度浮點(diǎn)型變量。該卷積神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)方案詳見(jiàn)下文。
4)多列神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)驅(qū)動(dòng)信號(hào)輸出方案
針對(duì)左輪和右輪驅(qū)動(dòng)方案分別設(shè)計(jì)1列卷積神經(jīng)網(wǎng)絡(luò),形成多列卷積神經(jīng)網(wǎng)絡(luò)系統(tǒng)。2列神經(jīng)網(wǎng)絡(luò)的模塊架構(gòu)相同,根據(jù)不同設(shè)計(jì)方案進(jìn)行訓(xùn)練。每列神經(jīng)網(wǎng)絡(luò)共12個(gè)輸入數(shù)據(jù),均為雙精度浮點(diǎn)型變量,包括4個(gè)激光點(diǎn)云數(shù)據(jù)卷積結(jié)果、4個(gè)可見(jiàn)光數(shù)據(jù)卷積結(jié)果、4個(gè)路徑預(yù)設(shè)結(jié)果。
該多列神經(jīng)網(wǎng)絡(luò)系統(tǒng)的核心統(tǒng)計(jì)學(xué)目標(biāo)并非數(shù)據(jù)卷積,因?yàn)榕c前文數(shù)十萬(wàn)數(shù)據(jù)卷積為1個(gè)數(shù)據(jù)相比,通過(guò)12個(gè)輸入數(shù)據(jù)卷積為1個(gè)數(shù)據(jù),其卷積壓力較小,所以該部分神經(jīng)網(wǎng)絡(luò)的核心統(tǒng)計(jì)學(xué)目標(biāo)為發(fā)掘數(shù)據(jù)細(xì)節(jié),實(shí)現(xiàn)更高精度的數(shù)據(jù)表達(dá)。故其節(jié)點(diǎn)函數(shù)選擇方案應(yīng)側(cè)重于數(shù)據(jù)細(xì)節(jié)的發(fā)現(xiàn),應(yīng)采用對(duì)數(shù)回歸函數(shù)進(jìn)行節(jié)點(diǎn)設(shè)計(jì),其基函數(shù)應(yīng)改寫(xiě)如下:
Y=∑(A·logeXi+B)
(2)
式中:Xi為節(jié)點(diǎn)輸入項(xiàng)中的第i個(gè)輸入值;Y為節(jié)點(diǎn)輸出值;e為自然常數(shù),此處取近似值e=2.718 281 828;A、B為節(jié)點(diǎn)待回歸系數(shù)。
為加強(qiáng)數(shù)據(jù)分析結(jié)果,該部分神經(jīng)網(wǎng)絡(luò)隱藏層層數(shù)設(shè)計(jì)為6層,分別為17節(jié)點(diǎn)、31節(jié)點(diǎn)、53節(jié)點(diǎn)、29節(jié)點(diǎn)、11節(jié)點(diǎn)、3節(jié)點(diǎn)。輸出為1個(gè)雙精度浮點(diǎn)型變量。
5)驅(qū)動(dòng)方案解釋辦法
上述2列多列神經(jīng)網(wǎng)絡(luò)各輸出1個(gè)雙精度浮點(diǎn)型變量,值域空間為(-∞,+∞)。在解釋辦法中應(yīng)將該輸出值解釋為輪對(duì)單側(cè)驅(qū)動(dòng)輪運(yùn)行的8個(gè)驅(qū)動(dòng)策略(表1),其輸出值與解釋值之間的關(guān)系如表3所示。
表3 驅(qū)動(dòng)方案解釋辦法匯總表
表3中,將數(shù)據(jù)解釋方案設(shè)定為有效值域空間[0,1.000]范圍,超出此值域范圍的(-∞,0)和(1.000,+∞),均設(shè)定為報(bào)錯(cuò)區(qū)間。該報(bào)錯(cuò)區(qū)間用于判斷神經(jīng)網(wǎng)絡(luò)系統(tǒng)是否有效收斂,而在實(shí)際運(yùn)行中,一旦一側(cè)驅(qū)動(dòng)輪給出報(bào)錯(cuò)數(shù)據(jù),則兩側(cè)驅(qū)動(dòng)輪均同時(shí)制動(dòng)抱死,防止出現(xiàn)不可預(yù)見(jiàn)事故。在有效值域空間內(nèi),系統(tǒng)根據(jù)兩側(cè)驅(qū)動(dòng)輪的實(shí)際神經(jīng)網(wǎng)絡(luò)輸出值選擇合適策略。但在安全保護(hù)裝置中,系統(tǒng)會(huì)給出以下輔助報(bào)錯(cuò)空間,以對(duì)神經(jīng)網(wǎng)絡(luò)的收斂情況給出加強(qiáng)輔助判斷過(guò)程,詳見(jiàn)表4。
表4 輔助報(bào)錯(cuò)空間設(shè)置
表4中,前進(jìn)策略共有4個(gè),后退策略為2個(gè),停車策略1個(gè),計(jì)劃內(nèi)制動(dòng)策略1個(gè),轉(zhuǎn)向策略10個(gè),上述計(jì)劃內(nèi)策略共18個(gè),而策略投影空間共有81項(xiàng)。該81項(xiàng)中如果策略投影不在18個(gè)計(jì)劃內(nèi)策略中,均會(huì)給出報(bào)錯(cuò),并使系統(tǒng)保護(hù)性制動(dòng)。該策略進(jìn)一步增加神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程中的收斂度,且增加了系統(tǒng)安全性。
該系統(tǒng)軟件開(kāi)發(fā)過(guò)程中,3個(gè)處理器均采用了Linux操作系統(tǒng),邏輯數(shù)據(jù)管理使用了MySQL平臺(tái)軟件,視頻與激光點(diǎn)云驅(qū)動(dòng)為探頭內(nèi)置軟件,軟件開(kāi)發(fā)使用了Java編譯系統(tǒng)。數(shù)據(jù)訓(xùn)練過(guò)程采用了遙控訓(xùn)練法,使用人工遙控的方式操作該輪對(duì)驅(qū)動(dòng)系統(tǒng),神經(jīng)網(wǎng)絡(luò)系統(tǒng)根據(jù)操作指令和探頭輸入數(shù)據(jù)進(jìn)行訓(xùn)練,其自主訓(xùn)練路徑長(zhǎng)度100m,設(shè)計(jì)拐點(diǎn)6個(gè),運(yùn)行過(guò)程中設(shè)計(jì)額外障礙物及行人闖入等應(yīng)急狀態(tài)。根據(jù)訓(xùn)練時(shí)長(zhǎng)測(cè)試其效率,得到測(cè)試結(jié)果如表5所示。
表5 系統(tǒng)開(kāi)發(fā)測(cè)試結(jié)果表
表5中,當(dāng)訓(xùn)練達(dá)到25h時(shí),該系統(tǒng)的自主尋跡能力已經(jīng)與人工遙控操作時(shí)長(zhǎng)保持持平;當(dāng)訓(xùn)練達(dá)到100h時(shí),該系統(tǒng)的平均車速11.19m/s較人工遙控的9.59m/s提升16.7%。考察行人侵入的制動(dòng)效率,人工遙控制動(dòng)最終位置距離行人平均1.92±0.36m;訓(xùn)練25h時(shí)制動(dòng)最終位置距離行人平均1.23±0.24m;訓(xùn)練100h時(shí)制動(dòng)最終位置距離行人平均0.73±0.18m。可以推測(cè)自主尋跡避障功能,更傾向于貼近異常點(diǎn)進(jìn)行制動(dòng),且所有機(jī)器人操作在訓(xùn)練5h后均未發(fā)生意外碰撞事故。
使用4個(gè)激光點(diǎn)云探頭構(gòu)建自主尋跡避障主視覺(jué)系統(tǒng),使用4個(gè)3通道可見(jiàn)光攝像頭構(gòu)建自主尋跡避障輔助視覺(jué)系統(tǒng),采用機(jī)器人自主視覺(jué)系統(tǒng),在輪對(duì)驅(qū)動(dòng)AGV車輛底盤上,構(gòu)建驅(qū)動(dòng)系統(tǒng)。該系統(tǒng)使用3個(gè)嵌入系統(tǒng)運(yùn)行8個(gè)深度卷積神經(jīng)網(wǎng)絡(luò)和2個(gè)數(shù)據(jù)庫(kù)輔助多列卷積神經(jīng)網(wǎng)絡(luò),最終構(gòu)建針對(duì)2個(gè)驅(qū)動(dòng)輪的8擋位控制系統(tǒng),給出4個(gè)前進(jìn)策略、2個(gè)倒退策略、10個(gè)轉(zhuǎn)向策略、1個(gè)停車策略和1個(gè)計(jì)劃內(nèi)制動(dòng)策略。最終開(kāi)發(fā)測(cè)試中,該系統(tǒng)在遙控訓(xùn)練25h時(shí),達(dá)到與人工遙控近似的自主尋跡能力;遙控訓(xùn)練100h時(shí),控制效率超出人工遙控16.7%;但后續(xù)訓(xùn)練未發(fā)現(xiàn)有控制效率的顯著提升。該系統(tǒng)通過(guò)提升神經(jīng)網(wǎng)絡(luò)系統(tǒng)的節(jié)點(diǎn)數(shù)量、增加控制器的硬件配置,可以得到更高的控制效率。