姚毅, 陳光建, 賈金玲
(四川理工學(xué)院b.計(jì)算機(jī)學(xué)院;a.自動(dòng)化與電子信息學(xué)院, 四川自貢643000)
基于模糊神經(jīng)網(wǎng)絡(luò)算法的機(jī)器人路徑規(guī)劃研究
姚毅a, 陳光建b, 賈金玲b
(四川理工學(xué)院b.計(jì)算機(jī)學(xué)院;a.自動(dòng)化與電子信息學(xué)院, 四川自貢643000)
路徑規(guī)劃是移動(dòng)機(jī)器人研究的關(guān)鍵技術(shù)之一。在研究模糊理論和神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,提出了一種新的算法,即模糊神經(jīng)網(wǎng)絡(luò)。模糊神經(jīng)網(wǎng)絡(luò)既可以像神經(jīng)網(wǎng)絡(luò)那樣并行處理、自行學(xué)習(xí),又可以像模糊理論處理模糊信息、完成模糊推理功能。采用模糊神經(jīng)網(wǎng)絡(luò)來(lái)對(duì)移動(dòng)機(jī)器人的路徑進(jìn)行規(guī)劃,充分發(fā)揮模糊理論和神經(jīng)網(wǎng)絡(luò)的各自優(yōu)勢(shì),從而獲得從起始點(diǎn)到目標(biāo)點(diǎn)的最優(yōu)路徑。在環(huán)境信息完全未知且靜態(tài)的情況下進(jìn)行了仿真實(shí)驗(yàn),結(jié)果表明:該算法效率高、收斂速度快,有效提高了移動(dòng)機(jī)器人的智能化水平。
移動(dòng)機(jī)器人;路徑規(guī)劃;模糊理論;神經(jīng)網(wǎng)絡(luò)
目前,機(jī)器人的發(fā)展趨勢(shì)是高度智能化,而路徑規(guī)劃又是評(píng)定機(jī)器人智能化的重要指標(biāo)。所謂路徑規(guī)劃技術(shù)就是當(dāng)機(jī)器人在前進(jìn)過(guò)程中當(dāng)遇到障礙物無(wú)法前進(jìn)時(shí),需要重新尋找一條路徑到達(dá)終點(diǎn)。新找的一條路徑不僅能使機(jī)器人繞過(guò)障礙物,而且要用時(shí)最短,選擇的距離最科學(xué)。障礙物的大小,距離機(jī)器人的距離都直接影響到機(jī)器人的路徑規(guī)劃。隨著機(jī)器人技術(shù)向人工智能化方向的發(fā)展,對(duì)機(jī)器人的路徑規(guī)劃提出了越來(lái)越高的要求。神經(jīng)網(wǎng)絡(luò)和模糊算法在人工智能方面都表現(xiàn)了各自的優(yōu)越性,但也存在許多弊端。神經(jīng)網(wǎng)絡(luò)雖然有很好的學(xué)習(xí)功能及魯棒性,但是它不適合對(duì)已經(jīng)存在的規(guī)律性知識(shí)的表達(dá),對(duì)已有先驗(yàn)知識(shí)不能很好的利用。模糊邏輯能將通常不能用數(shù)學(xué)方法精確處理的問(wèn)題用模糊的方法來(lái)綜合判斷,但需要全面的先驗(yàn)知識(shí),來(lái)構(gòu)成推理規(guī)則和模糊表。在路徑規(guī)劃中,通過(guò)模糊算法和神經(jīng)網(wǎng)絡(luò)的有機(jī)結(jié)合可以很好地綜合各自的優(yōu)點(diǎn),使規(guī)劃的方式更靈活,規(guī)劃的效果更優(yōu)越。
本文在研究了模糊邏輯算法和神經(jīng)網(wǎng)絡(luò)算法的基礎(chǔ)上,提出了模糊神經(jīng)網(wǎng)絡(luò)算法,并應(yīng)用于移動(dòng)機(jī)器人的路徑規(guī)劃,最后通過(guò)了仿真驗(yàn)證該算法切實(shí)可行的。
1.1神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,簡(jiǎn)稱ANN)是一種模擬人類大腦的思維能力,通過(guò)大量的模擬神經(jīng)元來(lái)實(shí)現(xiàn)非線性算法功能的一種網(wǎng)絡(luò)。它與人腦神經(jīng)系統(tǒng)處理信息的過(guò)程類似,都具有學(xué)習(xí)和自適應(yīng)功能,不同在于其理論基礎(chǔ)是數(shù)學(xué)網(wǎng)絡(luò)拓?fù)?,用神?jīng)網(wǎng)絡(luò)自身結(jié)構(gòu)表達(dá)輸入輸出關(guān)系,使網(wǎng)絡(luò)具有非線性映射的功能對(duì)信息進(jìn)行并行處理。人工神經(jīng)網(wǎng)絡(luò)主要特點(diǎn)是非線性、能夠并行處理信息的網(wǎng)絡(luò),且具有學(xué)習(xí)功能、容錯(cuò)性、信息分布式存儲(chǔ)功能及魯棒性。人工神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)規(guī)則主要有誤差糾正學(xué)習(xí)、競(jìng)爭(zhēng)學(xué)習(xí)、Hebb學(xué)習(xí)等。
1.2模糊理論
模糊理論(Fuzzy Theory)是指用到了模糊集合的基本概念或連續(xù)隸屬度函數(shù)的理論。通過(guò)研究發(fā)現(xiàn),模糊邏輯和神經(jīng)網(wǎng)絡(luò)這兩種技術(shù)各有所長(zhǎng)且具有互補(bǔ)性,因此利用一定的技術(shù)將模糊邏輯與神經(jīng)網(wǎng)絡(luò)適當(dāng)?shù)亟Y(jié)合起來(lái),形成一種新的結(jié)構(gòu),此結(jié)構(gòu)吸取了兩者的長(zhǎng)處,且在不失原有特點(diǎn)的基礎(chǔ)上又有自己的特性,是比單獨(dú)的神經(jīng)網(wǎng)絡(luò)或單獨(dú)的模糊系統(tǒng)性能更好的系統(tǒng)。對(duì)于移動(dòng)機(jī)器人路徑規(guī)劃這樣復(fù)雜的系統(tǒng),模糊神經(jīng)控制技術(shù)有其巨大的優(yōu)勢(shì)。
1.3模糊系統(tǒng)和神經(jīng)網(wǎng)絡(luò)的融合方式
將神經(jīng)網(wǎng)絡(luò)和模糊邏輯采用一定的手段結(jié)合起來(lái)形成了一種新結(jié)構(gòu)的技術(shù),叫神經(jīng)模糊技術(shù)。它們的融合主要有神經(jīng)網(wǎng)絡(luò)和模糊系統(tǒng)集成[1]、模糊邏輯增強(qiáng)型的神經(jīng)網(wǎng)絡(luò)、模糊神經(jīng)網(wǎng)絡(luò)三種方式[2-4]。
本文研究的是模糊神經(jīng)網(wǎng)絡(luò)。模糊神經(jīng)網(wǎng)絡(luò)其實(shí)就是在傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)中加入了一些模糊成分而形成的。它既可以像神經(jīng)網(wǎng)絡(luò)那樣并行處理、自行學(xué)習(xí),又可以像模糊理論處理模糊信息、完成模糊推理功能。根據(jù)在神經(jīng)網(wǎng)絡(luò)中加入的模糊成分不同,又可以將模糊神經(jīng)網(wǎng)絡(luò)分成不同類型。模糊神經(jīng)網(wǎng)絡(luò)在保持原有功能的基礎(chǔ)上又有自身的特點(diǎn)。
2.1模糊神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
模糊推理中的關(guān)鍵問(wèn)題就是隸屬度函數(shù)和模糊規(guī)則的確定,而基于神經(jīng)網(wǎng)絡(luò)的模糊控制器將它們歸結(jié)為神經(jīng)網(wǎng)絡(luò)參數(shù)和結(jié)構(gòu)的訓(xùn)練。有學(xué)者提出了基于Takagi-Sugeno模型(簡(jiǎn)稱T-S模型)的模糊神經(jīng)網(wǎng)絡(luò),本文用變結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)基于T-S的模糊推理[5-9]。
模糊系統(tǒng)的輸出量為每條規(guī)則的輸出量的加權(quán)平均,即:
(1)
將多個(gè)單輸出系統(tǒng)采用一定技術(shù)組合起來(lái)就形成了一個(gè)多輸出系統(tǒng)。現(xiàn)代技術(shù)中可以用來(lái)實(shí)現(xiàn)上述模糊推理過(guò)程的典型方法就是神經(jīng)網(wǎng)絡(luò)。
2.2模糊神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法
模糊神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)包含兩個(gè)步驟:
第一,參數(shù)初調(diào)及結(jié)構(gòu)訓(xùn)練。根據(jù)經(jīng)驗(yàn)確定網(wǎng)絡(luò)參數(shù)初值,構(gòu)造訓(xùn)練樣本對(duì),進(jìn)行參數(shù)初始學(xué)習(xí);然后根據(jù)如下規(guī)則進(jìn)行變結(jié)構(gòu):對(duì)于與某個(gè)輸出相對(duì)應(yīng)的某個(gè)結(jié)點(diǎn)j,若與其相連的權(quán)均小于某域值,則刪除該結(jié)點(diǎn)j。若對(duì)于所有的輸出,其對(duì)應(yīng)的結(jié)點(diǎn)j都被刪除,則刪除結(jié)點(diǎn)j。這表明第j條規(guī)則不存在,從而可以實(shí)現(xiàn)規(guī)則庫(kù)的精煉[2]。
第二,進(jìn)一步進(jìn)行參數(shù)調(diào)整。在經(jīng)過(guò)前面的訓(xùn)練調(diào)整后,其網(wǎng)絡(luò)結(jié)構(gòu)已經(jīng)比較成熟,在此基礎(chǔ)之上,讓參數(shù)進(jìn)行再學(xué)習(xí)。
從本質(zhì)上來(lái)講,由于模糊神經(jīng)網(wǎng)絡(luò)與BP網(wǎng)絡(luò)的結(jié)構(gòu)非常類似,因此,其參數(shù)學(xué)習(xí)完全可以借用BP網(wǎng)絡(luò)的誤差反傳算法[10-11]。按照T-S模糊系統(tǒng)模型建立了模糊神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)中的所有結(jié)點(diǎn)及相關(guān)參數(shù)都分別與模糊系統(tǒng)的隸屬函數(shù)或者是推理過(guò)程對(duì)應(yīng)。該網(wǎng)絡(luò)中的參數(shù)值隨系統(tǒng)的模糊或定性的知識(shí)都是可以根據(jù)需要確定的,因?yàn)樯窠?jīng)網(wǎng)絡(luò)是一個(gè)黑箱子,參數(shù)值要隨機(jī)選取;另外,用較短的時(shí)間收斂到要求的輸入輸出關(guān)系,也是模糊神經(jīng)網(wǎng)絡(luò)的一個(gè)優(yōu)點(diǎn)所在。由于它具有神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),因此,可以實(shí)現(xiàn)規(guī)則及參數(shù)的自學(xué)習(xí),與單純的模糊邏輯系統(tǒng)相比,這也是它的優(yōu)勢(shì)所在。
機(jī)器人對(duì)環(huán)境的外部感知采用的是多傳感器信息融合模型,具體結(jié)構(gòu)如圖1所示。
圖1 機(jī)器人多傳感器信息融合模型框圖
實(shí)現(xiàn)它的核心硬件是智能機(jī)器人傳感器交互模塊,該模塊通過(guò)串行口和I2C總線配置各個(gè)傳感器,包括超聲波、紅外,攝像頭;通過(guò)I2C總線連接六組超聲波測(cè)距傳感器和四組紅外測(cè)距傳感器獲取機(jī)器人周圍障礙物信息數(shù)據(jù),并利用多傳感器信息融合準(zhǔn)確定位障礙物以便機(jī)器人實(shí)現(xiàn)避障和為返回做準(zhǔn)備。用超聲波傳感器和紅外傳感器完成障礙物距離的測(cè)量,用視覺(jué)傳感器完成障礙物邊緣和位置信息的提取。在對(duì)障礙物距離的測(cè)量過(guò)程中,采用超聲波傳感器測(cè)距為主,紅外傳感器為輔,紅外傳感器主要用來(lái)彌補(bǔ)超聲波傳感器的一些缺陷,作為緊急避障來(lái)使用。
具體的原則為:對(duì)CCD攝像頭采集到的視覺(jué)信息,按照數(shù)字圖像處理的方法檢測(cè)到障礙物的邊緣,再利用分區(qū)掃描的辦法獲得障礙物邊緣的像素坐標(biāo),最后得到障礙物兩側(cè)空間的大小,歸一化處理后作為模糊神經(jīng)網(wǎng)絡(luò)輸入[12]。
機(jī)器人在作業(yè)時(shí)主要靠傳感器獲得的外部障礙物信息以及自身所處的狀態(tài)來(lái)決定下一步該怎樣運(yùn)動(dòng)。機(jī)器人獲得相關(guān)數(shù)據(jù)通后輸入計(jì)算模塊,通過(guò)計(jì)算得到合理的運(yùn)動(dòng)軌跡避開(kāi)障礙物,且在避開(kāi)障礙物后,能返回到設(shè)定運(yùn)動(dòng)路線上繼續(xù)前進(jìn)。
為了減少模糊神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時(shí)間,在此采用了離線訓(xùn)練[7,13],其流程如圖2所示。
圖2 模糊神經(jīng)網(wǎng)絡(luò)訓(xùn)練流程圖
根據(jù)離線訓(xùn)練網(wǎng)絡(luò)的參數(shù)和結(jié)構(gòu),把已建立的模糊控制規(guī)則作為模糊神經(jīng)網(wǎng)絡(luò)控制器的訓(xùn)練樣本來(lái)訓(xùn)練網(wǎng)絡(luò)。在訓(xùn)練好網(wǎng)絡(luò)之后,模糊神經(jīng)網(wǎng)絡(luò)控制器就可以對(duì)移動(dòng)機(jī)器人的局部運(yùn)動(dòng)進(jìn)行規(guī)劃,通過(guò)CCD攝像機(jī)、紅外和超聲波傳感器來(lái)獲取障礙物信息,從而實(shí)現(xiàn)對(duì)移動(dòng)機(jī)器人的實(shí)時(shí)控制。
經(jīng)過(guò)訓(xùn)練以后,隸屬度函數(shù)變得很平緩,即機(jī)器人運(yùn)行比較平穩(wěn);當(dāng)障礙物距離機(jī)器人較近時(shí),機(jī)器人會(huì)實(shí)時(shí)靈敏的做出相應(yīng)的操作;當(dāng)距離較遠(yuǎn)時(shí),機(jī)器人具有較強(qiáng)的魯棒性控制自己的運(yùn)動(dòng)。由此可知:經(jīng)過(guò)訓(xùn)練,機(jī)器人的避障功能得到增強(qiáng),用于輸入變量的隸屬度函數(shù)由于得到有效的優(yōu)化而更適用于機(jī)器人的避障。
本仿真實(shí)驗(yàn)是在環(huán)境信息完全未知且靜態(tài)的情況下進(jìn)行的。在仿真實(shí)驗(yàn)中,一些外界信息都是通過(guò)計(jì)算得到的,但是在實(shí)際情況中,機(jī)器人作業(yè)環(huán)境的外部信息包括溫度、濕度、障礙物分布情況等都是由傳感器獲得的。為了簡(jiǎn)化實(shí)驗(yàn),在具體操作的時(shí)候,將外界信息理想化(比如將障礙物的形狀用圓形來(lái)表示)。最后,分別給出了在同樣的環(huán)境下障礙物多和障礙物少的路徑圖的兩種仿真結(jié)果,其中移動(dòng)機(jī)器人的起始點(diǎn)均為原點(diǎn)。圖3是障礙物分布較密集的時(shí)候的路徑軌跡,圖4是障礙物分布較疏散的情況下的機(jī)器人仿真路徑。
圖3 障礙物(圓形)較多時(shí)的路徑規(guī)劃仿真圖
圖4 障礙物(圓形)較少時(shí)的路徑規(guī)劃仿真圖
通過(guò)以上仿真結(jié)果可以得出,采樣時(shí)間的長(zhǎng)短和轉(zhuǎn)角度數(shù)的選擇對(duì)機(jī)器人路徑規(guī)劃有相當(dāng)重要的影響。仿真結(jié)果顯示采樣時(shí)間較短時(shí),機(jī)器人在障礙物間就會(huì)不停地轉(zhuǎn)向甚至在某些點(diǎn)會(huì)打轉(zhuǎn)進(jìn)而發(fā)生死鎖現(xiàn)象;但當(dāng)采樣時(shí)間比較長(zhǎng)時(shí),機(jī)器人又會(huì)很容易和障礙物發(fā)生碰撞,當(dāng)障礙物較小時(shí)機(jī)器人還會(huì)沖進(jìn)障礙物區(qū)域。本文進(jìn)行了多次試驗(yàn),得到一組能滿足大多數(shù)情況的采樣時(shí)間和轉(zhuǎn)角度數(shù)的組合:采樣時(shí)間0.1秒,轉(zhuǎn)角度數(shù)為5度。由仿真圖可知,機(jī)器人可以比較順利地完成路徑規(guī)劃,說(shuō)明采用模糊神經(jīng)網(wǎng)絡(luò)算法是可行的。
本文以已有的機(jī)器人雛形為研究對(duì)象,針對(duì)未知環(huán)境下移動(dòng)機(jī)器人路徑規(guī)劃問(wèn)題開(kāi)展研究。在對(duì)神經(jīng)網(wǎng)絡(luò)和模糊理論進(jìn)行分析對(duì)比的基礎(chǔ)上,將兩者有機(jī)地結(jié)合到了一起,構(gòu)建了在靜態(tài)未知環(huán)境下用于路徑規(guī)劃的模糊神經(jīng)網(wǎng)絡(luò),并提出了相應(yīng)的方法。采用模糊神經(jīng)網(wǎng)絡(luò)對(duì)移動(dòng)機(jī)器人的路徑進(jìn)行規(guī)劃,從而獲得從起始點(diǎn)到目標(biāo)點(diǎn)的最優(yōu)路徑。該算法能夠有效提高移動(dòng)機(jī)器人的智能化水平。
[1] 許 亮.基于模糊神經(jīng)網(wǎng)絡(luò)的AUV路徑規(guī)劃技術(shù)[D].青島:中國(guó)海洋大學(xué),2007.
[2] 鄭洪濤,李玉榕,喬 斌,等.基于模糊神經(jīng)網(wǎng)絡(luò)開(kāi)關(guān)磁阻電動(dòng)機(jī)轉(zhuǎn)矩觀測(cè)[J].儀器儀表學(xué)報(bào),2002,23(4):351-353,360.
[3] 蓋慶書(shū),白 雪.基于神經(jīng)網(wǎng)絡(luò)模型的信息融合技術(shù)[J].華北水利水電學(xué)院學(xué)報(bào),2009(1):25-27.
[4] 叢 爽,戴 宜.遞歸神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)研究[J].計(jì)算機(jī)應(yīng)用,2004,24(8):18-21.
[5] 周 杰.含擴(kuò)散項(xiàng)時(shí)滯模糊Cohen-Grossberg神經(jīng)網(wǎng)絡(luò)的指數(shù)穩(wěn)定性[J].四川理工學(xué)院學(xué)報(bào):自然科學(xué)版, 2010,23(3):270-274.
[6] 張寒松,賈瑞清.基于實(shí)際函數(shù)的機(jī)器人模糊神經(jīng)網(wǎng)絡(luò)路徑規(guī)劃[J].礦山機(jī)械,2010,38(14):44-48.
[7] 李貽斌,李彩虹,宋 勇.基于模糊神經(jīng)網(wǎng)絡(luò)的移動(dòng)機(jī)器人自適應(yīng)行為設(shè)計(jì)[J].山東大學(xué)學(xué)報(bào):工學(xué)版,2010(2):28-33.
[8] 劉 毅.移動(dòng)機(jī)器人路徑規(guī)劃中的仿真研究[J].計(jì)算機(jī)仿真,2011(6):227-230.
[9] 錢 夔,宋愛(ài)國(guó),章華濤,等.基于自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)的機(jī)器人路徑規(guī)劃方法[J].東南大學(xué)學(xué)報(bào):自然科學(xué)版,2012(4):637-642.
[10] 李瑞峰,張 超,黃 超,等.清掃機(jī)器人路徑規(guī)劃的研究[J].機(jī)械設(shè)計(jì)與制造,2012(12):160-162.
[11] 郜園園,朱凡,宋洪軍.進(jìn)化操作行為學(xué)習(xí)模型及在移動(dòng)機(jī)器人避障上的應(yīng)用[J].計(jì)算機(jī)應(yīng)用, 2013(8):2283-2288.
[12] 王華秋.自組織模糊神經(jīng)網(wǎng)絡(luò)的內(nèi)??刂蒲芯颗c應(yīng)用[J].計(jì)算機(jī)仿真,2014(4):343-346.
[13] 張萬(wàn)緒,張向蘭,李 瑩.基于改進(jìn)粒子群算法的智能機(jī)器人路徑規(guī)劃[J].計(jì)算機(jī)應(yīng)用,2014(2):510-513.
Study on the Robot Path Planning Based on Fuzzy Neural Network Algorithm
YAOYia,CHENGuangjianb,JIAJinlingb
(a.School of Automation and Electronic Information; b.School of Computer Science, Sichuan University of
Science & Engineering, Zigong 643000, China)
Path planning is one of the key technologies for mobile robot researches. Based on the study of fuzzy theory and neural network, a new algorithm namely fuzzy neural network is proposed. Fuzzy neural network-FNN can not only perform parallel processing and self learning, as what NNs can do, but also process fuzzy information and perform fuzzy reasoning, as what fuzzy theory can do. The fuzzy neural network-FNN is used for designing routes of mobile robots, and respective advantages of fuzzy theory and NNs are fully utilized, then the optimum route from start point to object point is obtained. In conditions where environmental information is unknown and static, simulation experiment is conducted and the results indicate that this algorithm is efficient and has fast convergence rate, which helps to improve the intelligence level of mobile robots in an efficient way.
mobile robot; path planning; fuzzy theory; neural network
2014-08-01
人工智能四川省重點(diǎn)實(shí)驗(yàn)室基金項(xiàng)目(2014RYY01;2014RYY03);企業(yè)信息化與物聯(lián)網(wǎng)測(cè)控技術(shù)四川省高校重點(diǎn)實(shí)驗(yàn)室基金項(xiàng)目(2013WZY02);四川理工學(xué)院校級(jí)培育科研項(xiàng)目(2012PY21;2013PY06)
姚 毅(1961-),男,四川自貢人,教授,碩士,主要從事信號(hào)檢測(cè)與智能信息處理方面的研究,(E-mail)yaoyi@suse.edu.cn 陳光建(1979-),男,四川自貢人,副教授,碩士,主要從事計(jì)算機(jī)應(yīng)用方面的研究,(E-mail)guangjian224@126.com;
1673-1549(2014)06-0030-04
10.11863/j.suse.2014.06.08
TP242
A