戚毅凡,賈英宏,趙寶山,鐘睿,洪聞青
1. 昆明物理研究所,昆明 650223
2. 北京航空航天大學(xué) 宇航學(xué)院,北京 100191
3. 天津航天機(jī)電設(shè)備研究所 天津市微低重力環(huán)境模擬技術(shù)重點(diǎn)實(shí)驗(yàn)室,天津 300301
在軌服務(wù)技術(shù)是航天領(lǐng)域的熱點(diǎn)研究問題之一,而空間機(jī)械臂是空間任務(wù)中不可或缺的裝備??臻g機(jī)械臂在執(zhí)行零件對(duì)接拆裝、維修、捕獲及釋放等操作時(shí)會(huì)與環(huán)境發(fā)生接觸,空間機(jī)械臂末端與環(huán)境會(huì)存在較大的接觸力。為了確保目標(biāo)或機(jī)械臂本身不被損壞以及任務(wù)的順利進(jìn)行,必須對(duì)空間機(jī)械臂進(jìn)行柔順控制[1]。
機(jī)械臂柔順控制包括被動(dòng)柔順控制和主動(dòng)柔順控制[2]。被動(dòng)柔順控制的力控制精度較低,對(duì)環(huán)境的適應(yīng)能力有限,因而主動(dòng)柔順控制是主要研究方向。主動(dòng)柔順控制主要分為兩類:力/位混合控制和阻抗控制。力/位混合控制就是在一定規(guī)則下將力反饋與位置反饋相結(jié)合,以同時(shí)滿足任務(wù)中位置和力的約束條件。其原理是在笛卡爾坐標(biāo)系下將機(jī)械臂末端的運(yùn)動(dòng)空間分解為約束空間和無(wú)約束空間,在不受約束空間上進(jìn)行位置控制,在約束空間上進(jìn)行力控制[3]。文獻(xiàn)[4]提出了阻抗控制算法,該算法建立了力、位置、速度的阻抗關(guān)系式,僅需要一個(gè)控制策略即可同時(shí)控制力和位置。阻抗控制將力和位置控制納入同一控制體系,相比力/位混合控制,阻抗控制計(jì)算量更小,控制更容易實(shí)現(xiàn),且研究的成熟度更高。故本文使用阻抗控制算法作為柔順控制方法。
使用阻抗算法實(shí)現(xiàn)精準(zhǔn)的力控制要求獲得精確的環(huán)境信息,例如環(huán)境位置、環(huán)境剛度和環(huán)境阻尼等[5]。然而空間機(jī)械臂在執(zhí)行任務(wù)時(shí)環(huán)境復(fù)雜多變,環(huán)境信息難以準(zhǔn)確測(cè)量或辨識(shí),獲得精確的環(huán)境信息難以實(shí)現(xiàn),為此眾多學(xué)者針對(duì)該問題進(jìn)行了研究。文獻(xiàn)[6]在傳統(tǒng)阻抗控制中引入了自適應(yīng)控制方法,基于迭代思想彌補(bǔ)環(huán)境信息不確定所帶來(lái)的影響,使控制器對(duì)環(huán)境的適應(yīng)能力增強(qiáng)。文獻(xiàn)[7]將魯棒控制與阻抗控制相結(jié)合,基于函數(shù)逼近技術(shù)設(shè)計(jì)了魯棒阻抗控制器,并在Puma560機(jī)器人上驗(yàn)證了該控制器的有效性。
也有學(xué)者通過實(shí)時(shí)調(diào)整阻抗參數(shù),來(lái)解決環(huán)境信息不確定下的空間機(jī)械臂阻抗控制問題。阻抗參數(shù)的選擇決定了控制器的柔順特性,若阻抗參數(shù)能隨環(huán)境實(shí)時(shí)調(diào)整,則阻抗控制器的柔順控制效果會(huì)優(yōu)于阻抗參數(shù)固定的情況[8]。文獻(xiàn)[9]提出了一種在未知環(huán)境下模糊自適應(yīng)阻抗控制,通過接觸力反饋調(diào)整阻抗參數(shù)來(lái)適應(yīng)未知環(huán)境。絕大多數(shù)研究在解決環(huán)境信息不確定下的空間機(jī)械臂阻抗控制問題時(shí),通常將碰撞模型假設(shè)為簡(jiǎn)單的彈簧模型或是彈簧阻尼模型,而真實(shí)的碰撞模型是更復(fù)雜的、更難以解析的非線性模型[10]。若碰撞模型未知或建立不準(zhǔn)確,以上研究中調(diào)整阻抗參數(shù)的自適應(yīng)算法將失效,控制器的柔順控制效果無(wú)法得到保障。
神經(jīng)網(wǎng)絡(luò)憑借非線性擬合的特性被引入到自動(dòng)化控制領(lǐng)域中,與傳統(tǒng)控制器相比,神經(jīng)網(wǎng)絡(luò)控制器不受被控對(duì)象模型建立的影響,其適應(yīng)性和魯棒性均較強(qiáng)[11]。若能將神經(jīng)網(wǎng)絡(luò)引入到柔順控制系統(tǒng)中,并根據(jù)機(jī)械臂末端反饋信息對(duì)阻抗參數(shù)進(jìn)行實(shí)時(shí)調(diào)整,則能避免由于碰撞模型未知及空間中環(huán)境的不確定因素對(duì)柔順?biāo)惴óa(chǎn)生的不利影響。當(dāng)下已有許多學(xué)者將神經(jīng)網(wǎng)絡(luò)與阻抗算法相結(jié)合,對(duì)空間機(jī)械臂進(jìn)行控制。文獻(xiàn)[12]提出了一種基于BP神經(jīng)網(wǎng)絡(luò)的自適應(yīng)阻抗控制,BP神經(jīng)網(wǎng)絡(luò)根據(jù)環(huán)境剛度和位置的變化通過補(bǔ)償阻抗控制器的誤差來(lái)校正機(jī)械臂末端的位置。文獻(xiàn)[13]將RBF神經(jīng)網(wǎng)絡(luò)應(yīng)用于改進(jìn)后的阻抗關(guān)系,對(duì)系統(tǒng)的未知部分進(jìn)行補(bǔ)充,提高了所設(shè)計(jì)控制器的跟蹤性能。
但將傳統(tǒng)神經(jīng)網(wǎng)絡(luò)應(yīng)用于阻抗參數(shù)實(shí)時(shí)調(diào)整存在諸多問題,例如學(xué)習(xí)時(shí)間冗長(zhǎng)、網(wǎng)絡(luò)參數(shù)選擇無(wú)具體參考公式等[14]。例如傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)通常使用逆梯度下降法完成訓(xùn)練,收斂速度慢,易陷入局部最優(yōu)[15],故無(wú)法將阻抗參數(shù)實(shí)時(shí)調(diào)整到最優(yōu)數(shù)值。針對(duì)環(huán)境信息不確定、真實(shí)碰撞模型復(fù)雜且未知、傳統(tǒng)神經(jīng)網(wǎng)絡(luò)收斂速度慢且易陷入局部最優(yōu)等問題,本文將粒子群優(yōu)化算法(particle swarm optimization,PSO)與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)結(jié)合,提出了一種基于改進(jìn)神經(jīng)網(wǎng)絡(luò)的阻抗控制方法。該方法無(wú)需準(zhǔn)確的環(huán)境信息,也不需要碰撞模型的先驗(yàn)知識(shí),利用粒子群優(yōu)化算法調(diào)整神經(jīng)網(wǎng)絡(luò)中的權(quán)值矩陣,改善傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)的尋優(yōu)性能。改進(jìn)后的神經(jīng)網(wǎng)絡(luò)根據(jù)機(jī)械臂末端反饋的信息在線調(diào)整阻抗參數(shù),以獲得更好的控制性能和控制精度。所設(shè)計(jì)的粒子群優(yōu)化BP神經(jīng)網(wǎng)絡(luò)阻抗控制器(PSO-BP阻抗控制器)能有效降低最大接觸力,減小穩(wěn)態(tài)力控制誤差,提高控制系統(tǒng)的響應(yīng)速度,且不依賴精確的環(huán)境信息,具有較強(qiáng)的抗干擾能力。
本文以如圖1所示的平面二自由度機(jī)械臂系統(tǒng)作為研究對(duì)象,系統(tǒng)由衛(wèi)星基座與二自由度機(jī)械臂構(gòu)成。
圖1 二自由度機(jī)械臂系統(tǒng)Fig.1 2-DOF manipulator system
假設(shè)衛(wèi)星基座受控良好,位置與姿態(tài)保持固定狀態(tài)。此情況下,空間機(jī)械臂的柔順控制可以類比固定基座機(jī)械臂,即衛(wèi)星本體坐標(biāo)系近似于慣性坐標(biāo)系[16]。機(jī)械臂連桿視為細(xì)桿,連桿間由單自由度的旋轉(zhuǎn)關(guān)節(jié)連接,整個(gè)系統(tǒng)為二自由度系統(tǒng)。機(jī)械臂末端接觸衛(wèi)星基座上一平板,平板與衛(wèi)星基座固連且垂直于衛(wèi)星基座表面。如上機(jī)械臂系統(tǒng)的動(dòng)力學(xué)方程可以寫為:
(1)
式中:τ為關(guān)節(jié)控制力矩;θ為關(guān)節(jié)轉(zhuǎn)角;D為正定對(duì)稱的質(zhì)量陣;H為離心力和哥氏力向量;Fe為機(jī)械臂末端與環(huán)境的接觸力;J為雅克比矩陣。機(jī)械臂正運(yùn)動(dòng)學(xué)即由各關(guān)節(jié)轉(zhuǎn)角計(jì)算獲得機(jī)械臂末端位置,其可通過幾何關(guān)系推導(dǎo)得到。將正運(yùn)動(dòng)學(xué)方程求導(dǎo),便可獲得機(jī)械臂末端速度的計(jì)算式
(2)
阻抗控制算法將環(huán)境與機(jī)械臂納入一個(gè)統(tǒng)一的控制體系,當(dāng)機(jī)械臂未接觸環(huán)境時(shí),可以根據(jù)位置誤差進(jìn)行軌跡規(guī)劃。當(dāng)機(jī)械臂與環(huán)境接觸產(chǎn)生接觸力時(shí),阻抗算法就能響應(yīng)該接觸力,使機(jī)械臂系統(tǒng)在位置控制和力控制之間達(dá)到一個(gè)平衡狀態(tài)。阻抗關(guān)系式通常使用二階形式[18]:
(3)
式中:Fd為機(jī)械臂末端期望接觸力;M、B、K為阻抗參數(shù),分別為慣性系數(shù)矩陣、阻尼系數(shù)矩陣和剛度系數(shù)矩陣,均為正定對(duì)角陣;位置誤差e=xd-x,x為機(jī)械臂末端位置,xd為機(jī)械臂末端期望位置。使用計(jì)算控制力矩法并結(jié)合空間機(jī)械臂逆動(dòng)力學(xué)方程設(shè)計(jì)阻抗控制器[19],控制器輸出的關(guān)節(jié)控制力矩τm為:
(4)
若碰撞模型已知,則可根據(jù)式(1)~(4)分析空間機(jī)械臂與環(huán)境接觸過程中的動(dòng)態(tài)響應(yīng)性能。常用的碰撞模型包括K模型、Kelvin-Voigt模型(K-V模型)和Hunt-Crossley模型(H-C模型)[20]。K模型假設(shè)接觸力僅由碰撞物體的局部接觸形變導(dǎo)致,接觸力大小與形變量成正比;K-V模型將碰撞模型等效為彈簧阻尼模型;H-C模型假設(shè)碰撞模型為更復(fù)雜的非線性模型。K模型、K-V模型、H-C模型的復(fù)雜程度依次遞增,接觸力計(jì)算也越接近真實(shí)碰撞情況。在機(jī)械臂柔順控制領(lǐng)域中,由于更注重控制算法的研究,所以碰撞模型通常選用較簡(jiǎn)單的K模型和K-V模型,計(jì)算得到的接觸力不能反映真實(shí)的碰撞過程。故本文使用更接近真實(shí)碰撞情況的H-C模型計(jì)算接觸力,其計(jì)算公式為:
(5)
式中:δ=x-xe,xe為環(huán)境位置;Khc和Bhc分別為環(huán)境剛度矩陣和環(huán)境阻尼矩陣,均為正定對(duì)角陣,表示接觸力可以在任意方向上解耦;指數(shù)n為模型的非線性度。H-C模型僅為仿真時(shí)計(jì)算空間機(jī)械臂末端接觸力使用,在控制過程中碰撞模型未知,可將式(5)表示為:
(6)
式中:函數(shù)g為一個(gè)未知的非線性函數(shù)。將式(3)(4)(6)代入式(2)即可獲得發(fā)生碰撞時(shí)機(jī)械臂系統(tǒng)的閉環(huán)方程
(7)
由式(7),機(jī)械臂末端穩(wěn)態(tài)位置xss滿足
(8)
穩(wěn)態(tài)接觸力Fss與穩(wěn)態(tài)位置xss存在非線性關(guān)系
(9)
由式(8)(9)可以計(jì)算穩(wěn)態(tài)力誤差EF為:
EF=Kxd-Kxss
(10)
若要使穩(wěn)態(tài)力誤差EF=0,則期望軌跡需要滿足
xd=xss
(11)
在碰撞模型未知、環(huán)境信息不確定的情況下機(jī)械臂末端穩(wěn)態(tài)位置xss不能求解。環(huán)境剛度的數(shù)值通常較大,期望軌跡較小的偏差就會(huì)導(dǎo)致較大的力控制誤差,這也是該情況下傳統(tǒng)阻抗控制難以實(shí)現(xiàn)精準(zhǔn)力控制的原因。對(duì)于傳統(tǒng)阻抗控制,阻抗參數(shù)的選擇往往是根據(jù)經(jīng)驗(yàn)決定,在整個(gè)控制過程中視為固定值。但阻抗參數(shù)的選擇與機(jī)械臂模型、環(huán)境模型有較強(qiáng)的依賴關(guān)系,所以傳統(tǒng)阻抗控制系統(tǒng)的穩(wěn)態(tài)誤差較大,而且系統(tǒng)的魯棒性較差。由式(10)(11)還發(fā)現(xiàn),若阻抗參數(shù)能進(jìn)行合適的調(diào)整,則可以降低穩(wěn)態(tài)力誤差,實(shí)現(xiàn)精準(zhǔn)的力控制。下文將使用改進(jìn)后的神經(jīng)網(wǎng)絡(luò)對(duì)阻抗參數(shù)進(jìn)行在線調(diào)整,以提高力控制精確度。
文獻(xiàn)[21]提出粒子群優(yōu)化算法,PSO算法初始化一群隨機(jī)粒子,通過迭代在隨機(jī)解中尋找最優(yōu)解。粒子群優(yōu)化的基本原理為[22]:假設(shè)在一個(gè)D維空間中存在一個(gè)由N個(gè)粒子組成的種群,在求解最優(yōu)值的過程中,每個(gè)粒子通過自身的歷史最優(yōu)位置和種群的歷史最優(yōu)位置,調(diào)整自身的位置和速度,使自身向全局最優(yōu)解靠近。定義第i個(gè)粒子的位置向量為xi=(xi1xi2…xiD),速度向量為vi=(vi1vi2…viD),歷史最優(yōu)位置為pi=(pi1pi2…piD),整個(gè)種群的歷史最優(yōu)位置為pg=(pg1pg2…pgD)。在迭代過程中,每一個(gè)粒子根據(jù)以下公式對(duì)自身的位置和速度進(jìn)行更新:
(12)
(13)
式中:i=1,2,…,N;d=1,2,…,D;ω為慣性因數(shù);c1、c2為加速系數(shù),均為非負(fù)常數(shù),加速系數(shù)的合理選擇可以提高尋優(yōu)速度并且避免陷入局部最優(yōu);r1、r2分別為兩個(gè)[0,1]之間的隨機(jī)數(shù)。式(12)(13)表示第i個(gè)粒子由第k代進(jìn)化到第k+1代速度和位置的更新規(guī)則。粒子速度通常被限制在一個(gè)范圍之內(nèi),vid∈[-vmax,+vmax],避免因其速度過大而搜索遠(yuǎn)離最優(yōu)解或速度過小陷入局部最優(yōu)。同樣,粒子位置也被限制于一個(gè)范圍之內(nèi),xid∈[-xmax,+xmax]。xmax、vmax通常根據(jù)經(jīng)驗(yàn)設(shè)定。粒子群優(yōu)化的結(jié)束條件一般為:達(dá)到最大迭代次數(shù)kmax或全局極值對(duì)應(yīng)的適應(yīng)度值小于目標(biāo)適應(yīng)度閾值[23]。
在碰撞模型未知、環(huán)境信息不確定的情況下,空間機(jī)械臂難以實(shí)現(xiàn)準(zhǔn)確的力控制。傳統(tǒng)神經(jīng)網(wǎng)絡(luò)難以實(shí)現(xiàn)理想的自適應(yīng)控制,其原因?yàn)椋簩W(xué)習(xí)或訓(xùn)練時(shí)間較長(zhǎng),無(wú)法滿足控制快速性的要求;控制結(jié)果與系統(tǒng)的穩(wěn)定性受權(quán)值矩陣初始值的影響較大;易陷入局部最優(yōu),無(wú)法找到滿足要求的全局最優(yōu)解?;谝陨显?,本文對(duì)傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行改進(jìn),引入PSO算法作為神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法,并將改進(jìn)后的神經(jīng)網(wǎng)絡(luò)與阻抗控制結(jié)合,設(shè)計(jì)PSO-BP阻抗控制器,控制器結(jié)構(gòu)如圖2所示。
圖2 PSO-BP阻抗控制器結(jié)構(gòu)示意Fig.2 Structure of PSO-BP impedance controller
圖3 PSO-BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意Fig.3 Structure of PSO-BP neural network
1)隨機(jī)初始化輸入權(quán)值矩陣win和輸出權(quán)值矩陣wout,設(shè)置神經(jīng)網(wǎng)絡(luò)各層節(jié)點(diǎn)個(gè)數(shù):輸入層神經(jīng)元數(shù)I=3、隱層神經(jīng)元數(shù)H=5、輸出層神經(jīng)元數(shù)J=3。神經(jīng)網(wǎng)絡(luò)的輸入信號(hào)xin、輸入權(quán)值矩陣win和輸出權(quán)值矩陣wout的具體表達(dá)形式為:xin=[xi],win=[vih],wout=[whj]
其中,i=1,2,…,I;h=1,2,…,H;j=1,2,…,J。 2)由期望軌跡、期望力、機(jī)械臂末端軌跡和接觸力構(gòu)成神經(jīng)網(wǎng)絡(luò)的輸入信號(hào):
3)將輸入信號(hào)傳遞給神經(jīng)網(wǎng)絡(luò)的輸入層,由輸入權(quán)值矩陣win計(jì)算隱層第h個(gè)神經(jīng)元的輸入αh:
αh=xivih
4)隱層將輸入信號(hào)αh輸入激活函數(shù)后輸出,隱層激活函數(shù)為tanh函數(shù),具體計(jì)算過程為:
5)將隱層輸出信號(hào)傳遞給輸出層,由輸出權(quán)值矩陣wout計(jì)算輸出層第j個(gè)神經(jīng)元的輸入βj:
βj=bhwhj
6)輸出層將信號(hào)βj輸入激活函數(shù)后輸出,輸出激活函數(shù)為sigmoid函數(shù),其具體算法為:
其中,z1=M,z2=B,z3=K。
7)根據(jù)PSO-BP神經(jīng)網(wǎng)絡(luò)輸出的阻抗參數(shù)計(jì)算關(guān)節(jié)控制力矩τm,并根據(jù)要求對(duì)其進(jìn)行限幅,之后將關(guān)節(jié)控制力矩輸入到空間機(jī)械臂系統(tǒng)中。
8)粒子群開始尋優(yōu),粒子群維度由輸入權(quán)值矩陣win和輸出權(quán)值矩陣wout中的元素個(gè)數(shù)決定,定義粒子的適應(yīng)度函數(shù)f為:
9)根據(jù)位置和速度更新公式,得到下一代粒子群的位置和速度,并計(jì)算各粒子的適應(yīng)度,更新個(gè)體極值與全局極值。
10)當(dāng)全局極值大于或等于所設(shè)定的目標(biāo)值時(shí),返回步驟8)。若全局極值小于設(shè)定的目標(biāo)值或達(dá)到迭代次數(shù)上限,尋優(yōu)結(jié)束,當(dāng)前粒子位置即代表輸入權(quán)值矩陣win和輸出權(quán)值矩陣wout中每一個(gè)元素的最優(yōu)解。
將輸入權(quán)值矩陣win和輸出權(quán)值矩陣wout返回至PSO-BP神經(jīng)網(wǎng)絡(luò)中,重復(fù)步驟3)~7)計(jì)算最優(yōu)阻抗參數(shù),對(duì)空間機(jī)械臂系統(tǒng)進(jìn)行柔順控制。
圖4 機(jī)械臂末端x方向接觸力誤差Fig.4 Contact force error on tip of manipulator in x direction
圖5 機(jī)械臂末端x方向位置誤差Fig.5 Position error of tip of manipulator in x direction
圖6 慣性系數(shù)的變化Fig.6 Variations of inertial coefficient
圖7 阻尼系數(shù)的變化Fig.7 Variations of damping coefficient
圖9 PSO-BP阻抗控制器關(guān)節(jié)控制力矩Fig.9 Control torques of PSO-BP impedance controller
表1 接觸力動(dòng)態(tài)響應(yīng)
由仿真結(jié)果可見,相較于傳統(tǒng)阻抗控制器和BP阻抗控制器,本文提出的PSO-BP阻抗控制器的機(jī)械臂末端位置控制誤差和接觸力控制誤差最小(圖4、圖5),與傳統(tǒng)阻抗控制器相比降低了99.1%;此外,PSO-BP阻抗控制器實(shí)現(xiàn)了更小的最大接觸力和更短的調(diào)節(jié)時(shí)間(圖4、表1),與傳統(tǒng)阻抗控制器相比分別降低了41.7%和19.0%,柔順控制效果得到顯著提升。在初始階段,由于粒子群處于初始化階段,尋優(yōu)難度較大,在線調(diào)整的慣性系數(shù)、阻尼系數(shù)和剛度系數(shù)出現(xiàn)了幅值較大的調(diào)節(jié)過程(圖6~8),控制力矩也出現(xiàn)高頻振蕩(圖9);但當(dāng)粒子群的速度和位置經(jīng)過較短時(shí)間的更新后,就能快速地尋找到全局最優(yōu)方向,優(yōu)化和控制效果隨之平穩(wěn)。為了考察PSO-BP阻抗控制器的抗干擾能力,在仿真中的接觸力反饋通道設(shè)置了一個(gè)正弦干擾信號(hào)Fint=0.15sin (180t),機(jī)械臂末端位置誤差及接觸力的仿真結(jié)果如圖10、圖11所示。
圖10 存在干擾情況下x方向的機(jī)械臂末端接觸力誤差Fig.10 Contact force error of tip of manipulator with interference in x direction
圖11 存在干擾情況下機(jī)械臂末端x方向的位置誤差Fig.11 Position error of tip of manipulator with interference in x direction
由圖10、圖11可見,在接觸力反饋存在干擾信號(hào)的情況下,BP阻抗控制器和PSO-BP阻抗控制器的機(jī)械臂末端接觸力和位置控制精度均顯著優(yōu)于傳統(tǒng)阻抗控制器,而PSO-BP阻抗控制器在力反饋信號(hào)受到干擾時(shí)位置誤差和接觸力誤差波動(dòng)最小,位置控制和力控制更為穩(wěn)定,表現(xiàn)出較強(qiáng)的抗干擾能力。
本文針對(duì)環(huán)境信息不確定和碰撞模型未知情況下的空間機(jī)械臂柔順控制問題,結(jié)合文獻(xiàn)[21-22]的粒子群優(yōu)化算法對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行改進(jìn),將文獻(xiàn)[18]的阻抗控制方法與改進(jìn)后的神經(jīng)網(wǎng)絡(luò)相結(jié)合,提出了一種改進(jìn)型神經(jīng)網(wǎng)絡(luò)阻抗控制方法,得到的結(jié)論如下:
1)針對(duì)傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)時(shí)間長(zhǎng)、易陷入局部?jī)?yōu)化等問題,利用PSO算法調(diào)整神經(jīng)網(wǎng)絡(luò)中的權(quán)值矩陣,改善傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)的尋優(yōu)性能。
2)將PSO-BP神經(jīng)網(wǎng)絡(luò)與阻抗控制相結(jié)合,設(shè)計(jì)了PSO-BP阻抗控制器。該控制器可在無(wú)碰撞模型先驗(yàn)知識(shí)、不依賴環(huán)境信息的情況下,利用空間機(jī)械臂末端位置和力的信息反饋,在線調(diào)整阻抗參數(shù)。
3)數(shù)值仿真結(jié)果表明,相比傳統(tǒng)阻抗控制器和BP阻抗控制器,本文所設(shè)計(jì)的PSO-BP控制器對(duì)機(jī)械臂末端的位置控制和接觸力控制精度更高,最大接觸力更小,且對(duì)于力反饋干擾信號(hào)具有更強(qiáng)的抗干擾能力。
4)本文所提出的算法有效提升了控制器的柔順控制性能,但對(duì)硬件的計(jì)算能力要求較高。在后續(xù)研究中,可對(duì)算法進(jìn)行邏輯優(yōu)化進(jìn)而減少計(jì)算量,提高該方法的實(shí)用性能。