基于Q神經(jīng)網(wǎng)絡(luò)的Agent路徑規(guī)劃算法
摘要: 針對未知環(huán)境下Agent自主決策的快速路徑規(guī)劃與避碰問題,將Q-learning與神經(jīng)網(wǎng)絡(luò)相結(jié)合,利用基于目標(biāo)導(dǎo)向的動作策略與獎勵函數(shù)的動態(tài)計算方法,以及優(yōu)化的神經(jīng)網(wǎng)絡(luò)訓(xùn)練框架,構(gòu)建Agent避碰導(dǎo)航算法,通過仿真驗證,表明算法有效,收斂速度較快,適應(yīng)于靜態(tài)障礙的避碰與導(dǎo)航,同時對Agent隨機(jī)指定出發(fā)點及障礙物微小變化的環(huán)境,具有一定的泛化能力,算法可以支持無人裝備的自主路徑... (共5頁)
開通會員,享受整站包年服務(wù)