事件觸發(fā)式多智能體分層安全強(qiáng)化學(xué)習(xí)運(yùn)動(dòng)規(guī)劃
控制與決策
頁數(shù): 8 2024-06-06
摘要: 針對深度強(qiáng)化學(xué)習(xí)序貫決策過程中面臨的動(dòng)作安全性問題,研究一種事件觸發(fā)式多智能體分層安全強(qiáng)化學(xué)習(xí)運(yùn)動(dòng)規(guī)劃方法.首先,基于受限馬爾可夫決策模型,構(gòu)建一種具備安全約束的多智能體深度確定性策略梯度框架,該框架針對不同狀態(tài)空間,以事件觸發(fā)的方式實(shí)現(xiàn)運(yùn)動(dòng)策略的分層學(xué)習(xí);然后,通過引入李雅普諾夫評價(jià)網(wǎng)絡(luò),建立帶有條件約束的目標(biāo)動(dòng)作選擇機(jī)制,并利用拉格朗日乘子法,解決多目標(biāo)約束求解困難的問題,... (共8頁)
開通會(huì)員,享受整站包年服務(wù)