融合動作退出和軟獎勵(lì)的強(qiáng)化學(xué)習(xí)知識推理方法
摘要: 針對深度強(qiáng)化學(xué)習(xí)推理方法中存在的過擬合以及稀疏獎勵(lì)的問題,提出了一種融合動作退出和軟獎勵(lì)的強(qiáng)化學(xué)習(xí)知識推理方法(knowledge reasoning method of reinforcement learning integrating action withdrawal and soft reward,AS-KRL)。AS-KRL使用門控循環(huán)神經(jīng)網(wǎng)絡(luò)(GRU)對歷史路徑信... (共8頁)
開通會員,享受整站包年服務(wù)