改進TD3算法的機械臂三維路徑規(guī)劃方法
電光與控制
頁數(shù): 6 2024-12-25
摘要: 在軍事航空領域中,復雜任務對機械臂路徑規(guī)劃提出了挑戰(zhàn)。針對雙延遲深度確定性策略梯度(TD3)算法學習效率低、樣本利用率低的問題,提出了一種改進的TD3算法(Recurrent-TD3算法)。首先,將LSTM結合到策略網絡與價值網絡中,捕獲航空控制任務中的時間序列信息,增強對時間序列變化的響應能力,使其能夠在決策時考慮歷史動作和狀態(tài),提高網絡的表達能力;然后,將事后經驗回放(HE... (共6頁)
開通會員,享受整站包年服務