當前位置:首頁 > 科技文檔 > 自動化技術(shù) > 正文

具有自適應(yīng)貪婪因子的深度強化學(xué)習路徑規(guī)劃

計算機仿真 頁數(shù): 8 2024-09-15
摘要: 深度強化學(xué)習的開創(chuàng)性(Deep Q-Network, DQN)算法,雖然其在路徑規(guī)劃中表現(xiàn)優(yōu)異,但仍存在過估值、經(jīng)驗回放機制缺陷以及沒有很好地平衡探索與利用的關(guān)系等問題。為了解決上述問題,提出了一種具有自適應(yīng)貪婪因子的深度強化學(xué)習路徑規(guī)劃算法。首先,在D3QN算法的基礎(chǔ)上引入了優(yōu)先經(jīng)驗回放機制,解決過估值問題的同時增加了算法對重要樣本的抽樣概率,提高了算法的效率;其次,設(shè)計了一... (共8頁)

開通會員,享受整站包年服務(wù)