基于D3QN的火力方案優(yōu)選方法
摘要: 針對(duì)在多類彈藥協(xié)同攻擊地面工事類目標(biāo)任務(wù)中火力方案優(yōu)選效率低的問(wèn)題,提出一種基于雙層決斗DQN(duelingdoubledeepQnetwork,D3QN)的火力方案優(yōu)選方法。該方法將打擊過(guò)程建模為馬爾科夫決策過(guò)程(Markovdecisionprocesses,MDP),設(shè)計(jì)其狀態(tài)空間和動(dòng)作空間,設(shè)計(jì)綜合獎(jiǎng)勵(lì)函數(shù)激勵(lì)火力方案生成策略優(yōu)化,使智能體通過(guò)強(qiáng)化學(xué)習(xí)框架對(duì)策略進(jìn)行自... (共9頁(yè))
開(kāi)通會(huì)員,享受整站包年服務(wù)