當(dāng)前位置:首頁 > 科技文檔 > 體育 > 正文

改進(jìn)深度神經(jīng)網(wǎng)絡(luò)在愛恩斯坦棋中的應(yīng)用研究

摘要: 愛恩斯坦棋作為一種附帶隨機(jī)性的完美信息博弈,其難度在于每次投擲骰子導(dǎo)致的結(jié)果不確定性,這增加了策略設(shè)計和局面的評估難度。針對愛恩斯坦棋的游戲規(guī)則,提出了一種改進(jìn)的深度學(xué)習(xí)方法。對Alpha(go) Zero神經(jīng)網(wǎng)絡(luò)模型進(jìn)行改進(jìn)和設(shè)計,使其能精確地評估各種棋盤狀態(tài),生成有效的游戲策略。通過結(jié)合改進(jìn)的殘差神經(jīng)網(wǎng)絡(luò)和蒙特卡洛樹搜索,提取棋局特征并進(jìn)行局面評估,動態(tài)生成策略和進(jìn)行決策。... (共7頁)

開通會員,享受整站包年服務(wù)
科技文檔