當前位置:首頁 > 科技文檔 > 數學 > 正文

對手類型未知情況下的兩人零和馬爾科夫博弈決策

控制理論與應用 頁數: 8 2024-11-15
摘要: 本文研究一類典型的非完全信息博弈問題—–對手類型未知的兩人零和馬爾科夫博弈,其中對手類型多樣且每次博弈開始前無法得知對手類型.文中提出了一種基于模型的多智能體強化學習算法—–對手辨識的極大極小Q學習(DOMQ).該算法首先建立對手相關環(huán)境的經驗模型,再使用經驗模型學習納什均衡策略,己方智能體在實際博弈中根據經驗模型判斷對手類型,從而使用相應的納什均衡策略,以保證收益下限.本文所... (共8頁)

開通會員,享受整站包年服務