Welcome To Ask or Share your Answers For Others

多智能体强化学习如何处理决策（动作）不同步的问题？

asked Jan 24, 2021 in Technique[技术] by 深蓝 (71.8m points)

目前看了一些多智能体强化学习算法，如VDN、QMIX等，好像都是在Dec-POMDP模型上建立的，但是MDP相关的模型都要求一个联合动作空间，多个智能体的动作需要同时做出，但实际问题中，多个智能体的动作往往是不同步的，这种情况应该如何处理？

与恶龙缠斗过久,自身亦成为恶龙；凝视深渊过久,深渊将回以凝视…

3.9k views

Welcome To Ask or Share your Answers For Others

1 Answer

answered Jan 24, 2021 by 深蓝 (71.8m points)

没有动作也是可以当做一个动作吧，action-state，作为输入。

与恶龙缠斗过久,自身亦成为恶龙；凝视深渊过久,深渊将回以凝视…

...