研究多层合作研究中的一个关键挑战是不仅需要有效合作的个人代理,而且需要与谁合作。当其他代理人隐藏的情况下,可能是错误的动机和目标时,这在局势中特别关键。社交扣除游戏提供途径来研究个人如何学习如何综合有关其他人的潜在不可靠的信息,并阐明其真正的动机。在这项工作中,我们展示了隐藏的议程,这是一个双队的社交扣除游戏,为在未知团队对齐的情况下学习学习代理的2D环境。环境承认两支球队的丰富战略。在隐藏议程中培训的强化学习代理表明,代理商可以学习各种行为,包括合作和投票,而无需以自然语言沟通。
translated by 谷歌翻译