chatarena:ChatArena 是一个为大型语言模型提供多智能体语言游戏环境的 Python 库。它提供了一个灵活的框架来定义玩家、环境和它们之间的交互,并提供了用户友好的界面来开发和设计大型语言模型智能体。;on-policy:该存储库实现了MAPPO,一种PPO的多智能体变体,广泛应用于合作多智能体游戏和研究。它为星际争霸II、花火和谷歌足球等多种多智能体环境提供了健壮的实现,并附有详细的训练脚本和超参数指南。
研究和理解大型语言模型的社交互动
合作多智能体强化学习的研究与实验