MetaGPT:MetaGPT是一个多智能体框架,它为大型语言模型分配不同角色,使它们能够协作完成复杂的软件开发任务。它接受一行需求输入,并输出全面的项目产物,模拟一个软件公司的完整流程。;on-policy:该存储库实现了MAPPO,一种PPO的多智能体变体,广泛应用于合作多智能体游戏和研究。它为星际争霸II、花火和谷歌足球等多种多智能体环境提供了健壮的实现,并附有详细的训练脚本和超参数指南。
数据分析与解释
合作多智能体强化学习的研究与实验