LLM-VM:Anarchy LLM-VM 是一个优化的后端,旨在运行具有工具使用和持久内存等现代功能的开源大型语言模型。它作为人类语言的虚拟机,协调模型、数据、提示和工具,以优化批量调用并支持各种架构。;on-policy:该存储库实现了MAPPO,一种PPO的多智能体变体,广泛应用于合作多智能体游戏和研究。它为星际争霸II、花火和谷歌足球等多种多智能体环境提供了健壮的实现,并附有详细的训练脚本和超参数指南。
加速AGI开发和原型设计
合作多智能体强化学习的研究与实验